ANSC_et_correlation canonique

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Thu Jul 02 1998 - 09:18:06 MET DST


Bonjour,

Un petit complément aux messages de Clémentine sur l'Analyse non symétrique
des correspondances.

Considérons un écologue A qui désire étudier la distribution d'un groupe
donné (par exemple les éphéméroptères) en fonction de caractéristiques
environnementales (par exemple la pollution). Il définit un plan
d'échantillonnage pour représenter au mieux la plus grande variabilité avec
des stations propres, des stations moyennes et des stations très vilaines
pour analyser la position et l'amplitude des taxons de son groupe sur les
gradients de dégradation du milieu.

Considérons un écologue B qui désire étudier un gradient environnemental,
par exemple un gradient de dégradation des rivières. Il choisit un groupe
d'organismes réputés pour sa valeur de bio-indicateur, par exemple les
éphéméroptères pur analyser la position moyenne et la diversité des
stations sur les gradients définis par les espèces.

Considérons un écologue C qui étudie un groupe très peu connu, par exemple
les éphéméroptères du Sud de Java dans un univers qui a vu passer très peu
d'écologues. Il faudra en même temps faire une typologie de stations avec
les espèces et une typologie d'espèces avec les stations.

Considérons enfin un biométricien qui a discuté avec A, B et C.

Logiquement, A fera une ANSC sur les profils espèces, B fera une ANSC sur
les profils relevés, C fera une AFC qui est un compromis entre les deux
précédentes et D fera les trois pour savoir comment ça réagit. Voilà à peu
près un résumé concret du débat.

Si on tient à comparer la valeur propre de l'AFC (carré de corrélation
canonique) et celle de l'ANSC il suffit d'une petite opération.

Par exemple, sur la carte JV73_Poissons qui illustre COA: NSCA_Col_Profiles

COA donne :
Num. Eigenval. R.Iner. R.Sum |Num. Eigenval. R.Iner. R.Sum |
01 +4.9654E-01 +0.3000 +0.3000 |02 +2.3774E-01 +0.1436 +0.4436 |
03 +1.9864E-01 +0.1200 +0.5636 |04 +1.5884E-01 +0.0960 +0.6595 |
lambda1 = 0.4965 --> r12 = lambda1 = 0.497
lambda2 = 0.2377 --> r22 = lambda2 = 0.238

COA: NSCA_Col_Profiles donne :
Num. Eigenval. R.Iner. R.Sum |Num. Eigenval. R.Iner. R.Sum |
01 +7.3279E-03 +0.3210 +0.3210 |02 +4.0768E-03 +0.1786 +0.4995 |
03 +2.0929E-03 +0.0917 +0.5912 |04 +1.8508E-03 +0.0811 +0.6723 |
lambda1 = 0.007328 --> r12 = nlig*lambda1 = 0.007328*92 = 0.674
lambda2 = 0.004077 --> r22 = nlig*lambda2 = 0.004077*92 = 0.375

COA: NSCA_Row_Profiles donne :
Num. Eigenval. R.Iner. R.Sum |Num. Eigenval. R.Iner. R.Sum |
01 +4.9477E-02 +0.4427 +0.4427 |02 +2.3284E-02 +0.2083 +0.6510 |
03 +1.2175E-02 +0.1089 +0.7599 |04 +7.3128E-03 +0.0654 +0.8254 |
lambda1 = 0.04948 --> r12 = ncol*lambda1 = 0.04948*19 = 0.940
lambda2 = 0.02328 --> r22 = ncol*lambda1 = 0.02328*19 = 0.442

On compare non des corrélations canoniques mais des rapports de corrélations.

Dans l'analyse 1)
Code des espèces de variance 1 -> variance des moyennes par relevés maximum
= lambda1
Code des relevés de variance 1 -> variance des moyennes par espèces maximum
= lambda1
Code des relevés de variance 1 + Code des espèces de variance 1
-> corrélation sur le tableau maximum = sqrt(lambda1)

Dans l'analyse 2)
Code des relevés (pondération uniforme) de variance 1 -> variance des
moyennes par espèces maximum = lambda1

Dans l'analyse 3)
Code des espèces (pondération uniforme) de variance 1 -> variance des
moyennes par relevés maximum = lambda1

Les contraintes ne sont pas les mêmes et j'ai respecté les choix de Lauro
et D'Ambra.
Il suffit de dire que l'ANSC est l'analyse du triplet (K0, DJ, (1/I)IdI) au
lieu de celle du triplet (K0, DJ, IdI) comme actuellement. On peut
préférer ce point de vue que j'avais évité pour ne pas pousser à une
comparaison directe. On confirme que les trois analyses sont différentes en
profondeur et que le cout du double averaging de l'AFC est très élevé.

Ce qui est sùr, par ailleurs, c'est que les footballeurs Anglais sont
vraiment magnifiques (comme les biométriciens d'ailleurs).

Cordialement

>
>En attendant l'arrivee des anglais, une question toulousaine (c..?) pour
>passer le temps.
>
>Je tente d'ameliorer une ordination especes-releves concernant des points
>d'ecoute oiseau et un gradient d'ouverture des paysages agricoles de la
>foret aux vastes terrasses cultivees de la Garonne. J'ai un tableau de
>contingence d'environ 400 lignes-releves et 55 colonnes-oiseaux. Bien sur
>dans les milieux ouverts le nombre d'especes d'oiseaux par releve est bien
>inferieur a celui des zones bocageres et forestieres. Je n'ai parfois que 2
>a 3 especes avec des effectifs reduits.
>L' AFC du tableau de contingence produit une ordination interessante
>(VPropre F1 = 0. 55 donc correlation canonique de 0.74).
>Ceci dit, compte tenu de la question posee il me semble interessant
>d'egaliser le poids des especes. L'oedicneme (2 contacts) et le Pipit
>rousseline (6 contacts) m'interessent autant que la fauvette a tete noire
>ou le pinson.
>J'ai donc effectue sur le meme tableau de contingence une AFC non
>symetrique sur les colonnes-especes. Les resultats semblent "visuellement"
>plus interessants que pour l'AFC. Sur le plan factoriel 1-2 les distances
>entre les especes de milieu ouvert semblent plus conformes a ce qu'un
>ornitho peut attendre ; de meme pour le graphe canonique reconstitue par le
>module Tables.
>
>J'aimerais pouvoir comparer sur des bases plus objectives la qualite de
>l'ordination AFC et celle resultant de l'AFC non-symetrique. La valeur
>propre du facteur 1 de l'AFCNS etant extrement faible (0.0014; trace totale
>0.013) j'en conclue que le calcul de la correlation canonique comme racine
>carree de la valeur propre n'est pas conserve en raison probablement de l'
>assymetrie des ponderations entre colonnes et lignes.
>Comment doit-on s'y prendre pour caracteriser la liaison especes releves
>dans les conditions d'une AFCNS? Et quelles sont les precautions a prendre
>pour effectuer une comparaison AFC / AFCNS?
>
>Merci d'avance
>
>Bien cordialement
>
>Gerard Balent
>--------------------------------------------------------------------
>INRA-SAD Toulouse; CNRS-UMR 5552 Ecologie Terrestre
>BP 27; F-31326 Castanet-Tolosan Cedex
>Phone: +33 5 6128 52 58; Fax: +33 5 61 73 20 77

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:58 MET