Reponse a G. Balent

From: JPP (gimaret@biomserv.univ-lyon1.fr)
Date: Sat Jun 27 1998 - 13:33:02 MET DST


Bonjour,

Je vais tenter de repondre a la question de G. Balent dans la mesure ou
l'analyse non symetrique des correspondances a ete introduite dans ADE
par D. Chessel pour l'analyse du jeu de donnees particulier dont je
dispose. Ce jeu de donnees, evoque dans la fiche thematique 2.8 est une
 liste d'occurrences d'especes d'arbres endemiques de l'Inde constituee
 a partir des specimens des differents herbiers disponibles, completee
par desdonnees de la litterature et de releves de terrain. Une occurrence est
donc un individu caracterise par un nom d'espece et des coordonnees x, y. Afin
d'analyser la structure spatiale multispecifique, ces occurrences ont ete
attribuees a des unites spatiales elementaires, des quadrats definis par une
grille reguliere. Tout cela pour en venir au fait que l'on part d'un tableau
(n, s) constitue par les n occurrences: en lignes les n individus et en
colonnes les s especes, le tableau etant forme par les indicatrices des s
especes, s modalites d'une variable qualitative. Ce tableau n'a pas de sens en
soi sauf en ce qui concerne son inertie : si on le centre par espece,
l'inertie totale vaut l'indice de Simpson, 1-(somme des carres des frequences
des especes f.j). C'est la premiere valeur du listing de l'ANSC, forcement
inferieure a 1.

Avec les q quadrats, on ajoute une information exterieure, chaque individu
etant attribue a un quadrat. On peut donc reconstituer une table (q, s) avec
les quadrats en lignes, les especes en colonnes, que l'on pourrait analyser
par AFC. Mais ici, les variables "espece" et "quadrat" n'ont pas le meme
statut, l'appartenance d'un individu a une espece est une observation tandis
que l'appartenance de ce meme individu a un quadrat est issu d'une
grille arbitraire, controlee par l'experimentateur. Cette asymetrie
fondamentale a conduit a la recherche d'une analyse en tenant compte. L'ANSC
donne la solution : c'est la version inter-classe de l'AFC, qui permet de
traiter les quadrats comme des classes et les especes comme des observations
dans ces classes. Elle ne fait qu'une analyse discriminante, celle
des quadrats par leur contenu en especes. Ainsi, l'inertie totale de l'ANSC
est l'inertie d'une analyse inter. C'est la deuxieme valeur du listing de
l'ANSC.

Si on revient au tableau (n, s), on a donc maintenant en face le tableau
(n,q) qui constitue une partition des lignes du premier. Le premier avait
comme inertie totale l'indice de Simpson, qui peut donc etre decomposee en une
inertie intra-classe et une inertie inter-classe. L'inertie totale de l'ANSC
représente donc la variance expliquee par la variable "quadrat" sur la
variable "espece". Ce pourcentage de variance expliquee, r2 = inertie ANSC /
Simpson est la troisieme valeur du listing d'ANSC. Son caractere significatif
peut etre teste par l'indice CATANOVA, une alternative au Chi-2 mise au point
par Light & Margolin. C'est la quatrieme valeur du listing.

Finalement, pour revenir a la question initiale, l'ANSC s'avere tres efficace
sur les tables de contingence analysees classiquement par l'AFC car elle
permet de faire deux ordinations au lieu d'une, la discrimination des releves
en fonction de leur contenu en especes ou la discrimination des especes en
fonction de leur repartition spatiale. Ainsi, la premiere valeur propre n'est
pas une correlation canonique mais represente la variance inter maximisee sur
le premier axe. Elle est forcement faible : si elle represente 5% de l'inertie
totale de l'ANSC, elle-meme representant 20% de l'inertie du
tableau initial (qui vaut l'indice de Simpson sur le tableau
individus-especes), on aura une vp de 0.009.

Donc, sur une table de contingence especes-releves, la liaison
especes/releves est mesuree par l'inertie de l'ANSC dont le caractere
significatif est teste par l'indice CATANOVA. Les valeurs numeriques issues de
l'ANSC et de l'AFC ne peuvent donc pas etre comparees. Mais la structure du
graphe des valeurs propres en revanche est tres instructive, ainsi que les
cartes factorielles obtenues. Ainsi, sur un autre jeu de donnees avec des
vrais releves, j'ai compare les trois analyses, AFC, ANSC des profils des
releves et ANSC des profils des especes. Seules les 2 premieres vp de l'AFC
sont utiles, isolant des associations especes/releves qui ne sont pas
marginales, toutes les autres vp isolent une association singuliere
espece-releve sans interet. En revanche, les deux ANSC revelent trois
structures interessantes sur les trois premiers axes, qui different d'une
analyse a l'autre, l'ANSC des profils des releves mettant en relief les
regions floristiquement homogenes tandis que l'ANSC des profils des especes
met en evidence les groupes d'especes ayant la meme repartition spatiale.

 Clementine Gimaret



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:58 MET