RE: besoin d'aide pour ACC suite

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Jul 03 2001 - 06:13:34 MEST


Le plus simple est d'en revenir à la définition de l'analyse que vous
utilisez

Supposons que vous preniez un tableau à n sites et 3 variables
environnementales
supposons que la première variable mesure l'argile, la seconde le limon et
la troisième le sable en pourcentage. Le second tableau peut être un tableau
avec les mêmes sites et mettons 10 espèces.

Il n'y aura pas en ACC de fichier ivfa parce que la somme des trois
variables environnementales fait toujours 1, donc après centrage toujours 0.
On dit que quand on connaît deux des trois variables on sait tout sur la
troisième et en mathématiques on dit qu'elles sont linéairement dépendantes.

On peut faire pourtant l'ACC. On trouve une combinaison linéaire de
variables
2*argile + 3*limon -1*sable par exemple pour les variable centrées (somme
nulle)
ça veut dire que parce que argile + limon + sable = 0 (variable centrées)
2*argile + 3*limon -1*sable
peut être aussi être écrite
3*argile + 4*limon
ou encore
argile + 2*limon - 2*sable
ou encore une infinité de manière

La variable canonique existe (et est unique) mais peut s'exprimer d'une
infinité de manière comme combinaison des variables de départ. Il n'y a pas
de ivfa ! (bouh)

Vous pouvez résoudre le problème de deux manières
1) éliminer la redondance : si dans le fichier de l'exemple on enlève une
des trois variables le fichier ivfa reviendra (oh bonheur !)
si on enlève sable on trouvera 3*argile + 4*limon (ou -3*argile - 4*limon)
si on enlève argile on trouvera limon - 3*sable (ou -limon + 3*sable)
si on enlève limon on trouvera -1*argile -4*sable (ou 1*argile + 4*sable)

la variable canonique (ivli) est toujours la même et on n'a plus que 3
manières de l'exprimer (ou 3 autres équivalentes le signe étant tiré au
hasard).

Dans tous les cas on aura la même disposition des espèces car on a trouvé la
combinaison qui maximisait la variance des positions des espèces. Comme
argile + limon + sable = 1 (variables brutes) l'interprétation est toujours
la même. On peut avoir beaucoup de redondance à éliminer. Il faut par
exemple supprimer une modalité de chaque variable qualitative, une
composante de chaque variable floue, ... Il se peut que la redondance soit
très forte pour des erreurs de codage quand on croit utile de mettre dans
les explicatives x, y et x + y (x+y est en trop) ou x, y, z et x+y y+z et
x+z (les trois dernières sont en trop). Si on tient au ivfa, la redondance
est interdite.

2) on peut vivre sans fichier ivfa. On cherchera simplement à comprendre
quelle relation entretient le score (ivli) avec les variables en calculant
par exemple la corrélation. Si y est corrélée positivement avec l'argile et
positivement avec le limon ce sera négatif avec le sable ... La redondance
n'a pas disparue, on fait avec ...

L'interprétation avec ivc1, ivls et ivli est plus difficile et vous devriez
vous en passer.
ivli contient un score qui maximise la variance des positions des espèces.
Regardez comment les espèces sont disposées et pour interpréter le score en
absence de l'écriture unique qui n'est pas possible à cause de la redondance
utiliser toute mesure du lien entre le score et chacune de vos variables.

allez, bon courage !

Daniel Chessel
Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
69622 Villeurbanne CEDEX
Tel : 04 72 44 82 77 - (33) 4 72 44 82 77

-----Message d'origine-----
De : owner-adelist@biomserv.univ-lyon1.fr
[mailto:owner-adelist@biomserv.univ-lyon1.fr]De la part de Yorick REYJOL
Envoyé : mercredi 27 juin 2001 12:12
À : adelist@biomserv.univ-lyon1.fr
Objet : besoin d'aide pour ACC suite

Rebonjour,

je comprends bien tout ce que vous me dîtes pour le premier point de ma
question, cependant je ne comprends pas comment utiliser un autre mode
d'interprétation sans le .ivfa. L'autre possibilité proposée est
l'utilisation conjointe de ivc1, ivls et ivli. Or, si ivc1 me permet bien
de projeter mes variables explicatives que sont mes colonnes, ivls et ivli
ne me permettent que de représenter mes lignes, et non plus mes
colonnes-espèces dépendantes. Que faut-il que je fasse ? Faut-il passer par
scatterclass après avoir précisé l'espèce dans une colonne à part et
effectué readcategfile ?



This archive was generated by hypermail 2b30 : Thu Jul 04 2002 - 09:39:12 MEST