Re: Within - Between.coa

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Jun 28 2005 - 20:56:27 MEST


Michaël Aubert a écrit :

> Bonjour,
>
> Je dispose d'une matrice de 300 relevés de végétation x 120 espèces
> végétales provenant d'un échantillonnage dont l'objectif est de
> caractériser l'impact des pratiques de gestion d'un écosystème sur
> les communautés végétales. Les relevés ont été effectués dans 4 modes
> de gestion situés dans deux régions géographiques différentes (2 modes
> de gestion par région)
> Mon but et de comparer l'effet de 3 des modes de gestion par rapport à
> un quatrième qui serait le "mode de référence" le tout en
> m'affranchissant d' un effet région qui semble ressortir lors des
> analyses exploratoires. Je souhaite également exploiter les
> amplitudes d'habitats et les diversités écologiques.
>
> La stratégie de traitement des données que je compte utiliser est la
> suivante:
> 1)- quantification de l'effet région (between.coa, $ratio=0.079)
> 2)- retrait de cet effet région de la coa ->matrice2, 300 lignes
> 3)- de nouveau coa sur le modèle de référence à partir de la mat2, 100
> lignes
> 4)- projection des autres traitements en individus supplémentaires
> pour pouvoir quantifier les distorsions liées à la gestion dans les
> assemblages d'espèces. Pour celà je souhaite pouvoir récupérer les AH
> et DE.
> Je bloque pour le moment au stade 2: j'avais pensé utilisé le $tab
> fourni par la fonction within.coa, mais la fonction dudi.coa n'accepte
> pas cette matrice (valeurs négatives).
> En vous remerciant pour l'attention que vous voudrez bien consacrer à
> ce problème.
>
> Michaël Aubert

La question est tout-à-fait intéressante par la généralité de la
situation qu'elle recouvre.
Dans un plan d'observation précis 2 régions/quatre modes de gestion on a
une réponse hyper-multivariée (120 espèces végétales)

Plus généralement une variable réponse est une liste d'espèces
éventuellement avec abondance dans un plan d'observations contrôlées.

La within.coa se généralise en d'étranges analyses de type AFC sous
contraintes positives ou négatives et G. Yoccoz avait écrit une note aux
CR (Yoccoz N. & Chessel D. (1988) Ordination sous contraintes de relevés
d'avifaune : élimination d'effets dans un plan d'observations à deux
facteurs. Compte rendu hebdomadaire des séances de l'Académie des
sciences. Paris, D, III, 307 : 189-194) qui fait la théorie de la chose
et est illustrée en utilisant des données de J. Blondel (2 régions/6
types de végétation/ cortège d'avifaune). Vous trouverez ça à
http://pbil.univ-lyon1.fr/R/pagechessel.html.

Au plan théorique, il n'y a pas une ligne à retirer à cette note (Hello
Gilles !) mais au plan de l'utilisateur je pense que c'est moins simple.
Avec des variables numériques, on peut toujours faire avec des résidus
de régression des bricolages divers du genre ACP sur résidus de
prédictions sur une variable externe. En AFC, Michaël Aubert essaie de
faire la même chose et ça plante lamentablement (apparemment parce que
la coa n'accepte pas les nombres négatifs) et plus sérieusement parce
que la théorie invalide cette pratique.

En plus la question posée (l'effet de 3 des modes de gestion par rapport
à un quatrième qui serait le "mode de référence") est typiquement un
problème de contrastes dans un modèle linéaire. Et c'est très
raisonnable. Un lecteur dans une revue exigera d'avoir des niveaux de
signification. A juste titre, avec 120 espèces, on en trouvera toujours
3 ou 4 assez gentilles pour démontrer ce qu'on veut (ce qui n'est pas le
cas, précisons le, dans des questions canoniques d'organisation des
communautés posées par J. Blondel, avec une rigueur célèbre).

En bref, d'un côté une liste floristique (donc ordination multivariée)
et de l'autre un plan d'observations et des hypothèses (donc modèle
linéaire, anova, contrastes). Et pour avoir le beurre et l'argent du
beurre ?

Une seule solution est raisonnable : faire de l'anova ou de la manova
sur des scores interprétables. Il vaut mieux éviter l'AFC qui impose des
poids non uniformes qui seront en conflit avec l'implicite des lm (somme
de carrés d'écarts à pondération unitaire).
Pour des présences-absences l'ACP centrée simple (espèces-colonnes) ne
me pose pas de problème (les espèces rares en prennent un coup mais on
peut toujours faire un glm sur la richesse pour se venger), ou bien
après passage en pourcentage par lignes (relevés) ou bien la même chose
en racine-carrée. On aura des variables de synthèses (scores) totalement
indépendantes des intentions expérimentales, puis des effets parasites
(ici régions) plus ou moins significatifs puis des effets contrôlés plus
ou moins significatifs puis des idées pour retourner aux données avec
des arguments sérieux pour faire les illustrations. C'est encore plus
vrai si on veut intégrer les mesures de diversité.

Donc, pour faire de l'ordination sous contrainte, il faut des
sous-espaces. Avec des pondérations non uniformes, ce sera compliqué et
ça peut amener des ennuis sévères avec les comités de lecture.
Ordination avec méthodes simples, ml sur les scores avec tests et
contrastes, retour aux données pour les illustrations, c'est
raisonnable. Pas de recettes pour bricolage disponible dans cet espace,
mais adelist n'est pas un forum pour ça :-) .

Mais si vous y tenez, je peux expliquer comment faire une AFC
inter-intra, ça vaut le voyage mais je ne suis pas sûr que c'est une
bonne chose. Gilles, tu as peut-être un avis ?

D. Chessel



This archive was generated by hypermail 2b30 : Tue Oct 18 2005 - 10:35:40 MEST