Re: Analyse de deux tableaux ACPVi, analyse de redondance

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Sat Feb 07 2004 - 15:37:35 MET


At 13:55 07/02/2004 +0100, Patrick Giraudoux wrote:
>Bonjour,
>
>Je me trouve confronté au problème suivant relatif à un essais d'analyse du rôle de pratiques agricoles ou/et de qualité de la végétation sur des dynamiques de population de campagnol terrestre.
>
>Chaque ligne des deux tableaux correspond à une parcelle:
>
>- Le premier tableau est constitué des variations d'abondance sur plusieurs années (chaque colonne représente l'indice d'abondance pour une saison)
>- Le second tableau est constitué des mesures de végétation et/ou de pratiques (engrais, travail du sol, pâturage, etc..)
>
>La question est: en quoi les pratiques ou la végétation conditionnent-ils les types de cinétique observés?
>

Là, on part de l'objectif et l'exposé des motifs est on ne peut plus clair.

>Ca fait un moment que je n'ai pas eu à traiter de ce type d'analyse et, dans mon "vieux" language, il me semble qu'une solution possible pour examiner la réponse à cette question serait d'ordonner le premier tableau (les cinétiques) sous la contrainte du second (les variables environnementales) et j'appelais ça une Analyse en composante principale avec variables instrumentales - ACPVi).

C'est parfaitement exact.

>
>Je me suis donc replongé dans la petite bible qu'est le Legendre et Legendre pour m'aperçevoir que le vocabulaire avait changé et que les choses se présentaient dans le cadre plus général des analyses canoniques. Ce qui me semble être le plus proche de ce que j'ai décrit plus haut est appelé Analyse de redondance (pourquoi pas). J'ai regardé également dans ADE (sous R) quel était la boîte à outil disponible, et là je suis un peu perdu puisque que "cca" est donné comme "Canonical Correspondence Analysis" et je ne trouve rien qui ressemble à ma bonne vieille ACPVi ou à de l'analyse de redondance.

Le terme analyse canonique utilisé par Legendre ne fait pas l'unanimité. P. Legendre désigne par analyses canoniques l'ensembles des méthodes qui couplent deux tableaux, sur la base que la plus ancienne s'appelait l'analyse canonique. En France on utilise plutôt le terme analyse canonique pour désigner la première et ses soeurs comme l'analyse discriminante linéaire et l'analyse canonique généralisée. Mais c'est compliqué par le fait que l'AFC est aussi une analyse canonique, ce que globalement on veut l'ignorer en s'en tenant aux analyses d'inertie.

On trouvera une description des trois grandes stratégies de couplage (canonique, coinertie et variables instrumentales) dans http://pbil/R/stage/stage5.pdf.

>
>Y-aurait-il un volontaire pour me dire:
>
>- si, compe-tenu de problème posé, la stratégie d'analyse retenue est acceptable ou/et optimale?

c'est très difficile à dire. L'essentiel de l'APCVI peut se voir dans la démarche
1) je cherche dans X du meilleur prédicteur linéaire de la première variable Y1 de Y
2) je cherche dans X du meilleur prédicteur linéaire de la deuxième variable Y2 de Y
3) ...
4) il peut arriver que les prédictions de Y1, Y2, ... se fasse à partir d'un modèle assez commun
alors je cherche le meilleur prédicteur simultané de Y1? Y2, ...

L'archétype biologique de cette démarche je crois est dans un tableau X sites-milieu qui décrit n stations et dans un tableau Y qui contient l'abondance de la même espèce plusieurs années successives. Il est logique de penser qu'un même modèle favorise ou défavorise la même espèce et que chaque année ce modèle commun s'exprime à travers les aléas ordinaires.

Je pense que c'est assez différent du problème posé où dans un tableau on a en ligne une courbe et donc une structure d'information sur la marge colonne de Y. Stéphane Champely qui s'intéressait aux ACP de familles de courbes avait posé le problème de l'analyse de deux familles de courbes (traces dans un colloque à
http://pbil.univ-lyon1.fr/R/articles/arti079.pdf)

L'analyse de co-inertie avait été choisie avec J. Devillers pour parler de l'effet d'une substance chimique in vivo et in vitro (http://pbil.univ-lyon1.fr/R/articles/arti089.pdf)
Si vraiment c'est l'évolution de la population qui est en cause il vaudrait mieux consulter un spécialiste de l'analyse des processus et c'est un problème très ouvert.

>- quelles sont la ou les fonction(s) de ADE sous R permettant de la mettre en oeuvre (ou la doc me permettant de bosser ça)?

l'ACPVI se fait avec pcaiv qui tolère des X qualitatives et quantitatives et utilise la fonction lm dans une boucle avant une ACP des modèles. La co-inertie se fait avec coinertia. L'analyse canonique est pratiquement reservé à un usage sur des coordonnées des deux tableaux et cancor de mva suffit.

il y a des fiches de TD qui décrivent le système
http://pbil/R/fichestd/tdr64.pdf
http://pbil/R/fichestd/tdr65.pdf

Bon courage

Daniel Chessel - chessel@biomserv.univ-lyon1.fr



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:30:56 MEST