Re: ACC (Sonia_Said)

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Sat Dec 20 1997 - 13:32:48 MET


La question de Sonia Said est très générale et relance un débat qui le mérite.
L'ACC est une méthode de couplage de tableaux (ici X=Veg (n lignes-relevés et p colonnes-espèces) et Y=mil (n lignes-relevés et q colonnes-variables))

Quand on veut coupler deux types d'informations on doit se poser deux questions.

1 - Est-ce une question de prédiction Y=f(X) (cas A) ou X=f(Y) (cas B) ou un problème de corrélation C(X,Y) (cas C) ? Cette question se pose pour deux variables la droite de régression de Y/X, celle de X/Y et l'axe principal étant trois solutions distinctes. Résoudre un problème de corrélation par une technique de prédiction et inversement est une bizarrerie historique. Il y a 3 possibilités A,B et C.

2 - X est-il faiblement ou fortement multivarié ? Y est-il faiblement ou fortement multivarié ? (Pour les variables qualitatives compter les modalités et non les variables). Il y a 4 possibilités 1>non-non, 2>non-oui, 3>oui-non et 4>oui-oui.

On remarque tout de suite que la régression des axes de l'AFC de X sur les variable de Y passe d'un problème B (Veg=f(Mil)) de classe 4 (multivarié-multivarié) à un problème B de classe 2 (univarié-multivarié).

En écologie actuellement la difficulté est majeure. Tout le monde dit et répète que l'écologie doit être prédictive (sinon plus d'argent, BRRRR!). Bon, mais la statistique dit que si on veut prédire quoi que ce soit il faut s'en donner la peine. En particulier limiter de manière drastique le nombre de prédicteurs, éviter les prédicteurs corrélés, compter 500 mesures minimum pour utiliser 10 prédicteurs etc... Comme la statistique dit clairement ce qu'il en est et que ça casse les pieds, virons la : algorithmes génétiques, réseaux de neurones, arguments tordus sur la linéarité,... ce ne sont pas les occasions qui manquent.
ça ne changera pas grand chose.

L'ACC est en fait actuellement un programme qui est employé outre mesure sans que ça se voit pour la raison fondamentale qu'on fait l'AFC du tableau Veg (à peu près) quand le nombre de descripteur est grand. La question n'est pas comment sélectionner les variables explicatives en trop quand fait une ACC mais pourquoi faire une ACC quand a beaucoup de variables. Il y a en fait des cas incontournales.

1 - Les problèmes C(X,Y) avec X et Y très multivariés relèvent de la co-inertie. C'est le cas des couplages de questionnaires (Cazes), des couplages AFC veg-ACM milieu (théorie des profils écologiques) et celui des couplages de batterie de tests (Tucker, l'initiateur)
2 - Les problèmes Y=f(X) avec X très multivariés sont "toxiques" et doivent être reposés. Ils sont automatiquement reposés dans les stratégies PLS, ce qui en fait ramène au cas précédent et donne une fonction prédictrice aux coordonnées de co-inertie (chimiométrie).
3 - Les problèmes Y=f(X) avec Y très multivarié pour des dimensions de X acceptables sont caractéristiques des stratégies de variables instrumentales dont l'ACC. L'exemple de Bondel dans la doc d'ADE-4 est l'archétype (2 régions / 6 strates de végétation pour 300 relevés d'avifaune)
4 - Les problèmes C(X,Y) avec X et Y peu multivariés relèvent de l'analyse canonique (cas particulier : le couplage de 2 variables qualitatives par l'AFC).

Les problèmes y = f(X) (Y univarié) relévent de la statistique inférentielle.

C'est pourquoi la question de Sonia Said est importante et je ne suis pas favorable à l'implantation des stratégies de pas-à-pas en ACC. Le débat est ouvert.

>Un des problèmes frequent en phytoecologie c'est de determiner les
>variables pertinantes pour expliquer la repatition de la vegetation.
>
>La regression des axes de l'AFC est une solution, l'ACC semble etre une
>meilleure.
>
>Il reste cependant un probleme, l'ACC ne fournit pas d'indicateur de la
>pertinence des variables entree dans le tableau des variables explicatives.
>
>C'est pourquoi, une ACC de type pas à pas (comme les regressions pas à
>pas) semblerait bien utile pour selectionner les variables pertinentes.
>
>Pensez-vous que c'est interessant ?

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 sur Internet ---> http://biomserv.univ-lyon1.fr/ADE-4.html
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:44 MET