Re: CCA pas tout a fait linéaire

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Wed Nov 05 2003 - 11:24:03 MET


At 08:42 05/11/2003 +0100, Martial Ferreol wrote:

>Bonjour,
>
> J'ai 2 questions sur la CCA et plus généralemnent les techniques sur variables instrumentales, la première étant d'ordre pratique :
>
>1- Une CCA avec Canoco à été faite (sur un tableau espèces de diatomées par sites et un tableau paramètres environnementaux par sites) suivie d'une "forward selection" afin de retenir les paramètres de milieu ayant une contrainrte significative sur le 1er tableau. Mais voilà, les 8 paramètres retenus n'influencent pas tous chacunes des espèces et il s'agit ici de définire quels paramètres influencent quelles espèces. Pour vérifier si une telle relation existe, j'hésite à utiliser le test de corrélation des rangs de Spearman (espèce xi Vs paramètre yj). En effet, un tel test suppose une relation linéaire entre les 2 variables testées. Or cette situation n'est pas évidente du tout (les relations ont souvent une allure en cloche).

Il y a une contradiction à peu près parfaite entre deux objectifs.

Le premier pense que chacune des variables de milieu mesure quelque chose d'original et d'unique (ce qui est en général faux) et que chacune des espèces a une relation originale et indépendante à ce quelque chose (ce qui est en général faux, si on considère qu'il existe des communautés et une histoire). Dans ce cas le lien entre une espèce et une variable a un sens et chacun de ces liens pose un problème personnel et on peut envisager de faire des tests d'association. C'est vrai par exemple quand on étudie un petit cortège spécifique dans un échantillonnage fortement stratifié sur des critères ciblés.

Le second pense que l'environnement est un tout, que c'est l'expérimentateur qui le décompose en paramètres, liés entre eux de façon complexe et que les espèces présentes quelque part ont une histoire en commun pour partie et que le communauté est plus qu'une collection et qu'elle doit se manipuler globalement. Dans ce cas, on fait de l'ordination multivariée multispécifique. C'est vrai par exemple quand on fait une carte phytoécologique avec un point à l'hectare sur des variables standards.

Quand on sait ce qu'on veut, on se pose ensuite des questions techniques.

>La raison de mon hésitation amène la seconde question :
>
>2- Une CCA, entre autre, repose sur un principe de regression linéaire multiple. Donc peut on en déduire que la relation espèce x / paramètres y doit être linéaire pour pouvoir pratiquer une méthode sur variable instrumentale ? Si c'est strictement le cas, la CCA m'apparait alors comme peu recommendable en écologie (mais que faire sinon...). Pour revenir à ma première question, le test de Spearman pourrait être pratiqué en partant du principe que la relation linéaire est déjà justifiée par l'emploi d'une CCA et de ce que cela implique alors.
>
>Merci de m'éclairer sur ce sujet qui me tourmente (mais seulement quand je suis dans mon bureau).

Si il y a une chose qui me tourmente moi c'est la confusion éternelle entre linéaire associé à ligne (donc relation linéaire, droite de régression) et linéaire associé à algèbre (donc base, sous-espace, projection). Ce qui est linéaire en ACPVI ou CCA, ce n'est pas la liaison espèce-variable (évidemment, ce n'est pas une droite), c'est le principe méthodologique (projection sur un sous-espace puis projection sur des composantes principales). L'analyse statistique utilise des modèles pas parce qu'ils sont vrais mais parce qu'ils sont utiles. Alors que la CCA soit peu recommandable en écologie, ça va faire sourire ! A relire d'urgence :

Lebreton, J. D., R. Sabatier, G. Banco, and A. M. Bacou. 1991. Principal component and correspondence analyses with respect to instrumental variables : an overview of their role in studies of structure-activity and species- environment relationships. Pages 85-114 in J. Devillers and W. Karcher, editors. Applied Multivariate Analysis in SAR and Environmental Studies. Kluwer Academic Publishers.

On y voit comment la transformation initiale dans une AFC linéarise des relations et comment maximiser la variance des moyennes et un problème de régression qui n'a rien à voir avec tracer une droite. Ou encore :

Ter Braak, C. J. F. 1985. Correspondence analysis of incidence and abundance data : properties in terms of a unimodal reponse model. Biometrics 41:859-873.

la base de l'ACC par l'AFC vue comme estimation de modèles de réponse unimodaux (illustrations dans tdr62.pdf)
Alors, PRUDENCE !

>____________________________________________________
>Martial FERREOL
>
>Cellules de Recherche en Environnement et BiotechnologieS
>Centre de Recherche Public - Gabriel Lippmann
>
>162a Avenue de la Faïencerie
>L-1511 Luxembourg
>
>Tel : +352 470 261 441 Fax : +352 470 261 389
>
>http://www.crpgl.lu
>____________________________________________________

Daniel Chessel - chessel@biomserv.univ-lyon1.fr



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:45:25 MEST