Re: Excuses...et suite de l'ACP-covariance

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Thu Feb 14 2002 - 10:00:50 MET


At 20:20 29/01/2002 +0100, Le Mire Pecheux Lidwine wrote:

>Dans le cas ou le mail n'aurait pas été posté, je réitère mes questions
>avec quelques suppléments en réponse au mail de Mr Thioulouse:

>
>J'ai un tableau floristique avec 173 relevés et 640 espèces renseignées
>par un coefficient d'abondance (de 0 à 5).
>Une même espèce peut être présente 2 fois dans un même relevé suivant la
>strate à la quelle elle appartient.
>Par exemple, dans un relevé de pinède je peux avoir l'espèce "Pinhal1"
>(quand Pinus halepensis est herbacée) avec une abondance de 1 et "PinhalA"
>(quand Pinus halepensis est arborescente) avec une abondance de 5
>
>Je voudrais rassembler les relevés en fonction des espèces les plus
>communes et les plus abondantes. En somme, regrouper tous les relevés en
>Pinède par le fait qu'il y ait du Pin d'halep, en strate A(arbrorée) et
>qu'il soit abondant.
>
>Vous me direz que je cherche à enfoncer des portes ouvertes,mais l'exemple
>est grossier car dans beaucoup de relevés je me retrouve avec des unités
>de végétation pas très évidentes à trancher, notemment pour tous ceux qui
>ont une affinité avec les garrigues...!!
>
>1) J'ai donc fait une ACP-covariance, les regroupements d'espèces sont
>assez satisfaisants (pour certains), mais je cherche à faire mieux. Y
>aurait -il une meilleure approche?
>
>En réponse à Mr Thioulouse, après cette ACP-covariance, certains
>classements de relevés "évidents" me laissent songeuse ; un exemple :
> - Dans un nuage de points constitué en majorité par des relevés
> en Chênaie verte (13) se trouvent aussi :
> 2 / 9 relevés en forêts mixtes (à Pin + Chêne vert +
> Chêne pubescent)
> 2 / 4 relevés en Cêdraie
> C'est l'association de 3 codes-espèces à fortes contributions
> sur l'axe 2 (Chêne vert en strate AD et en strate uniquement D puis le
> Buis en strateD) qui déterminent le regroupement des relevés ci-dessus
> aux plus fortes contributions absolues sur l'axe 2.
>

Il y a plusieurs questions imbriquées.

1-1 les relevés à strates verticales : c'est un problème très ennuyeux. On
peut répéter les espèces PinS1, PinS2, ..., on peut répéter les relevés
RelS1, RelS2, ..., on peut répéter le tableau TabS1, TabS2, ... ça renvoie
à l'idée très générale qu'on devrait acquérir des données en ayant prévu à
l'avance ce qu'on va en faire et non l'inverse, à savoir noter
des éléments qui ont un sens pour se demander ensuite ce qu'on peut en
faire. C'est ainsi le cas des questionnaires à questions emboîtées (si on
répond 1 alors on répond à la question 4, sinon on passe à la question 22,
...) Il vaut mieux chercher à n'avoir qu'une seule valeur par couple
espèce-relevé, c'est déjà assez compliqué comme ça.

1-2 le raisonnement sur les contributions : c'est une idée très répandue
qu'il faut s'en servir abondamment. Je suis personnellement très méfiant.
Les données génèrent des statistiques en quantité industrielle et ça n'est
pas une bonne chose. Les contributions absolues en ACP sont sans intérêt
car elles se voient sur les plans directement parce que les poids sont
constants : ce qui est loin contribue et ce qui est près ne contribue pas.
En AFC c'est faux car les poids peuvent varier et on a un équilibre poids *
distance au carré qui peut se faire soit avec le poids soit avec la
distance. Mais les AFC avec de très grosses variations de poids entre
lignes ou colonnes sont souvent mal conditionnées. Les contributions
relatives sont également ambigues car elles prennent un sens que pour des
contributions absolues élevées. En fait, une analyse est surtout faite pour
parler de la structure du tableau qui est une collection de faits
élémentaires n'ayant par eux-mêmes qu'un intérêt limité.

1-3 la vision des plans laisse songeur si on oublie qu'il s'agit de
projections et deux points projetés au même endroit peuvent venir de
partout dans un espace où on peut avoir 150 directions perpendiculaires
deux à deux ! Si on trouve ensemble des choses qui étonnent c'est qu'il
existe des directions perpendicualires au plan qui les séparent. Une
tradition est de représenter sur un plan factoriel des classifications ce
qui permet de voir dans les groupes qui se chevauchent l'indication des
dimensions qu'on ne voit pas. Mais ce n'est jamais simple.

>
>2) On m'a suggéré de remplacer les abondances par "Log(Abondance) +1"?
>Mais est ce vraiment nécessaire?
>
> - Mr Thioulouse ne pense pas, mais pourquoi?
> - La réponse serait-elle dans l'archive du 9 mai 1997 écrite par Mr
> Chessel :
> "Ne pas transformer les données consiste à prendre comme
> abondance totale d'un relevé, l'abondance des espèces les plus
> abondantes, souvent les ubiquistes généralistes d'intérêt écologique
> faible" .... n'est ce pas justement ce qui est interressant dans
> mon cas, vu que je ne cherche pas particulièrement d'interprétation écologique?
>

En phyto-écologie, la transformation n'a pas lieu d'être car elle est déjà
faite dans la pratique de terrain. Les indices d'abondance sont en échelle
logarithmique et intègre le fait que l'erreur de mesure croit avec
l'abondance. Les transformations log sont faites pour ceux qui doivent
compter des organismes, elles sont à éviter par ceux qui estiment des
recouvrements et qui font la transformation intuitivement.

>3) Et enfin, pourriez vous juste en quelques mots me renseigner sur la
>différence entre ACP-Covariance et AFC sur un tableau en abondance?
> - Je pense que l'ACP-Covariance discrimine les relevés en fonction
> des espèces les plus communes (c'est pour cela que je l'ai choisi cette
> méthode)
> - et que l'AFC discrimine les relevés en fonction des espèces et des
> associations d'espèces les moins fréquentes.
>
>Mr Thioulouse m'a répondu "L'AFC elimine l'influence de l'abondance des
>especes en divisant par les effectifs marginaux. Dans le cas des especes
>rares presentes dans des releves contenant peu d'individus, cela peut
>provoquer des effets edhibitoires ("correspondances pointues")."
>
>Qu'en est -t-il de l'ACP-covariance?
>

En quelques mots (vous avez dix secondes) il y a quelques centaines
d'articles depuis 50 ans qui traitent de la classification et l'ordination
des tableaux de relevés écologiques. Personne n'ose plus faire une
synthèse, tellement c'est un problème compliqué. L'ACP-covariances donnes
des combinaisons linéaires d'abondance d'espèces de variance maximum. Elle
utilise pour ce faire les espèces variables (si il y a 300 espèces rares,
elle les ignorent). Est ce utile ? "J'ai un tableau floristique avec 173
relevés et 640 espèces renseignées par un coefficient d'abondance (de 0 à
5)" : ça dépend de l'objectif (comme d'habitude) mais ça on n'en sait rien
(comme ...)

Cordialement

>Daniel Chessel
>Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
>69622 Villeurbanne CEDEX



This archive was generated by hypermail 2b30 : Fri Feb 14 2003 - 14:36:09 MET