Olivier Planchon pose la question à 100 F
La première synthèse à cette question est consignée dans :
Whittaker, R.H. (1973) Ordination and classification of communities. Hanbook of vegetation science. Part V. Dr. W. Junk b.v., The Hague. 1-737.
Avec bibliographie dans tous les chapitres et pp. 708 à 726
Il faisait le bilan de 25 ans de recherches avec des articles de synthèse de Cottam, Dagnélie, Gauch, Goff, Goodall, Maarel, McIntosh, Orloci et ... Whittaker.
Les 25 ans qui ont suivi ont vu naître un certain découragement tant la question est compliquée qui se traduit par "LA méthode recommandée" n'existe que pour ceux qui n'ont qu'un programme.
La question vient de la diversité des situations (évidemment).
On peut avec certitude dire qu'il y a deux paramètres de base à intégrer dans la réponse.
Le premier est celui de l'abondance. En principe il se pose rarement dans la végétation qui fournit des relevés standardisés. Cela dépend aussi de la multiplicité des observateurs, de certains facteurs structurant (salinité, engorgement) et des questions de phénologie qui peuvent fournir une certaine hétérogénéité de la richesse des relevés.
Le second est celui de l'objectif principal : classement ou ordination des espèces (phytosociologie, les relevés sont un moyen) ou classement ou ordination des relevés (phytoécologie, les espèces sont des variables).
Si on introduit une dissymétrie dans l'objectif ("Mon but est de classer des sites en fonction de leur composition floristique") et si il y a beaucoup d'espèces rares avec lesquelles on pense avoir des problèmes ("sans pour autant que la présence de ces espèce rares ne domine l'analyse") il faut éviter l'analyse des correspondances, ou si on y tient, comme dit Eric Baran, il faut les sortir sur un critère arbitraire et discutable. A mon avis, il vaut mieux l'éviter.
L'ACP centrée par espèces (un standard) ou doublement centré (pour éliminer l'hétérogénéité des richesses) est assez indifférente aux espèces rares et a tendance à utiliser essentiellement les abondantes qui ont une forte variance. On a pas besoin de faire des sacrifices (la procédure le fera sans qu'on s'en aperçoive). Si on ne fera pas grand cas de la légende de la typologie de relevés l'ACP convient en général car la carte des espèces est assez difficile à interpréter. Si on s'oriente vraiment vers une classification on aura souvent mieux avec une matrice de distance inter sites (Distances : Binary Dissimilarity) ordonnée par une analyse en coordonnées principales (Distances : Principal Coordinates) et donnant une classification associée (Clusters : Compute hierarchy) avec une vision associée des deux (Clusters : Prepare convex hulls et ScatterClass). Le choix de l'indice est évidemment un gros problème. Certains font systématiquement un NMDS (hors ADE-4 !) sur cette base.
Si la légende espèces de la typologie des relevés a au contraire une grande importance (légende d'une carte phytoécologique) on a intérêt à utiliser une méthode qui prend les espèces comme des distributions de fréquence inter-site. L'opération redonne alors beaucoup d'importance aux espèces rares qu'il faut modérer par une pondération de type AFC dans une analyse de type ACP. C'est ce qui se fait dans Niche : Species Profiles PCA ou dans COA : NSCA_Col_Profiles (espèces en colonnes). Dans les cartes les espèces sont à la moyenne des relevés et l'interprétation est plus simple. Mais ces méthodes sont peu connues et le reviewer fera la gueule en demandant de justifier. Voir encore comparaisons entre ACP, AFC et ACP de profils dans la fiche thématique 4.7.
En bref, il n'y a pas de méthode recommandée. Mais souvent l'analyse du tableau de base sera intégré à de l'information complémentaire (Où ? Quand ? Qui ? Dans quelles conditions ?) qui oriente la discussion. Si il y a un tableau de milieu qui va avec le tableau floristique, il faut penser directement au couplage.
Enfin, le débat est ouvert.
>Bonjour,
>Je dois analyser un tableau de relevés floristiques.
>Mon but est de classer des sites en fonction de leur composition
>floristique.
>d'ou ma première question :
>Quelle est la méthode recomandée pour analyser un tableau binaire
>Présence/Absence ?
>
>Parmi les 140 espèces étudiées, beaucoup n'apparaissent que 2 ou 3 fois sur
>les 100 sites.
>d'ou ma 2eme question :
>Est-il possible de traiter cette information, sans pour autant que la
>présence de ces espèce rares ne domine l'analyse et n'occulte des
>ressemblances portant sur des espèces plus communes ?
Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 sur Internet ---> http://biomserv.univ-lyon1.fr/ADE-4.html
----------------------------------------------------------------
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:39 MET