Re: ACC, ACC partielles et échelles emboitées

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Thu May 18 2006 - 08:10:22 MEST

  • Next message: Milton: "x----SPAM----x gOOd meds sOlutiOnd firectly frOm manufacturer"

    Nicolas Poulet pose une question d'intérêt très général qui est caractéristique de l'évolution de l'écologie factorielle. Elle veut continuer à travailler sur les communautés et les assemblages d'espèces. Elle n'a pas tord, c'est sa raison de vivre. Mais elle veut aussi être explicative et prédictive (sinon on lui coupe les crédits) et c'est beaucoup plus compliqué.

    Je crois qu'on peut faire une réponse très simple. La stratégie des ordinations sous contraintes marque une faiblesse fondamentale en terme de tests partiels (qu'est ce qui revient à ceci en tenant compte de cela, on trouve ça dans les questions espace-temps, multi-échelles, multi-blocs de paramètres).

    Quand on sait ce qu'on veut (ordination sous contrainte positive) ou ce qu'on ne veut pas (contrainte négative) les acc ou acpvi fonctionnent parfaitement. Quand on cherche à évaluer le rôle parfois subtil de certains paramètres derrière des naïvetés du genre il fait plus chaud au Sud, elle sont assez inefficaces en terme de signification.

    Ces difficultés sont inhérentes au mélange des genres : la communauté est faite de ce que je trouve, les variables de contrôle sont faites de ce que je mets (on se comporte dans la nature comme si on était dans un labo).

    Sur le fond, je serais assez d'accord avec P. Legendre. Vous travaillez sur des communautés. Très bien. Mesurer les différences entre communautés observées. Vous avez pour ça un siècle ou deux de littérature écologique. Prenez une distance qui exprime ce que vous pensez des différences entre communautés. Sans vous occuper de contrôles. A priori ! Justifiez votre choix, calculer les distances, faites la PCO et de deux choses l'une.

    1) c'est très structuré : quelques axes donnent des scores indiscutables (c'est le propre de l'ordination). Faites en des variables à expliquer (ce sont des marqueurs numériques) et du lm et vous aurez des tests partiels solides.

    2) c'est la bouteille à l'encre. Si vous avez besoin de publier pour vivre faites une dcca comme tout le monde et ajoutez un article au flot. Sinon prenez les espèces abondantes et faites du lm ou du glm. Vous aurez au moins de l'information sur des espèces clefs.

    Je dis ça parce qu'on est devant une contradiction majeure. Ce qui intéresse l'écologue, c'est le rare, la richesse, la diversité (qui est la quantité de rare). Un beau tableau est plein de 0 et certains 1 ont demandé de vérifier si l'espèce est connue. Il a le plus de colonnes possible. Et tout ça, c'est du matériel épouvantable pour la statistique. La PCO prend en compte les espèces rares beaucoup mieux que toutes les autres analyses linéaires (l'afc en fait trop, l'acp pas assez). Elle est dépourvue d'a priori et a l'avantage de dire clairement : les espèces sont des marqueurs qui font de la différence et non des variables interprétables.

    Mais si vous voulez le beurre et l'argent et ..., c'est à dire conserver l'interprétation par les espèces et les espèces rares alors ça plante. Des variables qui prennent quelques valeurs non nulles n'ont rien à faire dans un problème de statistique, des dizaines de variables comme ça, encore moins.

    Enfin, c'est un point de vue.
    D. Chessel

    poulet@cict.fr a écrit :
    > Bonjour,
    >
    > Je dispose de prélèvements de macroinvertébrés avec la densité par taxon. Il y a
    > entre 4 et 8 prélèvements par station. Ces stations sont localisées dans
    > différents bassins sachant qu'un même bassin peut contenir 1 à 3 stations.
    >
    > Pour chacune de ces échelles, je dispose de variables descriptives:
    > - Prélèvement : granulométrie (codée de 1 à 6), présence/absence de végétation
    > aquatique, présence/absence de litière
    > - Station : altitude, pente, superficie du bassin versant, distance à la source
    > - Bassins : superficie, pente moyenne, altitude de la source
    >
    > Mon but est dans un premier temps d'identifier quelles sont les variables qui
    > expliquent le plus la variabilité de l'assemblage de taxons. Ensuite,
    > j'aimerais pouvoir quantifier la part de variabilité expliquée par chacune des
    > échelles considérées.
    >
    > Pour la première partie mon idée était de faire une ACC. Cependant, je me
    > demande si cela serait juste avec un tel tableau comportant des échelles
    > emboîtées tel que, par exemple, l'info pour une variable à l'échelle de la
    > station est répétée autant de fois qu'il y a de prélèvements à cette station.
    >
    > Ensuite, j'avais envisagé, pour la deuxième partie, de faire des ACC partielles
    > (cf package vegan), mais une recherche sur le forum
    > (http://pbil.univ-lyon1.fr/ADE-4/adelisthtmlannuel/04/0043.html) m'a amené à
    > envisager une autre alternative… Mais laquelle ?
    >
    > Merci pour votre aide
    >
    > Nicolas Poulet
    >
    >



    This archive was generated by hypermail 2b30 : Thu May 18 2006 - 08:12:33 MEST