Re: variance intra

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Jun 08 2004 - 17:08:29 MEST


At 09:29 07/06/2004 +0200, Karine Jacquet wrote:
>Bonjour,
>
>J'ai réalisée une ACC avec un tableau de végétation et un tableau d'avifaune (abondance des espèces) afin de pouvoir évaluer les variations d'avifaune d'après les variations de végétation.
>Je voudrai maintenant pouvoir récupérer les variances intra-relevés et intra-espèces sur le premier axe de cette ACC...mais comment puis-je faire? Quelle options dois-je utiliser? (sous ade4 et sous R)
>Pour la variance intra-espèce, j'ai pensé que l'option, sur R, "sco.distri" pourrait servir mais je n'arrive pas à avoir mes variances intra-relevés. Est-ce la fonction à utiliser?

La question appelle quelques précisions sur la notion de logiciel utilitaire.

Si la question est : où sont les variances intra-relevés dans une CCA, la réponse est nulle part, ça n'existe pas. D'ailleurs d'où vient cette notion de variance intra-relevés ? J'ai consulté Goooogle pour retrouver le sujet de thèse de Karine Jacquet qui pose la question et j'ai trouvé la très bonne référence
CHESSEL D., LEBRETON J.-D., & PRODON R. 1982. Mesures symétriques d'amplitude d'habitat et de diversité intra-échantillon dans un tableau espèces-relevés : cas d'un gradient simple. C. R. Séances Acad. Sci. Ser.III Sci. Vie, 295 : 83-88.

Effectivement, quand on fait l'AFC d'un tableau floro-faunistique les scores des espèces maximisent la variance entre moyennes par relevés et les scores des relevés maximisent la variance des moyennes conditionnelles par espèces. D'où l'idée que la variance par espèce est une amplitude d'habitat et la variance par relevé est une mesure de diversité. On peut faire les deux simultanément sur les scores des cases avec Thioulouse, J., and D. Chessel. 1992. A method for reciprocal scaling of species tolerance and sample diversity. Ecology 73:670-680.

MAIS, ceci est spécifique de l'AFC et la CCA casse la symétrie car les scores des lignes sont composés de moyennes par sites suivis d'une régression multiple. Il reste la diversité des espèces mais pas l'amplitude des sites.

Ceci dit, dans R, si on veut calculer une variance, ce n'est pas compliqué. Je veux par exemple la variance par espèce dans rpjdl$fau du recouvrement de la végétation à 1 m (rpjdl$mil$C1)
data(rpjdl) # Merci Roger Prodon et Jean-Dominique Lebreton

v1 <- function(x,w) {
        if (sum(w)==0) return(0)
        w = w/sum(w) ; m = sum(x*w)
        return(sum((x-m)*(x-m)*w))
}

apply(rpjdl$fau,2,v1,x=rpjdl$mil$C1)

et hop !

Remarque :
coa1=dudi.coa(rpjdl$fau,scannf=F) l'AFC du tableau de faune
sum(apply(rpjdl$fau,2,v1,x=coa1$l1[,1])*coa1$cw)
[1] 0.2468 la moyenne par espèce de la variance du score des relevés qui contiennent l'espèce
coa1$eig[1]
[1] 0.7532 la variance des moyennes par espèce
total = 1

sum(apply(t(rpjdl$fau),2,v1,x=coa1$c1[,1])*coa1$lw)
[1] 0.2468 la moyenne par sites de la variance du score des espèces présentes dans le relevé
coa1$eig[1]
[1] 0.7532 la variance des moyennes par site
total = 1

En AFC, la symétrie sites-espèces est parfaite (et ce n'est pas forcément un bien !)
En CCA, la symétrie n'est pas du même type.

Du logiciel utilitaire (où sont les variances ?),on est passé à un langage (les variances je les calcule quand je veux). C'est différent.

 

Daniel Chessel - chessel@biomserv.univ-lyon1.fr



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:30:56 MEST