Re: test de mantel

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Fri Mar 25 2005 - 10:26:21 MET


Aurélie Coulon a écrit :
> bonjour,
>
> je voudrais tester la corrélation entre des distances génétiques et
> géographiques entre individus, en utilisant un test de mantel.
> mon pb est que* *mes matrices de distances ne sont pas complètes car je
> dispose d'individus échantillonnés sur une zone de 50x50km, et je ne
> veux tester la corrélation que pour les individus séparés par max 10 km
> ; je n'ai donc pas, dans mes matrices, toutes les distances possibles
> entre tous les individus.
>
> ade requiert, pour le test de mantel, des matrices de distances
> complètes (comme, d'ailleurs, tous les logiciels que je connais
> qui permettent de faire ce test) ; y a t'il une raison statistique pour
> cela ? cela pose t'il un pb de ne pas faire le test sur toutes les
> distances possibles entre paires d'individus ?

Bien évidemment, il y a une raison statistique à cela. La présente question touche plus
généralement aux liens entre matrices de distances.

Du point de vue pratique, ce qui intéresse essentiellement un biologiste (N.B. au sens de
la fonction, une personne qui fait de la biologie !), une matrice de distances est un
ensemble de valeurs de distances dij et cet ensemble peut ne pas recouvrir tous les
couples ij. C'est bien vrai, puisque la classe dist de R est l'écriture sous forme d'un
vecteur de la demi-matrice d21, d31, d41, ..., d32, d42, ... où ne figure qu'une seule des
deux valeurs égales dij et dji et pas les valeurs nulles djj.

La question est posée par l'obsevation que le test de Mantel porte sur la corrélation
entre les deux matrices de distances écrites sous cette forme. C'est la porte ouverte à
une énorme bévue qui consisterait à croire que le test de Mantel, puisqu'il calcule une
corrélation est un test de corrélation. Ce serait très pratique parce que avec 20
individus on a 20*9 = 180 couples actifs et un test archi significatif pour pas cher.
C'est parfaitement idiot, à cause de la non indépendance entre les couples. Si i et j sont
voisins et i et k loin l'un de l'autre alors j et k aussi (sauf si parle d'élastiques).

Le test utilise la statistique de la corrélation mais pas l'hypothèse nulle de
l'indépendance du modèle linéaire. C'est pourquoi les matrices de distances doivent être
pleines pour faire le test de Mantel et que pour faire autrement, il faut réfléchir.

Rien n'empêche de changer d'individus statistiques et de dire que l'individu de l'analyse
est un couple ij de points qui donne un dij et un Dij. On doit s'arranger pour avoir
l'indépendance entre les ij. Evidemment, c'est compliqué, car on voudrait bien que le même
point serve plusieurs fois (c'est cher les données). En tous cas, si les couples ne sont
pas indépendants le test est invalide (mais, bof, ça ne serait pas le premier !)

On pourrait penser étendre le test aux données manquantes sans problème en utilisant les
permutations aléatoire lignes-colonnes propre à l'hypothèse non paramétrique, mais cela ne
tiendrait que pour des données manquantes aléatoires (pas du genre manque au dela de x0).
La vie est dure.



This archive was generated by hypermail 2b30 : Tue Oct 18 2005 - 10:35:39 MEST