Re: test de mantel

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Fri Mar 25 2005 - 10:26:21 MET

  • Next message: natalia norden: "autre question test de mantel"

    Aurélie Coulon a écrit :
    > bonjour,
    >
    > je voudrais tester la corrélation entre des distances génétiques et
    > géographiques entre individus, en utilisant un test de mantel.
    > mon pb est que* *mes matrices de distances ne sont pas complètes car je
    > dispose d'individus échantillonnés sur une zone de 50x50km, et je ne
    > veux tester la corrélation que pour les individus séparés par max 10 km
    > ; je n'ai donc pas, dans mes matrices, toutes les distances possibles
    > entre tous les individus.
    >
    > ade requiert, pour le test de mantel, des matrices de distances
    > complètes (comme, d'ailleurs, tous les logiciels que je connais
    > qui permettent de faire ce test) ; y a t'il une raison statistique pour
    > cela ? cela pose t'il un pb de ne pas faire le test sur toutes les
    > distances possibles entre paires d'individus ?

    Bien évidemment, il y a une raison statistique à cela. La présente question touche plus
    généralement aux liens entre matrices de distances.

    Du point de vue pratique, ce qui intéresse essentiellement un biologiste (N.B. au sens de
    la fonction, une personne qui fait de la biologie !), une matrice de distances est un
    ensemble de valeurs de distances dij et cet ensemble peut ne pas recouvrir tous les
    couples ij. C'est bien vrai, puisque la classe dist de R est l'écriture sous forme d'un
    vecteur de la demi-matrice d21, d31, d41, ..., d32, d42, ... où ne figure qu'une seule des
    deux valeurs égales dij et dji et pas les valeurs nulles djj.

    La question est posée par l'obsevation que le test de Mantel porte sur la corrélation
    entre les deux matrices de distances écrites sous cette forme. C'est la porte ouverte à
    une énorme bévue qui consisterait à croire que le test de Mantel, puisqu'il calcule une
    corrélation est un test de corrélation. Ce serait très pratique parce que avec 20
    individus on a 20*9 = 180 couples actifs et un test archi significatif pour pas cher.
    C'est parfaitement idiot, à cause de la non indépendance entre les couples. Si i et j sont
    voisins et i et k loin l'un de l'autre alors j et k aussi (sauf si parle d'élastiques).

    Le test utilise la statistique de la corrélation mais pas l'hypothèse nulle de
    l'indépendance du modèle linéaire. C'est pourquoi les matrices de distances doivent être
    pleines pour faire le test de Mantel et que pour faire autrement, il faut réfléchir.

    Rien n'empêche de changer d'individus statistiques et de dire que l'individu de l'analyse
    est un couple ij de points qui donne un dij et un Dij. On doit s'arranger pour avoir
    l'indépendance entre les ij. Evidemment, c'est compliqué, car on voudrait bien que le même
    point serve plusieurs fois (c'est cher les données). En tous cas, si les couples ne sont
    pas indépendants le test est invalide (mais, bof, ça ne serait pas le premier !)

    On pourrait penser étendre le test aux données manquantes sans problème en utilisant les
    permutations aléatoire lignes-colonnes propre à l'hypothèse non paramétrique, mais cela ne
    tiendrait que pour des données manquantes aléatoires (pas du genre manque au dela de x0).
    La vie est dure.



    This archive was generated by hypermail 2b30 : Fri Mar 25 2005 - 10:27:09 MET