Re: MCA et genetique des populations

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Thu Dec 02 1999 - 14:07:46 MET


La question de Christian BARNABE revient régulièrement et a pour thème
"quels liens peut-on faire entre génétique et analyse des données ?". Il
est normal que cette question arrive sur ce forum.

Il faut savoir que c'est une question ouverte. L'articulation entre les
deux langages n'est pas faite. Cela se voit sur le message dans le lien
entre le terme fingerprinting a locus independants et MCA. Si l'allèle
utilisé dans un locus est indépendant de l'allèle utilisé dans un autre
(chromosomes différents ou distances importantes sur le même chromosome), a
priori l'analyse des correspondances multiples destinée à faire le bilan
des corrélations entre modalités de variables différentes n'a pas d'intérêt.

Mais la typologie des individus n'est en général pas un objectif de la
génétique des populations. Ce qui compte c'est la variabilité entre
groupes. On travaille donc sur les fréquences alléliques. C'est pourquoi on
fait de l'AFC groupes/allèles par locus ou simultanément (AFC dite de
Leclerc : Leclerc, A. (1975) L'analyse des correspondances sur
juxtaposition de tableaux de contingence. Revue de Statistique Appliquée :
XXIII, 5-16.). On peut faire aussi de l'ACM floue mais les justificatifs
apportés par Guinand, B. (1996) Use of a multivariate model using allele
frequency distributions to analyse patterns of genetic differentiation
among populations. Biological Journal of the Linnean Society : 58, 173-195,
sont totalement erronées. On peut faire de l'ACP sur tableau de profils
mais les aides à l'interprétation sont incomplètes. L'inter-classe
(populations) après l'ACM citée par Christian BARNABE est une
généralisation acceptable de l'AFC de Leclerc pour données manquantes. On
peut aussi penser introduire le multi-tableau surtout pour des loci très
polymorphes comme les microsatellites. Enfin, rien ne prend en compte dans
la structure des données à deux allèles par locus pour les individus
diploides, sauf les codage en 00100100 pour les hétérozygotes et 00020000
pour les homozygotes mais il faut préciser quel type d'analyses
conviennent. En particulier il faut connecter les paramètres classiques de
génétique des populations Fst, Fis, PIC, taux homozygotie, ... avec les
statistiques des diverses analyses.

Enfin, la diversité des manips, les difficultés d'interprétation, le type
de polymorphisme, ... générent des cas particuliers fort nombreux. C'est
pourquoi il est difficile de donner une indication générale sur la question
posée.

Nous avons entrepris avec D. Laloë (SGQA, INRA, Jouy en Josas) d'apporter
des réponses précises à quelques unes de ces questions. Le travail est en
cours. Nous en sommes à choisir un mode de codage pour avoir un utilitaire
de lecture large, à mettre des données de référence dans la pile de données
et à illustrer diverses approches sur ce type de données.

D'ici peu, nous mettrons une fiche thématique sur les cas étudiés. La
prochaine version d'ADE-4 comportera aussi des développements sur les
matrices de distances, en particulier un test de comparaison meilleur que
celui de Mantel, des méthodes de calcul des indices de biodiversité dont
certains recouperont les indices de diversité génétique et la possibilité
de faire de la PCO sur plusieurs matrices de distances (méthodes
K-distances). Si des utilisateurs potentiels ont des desiderata on peut
aussi discuter de l'introduction du Neighbour joining dans Clusters.

à suivre ...

>A ma connaissance, peu de travaux utilisent la MCA (Analyse des
>Correspondances Multiples) en genetique descriptive, en considerant par
>exemple les locus "enzymatiques" comme variables et les genotypes a ces
>locus comme modalites. En revanche, pas mal de travaux utilisent l'AFC.
>
>Quelle (s) methode (s) selon vous sont les plus adaptes pour une etude
>genetique (isoenzymes, RAPD ou tout fingerprinting a locus independants) ?
>quand il s'agit bien entendu de variables qualitatives de type presence /
>absence de tel ou tel genotype.

Daniel Chessel
Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
69622 Villeurbanne CEDEX
Tel : 04 72 44 82 77 - (33) 4 72 44 82 77



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:36:03 MET