Analyse de données de polymorphisme
et de substitution
I- Evolution de la déshydrogénase alcoolique chez la drosophile
L’étude du gène de la déshydrogénase alcoolique
(Adh) chez la drosophile est un exemple renommé de l’analyse du polymorphisme
des séquences d’ADN en évolution moléculaire.
* En électrophorèse enzymatique, l’Adh présente
deux allèles, Adh-f et Adh-s (pour “fast” et “slow”), qui ségrègent
en fréquence intermédiaire dans les populations naturelles
de Drosophila melanogaster d’Amérique du nord tout en formant un cline
longitudinal. Depuis les premières études, ce gène a
été suspecté être sous l’action d’une sélection
stabilisante agissant sur les deux formes alléliques.
* En 1983 des séquences d’Adh d’individus différents ont
été obtenues dans l’une des premières études
de polymorphisme de séquences d’ADN codant (Kreitman 1983).
- Ouvrir le logiciel DnaSP. (NB: DnaSP est disponible
sur ce site: http://www.ub.es/dnasp/)
- Ouvrir le fichier adh.nex. Le fichier est composé
de 28 séquences : les 12 premières sont des séquences
de D. melanogaster, et les 16 autres sont des séquences de deux espèces
proches, D. simulans (4 séquences) et D. yakuba (12 séquences).
- Combien y a-t-il de sites polymorphes dans les séquences de D. melanogaster
?
- Combien de sites polymorphes modifient la séquence en acides aminés
(mutations non synonymes) ? Retenez leurs positions.
- Combien de sites polymorphes ne modifient pas la séquence en acides
aminés mais sont dans les portions codantes du gène, c'est-à-dire
les exons (mutations synonymes)?
- Combien de sites polymorphes se situent dans les régions non-codantes
(introns, 3’ et 5‘ UTR) ?
- Mêmes questions pour D. simulans et D. yakuba
Remplir le tableau suivant :
|
D. melanogaster
|
D. simulans
|
D. yakuba
|
Pn
|
|
|
|
Ps
|
|
|
|
Pnc
|
|
|
|
Pn: nombre de sites non synonymes polymorphes.
Ps: nombre de sites synonymes polymorphes.
Pnc: nombre de sites polymorphes dans l’ADN non-codant.
* La distribution du polymorphisme le long du gène de l’Adh a
longtemps été considéré comme un exemple de l’effet
que peut avoir un polymorphisme sous sélection balancé (le
polymorphisme thréonine/lysine responsable des formes Adh-f et Adh-s)
sur les mutations neutres avoisinantes (Hudson et al. 1987; Kreitman and
Hudson 1991).
- Réaliser une analyse par fenêtre coulissante du polymorphisme
afin de visualiser le pic de diversité avoisinant la mutation non-synonyme.
- Afin de vérifier que le pic de diversité n’est pas du au
variation du taux de mutation, faire la même manip chez les 2 autres
espèces et sur les taux de substitutions entre espèces (divergence).
* En 1999, Begun et al. (1999) lèvent le doute en montrant que
le pic de diversité est présent dans des populations monomorphes
d’Afrique. Si polymorphisme balancé il y a, il n’est probablement
pas la cause du pic de diversité observé.
- Ouvrir le fichier BegunADH.nex qui contient
les séquences d’une population de drosophile du Zimbabwe.
- Y a-t-il des sites non synonymes polymorphes ?
- Retrouve-t-on le pic de diversité précédemment observé
?
* Les séquences d’Adh de drosophile sont également à
l’origine d’un standard de l’évolution moléculaire, le test
de McDonald et Kreitman (McDonald and Kreitman 1991). La logique du test
repose sur l’utilisation d’un ratio substitutions non synonymes sur substitutions
synonymes, ces dernières jouant le rôle de référence
neutres. Ceci le rend insensible aux déviations de l’équilibre
démographique et permet de comparer, dans la forme originale, le polymorphisme
intraspécifique et la divergence interspécifique. Si le ratio
non synonyme sur synonyme est significativement plus grand dans la divergence
que dans le polymorphisme, on déduit qu’il y a eu des fixations adaptatives
parmi les fixations en acides aminés observées.
- Calculer le nombre de fixations synonymes, non-synonymes et dans l’ADN
non codant, entre les 3 espèces de drosophile, ou alternativement
utiliser la procédure "McDonald and Kreitman test" de DnaSP.
Remplir le tableau suivant :
|
D. melanogaster
|
D. simulans
|
D. yakuba
|
Total
|
Pn
|
|
|
|
|
Ps
|
|
|
|
|
Pnc
|
|
|
|
|
Dn
|
|
|
|
|
Ds
|
|
|
|
|
Dnc
|
|
|
|
|
Pn: nombre de sites non synonymes polymorphes.
Ps: nombre de sites synonymes polymorphes.
Pnc: nombre de sites polymorphes dans l’ADN non-codant.
Dn: nombre de substitutions non synonymes.
Ds: nombre de substitutions synonymes.
Dnc: nombre de substitutions dans l’ADN non-codant.
- L’attendu neutre est que le ratio Pn/Ps (ou Pn/Pnc ou Pn/(Ps+Pnc)) devrait
être égale au ratio Dn/Ds (ou Dn/Dnc ou Dn/(Ds+Dnc)). Dans leur
papier, McDonald et Kreitman ont sommé tous les polymorphismes sur
les 3 espèces et ont comparé les mutations synonymes et non
synonymes. Vérifier que le test est significatif (NB : certains sites
comptés polymorphes par McDonald et Kreitman mais codés comme
étant incertains dans les séquences de Genbank ont été
éliminés dans l’analyse).
|
Somme des polymorphismes dans les 3 espèces
|
Divergence
|
Non synonyme
|
|
|
Synonyme
|
|
|
- Le test est-il encore significatif dans d’autres configurations (par exemple
en prenant en compte le polymorphisme des introns ou dans une seule espèce)
?
- Enfin, est-ce que la sélection potentiel sur le polymorphisme thréonine/lysine
responsable des formes Adh-f et Adh-s a une influence sur le test de McDonald
et Kreitman ?
II- Evolution des protéines des glandes sexuelles des Drosophiles
mâles ("male accessory gland proteins", ACP).
Dans le fichier ACP.nex, vous trouverez 10 séquences
de D. melanogaster dont vous étudierez le polymorphisme, et une séquence
de chacune de 3 espèces proches (D. simulans, D. sechelia et D. mauritiana)
pour la divergence. Il s’agit de deux gènes ACP dupliqués en
tandem chacun composé de deux exons qui ont été publiés
par Aguadé et al. (1992). Ces gènes présentent un polymorphisme
et une divergence non synonymes très forts et ils sont de ce fait
suspectés être sous l’influence d’une sélection positive
diversifiante.
En plus des analyses comparables à celles réalisées
sur l’Adh, ces séquences permettent d’introduire une méthode
récente pour détecter la signature de la sélection (Fay
and Wu 2000). Lorsqu’une mutation favorable se fixe, elle élimine
la diversité neutre qui lui est liés si aucun événement
de recombinaison n’a lieu pendant la fixation entre la mutation favorable
et le site polymorphe. Un peu plus loin sur le chromosome, des événements
de recombinaison ont permis de conserver de la diversité mais les
fréquences des mutations ont tout de même été
perturbées par la fixation de la mutation favorable. Fay et Wu (2000)
ont montré que ce processus entraînait un excès de mutations
fréquentes par rapport à l’attendu neutre et ont développé
une statistique pour quantifier cet excès. Vous réaliserez
une analyse en fenêtre coulissante de la statistique H dans la procédure
"Fu and Li's (and other) Tests with an Outgroup" de DnaSP.
III- Estimations du taux de substitution adaptative génomique.
Une extension multilocus du test de McDonald et Kreitman peut permettre d’estimer
le taux de substitution adaptative (Smith and Eyre-Walker 2002). Il s’agit
de compiler des tables de McDonald et Kreitman sur un grand nombre de gènes
et d’inférer l’excès de substitutions non synonymes. Bierne
et Eyre-Walker (2004) ont développé une méthode simple
pour estimer ce taux par maximum de vraisemblance. Une démonstration
sera présentée sur le jeux de données de Smith et Eyre-Walker
(2002).
Références
Aguade, M., N. Miyashita and C. H. Langley, 1992 Polymorphism and divergence
in the Mst26A male accessory gland gene region in Drosophila. Genetics 132:
755-770.
Begun, D. J., A. J. Betancourt, C. H. Langley and W. Stephan, 1999 Is the
fast/slow allozyme variation at the Adh locus of Drosophila melanogaster
an ancient balanced polymorphism? Mol. Biol. Evol. 16: 1816-1819.
Bierne, N., and A. Eyre-Walker, 2004 The genomic rate of adaptive amino-acid
substitution in Drosophila. Mol Biol Evol 21: 1350-1360.
Fay, J. C., and C. I. Wu, 2000 Hitchhiking under positive Darwinian selection.
Genetics 155: 1405-1413. (PDF)
Hudson, R. R., M. Kreitman and M. Aguade, 1987 A test of neutral molecular
evolution based on nucleotide data. Genetics 116: 153-159.
Kreitman, M., 1983 Nucleotide polymorphism at the alcohol dehydrogenase gene
region of Drosophila melanogaster. Nature 304: 412-417.
Kreitman, M., and R. R. Hudson, 1991 Inferring the evolutionary histories
of the Adh and Adh-dup loci in Drosophila melanogaster from patterns of polymorphism
and divergence. Genetics 127: 565-582. (PDF)
McDonald, J. H., and M. Kreitman, 1991 Adaptive evolution at the Adh locus
in Drosophila. Nature 351: 652-654.
Smith, N. G. C., and A. Eyre-Walker, 2002 Adaptive protein evolution in Drosophila.
Nature 415: 1022-1024.
Index