Analyse de données de polymorphisme et de substitution


I- Evolution de la déshydrogénase alcoolique chez la drosophile


L’étude du gène de la déshydrogénase alcoolique (Adh) chez la drosophile est un exemple renommé de l’analyse du polymorphisme des séquences d’ADN en évolution moléculaire.

* En électrophorèse enzymatique, l’Adh présente deux allèles, Adh-f et Adh-s (pour “fast” et “slow”), qui ségrègent en fréquence intermédiaire dans les populations naturelles de Drosophila melanogaster d’Amérique du nord tout en formant un cline longitudinal. Depuis les premières études, ce gène a été suspecté être sous l’action d’une sélection stabilisante agissant sur les deux formes alléliques.

* En 1983 des séquences d’Adh d’individus différents ont été obtenues dans l’une des premières études de polymorphisme de séquences d’ADN codant (Kreitman 1983).
- Ouvrir le logiciel DnaSP. (NB: DnaSP est disponible sur ce site: http://www.ub.es/dnasp/)
- Ouvrir le fichier adh.nex. Le fichier est composé de 28 séquences : les 12 premières sont des séquences de D. melanogaster, et les 16 autres sont des séquences de deux espèces proches, D. simulans (4 séquences) et D. yakuba (12 séquences).
- Combien y a-t-il de sites polymorphes dans les séquences de D. melanogaster ?
- Combien de sites polymorphes modifient la séquence en acides aminés (mutations non synonymes) ? Retenez leurs positions.
- Combien de sites polymorphes ne modifient pas la séquence en acides aminés mais sont dans les portions codantes du gène, c'est-à-dire les exons (mutations synonymes)?
- Combien de sites polymorphes se situent dans les régions non-codantes (introns, 3’ et 5‘ UTR) ?
- Mêmes questions pour D. simulans et D. yakuba

Remplir le tableau suivant :

D. melanogaster
D. simulans
D. yakuba
Pn



Ps



Pnc




 
Pn: nombre de sites non synonymes polymorphes.
Ps: nombre de sites synonymes polymorphes.
Pnc: nombre de sites polymorphes dans l’ADN non-codant.

* La distribution du polymorphisme le long du gène de l’Adh a longtemps été considéré comme un exemple de l’effet que peut avoir un polymorphisme sous sélection balancé (le polymorphisme thréonine/lysine responsable des formes Adh-f et Adh-s) sur les mutations neutres avoisinantes (Hudson et al. 1987; Kreitman and Hudson 1991).
- Réaliser une analyse par fenêtre coulissante du polymorphisme afin de visualiser le pic de diversité avoisinant la mutation non-synonyme.
- Afin de vérifier que le pic de diversité n’est pas du au variation du taux de mutation, faire la même manip chez les 2 autres espèces et sur les taux de substitutions entre espèces (divergence).

* En 1999, Begun et al. (1999) lèvent le doute en montrant que le pic de diversité est présent dans des populations monomorphes d’Afrique. Si polymorphisme balancé il y a, il n’est probablement pas la cause du pic de diversité observé.
- Ouvrir le fichier BegunADH.nex qui contient les séquences d’une population de drosophile du Zimbabwe.
- Y a-t-il des sites non synonymes polymorphes ?
- Retrouve-t-on le pic de diversité précédemment observé ?

* Les séquences d’Adh de drosophile sont également à l’origine d’un standard de l’évolution moléculaire, le test de McDonald et Kreitman (McDonald and Kreitman 1991). La logique du test repose sur l’utilisation d’un ratio substitutions non synonymes sur substitutions synonymes, ces dernières jouant le rôle de référence neutres. Ceci le rend insensible aux déviations de l’équilibre démographique et permet de comparer, dans la forme originale, le polymorphisme intraspécifique et la divergence interspécifique. Si le ratio non synonyme sur synonyme est significativement plus grand dans la divergence que dans le polymorphisme, on déduit qu’il y a eu des fixations adaptatives parmi les fixations en acides aminés observées.

- Calculer le nombre de fixations synonymes, non-synonymes et dans l’ADN non codant, entre les 3 espèces de drosophile, ou alternativement utiliser la procédure "McDonald and Kreitman test" de DnaSP.

Remplir le tableau suivant :
               
    


D. melanogaster 
D. simulans
D. yakuba
Total
Pn




Ps




Pnc




Dn




Ds




Dnc




    
Pn: nombre de sites non synonymes polymorphes.
Ps: nombre de sites synonymes polymorphes.
Pnc: nombre de sites polymorphes dans l’ADN non-codant.
Dn: nombre de substitutions non synonymes.
Ds: nombre de substitutions synonymes.
Dnc: nombre de substitutions dans l’ADN non-codant.

- L’attendu neutre est que le ratio Pn/Ps (ou Pn/Pnc ou Pn/(Ps+Pnc)) devrait être égale au ratio Dn/Ds (ou Dn/Dnc ou Dn/(Ds+Dnc)). Dans leur papier, McDonald et Kreitman ont sommé tous les polymorphismes sur les 3 espèces et ont comparé les mutations synonymes et non synonymes. Vérifier que le test est significatif (NB : certains sites comptés polymorphes par McDonald et Kreitman mais codés comme étant incertains dans les séquences de Genbank ont été éliminés dans l’analyse).

        
        
        

Somme des polymorphismes dans les 3 espèces
Divergence
Non synonyme


Synonyme



- Le test est-il encore significatif dans d’autres configurations (par exemple en prenant en compte le polymorphisme des introns ou dans une seule espèce) ?

- Enfin, est-ce que la sélection potentiel sur le polymorphisme thréonine/lysine responsable des formes Adh-f et Adh-s a une influence sur le test de McDonald et Kreitman ?

 II- Evolution des protéines des glandes sexuelles des Drosophiles mâles ("male accessory gland proteins", ACP).

Dans le fichier  ACP.nex, vous trouverez 10 séquences de D. melanogaster dont vous étudierez le polymorphisme, et une séquence de chacune de 3 espèces proches (D. simulans, D. sechelia et D. mauritiana) pour la divergence. Il s’agit de deux gènes ACP dupliqués en tandem chacun composé de deux exons qui ont été publiés par Aguadé et al. (1992). Ces gènes présentent un polymorphisme et une divergence non synonymes très forts et ils sont de ce fait suspectés être sous l’influence d’une sélection positive diversifiante.
En plus des analyses comparables à celles réalisées sur l’Adh, ces séquences permettent d’introduire une méthode récente pour détecter la signature de la sélection (Fay and Wu 2000). Lorsqu’une mutation favorable se fixe, elle élimine la diversité neutre qui lui est liés si aucun événement de recombinaison n’a lieu pendant la fixation entre la mutation favorable et le site polymorphe. Un peu plus loin sur le chromosome, des événements de recombinaison ont permis de conserver de la diversité mais les fréquences des mutations ont tout de même été perturbées par la fixation de la mutation favorable. Fay et Wu (2000) ont montré que ce processus entraînait un excès de mutations fréquentes par rapport à l’attendu neutre et ont développé une statistique pour quantifier cet excès. Vous réaliserez une analyse en fenêtre coulissante de la statistique H dans la procédure "Fu and Li's (and other) Tests with an Outgroup" de DnaSP.

III- Estimations du taux de substitution adaptative génomique.

Une extension multilocus du test de McDonald et Kreitman peut permettre d’estimer le taux de substitution adaptative (Smith and Eyre-Walker 2002). Il s’agit de compiler des tables de McDonald et Kreitman sur un grand nombre de gènes et d’inférer l’excès de substitutions non synonymes. Bierne et Eyre-Walker (2004) ont développé une méthode simple pour estimer ce taux par maximum de vraisemblance. Une démonstration sera présentée sur le jeux de données de Smith et Eyre-Walker (2002).


Références
Aguade, M., N. Miyashita and C. H. Langley, 1992 Polymorphism and divergence in the Mst26A male accessory gland gene region in Drosophila. Genetics 132: 755-770.
Begun, D. J., A. J. Betancourt, C. H. Langley and W. Stephan, 1999 Is the fast/slow allozyme variation at the Adh locus of Drosophila melanogaster an ancient balanced polymorphism? Mol. Biol. Evol. 16: 1816-1819.
Bierne, N., and A. Eyre-Walker, 2004 The genomic rate of adaptive amino-acid substitution in Drosophila. Mol Biol Evol 21: 1350-1360.
Fay, J. C., and C. I. Wu, 2000 Hitchhiking under positive Darwinian selection. Genetics 155: 1405-1413. (PDF)
Hudson, R. R., M. Kreitman and M. Aguade, 1987 A test of neutral molecular evolution based on nucleotide data. Genetics 116: 153-159.
Kreitman, M., 1983 Nucleotide polymorphism at the alcohol dehydrogenase gene region of Drosophila melanogaster. Nature 304: 412-417.
Kreitman, M., and R. R. Hudson, 1991 Inferring the evolutionary histories of the Adh and Adh-dup loci in Drosophila melanogaster from patterns of polymorphism and divergence. Genetics 127: 565-582. (PDF)
McDonald, J. H., and M. Kreitman, 1991 Adaptive evolution at the Adh locus in Drosophila. Nature 351: 652-654.
Smith, N. G. C., and A. Eyre-Walker, 2002 Adaptive protein evolution in Drosophila. Nature 415: 1022-1024.

Index