INSA - Examen





Question: genome annotation 
 

A fragment of the genome of chicken (Gallus gallus) has been sequenced:
 

>chicken_genome
GATAAAAGTTTAACGTGATTTTTCAGTGATATAATTTCCATACAGGAAAAGTGTATGATA
GATTTGAAAAAGGAATTATGTAATTCTGATTCATTTTTTTTAAGGAGCAGATGATTTTAG
GTAAGCTTCTAAGAGAGCTATTTGAATAATCTATACGTTATAGACATACAGAGATTGGTT
TTAGATGTTATTTTTCTGGAAAGATATACTAATGTGTAATAGAATACTTACTATGGCAAC
AGCATGTGAAATGTTTTTAAAACAAAAGTAATTTTTTTAATAGGTCTTACAAGAAGCCTA
AGTATAACTTCAGCTGAATCAGCATTTGAAAAAGCTCAAGGAGAGAGAGTTACGTTGCCA
TGTACCTTTGAACTCTCAGAAGAGGATGTAGGCACACTAGATATTGAGTGGGTTTTGATA
CCAGCAGATATTCAGAAGAAGGAAGAAACAGTAAGTAAAAACTTCTTAATTTTTGGCAGC
TGTAGTCAAGTCATTAGGGTAAGTCAATGTGTGAACTTTGGTAGTGACTCTTTTGACTTT
CACCTTTTCAAGATGGTATGCGTGTGATCTTAAATTACTTTGAAGCACCAATGTGGAAGT
TATGAAATAGTGAGAATGTTACAATATTTTGTGCTTAATCCTCTATTCACTGTGAACAAT
TCTAAAATTAAAAAATGATTCAGAGAACAGACAACTCTGCTTTTGCAGACCTACACTATG
TTTCTGATTGAAAGAAGTCGTTTATAAGAATTTGGTCTTAAATGTAGTATGTCTTTGTTA
GTTATTAGCTCTTTCACTTATTCTGAAGTCTGAGAACTTCTTTAGCAGAGATTTTACAGA
ATTAAGATTAGATAAATAGTTTTCTTTAAGACAGAAGACAGTGTTGACATTCTTTCACTT
GAACAGGTATTGCATTGGAGTATTTGTTAGAGCGTTTTGTGTGGTGTTATTTTGAAAAAA
GGTACGTCATGCCCTGGGATTACTTTAAACAGTAAAGGGAGGCTGCTAAAAATCTGAAGA
TGCTTTTTATTTTTTCTTCAAATGTTCATATGTCAAGTAGATTCCTGAACCGTATTTCTT
CTTTTACAGATAATTCTATATTCTGGAGATAGGATTTATAATCATTATCATCCTGCTCTG
GCTGGGCGGCTGCAATTTACTAGTTCTGATCCCAAATCTGGTGATGGTTCAGTGGATATC
CTGAATTTAAAGTCAGCAGATACTGGCACATACCAGTGCAAAGTGAAGAAGGCTCCTGGA
GTTGAAAGCCTAAAAATACAGTTGAACGTACTTGGTAAGCAAGTTTTTTTTTTTTTCCCA
TGAATTTCAGTGGCATGTTTGTGTTTATGCTATTTTTCATTTGATATATAAAATGAAAAC
GAATGTAGGGCAAAGTCATACTGAATCTACAATAATGCATCCATTATTAAGTCTTCAGGA
CAGGGGCAGGCAAAGTAAATAATAGAGTAATTGAGCACTTTTAAAAATTGTGCATCTGAT
TCGTATTTCATAGTATTTTTTTCATGCTTACAAAGGCTTTGTTGTACAAAATTGCTATAG
TAAAATGTGCTGATGAACTAAAATGTTACGATTTTGATTGTGACTTATTAATTCAATAAT
ACTTTGTTTATCAGTAAAGCCAGCAAGCACTAAATGCTCCATTGAAGGATCACAGGAGAT
TGGAAAGGACATTGTATTGAAGTGTGCATCACAAGAAGGAACCCCACTTTTGTATTATGA
CTGGAGAAGAGTAGTAACTGGCACACAAGGACTTCCTGCCACTTCCGTACTAAGTATTGT
CAAACTTTAAGTATTTCAGAATAATAAATAATACAGATTGTATTCATATTTTTGACATAT
TTTGACTTGTTAGCAGCTTATGCGTGCTTTTAATATAGAGCAGTCTATAGAAGTGTCACT
TCTATCCTTCCAGTGGATAGTAAAACTGACATTTAAACAAGCTACTCCGAGTTGAGAGAG
ATTCTTACCATTAGGTTTGCAGAATCATGCTAATCTCTGCATACAAATGTTTTGACTGCT
CTTGCTTGTTGATTCTTGGCTGCTTTTCTGTTCAGATGGATGGGGTGAAGAGTCAGAATA
GAGTATAGACCAGTGGTTTGAACTGTATATTCAATTGGAAATGAAATTTAAATTTTAGTA
TAGATTGAAGTGAGAGCTTCAGTTTCTGGTCAAGTGATGGAACTGCTTAGTTAAGGAGGG
GAGAGAATACATGTCTATGGAAGAAAAATTGTCATGAGTAAAGGAAATGAGAAGGTTGTC
TCTCTTCTTATGTGACACATCCAGGAAAGAATTTTCTTAAAAAAAACTGGCTTATAAATT
GAGAATTGTTATTGTGGTGGTATTGGATTTTTTTTTTTTTTTTTTTTTGTGAAAACTTAA
TTGCTGAAGTTTATTAGAGAAGTTGATTTTACTCATCAGTTTAGTTCATTGGTAGTTTGT
GAGTTCTGACTTTGAAAGTTATCCTGGAATATTTTATGTAATTATGCTTTGCAGTACCAA
TTCTTTTTTACTTTTGTAATTAAAAAAAAAAAAAAGCTTTAAAGCCTTGAAATGGTAGCC
CTTTAAGTGCAGGTATAGCTCTTTAAGTATTTGCTTAGAAGTGTTTTAACTCAGATTGCA
AATTACATACAGGATGAAAACTATCATGATATGTTCAAGAGCAGCCATAGTCTTGGGAGA
GAGATTAGGAACATGTGTGGATCTTCTTCATAATGATCTCCTGTCCTCCTGTCATTTATG
CTTTTAGACCTTCCAGAGGGAGATACGGTTTCCATTCAATTGACCTAAACCAAACAAAAG
TGACTATCTGAACTCTGCTTTGTACTTCTCCAGTCTACTTCAAACTGTAGTCCAGTAGTA
TCTGCATGTCTTAGGGGACATAACTCCTAAAAATTAATTGCATCTGAAAAACCTTGTACT
GTTCTTGAGCTTGCCTTGTGGTAGTGCTGTTTGATACATCCTATTTCTTGTTTTGACAAC
AAGCAGTTAGTTACTAATGTCTCTGTGTATCATTCAAGACCTTAAGCTTCTATTGTTCTC
TCTTTATCCACATTGCAAATTTGTTTCATAAATAAATTGATAGTTTTAGTGCTGGACAAG
AATGAGGAAGTATACAGAAATGGTGTGTAGCATCATTAAGCTACTGTTGCTTTCGGCTTG
TGATTGTAGGTTCATGGGCACTGAATGTGCTGTCAAGAACCTAGATGCTGCTTCACTTCA
GCTGAAGGAGCTAGCTAGGTCTTTGTGTGATTCTTTAGTACTGAGATGTAGTCTCTTGAC
AGCTTGGGATTTAAGTGCTGATGGCAAATCTATGAGCAATCTGAGTGTTCAAGCCATTTG
AAGTTCAGATAGTAATATCTCAAAGGTAGCTACCAGTTGCTTTGGAAGCCTTAGGAAGAA
ACTTTTTCTGTTTTCGCTCAGTCAGCCTATCTAGAGTTAAATGGTCACCTATTGGATCAG
CCTTTTGTGTTGAACGTGAGTTCTGCAGACATCTGAGATGGTTGCATAGAATTACTTCAC
ATACAGAAGAGAAGGAGATTCCTTTGGGATGCAGCTCATCCACTGTATTTTAAAACTCCA
GGTTAGGGTGAGAGAACTTGCCATCTTAAGTATCCTTTTCTTTCCATTGGCAGAGCAATT
TGAAAGCCTTGTTACTAAAGTCAATTTCTGTGGCATAAATTTCTACTGAAGTAAACGGTT
TTTACAAATAGTAGTGTTCTGTGGTGGAGTAAACTTTTGGTTTTGAGTATTGTTTTCAAT
ATGGCATTTTTAGTTAAGATTTCATGAATGTGCTTGATTAATAATTCTGTTGCGTGCTGG
ATTGATAATTCTGTTGCATTGAATTAGAAATTAAACTTTGGTAAATGGTAAACCTTTTGC
TTCTTATTCTTTGTAGACAAAAATACAGGGGAACTTCTCTTGAAAAATGCCTCTAAAGAC
TATTCTGGTACATACAGTTGTGTTGCTTCAAACCGAGTTGGCACAGATGAATGTTCTGTT
GAGCTGAATGTCACCCCTCGTAAGTGTTCACTGTGTAGTAGTCACATAGTGTTTTGTGTA
TTTGAATAATCTTGTTTCTCTATATTCTTAAAAGTTTAAAAACAACAAACACTGTTTTGC
AGCTGAGGGTTGCTGCTTTAAATTTGTACTTTGCCGAAGATTTGATTATTTTTTTTTAAT
GTAGAAAGATACAATTCTCCTGTCATTCTCAATCACAGAATTGAAACATACCTCTACTTC
AGTGATAAATTAAGTTTGATGCTTAAACACTATTGTAATTTATCTATTCTAGCTATAAAT
ACAGCTGGTGTAATTGCTGGAGCTATTCTGGGAACTCTGTTGGGTCTTGCCTTGTTGGCT
TTTCTTGTCATCTGTTGCTGTAAGAAGCATAGAGAGAAGAAATATGAGAAAGAAGTACAT
CATGAAATCAGGTAATGACATGCCTAGCTTGAGAGGTTCTGCTTGAAAATTAGCTGCTAA
ATGACTTTATGCAAGGAAGATGACTAGTAGTTGGGATTTCTGTTTTAATCTGGTAAATTT
ATTAAAACACTAACAGTTCATCTGAGAACTTGTTTTGAGTATGGTGTAGGTAGTCATGTC
TTCCTACTTTCAGTAAAAATCTTAAAGACAATGATAACTTCCTTTTTTTTTTAAGATTAA
AAAAAAGCCTTTTTGTCTACTGAGTCAGAATGTGAAGAAACAAATGGAAACGTTATTATG
CAAGCTGCTGCGTAGCAGTAACTGAACTCTTGTTGTGCAACTGTTCTTTCTTTTCTTTCA
GAGAAGATGTTCTGCCTCCAAAAAGTCGCAGTTCAACAGCACGCAGCTACATAGGCAGCA
ATCGTTCTTCTCTGGGTTCAATGTCTCCCTCAAATATGGAAGGATACTCCAAAACTCCAT
ATAGCCAGGTTCCAAGTGAAGACTTTGAACGTACTTCTGGTCAAAACCAAACCATTGCAT
CTTCAAAGGTAGCTGCACCTAATTTAAGTAGAATGGGAGCTGTCCCTGTGATGATTCCAG
CACAAAGCAAAGATGGGTCCATAGTATGAAATATTAATTTAAGTCCTGGGTTTTTTAAGT
GTTTGTTGTAAGTATTAGAGAAAACTACAGTATTCCAACCCTCATTTAAACAATGGCATG
CAATTTTCCTTGAAGTAAATGAACATGTTAGTTTGAAAAGCCACCAATTCTCATTTTTAA
TTTTAAACTTATTAGTGTGTAACAGTTGAACTATTGAAAGCGTGAGAGTTCCTAAATATC
AGATACTGAAGGTGTTTGGATCTCTGGTGGCTTGCTGAAGAGATGCTATTAGCTGATGTG
CAGTTCTCAGAATCTGAAAGAGCAACACAACTGAGAAGTAACAAAACCATTTCATATGTA
GACAATGAAGTTCCTCAGAGTTCCTGAAGCTTTATTCTCAGTCTTGGAGTAAAGGGGTAT
TTTAATTTGGCCACTGTCTGATGAACTTGCAGTGGGGCTGAGATACTGAGGAGAACTTTG
AATTCTGCTCAAACTCAGAGGACTTATGCAGTTCTTGAAGTTGTCTGGAGTGTTTCCTGG
GTTGTTATCTCAGGGGCTACCAGTCATTTGGTTGGTTCAGTTAATTTAATGAATCTGTTC
TGAGTTTAAAATTACAATGAGTAAAAATGCAACAGGAGATTTTGCAAGCTCCTTGAAATC
AGAATTTTACTGCATTAACTGGTTCTAGTAGTGTCAGATAGTTAAGTTATCCTATGTAAC
ACGTCTTATCAGATTGTTACTAGTGGTATCTAGGTTCTAAAATCTATAGCTCAACTGTTA
CATTGTCAAAGTTAGAGTGAACATGCATCTCTGCAGGTCTTAAGTTAGCTGTATCTCACA
TTTTCCAAAGCCTCTTTAGATTCTAAGGCAGTGTTCTTTTTCTAAACCAACTACCTAGAA
GTTTCACGGGGCTTGATTACAGCTGTTAAGAAACTGGTATTTAATAGTTGCTCTTGCTC


Send your report (including results and discussions) to laurent.duret@univ-lyon1.fr (before 12h).