TP dotplot
dotplot est un outil graphique (simple mais relativement efficace) de comparaison de deux séquences (ou d'une séquences avec elle-même).
On utilise une applet java qui construit des dotplot, dotlet (doplot+applet) de Marco Pagni et Thomas Junier (Swiss Institute of Bioinformatics à Epalinges, Suisses). Vous pouvez :
- l'utiliser en ligne ici
- ou télécharger le fichier "dotlet.jar" ici et utiliser la commande
java -cp dotlet.jar DotletLa séquence ci-dessous contient un terminateur. C'est-à-dire qu'elle contient un palindrome signalant la présence d'une épingle à cheveux (hairpin).
>terminateur de UTP-glucose-1-phosphate uridylyltransferase, Bacillus subtilis CCCGCTGACAAGTGAAGGCCGCCGTTATCAGGTGAAAAACTTCGTTGAAAAACCGCCTAAAGGCACAGCACCTTCTAATC TTGCCATCTTAGGCCGTTACGTATTCACGCCTGAGATCTTCATGTATTTAGAAGAGCAGCAGGTTGGCGCCGGCGGAGAA ATTCAGCTCACAGACGCCATTCAAAAGCTGAATGAAATTCAAAGAGTGTTTGCTTACGATTTTGAAGGCAAGCGTTATGA TGTTGGTGAAAAGCTCGGCTTTATCACAACAACTCTTGAATTTGCGATGCAGGATAAAGAGCTTCGCGATCAGCTCGTTC CATTTATGGAAGGTTTACTAAACAAAGAAGAAATCTAAACAAAAAGGCTATTGGACATTCATCCAATAGCCTTTTTTTAT TTCAACATCAAAGTCAATGTATGCTCTTCATTATCAACTGCGAAGACCTGATCAACGGCCTGCCGCAAAAATTAATAATC CCAGACAAACACACTGATTGTAGAGTTAAACAAACTAAATGAAAACATAAATACAAACATGCAGATTAAATAGTAAATAT CTTGTATTCAATGCAAGCTAAGTAAACACCACTTGCTAAAAGAACAATGACTAAACAACCAGCATTACAAATComparer la séquence ci-dessus à elle-même à l'aide du dotplot. On obtient (en jouant sur les niveau de gris et en plaçant le curseur au niveau de la position 439/450) :
[à vous de trouver et de décrire le dotplot obtenu]
A l'aide de dotlet, on trouve de la position 361 à 396 (en rouge ci-dessous) :
0 1 2 3 4 5 6 7 8 12345678901234567890123456789012345678901234567890123456789012345678901234567890 CCCGCTGACAAGTGAAGGCCGCCGTTATCAGGTGAAAAACTTCGTTGAAAAACCGCCTAAAGGCACAGCACCTTCTAATC TTGCCATCTTAGGCCGTTACGTATTCACGCCTGAGATCTTCATGTATTTAGAAGAGCAGCAGGTTGGCGCCGGCGGAGAA ATTCAGCTCACAGACGCCATTCAAAAGCTGAATGAAATTCAAAGAGTGTTTGCTTACGATTTTGAAGGCAAGCGTTATGA TGTTGGTGAAAAGCTCGGCTTTATCACAACAACTCTTGAATTTGCGATGCAGGATAAAGAGCTTCGCGATCAGCTCGTTC CATTTATGGAAGGTTTACTAAACAAAGAAGAAATCTAAACAAAAAGGCTATTGGACATTCATCCAATAGCCTTTTTTTAT TTCAACATCAAAGTCAATGTATGCTCTTCATTATCAACTGCGAAGACCTGATCAACGGCCTGCCGCAAAAATTAATAATC CCAGACAAACACACTGATTGTAGAGTTAAACAAACTAAATGAAAACATAAATACAAACATGCAGATTAAATAGTAAATAT CTTGTATTCAATGCAAGCTAAGTAAACACCACTTGCTAAAAGAACAATGACTAAACAACCAGCATTACAAATAAAAAGGCTATTGGACATTCATCCAATAGCCTTTTT est bien un palindrome (sauf pour les quelques nucléotides du centre de cette sous-séquence), ci-dessous la première ligne est la seconde retournée :
T T T T T C C G A T A A C C T A C T T A C A G G T T A T C G G A A A A A A A A A A G G C T A T T G G A C A T T C A T C C A A T A G C C T T T T TOn voit les relations A/T et G/C. L'épingle à cheveux comporte une petite boucle (quelques nucéotides séparent les deux moités du palindrome). Cela implique que les deux diagonales représentant les deux moitiés du palindrome entourent la diagonale principale représentant la séquence contre elle-même. De plus, ces diagonales sont relativement courtes (une dizaine de nucléotides). On a la représentation suivante du terminateur :
T T A C C A A - T G - C G - C T - A T - A A - T T - A C - G G - C G - C A - T A - T A - T A - T A - T ....ATCTAAAC TTATTTCA....
Il s'agit d'une épingle à cheveux de 15 paires, l'ARN correspondant (remplacer T par U !) possède une structure bi-dimensionnelle : l'ARN est simple brin mais se replie dans l'espace en formant des hélices (cette épingle forme une hélice) comparables à une hélice d'ADN.