TP dotplot


Comparaison de séquences deux à deux avec dotplot

dotplot est un outil graphique (simple mais relativement efficace) de comparaison de deux séquences (ou d'une séquences avec elle-même).

On utilise une applet java qui construit des dotplot, dotlet (doplot+applet) de Marco Pagni et Thomas Junier (Swiss Institute of Bioinformatics à Epalinges, Suisses). Vous pouvez :

La séquence ci-dessous contient un terminateur. C'est-à-dire qu'elle contient un palindrome signalant la présence d'une épingle à cheveux (hairpin).

>terminateur de UTP-glucose-1-phosphate    uridylyltransferase, Bacillus subtilis
CCCGCTGACAAGTGAAGGCCGCCGTTATCAGGTGAAAAACTTCGTTGAAAAACCGCCTAAAGGCACAGCACCTTCTAATC    
TTGCCATCTTAGGCCGTTACGTATTCACGCCTGAGATCTTCATGTATTTAGAAGAGCAGCAGGTTGGCGCCGGCGGAGAA    
ATTCAGCTCACAGACGCCATTCAAAAGCTGAATGAAATTCAAAGAGTGTTTGCTTACGATTTTGAAGGCAAGCGTTATGA    
TGTTGGTGAAAAGCTCGGCTTTATCACAACAACTCTTGAATTTGCGATGCAGGATAAAGAGCTTCGCGATCAGCTCGTTC    
CATTTATGGAAGGTTTACTAAACAAAGAAGAAATCTAAACAAAAAGGCTATTGGACATTCATCCAATAGCCTTTTTTTAT    
TTCAACATCAAAGTCAATGTATGCTCTTCATTATCAACTGCGAAGACCTGATCAACGGCCTGCCGCAAAAATTAATAATC    
CCAGACAAACACACTGATTGTAGAGTTAAACAAACTAAATGAAAACATAAATACAAACATGCAGATTAAATAGTAAATAT    
CTTGTATTCAATGCAAGCTAAGTAAACACCACTTGCTAAAAGAACAATGACTAAACAACCAGCATTACAAAT 

Comparer la séquence ci-dessus à elle-même à l'aide du dotplot. On obtient (en jouant sur les niveau de gris et en plaçant le curseur au niveau de la position 439/450) :

[à vous de trouver et de décrire le dotplot obtenu]

A l'aide de dotlet, on trouve de la position 361 à 396 (en rouge ci-dessous) :

0        1         2         3         4         5         6         7         8
12345678901234567890123456789012345678901234567890123456789012345678901234567890
CCCGCTGACAAGTGAAGGCCGCCGTTATCAGGTGAAAAACTTCGTTGAAAAACCGCCTAAAGGCACAGCACCTTCTAATC
TTGCCATCTTAGGCCGTTACGTATTCACGCCTGAGATCTTCATGTATTTAGAAGAGCAGCAGGTTGGCGCCGGCGGAGAA
ATTCAGCTCACAGACGCCATTCAAAAGCTGAATGAAATTCAAAGAGTGTTTGCTTACGATTTTGAAGGCAAGCGTTATGA
TGTTGGTGAAAAGCTCGGCTTTATCACAACAACTCTTGAATTTGCGATGCAGGATAAAGAGCTTCGCGATCAGCTCGTTC
CATTTATGGAAGGTTTACTAAACAAAGAAGAAATCTAAACAAAAAGGCTATTGGACATTCATCCAATAGCCTTTTTTTAT
TTCAACATCAAAGTCAATGTATGCTCTTCATTATCAACTGCGAAGACCTGATCAACGGCCTGCCGCAAAAATTAATAATC
CCAGACAAACACACTGATTGTAGAGTTAAACAAACTAAATGAAAACATAAATACAAACATGCAGATTAAATAGTAAATAT
CTTGTATTCAATGCAAGCTAAGTAAACACCACTTGCTAAAAGAACAATGACTAAACAACCAGCATTACAAAT 

AAAAAGGCTATTGGACATTCATCCAATAGCCTTTTT est bien un palindrome (sauf pour les quelques nucléotides du centre de cette sous-séquence), ci-dessous la première ligne est la seconde retournée :

T
T
T
T
T
C
C
G
A
T
A
A
C
C
T
A
C
T
T
A
C
A
G
G
T
T
A
T
C
G
G
A
A
A
A
A
A
A
A
A
A
G
G
C
T
A
T
T
G
G
A
C
A
T
T
C
A
T
C
C
A
A
T
A
G
C
C
T
T
T
T
T
On voit les relations A/T et G/C. L'épingle à cheveux comporte une petite boucle (quelques nucéotides séparent les deux moités du palindrome). Cela implique que les deux diagonales représentant les deux moitiés du palindrome entourent la diagonale principale représentant la séquence contre elle-même. De plus, ces diagonales sont relativement courtes (une dizaine de nucléotides). On a la représentation suivante du terminateur :
                               T T 
                              A   C
                             C     A
                              A - T
                              G - C
                              G - C
                              T - A
                              T - A
                              A - T
                              T - A
                              C - G
                              G - C
                              G - C
                              A - T
                              A - T
                              A - T
                              A - T
                              A - T 
                  ....ATCTAAAC     TTATTTCA....

Il s'agit d'une épingle à cheveux de 15 paires, l'ARN correspondant (remplacer T par U !) possède une structure bi-dimensionnelle : l'ARN est simple brin mais se replie dans l'espace en formant des hélices (cette épingle forme une hélice) comparables à une hélice d'ADN.