
MATERIAL UND METHODEN KAPITEL 2
• BLAST-A/jointfilesconvert/333809/bgleich der Genome gegeneinander:
blastall -p blastp -i a.fas -d b.fas -e 1.0e-15
blastall -p blastp -i b.fas -d a.fas -e 1.0e-15
• skriptgesteuerte Auswertung der Ergebnisse
Mit Hilfe eines Skriptes wurden die Ausgaben der beiden blastall-Aufrufe
eingelesen, miteinander verglichen und diejenigen Proteine als Treffer ausgegeben, die
wechselseitig aufeinanderwiesen, d.h. Proteine 1 und 2 wurden als Trefferpaar
ausgegeben, wenn Protein 1 aus Organismus A größte Ähnlichkeit zu Protein 2 aus
Organismus B zeigt UND Protein 2 aus Organismus B größte Ähnlichkeit zu Protein 1
aus Organismus A zeigte. Mit diesem Verfahren können falsch positive Treffer zu
paralogen Proteinen ausgeschlossen werden (Proteine, die in mehreren Kopien im
selben Genom vorliegen). Der Schwellenwert für signifikante BLAST-Treffer wurde als
e-value (1.0e-15, d.h. e
-15
) im blastall-Aufruf angegeben.
2.13 Vorhersage und Annotation kodierender Sequenzen
Um die kodierenden Eigenschaften eines Genoms bestimmen zu können, bedarf es der
Annotation aller potentiellen Gene. Dazu müssen zunächst alle kodierenden Sequenzen
(coding sequences, CDSs) bestimmt werden und diesen in einem zweiten Schritt eine
funktionelle Annotation zugewiesen werden. Funktionszuweisungen werden anhand
von Sequenzähnlichkeiten zu bekannten Proteinen vorgenommen, beruhend auf der Be-
obachtung, daß Proteine ab einer Ähnlichkeit von 30 % mit hoher Wahrscheinlichkeit
übereinstimmende räumliche Strukturen zeigen (Sander & Schneider, 1991).
2.13.1 Vorhersage kodierender offener Leserahmen (CDSs)
Als zuverlässigste Methode zur CDS-Vorhersage erwies sich eine Kombination ver-
schiedener automatischen Vorhersageprogramme in Verbindung mit einer manuellen
Kontrolle der CDS-Längen. Dazu wurde das von Tech & Merkl (2003) entwickelte
Programm YACOP verwendet, das auf einer Kombination der Programme Critica
32
Comentários a estes Manuais