Analyseturbo für schnellen Proteinvergleich
29.12.2011 -
Forscher der Ludwig-Maximilians-Universität München (LMU) haben eine neue Methode entwickelt, mit der sich die Eigenschaften von Proteinen genauer als bisher vorhersagen lässt. Die Bioinformatiker um Johannes Söding vom Genzentrum der LMU haben eine neue Software entwickelt, die verwandte Proteine besonders schnell und präzise erkennt. Dafür analysiert das Programm die Abfolge der molekularen Grundbausteine des Proteins, die Aminosäuresequenz. Mit einem Trick schafft es diese umfangreiche Analyse bis zu 2.500 mal schneller als das bisherige Standardprogramm. Das neue Werkzeug präsentieren die Forscher in der Fachzeitschrift Nature Methods (2011, Onlineveröffentlichung).
Dem Verfahren liegt ein einfacher Gedanke zugrunde: Je ähnlicher Proteine aufgebaut sind, umso wahrscheinlicher ist es, dass sie vergleichbare Aufgaben erfüllen. Schon seit vielen Jahren nutzen Wissenschaftler daher Sequenzvergleiche, um mithilfe von Daten bekannter Proteine oder Proteinuntereinheiten die Funktion und Struktur verwandter Proteine vorherzusagen. „Diese Vorhersagen ermöglichen in allen Bereichen der auf molekularem Niveau forschenden Lebenswissenschaften oft ein gezielteres experimentelles Vorgehen“, sagt Bioinformatiker Söding, der auch dem Exzellenzcluster „Center for Integrated Protein Science Munich“ (CIPSM) angehört.
Mehr zum Thema auf biotechnologie.de |
News: Humangenom - 10 Jahre nach der ersten Sequenz Menschen: Burkhard Rost - Enträtselts das Genom mit Bits und Bytes Förderbeispiel: Mehr Rechenpower für den Sequenzierexpress |
Die Vergleichssequenzen sind in Datenbanken gespeichert, in denen auch Eigenschaften und Funktionen bereits bekannter Proteine hinterlegt sind. „Solche Sequenzanalysen sind ein fundamentales Werkzeug der Bioinformatik“, erklärt Söding. Mit speziellen Suchmaschinen lassen sich die frei zugänglichen Datenbanken durchforsten. PSI-BLAST ist das meistverwendete Programm zur Analyse von Proteinsequenzen. Es bewertet die Ähnlichkeit der Sequenzen, indem diese so untereinander angeordnet werden, dass sich möglichst ähnliche Aminosäuren in der gleichen Spalte des sogenannten Sequenz-Alignments befinden.
„Fast noch wichtiger als die Suche nach paarweise Sequenzähnlichkeiten ist die Erstellung sogenannter multipler Sequenz-Alignments, sagt Söding: „Hier werden ähnliche Sequenzen vieler verwandter Proteine gesucht und zu einem großen Alignment zusammengebaut.“ Das funktioniert, weil die Struktur und Funktionen von Proteinen im Laufe der Evolution nicht beliebig wechseln. Häufig bleiben sie erhalten, selbst wenn die Aminosäuresequenz durch Mutationen verändert wird. Multiple Sequenz-Alignments sind heutzutage die wichtigste Grundlage für die Vorhersage von Proteinstruktur und -funktion.
LMU-Genzentrum |
Am Genzentrum der LMU wird die Regulation der Genexpression auf allen Ebenen erforscht – von der Transkription von Genen in Boten-RNA im Zellkern bis zu deren Translation in Proteine im Zytoplasma. Die Bioinformatikgruppe bietet auf ihrer Internetseite einen freien Zugang zum Programm HHblits an. mehr Informationen: hier klicken zu HHblits: hier klicken |
Vorläuferzellen von braunem Fettgewewebe vermehren
Nun ist es Södings Team gelungen, mit HHblits eine Methode zu entwickeln, die das bisherige Standardprogramm PSI-BLAST in allen Bereichen deutlich zu übertreffen verspricht. Dafür wandeln die Bioinformatiker die zu analysierenden Sequenzen ebenso wie die Vergleichssequenzen in den zu durchsuchenden Datenbanken in sogenannte Hidden-Markov-Modelle (HMM) um. HMMs sind statistische Modelle der Aminosäuresequenzen, die auch die im Sequenzalignment ablesbaren Wahrscheinlichkeiten von Mutationen berücksichtigen – so wird die Suche empfindlicher und genauer. Mit einem zusätzlichen Vorfilter grenzen die Bioinforamtiker zudem die zu durchsuchende Datenmenge ein. Die Suche läuft so etwa 2500 mal schneller als bisher, ist aber immer noch doppelt so empfindlich. „Insgesamt ermöglicht HHblits, häufiger und genauer als bisher die Funktion und Struktur unbekannter Proteine vorherzusagen“, betont Söding, der die Methode nun noch weiter verbessern möchte, unter anderem durch die Einbeziehung von Strukturinformationen.
© biotechnologie.de/bk