Mehr Rechenpower für den Sequenzierexpress
28.12.2011 -
Die Triebkräfte zur Verbesserung bestehender Technologien lassen sich auf wenige, aber entscheidende Parameter zusammenkürzen: Genauigkeit, Schnelligkeit und Kostenersparnis. Dieses Ziel verfolgt auch das vom Bundesministerium für Bildung und Forschung (BMBF) geförderte Bioinformatik-Verbundvorhaben NGSgoesHPC. Bei diesem Projekt trifft das Next Generation Sequencing (NGS) auf modernste High Performance Computer (HPC). Das aus vier akademischen und drei Industriepartnern bestehende Konsortium führt Biotechnologen, Genetiker und Informatiker zusammen und erlaubt ihnen die Ausschöpfung der Vorzüge modernster Hochleistungsrechner für ihre Arbeit. Das gemeinsame Ziel in den nächsten drei Jahren ist es, die Analyse von DNA-Sequenzdaten dramatisch zu beschleunigen und qualitativ zu verbessern. Die Atlas Biolabs GmbH bringt in dieses Projekt ihre umfangreiche Bioinformatik-Expertise ein, die sie durch langjährige Tätigkeit auf diesem Gebiet erworben hat.
Das Humangenomprojekt ist heute Legende. Vor mehr als zehn Jahren wurde bereits die erste vorläufige Version des menschlichen Erbguts publiziert. Fünf große Forschungseinrichtungen mit über 150 Mitarbeitern arbeiteten nahezu 13 Jahre daran und investierten die gigantische Summe von drei Milliarden US Dollar dafür. Als grandioser Meilenstein in der Entwicklung der modernen Biologie und Medizin wurde die Sequenzierung des ersten menschlichen Genoms damals zurecht gefeiert. Heute erscheint jedoch der dafür getriebene Aufwand völlig überzogen, denn die Preise und der Zeitaufwand für die Sequenzierung von DNA sind seitdem dramatisch geschrumpft. „Dieser Quantensprung ist durch die Einführung neuer Sequenzierautomaten möglich geworden, die auch „Next Generation Sequencer“ genannt werden. Diese ermöglichen heutzutage das Lesen eines kompletten Genoms in nur wenigen Wochen für einen Preis um die 3.000 Euro, weiß Karsten R. Heidtke, Leiter Bioinformatik und IT der Atlas Biolabs GmbH. Verbesserungen sind dennoch notwendig.
Nadelöhr: Datenflut durch Genomanalyse
Mehr auf biotechnologie.de |
News: DKFZ vervielfacht Kapazität bei DNA-Sequenzierung News: Deutsche Wissenschaftler bei internaitonalem MEgaprojekt der Krebsforschung dabei Wochenrückblick: Neues Labor für Hochdurchsatz-Screening an der Universität Mainz |
Was haben wir eigentlich davon, wenn wir die genaue Basenabfolge unseres Erbguts kennen? Die Antwort liefert das Geschäftsmodell der Atlas Biolabs GmbH, ein in privater Hand befindliches Biotech-Unternehmen. Neben dem Array-Service bieten die Berliner auch die Sequenzierung des menschlichen Erbgutes als Ganzes oder in Teilen an. „Die Sequenz eines Patienten kann beispielsweise wertvolle Informationen zu den Ursachen einer Krankheit liefern, die dazu genutzt werden können, optimale oder sogar personalisierte Therapien anzuordnen“, erklärt der promovierte Informatiker Heidtke. „Für einige Erkrankungen bedeutet die Analyse des Erbguts das Ende einer endlosen Odyssee von Arzt zu Arzt – der Patient findet durch unsere Mitwirkung zumindest eine Erklärung für seine Krankheit, auch wenn ihm die heutige Medizin noch nicht immer therapeutisch helfen kann.“
NGS trägt dazu bei, Genome oder relevante Teilabschnitte der Erbsubstanz in kurzer Zeit zu entschlüsseln; doch das Zusammensetzen der vielen kurzen Sequenzen, die die neuen Maschinen generieren, bereitet den Wissenschaftler noch etwas Kopfzerbrechen. „Aus technischen Gründen ist es nicht möglich, das gesamte Genom am Stück zu sequenzieren“, erklärt Heidtke. „Wie müssen es in kleine Teile zerlegen, diese sequenzieren, und anschließend mit Hilfe von Hochleistungsrechnern und maßgeschneiderten Algorithmen wieder in der richtigen Reihenfolge zusammensetzen. Dieser Prozess stellt das Nadelöhr im gesamten Sequenzierprozesses dar und genau hier setzt das auf drei Jahre ausgelegte und mit 1,5 Millionen Euro vom BMBF geförderte Projekt NGSgoesHPC (Förderkennzeichen: 01IH11003F) an. Zum einen sollen bestehende Software-Anwendungen verbessert werden, zum anderen werden modernste Hochleistungsrechner dazu beitragen, die Flut an anfallenden Daten zu verarbeiten. „Momentan rechnen wir 18 Stunden an einem Genom, um die Fragmente einer Referenzsequenz unter Berücksichtigung ihrer exakten Position zuzuordnen“, so Heidtke. „Das muss schneller werden, vor allem im Hinblick auf dringliche Diagnostik- bzw. Therapiemaßnahmen für Patienten.“
Atlas Biolabs setzt Anwenderbrille auf
Die Berliner Atlas Biolabs GmbH vertritt in diesem Projekt die Sicht des Anwenders. Zusammen mit den Partnern werden neue Algorithmen definiert und unter realen Bedingungen getestet. Im Rahmen des Projekts werden weiterhin Methoden zur visuellen Darstellung der NGS-Daten verbessert. „Wir versprechen uns eine Stärkung unserer Wettbewerbsfähigkeit durch die frühe Etablierung von Methoden, die zukünftig in dem Tandem Diagnostik und Therapieentscheidung eine essentielle Rolle spielen werden“, so Heidtke. „Neben der schnelleren Bereitstellung von Daten können wir zukünftig unseren Kunden die Ergebnisse zudem noch schneller und übersichtlicher via Bildschirm-Konferenz erklären.“
Nutzen für die Öffentlichkeit
Für die Öffentlichkeit ergeben sich eine Reihe von Vorteilen. Die verbesserten Algorithmen werden der Community kostenfrei zur Verfügung gestellt. Dank großer internationaler Sequenzierprojekte, wie zum Beispiel dem 1000 Genomes Project (mehr…) stehen mittlerweile auch viele hilfreiche Informationen und Publikationen zu genetischen Variationen und Phänotypen für die Auswertung von Daten zur Verfügung.
Neben der zwölf Mitarbeiter starken Atlas Biolabs GmbH beteiligen sich die folgenden Partner an dem Vorhaben: das Forschungszentrum Jülich GmbH; das Max-Planck-Institut für Biologie des Alterns in Köln; die Technische Universität Dresden mit dem biotechnologischen Zentrum (BIOTEC), der Deep Sequencing Group und dem Zentrum für Informationsdienste & Hochleistungsrechnen (ZIH); die Universität Köln mit dem regionalen Rechenzentrum (RRZK) und dem Cologne Center for Genomics (CCG); die Bull GmbH mit Sitz in Köln; die DataDirect Networks GmbH in Freiburg und das ExaCluster Labor der Intel GmbH in Jülich. Die Konsortialführung des vom BMBF geförderten Projektes liegt bei der Universität Köln.
© biotechnologie.de/avb