Fakultätsbericht 2016-2017
FORSCHUNG — 39 Die Entwicklung von Workflow-System zur Metabolomanalytik Die Prozessierung und Analyse von Metabo- lomdaten wird weltweit immer noch weitgehend auf der Basis von Individuallösungen durchge- führt, die von einzelnen Labors entwickelt wer- den. Die Metabolomforschung verfügt deshalb nicht über standardisierte und reproduzierbare Analysemethoden (computational workflows), die auf international akzeptierten Standard- Arbeitsabläufen (Standard Operating Proce- dures, SOPs) beruhen. Durch Arbeiten der Steinbeck‘schen Gruppe in PhenoMeNal (Horizon 2020) und COSMOS (7. Rahmenprogramm) und innerhalb der Standardi- sierungsgruppe der Metabolomics Society ist es gelungen, ein internationales Konsortium zur Entwicklung von Workflow-Systemen in der Me- tabolomanalytik zu bilden, dessen Ziel es ist, portable und cloud-basierte Workflows auf der Basis des Galaxy-Systems zu entwickeln. Galaxy ermöglicht es, rechenintensive Workflows über ein Webinterface graphisch zu definieren und dann auf Hochleistungsrechnern unabhängig vom Arbeitsplatzrechner oder Laptop des Wis- senschaftlers auszuführen. Hauptziel ist es, die- se Workflows als portable, container-basierte und weitgehend plattform-unabhängige Kompo- nenten zu entwickeln, die sowohl auf lokalen OpenStack Clustern, wie auch auf kommerziellen (Amazon Web Services, Google Compute Cloud) oder öffentlichen Cloud Systemen (European Grid Initiative, European Open Science Cloud) ausführbar und portierbar sind. Ziel dieser Entwicklungen, die die Gruppe im Rahmen der existierenden Kooperationen bear- beitet, ist eine ganzheitliche Lösung, die das Da- tenmanagement in lokalen LIMS (LaborInformationsManagementSysteme), die Prozessierung und Analyse dieser Daten und Archivierung in offenen globalen Datenbanken für Metabolomik sowie schließlich die Wieder- und Metaanalyse der dortigen Daten miteinander verbindet. Die reichhaltige Arbeit von Gruppen in den Sonderforschungsbereichen ChemBioSys, FungiNet oder AquaDiva zu Naturstoffen und chemischer Ökologie in mikrobiellen Gemein- schaften sind eine ideale Basis, um solche Work- flows nah an der Anwendung und mit Anwen- dern zu entwickeln. Information-Mining der Literatur zur automati- schen Extraktion chemischer Information Datenbanken mit Naturstoffen und Informatio- nen zu Spezies-Metabolomen werden von Kura- toren durch Sichtung der Literatur und manueller Exzertion erstellt. Naturgemäß skaliert diese Vorgehensweise linear mit der Zahl der am Pro- jekt arbeitenden Kuratoren. Zudem beinhalten existierende offene Datenbanken in diesem The- menbereich nur wenig Information. In diesem Projekt wird die Steinbeck-Gruppe Methoden entwickeln, die sowohl retrospektiv die letzten 50 Jahre in Journalen wie Phytochemistry oder Journal of Natural Products automatisch exzer- piert als auch die aktuell erscheinende Literatur in einer offenen Datenbank veröffentlicht. Entwicklung und Implementierung von Metho- den und Algorithmen in der Chemieinformatik Die von Christoph Steinbeck im Jahr 2000 ins Leben gerufene Algorithmenbibliothek „The Che- mistry Development Kit“ (CDK, http://cdk.github.io) hat sich in den vergangenen 16 Jahren zu einer der am weitesten verwende- ten Software Libraries in der Chemieinformatik entwickelt. Die Pflege und Weiterentwicklung dieses Projektes beinhaltet die Implementierung neuer Algorithmen, Optimierung existierender Methoden, kontinuierliche Beschreibung der Fortentwicklung und Verbesserung der Doku- mentation, die Organisation von Entwicklerkon- ferenzen und die regelmäßige Publikation in wis- senschaftlichen Journalen. Insbesondere wird die Gruppe hier als nächstes die Entwicklung eines Cloud-fähigen CDK-Containers in Angriff nehmen, der schnelle und skalierbare Berech- nungen in Clouds wie AWS oder GCE ermöglicht.
RkJQdWJsaXNoZXIy OTI3Njg=