Dr. Kai Dührkop präsentiert die Visualisierung eines Datensatzes mit der Software CANOPUS.

Suchmaschine für Stoffwechselmoleküle

Bioinformatiker der Universität Jena entwickeln neue Methode zur Analyse von Metaboliten​
Dr. Kai Dührkop präsentiert die Visualisierung eines Datensatzes mit der Software CANOPUS.
Foto: Jens Meyer (Universität Jena)

Der Stoffwechsel eines jeden Organismus – von der einzelligen Mikrobe bis zum komplexen System Mensch – bringt tausende chemische Verbindungen hervor. Diese Moleküle sind Ausgangs-, Zwischen- und Endprodukte chemischer Prozesse und können so Auskunft geben über den physiologischen Zustand von Lebewesen, ihren Organen, Geweben und Zellen. Vorausgesetzt, diese Moleküle – die Metaboliten – lassen sich auch nachweisen. Bislang sind solche Analysen extrem aufwendig, denn nur die Metaboliten, deren Strukturen bereits bekannt sind, lassen sich auch eindeutig identifizieren. Bioinformatiker der Universität Jena nutzen jetzt Methoden der künstlichen Intelligenz, um sämtliche – auch bislang unbekannte – Metabolite in einer Probe zu erfassen.


Text: Sebastian Hollstein

Alles, was lebt, produziert Metabolite. Metabolite können als »chemische Mar­ker« genutzt werden, um beispielsweise Krankheiten zu erkennen oder in der Umwelttechnologie Trinkwasserproben zu untersuchen. Doch die Diversität dieser chemischen Verbindungen macht ihre Analyse schwierig. Bisher sind nur vergleichsweise wenige Moleküle in ihrer Struktur bekannt und definiert. Wird eine Probe im Labor analysiert, kann deshalb bislang nur ein relativ kleiner Teil davon identifiziert werden – der Großteil an Molekülen bleibt un­bekannt.

Die Jenaer Bioinformatiker haben nun gemeinsam mit Kollegen aus Finnland und den USA eine weltweit einmalige Methode entwickelt, bei der alle Meta­bolite in einer Probe gleichzeitig berück­sichtigt werden können und sich somit der Erkenntnisgewinn bei der Unter­suchung solcher Moleküle erheblich vergrößert. Über seinen Erfolg berichtet das Team im renommierten Fachjournal »Nature Biotechnology«.

»Bei der Massenspektrometrie, eine der meistgenutzten experimentellen Me­thoden zur Analyse von Metaboliten, werden nur die Moleküle identifiziert, die durch den Abgleich mit einer Da­tenbank eindeutig zugeordnet werden können. Alle anderen, bisher unbekann­ten Moleküle, die in der Probe enthal­ten sind, liefern keine Informationen«, erklärt Prof. Dr. Sebastian Böcker von der Universität Jena. »Mit unserem neu entwickelten Verfahren namens CANO­PUS entlocken wir allerdings auch den unidentifizierten Metaboliten in einer Probe wertvolle Informationen, da wir sie bereits bekannten Stoffklassen zu­ordnen können.«

CANOPUS funktioniert in zwei Phasen: Zunächst erzeugt das Verfahren, aus dem mittels Massenspektrometrie ge­messenen Fragmentierungsspektrum, einen sogenannten molekularen Finger­abdruck. Dieser beinhaltet Informatio­nen über die Struktureigenschaften des gemessenen Moleküls. In einem zwei­ten Schritt ordnet das System den Me­taboliten mithilfe des Fingerabdrucks einer bestimmten Stoffklasse zu, ohne diesen dafür identifizieren zu müssen.

Zweistufiges Lernverfahren verein­facht den Analyseprozess

»Maschinelle Lernverfahren benötigen in der Regel große Datenmengen, um trainiert zu werden. Unser zweistufiges Verfahren hingegen ermöglicht es, im ersten Schritt auf einer vergleichsweise kleinen Datenmenge von zehntausen­den Fragmentierungsspektren zu trai­nieren, um dann im zweiten Schritt aus Millionen von Strukturen die charakte­ristischen Struktureigenschaften zu be­stimmen, die für eine Stoffklasse signifi­kant sind«, erklärt Dr. Kai Dührkop von der Universität Jena.

Das System detektiert also diese Struk­tureigenschaften bei einem unbekann­ten Molekül innerhalb einer Probe und ordnet es dann einer bestimmten Stoff­klasse zu. »Allein diese Information reicht bereits aus, um viele wichtige Fragestellungen zu beantworten«, be­tont Böcker. »Die eindeutige Identifi­kation eines Metabolits wäre weitaus aufwendiger und ist häufig überhaupt nicht notwendig.« Insgesamt liege dem CANOPUS-Verfahren ein tiefes neuronales Netz für die rund 2 500 Stoffklas­sen zugrunde.

Mit ihrer Methode haben die Jenaer Bioinformatiker beispielsweise die Darmflora von Mäusen verglichen, bei denen eine Versuchsgruppe mit Anti­biotika behandelt worden war. Die Un­tersuchungen geben Hinweise darauf, welche Stoffklassen von der Maus selbst und welche von ihrer Darmflora pro­duziert werden. Solche Forschungser­gebnisse können wichtige Erkenntnisse über das menschliche Verdauungs- und Stoffwechselsystem ermöglichen. Durch zwei weitere Anwendungsbeispiele, die sie in ihrer Studie ausführen, zeigen die Wissenschaftler die Funktionalität und Aussagekraft des Verfahrens.

Jenaer Molekül-Suchmaschine millionenfach genutzt

Mit der neuen Methode erweitern die Bioinformatiker die Möglichkeiten der Suchmaschine für molekulare Struktu­ren „CSI:FingerID“, die sie der interna­tionalen Forschungsgemeinschaft seit rund fünf Jahren zur Verfügung stellen. Weltweit nutzen Forscher dieses Ange­bot inzwischen tausende Male täglich, um ein Massenspektrum aus einer Pro­be mit verschiedenen Online-Datenban­ken abzugleichen und so einen Meta­boliten genauer bestimmen zu können. Mittlerweile sind mehr als hundert Mil­lionen Anfragen eingegangen.

Das neue Verfahren stärkt die Metabo­lomik, also die Erforschung dieser om­nipräsenten Moleküle, und fördert ihr Potenzial in vielen Bereichen, etwa in der Pharmazie. Viele Arzneiwirkstoffe sind Metabolite – weitere könnten mit ihrer Hilfe entwickelt werden.

Information

Original-Publikation:

Systematic classification of unknown meta­bolites using high-resolution fragmentation mass spectra, Nature Biotechnology (2020), DOI: 10.1038/s41587-020-0740-8Externer Link

Kontakt:

Sebastian Böcker, Univ.-Prof. Dr.
vCard
Raum 3405
Ernst-Abbe-Platz 1-2
07743 Jena Google Maps – LageplanExterner Link