Forschende aus Jülich und Düsseldorf haben mit „Helixer“ ein neues Deep-Learning-Tool veröffentlicht, das den Flaschenhals der Genomanalyse eliminiert. Die Software identifiziert Gene direkt aus Roh-DNA-Sequenzen – ohne experimentelle Referenzdaten oder biologisches Vorwissen.
In der Genomik galt die strukturelle Annotation – das Mapping von Genen, Introns und UTRs (Untranslated Regions) – bisher als rechen- und datenintensivster Schritt. Während die Sequenzierung längst automatisiert ist, erforderte die präzise Lokalisierung funktionaler Einheiten oft monatelange manuelle Kuratierung oder den Abgleich mit verwandten Arten.
Technische Key-Facts für die IT-Infrastruktur:
- Deep-Learning-Ansatz: Helixer erkennt Start-/Stopp-Signale und komplexe Strukturen (CDS, Introns) direkt in der Sequenzabfolge.
- Cross-Spezies-Fähigkeit: Erstes Tool, das zuverlässig über taxonomische Grenzen hinweg (Pflanzen, Pilze, Insekten, Wirbeltiere) funktioniert.
- Performance: Erreicht bei der Vorhersagegenauigkeit nahezu die Qualität manuell kuratierter Referenzannotationen, bei Pflanzen übertrifft es etablierte Prädiktionswerkzeuge deutlich.
- Effizienz: Reduziert den Analyseaufwand von Monaten auf einen Bruchteil der Zeit, was den High-Throughput-Workflow in der Bioinformatik massiv beschleunigt.
„Helixer zeigt, dass moderne KI-Methoden helfen können, diesen Engpass zu überwinden“, so Prof. Björn Usadel (FZ Jülich). Helixer wird bereits aktiv in der Biotechnologie und Pflanzenzüchtung eingesetzt. Damit schließt die Bioinformatik-Pipeline die technologische Lücke zwischen der automatisierten Datenerzeugung und der funktionalen Interpretation.
Quelle: Forschungszentrum Jülich (01/2026)
