Bild vom Cast der Serie "Biohackers"
Netflix/Key Art

Datensicherung
Netflix-Serie "Biohackers" auf synthetischer DNA gespeichert

Zwei Forscher der TU München beschäftigen sich mit einer noch weitestgehend unbekannten Speichertechnik für Daten. Diese ist extrem robust.

07.09.2020

Zwei Forscher von der TU München und der ETH Zürich haben die erste Folge der Netflix-Serie "Biohackers" auf synthetischer DNA gespeichert. Die Speichertechnik dahinter heißt "DNA Data Storage". Mit dieser können große Mengen an Daten für über 1.000 Jahre gesichert werden.

"Die Informationsdichte von DNA ist sehr hoch. Die gesamte Serie 'Biohackers' ist etwa auf einem billionstel Gramm DNA gespeichert", sagt Professor Reinhard Heckel. "Das ist schon eine extrem hohe Datendichte. Theoretisch möglich wäre das 2.000-fache." Bei der DNA-Speicherung werden die Bausteine, aus denen DNA besteht, in das Binärsystem rückübersetzt, auf dem Computer aufgebaut sind.

"DNA besteht aus den Bausteinen Adenin (A), Thymin (T), Guanin (G) und Cytosin (C). Computer-Daten sind wiederum als Nullen und Einsen kodiert", erklärt Heckel. "Beim 'DNA Data Storage' legen wir fest, welche Zahlenkombination welchen Buchstaben entspricht, etwa 00 ist A, 01 ist C, 10 ist G und 11 ist T. Haben wir dann zum Beispiel die Zahlenfolge 01 01 11 00 entspricht das der DNA-Sequenz CCTA." Insgesamt bestehe die erste Folge der Serie beispielsweise aus 600 Millionen Nullen und Einsen.

Codierfehler: Algorithmus ermöglicht fehlerfreies Lesen

Beim Schreiben und Lesen der Daten passieren laut Heckel wie auch bei anderen Speichermedien viele Fehler. "Um das Problem zu lösen, habe ich einen Algorithmus entwickelt, der auf Kanalkodierung basiert", erklärt er. "Der Dekodieralgorithmus tut im Prinzip etwas Ähnliches wie wir, wenn wir fehlerhaften Text lesen: Auch wir können Wörter fehlerfrei lesen, wenn einzelne Buchstaben fehlen oder an der falschen Stelle stehen. Das geht nur, weil die Sprache sehr redundant ist." Durch einen solchen Algorithmus bleiben Daten laut Heckel bei "DNA Data Storage" auch bei vielen Fehlern beim Lesen, Speichern und Schreiben der DNA erhalten.

"Wir arbeiten daran, die Technologie günstiger und schneller zu machen."

DNA als Speichermedium nutzen zu können, sei auch Heckels Kollege Professor Robert Grass von der ETH Zürich zu verdanken. "Er hat ein Verfahren entwickelt, das DNA-Stränge in Nanometer große Kügelchen aus der glasähnlichen Verbindung Silicium verwandelt und sie damit stabil verpackt." Noch sei das Speicherverfahren jedoch sehr aufwendig und teuer, sagt Heckel, "besonders die Herstellung von DNA, aber auch das Lesen". Genau seien die Kosten schwer zu beziffern. Heckel schätzt diese aktuell auf 1000 US-Dollar pro Megabyte.

"Mit Professor Grass arbeiten wir – so wie viele andere Forschungsgruppen auch – daran, diese Technologie günstiger und schneller zu machen." Dabei arbeiteten sie in interdisziplinären Teams aus Chemie, Informatik und Elektrotechnik. Information sind in "DNA-Storage-Systemen" in sehr vielen kurzen DNA Strängen gespeichert. Diese Stränge können laut Heckel parallel auf einem Datenfeld produziert werden, was technologisch schwierig, aber sehr gut umzusetzen sei.

Vor der Folge von "Biohackers" haben die Forscher unter anderem bereits ein Buch von Archimedes und den Bundesbrief der Schweiz – "beides sehr alte und wichtige Dokumente", so Heckel – sowie ein Album der Band "Massive Attack" auf DNA gespeichert.

Literaturhinweis

Linda C. Meiser, Philipp L. Antkowiak, Julian Koch, Weide D.Chen, A.Xavier Kohll, Wendelin J. Stark, Reinhard Heckel, Robert N. Grass: "Reading and writing digital data in DNA". Erschienen in "Nature Protocols" im Januar 2020. DOI: 10.1038/s41596-019-0244-5

kas