Interviews mit Branchenführern

Wie viel Information steckt wirklich in der DNA? Eine spannende Reise durch das Erbgut

Interviews mit Branchenführern
DNA is maybe 60-750MB of data

Eine tiefgehende Betrachtung der Informationsmenge in der menschlichen DNA und welche Rolle Kompression, Biologie und Informationsdefinitionen dabei spielen. Erfahren Sie, wie die DNA als Datenspeicher funktioniert und warum die wirklich relevante Informationsmenge weitaus komplexer ist, als man denkt.

Die menschliche DNA ist das fundamentale Molekül des Lebens, das den Bauplan für jeden Organismus enthält. Mit etwa 3,1 Milliarden Basenpaaren repräsentiert sie eine enorme Menge an biologischer Information. Doch wie viel Datenmenge steckt tatsächlich in der DNA eines Menschen? Die einfache Antwort lautet: Etwa 12 Milliarden Bits, was ungefähr 1,5 Gigabyte entspricht. Doch diese Zahl allein täuscht darüber hinweg, wie komplex und vielschichtig das Konzept von „Information“ in der biologischen Welt wirklich ist. Jedes Basenpaar kann vier verschiedene Nukleotide enthalten — Adenin (A), Thymin (T), Cytosin (C) oder Guanin (G).

Diese vier Varianten lassen sich theoretisch mit zwei Bits codieren, da zwei Bits vier Zustände repräsentieren können. Daraus ergibt sich, dass das gesamte menschliche Erbgut bei einem weiblichen Genom, das zwei Kopien jedes Chromosoms enthält, rund 12,1 Milliarden Bits stellt. Bei männlichen Genomen, die ein X- und ein Y-Chromosom besitzen, sind es knapp 11,9 Milliarden Bits. Dieser Rohdatenwert ist jedoch nur der Anfang der Betrachtung. Die meisten Menschen teilen 99,6 Prozent ihres Erbguts miteinander.

Das bedeutet, dass die individuelle genetische Variation vergleichsweise gering ist. Man könnte also argumentieren, dass ein großer Teil der genetischen Information redundant ist, wenn man die DNA im Hinblick auf individuelle Unterschiede betrachtet. Diese Tatsache bildet die Grundlage vieler moderner Genom-Kompressionsalgorithmen, die mit einem sogenannten Referenzgenom arbeiten. Dabei wird das komplette menschliche Genom als Basis gespeichert und für jede Person nur die Abweichungen davon festgehalten. So kann die Speichergröße um über 99 Prozent reduziert werden, je nachdem, wie gut das Referenzgenom die Vielfalt abdeckt.

Doch Kompression ist kein einfaches Konzept, wenn es um die Definition von Information in der DNA geht. Man kann das Genom einfach als eine lange Folge von Buchstaben betrachten, aber was wirklich relevant ist, ist zu verstehen, welcher Anteil tatsächlich „Bedeutung“ hat und wie diese Bedeutung definiert wird. Hier kommen unterschiedliche Konzepte aus der Informationstheorie ins Spiel. Kolmogorov-Komplexität und Shannon-Information stellen zwei verschiedene Herangehensweisen dar, diesen Begriff praktisch zu fassen. Die Kolmogorov-Komplexität misst die Länge des kürzesten Computerprogramms, das eine bestimmte DNA-Sequenz ausgeben kann.

Diese Definition entspricht im Prinzip der bestmöglichen verlustfreien Kompression ohne Referenz. Gemäß dieser Definition enthält die DNA eines Menschen rund 4,6 Milliarden Bits an Information, wenn man von der besten verfügbaren Kompression ausgeht. Die Shannon-Information hingegen betrachtet die Wahrscheinlichkeit, mit der eine bestimmte Sequenz im Gesamtpool der menschlichen Genome vorkommt. Hierbei wird das Wissen um verbreitete Muster und Varianten einbezogen. Das Resultat ist eine viel geringere Menge an „Information“, da in dieser Betrachtung nur die individuellen Unterschiede gegenüber dem Durchschnittszustand gezählt werden.

Das heißt, unter dieser Perspektive enthält ein menschliches Genom nur etwa 120 Millionen Bits an Information. Dieser enorme Unterschied zeigt, wie stark die Interpretation von „Information“ variieren kann, je nachdem, welchen theoretischen Rahmen man anlegt. Für biologische Fragestellungen, bei denen es darum geht, wie viel Wissen über die Funktionsweise und Komplexität eines Lebewesens im Genom kodiert ist, ist die Kolmogorov-Komplexität oft die sinnvollere Wahl, da sie auch die konservierten, für alle Menschen gemeinsamen Abschnitte einbezieht. Biologisch gesehen ist die DNA jedoch weit mehr als nur eine lineare Abfolge von Nukleotiden. Nur etwa 1 Prozent des menschlichen Genoms codiert direkt für Proteine.

Ein weitaus größerer Teil wird in RNA transkribiert, die nicht immer in Proteine übersetzt wird, aber dennoch wichtige regulatorische Funktionen erfüllen kann. Das restliche Genom besteht aus sogenannten Introns, regulatorischen Sequenzen wie Promotoren, Enhancern oder Silencern, repetitiven Abschnitten, Pseudogenen und strukturellen Elementen wie Telomeren und Zentromeren. Diese Millionen Basenpaare erweisen sich häufig als ein komplexes Zusammenspiel von Funktionen, Redundanzen und scheinbar „nutzlosem“ genetischen Material, das in Wirklichkeit bedeutsame Rollen in der Genregulation, Chromosomenstabilität und evolutionären Anpassung spielt. Die DNA eines Lebewesens ist somit kein statisches Datenarchiv, sondern ein dynamisches System, das viele Schichten und Ebenen der Informationsverarbeitung enthält. Eine wesentliche Herausforderung bei der Bewertung der Informationsmenge in der DNA besteht darin, die „Nützlichkeit“ der codierten Sequenzen zu beurteilen.

Die molekulare Biologie hat gezeigt, dass evolutionär konservierte Regionen oft jene sind, die eine lebenswichtige Funktion erfüllen. Dennoch gibt es viele DNA-Abschnitte, deren Funktion noch unbekannt oder sehr subtil ist. Man spricht deshalb auch von der sogenannten „Dunklen Materie des Genoms“. Hier ist die Forschung weiterhin aktiv, und unser Verständnis von den Herausforderungen und Feinheiten der Genomkomplexität wächst beständig. Mutationen, also Veränderungen an der DNA, passieren ständig aufgrund von Fehlern bei der Zellteilung oder durch Umwelteinflüsse wie UV-Strahlung oder chemische Stoffe.

Der Körper verfügt über ausgeklügelte Reparaturmechanismen, die meistens dafür sorgen, dass Veränderungen minimal und kontrolliert bleiben. Doch der fortwährende Kampf zwischen Mutationen und Reparaturmechanismen trägt auch dazu bei, dass das Genom niemals statisch ist. Die biologische „Messy-ness“, also die „Unordnung“ in der DNA, ist deshalb kein Fehler, sondern ein Teil des Evolutionsprozesses. Aus all diesen Gründen schlägt die Wissenschaft vor, die Information in der DNA nicht nur anhand der Sequenz zu messen, sondern auch im Kontext des phänotypischen Outputs — also dem, was aus der DNA tatsächlich an sichtbaren und funktionalen Eigenschaften eines Lebewesens entsteht. Diese sogenannte „phänotypische Kolmogorov-Komplexität“ beschreibt die kürzeste mögliche Kompression der DNA, die dennoch zu einem Individuum führt, das äußerlich und funktional wie ein Mensch ist.

Automatischer Handel mit Krypto-Geldbörsen Kaufen Sie Ihre Kryptowährung zum besten Preis

Als Nächstes
Bitcoin wieder über 100.000 Dollar – das treibt den Kurs
Freitag, 13. Juni 2025. Bitcoin knackt wieder die Marke von 100.000 Dollar – Ursachen und Ausblick

Der Bitcoin hat erstmals seit Anfang des Jahres wieder die psychologisch wichtige Marke von 100. 000 Dollar überschritten.

Bitcoin kurz vor 100.000 US-Dollar – jetzt einsteigen oder auf Alternativen ausweichen?
Freitag, 13. Juni 2025. Bitcoin auf 100.000 US-Dollar: Der perfekte Zeitpunkt zum Einstieg oder lohnt sich der Ausweich auf Alternativen?

Bitcoin nähert sich der magischen Marke von 100. 000 US-Dollar.

Warum steigt Krypto? - Gründe für den Kursanstieg bei Bitcoin & Co
Freitag, 13. Juni 2025. Warum steigen Kryptowährungen? Die wichtigsten Faktoren hinter dem aktuellen Krypto-Boom

Ein tiefgehender Einblick in die Ursachen des jüngsten Kursanstiegs bei Bitcoin, Ethereum und anderen Kryptowährungen. Erfahren Sie, welche geldpolitischen und geopolitischen Entwicklungen den Kryptomarkt derzeit beeinflussen und warum Investoren verstärkt auf digitale Assets setzen.

Ethereum zeigt Stärke am Kryptomarkt: Kursanstieg von 6,7% übertrifft Bitcoin
Freitag, 13. Juni 2025. Ethereum setzt neuen Impuls am Kryptomarkt: Kursanstieg übertrifft Bitcoin deutlich

Ethereum erlebt einen starken Kursanstieg von 6,7 Prozent und zeigt damit eine bemerkenswerte Dynamik im Kryptomarkt, die Bitcoin deutlich übertrifft. Technische Upgrades, steigendes Investoreninteresse und positive Zukunftsaussichten beflügeln die Entwicklung von Ethereum und sorgen für wachsende Dominanz gegenüber Bitcoin.

Engineered adipocytes implantation suppresses tumor progression in cancer models
Freitag, 13. Juni 2025. Innovative Therapie gegen Krebs: Wie gentechnisch veränderte Adipozyten das Tumorwachstum hemmen

Die Implantation gentechnisch modifizierter Adipozyten eröffnet neue vielversprechende Wege in der Krebstherapie. Durch gezielte metabolische Manipulationen können Tumore in ihrem Wachstum effektiv gebremst werden.

Easily query SQL and NoSQL databases in your Java app with one single language
Freitag, 13. Juni 2025. Mit einer einzigen Sprache SQL- und NoSQL-Datenbanken in Java-Anwendungen einfach abfragen

Erfahren Sie, wie moderne Java-Entwickler dank eines einheitlichen Query-Frameworks effizient und unkompliziert sowohl SQL- als auch NoSQL-Datenbanken ansprechen können – ohne den Aufwand, verschiedene Abfragesprachen zu lernen und zu pflegen.

Progress toward fusion energy gain as measured against the Lawson criteria
Freitag, 13. Juni 2025. Fortschritte bei der Kernfusionsenergie: Ein Blick auf die Lawson-Kriterien und ihre Bedeutung für den Energiewandel

Die Bedeutung der Lawson-Kriterien für den Fortschritt in der Kernfusionsforschung und wie aktuelle Entwicklungen die Zukunft der Energiegewinnung revolutionieren könnten.