I. Am Beginn einer neuen Ära
Das menschliche Genom ist noch nicht vollständig entziffert
Das menschliche Genomprojekt gilt seit Anfang des Jahres 2001 als abgeschlossen,
obwohl nur 93% der Sequenzen aufgeklärt sind und nur etwa 50% in ununterbrochenen
Ketten von mindestens 82 000 Basen ( = 82 kb) vorliegen. (Stand Ende Januar
2001) (1). Die andere Hälfte liegt nur in einer weniger genauen, so
genannten Entwurfsform vor. Sie ist weniger genau als für die Endfassung
geplant und enthält mehrere Löcher unbekannter Länge mit
völlig unidentifizierten Sequenzen. Ausserdem besteht die Entwurfsform
aus mehreren längeren Abschnitten, deren Reihenfolge untereinander
nicht bekannt ist. Insgesamt ist nur ein Viertel des Genoms mit der höheren
Genauigkeit sequenziert (2). Da aber die aufgeklärten Bereiche eine
erhöhte Dichte an Genen enthalten, gibt man sich offenbar mit dem
Stand der Arbeit zufrieden und erklärt das menschliche Genom für
sequenziert.
Was wäre ohne das Projekt?
Bevor ich erörtere, was das Projekt gebracht hat, will ich die
Frage stellen: Wo wäre die Forschung heute ohne das Projekt? Es wird
wohl niemand bezweifeln, dass man alles, was heute bekannt ist, auch ohne
das Projekt irgenwann herausgefunden hätte. Aber die Ergebnisse wären
eher entlang funktioneller Fragen erarbeitet worden – und das wesentlich
langsamer, denn durch die begleitende Werbung flossen erhöhte Geldbeträge
in diesen Sektor. Das war erklärtermassen auch einer der Gründe,
warum der Nobelpreisträger James Watson sein "Manhattan-Projekt",
wie er es nannte, so vorangetrieben hat.
Fortsetzung nur mit Automaten?
In den vergangenen Jahren haben automatische Sequenziergeräte mit
zunehmender Geschwindigkeit nicht nur die menschlichen DNA-Sequenzen ausgespuckt,
sondern auch die Sequenzen von 40 anderen Lebewesen, so genannten Modellorganismen.
Weitere 100 sind in Arbeit. All diese Daten bilden eine breite Grundlage
für die Bearbeitung neuer Fragestellungen. Um die Zäsur zu verdeutlichen,
wurde gleich ein neues Zeitalter ausgerufen, die postgenomische Ära
hätte begonnen. Tatsächlich könnte der Bruch zwischen dem,
was war, und dem, was kommt, kaum grösser sein. Noch nie warteten
so viele Daten auf eine Weiterverarbeitung. Daher wäre es nicht sinnvoll,
nun vom Automaten zum Reagenzglas zurückzukehren. Und so stehen wir
wirklich am Anfang einer neuen Ära, am Beginn einer Forschung mit
Automaten und Software. Parallelversuche in grosser Zahl und miniaturisierter
Form sollen mit so genannten Hochdurchsatz-Techologien die grosse Zahl
von Daten weiterverarbeiten und eine noch grössere Zahl neuer Daten
liefern. Die Aufklärung einzelner Reaktionen mit einzelnen Substanzen
– und der reagenzgläschenschüttelnde Chemiker im Labor - gehören
wahrscheinlich der Vergangenheit an.
Neusprech für die neue Zeit
Parallel zu den methodischen Umbrüchen entsteht eine neue Begriffswelt.
Da man nicht mehr mit einzelnen Substanzen arbeitet, tauchen auch die Namen
einzelner Verbindungen nicht mehr auf. Statt von bestimmten Proteinen,
Aminosäuren und Nucleotiden wird nun von "Zielstrukturen" und "Leitstrukturen"
("targets" und "leads") gesprochen. Die Schilderungen bleiben möglichst
allgemein – um die umfassenden Kapazitäten der Methoden zu betonen
– und sind oft unklar und schwammig.
Dazu kommt, dass die Sprache eher Werbeträgerin als Kenntnisvermittlerin
zu sein scheint. Bei Wortbildungen, die das Gigantische betonen und z.T.
aus der Raumfahrt entlehnt sind, fühlt man sich als Leser eher zum
Staunen als zum Verstehen aufgerufen. Es geht um Begriffe wie "Diversitätsraum"
("diversity space"), "chemischer Raum" ("chemical space"), Gen-Raum (gene
space) (3), Eigenschaftsraum ("property space") (gemeint ist die Gesamtheit
aller Möglichkeiten z.B. in einem bestimmten Versuchsansatz), "proteomische
Welt" (4) (die Gesamtheit aller Proteine eines Organismus) oder multifaktorielle
Welt (die neu entdeckte Komplexität, die höher ist als zuvor
angenommen) (5). Die diversen Arbeitsbereiche werden mit Modeworten klassifiziert
wie Transkriptomik, Proteomik, Phenomik oder Operomik. (6). Reaktionsbedingungen
heissen Formate. Die konservierte Reihenfolge mehrer Gene wird "Syntenie"
genannt. Auch das Wort "global" kommt oft vor und soll heissen, dass sich
etwas auf das gesamte Genom bezieht. Ein globaler Transkriptionsfaktor
z.B. ist einer, dessen Funktion nicht auf einen Teil des Genoms beschränkt
ist. Oder man findet Formulierungen wie: "Proteomik zeichnet ein globales
Bild". Hier wird der Arbeitsbereich (Proteomik) zum Akteur (und zum Singular,
denn im Englischen verwendet man sonst im Allgemeinen den Plural:
"proteomics"). Das Gleiche in: "Proteomik verspricht aufregende Einblicke".
Auch Eigenschaften von Chemikalien werden personalisiert, denn sie werden
als "Deskriptoren" bezeichnet, z.B. ist die elektrische Ladung eines Moleküls
ein Deskriptor (7) und funktionelle Gruppen an einem Molekül sind
"Dekorationen" (7).
Dass ich mit diesem Sprachunbehagen nicht allein dastehe, soll ein Zitat
zeigen: Ausgerechnet zwei Autoren des "Genomics Institute of the Novartis
Research Foundation" schrieben "Leider ist es eine Tatsache, dass die wissenschaftliche
Literatur einigermassen planlos entstanden ist, ohne den Vorteil eines
kontrollierten oder eingeschränkten Vokabulars und einer wohl-definierten
Semantik und Grammatik" und: "Es ist absolut notwendig, die Fakten, Ideen,
Beobachtungen usw., die in der wissenschaftlichen Literatur und in den
Köpfen von Wissenschaftlern existieren, in eine Form einzupassen,
die systematisch, organisiert, verknüpft und visualisiert ist und
ihre Verwendung als Suchworte erlaubt"(3).
Das menschliche Genom ist kleiner als gedacht – nur 32 000 Gene
statt 100 000
Der "Abschluss" des Genomprojektes brachte ein Ergebnis, das laut Tagespresse
und Wissenschaftlichen Zeitschriften sowohl bei Gentechnikbefürwortern
wie –gegnern einen Schock auslöste: Der Mensch hat statt der bisher
meist mit 80 bis 100 000 angegebenen nur etwa 30 – 40 000 Gene. Zwar war
die Zahl bis kurz davor umstritten gewesen, einige Forscher hatten Werte
herunter bis 25 000 angenommen und waren dafür als "low baller" belächelt
worden. Die höchsten Annahmen lagen bei 150 000. Beim hoch renommierten
jährlichen Cold-Spring-Harbor-Symposium in den USA wurde im Mai 2000
auf die Zahl der Gene gewettet, die Spanne lag zwischen <28 000 und
200 000 (8). 80 bis 100 000 galt in den vergangenen Jahren als Konsens.
Peinlich ist natürlich, dass sich einige Datenbankbetreiber gebrüstet
hatten, sie besässen in ihren Banken 100 000 Gene (HGS = Human Genome
Sciences) oder 125 000 Gene (Incyte) (9). Incyte räumt jetzt ein,
dass sie die Zahl ihrer Gene nicht genau kennen, ein Fehler könne
sein, dass unter den Messenger-RNAs (mRNAs), die sie gezählt haben,
sich auch Pseudogene befinden, die zwar eine mRNA bilden, aber keine Funktion
haben, und es könnte weiterhin sein, dass sie verschiedene mRNAs,
die durch alternatives Spleissen (s.Teil II ) von ein und demselben Gen
gebildet wurden, mitgezählt haben (9).
Diese drastische Korrektur eines vorher sehr oft zitierten Ergebnisses
ist ein erschreckendes Zeichen dafür, wie dünn die Grundlagen
für einige als sicher dargestellte Fakten sein können. Bei ehrlicher
Berichterstattung hätte es in den Jahren davor heissen müssen,
dass es keinerlei Beweise, sondern nur Anhaltspunkte für die
Zahl menschlicher Gene gebe, und dass der mögliche Wert zwischen 25
000 und 150 000 läge. Aber die Blösse einer so grossen Unsicherheitsspanne
hatte man sich offenbar nicht geben wollen.
Was macht einen hoch organisierten Organismus aus?
Nach dem Bekanntwerden der neuen Zahlen beeilte man sich zu sagen, das
bedeute, dass die Komplexität der Gen-Phänotyp-Beziehungen entsprechend
höher sei und dass daher jedes Gen im Durchschnitt zwei bis drei Proteine
produzieren müsse. Wenn es nur ein Drittel der bisher vermuteten Gene
gibt, muss eben jedes Gen drei Proteine produzieren – meint man. Aber wie
sicher ist das? Die Wissenschfatsgemeinde musste doch gerade eine erschreckende
Unkenntnis der Zahl der Gene zugegeben und am nächsten Tag ist sie
wieder Herr der Zahlen – so scheint es. Offenbar meint man, dass die angenommene
Zahl der Proteine trotz der nach unten korrigierten Zahl der Gene gleich
geblieben ist und 100 000 beträgt. War die Zahl 100 000 nicht in erster
Linie deswegen angenommen worden, weil man 100 000 Gene vermutete? Über
die Gesamtzahl menschlicher Proteine findet man kaum Angaben. Das Biochemie-Institut
der Universität Erlangen nennt 250 000 (10). An anderer Stelle heisst
es vage: "Die Anzahl der verschiedenen, vom menschlichen Genom exprimierten
Proteinmoleküle liegt wahrscheinlich näher bei einer Million
als bei 100 000, wie generell von Genom-Wissenschaftlern angenommen (11,12)."
Demnach müsste jedes Gen im Schnitt fast zehn Proteine bilden. Ich
will später ausführen (s. Teil II),
dass wir es hier vermutlich mit einer Art von Komplexität zu tun
haben, die sich einer Abzählung entzieht.