.zurück zur auswahl        zurück       weiter
 
.  
.
  Postgenomik (Teil IV)
.
 
IV. Die Funktionsaufklärung von Genen

Im vorhergehenden Abschnitt wurde ausgeführt, wie man die Position von Genen im Genom finden kann. Den Ort eines Gens zu kennen, hat aber nur dann einen Sinn, wenn man etwas über seine Funktion weiss. Deshalb ist die Aufklärung der Genfunktionen  nach dem Abschluss der Sequenzierung die Hauptaufgabe der Forschung. 
 
 

Für die Funktionsaufklärung von Genen spielen - ähnlich wie bei der Suche nach ihrer Lage in den Chromosomen - Vergleiche mit homologen Genen die grösste Rolle. 


 

A) Homologievergleiche bei der Suche nach der Genfunktion

a) Die Voraussetzungen für Homologievergleiche

Voraussetzungen für Homologievergleiche zur Funktionsaufklärung sind: 

1. dass für dieses Gen homologe Gene bekannt sind,

2. dass die Ähnlichkeit der Funktionen der zu 
    vergleichenden Gene im Verlauf der Evolutionerhalten 
    geblieben ist  und

3. dass das in einer Datenbank gespeicherte Ergebnis
    der Funktionsanalyse für das Referenz-Gen richtig ist.

Zu Punkt 1:
Für etwa die Hälfte aller Gene sind keine Homologen bekannt (s. Teil III, F). Für sie muss eine Funktionsanalyse über andere, aufwendigere Wege erfolgen (s. Teil V, Proteomik). 
 

Zu Punkt 2: Beziehungen zwischen Sequenz und Funktion

Chemische Reaktion ist nicht gleich biologische Funktion

Ähnlichkeiten in der Sequenz bedeuten nicht immer auch Ähnlichkeit in der Funktion, z.B. sind die Gene für die Proteine der Augenlinse (Crystalline) homolog mit den Genen für die Chaperone, die für eine richtige Faltung von Proteinen Hilfestellung leisten (1). 
 

Aber auch wenn die Funktion bei der getrennten Entwicklung der homologen Gene während der Evolution erhalten geblieben ist, reicht eine solche Funktionszuschreibung nicht aus, das Gen im Kontext der zellulären Funktionen zu verstehen (2). Dafür einige Beispiele:

 
Ähnliche Enzyme können verschiedene Funktionen haben

Vier homologe Enzyme (Fumarase, Aspartase, Argininosuccinat-Lyase und Adenylosuccinat-Lyase) katalysieren vier sehr ähnliche Reaktionen. Bei jeder der Reaktionen wird Fumarsäure angelagert, d.h. der eine der beiden Reaktionspartner ist immer der gleiche, nur beim zweiten handelt es sich jedesmal um eine andere chemische Verbindung. Auf der chemischen Ebene herrscht also grosse Ähnlichkeit. Aus der Perspektive des Gesamtstoffwechsels oder der biologischen Funktion betrachtet sieht das jedoch anders aus. Die Fumarase gehört zum allgemeinen Zwischenstoffwechsel, die Aspartase zum Aminosäure-Abbau, die Argininosuccinat-Lyase zur Aminosäure-Synthese und die Adenylosuccinat-Lyase zur Nucleinsäuresynthese (3).

Völlig unterschiedliche Gene können die Ursache für sehr ähnliche Erkrankungen sein

Myotone Dystrophie DM1 (eine Form von Muskelschwund) wird durch die Erweiterung eines sich wiederholenden Elements (Repeat) verursacht. Sie liegt zwischen den Genen DMPK und SIX5 und reicht in die flankierenden (nicht codierenden) Regulationsbereiche beider Gene hinein. Unlängst wurde eine zweite Form der Myotonen Dystrophie (DM2) gefunden. Auch hier ist die Ursache die Expansion eines Repeats. Wieder liegt die Expansion im nicht codierenden Bereich, aber in diesem Fall im ersten nicht-codierenden Zwischenstück (Intron) innerhalb des Gens ZNF9. Dieses ZNF9-Gen hat mit keinem der beiden Gene DMPK oder SIX5 Ähnlichkeit.(4,5). Hier führen also Funktionsausfälle bei zwei völlig unterschiedlichen Genen zu sehr ähnlichen Phänotypen. (6)
 
 

 
Erläuterungen:

Das DMPK-Gen ist das Gen für die Dystrophia-myotonica-Protein-Kinase.
Das SIX5-Gen gehört zu den so genannten Homeodomänen oder Hox-Genen. Das sind Gruppen von Genen, die durch die Evolution nur wenig verändert wurden. Man sagt, sie sind hoch konserviert. Ein hohes Mass an Konservierung zeigt immer eine besonders grosse Bedeutung an. 
In diesem Fall handelt es sich um übergeordnete Funktionen bei der frühen Embryonalentwicklung. Die Hox-Gene entscheiden darüber, welche Organe in welchem Segment angelegt werden.
Die Abkürzung ZNF9 steht für Zinkfingerprotein 9. Zinkfinger nennt man bestimmte zinkhaltige aktive Zentren von Proteinen. Sie sind Signalüberträger.
 

 

Eigentlich war ich im Zweifel, ob ich das Myotonie-Beispiel an dieser Stelle anführen sollte, denn die Ähnlichkeit der Krankheitsbilder beruht nicht auf der ähnlichen Wirkung zweier verschiedener Gene, sondern auf dem Einschub zweier ähnlicher DNA-Sequenzen in zwei Gene. Die Krankheit wird in diesem Fall nicht durch die veränderte oder ausgefallene Aktivität eines oder meherer Gene ausgelöst, sondern direkter durch die toxische Wirkung der von der Sequenz abgelesenen RNA. (Zum Mechanismus der Krankheitsentstehung vgl. Teil II: Alternatives Spleissen) 

(Der Vollständigkeit halber muss gesagt werden, dass die Krankheitssymptome nicht ausschliesslich durch die toxische RNA bedingt sind, sondern dass die in ihren Regulationsbereichen getroffenen Gene auch dazu beitragen. Auf diese Weise kommt es dann logischerweise zu den Unterschieden zwischen den beiden Erkrankungsformen DM1 und DM. Immerhin sind die Unterschiede so gering, dass die zweite Form –die  DM2 - nicht auf Grund der Symptomatik sondern durch genetische Untersuchungen entdeckt wurde.)

Wenn Gene unter Evolutionsdruck geraten, ändert sich ihre Funktion

Das Gen für Leptin steht bei der Maus mit dem Phänotyp Fettleibigkeit in Beziehung. Deshalb wurde das entsprechende menschliche Gen schnell bekannt und zu einer Zielstruktur für ein Mittel gegen Fettleibigkeit, das wegen der breiten Anwendbarkeit hohe Gewinne versprach. Deshalb zahlte die Firma Amgen 20 Millionen $ dafür (4). Rekonstruiert man aber die evolutionäre Entstehungsgeschichte dieser Gen-Familie 
(das ist durch Sequenzvergleiche verschieden nahe verwandter Arten möglich), so 
sieht man, dass es in der Entwicklung von den gemeinsamen Vorfahren zwischen Mensch und  Maus bis zum  Menschen eine Episode mit einer "bemerkenswert hohen" Rate an Sequenzänderungen gegeben hat. Nach der Darwinschen Theorie muss man annehmen, dass das Gen in dieser Zeit unter positivem Selektionsdruck stand, so dass eine veränderte Funktion des Leptin-Gens angenommen werden muss (3).
 

Bei funktioneller Divergenz kann Homologie gar nicht die gleiche Funktion bedeuten

Ein Vergleich aus der Familie der Elongationsfaktoren bei Bakterien und bei  Eukaryonten: Bei Eukaryonten werden diese Faktoren im Zellkern an unbeladene 
tRNAs gebunden, die tRNAs werden danach im Zellkern mit Aminosäuren beladen 
und anschliessend aus dem Zellkern ins Cytosol transportiert. Der letzte Schritt ist trotz vorhandener Homologie bei Bakterien grundsätzlich nicht möglich, denn sie haben keinen Zellkern (3).

 
Eräuterungen:

Elongationsfaktoren spielen eine Rolle bei der Verlängerung der Peptidketten, d.h. bei der Proteinsynthese.
Bakterien gehören zu den Prokaryonten. Der Name besagt, dass sie noch keinen richtigen, von einer Membran umgebenen Zellkern besitzen, sondern nur eine, als Nucleoid bezeichnete Vorstufe dazu. Zu den Eukaryonten mit einem membranumschlossenen Zellkern (Nucleus) gehören alle Lebewesen, die höher organisiert sind als Bakterien (und Blaualgen). Das sind Einzeller von den Hefen ab und alle Mehrzeller.
tRNAs (Transfer-RNAs) transportieren die Aminosäuren zum Ort ihres  Zusammenbaus zu Proteinen.

 
Die Lebensweise beeinflusst die Funktion

Es ist ein Gesetz der Evolution, dass wenn zwei Arten im selben Lebensraum die gleiche Lebensweise haben, nur eine von beiden überlebt. Umgekehrt bedeutet das "fast per Axiom", dass zwei verschiedene Organismen in einem gemeinsamen Lebensraum unterschiedliche Überlebensstrategien entwickelt haben müssen. Das wiederum schliesst mit ein, dass zwei sich funktionell und in der Herkunft entsprechende (orthologe) Proteine möglicherweise nicht in genau derselben Weise zum Überleben der Art beigetragen haben, also partiell unterschiedliche Funktionen haben müssen (3).
 
 

Die Beziehung Ein-Gen-eine-Funktion ist nicht immer gegeben

-   Eine weitere Komplikation kann darin liegen, dass Gene im Laufe der Evolution 
    funktionelle Domänen aufnehmen oder verlieren können. So kann ein Protein mehr als
    einen "Vorfahren" haben. (Das sind natürlich entstandene chimärische Proteine) (1).

-   Wird ein morphologisches Merkmal durch die kollektive Wirkung vieler Gene
    erzeugt,  könnte es sein, dass eine Mutation in einem einzelnen dieser Gene keine
    erkennbare Veränderung bewirkt, weil das Gen nur in einem kleinen Teil des 
    genetischen Netzwerkes arbeitet oder weil es vollständig redundant ist (8).

-   Umgekeht kann es sein, dass die Mutation eines einzigen Gens zu einer Kaskade
    von Veränderungen führt, die im weiteren Verlauf weitreichende Effekte zur Folge 
    hat, so dass man nur schwer zwischen primären und sekundären Wirkungen 
    unterscheiden kann (8). 

In allen drei Fällen kann die Zuordnung einer Funktionen zu einem Gen 
erschwert sein.
 

Nachträgliche Modifikationen verändern die Proteinfunktion

Ausserdem fehlt bei der automatischen Vorhersage von Proteinfunktionen jegliche Information über posttranslationale Modifikationen (PTMs, das sind nachträgliche chemische Veränderungen am Protein, die nicht vom selben Gen gesteuert werden.) 

Dazu gehören: 

  • Abspaltung von Signalsequenzen,
  • Abspaltung von Transit- oder Pro-Peptiden,
  • Abspaltung des Start-Methionins,
  • Anheftung von Gruppen, wie Acetyl-, Methyl-, Zucker-, und Lipid-, Phosphoryl- oder Sulfatgruppen,
  • innermolekulare oder nach aussen gerichtete Vernetzungen durch S-S-Bindungen.
  • Z.Zt. sind über 100 verschiedene Modifikationen bekannt und die Entdeckung weiterer wird erwartet (9). 
     

    Wir sehen also eine grosse Vielfalt an Beziehungen zwischen Genen und Funktionen, so dass einfache Rückschlüsse nicht immer möglich sind.
     

    Zu Punkt 3: Fehler in den Datenbanken

    Ein erheblicher Anteil der konventionell erarbeiteten Gen-Deutungen ist nicht korrekt

    In einer Studie wurden drei Veröffentlichungen mit Funktionsangaben über 340 Gene von Mycoplasma genitalis (dem nicht-parasitischen Organismus mit dem kleinsten aller bisher gefundenen Genome) verglichen. Dabei wurden für 8% der Gene völlig unkompatible Deutungen gefunden. Die tatsächliche Zahl von Fehlern ist wahrscheinlich höher, weil beim Vergleichen nur Unterschiede in der Deutung registriert wurden. Zu den 8% kommen also die Gene hinzu, die von allen drei Arbeitskreisen gleichlautend falsch interpretiert wurden. Dafür gibt es eine erhebliche Wahrscheinlichkeit, weil alle Arbeiten auf denselben derzeit gängigen Methoden und Grundannahmen beruhen. "Die Deutungsfehler eskalieren dramatisch", wenn solche falschen Daten in die Datenbanken eingegeben und wenn "mit den daraus resultierenden falschen Ergebnissen weitere Datenbanken gefüttert werden," heisst es in der Studie (10).
     

    Wieviel Prozent Homologie haben wieviel Aussagekraft?

    Hierzu wurden ebenfalls verschiedene Forschungsarbeiten an Mikroorganismen miteinander verglichen, u.zw. auf zweierlei Weise: 

    Erstens wurde untersucht, wie gross die Sequenzübereinstimmungen zwischen Proteinen sind, die bisher für Homologievergleiche herangezogen wurden. Die Autoren fanden, dass die meisten Vergleiche mit Proteinen durchgeführt wurden, deren Sequenzen zu gut 30% identisch waren. Zweitens wurde innerhalb ganzer Sätze von Proteinen, deren Funktionen bereits gut bekannt sind, nachgeschaut, wie ähnlich die Funktionen bei der oben festgestellten durchschnittlichen Sequenzübereinstimmung von gut 30% tatsächlich sind. 

    Dabei fanden die Autoren nur 5% Abweichungen bei groben Funktionsbezeichnungen (z.B. Transport), aber bis 40% Abweichungen, wenn die Funktion detailliert benannt wurde (z.B. Phosphat-Transport). Diese Fehlerrate könne jedoch verringert werden – so heisst es - durch Einbeziehen anderer Kriterien, wie dem genomischen und physiologischen Kontext (z.B. Einbeziehen des Stoffwecheslweges, an dem die Funktion beteiligt ist, der Zugehörigkeit zu einer Proteinfamilie oder von Informationen aus der Evolution des Gens) (11). 
     
     

    Warum gibt es keine systematische Fehlerbewertung?

    Die Autoren meinen, es sei paradox, "dass auf die ausgeklügelten computerisierten Methoden, die bei der Sequenzierung und Kommentierung ganzer Genome verwendet wurden, keine systematische Bewertung der bei diesen Vorhersagen auftretenden Fehler gefolgt ist (11)."
     

    Und noch eine grundlegende wichtige Unzulänglichkeit der bisher entwickelten automatischen Methoden: kleine Proteine sind damit nicht auffindbar (9). Es gibt aber sehr viele kleine Proteine mit entscheidenden Funktionen für viele biologische Prozesse (z.B. Peptidhormone, Cytokine)


     

    b) Zum Umgang mit der Fehlerhäufigkeit

    Patente auf die Arbeit von Computern?

    Trotz der hohen Fehlerrate genügt für eine Patentierung von Genen, sowohl nach US-amerikanischem Recht als auch nach der EU-Patent-Richtlinie, die Funktionszusprechung nach Homologievergleich. Selbst Francis Collins, der Leiter der US-amerikanischen Sektion des Human Genome Project hat kritisiert, 
    dass Tausende von Patentanträgen auf Angaben basieren, die nur aus 
    dem Vergleich von Gendatenbanken im Computer resultieren (12). An 
    der staatlichen Universität in New York wurde eine Umfrage unter den wissenschaftlichen Mitgliedern der US-amerikanischen Gesellschaft 
    für Humangenetik durchgeführt. Von den über 1200 Befragten sehen 
    90% im übermässigen (excessive) Patentieren ein Problem, sogar bei Industriewissenschaftlern sind es 86%. 5% lehnen Patente auf DNA ab, gleich ob kurze oder lange Bereiche, ob mit oder ohne Funktionsangaben (13). 
     

    Bei Unzulänglichkeit der Automaten – zurück zur Handarbeit?

    Wegen der grossen Fehlerhäufigkeit wird vor einer unbesehenen Verwendung von Informationen aus den Datenbanken gewarnt. Man solle darauf achten, ob die Daten ausgiebig manuell überprüft wurden (14). 

    Manuell überprüfen? Das klingt, als würde das Rad des Fortschritts rückwärts gedreht! Aber es ist tatsächlich so und die Begründung klingt 
    fast etwas nostalgisch: im Anschluss an einen Hochdurchsatzlauf würde die Funktionsaufklärung entscheidend abhängig von einer konventionellen, von Hypothesen ausgehenden Forschung (1). Das ist tatsächlich ein Schwenk rückwärts, denn andere Autoren sind gerade dabei, sich von den guten alten Hypothesen als Forschungsgrundlage zu verabschieden: "In gewisser Weise ist die derzeitige Lifescience-Forschung Technologie-getrieben und neue Instrumentarien haben dazu beigetragen, dass sich diese Arbeiten von Hypothese-getriebenen zu Entdeckungs-getriebenen Untersuchungen entwickelt haben," schreibt der US-Wissenschaftler Kelvin Lee, Spezialgebiet: Chemical Engineering (15). 
     

    Wird der künftige Forscher forschende Automaten bauen?

    Mit anderen Worten: der Motor wissenschaftlicher Arbeit waren bisher die gedanklichen Schlussfolgerungen und Ideen von Wissenschaftlern, die im Diskurs zur Übereinstimmung gebracht wurden, heute dagegen sind es massenhaft anfallende maschinenerstellte Daten, die das Ausgangmaterial für weitere 
    Daten bilden. Der menschliche Beitrag liegt in der Steuerung der Suchdurchläufe und (zum Teil) im Erkennen des Brauchbaren. An oberster Stelle steht nicht mehr der menschliche Geist im Dienste 
    der Naturgesetze, sondern die von Menschen gemachte Maschine. Der Mensch selbst ist ins zweite Glied getreten. 

    Es scheint, dass die bisherige Form der Forschung angesichts der hochvernetzten Kompexitäten des Zellgeschehens an eine Machbarkeitsgrenze geraten ist und dadurch die Automation notwendig gemacht hat. Aber wird die Computertechnik nicht auch auf Grenzen stossen? 

    Vielleicht läuft die Entwicklung in Richtung auf eine Kombination beider Arbeitsansätze. Das wäre aber auch eine Kombination der Nachteile. Bedauerlich ist, dass diese ernste Problematik mit einer Sprache zugekleistert wird, die aus der Werbung stammt und die es bis vor kurzem in der Wissenschaft nicht gegeben hat (vgl. Teil I). Wie später ausgeführt werden soll, gibt es erste Hinweise darauf, dass die neuen Technologien nicht so viele verwertbare Ergebnisse liefern wie erhofft, und dass auch deshalb sich die Blicke nach rückwärts zu richten beginnen. 
     

    Qualitätsangaben für Daten

    Um das Problem der Fehldeutungen besser einschätzen zu können, 
    werden die Einträge in den Datenbanken mit Qualitätsangaben versehen 
    wie "vorhergesagt", "provisorisch" oder "überprüft". Bisher trägt nur ein kleiner Teil der Daten das Prädikat "überprüft". Im Mai 2001 waren es 
    in der Bank für Referenzsequenzen (RefSeq-Bank) des US-National 
    Center for Biotechnology Information (NCBI) von gut 12 000 Einträgen 
    nur gut 2000 (14). 
     

    Der technische Aufwand ist sehr gross

    Die folgende Schilderung einer Geräteanordnung soll einen Eindruck vermitteln, in welchen Dimensionen solche Analysen ablaufen: Das Gen-Deutungssystem "Ensembl" besteht aus einem "Cluster" von 500 Computern und einer "Pipeline" mit Deutungsprogrammen. Die zu untersuchende Sequenz wird in die Pipeline eingeführt, und dann durch eine "Suite" von Gen-Vorhersage-Programmen gejagt. Dazu gehören verschiedene Ähnlichkeits-Such-Algorithmen auf Nucleotid- oder Proteinbasis sowie Protein-Domänen-Suchprogramme (1).

     
    Erläuterungen: 

    "Ensembl" ist eine Kooperation aus EMBL-EBI und dem Sanger Centre. EMBL = Europäisches Labor für Molekularbiologie; EBI = Europäisches Institut für Bioinformatik; Das Sanger Centre ist ein britisches Genom-Forschungszentrum, das 1992 vom Wellcome Trust und dem Medical Research Council gegründet wurde. 
     


     
    Manuelle Überprüfung

    Bei der manuellen Überprüfung werden 

    -    kontaminierende Reste der Vektoren entfernt, 
    -    Sequenzierfehler korrigiert, 
    -   die Ausdehnung der nicht translatierten Regionen überprüft, und die 
         Spleissstellen untersucht (14). 
     
    Erläuterungen:

    Vektoren sind Transportvehikel für DNA. Die DNA-Sequenzen in Datenbanken werden nämlich in geklonter Form in Bakterienzellen gelagert. Und die für den Einbau in die Bakterien verwendeten Vektoren können Verunreinigungen bilden.
    Translation ist die Übersetzung der mRNA in Proteine.
     

     

    B) Expressionsprofile zur Charakterisierung von Genfunktionen
     

    Expressionsprofile sind Abbilder des Stoffwechsels

    Ein zweiter Weg (ausser den Homologievergleichen), etwas über die Funktion von Genen zu erfahren, ist eine vergleichende Analyse der Expression unter verschiedenen Bedingungen. Die Expression ist die direkte "Äusserung" eines Gens, sozusagen seine ureigene Sprache. Sie ist der erste Schritt der Informationsweitergabe. Dieser erste Schritt ist die Synthese 
    einer Messenger-RNA-Vorstufe (Prä-mRNA), aus der die eigentliche Messenger-RNA (mRNA) herausgespleisst wird (s. Teil II). Eine Bestimmung der Profile dieser Substanz gewordenen Gen-Informtionen, der mRNAs gibt demnach Auskunft über die Aktivitätsmuster der Gene. Bestimmt wird, wieviel von welcher mRNA in welcher Situation in welchem Gewebe gebildet wird. Die Ergebnisse nennt man Expressions- oder mRNA-Profile. 
     
     

    Die mRNA-Profile geben ein verzerrtes Bild

    Mit der mRNA-Bestimmung lassen sich quasi Schnappschüsse der gesamten Gen-Aktivitäten zu einem bestimmten Zeitpunkt in einzelnen Zellen aufnehmen (16). Man hofft durch umfassende Erforschung der Expressionsmuster das Netz der biochemischen Wechselwirkungen verstehen zu können. Eigentlich wäre dafür eine Bestimmung der mit Hilfe der mRNA gebildeten Proteine 
    das geeignetere Mittel, da die Proteine die eigentlichen Vermittler der Stoffwechselaktivitäten sind. Aber eine mRNA-Bestimmung lässt sich 
    leichter automatisieren. RNA kann durch Hybridisierung an Chips 
    (s.Teil VII D) und computerisierte Datenauswertung analysiert werden. Dafür nimmt man allerdings ein verzerrtes Bild des tatsächlichen Stoffwechselgeschehens in Kauf, denn die Proteinaktivitäten sind 
    mit den mRNA-Mengen leider nur etwa zur Hälfte korreliert (17,18).
     

    Die Wundheilung ähnelt der Embryonalentwicklung

    Die Expressionsprofile ändern sich mit dem physiologischen Zustand der Zelle. Es gibt erste Ergebnisse über charakteristische Veränderungen in Tierversuchen bei 

     - Hirnverletzungen, 
     - Verbrennungen, 
     - Vergiftungen und 
     - Krankheiten. 

    Man hofft die verschiedenen Profile so gut kennenzulernen, dass man künftig aus einem Expressionsprofil auf den Zustand der Zelle und damit evtl. auf die Art einer Erkrankung schliessen kann. Dabei zeigen sich Ähnlichkeiten zwischen den Heilungsprozessen verletzter Nervenzellen und den Vorgängen bei der Differenzierung embryonaler Stammzellen zu Nervenzellen. Man schliesst daraus, dass bei der Wundheilung das Aktivitätsmuster der Embryonalzellen vorrübergehend reaktiviert wird (17). An diesen Versuchen könnte es demnach  noch ein anderes Interesse geben als das der Erkennung von Krankheiten, denn die Wiederbelebung embryonaler Genaktivitäten in differenzierten Zellen ist die Hauptvoraussetzung für das Klonen nach der Dolly-Methode. 
     

    Sind Profile für Toxizität gleich Profilen für Nebenwirkungen?

    Wenn die Profile sich bei Vergiftungen ändern, könnten auch therapeutische Wirkungen und toxische Nebenwirkungen von Medikamenten auf diese Weise erkennbar sein. Und da Erkrankungen zu spezifischen Veränderungen führen, kann man die beim Krankheitsgeschehen involvierten Gene auf diese Weise identifizieren sowie ihre unmittelbaren (primären) oder sekundären Produkte. Hat man auf diesem Wege für einige Genprodukte eine Beteiligung am Krankheitsgeschehen erkannt, kann man sie eventuell als Zielstrukturen 
    für die Gewinnung von Medikamenten verwenden (vgl. Teil VII B und 
    Teil VII C). Leider sind die Ergebnisse der Profilvergleiche äuserst komplex.(vgl. Teil VII F).
     

    "Brute-force"-Strategien

    Als Nachteil der Expressionsprofile werden Argumente angeführt, die eigentlich ein Stück weit entlarvend sind für die Grundhaltung, mit der gearbeitet wird. Es heisst, die Erstellung von Expressionsprofilen erfülle zwar die Forderung, schnell und informativ zu sein, sie sei aber auf die Kreativität der Forscher angewiesen, sich geeignete Stimuli auszudenken, um Effekte zu verursachen, und das sei eine Begrenzung der Methode (19). Offenbar werden irgendwelche Stimuli gesetzt, die irgendwelche Daten liefern, mit denen man dann den Computer füttern kann. Auf der molekularbiologischen Ebene Einzelerwägungen über Reaktionen nachzugehen, ist wegen der grossen Zahl anfallender Möglichkeiten nicht mehr machbar. So aber wird die wissenschaftliche Vorgehensweise auf ein stumpfes Ausprobieren und Registrieren summierter Effekte reduziert. Sehr viel Zeit und Erfindungsgeist wird dagegen in die Entwicklung der neuen Technologien investiert (vgl..diesen Teil (IV), A, b). Solche Methoden werden auch als "brute force" bezeichnet. Der US-amerikanische Mathematiker Leonhard Adleman nennt Methoden "brute-force", wenn ohne Strategie alle Möglichkeiten durchprobiert werden (20, 21). Der Begriff wird für postgenomische Arbeiten häufig verwendet und ist positiv besetzt, als eine neue Art computergerechter Sachlichkeit. 
     

    C) Funktionsermittlung durch Abschalten einzelner Gene

    Das Arbeiten an einzelnen Genen ist schwer automatisierbar

    Mit Expressionsprofilen lässt sich - wie bereits ausgeführt - feststellen, welche Gene auf welche veränderte Situation reagieren, z.B. auf die Einwirkung eines Giftes oder Medikamentes (das können Hunderte von Genen sein, s.später unter Toxizitätsprüfungen). So erfährt man, welche Gene an einer Reaktion beteiligt sind. Will man aber etwas über den Beitrag  eines einzelnen Gens an einem Zellgeschehen wissen, so kann man versuchen, dieses Gen entweder ganz oder teilweise auszuschalten, um zu sehen, was sich dann ändert. 
     

    1) Totale Ausschaltung von Genen

        a) Die Knockout-Methode zur Züchtung von Versuchstieren 

        Bisher wurden hierfür so genannte Knock-out-Mutanten von 
        Versuchstieren gezüchtet, bei denen das zu untersuchende Gen 
        gentechnisch ausgeschaltet war. Das ist mit einem, vom heutigen 
        Standpunkt aus geradezu ungeheuerlichen Zeitaufwand verbunden. 

         b) Die Anti-Sense-Methode an Zellkulturen 

        Für die Knock-out-Methode am ganzen Tier gibt es jedoch einen 
        Ersatz, der auf Zellkulturen anwendbar ist: die Antisense-Methode. 
        Hierbei werden DNA-Stücke mit einer zum untersuchten Gen 
        komplementären Sequenz eingesetzt, die mit dem Gen hybridisieren 
        und es dadurch blockieren. Aus den Folgen des Aktivitätsausfalls 
        kann man auf die Funktion des Gens schliessen. Der Vorteil dieser 
        Methode ist, dass solche Antisense-Oligonucleotide für jedes Gen 
        vollautomatisch synthetisiert werden können (19). Nachteile sind,

     i)  dass sie nicht gut funktioniert, weil die DNA-Stücke 
          sehr leicht abgebaut werden.
          Nicht einmal da, wo die Technik patentiert wurde, ist sicher, 
          ob sie funktioniert. 

           Bei einer Einspruchsverhandlung gegen
          das Flavr-Savr-Tomaten-Patent der Firma Calgene vor
          dem Europäischen Patentamt am 8. 2. 2001 wurde 
          offenkundig, dass bei der als Antisense-Technik patentierten
          Methode nicht bewiesen ist, ob der Effekt tatsächlich auf
          einer Antisense-Wirkung beruht. In der Verhandlung wurde
          hierzu ziemlich flapsig argumentiert, wenn das patentierte
          Stück DNA "seinen Job tut", sei das Patent gerechtfertigt, 
          auf welchem Wege das erfolge, sei unerheblich.

    ii)  dass sie nur dann angewendet werden kann, wenn der
          Gen-Ausfall nicht lethal ist. Aber selbst wenn er nicht
          lethal ist, muss man vermuten, dass es durch den 
          Ausfall des Gens zu Kompensationsreaktionen
          anderer Gene gekommen sein könnte. Das würde zu
          falschen Schlussfolgerungen darüber führen, welche
          Rolle das Gen in der Normalsituation spielt (19).


    2) Partielle Gen-Abschaltung mit der RNA-Interferenz-Methode (RNAi).

        Die RNA-Interferenzmethode scheint auf den ersten Blick Ähnlichkeit mit 
        der Antisense-Methode zu haben, weil auch hier Nucleinsäurestücke 
        eingesetzt werden, die komplementär sind zu Teilen der Nucleinsäure, die 
        sie hemmen sollen. Bei näherem Hinsehen erweist sie sich jedoch als etwas 
        vollkommen anderes: 

     
    Ein 21 Basen langes RNA-Stück induziert seinen eigenen Abbau

    Erst unlängst wurde entdeckt, dass es bei vielen Organismen Proteine 
    gibt mit einer spezifischen Bindungsfähigkeit für doppelsträngige RNA (dsRNA). Diese dsRNA muss eine Länge von genau 21 Nucleotiden haben,
    die Sequenz dagegen kann beliebig sein. Der RNA-Anteil des so gebildeten RNA-Protein-Komplexes kann (wie Nucleinsäuren es immer können) unter Bildung einer Triple-Helix eine weitere RNA binden, die zu einem der beiden Stränge der dsRNA komplementär ist. Das Besondere in diesem Fall ist, dass 
    in dem  Protein durch die Bindung mit der dsRNA eine RNA-apaltende Aktivität induziert wird, die sich gegen die neu hinzugekommene RNA richtet (22,23).  Dieser Mechanismus kann dazu dienen, die mRNA eines bestimmten Gens 
    zu spalten. Hierzu stellt man eine 21 Nucleotide lange dsRNA her, deren Sequenz  zu einem  exprimierten (in mRNA übersetzbaren) Abschnitt des 
    Gens komplementär ist. Der Komplex aus dem induzierbaren  Protein mit der 
    dsRNA wird nun diese mRNA an der vorgesehenen Stelle spezifisch spalten.

    Das führt zu einer Herabsetzung der Aktivität des Gens und erlaubt – ähnlich wie bei der Antisense-Methode - Rückschlüsse auf die Genfunktion. Man spricht von Knock-down-Genen (in Anlehnung an die Bezeichnung "Knock-out"-Mutanten) (8). Die Bindung an die dsRNA ist hoch spezifisch
    und erfordert nur 1/1000 der für die Antisense-Technik benötigten Mengen(22). Das allein ist schon ein Hinweis dafür, dass hier ein ganz anderer Mechanismus zugrunde liegen muss. Die RNAi-Methode gewinnt zunehmend an Bedeutung. Ihr Hauptvorteil ist, dass sie automatisierbar ist. Die 21 Nucleotide langen dsRNAs können auf  Chips aufgebracht und die Chips dann mit dem zu untersuchenden Zellmaterial inkubiert  werden. So ist es möglich, an einer 
    Reihe von Zellen die Effekte einer Serie von Gen-Teilabschaltungen 
    gleichzeitig zu untersuchen (23).


    Phänomene müssen definiert und quantifiziert werden

    Automatisierbar oder nicht? Das wird zur alles entscheidenden Fragefür die Verwertbarkeit einer Methode. Im biologischen Geschehen spielen aber qualitativ beschreibbare Phänomene eine wesentliche Rolle. Um auch hier mit Automaten arbeiten zu können, muss eine Kategorisierung der Befunde eingeführt werden, über die man zu quantitativen Aussagen kommen kann. Im Fall der Expressionsprofile wird versucht, für ein Phänomen ein allen Varianten gemeinsames Maß zu finden und die Aktivitätsmuster je nach Abstand zu diesem Maß in Gruppen zu unterteilen. Die durch Definitionen gewonnenen, gruppierten Daten werden dann mit Hilfe von Multivariantstatisik ausgewertet (17).

     
    (1)    L. Stein, Genome annotation: from sequence to biology, Nature Reviews Genetics 
            Bd. 2, S. 493-494 (Juli 2001).(Der Autor ist aus dem Cold Spring Harbor-Labor). 

     (2)  D. Eisenberg, E.M. Marcotte, I. Xenarios u. T.O. Yeates, Protein function in the 
            post-genomic era, Nature, Bd. 405, S. 823-826 (Juni 2000). 

     (3)  S.A. Benner u. E. A. Gaucher, Evolution, language and analogy in functional 
            genomics, Trends in Genetics Bd. 17 S.414-418 Juli 2001. 

    (4)  http://courses.washington.edu/phcol535/data/May16_5.pdf  S. Sato et al. 
          Identification of transcriptional targets for SIX5: implication for the pathogenesis of 
          myotonic dystrophy type 1, Hum. Mol. Genet. Bd.11, S.1045-1058 (2002).

    (5)  C.L. Liquori et al., Myotonic dystrophy type 2 caused by a  CCTG expansion in 
          intron 1 of ZNF9, Science Bd. 293, S. 864-867 (Aug. 2001).

    (6)  Jane Alfred, Myotonic dystrophy comes into focus, Nature Reviews Genetics  
          Bd. 2, S. 736  (Okt. 2001).

    (7)  A. Coghlan `Miracle´jab makes fat mice thin, New Scientist, 5. Aug. 1995, S. 7.

     (8)  S.T. Kim, http://C. elegans: Mining the functional genomic landscape, Nature 
           Reviews Genetics, Bd. 2, S. 681-689 (Sep. 2001). 

     (9)  C. O´Donovan, R. Apweiler u. A. Bairoch, The human proteomics initiative (HPI), 
           Trends in Biotechnology, Bd. 19, S. 178-181 (Mai 2001). 
     

    (10)  S.E. Brenner, Errors in genome annotations, Trends in Genetics, 
          Bd. 15, S. 132-133 (Apr. 1999).

    (11)  D. Devos u. A. Valencia, Intrinsic errors in genome annotation, Trends in  
          Genetics, Bd. 17, S. 429-431 (Aug. 2001).

    (12)  Die Zeit 23.3.2000.

    (13) I. Rabino, How human geneticists in US view commercialization of the Human 
           Genome Project, Nature Genetics, Bd. 29, S. 15-16 (Sep. 2001).

    (14) S. Peri, N. Ibarrola, B. Blagoev, M. Mann u. A. Pandey, Common pitfalls in 
           bioinformatics-based analyses: look before you leap, Trends in Genetics, 
           Bd. 17, S. 541-545 (Sep. 2001).

    (15) K.H.Lee, Proteomics: a technology-driven and technology-limited discovery
            science, Trends in Biotechnology, Bd. 19, S. 217-222 (Juni 2001). 

    (16) A. Abbot, A post-genomic challenge: learning to read patterns of protein 
           synthesis, Nature Bd. 402 S.715-720 (Dez. 1999). 
     

    (17) R. Somogyi, Making sense of gene-expression data, Pharmainformatics, 
           Supplement-Band der "Trend"-Zeitschriften von Elsevier Science Ltd., S. 17-24, 
           1999.  (Der Autor ist von Incyte Pharmaceuticals).

    (18) M.F. Templin et al., Protein microarray technology, Drug Discovery Today, Bd. 7, S.
           815-822 (Aug. 2002).

    (19) S.T. Crooke, Genotypic drug discovery: what does the future hold?, 
           Pharmainformatics, Supplement-Band der "Trend"-Zeitschriften von Elsevier 
           Science, Ltd., S. 10-11, 1999. (Der Autor ist von Isis Pharmaceuticals).

    (20) Zitat aus der FR: Parallelrechnen mit Genen – Amerikanische Forscher entwickeln
           "Biologische Computer", Wechselwirkung Nr.73, Juni 1995, S.73.

    (21) M. Uhlen, Whose genome is it anyway?, Trends in Biotechnology, Bd.13, 
            S.160-16, (Mai 1995).

    (22) Kein Autor Gene gezielt abschalten, Max-Planck-Forschung 3/2001 S.13-14.

    (23) P.D. Zamore, RNA interference: listening to the sound of silence, Nature 
            Structure Biology, Bd.8, S.746-749 (Sep. 2001).


     
    V. Proteomik, die Gesamtheit aller Proteine, ihrer Aktivitäten und Regulationen

    Zum Verständnis der Genfunktionen gehören Kenntnisse über die Beschaffenheit, Aktivität und Wechselwirkungen ihrer Produkte, der Proteine. Das Arbeiten mit Proteinen ist schwerer zu automatisieren als das mit Genen und daher sehr aufwendig.[ mehr ]


    VI. Die Raumstruktur der Proteine

    Die Aufklärung der räumliche Strukturen von Proteinen ist ein ganz entscheidendes Problem der postgenomischen Forschung. Die Kenntnis der räumlichen Beschaffenheit, besonders die der aktiven Zentren und Bindungsstellen, ist unverzichtbar für das ursächliche Verstehen der Funktionen und sie bildet die Grundlage für die Bindung möglicher Wirkstoffe und damit für die neue Art, Medikamente zu entwickeln. Aber gerade hier gibt es Probleme, deren Lösung noch in den Anfängen steckt. 
    [ mehr ]


    VII. Entdeckung von Medikamenten 
    mit den neuen Technologien

    Das Hauptziel aller geschilderter Bemühungen, die Funktion der Gene aufzuklären, ist es, auf eine neue Art Wirkstoffe zu finden, die als Medikamente verwendet werden können. Neu ist dabei in jedem Fall die Art der Suche. Die Wirkstoffe selbst sind generell nicht neuartig. Grundsätzlich geht es darum, auf der Grundlage der Kenntnisse aus der Genomsequenz mit Hilfe automatischer Methoden Substanzen zu finden, die in ein Krankheitsgeschehen eingreifen können. [ mehr ]


    VIII. Wieviel kostet die Entwicklung eines Medikamentes?

    Die angegebenen Kosten für die Entwicklung eines Medikamentes sind 
    astronomisch hoch und steigen weiter an. Aufgrund der letzten Studie vom 
    November 2001 liegen sie bei 802 Mio.$. Verbraucherorganisationen 
    kommen zu anderen Ergebnissen.  [mehr ]
     
     
     


     

    Linde Peters 
    linde.peters@t-online.de
    .
    . .. Erstellt am 26.07.02 / ergänzt am 25.03.03

    auswahl          zurück       weiter      nach oben      home