Vor mehr als einem Jahr wurde die erste vollständige DNA-Sequenz eines eukaryontischen Genoms, des der Hefe Saccharomyces cerevisiae, in elektronischer Form veröffentlicht (1). Zweifellos hat jedes Mitglied des internationalen Konsortiums von Hefebiologen gegenüber seiner eigenen Förderorganisation in Europa, Japan, Großbritannien, Kanada oder den Vereinigten Staaten das Argument vorgebracht, dass diese Hefe ein hervorragender „Modellorganismus“ sei, der für die Interpretation und das Verständnis menschlicher DNA-Sequenzen nützlich wäre. Wie recht hatten sie?
Lange bevor die systematische Sequenzierung von Genomen begann, war klar, dass es in Hefe und Säugetieren Gene gibt, die für sehr ähnliche Proteine kodieren (2). Einige Homologien – darunter Proteine molekularer Systeme (z. B. der Ribosomen und des Zytoskeletts) – waren keine Überraschung. Einige waren jedoch völlig unerwartet. Ein besonders aufsehenerregendes frühes Beispiel war die Entdeckung zweier enger Homologe (RAS1 und RAS2) des ras-Proto-Onkogens von Säugetieren in Hefe; Hefezellen, denen beide Gene fehlen, sind nicht lebensfähig. Dieses System war 1985 der Anlass für den ersten von vielen gezielten Tests zur Funktionserhaltung: Die Säugetier-H-ras-Sequenz wurde in einem Hefestamm exprimiert, dem beide RAS-Gene fehlten, mit dem bemerkenswerten Ergebnis, dass die Lebensfähigkeit wiederhergestellt wurde, was auf eine tiefgreifende Erhaltung nicht nur der Sequenz, sondern auch der detaillierten biologischen Funktion hinweist (3).
Mit der gesamten Hefegenomsequenz in der Hand können wir abschätzen, wie viele Hefegene signifikante Säugetierhomologe haben. Wir haben (4) alle Hefeproteinsequenzen mit den Säugetiersequenzen in GenBank verglichen. Das Ergebnis (siehe Tabelle) ist ermutigend: Für fast 31 % aller potenziell proteinkodierenden Gene der Hefe (offene Leserahmen oder ORFs) fanden wir ein statistisch robustes Homolog in den Proteinsequenzen von Säugetieren (5). Dies ist eindeutig eine Unterschätzung, da die Datenbanken sicherlich noch nicht die Sequenzen aller Säugetierproteine oder gar Vertreter jeder Proteinfamilie enthalten. Viele dieser Ähnlichkeiten beziehen sich auf einzelne Domänen und nicht auf ganze Proteine, was zweifellos die für die Proteinevolution charakteristische Umschichtung funktioneller Domänen widerspiegelt.
Tabelle 1
Säugetier-Homologe (basierend auf P-Wert)
P-Wert | Anzahl der ORFs mit P-Wert oder niedriger |
Prozent der gesamten ORFs (n = 6223) |
Prozent der ORFs mit unbekannter Funktion |
---|---|---|---|
1 × 10-10 | 1914 | 30.8 | 34 |
1 × 10-20 | 1553 | 25.0 | 30 |
1 × 10-40 | 1083 | 16.8 | 26 |
1 × 10-60 | 784 | 12.6 | 23 |
1 × 10-80 | 576 | 9.3 | 22 |
1 × 10-100 | 442 | 7.1 | 21 |
1 × 10-150 | 221 | 3.6 | 23 |
1 × 10-200 | 101 | 1,6 | 25 |
Obwohl S. cerevisiae zu den am besten untersuchten Versuchsorganismen gehört, haben 60 % seiner Gene noch keine experimentell ermittelte Funktion. Von diesen haben die meisten jedoch eine gewisse Ähnlichkeit oder ein Motiv, das auf eine mögliche Funktion hindeutet, während etwa 25 % (nach tatsächlicher Zählung) ohne jeden Anhaltspunkt bleiben. Bei der Zusammenstellung der Daten in der Tabelle haben wir festgestellt, dass bei Genen mit Homologie zu Säugetiersequenzen die Wahrscheinlichkeit, dass nichts über ihre Funktion experimentell bekannt ist, deutlich geringer ist. Nur 34 % aller Hefegene mit Säugetierhomologen sind in der Saccharomyces-Genomdatenbank ohne Funktion aufgeführt, verglichen mit weniger als 25 % der Gene mit der stärksten Homologie. Wir kennen den Grund dafür nicht, obwohl wir die optimistische Idee nicht ausschließen, dass es den Hefebiologen gelungen ist, sich auf die wichtigsten Gene zu konzentrieren (diejenigen, die am wahrscheinlichsten konserviert sind).
Die Wahrscheinlichkeit, dass ein neu entdecktes menschliches Gen ein Hefe-Homolog mit zumindest einigen funktionellen Informationen über eine seiner Domänen hat, ist also recht groß. Genetische Manipulationen in Hefe sind einfach und billig, während solche Manipulationen, selbst wenn sie in Säugetiersystemen möglich sind, weder einfach noch billig sind. Darüber hinaus besteht die Möglichkeit, die funktionelle Kompatibilität mit der oben für die RAS-Gene beschriebenen Methode zu nutzen. Mindestens 71 menschliche Gene sind komplementär zu Hefemutationen; dies ist sicher eine Unterschätzung (6). Die Informationen über menschliche Gene, die aus dem Studium ihrer Hefe-Homologe gewonnen werden, haben also einen ausgezeichneten Preis.
Die besten Beispiele für den Wert der Hefe als Modellsystem betreffen menschliche Krankheitsgene, die durch Kopplung kartiert, in ihrer Position kloniert und dann sequenziert wurden. Normalerweise ist über diese Gene nichts weiter bekannt als die Tatsache, dass ihre Vererbung zu einer Krankheit führt. Die Sequenz des Gens liefert in der Regel den ersten Hinweis auf die Funktion durch die Homologie mit den Genen anderer Organismen, in der Regel S. cerevisiae (7). Zu den besten Übereinstimmungen gehören die menschlichen Gene, die hereditären nichtpolypösen Dickdarmkrebs verursachen (MSH2 und MLH1 in Hefe), Neurofibromatose Typ 1 (IRA2 in Hefe), Ataxia telangiectasia (TEL1 in Hefe) und das Werner-Syndrom (SGS1 in Hefe). Zwei davon haben eine besonders anschauliche Geschichte.
Erbliche nichtpolypöse Dickdarmkarzinome haben einen zellulären Phänotyp: Instabilität kurzer, sich wiederholender Sequenzen in den Tumorzellen. Angeregt durch dieses Ergebnis und noch bevor die menschlichen Gene kloniert worden waren, isolierten Hefeforscher Mutationen in Hefegenen mit demselben Phänotyp (einschließlich Mutationen in MSH2 und MLHI) und sagten voraus, dass die Dickdarmkrebsgene wahrscheinlich ihre Homologe sind (8).
Das Werner-Syndrom ist eine Krankheit mit mehreren Merkmalen des vorzeitigen Alterns. Auch hier gibt es einen zellulären Phänotyp, der eine verkürzte Lebensdauer in der Kultur beinhaltet. Es wurde festgestellt, dass die Sequenz des menschlichen Gens große Ähnlichkeit mit der des SGS1-Gens der Hefe aufweist, das für eine DNA-Helikase kodiert. Auf Seite 1313 dieser Ausgabe berichten Sinclair et al. (9), dass SGS1-mutierte Hefezellen eine deutlich verkürzte Lebensdauer haben und andere zelluläre Phänomene mit Zellen von Personen mit Werner-Syndrom teilen.
Hefe hat sich also tatsächlich als nützliches „Modell“ für die eukaryotische Biologie erwiesen. Es gibt genügend Gründe, die Bemühungen zu intensivieren, die funktionelle Rolle der verbleibenden 60% der Hefegene zu bestimmen, deren Funktion noch nicht bekannt ist. Es gibt auch viele individuelle Gründe, Genen wie MSH2 und SGS1 noch mehr Aufmerksamkeit zu schenken. Diese Hefegene könnten den effizientesten Weg zum Verständnis des Dickdarmkrebses und der Alterung darstellen, die durch Mutationen in ihren menschlichen Homologen verursacht werden.