De eerste volledige DNA-sequentie van een eukaryotisch genoom, dat van de gist Saccharomyces cerevisiae, werd meer dan een jaar geleden in elektronische vorm vrijgegeven (1). Ongetwijfeld heeft elk lid van het internationale consortium van gistbiologen bij zijn of haar eigen financierende instantie in Europa, Japan, Groot-Brittannië, Canada of de Verenigde Staten het argument aangevoerd dat deze gist een prima “modelorganisme” zou zijn, dat nuttig zou zijn voor het interpreteren en begrijpen van menselijke DNA-sequenties. Hoe gelijk hadden ze?
Het was al lang voor het begin van de systematische sequentiebepaling van genomen duidelijk dat er genen in gist en zoogdieren zijn die coderen voor zeer vergelijkbare eiwitten (2). Sommige homologieën – waaronder eiwitten van moleculaire systemen (bijvoorbeeld de ribosomen en cytoskeletten) – waren geen verrassing. Sommige waren echter zeer onverwacht. Een bijzonder boeiend voorbeeld uit een vroeg stadium was de ontdekking in gist van twee nauwe homologe genen (RAS1 en RAS2) van het zoogdierproto-oncogen ras; gistcellen die beide genen missen, zijn onvruchtbaar. In 1985 was dit systeem de aanleiding voor de eerste van vele doelbewuste tests van functionele instandhouding: De H-ras sequentie van zoogdieren werd tot expressie gebracht in een giststam waarin beide RAS genen ontbraken, met het opmerkelijke resultaat dat de levensvatbaarheid werd hersteld, hetgeen wijst op een diepgaand behoud, niet alleen van sequentie, maar ook van gedetailleerde biologische functie (3).
Met de volledige genoomsequentie van gist in de hand, kunnen we schatten hoeveel gistgenen significante homologs van zoogdieren hebben. We vergeleken (4) alle gist eiwitsequenties met de zoogdiersequenties in GenBank . Het resultaat (zie de tabel) is bemoedigend: Voor bijna 31% van alle potentiële eiwit-coderende genen van gist (open reading frames, of ORF’s) vonden wij een statistisch robuuste homoloog onder de zoogdier eiwit-sequenties (5). Dit is duidelijk een onderschatting, want de databases bevatten zeker nog niet de sequenties van alle zoogdiereiwitten of zelfs maar vertegenwoordigers van elke eiwitfamilie. Veel van deze overeenkomsten hebben betrekking op afzonderlijke domeinen, en niet op hele eiwitten, ongetwijfeld als gevolg van de verschuiving van functionele domeinen die kenmerkend is voor de evolutie van eiwitten.
Tabel 1
Homologen van zoogdieren (op basis van P-waarde)
P-waarde | Aantal ORF’s met P-waarde of lager |
Percentage van totale ORFs (n = 6223) |
Percentage ORFs met onbekende functie |
---|---|---|---|
1 × 10-10 | 1914 | 30.8 | 34 |
1 × 10-20 | 1553 | 25.0 | 30 |
1 × 10-40 | 1083 | 16.8 | 26 |
1 × 10-60 | 784 | 12.6 | 23 |
1 × 10-80 | 576 | 9.3 | 22 |
1 × 10-100 | 442 | 7.1 | 21 |
1 × 10-150 | 221 | 3.6 | 23 |
1 × 10-200 | 101 | 1.6 | 25 |
Ondanks het feit dat S. cerevisiae tot de best best bestudeerde experimentele organismen behoort, heeft 60% van zijn genen nog steeds geen experimenteel vastgestelde functie. Van deze genen vertoont de meerderheid niettemin enige gelijkenis of een motief dat op mogelijke functies wijst, zodat ongeveer 25% (volgens het werkelijke aantal) geen enkele aanwijzing heeft. Bij het samenstellen van de gegevens in de tabel hebben wij vastgesteld dat genen met homologie met sequenties van zoogdieren veel minder vaak niets experimenteels over hun functie bekend hebben. Slechts 34% van alle gistgenen met homologe zoogdiersequenties heeft geen functie in de Saccharomyces Genome Database, vergeleken met minder dan 25% van de genen met de sterkste homologie. We weten niet wat de reden hiervoor is, hoewel we het optimistische idee niet uitsluiten dat gistbiologen erin geslaagd zijn zich te concentreren op de belangrijkste genen (die genen waarvan de kans het grootst is dat ze geconserveerd blijven).
De kans dat een nieuw ontdekt menselijk gen een gisthomoloog heeft met ten minste enige functionele informatie over een van zijn domeinen is dus vrij groot. Genetische manipulatie in gist is gemakkelijk en goedkoop, terwijl een dergelijke manipulatie, zelfs indien mogelijk in zoogdiersystemen, noch gemakkelijk noch goedkoop is. Bovendien bestaat de mogelijkheid om functionele compatibiliteit te exploiteren volgens de methode die hierboven voor de RAS-genen is beschreven. Ten minste 71 menselijke genen complementeren gistmutaties; dit is zeker een onderschatting (6). De beste voorbeelden van de waarde van gist als modelsysteem betreffen menselijke ziektegenen die via linkage in kaart zijn gebracht, positioneel gekloond en vervolgens gesequenced. Meestal is van deze genen niets meer bekend dan het feit dat hun overerving tot ziekte leidt. De sequentie van het gen geeft over het algemeen de eerste aanwijzing voor de functie door middel van homologie met de genen van andere organismen, gewoonlijk S. cerevisiae (7). Tot de beste overeenkomsten behoren de menselijke genen die erfelijke niet-polyposis colonkanker veroorzaken (MSH2 en MLH1 in gist), neurofibromatose type 1 (IRA2 in gist), ataxia telangiectasia (TEL1 in gist) en het syndroom van Werner (SGS1 in gist). Twee van deze hebben bijzonder illustratieve verhalen.
Geërfde niet-polyposis colonkankers hebben een cellulair fenotype: instabiliteit van korte herhaalde sequenties in de tumorcellen. Gestimuleerd door dit resultaat, en nog voordat de menselijke genen waren gekloond, isoleerden gistonderzoekers mutaties in gistgenen met hetzelfde fenotype (waaronder mutaties in MSH2 en MLHI), en voorspelden dat de darmkankergenen waarschijnlijk hun homologen waren (8).
Werner’s syndroom is een ziekte met verschillende kenmerken van vroegtijdige veroudering. Ook hier is er een cellulair fenotype, dat een verkorte levensduur in cultuur omvat. De sequentie van het menselijke gen bleek grote overeenkomst te vertonen met die van het gistgen SGS1, dat codeert voor een DNA helicase. Op blz. 1313 van dit nummer melden Sinclair et al. (9) dat SGS1 gemuteerde gistcellen een duidelijk verkorte levensduur hebben en andere cellulaire fenotypen delen met cellen van individuen met het syndroom van Werner.
Gist is dus inderdaad een nuttig “model” gebleken voor de eukaryotische biologie. Er is voldoende rechtvaardiging voor intensivering van de inspanningen om de functionele rollen van de resterende 60% van de gist genen waarvan de functie nog niet bekend is te bepalen. Er zijn ook veel individuele redenen om nog meer aandacht te besteden aan genen zoals MSH2 en SGS1. Deze gistgenen kunnen de meest efficiënte weg zijn naar het begrijpen van darmkanker en veroudering veroorzaakt door mutaties in hun menselijke homologe genen.