Den første komplette DNA-sekvens af et eukaryotisk genom, nemlig gæren Saccharomyces cerevisiae, blev offentliggjort i elektronisk form for mere end et år siden (1). Der er ingen tvivl om, at hvert medlem af det internationale konsortium af gærbiologer over for sit eget finansieringsorgan i Europa, Japan, Storbritannien, Canada eller USA har fremført det argument, at denne gær ville være en fin “modelorganisme”, der ville være nyttig til at fortolke og forstå menneskelige DNA-sekvenser. Hvor ret havde de?
Det stod klart længe før den systematiske sekventering af genomer begyndte, at der er gener i gær og pattedyr, som koder for meget ens proteiner (2). Nogle homologier – herunder proteiner i molekylære systemer (f.eks. ribosomer og cytoskeletoner) – var ikke overraskende. Nogle var imidlertid helt uventede. Et særligt opsigtsvækkende tidligt eksempel var opdagelsen i gær af to tætte homologer (RAS1 og RAS2) til pattedyrenes ras proto-oncogen; gærceller, der mangler begge gener, er ulevedygtige. I 1985 blev dette system brugt som anledning til den første af mange bevidste test af funktionel bevarelse: Pattedyrenes H-ras-sekvens blev udtrykt i en gærstamme, der manglede begge RAS-gener, med det bemærkelsesværdige resultat, at levedygtigheden blev genoprettet, hvilket viser en dybtgående bevarelse ikke blot af sekvensen, men også af den detaljerede biologiske funktion (3).
Med hele gærgenomsekvensen i hånden kan vi vurdere, hvor mange gærgener der har betydelige homologe fra pattedyrene. Vi sammenlignede (4) alle gærproteinsekvenser med pattedyrsekvenserne i GenBank . Resultatet (se tabellen) er opmuntrende: For næsten 31 % af alle potentielle proteinkodende gener i gær (open reading frames eller ORF’er) fandt vi et statistisk robust homolog blandt pattedyrenes proteinsekvenser (5). Dette er helt klart en undervurdering, da databaserne helt sikkert endnu ikke indeholder sekvenserne af alle pattedyrproteiner eller endog repræsentanter for alle proteinfamilier. Mange af disse ligheder vedrører individuelle domæner og ikke hele proteiner, hvilket utvivlsomt afspejler den omrokering af funktionelle domæner, der er karakteristisk for proteinernes udvikling.
Tabel 1
Pattedyrshomologer (baseret på P-værdi)
P-værdi | Antal ORF’er på P-værdi eller lavere |
Procent af de samlede ORF’er (n = 6223) |
Procent af ORF’er med ukendt funktion |
---|---|---|---|
1 × 10-10 | 1914 | 30.8 | 34 |
1 × 10-20 | 1553 | 25.0 | 30 |
1 × 10-40 | 1083 | 16.8 | 26 |
1 × 10-60 | 784 | 12.6 | 23 |
1 × 10-80 | 576 | 9.3 | 22 |
1 × 10-100 | 442 | 7.1 | 21 |
1 × 10-150 | 221 | 3.6 | 23 |
1 × 10-200 | 101 | 1,6 | 25 |
Selv om S. cerevisiae er blandt de bedst undersøgte forsøgsorganismer, har 60% af dens gener stadig ingen eksperimentelt bestemt funktion. Af disse har størstedelen dog en vis lighed eller et motiv, der tyder på mulige funktioner, mens ca. 25 % (efter faktisk antal) ikke har noget som helst fingerpeg. Ved udarbejdelsen af dataene i tabellen bemærkede vi, at det er langt mindre sandsynligt, at gener med homologi med pattedyrs sekvenser ikke har nogen eksperimentel viden om deres funktion. Kun 34 % af alle gærgener med pattedyrshomologer har ingen funktion opført i Saccharomyces Genome Database; sammenlignet med mindre end 25 % af generne med den stærkeste homologi. Vi kender ikke årsagen til dette, selv om vi ikke udelukker den optimistiske idé, at det er lykkedes gærbiologerne at koncentrere sig om de vigtigste gener (dem, der med størst sandsynlighed er bevaret).
Sandsynligheden for, at et nyopdaget humant gen vil have et gærhomolog med i det mindste nogle funktionelle oplysninger om et af dets domæner, er således ret god. Genetisk manipulation i gær er let og billig, hvorimod en sådan manipulation, selv når den er mulig i pattedyrsystemer, hverken er let eller billig. Der er desuden mulighed for at udnytte funktionel kompatibilitet ved hjælp af den metode, der er beskrevet ovenfor for RAS-generne. Mindst 71 humane gener supplerer gærmutationer; dette er helt sikkert et underestimat (6). Oplysninger om humane gener, som man får kendskab til ved at studere deres gærhomologer, er således til en fremragende pris.
De bedste eksempler på værdien af gær som modelsystem drejer sig formentlig om humane sygdomsgener, som er blevet kortlagt ved hjælp af linkage, positionelt klonet og derefter sekventeret. Normalt ved man intet om disse gener ud over den kendsgerning, at deres nedarvning resulterer i sygdom. Genets sekvens giver som regel det første fingerpeg om funktionen i form af homologi med generne i andre organismer, almindeligvis S. cerevisiae (7). Blandt de bedste matches er de menneskelige gener, der forårsager arvelig ikke-polyposisk tarmkræft (MSH2 og MLH1 i gær), neurofibromatose type 1 (IRA2 i gær), ataxia telangiectasia (TEL1 i gær) og Werner’s syndrom (SGS1 i gær). To af disse har særligt illustrative historier.
Inherited nonpolyposis colon cancers har en cellulær fænotype: ustabilitet af korte gentagne sekvenser i tumorcellerne. Stimuleret af dette resultat, og endnu før de menneskelige gener var blevet klonet, isolerede gærforskere mutationer i gærgener med samme fænotype (herunder mutationer i MSH2 og MLHI) og forudsagde, at tyktarmskræftgenerne sandsynligvis var deres homologer (8).
Werners syndrom er en sygdom med flere kendetegn ved for tidlig aldring. Igen er der en cellulær fænotype, som omfatter en reduceret levetid i kultur. Sekvensen af det menneskelige gen viste sig at være meget lig sekvensen af gærgenet SGS1, som koder for en DNA-helicase. På side 1313 i dette nummer rapporterer Sinclair et al. (9), at SGS1-mutante gærceller har en markant reduceret levetid og deler andre cellulære fænotyper med celler fra personer med Werners syndrom.
Så gær har faktisk vist sig at være en nyttig “model” for eukaryotisk biologi. Der er rigelig grund til at intensivere bestræbelserne på at bestemme de funktionelle roller for de resterende 60% af gærgenerne, hvis funktion stadig ikke er kendt. Der er også mange individuelle grunde til at fokusere endnu mere på gener som MSH2 og SGS1. Disse gærgener kan udgøre den mest effektive vej til at forstå tyktarmskræft og aldring forårsaget af mutationer i deres humane homologer.