Ensimmäinen eukaryoottigenomin, hiivan Saccharomyces cerevisiae, täydellinen DNA-sekvenssi julkaistiin sähköisessä muodossa yli vuosi sitten (1). Epäilemättä jokainen hiivabiologien kansainvälisen konsortion jäsen esitti omalle rahoituslaitokselleen Euroopassa, Japanissa, Isossa-Britanniassa, Kanadassa tai Yhdysvalloissa väitteen, että tämä hiiva olisi hieno ”malliorganismi”, josta olisi hyötyä ihmisen DNA-sekvenssien tulkinnassa ja ymmärtämisessä. Kuinka oikeassa he olivatkaan?
Olikin selvää jo kauan ennen kuin genomien systemaattinen sekvensointi alkoi, että hiivassa ja nisäkkäissä on geenejä, jotka koodaavat hyvin samanlaisia proteiineja (2). Jotkin homologiat – mukaan lukien molekyylijärjestelmien (esimerkiksi ribosomien ja sytoskelettien) proteiinit – eivät olleet yllätys. Jotkut olivat kuitenkin varsin odottamattomia. Erityisen pysäyttävä varhainen esimerkki oli nisäkkäiden ras-proto-onkogeenin kahden läheisen homologin (RAS1 ja RAS2) löytyminen hiivasta; hiivasolut, joista molemmat geenit puuttuvat, ovat elinkyvyttömiä. Vuonna 1985 tässä järjestelmässä tehtiin ensimmäinen monista toiminnallisen säilymisen tarkoituksellisista testeistä: Nisäkkään H-ras-sekvenssi ekspressoitiin hiivakannassa, josta puuttuivat molemmat RAS-geenit, ja huomattavaa oli, että elinkelpoisuus palautui, mikä osoitti paitsi sekvenssin myös yksityiskohtaisen biologisen toiminnan syvällistä säilymistä (3).
Kun meillä on käytössämme koko hiivan genomin sekvenssi, voimme arvioida, kuinka monella hiivageenillä on merkittäviä nisäkkään homologeja. Vertasimme (4) kaikkia hiivan proteiinisekvenssejä nisäkkäiden sekvensseihin GenBankissa . Tulos (ks. taulukko) on rohkaiseva: Lähes 31 prosentille kaikista hiivan potentiaalisista proteiineja koodaavista geeneistä (avoimet lukukehykset eli ORF:t) löysimme nisäkkäiden proteiinisekvensseistä tilastollisesti vahvan homologin (5). Tämä on selvästi aliarvio, sillä tietokannat eivät varmasti vielä sisällä kaikkien nisäkkäiden proteiinien tai edes jokaisen proteiiniperheen edustajien sekvenssejä. Monet näistä yhtäläisyyksistä liittyvät yksittäisiin domeeneihin eivätkä kokonaisiin proteiineihin, mikä epäilemättä heijastaa proteiinien evoluutiolle ominaista toiminnallisten domeenien sekoittumista.
Taulukko 1
Nisäkkäiden homologit (P-arvon perusteella)
P-arvo | Orf:ien lukumäärä P-arvolla tai sitä alhaisemmalla |
prosenttiosuus kaikista ORF:istä (n = 6223) |
prosenttiosuus ORF:istä , joiden funktio on tuntematon |
---|---|---|---|
1 × 10-10 | 1914 | 30.8 | 34 |
1 × 10-20 | 1553 | 25.0 | 30 |
1 × 10-40 | 1083 | 16.8 | 26 |
1 × 10-60 | 784 | 12.6 | 23 |
1 × 10-80 | 576 | 9.3 | 22 |
1 × 10-100 | 442 | 7.1 | 21 |
1 × 10-150 | 221 | 3.6 | 23 |
1 × 10-200 | 101 | 1.6 | 25 |
Vaikka S. cerevisiae kuuluu parhaiten tutkittuihin koeorganismeihin, 60 %:lla sen geeneistä ei ole vieläkään kokeellisesti määriteltyä toimintaa. Näistä suurimmalla osalla on kuitenkin jonkinlainen samankaltaisuus tai motiivi, joka viittaa mahdollisiin tehtäviin, mutta noin 25 prosentilla (todellisen lukumäärän mukaan) ei ole minkäänlaista vihjettä. Taulukon tietoja kootessamme havaitsimme, että nisäkkäiden sekvensseihin homologiset geenit ovat paljon harvinaisempia, eikä niiden toiminnasta tiedetä kokeellisesti mitään. Vain 34 prosentilla kaikista hiivageeneistä, joilla on nisäkkäiden homologit, ei ole Saccharomyces Genome Database -tietokannassa lueteltua funktiota; verrattuna alle 25 prosenttiin geeneistä, joilla on voimakkain homologia. Emme tiedä syytä tähän, vaikka emme sulje pois optimistista ajatusta siitä, että hiivabiologit ovat onnistuneet keskittymään tärkeimpiin geeneihin (niihin, jotka todennäköisimmin ovat konservoituneita).
Todennäköisyys sille, että vastikään löydetyllä ihmisgeenillä on hiivahomologi, jolla on ainakin jonkinlaista funktionaalista tietoa jostakin sen osa-alueesta, on siis melko hyvä. Geneettinen manipulointi hiivassa on helppoa ja halpaa, kun taas tällainen manipulointi, vaikka se olisi mahdollista nisäkkäiden järjestelmissä, ei ole helppoa eikä halpaa. Lisäksi on mahdollisuus hyödyntää toiminnallista yhteensopivuutta edellä kuvatulla menetelmällä RAS-geenien osalta. Ainakin 71 ihmisen geeniä täydentää hiivamutaatioita; tämä on varmasti aliarvio (6). Näin ollen hiivan homologeja tutkimalla saatava tieto ihmisen geeneistä saa erinomaisen hinnan.
Valvottavasti parhaat esimerkit hiivan arvosta mallijärjestelmänä koskevat ihmisen sairausgeenejä, jotka on kartoitettu linkittämällä, kloonattu ja sitten sekvensoitu. Yleensä näistä geeneistä ei tiedetä muuta kuin se, että niiden periytyminen johtaa sairauteen. Geenin sekvenssi antaa yleensä ensimmäisen vihjeen geenin toiminnasta, koska se on homologinen muiden organismien, yleensä S. cerevisiaen, geenien kanssa (7). Parhaita vastaavuuksia ovat ihmisen geenit, jotka aiheuttavat perinnöllistä ei-polypositiivista paksusuolisyöpää (MSH2 ja MLH1 hiivassa), neurofibromatoosi tyyppi 1 (IRA2 hiivassa), ataksia-telangiektasia (TEL1 hiivassa) ja Wernerin oireyhtymä (SGS1 hiivassa). Kahdella näistä on erityisen havainnolliset tarinat.
Perinnöllisillä nonpolyposis-paksusuolen syövillä on solufenotyyppi: lyhyiden toistuvien sekvenssien epävakaus kasvainsoluissa. Tämän tuloksen innoittamana ja jo ennen kuin ihmisen geenit oli kloonattu, hiivatutkijat eristivät mutaatioita hiivageeneistä, joilla oli sama fenotyyppi (mukaan lukien mutaatiot MSH2:ssa ja MLHI:ssä), ja ennustivat, että paksusuolisyövän geenit olivat todennäköisesti niiden homologeja (8).
Wernerin oireyhtymä on sairaus, jossa on useita ennenaikaisen vanhenemisen tunnusmerkkejä. Jälleen on olemassa solufenotyyppi, johon kuuluu lyhentynyt elinikä viljelyssä. Ihmisen geenin sekvenssin todettiin olevan hyvin samankaltainen hiivan SGS1-geenin kanssa, joka koodaa DNA-helikaasia. Tämän numeron sivulla 1313 Sinclair et al. (9) raportoivat, että SGS1-mutanttien hiivasolujen elinikä on selvästi lyhentynyt ja että niillä on muitakin samoja soluilmiöitä kuin Wernerin oireyhtymää sairastavien henkilöiden soluilla.
Hiiva on siis osoittautunut hyödylliseksi ”malliksi” eukaryoottien biologiassa. On hyvin perusteltua tehostaa ponnisteluja niiden jäljelle jäävien 60 prosentin hiivageenien toiminnallisen roolin määrittämiseksi, joiden toimintaa ei vielä tunneta. On myös monia yksittäisiä syitä kiinnittää vielä enemmän huomiota MSH2:n ja SGS1:n kaltaisiin geeneihin. Nämä hiivageenit saattavat edustaa tehokkainta tietä ymmärtää paksusuolen syöpää ja ikääntymistä, jotka johtuvat mutaatioista niiden ihmisen homologeissa.