Prima secvență completă de ADN a unui genom eucariot, cel al drojdiei Saccharomyces cerevisiae, a fost publicată în format electronic în urmă cu mai bine de un an (1). Fără îndoială, fiecare membru al consorțiului internațional de biologi ai drojdiei a adus argumentul către propria agenție de finanțare din Europa, Japonia, Marea Britanie, Canada sau Statele Unite că această drojdie ar fi un excelent „organism model”, util pentru interpretarea și înțelegerea secvențelor de ADN uman. Cât de multă dreptate au avut?
Era clar cu mult înainte de a începe secvențierea sistematică a genomurilor că există gene la drojdie și la mamifere care codifică proteine foarte asemănătoare (2). Unele omologii – inclusiv proteinele sistemelor moleculare (de exemplu, ribozomii și citoscheletele) – nu au fost o surpriză. Cu toate acestea, unele au fost destul de neașteptate. Un exemplu timpuriu deosebit de grăitor a fost descoperirea în drojdie a doi omologi apropiați (RAS1 și RAS2) ai proto-oncogenei ras a mamiferelor; celulele de drojdie lipsite de ambele gene sunt invizibile. În 1985, acest sistem a fost ocazia pentru primul dintre numeroasele teste deliberate de conservare funcțională: Secvența H-ras de mamifere a fost exprimată într-o tulpină de drojdie lipsită de ambele gene RAS, cu rezultatul remarcabil că viabilitatea a fost restabilită, indicând o conservare profundă nu numai a secvenței, ci și a funcției biologice detaliate (3).
Cu întreaga secvență a genomului de drojdie la îndemână, putem estima câte gene de drojdie au omologi importanți la mamifere. Am comparat (4) toate secvențele de proteine din drojdie cu secvențele de mamifere din GenBank . Rezultatul (a se vedea tabelul) este încurajator: Pentru aproape 31 % din toate genele potențial codificatoare de proteine ale drojdiei (cadre de lectură deschise sau ORF), am găsit un omolog robust din punct de vedere statistic printre secvențele de proteine de mamifere (5). Aceasta este în mod clar o subestimare, deoarece bazele de date cu siguranță nu conțin încă secvențele tuturor proteinelor de mamifere sau chiar ale reprezentanților fiecărei familii de proteine. Multe dintre aceste similitudini se referă la domenii individuale, și nu la proteine întregi, reflectând, fără îndoială, amestecul domeniilor funcționale caracteristic evoluției proteinelor.
Tabelul 1
Omologii de mamifere (pe baza valorii P)
Valoarea P | Numărul de ORF-uri la valoarea P sau mai mică |
Percent din totalul ORF-urilor (n = 6223) |
Percent de ORF-uri cu funcție necunoscută |
---|---|---|---|
1 × 10-10 | 1914 | 30.8 | 34 |
1 × 10-20 | 1553 | 25.0 | 30 |
1 × 10-40 | 1083 | 16.8 | 26 |
1 × 10-60 | 784 | 12.6 | 23 |
1 × 10-80 | 576 | 9.3 | 22 |
1 × 10-100 | 442 | 7.1 | 21 |
1 × 10-150 | 221 | 3.6 | 23 |
1 × 10-200 | 101 | 1,6 | 25 |
Chiar dacă S. cerevisiae se numără printre cele mai bine studiate organisme experimentale, 60% din genele sale nu au încă o funcție determinată experimental. Dintre acestea, majoritatea au totuși o anumită similitudine sau un motiv care sugerează posibile funcții, rămânând aproximativ 25% (după numărul real) fără niciun indiciu. În compilarea datelor din tabel, am observat că genele cu homologie cu secvențe de mamifere sunt mult mai puțin susceptibile de a nu se cunoaște nimic experimental despre funcția lor. Doar 34% din întregul set de gene de drojdie cu omologi de mamifere nu au nicio funcție listată în baza de date a genomului Saccharomyces; în comparație cu mai puțin de 25% din genele care au cea mai puternică omologie. Nu cunoaștem motivul pentru acest lucru, deși nu excludem ideea optimistă că biologii din drojdie au reușit să se concentreze asupra celor mai importante gene (cele mai susceptibile de a fi conservate).
Probabilitatea ca o genă umană nou descoperită să aibă un omolog din drojdie cu cel puțin unele informații funcționale despre unul dintre domeniile sale este astfel destul de bună. Manipularea genetică la drojdie este ușoară și ieftină, în timp ce o astfel de manipulare, chiar dacă este posibilă în sistemele mamiferelor, nu este nici ușoară, nici ieftină. Există, în plus, posibilitatea de a exploata compatibilitatea funcțională prin metoda descrisă mai sus pentru genele RAS. Cel puțin 71 de gene umane completează mutațiile din drojdie; este sigur că aceasta este o subestimare (6). Astfel, informațiile despre genele umane învățate prin studierea omologilor lor din drojdie au un preț excelent.
Probabil cele mai bune exemple ale valorii drojdiei ca sistem model se referă la genele bolilor umane care au fost cartografiate prin legătură, clonate pozițional și apoi secvențiate. De obicei, nu se știe nimic despre aceste gene în afară de faptul că moștenirea lor duce la boală. Secvența genei oferă, în general, primul indiciu privind funcția prin intermediul homologiei cu genele altor organisme, de obicei S. cerevisiae (7). Printre cele mai bune corespondențe se numără genele umane care cauzează cancerul de colon ereditar nepolipozant (MSH2 și MLH1 în drojdie), neurofibromatoza de tip 1 (IRA2 în drojdie), ataxia telangiectazie (TEL1 în drojdie) și sindromul Werner (SGS1 în drojdie). Două dintre acestea au povești deosebit de ilustrative.
Cancerele de colon nepolipozice moștenite au un fenotip celular: instabilitatea secvențelor scurte repetate în celulele tumorale. Stimulați de acest rezultat, și chiar înainte ca genele umane să fi fost clonate, cercetătorii din drojdie au izolat mutații în genele de drojdie cu același fenotip (inclusiv mutații în MSH2 și MLHI), prezicând că genele cancerului de colon erau probabil omologii lor (8).
Sindromul Werner este o boală cu mai multe semne distinctive ale îmbătrânirii premature. Din nou, există un fenotip celular, care include o durată de viață redusă în cultură. S-a constatat că secvența genei umane este foarte asemănătoare cu cea a genei SGS1 din drojdie, care codifică o ADN-elicază. La pagina 1313 din acest număr, Sinclair et al. (9) raportează că celulele de drojdie mutantă SGS1 au o durată de viață semnificativ redusă și împărtășesc alte fenotipuri celulare cu celulele provenite de la indivizi cu sindromul Werner.
Așa că drojdia s-a dovedit a fi într-adevăr un „model” util pentru biologia eucariotă. Există o justificare amplă pentru intensificarea eforturilor de determinare a rolurilor funcționale ale celor 60% de gene de drojdie rămase, a căror funcție nu este încă cunoscută. Există, de asemenea, multe motive individuale pentru a acorda și mai multă atenție unor gene precum MSH2 și SGS1. Aceste gene de drojdie pot reprezenta calea cea mai eficientă pentru înțelegerea cancerului de colon și a îmbătrânirii cauzate de mutații în omologii lor umani.