Soluissa tarvitaan useita monimutkaisia vaiheita, jotta DNA:n peruspalikoista koostuva perussekvenssi saadaan käännettyä proteiineiksi, jotka sitten toimivat elintärkeiden elintoimintojen kantavina voimina. Koska yhdellä DNA-juosteella koodataan monia erilaisia proteiineja, solu käyttää merkkiaineita tietääkseen, milloin proteiinin valmistus on aloitettava ja milloin se on lopetettava.
Monissa biologian oppikirjoissa sanotaan, että aloituskoodoniksi kutsuttu aloituskoodoni koodaa aina metioniini-nimistä yhdistettä. William Duax, New Yorkin osavaltionyliopistossa Buffalossa työskentelevä rakennebiologi, sanoo kuitenkin, että hänen ryhmänsä uusi tutkimus viittaa siihen, että oppikirjat voivat olla väärässä. Hän esittelee tutkimuksensa American Crystallographic Associationin 66. vuosikokouksessa, joka auttaa 22.-26. heinäkuuta Denverissä, Coloradossa.
”Meillä on runsaasti todisteita siitä, että sadat vanhimmista ribosomiproteiineista alkavat edelleen valiini- tai leusiinikoodilla eikä DNA:ssa ole metioniinikoodonia”, Duax sanoi viitaten proteiineihin, joita löytyy solun peruskomponenteista, joita kutsutaan ribosomeiksi. ”Olemme löytäneet yksiselitteisiä todisteita siitä, että varhaisimmat lajit maapallolla käyttävät edelleen geneettisen koodin alkeellista muotoa, jossa on vain puolet tavanomaisista 64 koodonista”, hän sanoi.
Tulokset ovat ristiriidassa biologien keskuudessa laajalti vallalla olevan uskomuksen kanssa. ”Oppikirjoissa on merkittäviä virheitä. Universaali koodi ei ole universaali, eivätkä kaikki nyt maapallolla elävät lajit käytä Watsonin ja Crickin väittämää ”ajassa jähmettynyttä” koodia”, Duax sanoi. ”Jotkin evoluutiota koskevat perusoletukset ovat virheellisiä.” Duax totesi myös, että tulokset herättävät kysymyksiä joistakin näkökohdista eräässä elämän alkuperää koskevassa hypoteesissa, jota kutsutaan RNA-maailmaksi ja jonka mukaan DNA:n kaltainen ja edelleen soluissa käytetty RNA oli ensimmäinen geneettinen materiaali.
Duax ja hänen ryhmänsä saivat tuloksensa haravoimalla läpi tietokannan, joka sisältää yli 90 miljoonan geenin sekvenssit. Geenit koodaavat proteiineja, ja tutkijat käyttivät uusia tekniikoita tunnistaakseen tarkasti jokaisen proteiiniperheen kaikki jäsenet ja erottaakseen ne kaikista muista perheistä, jotka ovat pysyneet muuttumattomina kolme miljardia vuotta.
Tutkijaryhmä kehitti ohjelmia, joilla voidaan nopeuttaa sellaisten proteiiniperheiden täydellistä taltioimista ja täydellistä kohdentamista, joissa on 25 000 jäsentä ja jotka kattavat kaikki lajit, joiden genomit on ilmoitettu. Näistä täydellisistä linjauksista tutkijat pystyivät tunnistamaan linjauksen konservoituneimpien jäännösten tarkan sijainnin ja toiminnan, eli ne proteiinit, jotka ovat pysyneet samoina pisimpään. Näistä alkuvaiheen proteiineista tutkijat löysivät todisteita siitä, että vanhimmat proteiinit eivät aloita tavanomaisella tavalla tai käytä monia muita proteiinien valmistuksen standardikoodien osia.
Vaikka yhtä yllättävää kuin tutkimus ja sen tulokset on tapa, jolla Duax auttoi rahoittamaan tutkimuksensa. Hän kehitti kolmen viikon kesäkoulun molekulaarisesta bioinformatiikasta ja evoluutiosta erittäin motivoituneille lukiolaisille. Viimeisten kuuden kesän aikana hän on kouluttanut yli 220 opiskelijaa jäljittämään proteiinien koostumuksen ja taittumisen, kaikkien solulajien ja geneettisen koodin alkuperää ja evoluutiota.
Muuttamalla tapaa, jolla tarkastelemme geneettistä koodausta, ja kirjoittamalla oppikirjoja uusiksi Duaxin työllä on sovelluksia geneettisissä hoitomuodoissa, joissa hyödynnetään bakteereiden rakenteellisia yksityiskohtia, jotta voidaan kehittää valikoivia ja sivuvaikutuksiltaan vähäisempiä hoitomuotoja.
Tutkimusryhmän seuraava askel on julkaista työnsä tulokset ja saada palautetta muilta tutkijoilta.
”Jotkut opiskelijoistani ovat olleet ohjelmassa kolme vuotta, ja heillä on jo valmiudet valmistella käsikirjoituksia molekyylievoluution ja rakennetieteen lehtiin lähetettäväksi”, Duax sanoi. Ryhmä on kuitenkin vasta alussa.