Abstract
Alternatiivinen pilkkominen (AS) on eukaryoottisten organismien yleinen transkription jälkeinen prosessi, jossa yhdestä geenistä tuotetaan useita erilaisia toiminnallisia transkriptejä. Ihmisen genomiluonnoksen julkaisu paljasti paljon ennakoitua pienemmän määrän geenejä. Koska vaihtoehtoinen pilkkominen voi lisätä proteiinien monimuotoisuutta, kiinnostus vaihtoehtoista pilkkomista kohtaan on lisääntynyt viime vuosikymmenen aikana. Vaikka viimeaikaiset tutkimukset ovat osoittaneet, että 94 prosentissa ihmisen multieksonigeeneistä käytetään AS:ää, AS:n evoluutio ja siten sen mahdollinen rooli eukaryoottisten genomien toiminnallisessa innovaatiossa on vielä suurelta osin tutkimatta. Tässä tarkastelemme saatavilla olevaa näyttöä AS:n yleisyydestä ja toiminnallisesta roolista. Lisäksi korostamme tarvetta korjata transkriptioiden kattavuuden voimakas vaikutus AS:n havaitsemiseen ja esitämme strategian, jonka avulla voidaan lopulta selvittää AS:n roolin laajuus funktionaalisessa innovaatiossa genomin mittakaavassa.
1. Johdanto
Ensimmäinen luonnos ihmisen genomin sekvenssistä julkistettiin helmikuussa 2001, ja yllättäen sen osoitettiin sisältävän ~23000 geeniä, mikä on vain murto-osa alun perin ennustetusta geenien määrästä . Vertailun vuoksi voidaan todeta, että sukkulamato C. elegansin genomissa on ~20 000 geeniä. Yhteyden puuttuminen geenien lukumäärän ja organismin monimutkaisuuden väliltä on lisännyt kiinnostusta vaihtoehtoiseen liittämiseen (AS), koska sen on ehdotettu olevan merkittävä tekijä korkeampien eukaryoottien säätely- ja toiminnallisen monimutkaisuuden, proteiinien monimuotoisuuden ja organismin monimutkaisuuden lisääntymisessä. Monien tutkimusryhmien parhaista ponnisteluista huolimatta ymmärrämme kuitenkin edelleen hyvin vähän siitä, mikä on AS:n todellinen rooli toiminnallisen innovaation evoluutiossa – joka tässä yhteydessä ymmärretään uusien toiminnallisten transkriptien ilmestymisenä – ja joka on havaitun organismin lisääntyneen monimutkaisuuden taustalla.
Vaihtoehtoinen splikointi on eukaryoottisten organismien transkription jälkeinen prosessi, jonka avulla yhdestä geenistä tuotetaan useita erilaisia transkriptejä . Aiemmat tutkimukset, joissa on käytetty korkean läpimenon sekvensointitekniikkaa, ovat raportoineet, että jopa 92 % ~ 94 % ihmisen multieksongeeneistä käy läpi AS:n , usein kudos-/kehitysvaihekohtaisesti. Koko genomin transkriptioprofiloinnin ja bioinformatiikan algoritmien kehittämisen ja jatkuvan parantamisen myötä AS:n yleisyys nisäkkäiden genomissa alkoi tulla selväksi. Yhden geenin ja yhden proteiinin käsite väistyi, kun todisteet AS:n suuresta esiintyvyydestä muissa kuin ihmislajeissa, kuten hedelmäkärpäsessä, arabidopsiksessa ja muissa eukaryooteissa, lisääntyivät. Vaikka AS:n ymmärtämisessä ja karakterisoinnissa on edistytty, useita kysymyksiä on edelleen ratkaisematta. Ensinnäkin suuri ero transkriptien kattavuudessa eri lajien välillä on vaikeuttanut vaihtoehtoisen pilkkomisen esiintyvyyden suoraa vertailua eri lajeissa. Toiseksi, vaikka lajeista saataisiinkin vertailukelpoisia AS-arvioita, on epäselvää, missä määrin AS:n yleisyydessä evoluution aikana tapahtuneet muutokset ovat vaikuttaneet proteiinien yleiseen monimuotoisuuteen vai ovatko ne pikemminkin heijastaneet splicing-kohinaa. Lisäksi tiedämme hyvin vähän siitä, miten AS on kehittynyt ajan myötä ja miten se liittyy geenien toiminnallisiin parametreihin. Seuraavassa käymme läpi, miten vaihtoehtoista pilkkomista säädellään, ja tarkastelemme viimeaikaista edistystä vaihtoehtoisen pilkkomisen evoluution ymmärtämisessä.
2. Vaihtoehtoinen pilkkominen ja sen säätely
Vuonna 1977 Chow ym. raportoivat, että useiden adenovirus 2:n (Ad2) mRNA:iden 5′- ja 3′-terminaaliset sekvenssit erosivat toisistaan, mikä viittasi uuteen mekanismiin, jonka avulla voidaan synnyttää useita toisistaan eroavia mRNA:ita. Tämän tutkimuksen jälkeen myös kilpirauhashormoni kalsitoniinia koodaavassa geenissä havaittiin vaihtoehtoista pilkkoutumista nisäkässoluissa. Myöhemmät tutkimukset osoittivat, että monet muutkin geenit pystyivät tuottamaan useamman kuin yhden transkriptin leikkaamalla pois eri osia koodaavilta alueiltaan (katsaus artikkelissa ).
Splikointitapahtumat voidaan luokitella neljään perustyyppiin sen mukaan, missä eksoniset segmentit leikataan pois – tai jätetäänkö intronit sisälle – jaottelemalla ne neljään perustyyppiin (kuva 1). Nämä neljä pääasiallista splikointitapaa ovat (1) eksonien skippaaminen (2) intronien säilyttäminen (3) vaihtoehtoinen 5′-splikointipaikka (5′ss) ja (4) vaihtoehtoinen 3′-splikointipaikka (3′ss) . Lisäksi toisiaan poissulkevat eksonit, vaihtoehtoinen initiaatio ja vaihtoehtoinen polyadenylaatio tarjoavat kaksi muuta mekanismia erilaisten transkriptioiden isomuotojen tuottamiseksi. Lisäksi erityyppinen vaihtoehtoinen splikointi voi tapahtua kombinatorisesti, ja yhteen eksoniin voi kohdistua useampi kuin yksi AS-tila, esimerkiksi 5′ss ja 3′ss samanaikaisesti (kuva 1). Kunkin AS-tyypin esiintyvyyden on todettu vaihtelevan eri taksonien välillä. Useat tutkimukset ovat osoittaneet, että eksonien skippaaminen on yleistä metazoottien genomissa, kun taas intronien säilyttäminen on yleisin AS-tyyppi kasveilla ja sienillä .
Vaihtoehtoisen pilkkomisen eri tyypit. Siniset laatikot ovat konstitutiivisia eksoneja ja punaisella vaihtoehtoisesti splikoituneet alueet. Intronit on esitetty laatikoiden välissä olevilla suorilla viivoilla. Tunnistettiin neljä erilaista yhteistä splikointitapahtumaa: (1) eksonin skippaus (2) intronin retentio (3) vaihtoehtoinen 5′-splikointikohta (5′ss) ja (4) vaihtoehtoinen 3′-splikointikohta (3′ss).
Alternatiivista splikointia säätelevät tiukasti cis-elementit sekä transaktiotekijät, jotka sitoutuvat näihin cis-elementteihin. Transaktiotekijät, pääasiassa RNA:ta sitovat proteiinit, muokkaavat spliceosomin ja cis-elementtien, kuten eksonisten spleikkauksen tehostajien (ESE), eksonisten spleikkauksen vaimentajien (ESS), intronisten spleikkauksen tehostajien (ISE) ja intronisten spleikkauksen vaimentajien (ISS), toimintaa. AS:n kanonisen mekanismin mukaan seriini-/arginiinirikkaat (SR) proteiinit sitoutuvat tyypillisesti ESE:iin, kun taas heterogeeniset ydinribonukleoproteiinit (hnRNP) sitoutuvat yleensä ESS:iin tai ISS:iin . Koska näillä säätelijöillä on ratkaiseva rooli splikointikoneistossa, cis- ja transaktiomutaatioiden, jotka häiritsevät splikointikoodia, tiedetään aiheuttavan sairauksia (tarkasteltu artikkelissa ). On arvioitu, että 15-60 prosenttia mutaatioista aiheuttaa sairauksia vaikuttamalla geenien splikointimalliin ( ja tarkasteltu artikkelissa ). Lisäksi on osoitettu, että AS:ää säädellään myös ilman aputekijöiden osallistumista, ja AS voi yhdistyä myös muihin transkription jälkeisiin tapahtumiin, kuten useiden sisäisten translaation aloituskohtien käyttöön, RNA:n editointiin, mRNA:n hajoamiseen ja mikroRNA:n sitoutumiseen ja muihin ei-koodaaviin RNA:han , mikä viittaa siihen, että AS:lle on olemassa muitakin ei-kanonisia mekanismeja, joita ei vielä ole tunnistettu.
Viime aikoina on raportoitu histonimodifikaatioiden suorasta roolista vaihtoehtoisessa spleikkauksessa, jossa histonimodifikaatio (H3-K27m3) vaikuttaa spleikkauksen lopputulokseen vaikuttamalla kromatiinia sitovan proteiinin välityksellä spleikkauksen säätelijöiden rekrytoitumiseen useissa ihmisen geeneissä, kuten FGFR2, TPM2, TPM1 ja PKM2 . Lisäksi on raportoitu, että CTCF:n edistämä RNA-polymeraasi II:n tauotus yhdistää DNA-metylaation ja spleikkauksen, mikä on ensimmäinen todiste spleikkaustuloksen kehityksellisestä säätelystä periytyvien epigeneettisten merkkien avulla . Lisäksi ei-koodaavat RNA:t ovat osoittautuneet keskeisiksi vaihtoehtoisten spleikkausmallien määrittäjiksi . Näin ollen nämä havainnot paljastavat epigeneettisen lisäkerroksen transkription ja vaihtoehtoisen pilkkomisen säätelyssä. Tämän vuoksi on ehdotettu genomin laajuisia geneettisiä ja epigeneettisiä tutkimuksia vähintään 100 erityisellä verisolutyypillä , jotka tuottavat korkealaatuisia vertailuepigenomeja (DNA-metylaatio- ja histonimerkkien määrityksiä käyttäen) sekä yksityiskohtaisia geneettisiä ja transkriptomitietoja (koko genomin sekvensointi, RNA-Seq ja miRNA-Seq), mikä antaa meille mahdollisuuden arvioida epigeneettisten tekijöiden genomin laajuista vaikutusta AS:n säätelyyn tietyissä verisolutyypeissä. Odotamme vertailevan epigenetiikan nousun tarjoavan erilaisen näkökulman transkriptomin evoluutioon.
3. Vaihtoehtoisten splikointitapahtumien tunnistaminen
Vaihtoehtoista splikointia on vaikea arvioida pelkkien genomiparametrien perusteella . Useita AS:n säätelymotiiveja on löydetty, mutta tunnettujen vaihtoehtoisten splikointimotiivien esiintyminen ei takaa, että geeni todella on vaihtoehtoisesti splikoitu . Näin ollen vaihtoehtoisia spleikkausmalleja arvioidaan yleensä transkriptiotietojen tarkastelun perusteella. Minkä tahansa kiinnostavan geenin vaihtoehtoiset pilkkoutumistapahtumat voidaan tunnistaa käyttämällä käänteistä transkriptiopolymeraasiketjureaktiota (RT-PCR), joka suoritetaan komplementaarisen DNA:n (cDNA) kirjastosta. Viime vuosikymmenen aikana, kun korkean läpimenon transkriptomitekniikat ovat parantuneet, on tullut mahdolliseksi arvioida vaihtoehtoisia pilkkoutumismalleja koko genomin laajuisesti. Splikointimallien arvioinnissa on käytetty kolmea tärkeintä transkriptomitiedon lähdettä: ilmaistut sekvenssitunnisteet (EST:t), splikointiliitosmikrosarjat ja RNA-sekvensointi (RNA-Seq).
Ensimmäinen genominlaajuisen transkriptomianalyysin aalto koostui suuressa mittakaavassa suoritetusta cDNA:n ja EST:ien suorasta sekvensoinnista , mikä mahdollisti vaihtoehtoisten splikointitapahtumien tunnistamisen kohdistamalla cDNA/EST-sekvenssit referenssigenomiin. EST:t ovat 200-800 nukleotidin pituisia, muokkaamattomia, satunnaisesti valittuja, cDNA-kirjastoista peräisin olevia yksittäisiä sekvenssilukuja. Tällä hetkellä dbEST-tietokannassa on kahdeksan miljoonaa EST-sekvenssiä ihmisestä, joista noin miljoona on peräisin syöpäkudoksista, ja noin 71 miljoonaa EST-sekvenssiä noin 2000 lajista . EST:t perustuvat kuitenkin matalan läpimenon Sanger-sekvensointiin, ja ne on aggregoitu useista eri kudoksista, kehitystiloista ja sairauksista käyttäen hyvin erilaisia herkkyystasoja.
Viime aikoina on käytetty enenevässä määrin liitosmikrosiruja ja RNA-Seq:tä vaihtoehtoisten liitostapahtumien kvantitatiiviseen analysointiin. Splikointimikrosirut kohdistuvat oligonukleotidikoettimilla tiettyihin eksoneihin tai eksoni-eksoni-liitoksiin. Yksittäisten koettimien fluoresenssin intensiteetit heijastavat vaihtoehtoisesti splikoituvien eksonien suhteellista käyttöä eri kudoksissa ja solulinjoissa. Suuritiheyksiset splice-junction-mikrosarjat ovat kustannustehokas tapa tutkia aiemmin tunnettuja eksoneja ja AS-tapahtumia alhaisella väärien positiivisten tulosten määrällä. Haittapuolena on, että se edellyttää ennakkotietoa olemassa olevista AS-varianteista ja geenirakenteista. Vielä tärkeämpää on se, että toisin kuin RNA-Seq ja EST, mikrosarjat eivät anna lisää sekvenssitietoa.
RNA-Seq on noussut tehokkaaksi teknologiaksi transkriptomianalyysissä, koska se pystyy tuottamaan miljoonia lyhyitä sekvenssilukuja . RNA-Seq-kokeet tarjoavat syvällistä tietoa transkriptiomaisemasta . Korkean läpimenotehon datan jatkuvasti lisääntyvä kertyminen tarjoaa jatkossakin yhä monipuolisempia mahdollisuuksia tutkia AS:n muita näkökohtia, kuten matalataajuisia AS-tapahtumia sekä kudos- ja/tai kehityspesifisiä AS-tapahtumia . Aikaisemmat tietokokonaisuudet koostuvat enintään 50 bp:n pituisista RNA-lukusekvensseistä, mikä rajoittaa tietoa AS-tapahtumien yhdistelmistä yksittäisessä transkriptissä, mutta on todennäköistä, että lyhyiden lukusekvenssien pituus kasvaa edelleen seuraavan vuosikymmenen aikana. Seuraavan sukupolven sekvensoinnin (RNA-Seq) kapasiteetin lisääntyessä vaihtoehtoisen maustamisen tutkimus kokee todennäköisesti mullistuksen . Transkriptomien sekvensoinnin suurempi syvyys ihmisessä ja muissa lajeissa on lisännyt ymmärrystämme AS-tapahtumien esiintymisestä ja AS-ekspressiomalleista eri kudoksissa ja kehitysvaiheissa.
Sekvenssipohjaisten tekniikoiden, kuten EST:ien ja RNA-Seq:n, transkriptiokokoonpanossa voidaan käyttää joko align-then-assemble- tai assemble-then-align -menetelmää riippuen referenssigenomin ja sekvenssidatan laadusta . Algoritmia voidaan käyttää AS-tapahtuman havaitsemiseen vertailemalla eri transkriptejä. AS-isoformien havaitseminen yksittäisen AS-tapahtuman sijaan on kuitenkin edelleen haastavaa, koska lyhyet sekvenssit antavat vain vähän tietoa eksonien yhdistelmästä. Transkriptien kokoamiseen ja AS-isoformien havaitsemiseen on kehitetty useita sovelluksia, erilaisia strategioita ja näiden sovellusten vertailua on tarkasteltu aiemmin .
4. Vaihtoehtoisen pilkkoutumisen yleisyys eukaryoottisissa genomeissa
Alun perin koko genomin analyyseissä esitettiin, että 5 % – 30 % ihmisen geeneistä oli vaihtoehtoisesti pilkottuja (tarkasteltu artikkelissa ). EST-pohjaiset AS-tietokannat tunnistavat AS-tapahtumia 40-60 %:ssa ihmisen geeneistä ; viime aikoina tätä lukua on kuitenkin tarkistettu kerta toisensa jälkeen, ja viimeisimmät arviot osoittavat, että jopa 94 % ihmisen monieksonisista geeneistä tuottaa useamman kuin yhden transkriptin vaihtoehtoisen splikoinnin kautta . Ymmärtämällä, miten vaihtoehtoinen pilkkominen on muuttunut ajan myötä, voidaan selvittää, miten vaihtoehtoinen pilkkominen on vaikuttanut transkriptien ja proteiinien monimuotoisuuteen ja fenotyyppien kehittymiseen . Sienissä AS:n uskotaan olevan harvinaista johtuen hiivan eksonien vähäisestä määrästä . Kasveissa on EST-tietojen perusteella arvioitu, että noin 20 prosentissa geeneistä tapahtuu AS , mutta tuoreen RNA-Seq-menetelmää käyttävän tutkimuksen mukaan ainakin noin 42 prosenttia Arabidopsiksen intronia sisältävistä geeneistä on vaihtoehtoisesti splikoituja . Odotamme, että eri eukaryooteista löydetään huomattavasti suurempia osuuksia AS:n esiintymisestä, koska transkriptomin perusteelliset tutkimukset seuraavan sukupolven sekvensoinnin, kuten RNA-Seq:n, avulla ovat käynnissä. Muutamissa tutkimuksissa on pyritty vertailemaan AS:n esiintyvyyttä eri taksonien välillä, ja eläimillä on yleisesti raportoitu olevan suurempi AS:n esiintyvyys kuin kasveilla ja selkärankaisilla suurempi AS:n esiintyvyys kuin selkärangattomilla . Nämä tutkimukset perustuvat kuitenkin joko rajalliseen aineistoon tai niissä ei ole korjattu transkriptioiden kattavuuden eroja.
On olemassa useita tietokantoja, jotka tarjoavat AS-tietoja useista lajeista . Nämä olemassa olevat resurssit keskittyvät kuitenkin ensisijaisesti eläinlajeihin, ja niiden kattavuus protistien, sienten ja kasvien genomien osalta on heikko, mikä vaikeuttaa erilaisten taksonien vertailua. Mikä tärkeintä, mikään näistä resursseista ei ota huomioon hyvin dokumentoituja vaikutuksia, jotka johtuvat geenien erilaisesta transkriptiokattavuudesta lajien sisällä ja lajien välillä, mikä vaikuttaa suuresti AS:n havaitsemisasteeseen. Satunnaisotantaa on käytetty ja sen on osoitettu minimoivan transkriptioiden kattavuuden aiheuttaman harhan (kuva 2). Odotamme, että vastaavia strategioita käytetään tulevissa vertailevissa AS-tietoaineistoissa.
(a)
(b)
(b)
Transkriptien kokonaismäärä vaikuttaa AS:n havaitsemiseen, mutta harhaa voidaan korjata käyttämällä otantamenetelmää. AS:n havaitseminen geeneissä jaettuna transkriptioiden kattavuudella sukkulamadolla (a ja b) käyttäen koko transkriptioaineistoa (a) tai satunnaista otantamenetelmää (b).
5. Onko vaihtoehtoinen splikointi funktionaalista vai enimmäkseen pelkkää kohinaa?
Jos AS-tasojen lisääntyminen selkärankaisten lajeissa selkärangattomiin verrattuna vahvistuu, nykyisten proteomiikan resurssien rajoitukset huomioon ottaen on vaikea arvioida, missä määrin vaihtoehtoisesti splikoidut transkriptit käännetään laajennetuksi proteomiksi. Monien sellaisten fenotyyppien evoluutioon, jotka yhdistämme eniten ihmiseen, kuten pidempi elinikä, enkefalisaatio tai jopa lisääntynyt monimutkaisuus, on liittynyt tehokkaan populaatiokoon jyrkkä pieneneminen, mikä mahdollisesti selittää erilaisten genomisten piirteiden lisääntymisen monimutkaisemmissa organismeissa ( mutta ks. ). Siksi on mahdollista, että AS:n lisääntyminen evoluution myötä johtuu poikkeavasta splikoinnista, eikä sillä siksi ole mitään toiminnallista merkitystä . Jos vaihtoehtoinen splikointi on lisääntynyt fylogeneettistä puuta pitkin ja se on todellakin toiminnallista, voimme odottaa seuraavaa: (A) Transkripteissä pitäisi olla vähän ennenaikaisia stop-kodoneja, mikä tekisi ne alttiiksi nonsense-välitteiselle hajoamiselle. Ihmisen ja hiiren transkripteissä on havaittu 4-35 prosenttia AS-ihmisen transkripteista sisältävän ennenaikaisen lopetuskodonin. Näissä transkripteissa on havaittu olevan runsaasti ei-konservoituneita eksoneja, jotka todennäköisesti aiheuttavat kehyssiirtymiä. Ei tiedetä, onko ennenaikaista lopetuskodonia sisältävien AS-transkriptien osuus muuttunut fylogeneettisen puun varrella.(B) On ehdotettu, että suurin osa ihmisen soluissa tuotetuista alhaisen kopioluvun vaihtoehtoisista isomuodoista on todennäköisesti toimimattomia . Tuore tutkimus on osoittanut, että vaikka syöpäspesifisiä vaihtoehtoisia splikointivariantteja voidaan löytää, nämä tapahtumat esiintyvät useimmiten yhden kopion tapahtumina, ja näin ollen niiden osuus syövän ydintranskriptomissa on epätodennäköinen .(C) Vaihtoehtoisten splikointitapahtumien säilymistä evoluutiossa voidaan pitää indikaattorina niiden toiminnallisesta roolista. AS:n säilyvyystasoja on tutkittu monissa lajeissa. Arvio vaihtelee 11 prosentista 67 prosenttiin ihmisen ja hiiren välillä . Huomattavaa on, että suurilla AS-muodoilla on yleensä korkeampi säilyvyystaso kuin pienillä muodoilla. Toisaalta konservoituneet AS-muodot vaihtelevat eri AS-muotojen välillä; esimerkiksi eksonien skippaus C. elegansin ja C. briggsaen välillä on osoittanut yli 81 %:n konservoituneisuuden tason, kun taas intronien säilyttäminen on osoittanut 28 %:n konservoituneisuuden tason .(D) Tunnistettavissa olevien funktionaalisten alueiden esiintyminen AS-alueilla voi myös olla indikaattori AS-transkriptien toiminnallisesta merkityksestä . Parhaan tietämyksemme mukaan funktionaalisten domeenien esiintyvyydestä AS-alueilla ei ole raportteja mallilajeissa. Tutkiaksemme toiminnallisten alueiden esiintymistä AS-transkripteissa kokosimme 267 996 AS-tapahtuman joukon, joka saatiin analysoimalla 8 315 254 EST:ää ihmisen normaaleista kudoksista. Havaitsimme, että noin 50 prosenttia ihmisen AS-alueista sisältää tunnettuja toiminnallisia komponentteja käyttämällä InterProScan-ohjelmaa, joka sisältää 14 sovellusta proteiinidomeenien ennustamiseen (kuva 3, ks. menetelmät osoitteessa ), mikä viittaa AS:n mahdolliseen toiminnalliseen rooliin. Toiminnallisten domeenien esiintyvyyden vaihtelun laajuus AS-alueiden välillä lajien välillä on vielä tutkimatta, mutta se antaisi lisätietoa AS:n evoluutiosta.
Tunnistettavissa olevia toiminnallisia domeeneja, sekundäärirakenteita ja pysäytyskoodoneja sisältävien AS-alueiden prosenttiosuus ihmisessä. Funktionaaliset komponentit tunnistettiin InterProScan-ohjelmalla, joka sisältää 14 sovellusta proteiinidomeenien ennustamiseen , mukaan lukien Pfam proteiinidomeenien ennustamiseen , SignalP 3.0 signaalipeptidien ennustamiseen ja TMHMM transmembraanidomeenien ennustamiseen. PSORT II:ta käytettiin proteiinituotteiden todennäköisen subcellulaarisen lokalisaation tunnistamiseen. Sekundaariset proteiinirakenteet ennustettiin CLC Main Workbench 5.7 -ohjelmalla, joka perustuu proteiinitietopankista (http://www.rcsb.org/pdb/) poimittuihin proteiinisekvensseihin.
Yllä olevat havainnot viittaavat siihen, että vaikkakin vaihtoehtoiset pilkkoutumistapahtumat ovat todellakin säilyneitä koko evoluution ajan, merkittävä osa niistä ei ole sitä, ja osa niistä saattaa olla seurausta kohinallisesta transkriptipilkkoutumisesta (noisy transcript splicing), joka ei edistä proteiinien määrää. Ennen kuin tehdään lisätutkimuksia, joissa käytetään vertailukelpoisia AS-indeksejä, on kuitenkin mahdotonta arvioida, missä määrin AS-tasojen lisääntyminen fylogeneettisen puun varrella on vaikuttanut funktionaalisten transkriptien pooliin.
6. Vaihtoehtoinen splikointi ja geenien monistuminen
Geenien monistumista (GD) pidetään ensisijaisena funktionaalisen innovaation lähteenä genomissa. Uudet duplikoidut geenit voivat kehittää toiminnallista eroavaisuutta , ja sen uskotaan olevan avainasemassa selkärankaisten kehitys- ja morfologisen monimutkaisuuden evoluution ajamisessa. Vaihtoehtoista splikointia, joka on yleinen mekanismi, joka myös lisää proteiinien monimuotoisuutta, on ehdotettu mahdolliseksi toimijaksi eukaryoottien evoluutiossa . Tarkastelemalla geenien monistumisen ja vaihtoehtoisen pilkkomisen välistä suhdetta voimme ymmärtää paremmin, missä määrin molemmat mekanismit ovat toisiaan vastaavia proteiinien monipuolistumisen keinoja. Useissa tutkimuksissa on raportoitu negatiivinen korrelaatio AS:n ja geeniperheen koon välillä ihmisellä, hiirellä ja madolla (taulukko 1). On helppo päätellä, että AS ja GD ovat keskenään vaihdettavissa ja että negatiivinen korrelaatio on yleinen madosta ihmiseen. Näiden kahden muuttujan välinen suhde on kuitenkin parhaimmillaankin marginaalinen, eikä se ole johdonmukainen, kun mukaan otetaan yksittäiset geenit, joiden AS-taso on alhaisempi verrattuna monigeeniperheisiin . Jin et al. ehdottivat, että singletongeeneillä on enemmän evolutiivista ahtautta kuin duplikaateilla, mikä haittaa niiden AS-isomuodon lisääntymistä Tämän hypoteesin mukaisesti Lin et al. havaitsivat, että singletongeenit eroavat monigeeniperheistä useissa näkökohdissa, mikä viittaa siihen, että niillä on erilaiset evolutiiviset polut. Vaikka keskityttäisiinkin vain monigeeniperheisiin, AS:n ja geeniperheen koon välinen negatiivinen korrelaatio voi selittyä tai olla sivutuote AS:n ja geeniperheen koon kovarianssista muiden tekijöiden kanssa. Selitykseksi on ehdotettu esimerkiksi geenien ikää ja vinoutunutta duplikaatiota . Tämä tutkimus on herättänyt epäilyksiä AS:n ja GD:n välisestä suhteesta, ja se saattaa todellakin antaa tukea ehdotukselle, jonka mukaan AS:llä ja GD:llä on vain vähän tai ei lainkaan samankaltaisia vaikutuksia proteiinien sekvenssiin, rakenteeseen ja toimintaan . Koska useimmissa tutkimuksissa on tutkittu pientä määrää mallilajeja, on vaikea arvioida AS:n ja GD:n välisen yhteyden laajuutta. Lisäksi tilannekohtainen lähestymistapa, jossa GFS:ää ja AS:ää verrataan yhdessä genomissa, saattaa peittää alleen AS:n ja GFS:n välisen todellisen suhteen.
|
7. Vaihtoehtoisen splikoinnin osuus toiminnallisiin innovaatioihin
Vaihtoehtoista splikointia on ylistetty puuttuvaksi genomin tietolähteeksi, joka selittää korkeamman monimutkaisuuden evoluution huolimatta lähes staattisesta geenimäärästä metazoalaisissa viimeisten 800 miljoonan vuoden aikana. Wegmann ym. havaitsivat, että geeniekspression leveys korreloi positiivisesti uusien transkriptioiden isoformien lukumäärän kanssa, ja ehdottivat, että geeniekspression leveyden lisääntyminen on olennaista uusien transkriptioiden isoformien hankkimiseksi, jota voisi ylläpitää uudenlainen tasapainottava valinta. Lisäksi kokeelliset ja bioinformatiikan analyysit ovat osoittaneet, että AS voi tuottaa erilaisia toiminnallisia mRNA- ja proteiinituotteita, joilla on erilaiset stabiilisuusominaisuudet, subcellulaarinen lokalisaatio ja toiminta sekä tietyt vaiheet solujen erilaistumisessa , sukupuolen erilaistumisessa ja kehityksessä .
Yksittäisen geenin tutkimukset ovat tarjonneet esimerkkejä, joissa vaihtoehtoinen pilkkominen voi johtaa toiminnalliseen innovaatiotoimintaan, ennen kuin yhtään geenin monistumistapahtumaa on tapahtunut. Yksi tällainen esimerkki on troponiini I (TnI), jolla on keskeinen rooli lihassupistuksessa. Selkärankaisten genomissa TnI:tä on kolme kopiota, joista jokainen ilmentyy eri lihastyypeissä (luurankolihaksissa, nopeissa ja hitaissa lihaksissa sekä sydänlihaksissa). Cionassa, joka on yksi selkärankaisten lähimmistä sukulaisista, TnI esiintyy yhtenä geeninä. Mielenkiintoista on kuitenkin se, että Cionan geeni tuottaa kolme erilaista vaihtoehtoisesti splikoitunutta isomuotoa, joista jokaisen havaittiin muistuttavan yhden selkärankaisten geenin ilmentymisprofiilia, mikä viittaa siihen, että TnI-proteiinien erikoistuminen toimimaan kussakin lihastyypissä edelsi geenien monistumistapahtumia. Tätä mallia, jossa esi-isiltä peräisin olevien yksittäisten geenien vaihtoehtoiset liitosmuunnokset muistuttavat myöhemmin kahdentuneiden geenien ilmentymisprofiileja, on havaittu myös tetrapodien synapsin-2 -geeneissä ja teleostikalojen MITF-geeneissä . Nämä esimerkit viittaavat siihen, että vaihtoehtoinen pilkkominen voi olla mekanismi, joka mahdollistaa toiminnallisen innovaation ennen geenien kahdentumistapahtumia jollakin kolmesta mahdollisesta reitistä (kuva 4).
(a) Splikointisignaalin degeneroituminen
(b) Ei-koodaavan DNA:n tai transposonien eksonisaatio.koodaavan DNA:n tai transposonien
(c) Eksoniduplikaatio ja isoformien erikoistuminen
(a) Splikointisignaalin rappeutuminen
(b) Koodaamattoman DNA:n tai transposonien eksonisaatio
(c) Eksoniduplikaatio ja isoformien erikoistuminen
Uudet AS-varianttimuodot voivat omaksua erikoistuneita tai uudentyyppisiä tehtäviä. Uudet spleikkausvariantit voivat syntyä a) mutaatioista konstitutiivisen eksonin tunnistuskohdassa ja sitä seuraavasta AS-säätelyelementtien omaksumisesta. (b) intronien tai intronialueiden tai transponoituvien elementtien eksonisaatiosta ja sitä seuraavasta AS-säätelyalueiden omaksumisesta. Uudet proteiinit voivat olla vuorovaikutuksessa eri proteiinien kanssa tai lokalisoitua eri solunalaisille alueille. (c) Eksonien monistuminen ja sitä seuraava erikoistuminen toiminnallisiin domeeneihin ja AS-säätelyalueisiin. Tuloksena olevat erikoistuneet proteiinit voivat omaksua osittaisia rooleja, jotka ovat merkityksellisiä eri solutyypeissä tai kehitysvaiheissa, tai johtaa uusiin vuorovaikutuksiin ja toimintoihin.
Geenit voivat myös edelleen saada vaihtoehtoista pilkkomista ja säätelyä kahdentumisen jälkeen yhdessä elinjärjestelmien monimutkaisuuden kanssa protokordattien ja selkärankaisten erkaantumisen jälkeen. Vertailu transkriptiotekijöiden Pax-geenien välillä selkärankaisissa ja sammakkoeläimissä on osoittanut, että selkärankaisissa on raportoitu ainakin 52 vaihtoehtoista splikointitapahtumaa verrattuna 23 tapahtumaan sammakkoeläimissä . Lisäksi selkärankaisten Pax-geenit ovat säilyttäneet suurimman osan esi-isiensä toiminnoista ja myös laajentaneet ilmentymistään . Pax-geenien uudenlaisen vaihtoehtoisen splikoinnin on osoitettu muuttavan tuloksena syntyvien proteiinituotteiden funktionaalisen domainin sisältöä (esim. DNA:n sitoutuminen) ja transaktivaatiokapasiteettia . Esimerkiksi Pax3:n uusi vaihtoehtoinen transkripti voi transaktivoida cMET-reporttikonstruktiota hiiressä . Näillä Pax3:n lisäisomuodoilla on ehdotettu olevan toiminnallinen rooli uusien roolien omaksumisessa selkärankaisten hermolevyssä . Vastaavasti Pax4:n ja Pax6:n eksoni 5a:n selkärankaspesifiset AS-tapahtumat on yhdistetty toiminnallisiin tehtäviin selkärankaisten silmän kehityksessä . Siksi on perusteltua esittää hypoteesi, että geeniduplikaation lisäksi vaihtoehtoisella splikoinnilla on tärkeä rooli uusien toimintojen omaksumisessa, jotka edistävät elinjärjestelmien monimutkaisuutta protokordiaattien ja selkärankaisten eroamisen jälkeen. AS:n lisääntyvän esiintyvyyden mahdollisia rooleja selkärankaisilla toiminnallisessa innovaatiossa tutkitaan tulevaisuudessa suurelta osin useammissa geeniperheissä tai genomitason tasolla, mikä lisää ymmärrystämme siitä, miten AS edistää toiminnallista innovaatiota.
8. Johtopäätökset
Tässä olemme tarkastelleet todistusaineistoa, joka on saatu genomitason laajuisista tutkimuksista, sekä mahdollisia mahdollisuuksia tuleviin vertaileviin tutkimuksiin vaihtoehtoisen pilkkomisen potentiaalista funktionaalisen innovaation lähteenä eukaryoottisen genomin evoluutiossa. Vaikka nyt on selvää, että AS on yleinen ihmisen genomissa, on edelleen esteitä sen arvioinnissa, miten vaihtoehtoinen pilkkominen on kehittynyt ajan myötä. Suurin este on se, että vaikka useimmat muut genomin ominaisuudet voidaan mitata tai arvioida suoraan pelkistä genomisekvensseistä, genomisekvenssianalyysistä ei voida saada tarkkoja arvioita vaihtoehtoisesta splikoinnista. Riippuvuus transkriptiosekvenssien saatavuudesta AS:n mittaamisessa yhdessä epätasaisen transkriptiokattavuuden aiheuttaman voimakkaan harhan kanssa on vaikeuttanut AS:n genominlaajuista arviointia kaikissa muissa kuin muutamissa mallilajeissa ja vaikeuttaa suoraa vertailua lajien välillä. Tämä on hidastanut sen tutkimista, miten vaihtoehtoinen pilkkominen on kehittynyt ajan mittaan, miten vaihtoehtoista pilkkomista säädellään ja miten se voi liittyä muihin genomin ominaisuuksiin ja ennen kaikkea fenotyyppiin. Yhä lisääntyvä transkriptioprofilointi yhä useammista lajeista yhdistettynä vertailukelpoisten indeksiestimaattien käyttöön mahdollistaa useiden AS:n evoluutioon liittyvien kysymysten tarkastelun ja sen vaikutusten selvittämisen transkriptien monimuotoisuuden ja toiminnallisten innovaatioiden kehittymiseen.
Interesseiden ristiriita
Tekijät eivät ilmoita eturistiriitoja.
Kiitokset
Tekijät haluavat kiittää Humberto Gutierrezia tämän artikkelin aikaisempia versioita koskevista kommenteista. Tämä työ on rahoitettu UK-China Scholarship for Excellence -stipendillä ja Bathin yliopiston tutkimusopiskelijan apurahalla L. Chenille, CONACyT-apurahalla J. M. Tovar-Coronalle ja Royal Societyn Dorothy Hodgkin Research Fellowship -apurahalla, Royal Societyn tutkimusapurahalla ja Royal Societyn tutkimusapurahalla apurahansaajille A. O. Urrutialle.
Hyvinvointistipendillä.