Abstract
Az alternatív splicing (AS) egy gyakori poszttranszkripciós folyamat az eukarióta szervezetekben, amelynek során egyetlen génből több különböző funkcionális transzkriptum keletkezik. Az emberi genom tervezetének nyilvánosságra hozatala a vártnál jóval kisebb számú gént tárt fel. A fehérjék diverzitásának bővítésében játszott potenciális szerepe miatt az alternatív splicing iránti érdeklődés az elmúlt évtizedben megnőtt. Bár a közelmúltban végzett vizsgálatok kimutatták, hogy a humán multiexon gének 94%-a AS-en megy keresztül, az AS evolúciója és így az eukarióta genomokban a funkcionális innovációban betöltött potenciális szerepe még nagyrészt feltáratlan. A következőkben áttekintjük az AS elterjedtségének és funkcionális szerepének evolúciójára vonatkozó rendelkezésre álló bizonyítékokat. Emellett hangsúlyozzuk annak szükségességét, hogy korrigálnunk kell a transzkriptek lefedettségének erős hatását az AS kimutatásában, és felvázolunk egy stratégiát, amely végső soron megvilágítja az AS funkcionális innovációban betöltött szerepének mértékét genomi léptékben.
1. Bevezetés
Az emberi genomszekvencia első tervezetét 2001 februárjában mutatták be, és meglepő módon kiderült, hogy ~23000 gént tartalmaz, ami csak töredéke az eredetileg megjósolt génszámnak . Hogy ezt perspektívába helyezzük, a C. elegans fonálféreg genomjában ~20 000 gén található. A génszám és a szervezet komplexitása közötti összefüggés hiánya megnövekedett érdeklődést eredményezett az alternatív splicing (AS) iránt, mivel a magasabb eukarióták szabályozási és funkcionális komplexitásának, fehérjediverzitásának és a szervezet komplexitásának egyik fő tényezőjeként javasolták. Számos kutatócsoport legjobb erőfeszítései ellenére azonban még mindig nagyon keveset tudunk arról, hogy az AS milyen szerepet játszik a funkcionális innováció evolúciójában – itt az új funkcionális transzkriptumok megjelenését értjük alatta -, ami a megfigyelt fokozott szervezeti komplexitás hátterében áll.
Az alternatív splicing egy poszttranszkripciós folyamat az eukarióta szervezetekben, amelynek során egyetlen génből több különböző transzkriptum keletkezik . Korábbi, nagy áteresztőképességű szekvenálási technológiát alkalmazó tanulmányok arról számoltak be, hogy a humán multiexon gének akár 92%~94%-a megy keresztül AS , gyakran szövet/fejlődési stádium-specifikus módon . A teljes genom transzkripciós profilok és bioinformatikai algoritmusok fejlesztésével és folyamatos fejlesztésével kezdett világossá válni az AS mindenütt jelenléte az emlős genomban. Az “egy gén – egy fehérje” koncepció háttérbe szorult, ahogy egyre több bizonyíték gyűlt össze a nem emberi fajokban , például a gyümölcslégyben, az Arabidopsisban és más eukariótákban előforduló AS nagy százalékos előfordulására. Az AS megértésében és jellemzésében elért haladás ellenére számos kérdés megválaszolatlan maradt. Először is, a fajok között a transzkriptek lefedettsége közötti nagy különbség akadályozta az alternatív splicing gyakoriságának közvetlen összehasonlítását a különböző fajokban. Másodszor, még ha a fajok közötti AS becslések összehasonlíthatóak is lennének, nem világos, hogy az AS gyakoriságában az evolúció során bekövetkezett változások milyen mértékben járultak hozzá az általános fehérjediverzitáshoz, vagy inkább a splicing zaját tükrözik. Végül, nagyon keveset tudunk arról, hogy az AS hogyan fejlődött az idők folyamán, és ez hogyan kapcsolódik a gének funkcionális paramétereihez. Itt áttekintjük az alternatív splicing szabályozásának módját és az alternatív splicing evolúciójának megértésében elért legújabb eredményeket.
2. Alternatív splicing és szabályozása
1977-ben Chow és munkatársai arról számoltak be, hogy több adenovírus 2 (Ad2) mRNS 5′ és 3′ terminális szekvenciája változik, ami egy új mechanizmusra utal a több különböző mRNS létrehozására. Ezt a tanulmányt követően alternatív splicinget találtak a pajzsmirigyhormon kalcitonint kódoló génben is emlőssejtekben. Későbbi vizsgálatok kimutatták, hogy számos más gén is képes egynél több transzkriptumot létrehozni a kódoló régiókból különböző szakaszok kivágásával (áttekintve: ).
A kivágott exonikus szakaszok elhelyezkedésétől függően – vagy attól függően, hogy az intronok bent maradnak-e – a splicing eseményeket négy alapvető típusba sorolhatjuk (1. ábra). Ez a négy fő splicing mód a következő: (1) exon kihagyás (2) intron megtartása (3) alternatív 5′ splicing site (5′ss), és (4) alternatív 3′ splicing site (3′ss) . Ezenkívül az egymást kölcsönösen kizáró exonok, az alternatív iniciáció és az alternatív poliadeniláció két további mechanizmust biztosítanak a különböző transzkript izoformák létrehozásához. Ezenkívül az alternatív splicing különböző típusai kombinatorikusan is előfordulhatnak, és egy exon egynél több AS-módusnak is alávethető, például 5′ss és 3′ss egyszerre (1. ábra). Az egyes AS-típusok prevalenciája a különböző taxonok között eltérőnek bizonyult. Számos tanulmány kimutatta, hogy az exon kihagyás gyakori a metazoák genomjaiban, míg a növények és gombák között az intron megtartása a leggyakoribb AS-típus .
Az alternatív splicing különböző típusai. A kék dobozok a konstitutív exonokat, az alternatív splicing régiók pedig pirossal vannak jelölve. Az intronokat a dobozok közötti egyenes vonalak ábrázolják. Négyféle közös splicing eseményt azonosítottunk: (1) exon kihagyás (2) intron megtartás (3) alternatív 5′ splicing site (5′ss), és (4) alternatív 3′ splicing site (3′ss).
Az alternatív splicinget szorosan szabályozzák a cis elemek, valamint az ezekhez a cis elemekhez kötődő transzaktív faktorok. A transzakciós faktorok, főként RNS-kötő fehérjék, modulálják a spliceoszóma és az olyan cisz-elemek aktivitását, mint az exonikus splicing enhancerek (ESE-k), exonikus splicing silencerek (ESS-ek), intronikus splicing enhancerek (ISE-k) és intronikus splicing silencerek (ISS-ek). Az AS kanonikus mechanizmusa szerint a szerin/arginin-gazdag (SR) fehérjék jellemzően az ESE-khez kötődnek, míg a heterogén nukleáris ribonukleoproteinek (hnRNP) inkább az ESS-ekhez vagy ISS-ekhez kötődnek. Tekintettel ezeknek a szabályozóknak a splicing gépezetben betöltött döntő szerepére, a splicing kódot megzavaró cisz- és transzakciós mutációkról ismert, hogy betegséget okoznak (áttekintve: ). Becslések szerint a mutációk 15-60%-a okoz betegséget a gének splicing-mintázatának befolyásolásával ( és áttekintve: ). Ezen túlmenően kimutatták, hogy az AS-t segédsplicing faktorok bevonása nélkül is szabályozzák, és az AS más poszttranszkripciós eseményekkel is kombinálódhat, mint például a többszörös belső transzlációkezdeményező helyek használata, az RNS-szerkesztés, az mRNS-bomlás, a mikroRNS-kötés és más nem kódoló RNS-ek , ami az AS további, még azonosítandó, nem kanonikus mechanizmusainak létezésére utal.
A közelmúltban a hisztonmódosulások közvetlen szerepéről számoltak be az alternatív splicingben, amelyben a hisztonmódosulás (H3-K27m3) befolyásolja a splicing kimenetelét a splicing regulátorok rekrutációjának befolyásolásával egy kromatin-kötő fehérjén keresztül számos emberi génben, mint például az FGFR2,TPM2,TPM1 és PKM2 . Ezenkívül arról számoltak be, hogy a CTCF által elősegített RNS-polimeráz II szüneteltetése összekapcsolja a DNS-metilációt a splicinggel, ami az első bizonyíték a splicing kimenetelének örökletes epigenetikai jelöléseken keresztül történő fejlődési szabályozására . Emellett a nem-kódoló RNS-ek is az alternatív splicing-mintázatok kulcsfontosságú meghatározóinak bizonyultak . Ezért ezek az eredmények egy további epigenetikai réteget tárnak fel a transzkripció és az alternatív splicing szabályozásában . Ezért genomszéles körű genetikai és epigenetikai vizsgálatokat javasoltak legalább 100 specifikus vérsejttípuson , amelyek magas minőségű referencia epigenomokat (DNS-metilációs és hisztonjelek vizsgálatával) biztosítanak részletes genetikai és transzkriptom adatokkal (teljes genom szekvenálás, RNS-Seq és miRNS-Seq), lehetőséget biztosítva számunkra, hogy értékeljük az epigenetikai tényezők genomszéles körű hatását az AS szabályozásában specifikus vérsejttípusokban. Arra számítunk, hogy az összehasonlító epigenetika felemelkedése más perspektívát fog nyújtani a transzkriptom evolúciójáról.
3. Alternatív splicing események azonosítása
Az alternatív splicinget nehéz megbecsülni pusztán genomikai paraméterekből . Számos AS szabályozó motívumot fedeztek fel, de az ismert alternatív splicing motívumok jelenléte nem garantálja, hogy egy gén valóban alternatív splicinggel rendelkezik . Így az alternatív splicing mintázatokat általában a transzkript adatok vizsgálatából értékelik. Bármely érdekes gén esetében az alternatív splicing eseményeket egy komplementer DNS (cDNS) könyvtáron végzett reverz transzkripciós polimeráz láncreakció (RT-PCR) segítségével lehet azonosítani. Az elmúlt évtizedben a nagy áteresztőképességű transzkriptom technológiák fejlődésével lehetővé vált az alternatív splicing-mintázatok genomszintű értékelése. A splicing-mintázatok értékelésére a transzkriptom adatok három fő forrását használták: expresszált szekvenciacímkék (EST), splice-junction microarray-k és RNS-szekvenálás (RNS-Seq).
A genomszintű transzkriptom-elemzés első hulláma a nagy léptékben végzett közvetlen cDNS- és EST-szekvenálásból állt , ami lehetővé tette az alternatív splicing-események azonosítását a cDNS/EST-szekvenciáknak a referencia genomhoz való igazításával. Az EST-k 200-800 nukleotid bázis hosszúságú, nem szerkesztett, véletlenszerűen kiválasztott, cDNS-könyvtárakból származó egymenetes szekvenciaolvasatok. Jelenleg nyolcmillió EST található az emberre vonatkozóan, beleértve körülbelül egymillió rákos szövetekből származó szekvenciát, és körülbelül 71 millió EST található a dbEST-ben körülbelül 2000 fajra vonatkozóan. Az EST-k azonban alacsony áteresztőképességű Sanger-szekvenáláson alapulnak, és a szövetek, fejlődési állapotok és betegségek széles skálájára aggregálódnak, nagyon eltérő érzékenységi szinteket alkalmazva.
A közelmúltban egyre gyakrabban használták a splice-junction microarray-ket és az RNA-Seq-et az alternatív splicing események kvantitatív elemzésére. A splicing microarray-k oligonukleotid szondákkal specifikus exonokat vagy exon-exon csomópontokat céloznak meg. Az egyes szondák fluoreszcens intenzitása tükrözi az alternatív splicing exonok relatív használatát a különböző szövetekben és sejtvonalakban. A nagy sűrűségű splice-junction microarray-k költséghatékony módját jelentik a korábban ismert exonok és AS események vizsgálatának, alacsony hamis pozitív arány mellett. Hátránya, hogy előzetes ismereteket igényel a meglévő AS-változatokról és génszerkezetekről. Ami még fontosabb, hogy az RNA-Seq-től és az EST-től eltérően a microarrays nem nyújtanak további szekvenciainformációt.
Az RNA-Seq a transzkriptom-elemzés hatékony technológiájává vált, mivel több millió rövid szekvenciaolvasás előállítására képes . Az RNA-Seq kísérletek mélyreható információt nyújtanak a transzkripciós tájról . A nagy áteresztőképességű adatok egyre növekvő felhalmozódása továbbra is egyre gazdagabb lehetőségeket fog nyújtani az AS további aspektusainak, például az alacsony gyakoriságú AS-események, valamint a szövetspecifikus és/vagy fejlődésspecifikus AS-események vizsgálatára . A korábbi adathalmazok 50 bp vagy annál kisebb RNS-olvasási szekvenciákból állnak, ami korlátozza az egyetlen transzkriptben lévő AS-események kombinációira vonatkozó információkat, de valószínű, hogy a rövid olvasások hossza a következő évtizedben tovább fog nőni. Az újgenerációs szekvenálás (RNA-Seq) kapacitásának növekedésével az alternatív fűzés vizsgálata valószínűleg forradalmi változásokon fog keresztülmenni . Az emberi és más fajok transzkriptomjainak nagyobb mélységű szekvenálása növelte az AS esemény előfordulásának és az AS expressziós mintázatának megértését a különböző szövetekben , fejlődési szakaszokban .
A szekvencia-alapú technológiák, mint például az EST és az RNS-Seq, transzkript-összeállítása a referencia genom és a szekvenciaadatok minőségétől függően használhatja az align-then-assemble vagy az assemble-then-align . A különböző transzkriptumok összehasonlításával algoritmust lehet alkalmazni az AS esemény észlelésére. Az AS izoformák kimutatása azonban, szemben az egyetlen AS-eseménnyel, még mindig kihívást jelent, mivel a rövid szekvenciák kevés információt szolgáltatnak az exonok kombinációját illetően. Számos alkalmazást fejlesztettek ki a transzkriptek összeállítására és az AS izoformák kimutatására, a különböző stratégiákat és ezen alkalmazások összehasonlítását korábban áttekintettük .
4. Az alternatív splicing elterjedtsége az eukarióta genomokban
A kezdeti teljes genom elemzések szerint az emberi gének 5-30%-a alternatív splicinggel rendelkezik (áttekintve ). Az EST-alapú AS adatbázisok a humán gének 40-60%-ában azonosítanak AS eseményeket ; azonban az utóbbi időben ezt a számot újra és újra felülvizsgálták, a legújabb becslések szerint a humán multiexon gének akár 94%-a egynél több transzkriptumot termel alternatív splicing révén . Az alternatív splicing időbeli változásának megértése betekintést nyújthat abba, hogy az alternatív splicing hogyan hatott a transzkript- és fehérjediverzitásra és a fenotípus evolúciójára . Gombákban az AS-t az élesztőben található exonok alacsony száma miatt ritkának tartják. A növényekben a becslések szerint a gének mintegy 20%-a megy keresztül AS-en az EST-adatok alapján , egy közelmúltbeli, RNA-Seq segítségével végzett tanulmány azonban azt sugallja, hogy az Arabidopsisban az intron-tartalmú gének legalább 42%-a alternatív splicinggel rendelkezik. Arra számítunk, hogy a különböző eukariótákból az AS előfordulásának lényegesen magasabb százalékos arányát fedezik fel, mivel a transzkriptom mélyreható tanulmányozása az újgenerációs szekvenálás, például az RNA-Seq segítségével folyamatban van. Néhány tanulmány megkísérelte összehasonlítani az AS előfordulását a különböző taxonok között: az állatoknál általában magasabb AS előfordulási gyakoriságról számoltak be, mint a növényeknél, és a gerinceseknél magasabb az AS előfordulási gyakorisága, mint a gerincteleneknél . Ezek a tanulmányok azonban vagy korlátozott adatokon alapulnak, vagy nem korrigálták a transzkripciók lefedettségében mutatkozó különbségeket .
Számos olyan adatbázis létezik, amely több fajra vonatkozóan nyújt AS-adatokat . Ezek a meglévő források azonban elsősorban az állatfajokra összpontosítanak, és gyenge lefedettséggel rendelkeznek a protisták, gombák és növények genomjaira, ami megnehezíti az eltérő taxonok összehasonlítását. A legfontosabb, hogy ezen források egyike sem veszi figyelembe a fajon belüli és a fajok közötti eltérő transzkripciós lefedettség jól dokumentált hatásait, ami nagyban befolyásolja az AS kimutatási arányokat . Véletlenszerű mintavételt alkalmaztak, és kimutatták, hogy az minimalizálja a transzkriptek lefedettségének torzítását (2. ábra). Arra számítunk, hogy hasonló stratégiákat fognak alkalmazni a jövőbeli összehasonlító AS-adatforrásokban.
(a)
(b)
(a)
(b)
A teljes transzkriptumszám befolyásolja az AS kimutatását, de a torzítás korrigálható mintavételi módszerrel. AS detektálása génekben osztva a transzkript lefedettséggel a fonálférgek esetében (a és b) a teljes transzkript adathalmaz (a) vagy egy véletlenszerű mintavételi módszer (b) használatával.
5. Az alternatív splicing funkcionális vagy többnyire csak zaj?
Ha a gerinces fajok AS-szintjének növekedése a gerinctelenekhez képest megerősítést nyer, a jelenlegi proteomikai erőforrások korlátai miatt nehéz felmérni, hogy az alternatív splicing transzkriptek milyen mértékben fordítódnak át egy kibővített proteómába. Számos olyan fenotípus evolúcióját, amelyet leginkább az emberhez kötünk, mint például a hosszabb élettartam, az enkefalizáció vagy akár a fokozott komplexitás, az effektív populációméret erőteljes csökkenése kísérte, ami valószínűleg magyarázza a különböző genomiális jellemzők elterjedését a komplexebb szervezetekben ( de lásd ). Ezért lehetséges, hogy a megnövekedett AS az evolúció során az aberráns splicing eredménye, és ezért nem játszik semmilyen funkcionális szerepet . Ha az alternatív splicing a filogenetikai fa mentén növekedett, és valóban funkcionális, akkor a következőket várhatjuk: (A) A transzkripteknek alacsony gyakorisággal kellene tartalmazniuk korai stop kodonokat, ami sebezhetővé tenné őket a nonszensz közvetítésű bomlással szemben. Az AS humán transzkriptumok 4 és 35 %-a között találtak korai terminációs kodont az emberi és egér transzkriptumokban . Úgy találták, hogy ezek a transzkriptek gazdagodtak a nem konzervált exonokban, amelyek valószínűleg kereteltolódásokat okozhatnak. Nem ismert, hogy a korai végkódont tartalmazó AS transzkriptek aránya változott-e a filogenetikai fa mentén.(B) Azt javasolták, hogy az emberi sejtekben termelődő alacsony kópiaszámú alternatív izoformák többsége valószínűleg nem funkcionális . Egy nemrégiben végzett tanulmány kimutatta, hogy bár találhatók rák-specifikus alternatív splicing variánsok, ezek az események többnyire egyetlen kópiát tartalmazó események, és így nem valószínű, hogy hozzájárulnak a rákos transzkriptom magjához .(C) Az alternatív splicing események konzerválódása az evolúció mentén funkcionális szerepük indikátorának tekinthető. Az AS konzervációs szintjeit számos fajban vizsgálták. A becslés 11% és 67% között mozog az ember és az egér között . Figyelemre méltó, hogy a fő AS-formák konzerváltsági szintje általában magasabb, mint a kisebb formáké. Másrészt a konzervált AS-formák különböző AS-ek között változnak; például a C. elegans és a C. briggsae között az exon skipping több mint 81%-os konzerváltsági szintet mutatott, szemben az intron megtartás 28%-ával .(D) Az azonosítható funkcionális domének jelenléte az AS-területeken szintén az AS-transzkriptumok funkcionális jelentőségének mutatója lehet. Legjobb tudomásunk szerint modellfajokban nincsenek beszámolók a funkcionális domének AS-területeken való elterjedtségéről. A funkcionális domének AS-transzkriptekben való jelenlétének vizsgálatához összeállítottunk egy 267 996 AS-eseményből álló halmazt, amelyet normál emberi szövetekből származó 8 315 254 EST elemzéséből nyertünk. Azt találtuk, hogy a humán AS területek mintegy 50%-a tartalmaz ismert funkcionális komponenseket az InterProScan segítségével, amely 14 alkalmazást tartalmaz a fehérjetartományok előrejelzésére (3. ábra, lásd módszerek a ), ami az AS lehetséges funkcionális szerepére utal. A funkcionális domének előfordulási gyakoriságában az AS területek közötti eltérések mértéke a fajok között még feltárásra vár, de további betekintést nyújtana az AS evolúciójába.
Az azonosítható funkcionális doméneket, másodlagos struktúrákat és stop kodonokat tartalmazó AS területek százalékos aránya emberben. A funkcionális komponenseket az InterProScan segítségével azonosítottuk, amely 14 alkalmazást tartalmaz a fehérjetartományok előrejelzésére , beleértve a Pfam-ot a fehérjetartományok előrejelzésére , a SignalP 3.0-t a szignálpeptidek előrejelzésére , és a TMHMM-et a transzmembrán tartományok előrejelzésére. A PSORT II-t a fehérjetermékek valószínű szubcelluláris lokalizációjának azonosítására használtuk. A másodlagos fehérjeszerkezeteket a CLC Main Workbench 5.7 segítségével jósoltuk meg, amely a fehérjeadatbankból (http://www.rcsb.org/pdb/) kinyert fehérjeszekvenciákon alapul.
A fenti megfigyelések együttesen arra utalnak, hogy bár az alternatív splicing-események valóban konzerválódtak az evolúció során, jelentős részük nem, és néhányuk a fehérjeállományhoz nem hozzájáruló zajos transzkript-splicing eredménye lehet. Amíg azonban nem végeznek további, összehasonlítható AS-indexeket használó vizsgálatokat, addig nem lehet megbecsülni, hogy az AS-szintek növekedése a filogenetikai fa mentén milyen mértékben hatott a funkcionális transzkriptek pooljára.
6. Alternatív splicing és génduplikáció
A génduplikációt (GD) a genom funkcionális innovációjának elsődleges forrásának tekintik. Az újonnan duplikált gének funkcionális divergenciát fejleszthetnek , és úgy gondolják, hogy ez kulcsfontosságú a gerincesek fejlődési és morfológiai komplexitásának evolúciójában. Az alternatív splicinget, mint olyan elterjedt mechanizmust, amely szintén növeli a fehérjék diverzitását, az eukarióták evolúciójának potenciális szereplőjeként javasolták . A génduplikáció és az alternatív splicing közötti kapcsolat vizsgálatával jobban megérthetjük, hogy a két mechanizmus mennyire egyenértékű eszköze a fehérjék diverzifikációjának. Számos tanulmány számolt be negatív korrelációról az AS és a géncsalád mérete között emberben, egérben és féregben (1. táblázat). Könnyű arra a következtetésre jutni, hogy az AS és a GD felcserélhető, és a féregtől az emberig általános negatív korreláció áll fenn. A két változó közötti kapcsolat azonban a legjobb esetben is marginális, és nem konzisztens, ha a több génből álló géncsaládokhoz képest alacsonyabb AS-szinttel rendelkező szingleton géneket is figyelembe vesszük . Jin és munkatársai azt feltételezték, hogy a szingletonok evolúciósan jobban beszűkülnek, mint a duplikátumok, ami akadályozza az AS izoforma nyereségüket Ezzel a hipotézissel összhangban Lin és munkatársai azt találták, hogy a szingletonok több szempontból is különböznek a multigén családoktól, ami arra utal, hogy eltérő evolúciós útjuk van. Még ha csak a multigéncsaládokra koncentrálunk is, az AS és a géncsalád mérete közötti negatív korreláció magyarázható vagy mellékterméke lehet az AS és a géncsalád méretének más tényezőkkel való kovarianciája. Például a génkor és az elfogult duplikáció javasolták a magyarázatot . Ez a tanulmány kétségbe vonta az AS és a GD közötti kapcsolatot, és valóban alátámaszthatja azt a javaslatot, hogy az AS és a GD kevéssé vagy egyáltalán nem egyenértékű a fehérjeszekvenciára, szerkezetre és funkcióra gyakorolt hatások tekintetében . Mivel a legtöbb tanulmány kis számú modellfajt vizsgált, nehéz felmérni az AS és a GD közötti kapcsolat mértékét. Ráadásul a GFS és AS egyetlen genomban történő összehasonlításának pillanatfelvételes megközelítése elrejtheti az AS és a GFS közötti valódi kapcsolatot.
|
7. Az alternatív splicing hozzájárulása a funkcionális innovációhoz
Az alternatív splicinget a genomban hiányzó információforrásként üdvözölték, amely a magasabb komplexitás evolúciójáért felelős, annak ellenére, hogy az elmúlt 800 millió évben a metazoáknál a génszám közel statikus volt. Wegmann és munkatársai megállapították, hogy a génexpresszió szélessége pozitívan korrelál az új transzkript izoformák számával, és azt javasolták, hogy a génexpresszió szélességének növekedése elengedhetetlen az új transzkript izoformák megszerzéséhez, amit a kiegyensúlyozó szelekció egy új formája tarthat fenn. Továbbá, kísérleti és bioinformatikai elemzések kimutatták, hogy az AS különböző funkcionális mRNS-eket és fehérjetermékeket hozhat létre, amelyek eltérő stabilitási tulajdonságokat, szubcelluláris lokalizációt és funkciót mutatnak, valamint a sejtdifferenciáció , a nemi differenciálódás és a fejlődés meghatározott szakaszaiban .
Az egygénes vizsgálatok példákat szolgáltattak arra, hogy az alternatív splicing funkcionális innovációhoz vezethet, mielőtt a génduplikáció eseményei bekövetkeztek volna. Az egyik ilyen példa a Troponin I (TnI), amely kulcsszerepet játszik az izomösszehúzódásban. A gerincesek genomjában a TnI három példányban létezik, amelyek mindegyike más-más izomtípusban (vázizom, gyors és lassú, valamint szívizom) fejeződik ki. A Cionában, a gerincesek egyik legközelebbi rokonában a TnI egyetlen génként van jelen. Érdekes módon azonban a Ciona gén három különböző, alternatív módon splicelt izoformát termel, amelyek mindegyike hasonlít a gerincesek egyik génjének expressziós profiljára, ami arra utal, hogy a TnI fehérjéknek az egyes izomtípusokban való működésre való specializálódása megelőzte a génduplikációs eseményeket. Az alternatív splice-változatoknak ezt a mintázatát a később megkettőzött gének expressziós profiljához hasonló, őseredetileg egyetlen génben található alternatív splice-változatokban a tetrapodák szinapszin-2 génjeiben és a teleosztikus halfajok MITF génjeiben is megtalálták. Ezek a példák arra utalnak, hogy az alternatív splicing a funkcionális innováció mechanizmusa lehet a génduplikációs eseményeket megelőzően, a három lehetséges út egyikén keresztül (4. ábra).
(a) Splicing signal degeneráció
(b) Nem kódoló DNS vagy transzpozonok exonizációja.kódoló DNS vagy transzpozonok
(c) Exonok duplikációja és izoformák specializációja
(a) Splicing signal degeneráció
(b) Nem kódoló DNS vagy transzpozonok exonizációja
(c) Exon duplikáció és izoformák specializációja
Az új AS-változatok specializált vagy új szerepeket tölthetnek be. Új splicing-variánsok keletkezhetnek a) egy konstitutív exon felismerőhelyének mutációjából és az AS szabályozó elemek későbbi megszerzéséből. (b) intronok vagy intron régiók vagy transzpozíciós elemek exonizációja, AS szabályozó régiók későbbi megszerzésével. Az új fehérjék kölcsönhatásba léphetnek különböző fehérjékkel vagy különböző szubcelluláris régiókban lokalizálódhatnak. (c) Exonok duplikációja és ezt követő specializáció funkcionális domének és AS szabályozó régiók. Az így létrejövő specializált fehérjék különböző sejttípusokban vagy fejlődési szakaszokban releváns részleges szerepeket vehetnek át, vagy új kölcsönhatásokat és funkciókat eredményezhetnek.
A gének a duplikáció után a szervrendszerek komplexitásával együtt a protochordaták és a gerincesek divergenciája után további alternatív splicinget és szabályozást is nyerhetnek. A transzkripciós faktorok Pax gének összehasonlítása a gerincesekben és a kétéltűekben azt mutatta, hogy legalább 52 bejelentett alternatív splicing eseményt jelentettek a gerincesekben, szemben a 23 eseménnyel a kétéltűekben . Továbbá, a gerincesek Pax génjei megtartották ősi funkcióik nagy részét, és kiterjesztették kifejeződésüket is . Kimutatták, hogy a Pax gének új alternatív splicingje módosítja a funkcionális domén tartalmát (pl. DNS-kötés) és a keletkező fehérjetermékek transzaktivációs kapacitását . Például a Pax3 új alternatív transzkriptje képes transzaktiválni egy cMET riporterkonstrukciót egérben . A Pax3 ezen további izoformáiról azt javasolták, hogy funkcionális szerepet játszanak az új szerepek megszerzésében a gerincesek ideglemezénél . Hasonlóképpen, a Pax4 és Pax6 5a exonjának gerinces-specifikus AS eseményeit a gerincesek szemének fejlődésében betöltött funkcionális szerepekhez kapcsolták . Ezért ésszerű azt a hipotézist felvetni, hogy a génduplikáció mellett az alternatív splicing fontos szerepet játszik a szervrendszerek komplexitásához hozzájáruló új funkciók megszerzésében a protochordaták és a gerincesek divergenciája után . A gerinceseknél az AS növekvő gyakoriságának a funkcionális innovációban betöltött potenciális szerepét a jövőben nagyrészt több géncsaládban vagy genomszintű szinten fogják feltárni, ami tovább fogja bővíteni annak megértését, hogy az AS hogyan járul hozzá a funkcionális innovációhoz.
8. Következtetés
Itt áttekintettük a genomszintű vizsgálatokból származó bizonyítékokat, valamint a jövőbeli összehasonlító vizsgálatok lehetséges útjait az alternatív splicing mint a funkcionális innováció forrása az eukarióta genom evolúciója során. Míg mára világossá vált, hogy az AS elterjedt az emberi genomban, még mindig vannak akadályok annak értékelésében, hogy az alternatív splicing hogyan fejlődött az idők során. A fő akadály abban rejlik, hogy míg a legtöbb más genomiális jellemző közvetlenül mérhető vagy becsülhető pusztán genomiális szekvenciákból, addig az alternatív splicingre vonatkozóan nem lehet pontos becsléseket kapni genomiális szekvenciaelemzésből. A transzkript-szekvenciák elérhetőségének függősége az AS méréséhez, valamint az egyenlőtlen transzkript-lefedettségből adódó erős torzítás akadályozza az AS genomszintű értékelését néhány modellfaj kivételével valamennyi faj esetében, és megnehezíti a fajok közötti közvetlen összehasonlítást. Ez lelassította annak vizsgálatát, hogy az alternatív splicing hogyan fejlődött az idők során, hogyan szabályozódik az AS, és hogyan függhet össze más genomiális jellemzőkkel és – ami a legfontosabb – a fenotípussal. Az egyre növekvő számú fajra vonatkozó transzkript-profilkészítés és az összehasonlítható indexbecslések használata lehetővé teszi számos evolúciós kérdés megválaszolását az AS evolúciójával és annak a transzkriptdiverzitás és a funkcionális innováció evolúciójára gyakorolt hatásával kapcsolatban.
Érdekellentét
A szerzők nem jelentenek be érdekellentétet.
Köszönet
A szerzők köszönetet mondanak Humberto Gutierreznek a tanulmány korábbi változataihoz fűzött megjegyzéseiért. Ezt a munkát a UK-China Scholarship for Excellence és a University of Bath Research Studentship támogatta L. Chen számára, a CONACyT ösztöndíj J. M. Tovar-Corona számára, valamint a Royal Society Dorothy Hodgkin Research Fellowship, a Royal Society Research Grant és a Royal Society Research Grant for Fellows A. O. Urrutia számára.