Abstract
Alternativ splicing (AS) är en vanlig posttranskriptionell process i eukaryotiska organismer, genom vilken flera olika funktionella transkriptioner produceras från en enda gen. I samband med offentliggörandet av utkastet till det mänskliga genomet avslöjades ett mycket mindre antal gener än väntat. På grund av dess potentiella roll när det gäller att öka proteinmångfalden har intresset för alternativ splicing ökat under det senaste decenniet. Även om nyligen genomförda studier har visat att 94 % av de mänskliga multiexon-generna genomgår AS, är evolutionen av AS och därmed dess potentiella roll för funktionell innovation i eukaryota genomer fortfarande till stor del outforskad. Här granskar vi tillgängliga bevis för evolutionen av förekomsten av AS och dess funktionella roll. Dessutom betonar vi behovet av att korrigera för den starka effekten av transkripttäckning vid upptäckt av AS och lägger fram en strategi för att i slutändan belysa omfattningen av AS roll i funktionell innovation på genomisk skala.
1. Introduktion
Det första utkastet till den mänskliga genomsekvensen avslöjades i februari 2001 och överraskande nog visade det sig att den innehöll ~23000 gener, endast en bråkdel av det antal gener som ursprungligen förutspåddes . För att sätta detta i perspektiv finns det ~20 000 gener i nematoden C. elegans genom. Avsaknaden av ett samband mellan antalet gener och organismens komplexitet har resulterat i ett ökat intresse för alternativ splicing (AS), eftersom det har föreslagits vara en viktig faktor för att öka den regulatoriska och funktionella komplexiteten, proteinmångfalden och organismens komplexitet hos högre eukaryoter . Men trots många forskargruppers ansträngningar förstår vi fortfarande väldigt lite om den faktiska roll som AS spelar i utvecklingen av funktionell innovation – här förstås som uppkomsten av nya funktionella transkript – som ligger till grund för den ökade organismiska komplexitet som observerats.
Alternativ splicing är en posttranskriptionell process i eukaryota organismer genom vilken flera olika transkriptioner produceras från en enskild gen . Tidigare studier med hjälp av sekvenseringsteknik med högt genomflöde har rapporterat att upp till 92 % ~ 94 % av mänskliga multiexongener genomgår AS , ofta på ett vävnads-/utvecklingsstadiespecifikt sätt . I och med utvecklingen och den ständiga förbättringen av transkriptionsprofiler för hela genomet och bioinformatikalgoritmer började det bli tydligt att AS är allestädes närvarande i däggdjursgenomet. Begreppet en gen – ett protein fick ge vika i takt med att bevisen ökade för den höga procentuella förekomsten av AS i icke-mänskliga arter, t.ex. fruktflugor, Arabidopsis och andra eukaryoter, ökade. Trots framstegen i vår förståelse och karakterisering av AS är flera frågor fortfarande obesvarade. För det första har den stora skillnaden i transkripttäckning mellan arter försvårat direkta jämförelser av förekomsten av alternativ splicing i olika arter. För det andra är det oklart, även om jämförbara uppskattningar av AS mellan arter skulle kunna erhållas, i vilken utsträckning förändringar i AS-prevalensen under evolutionen har bidragit till den totala proteinmångfalden eller om de snarare återspeglar brus i splicingen. Slutligen förstår vi mycket lite om hur AS har utvecklats genom tiderna och hur detta är relaterat till genernas funktionella parametrar. Här går vi igenom hur alternativ regleras och de senaste framstegen i vår förståelse av evolutionen av alternativ splicing.
2. Alternativ splicing och dess reglering
År 1977 rapporterade Chow et al. att 5′- och 3′-terminala sekvenser av flera mRNA:er från adenovirus 2 (Ad2) varierade, vilket antyder en ny mekanism för att generera flera olika mRNA:er. Efter denna studie fann man också alternativ splicing i den gen som kodar för sköldkörtelhormonet kalcitonin i däggdjursceller. Senare studier visade att många andra gener också kunde generera mer än ett transkript genom att klippa ut olika sektioner från dess kodande regioner (granskad i ).
Avhängigt av var de exoniska segmenten som klipps ut – eller om introner lämnas kvar – kan splicinghändelser klassificeras i fyra grundläggande typer (figur 1). Dessa fyra huvudtyper av skarvning är (1) exonskipping (2) intronretention (3) alternativ 5′-splicing site (5′ss), och (4) alternativ 3′-splicing site (3′ss) . Dessutom ger ömsesidigt exklusiva exoner, alternativ initiering och alternativ polyadenylering två andra mekanismer för att generera olika isoformer av transkriptet. Dessutom kan olika typer av alternativ splicing förekomma på ett kombinatoriskt sätt och ett exon kan vara föremål för mer än ett alternativt splicingläge, t.ex. 5′ss och 3′ss samtidigt (figur 1). Prevalensen av varje typ av AS har visat sig variera mellan olika taxa. Flera studier har visat att exonskipping är vanligt i metazoers genom medan intronretention är den vanligaste typen av AS bland växter och svampar .
Differentierade typer av alternativ splicing. De blå rutorna är konstitutiva exoner och alternativt splicade regioner i rött. Introner representeras av raka linjer mellan rutorna. Fyra typer av gemensamma splicinghändelser identifierades: (1) exonskipping (2) intronretention (3) alternativ 5′-splicing site (5′ss) och (4) alternativ 3′-splicing site (3′ss).
Alternativ splicing regleras noggrant av cis-element samt av transaktionsfaktorer som binder till dessa cis-element. Transaktörer, huvudsakligen RNA-bindande proteiner, modulerar aktiviteten hos spliceosomen och cis-element som exoniska splicing enhancers (ESEs), exoniska splicing silencers (ESSs), introniska splicing enhancers (ISEs) och introniska splicing silencers (ISSs). Den kanoniska mekanismen för AS tyder på att serin/arginininrika (SR) proteiner vanligtvis binder till ESEs, medan heterogena nukleära ribonukleoproteiner (hnRNP) tenderar att binda till ESSs eller ISSs . Med tanke på dessa regulatorers avgörande roll i splicingmaskineriet är det känt att cis- och transaktande mutationer, som stör splicingkoden, kan orsaka sjukdomar (granskat i ). Man har uppskattat att 15-60 % av mutationerna orsakar sjukdom genom att påverka genernas splicingmönster ( och granskat i ). Dessutom har AS också visat sig regleras utan inblandning av hjälpspliceringsfaktorer och AS kan också kombineras med andra posttranskriptionella händelser, t.ex. användning av flera interna översättningsinitieringsställen, RNA-redigering, nedbrytning av mRNA och bindning av mikroRNA och andra icke-kodande RNA:er , vilket tyder på att det finns ytterligare icke-kanoniska mekanismer för AS som ännu inte har identifierats .
Nyligen har en direkt roll för histonmodifieringar i alternativ splicing rapporterats, där histonmodifiering (H3-K27m3) påverkar splicingresultatet genom att påverka rekryteringen av splicingregulatorer via ett kromatinbindande protein i ett antal humana gener som FGFR2,TPM2,TPM1 och PKM2 . Dessutom har det rapporterats att CTCF-promenerad RNA-polymeras II-paus kopplar DNA-metylering till splicing, vilket ger det första beviset för utvecklingsreglering av splicingresultatet genom ärftliga epigenetiska markeringar . Dessutom har icke-kodande RNA:er också framstått som viktiga bestämningsfaktorer för alternativa splicingmönster . Dessa resultat avslöjar därför ytterligare ett epigenetiskt lager i regleringen av transkription och alternativ splicing . Därför har man föreslagit genomgripande genetiska och epigenetiska studier av minst 100 specifika blodcellstyper, vilket kommer att ge högkvalitativa referensepigenom (med hjälp av DNA-metylering och histonmarkeringar) med detaljerade genetiska och transkriptomdata (sekvensering av hela arvsmassan, RNA-Seq och miRNA-Seq), vilket ger oss en möjlighet att utvärdera epigenetiska faktorers genomgripande inflytande på regleringen av AS i specifika blodcellstyper. Vi förväntar oss att framväxten av komparativ epigenetik kommer att ge ett annat perspektiv på transkriptomens utveckling.
3. Identifiering av alternativa splicinghändelser
Alternativ splicing är svår att uppskatta enbart utifrån genomiska parametrar . Ett antal regleringsmotiv för AS har upptäckts, men närvaron av kända motiv för alternativ splicing garanterar inte att en gen faktiskt är alternativt splicad . Därför bedöms alternativa splicingmönster i allmänhet genom att man undersöker transkriptdata. För varje gen av intresse kan alternativa splicinghändelser identifieras med hjälp av RT-PCR (reverse transcription polymerase chain reaction) som utförs på ett komplementärt DNA-bibliotek (cDNA). Under det senaste decenniet har det i takt med att transkriptomtekniken med hög genomströmning har förbättrats blivit möjligt att bedöma alternativa splicingmönster i hela genomet. Tre huvudkällor för transkriptomdata har använts för att bedöma splicingmönster: uttryckta sekvenstaggar (EST), mikroarrayer för splice-junction och RNA-sekvensering (RNA-Seq).
Den första vågen av genomgripande transkriptomanalyser bestod av direkt sekvensering av cDNA och ESTs som utfördes i stor skala , vilket gjorde det möjligt att identifiera alternativa skarvningshändelser genom att anpassa cDNA/EST-sekvenser till referensgenomet. ESTs är 200-800 nukleotidbaser långa, oredigerade, slumpmässigt utvalda single-pass-sekvensavläsningar som härrör från cDNA-bibliotek . För närvarande finns det åtta miljoner ESTs för människor, inklusive cirka en miljon sekvenser från cancervävnader, och cirka 71 miljoner ESTs för cirka 2 000 arter i dbEST . ESTs är dock baserade på Sanger-sekvensering med låg genomströmning och aggregeras över ett stort antal vävnader, utvecklingstillstånd och sjukdomar med hjälp av vitt skilda känslighetsnivåer.
På senare tid har mikroarrayer för skarvkoppling och RNA-Seq använts i allt större utsträckning för att kvantitativt analysera alternativa skarvningshändelser. Splicing microarrays är inriktade på specifika exoner eller exon-exon-övergångar med oligonukleotidprober. Den fluorescerande intensiteten hos enskilda prober avspeglar den relativa användningen av alternativt splicande exoner i olika vävnader och cellinjer . Microarrays med hög densitet för skarvningsövergångar är ett kostnadseffektivt sätt att analysera tidigare kända exoner och alternativa splemhändelser med låg falsk-positivfrekvens. Nackdelen är att det kräver förkunskaper om befintliga AS-varianter och genstrukturer. Till skillnad från RNA-Seq och EST ger mikroarrayer ingen ytterligare sekvensinformation.
RNA-Seq har framstått som en kraftfull teknik för transkriptomanalys på grund av dess förmåga att producera miljontals korta sekvensavläsningar . RNA-Seq-experiment ger djupgående information om det transkriptionella landskapet . Den ständigt ökande ackumulationen av höggenomströmningsdata kommer att fortsätta att ge allt rikare möjligheter att undersöka ytterligare aspekter av AS, t.ex. lågfrekventa AS-händelser samt vävnadsspecifika och/eller utvecklingsspecifika AS-händelser . Tidigare dataset består av RNA-avläsningssekvenser på 50 bp eller mindre, vilket begränsar informationen om kombinationer av AS-händelser i ett enda transkript, men det är troligt att längden på korta avläsningar kommer att fortsätta att öka under det kommande decenniet. Med den ökande kapaciteten för nästa generations sekvensering (RNA-Seq) kommer studiet av alternativ spicing sannolikt att genomgå en revolution . Den mer djupgående sekvenseringen av transkriptom hos människor och andra arter har ökat vår förståelse för förekomsten av alternativa spicinghändelser och alternativa uttrycksmönster i olika vävnader och utvecklingsstadier.
Transkriptsammansättning av sekvensbaserad teknik, såsom ESTs och RNA-Seq, kan använda antingen align-then-assemble eller assemble-then-align, beroende på kvaliteten på referensgenom och sekvensdata . En algoritm kan användas för att upptäcka AS-händelser genom att jämföra olika transkript. Det är dock fortfarande en utmaning att upptäcka isoformer av AS, i motsats till en enda AS-händelse, eftersom korta sekvenser ger lite information om kombinationen av exoner. Flera tillämpningar har utvecklats för sammansättning av transkript och upptäckt av AS-isoformer, olika strategier och jämförelse av dessa tillämpningar har granskats tidigare .
4. Prevalens av alternativ splicing i eukaryotiska genomer
Initiala analyser av hela genomet tydde på att 5-30 % av de mänskliga generna var alternativt splicade (granskad i ). EST-baserade AS-databaser identifierar AS-händelser i 40-60 % av de mänskliga generna ; på senare tid har dock denna siffra reviderats om och om igen och de senaste uppskattningarna visar att upp till 94 % av de mänskliga multiexon-generna producerar mer än ett transkript genom alternativ splicing . Om man förstår hur alternativ splicing har förändrats över tid kan man få insikter om hur alternativ splicing har påverkat transkript- och proteinmångfalden och fenotyputvecklingen. Hos svampar tros AS vara sällsynt på grund av det låga antalet exoner i jäst . I växter har det uppskattats att cirka 20 % av generna genomgår alternativt splicing baserat på EST-data, men en nyligen genomförd studie med hjälp av RNA-Seq tyder dock på att åtminstone cirka 42 % av de introninnehållande generna i Arabidopsis är alternativt splicade . Vi förväntar oss att betydligt högre procentsatser av AS-förekomst kommer att upptäckas från olika eukaryoter med tanke på de djupgående studierna av transkriptom som pågår med hjälp av nästa generations sekvensering, t.ex. RNA-Seq. I ett fåtal studier har man försökt jämföra förekomsten av AS bland olika taxa, där djur generellt sett rapporteras ha högre förekomst av AS än växter och ryggradsdjur högre förekomst av AS än ryggradslösa djur . Dessa studier är dock antingen baserade på begränsade data eller har inte lyckats korrigera för skillnader i transkripttäckning.
Det finns ett antal databaser som tillhandahåller AS-data för flera arter. Dessa befintliga resurser är dock främst inriktade på djurarter och har dålig täckning för protist-, svamp- och växtgenom, vilket gör det svårt att jämföra olika taxa. Viktigast av allt är att ingen av dessa resurser tar hänsyn till de väldokumenterade effekterna av olika transkripttäckning mellan gener inom och mellan arter, vilket i hög grad påverkar AS-detekteringsfrekvensen . Slumpmässig provtagning har använts och visat sig minimera bias av transkripttäckningen (figur 2). Vi förväntar oss att liknande strategier kommer att användas i framtida jämförande AS-dataresurser.
(a)
(b)
(a)
(b)
Det totala antalet transkript påverkar upptäckten av AS, men bias kan korrigeras genom att använda en provtagningsmetod. AS-detektion i gener dividerat med transkripttäckning för nematod (a och b) med hjälp av hela transkriptdatasetet (a) eller en slumpmässig provtagningsmetod (b).
5. Är alternativ splicing funktionell eller mest bara buller?
Om en ökning av AS-nivåerna hos ryggradsdjur jämfört med ryggradslösa djur bekräftas är det, med tanke på begränsningarna i de nuvarande proteomikresurserna, svårt att bedöma i vilken utsträckning alternativt splicade transkript översätts till ett utökat proteom. Utvecklingen av många fenotyper som vi mest förknippar med människan, såsom längre livslängd, encefalisering eller till och med ökad komplexitet, har åtföljts av kraftiga minskningar av den effektiva populationsstorleken, vilket möjligen förklarar spridningen av en mängd olika genomiska egenskaper i mer komplexa organismer ( men se ). Därför är det möjligt att ökad AS genom evolutionen är ett resultat av avvikande splicing och att den därför inte spelar någon funktionell roll . Om den alternativa skarvning har ökat längs det fylogenetiska trädet och den verkligen är funktionell, kan vi förvänta oss följande: (A) Transkript bör ha en låg förekomst av för tidiga stoppkodoner, vilket skulle göra dem sårbara för nonsense-medierat sönderfall. Mellan 4 % och 35 % av AS mänskliga transkript har visat sig innehålla en för tidig stoppkodon i transkript från människa och mus . Dessa transkript har visat sig vara berikade på icke-konserverade exoner som sannolikt kan orsaka ramförskjutningar . Det är okänt om andelen AS-transkript som innehåller förtida stoppkodon har förändrats längs det fylogenetiska trädet. (B) Det har föreslagits att de flesta alternativa isoformer med lågt antal kopior som produceras i mänskliga celler sannolikt är icke-funktionella. En nyligen genomförd studie har visat att även om det går att hitta cancerspecifika varianter av alternativsplicering, så är dessa händelser mestadels enstaka kopior och det är därför osannolikt att de bidrar till cancertranskriptomet .(C) Bevarandet av alternativa spliceringshändelser längs evolutionen kan ses som en indikator på deras funktionella roll. Bevarandegraderna av AS har studerats hos många arter. Uppskattningen varierar från 11 % till 67 % mellan människa och mus . Framför allt tenderar större AS-former att ha högre bevarandegrad jämfört med mindre former. Å andra sidan varierar de bevarade AS-formerna mellan olika AS; till exempel har exonskipping mellan C. elegans och C. briggsae visat sig ha en bevarandegrad på mer än 81 %, jämfört med 28 % för intronretention .(D) Förekomsten av identifierbara funktionella domäner i AS-områden kan också vara en indikator på den funktionella betydelsen av AS-transkript . Såvitt vi vet finns det inga rapporter om förekomsten av funktionella domäner i AS-områden hos modellarter. För att undersöka förekomsten av funktionella domäner i AS-transkript sammanställde vi en uppsättning av 267 996 AS-händelser som erhållits genom analys av 8 315 254 ESTs från normala mänskliga vävnader. Vi fann att cirka 50 % av AS-områdena hos människor innehåller kända funktionella komponenter med hjälp av InterProScan som innehåller 14 tillämpningar för förutsägelse av proteindomäner (figur 3, se metoder i ), vilket tyder på en möjlig funktionell roll för AS. Omfattningen av variationerna i förekomsten av funktionella domäner bland AS-områden mellan arter återstår att utforska, men skulle ge ytterligare insikter om evolutionen av AS.
Procentuell andel av AS-områden som innehåller identifierbara funktionella domäner, sekundärstrukturer och stoppkodoner hos människa. Funktionella komponenter identifierades med hjälp av InterProScan som innehåller 14 program för förutsägelse av proteindomäner , inklusive Pfam för förutsägelse av proteindomäner , SignalP 3.0 för förutsägelse av signalpeptider och TMHMM för förutsägelse av transmembrandomäner. PSORT II användes för att identifiera den sannolika subcellulära lokaliseringen av proteinprodukter. Sekundära proteinstrukturer förutsades av CLC Main Workbench 5.7, som bygger på extraherade proteinsekvenser från proteindatabanken (http://www.rcsb.org/pdb/).
Tillsammantaget tyder ovanstående observationer på att även om alternativa splicing-händelser faktiskt är bevarade genom hela evolutionen så är en betydande andel av dem det inte, och en del av dem kan vara ett resultat av brusande transkriptsplicing som inte bidrar till proteinpoolen. Innan ytterligare studier som använder jämförbara AS-index är det dock omöjligt att uppskatta i vilken utsträckning ökningar av AS-nivåer längs det fylogenetiska trädet har påverkat poolen av funktionella transkript.
6. Alternativ splicing och genduplikation
Genduplikation (GD) anses vara en viktig källa till funktionell innovation i genomet. Nyligen duplicerade gener kan utveckla funktionell divergens , och det anses vara nyckeln till att driva utvecklingen av utvecklingsmässig och morfologisk komplexitet hos ryggradsdjur . Alternativ splicing, som är en vanlig mekanism som också ökar proteindiversiteten, har föreslagits som en potentiell aktör i evolutionen av eukaryoter . Genom att undersöka förhållandet mellan genduplicering och alternativ splicing kan vi bättre förstå i vilken utsträckning de båda mekanismerna är likvärdiga medel för diversifiering av proteiner. Flera studier har rapporterat en negativ korrelation mellan AS och genfamiljens storlek hos människa, mus och mask (tabell 1). Det är lätt att dra slutsatsen att AS och GD är utbytbara och att det finns en universell negativ korrelation från mask till människa. Sambandet mellan de två variablerna är dock i bästa fall marginellt och det är inte konsekvent när man inkluderar singletongener som har en lägre AS-nivå jämfört med multigenfamiljer . Jin et al. föreslog att singletoner har mer evolutionär inskränkning än duplikatgener, vilket försvårar deras AS-isoformtillväxt. I överensstämmelse med denna hypotes fann Lin et al. att singletoner skiljer sig från multigenfamiljer i flera avseenden, vilket tyder på att de har olika evolutionära vägar. Även om vi endast fokuserar på multigene-familjer kan en negativ korrelation mellan AS och genfamiljens storlek förklaras eller vara en biprodukt av att AS och genfamiljens storlek samvarierar med andra faktorer. Till exempel har genålder och förvrängd duplicering föreslagits som förklaring . Denna studie har kastat tvivel över förhållandet mellan AS och GD och den kan faktiskt ge stöd åt förslaget att AS och GD har liten eller ingen likvärdighet när det gäller effekter på proteinsekvens, struktur och funktion . Eftersom de flesta studier har undersökt ett litet antal modellarter är det svårt att bedöma omfattningen av sambandet mellan AS och GD. Dessutom kan snapshotmetoden att jämföra GFS och AS i ett enda genom dölja det verkliga förhållandet mellan AS och GFS.
|
7. Alternativ skarvningens bidrag till funktionell innovation
Alternativ skarvning har hyllats som den saknade informationskällan i genomet som förklarar evolutionen av högre komplexitet trots det nära nog statiska antalet gener hos metazoer under de senaste 800 miljoner åren. Wegmann et al. fann att bredden i genuttrycket är positivt korrelerad med antalet nya transkriptisoformer och föreslog att ökningen av genuttrycksbredden är nödvändig för att förvärva nya transkriptisoformer, vilket skulle kunna upprätthållas genom en ny form av balanserande urval. Dessutom har experimentella och bioinformatiska analyser visat att AS kan generera en mängd olika funktionella mRNA- och proteinprodukter, som uppvisar olika stabilitetsegenskaper, subcellulär lokalisering och funktion samt i specifika stadier i celldifferentiering , könsdifferentiering och utveckling .
Studier av enstaka gener har gett exempel på att alternativ splicing kan leda till funktionella innovationer innan några händelser av genduplikation har ägt rum. Ett sådant exempel är Troponin I (TnI), som spelar en nyckelroll vid muskelkontraktion. I arvsmassan hos ryggradsdjur finns TnI i tre kopior som var och en uttrycks i en annan muskeltyp (skelettmuskulatur, snabb och långsam muskulatur samt hjärtmuskulatur). I Ciona, en av de närmaste släktingarna till ryggradsdjur, finns TnI som en enda gen. Intressant nog producerar Ciona-genen dock tre olika alternativt splicade isoformer som var och en liknar uttrycksprofilen för en av generna hos ryggradsdjuren, vilket tyder på att specialiseringen av TnI-proteinerna för att fungera i varje muskeltyp föregick genduplikationerna . Detta mönster av alternativa splejsningsvarianter i ursprungligen enskilda gener som liknar uttrycksprofiler för gener som senare duplicerats har också hittats i synapsin-2 gener hos tetrapoder och MITF-gener hos teleostfiskarter . Dessa exempel tyder på att alternativ splicing kan vara en mekanism för funktionell innovation som föregår genduplicering genom en av de tre möjliga vägarna (figur 4).
(a) Splicing signal degeneration
(b) Exonisering av icke-kodande DNA eller transposoner
(b) Exonisering av icke-kodande DNA.kodande DNA eller transposoner
(c) Exondubblering och specialisering av isoformer
(a) Splicing signal degeneration(b) Exonisering av icke-kodande DNA eller transposoner
(b) Exonisering av icke-kodande DNA eller transposoner
(c) Exondubbling och specialisering av isoformer
Nya AS-varianter kan ta på sig specialiserade eller nya roller. Nya splicingvarianter kan uppstå genom a) mutationer i exonigenkänningsstället för ett konstitutivt exon och efterföljande förvärv av AS-regulatoriska element. (b) Exonisering av introner eller intronregioner eller transposerbara element med efterföljande förvärv av AS-regulatoriska regioner. Nya proteiner kan interagera med olika proteiner eller lokaliseras i olika subcellulära regioner. (c) Exondubblering och efterföljande specialisering funktionella domäner och AS-regulatoriska regioner. De resulterande specialiserade proteinerna kan ta på sig delroller som är relevanta i olika celltyper eller utvecklingsstadier eller resultera i nya interaktioner och funktioner.
Generna kan också få ytterligare alternativ splicing och reglering efter duplikation tillsammans med komplexiteten hos organsystemen efter divergensen av protochordater och vertebrater. En jämförelse mellan transkriptionsfaktorer Pax-gener hos ryggradsdjur och amphioxus har visat att minst 52 rapporterade alternativa splicinghändelser hos ryggradsdjur jämfört med 23 händelser hos amphioxus . Dessutom har Pax-gener från ryggradsdjur bibehållit de flesta av sina ursprungliga funktioner och även utökat sitt uttryck . Ny alternativ splicing av Pax-gener har visat sig ändra innehållet i den funktionella domänen (t.ex. DNA-bindning) och transaktiveringskapaciteten hos de resulterande proteinprodukterna . Ett nytt alternativt transkript av Pax3 kan till exempel transaktivera en cMET-reporterkonstrukt i mus . Dessa ytterligare isoformer av Pax3 har föreslagits spela en funktionell roll vid förvärvandet av nya roller vid neuralplattan hos ryggradsdjur . På samma sätt har vertebratspecifika AS-händelser av exon 5a i Pax4 och Pax6 kopplats till funktionella roller i utvecklingen av vertebraternas öga . Det är därför rimligt att föreslå hypotesen att alternativ splicing, förutom gendubblering, spelar viktiga roller när det gäller att förvärva nya funktioner som bidrar till organsystemens komplexitet efter att protokordaterna och ryggradsdjuren har divergerat . De potentiella rollerna av den ökande förekomsten av AS hos ryggradsdjur i funktionell innovation kommer till stor del att utforskas i fler genfamiljer eller på genomövergripande nivå i framtiden, vilket kommer att öka vår förståelse för hur AS bidrar till funktionell innovation.
8. Slutsats
Här har vi gått igenom bevis från genomövergripande studier samt möjliga vägar för framtida komparativa studier för potentialen hos alternativ splicing som en källa till funktionell innovation under evolutionen av det eukaryotiska genomet. Även om det nu står klart att AS är vanligt förekommande i det mänskliga genomet, kvarstår fortfarande hinder i bedömningen av hur alternativ splicing har utvecklats genom tiderna. Det främsta hindret är att medan de flesta andra genomiska egenskaper kan mätas eller uppskattas direkt från enbart genomsekvenser, kan inga exakta uppskattningar av alternativ splicing erhållas från genomsekvensanalyser. Förtroendet för tillgången till transkriptsekvenser för att mäta AS tillsammans med den starka bias som beror på ojämn transkripttäckning har försvårat den genomövergripande bedömningen av AS i alla utom några få modellarter och försvårar alla direkta jämförelser mellan arter. Detta har försenat studiet av hur alternativ splicing har utvecklats över tid, hur AS regleras och hur det kan relateras till andra genomiska egenskaper och framför allt till fenotypen. Den ständigt ökande transkriptprofileringen för många fler arter i kombination med användningen av jämförbara indexuppskattningar kommer att göra det möjligt att ta itu med ett antal evolutionära frågor om utvecklingen av AS och dess konsekvenser för utvecklingen av transkriptdiversitet och funktionell innovation.
Intressekonflikter
Författarna deklarerar inga intressekonflikter.
Acknowledgments
Författarna vill tacka Humberto Gutierrez för kommentarer på tidigare versioner av denna artikel. Detta arbete finansierades av UK-China Scholarship for Excellence och University of Bath Research Studentship till L. Chen, ett CONACyT-stipendium till J. M. Tovar-Corona och ett Royal Society Dorothy Hodgkin Research Fellowship, Royal Society Research Grant och Royal Society Research Grant for Fellows till A. O. Urrutia.