Alternativ splejsning: En potentiel kilde til funktionel innovation i det eukaryote genom

Abstract

Alternativ splejsning (AS) er en almindelig posttranskriptionel proces i eukaryote organismer, hvorved der produceres flere forskellige funktionelle transskriptioner fra et enkelt gen. Udgivelsen af udkastet til det menneskelige genom afslørede et meget mindre antal gener end forventet. På grund af dens potentielle rolle i udvidelsen af proteindiversiteten har interessen for alternativ splejsning været stigende i løbet af det sidste årti. Selv om nylige undersøgelser har vist, at 94 % af de menneskelige multiexongener gennemgår AS, er udviklingen af AS og dermed dens potentielle rolle i forbindelse med funktionel innovation i eukaryote genomer stadig stort set uudforsket. Her gennemgår vi de tilgængelige beviser for udviklingen af AS-prævalens og den funktionelle rolle. Desuden understreger vi behovet for at korrigere for den stærke effekt af transkriptdækning i AS-detektion og opstiller en strategi for i sidste ende at belyse omfanget af AS’ rolle i funktionel innovation på genomisk skala.

1. Indledning

Det første udkast til den menneskelige genomsekvens blev afsløret i februar 2001, og overraskende nok viste det sig at indeholde ~23000 gener, hvilket kun er en brøkdel af det antal gener, der oprindeligt var forudsagt . For at sætte dette i perspektiv er der ~20.000 gener i nematoden C. elegans’ genom. Den manglende sammenhæng mellem antallet af gener og organismens kompleksitet har resulteret i en øget interesse for alternativ splejsning (AS), da det er blevet foreslået, at den er en vigtig faktor i udvidelsen af den regulatoriske og funktionelle kompleksitet, proteindiversiteten og organismens kompleksitet hos højere eukaryoter . Men på trods af mange forskningsgruppers bedste indsats forstår vi stadig meget lidt om den faktiske rolle, som AS spiller i udviklingen af funktionel innovation – her forstået som fremkomsten af nye funktionelle transskriptioner – der understøtter den observerede øgede organismiske kompleksitet.

Alternativ splejsning er en posttranskriptionel proces i eukaryote organismer, hvorved der produceres flere forskellige transskriptioner fra et enkelt gen . Tidligere undersøgelser ved hjælp af højtydende sekventeringsteknologi har rapporteret, at op til 92% ~ 94% af humane multiexongener gennemgår AS , ofte på en vævs-/udviklingsstadie-specifik måde . Med udviklingen og den konstante forbedring af transkriptionsprofilering af hele genomet og bioinformatiske algoritmer begyndte det at blive klart, at AS er allestedsnærværende i pattedyrgenomet. Konceptet om ét gen – ét protein blev afskaffet, efterhånden som der kom beviser for den høje procentdel af AS-forekomst hos ikke-menneskelige arter, såsom frugtfluer, Arabidopsis og andre eukaryoter . På trods af de fremskridt, der er gjort i vores forståelse og karakterisering af AS, er der stadig flere ubesvarede spørgsmål. For det første har den store forskel i transkriptdækning mellem arter vanskeliggjort direkte sammenligninger af forekomsten af alternativ splejsning i forskellige arter . For det andet er det, selv om der kunne opnås sammenlignelige AS-estimater mellem arter, uklart, i hvilket omfang eventuelle ændringer i AS-prævalensen i løbet af evolutionen har bidraget til den samlede proteindiversitet eller snarere afspejler splejsningstøj. Endelig forstår vi meget lidt om, hvordan AS har udviklet sig gennem tiden, og hvordan dette hænger sammen med genernes funktionelle parametre. Her gennemgår vi, hvordan alternativ reguleres, og de seneste fremskridt i vores forståelse af evolutionen af alternativ splejsning.

2. Alternativ splejsning og dens regulering

I 1977 rapporterede Chow et al., at 5′ og 3′ terminale sekvenser af flere adenovirus 2 (Ad2) mRNA’er varierede, hvilket antydede en ny mekanisme for generering af flere forskellige mRNA’er. Efter denne undersøgelse blev der også fundet alternativ splejsning i det gen, der koder for skjoldbruskkirtelhormonet calcitonin i pattedyrceller. Efterfølgende undersøgelser viste, at mange andre gener også var i stand til at generere mere end ét transkript ved at skære forskellige sektioner ud af dets kodningsregioner (gennemgået i ).

Afhængigt af placeringen af de exoniske segmenter, der skæres ud – eller om introner efterlades i – kan splejsning hændelser klassificeres i fire grundlæggende typer (figur 1). Disse fire hovedformer for splejsning er: (1) exonskipping (2) intronretention (3) alternativt 5′-splejsningsted (5′ss) og (4) alternativt 3′-splejsningsted (3′ss) . Derudover udgør gensidigt eksklusive exoner, alternativ initiering og alternativ polyadenylering to andre mekanismer til generering af forskellige transkriptisoformer. Desuden kan forskellige typer af alternativ splejsning forekomme på en kombinatorisk måde, og et exon kan være genstand for mere end én AS-tilstand, f.eks. 5′ss og 3′ss på samme tid (figur 1). Det er blevet konstateret, at prævalensen af hver type AS varierer mellem forskellige taxa. Flere undersøgelser har vist, at exon skipping er almindeligt i metazoers genomer, mens intron retention er den mest almindelige type AS blandt planter og svampe .

Figur 1

Differente typer af alternativ splejsning. De blå bokse er konstitutive exoner og alternativt splejsede regioner med rødt. Introner er repræsenteret ved lige linjer mellem kasser. Der blev identificeret fire typer af almindelige splejsningsevents: (1) exonskipping (2) intronretention (3) alternativt 5′-splejningssted (5′ss) og (4) alternativt 3′-splejningssted (3′ss).

Alternativ splejsning reguleres nøje af cis-elementer samt transaktionsfaktorer, der binder til disse cis-elementer. Transacting-faktorer, hovedsagelig RNA-bindende proteiner, modulerer aktiviteten af spliceosomet og cis-elementer såsom exoniske splejsningforstærkere (ESE’er), exoniske splejsningssilensere (ESS’er), introniske splejsningforstærkere (ISE’er) og introniske splejsningssilensere (ISS’er). Den kanoniske mekanisme for AS tyder på, at serin/argininin-rige (SR) proteiner typisk binder sig til ESE’er, mens heterogene nukleare ribonukleoproteiner (hnRNP) har tendens til at binde sig til ESS’er eller ISS’er . I betragtning af disse regulatorers afgørende roller i splejsningsapparatet er cis- og transaktuelle mutationer, som forstyrrer splejsningskoden, kendt for at forårsage sygdom (gennemgået i ). Det er blevet anslået, at 15-60 % af mutationerne forårsager sygdom ved at påvirke genernes splejsningsmønster ( og gennemgået i ). Desuden er AS også blevet vist at blive reguleret uden inddragelse af hjælpesplejningsfaktorer, og AS kan også kombineres med andre posttranskriptionelle hændelser som f.eks. brugen af flere interne oversættelsesinitieringssteder, RNA-redigering, mRNA-nedbrydning og mikroRNA-binding og andre ikke-kodende RNA’er , hvilket tyder på, at der findes yderligere ikke-kanoniske mekanismer for AS, som endnu ikke er identificeret .

For nylig er der blevet rapporteret om en direkte rolle for histonmodifikationer i alternativ splejsning, hvor histonmodifikation (H3-K27m3) påvirker splejsningens resultat ved at påvirke rekrutteringen af splejsningregulatorer via et kromatinbindende protein i en række humane gener såsom FGFR2,TPM2,TPM1 og PKM2 . Desuden er det blevet rapporteret, at CTCF-fremmet RNA-polymerase II-pausering forbinder DNA-methylering med splejsning, hvilket giver det første bevis for udviklingsmæssig regulering af splejsningens resultat gennem arvelige epigenetiske mærker . Desuden er ikke-kodende RNA’er også fremkommet som vigtige determinanter for alternative splejsningsmønstre . Disse resultater afslører derfor et yderligere epigenetisk lag i reguleringen af transkription og alternativ splejsning . Der er derfor blevet foreslået genomdækkende genetiske og epigenetiske undersøgelser i mindst 100 specifikke blodcelletyper , som vil give referenceepigenomer af høj kvalitet (ved hjælp af DNA-methylerings- og histonmærkeanalyser) med detaljerede genetiske og transkriptomdata (sekventering af hele genomet, RNA-Seq og miRNA-Seq), hvilket giver os mulighed for at vurdere den genomdækkende indflydelse af epigenetiske faktorer i reguleringen af AS i specifikke blodcelletyper. Vi forventer, at stigningen af komparativ epigenetik vil give et andet perspektiv på transkriptomets udvikling.

3. Identifikation af alternative splejsning hændelser

Alternativ splejsning er vanskelig at vurdere ud fra genomiske parametre alene . En række reguleringsmotiver for AS er blevet afdækket, men tilstedeværelsen af kendte alternative splejsningmotiver er ikke en garanti for, at et gen faktisk er alternativt splejset . Derfor vurderes alternative splejsningsmønstre generelt ud fra en undersøgelse af transkriptdata. For et hvilket som helst gen af interesse kan alternative splejsningsevents identificeres ved hjælp af omvendt transskriptionspolymerasekædereaktion (RT-PCR), der udføres på et komplementært DNA-bibliotek (cDNA). I løbet af det sidste årti er det i takt med at transkriptomteknologierne med højt gennemløb er blevet forbedret, blevet muligt at vurdere alternative splejsningmønstre i hele genomet. Der er blevet anvendt tre hovedkilder til transkriptomdata til at vurdere splejsningsmønstre: EST’er (Expressed Sequence Tags), mikroarrays til splejsningskobling og RNA-sekventering (RNA-Seq).

Den første bølge af genomdækkende transkriptomanalyse bestod i direkte sekventering af cDNA og EST’er udført i stor skala , hvilket gjorde det muligt at identificere alternative splejsningsevents ved at tilpasse cDNA/EST-sekvenser til referencegenomet. EST’er er 200-800 nukleotidbaser lange, uredigerede, tilfældigt udvalgte single-pass-sekvenslæsninger afledt af cDNA-biblioteker . I øjeblikket findes der otte millioner EST’er for mennesker, herunder ca. en million sekvenser fra kræftvæv, og ca. 71 millioner EST’er for ca. 2000 arter i dbEST . EST’er er imidlertid baseret på Sanger-sekventering med lavt gennemløb og er aggregeret over en bred vifte af væv, udviklingstilstande og sygdomme ved hjælp af vidt forskellige følsomhedsniveauer.

For nylig er splejsningssammenkoblingsmikroarrays og RNA-Seq blevet anvendt i stigende grad til kvantitativ analyse af alternative splejsninghændelser. Mikroarrays til splejsning er rettet mod specifikke exoner eller exon-exon-forbindelser med oligonukleotidprober. De enkelte sonders fluorescerende intensitet afspejler den relative anvendelse af alternativt splejsende exoner i forskellige væv og cellelinjer . Microarrays med høj tæthedsgrad for splejsningsforbindelser er en omkostningseffektiv måde at analysere tidligere kendte exoner og AS-hændelser på med lav falsk positiv rate. Ulempen er, at det kræver forudgående kendskab til eksisterende AS-varianter og genstrukturer. Endnu vigtigere er det, at mikroarrays i modsætning til RNA-Seq og EST ikke giver yderligere sekvensinformation.

RNA-Seq har udviklet sig som en kraftfuld teknologi til transkriptomanalyse på grund af dens evne til at producere millioner af korte sekvenslæsninger . RNA-Seq-eksperimenter giver dybdegående oplysninger om det transkriptionelle landskab . Den stadigt stigende akkumulering af high-throughput-data vil fortsat give stadig rigere muligheder for at undersøge yderligere aspekter af AS såsom lavfrekvente AS-hændelser samt vævsspecifikke og/eller udviklingsspecifikke AS-hændelser . Tidligere datasæt består af RNA-læsesekvenser på 50 bp eller mindre, hvilket begrænser informationen om kombinationer af AS-hændelser i et enkelt transkript, men det er sandsynligt, at længden af korte læsninger fortsat vil stige i løbet af det næste årti. Med den stigende kapacitet for næste generations sekventering (RNA-Seq) vil undersøgelsen af alternativ spicing sandsynligvis gennemgå en revolution . Den større dybde af sekventering af transkriptomer hos mennesker og andre arter har øget vores forståelse af forekomsten af AS-hændelser og AS-udtryksmønstre i forskellige væv og udviklingsstadier .

Transkriptsamling af sekvensbaserede teknologier, såsom ESTs og RNA-Seq, kan bruge enten align-then-assemble eller assemble-then-align, afhængigt af kvaliteten af referencegenom og sekvensdata . Der kan anvendes en algoritme til at detektere AS-hændelse ved at sammenligne forskellige transskriptioner. Det er imidlertid stadig en udfordring at påvise AS-isoformer i modsætning til en enkelt AS-hændelse, fordi korte sekvenser kun giver få oplysninger om kombinationen af exoner. Flere applikationer er blevet udviklet til transkript samling og AS isoform detektion, forskellige strategier og sammenligning af disse applikationer er blevet gennemgået tidligere .

4. Prævalens af alternativ splejsning på tværs af eukaryote genomer

Initiale analyser af hele genomet antydede, at 5%-30% af de menneskelige gener var alternativt splejset (gennemgået i ). EST-baserede AS-databaser identificerer AS-hændelser i 40-60% af de menneskelige gener ; på det seneste er dette tal imidlertid blevet revideret igen og igen med de seneste skøn, der viser, at op til 94% af de menneskelige multiexon-gener producerer mere end ét transkript gennem alternativ splejsning . En forståelse af, hvordan alternativ splejsning har ændret sig over tid, kan give indsigt i, hvordan alternativ splejsning har påvirket transkript- og proteindiversiteten og fænotypeudviklingen . Hos svampe menes AS at være sjældent på grund af det lave antal exoner i gær . I planter er det blevet anslået, at omkring 20 % af generne gennemgår AS baseret på EST-data , men en nyere undersøgelse ved hjælp af RNA-Seq tyder imidlertid på, at mindst ca. 42 % af intron-holdige gener i Arabidopsis er alternativt splejset . Vi forventer, at der vil blive opdaget betydeligt højere procentsatser af AS-forekomst fra forskellige eukaryoter i betragtning af de dybtgående undersøgelser af transkriptomet ved hjælp af næste generations sekventering såsom RNA-Seq, der er i gang. Nogle få undersøgelser har forsøgt at sammenligne AS-prævalensen blandt forskellige taxa, idet dyr generelt rapporteres at have en højere AS-forekomst end planter, og hvirveldyr har en højere AS-forekomst end hvirvelløse dyr . Disse undersøgelser er imidlertid enten baseret på begrænsede data eller har ikke korrigeret for forskelle i transkriptdækning.

Der findes en række databaser, der indeholder AS-data for flere arter . Disse eksisterende ressourcer er imidlertid primært fokuseret på dyrearter og har dårlig dækning for protist-, svampe- og plantegenomer, hvilket gør det vanskeligt at sammenligne divergerende taxa. Vigtigst er det, at ingen af disse ressourcer tager hensyn til de veldokumenterede virkninger af differentiel transkriptdækning på tværs af gener inden for og mellem arter, som i høj grad påvirker AS-detektionshastigheden . Tilfældig prøveudtagning er blevet anvendt og har vist sig at minimere bias af transkriptdækningen (figur 2). Vi forventer, at lignende strategier vil blive anvendt i fremtidige sammenlignende AS-datteressourcer.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

(a)
(a)(b)
(b)

Figur 2

Det samlede transkriptantal påvirker AS-detektionen, men bias kan korrigeres ved at anvende en stikprøveudtagningsmetode. AS-detektion i gener divideret med transkriptdækning for nematoder (a og b) ved hjælp af det fulde transkriptdatasæt (a) eller en tilfældig prøveudtagningsmetode (b).

5. Er alternativ splejsning funktionel eller mest bare støj?

Hvis en stigning i AS-niveauerne i hvirveldyrsarter sammenlignet med hvirvelløse dyr bekræftes, er det i betragtning af begrænsningerne i de nuværende proteomiske ressourcer svært at vurdere, i hvilket omfang alternativt splejsede transskriptioner oversættes til et udvidet proteom. Udviklingen af mange fænotyper, som vi mest forbinder med mennesket, såsom længere levetid, encephalisering eller endog øget kompleksitet, er blevet ledsaget af kraftige reduktioner i den effektive populationsstørrelse, hvilket muligvis forklarer udbredelsen af en række genomiske træk i mere komplekse organismer ( men se ). Derfor er det muligt, at øget AS gennem evolutionen skyldes aberrant splejsning, og derfor spiller det ikke nogen funktionel rolle . Hvis alternativ splejsning er steget langs det fylogenetiske træ, og den faktisk er funktionel, kan vi forvente følgende: (A) Transkripter bør have en lav forekomst af for tidlige stopkodoner, hvilket ville gøre dem sårbare over for nonsense-medieret nedbrydning. Mellem 4 % og 35 % af AS humane transkripter har vist sig at indeholde et for tidligt afbrydelseskodon i menneske- og musetranskripter . Disse transkriptioner har vist sig at være beriget med ikke-konserverede exoner, der sandsynligvis kan forårsage frame shifts . Det er ukendt, om andelen af AS-transskriptioner, der indeholder for tidlige stopkodoner, har ændret sig langs det fylogenetiske træ. B) Det er blevet foreslået, at de fleste alternative isoformer med lavt kopiantal, der produceres i menneskelige celler, sandsynligvis er ikke-funktionelle . En nylig undersøgelse har vist, at selv om der kan findes kræftspecifikke alternative splejsningvarianter, findes disse hændelser for det meste som enkeltkopierede hændelser og bidrager således sandsynligvis ikke til det centrale kræfttranskriptom .(C) Bevarelse af alternative splejsninghændelser langs evolutionen kan tages som en indikator for deres funktionelle rolle. Bevaringsniveauet for AS er blevet undersøgt hos mange arter. Skønnet varierer fra 11 % til 67 % mellem menneske og mus . Især de store AS-former har tendens til at have et højere bevaringsniveau end de små former. På den anden side varierer de bevarede AS-former blandt de forskellige AS; f.eks. har exon-skipping mellem C. elegans og C. briggsae vist et bevaringsniveau på mere end 81 % sammenlignet med 28 % for intron-retention .(D) Tilstedeværelsen af identificerbare funktionelle domæner i AS-områder kan også være en indikator for AS-transskriptioners funktionelle relevans . Så vidt vi ved, er der ingen rapporter om forekomsten af funktionelle domæner i AS-områder i modelarter. For at undersøge tilstedeværelsen af funktionelle domæner i AS-transskriptioner kompilerede vi et sæt af 267.996 AS-hændelser, der er opnået ved analyse af 8.315.254 EST’er fra normale menneskelige væv. Vi fandt, at ca. 50 % af AS-områderne i mennesker indeholder kendte funktionelle komponenter ved hjælp af InterProScan, som indeholder 14 applikationer til forudsigelse af proteindomæner (figur 3, se metoder i ), hvilket tyder på en mulig funktionel rolle for AS. Omfanget af variationerne i forekomsten af funktionelle domæner blandt AS-områder mellem arter skal stadig undersøges, men ville give yderligere indsigt i evolutionen af AS.

Figur 3

Procentdel af AS-områder, der indeholder identificerbare funktionelle domæner, sekundære strukturer og stopkodoner i mennesker. Funktionelle komponenter blev identificeret ved hjælp af InterProScan , som indeholder 14 programmer til forudsigelse af proteindomæner , herunder Pfam til forudsigelse af proteindomæner , SignalP 3.0 til forudsigelse af signalpeptider og TMHMM til forudsigelse af transmembrandomæner . PSORT II blev anvendt til at identificere den sandsynlige subcellulære lokalisering af proteinprodukter. Sekundære proteinstrukturer blev forudsagt af CLC Main Workbench 5.7, som er baseret på ekstraherede proteinsekvenser fra proteindatabasen (http://www.rcsb.org/pdb/).

Sammenlagt tyder ovenstående observationer på, at selv om alternative splejsning-begivenheder faktisk er bevaret gennem evolutionen, er en betydelig del af dem det ikke, og nogle kan skyldes støjende transkriptsplejsning, der ikke bidrager til proteinpuljen. Indtil yderligere undersøgelser, hvor der anvendes sammenlignelige AS-indekser, vil det imidlertid være umuligt at vurdere, i hvilket omfang stigninger i AS-niveauer langs det fylogenetiske træ har påvirket puljen af funktionelle transkript

6. Alternativ splejsning og genduplikation

Genduplikation (GD) anses for at være en vigtig kilde til funktionel innovation i genomet. Nyligt duplikerede gener kan udvikle funktionel divergens , og det menes at være nøglen til at drive udviklingen af udviklingsmæssig og morfologisk kompleksitet hos hvirveldyr . Alternativ splejsning, som er en fremherskende mekanisme, der også øger proteindiversiteten, er blevet foreslået som en potentiel aktør i udviklingen af eukaryoter . Ved at undersøge forholdet mellem genduplikation og alternativ splejsning kan vi bedre forstå, i hvilket omfang begge mekanismer er ækvivalente midler til proteindiversificering. Flere undersøgelser har rapporteret om en negativ korrelation mellem AS og genfamiliestørrelse hos mennesker, mus og orme (tabel 1). Det er let at føre til den konklusion, at AS og GD er indbyrdes udskiftelige, og at der er en universel negativ korrelation fra orm til menneske. Forholdet mellem de to variabler er imidlertid i bedste fald marginalt, og det er ikke konsistent, når man medtager singletongener, som har et lavere AS-niveau sammenlignet med multigenfamilier . Jin et al. foreslog, at singletons har mere evolutionær indsnævring end dubletter, hvilket hæmmer deres AS isoform gevinst I overensstemmelse med denne hypotese fandt Lin et al. at singletons adskiller sig fra multigene familier i flere aspekter, hvilket tyder på, at de har forskellige evolutionære veje. Selv hvis vi kun fokuserer på multigenefamilier, kan en negativ korrelation mellem AS og genfamiliestørrelse forklares eller være et biprodukt af AS- og genfamiliestørrelseskovarians med andre faktorer. For eksempel er genalder og biased duplikation blevet foreslået som forklaring . Denne undersøgelse har kastet tvivl om forholdet mellem AS og GD, og den kan faktisk give støtte til forslaget om, at AS og GD har ringe eller ingen ækvivalens med hensyn til virkninger på proteinsekvens, -struktur og -funktion . Da de fleste undersøgelser har undersøgt et lille antal modelarter, er det vanskeligt at vurdere omfanget af forbindelsen mellem AS og GD. Desuden kan den øjebliksbilledetilgang, hvor man sammenligner GFS og AS i et enkelt genom, skjule det sande forhold mellem AS og GFS.

Species Data Alternativ splejsning Orthologi Bias-kontrol Korrelation Reference
Human Ensembl ASD’s AltSplice database BLSATP Exons, EST-dækning, genfamiliestørrelse, antal isoformer Negativ korrelation
NCBI, UCSC GeneSplicer program EnsMart Fjern skrald EST, EST dækning, Negativ korrelation
H-InvDB 5.0 H-InvDB 5.0 BLAST Positiv korrelation, når alle genfamilier indgår. Negativ korrelation inden for multigenefamilier
Mus Ensembl ASD’s AltSplice-database BLSATP Exons, EST-dækning, genfamiliestørrelse, antal isoformer Negativ korrelation
NCBI, UCSC GeneSplicer program EnsMart Fjern skrald EST, EST dækning, Negativ korrelation
Riken’s FANTOM3 Riken’s FANTOM3 Riken’s FANTOM3 BLAST Positiv korrelation, når alle genfamilier indgår. Negativ korrelation inden for multigene-familier
C. elegans WormPep WormPep BLAST Lækkerere AS-forekomst i multigene-familier
Rice TIGR 4.0 PASA-program BLASTP Fjernelse af gener, der mangler transkriptbeviser Multigenfamilier har signifikant højere forekomst af AS end singletoner
Arabidopsis TAIR7 TAIR7 TAIR7 Multigenfamilier har signifikant højere forekomst af AS end singletoner
Tabel 1
Sammenfatning for forholdet mellem AS og GFS.

7. Alternativ splejsningens bidrag til funktionel innovation

Alternativ splejsning er blevet hyldet som den manglende informationskilde i genomet, der er ansvarlig for udviklingen af højere kompleksitet på trods af det næsten statiske genantal i metazoer i løbet af de sidste 800 millioner år. Wegmann et al. fandt, at bredden af genudtryk er positivt korreleret med antallet af nye transkript isoformer og foreslog, at stigningen i genudtryksbredden er afgørende for at erhverve nye transkript isoformer, som kunne opretholdes af en ny form for balancerende selektion. Desuden har eksperimentelle og bioinformatiske analyser vist, at AS kan generere en række funktionelle mRNA’er og proteinprodukter, der viser forskellige stabilitetsegenskaber, subcellulær lokalisering og funktion samt i specifikke stadier i celledifferentiering , kønsdifferentiering og udvikling .

Single-gene-undersøgelser har givet eksempler på, at alternativ splejsning kan føre til funktionel innovation, før der har fundet nogen begivenheder af genduplikering sted. Et sådant eksempel er Troponin I (TnI), som spiller en nøglerolle i muskelkontraktion. I hvirveldyrgenomet findes TnI i tre kopier, der hver især udtrykkes i en anden muskeltype (skeletmuskulatur, hurtig og langsom muskulatur og hjertemuskulatur). I Ciona, der er en af hvirveldyrenes nærmeste slægtninge, findes TnI som et enkelt gen. Interessant nok producerer Ciona-genet imidlertid tre forskellige alternativt splejsede isoformer, som hver især ligner ekspressionsprofilen for et af hvirveldyrgenerne, hvilket tyder på, at specialiseringen af TnI-proteinerne til at fungere i hver enkelt muskeltype gik forud for genduplikationerne . Dette mønster med alternative splejsningsvarianter i forfædres enkeltgener, der ligner udtryksprofiler for gener, der senere er duplikeret, er også fundet i synapsin-2-gener hos tetrapoder og MITF-gener hos teleostfiskarter . Disse eksempler tyder på, at alternativ splejsning kan være en mekanisme for funktionel fornyelse forud for genduplikation gennem en af de tre mulige veje (Figur 4).

(a) Splejsningssignaldegeneration
(a) Splejsningssignaldegeneration
(b) Exonisering af ikke-kodende DNA eller transposoner
(b) Exonisering af ikke-kodende DNA eller transposoner
(b) Exonisering af ikkekodende DNA eller transposoner
(c) Exon-duplikering og specialisering af isoformer
(c) Exon-duplikering og specialisering af isoformer

(a) Splejsningssignaldegeneration
(a) Splejsningssignaldegeneration(b) Exonisering af ikkekodende DNA eller transposoner
(b) Exonisering af ikke-kodende DNA eller transposoner(c) Exon-duplikering og specialisering af isoformer
(c) Exon-duplikering og specialisering af isoformer

Figur 4

Nye AS-varianter kan påtage sig specialiserede eller nye roller. Nye splejsningvarianter kan opstå som følge af (a) mutationer i exongenkendelsesstedet for et konstitutivt exon og efterfølgende erhvervelse af AS-reguleringselementer. (b) exonisering af introner eller intronregioner eller transposable elementer med efterfølgende erhvervelse af AS-regulerende regioner. Nye proteiner kan interagere med forskellige proteiner eller lokaliseres i forskellige subcellulære regioner. (c) Exon-duplikering og efterfølgende specialisering funktionelle domæner og AS-regulatoriske regioner. De resulterende specialiserede proteiner kan påtage sig delvise roller, der er relevante i forskellige celletyper eller udviklingsstadier, eller resultere i nye interaktioner og funktioner.

Gener kan også få yderligere alternativ splejsning og regulering efter duplikation sammen med kompleksiteten af organsystemerne efter divergensen af protochordater og hvirveldyr. Sammenligning mellem transkriptionelle faktorer Pax gener i hvirveldyr og amphioxus har vist, at mindst 52 rapporterede alternative splejsning begivenheder i hvirveldyr sammenlignet med 23 begivenheder i amphioxus . Desuden har Pax-generne hos hvirveldyr bevaret de fleste af deres forfædres funktioner og har også udvidet deres udtryk . Ny alternativ splejsning af Pax-generne har vist sig at ændre indholdet af de funktionelle domæner (f.eks. DNA-binding) og transaktiveringskapaciteten af de resulterende proteinprodukter . F.eks. kan et nyt alternativt transkript af Pax3 transaktivere en cMET-reporterkonstrukt i mus . Disse yderligere isoformer af Pax3 er blevet foreslået at spille en funktionel rolle i forbindelse med erhvervelse af nye roller på neuralpladen hos hvirveldyr . På samme måde er hvirveldyr-specifikke AS-hændelser i exon 5a i Pax4 og Pax6 blevet knyttet til funktionelle roller i udviklingen af hvirveldyrs øje . Det er derfor rimeligt at foreslå den hypotese, at alternativ splejsning ud over genduplikation spiller vigtige roller ved erhvervelse af nye funktioner, der bidrager til kompleksiteten af organsystemerne efter protochordaternes og hvirveldyrenes divergens . De potentielle roller af den stigende prævalens af AS i hvirveldyr i funktionel innovation vil i høj grad blive udforsket i flere genfamilier eller genomewide niveau i fremtiden, hvilket vil fremme vores forståelse af, hvordan AS bidrager til funktionel innovation.

8. Konklusion

Her har vi gennemgået beviser fra genomewide undersøgelser samt mulige veje for fremtidige komparative undersøgelser for potentialet af alternativ splejsning som en kilde til funktionel innovation under udviklingen af det eukaryote genom. Selv om det nu står klart, at AS er udbredt i det menneskelige genom, er der stadig forhindringer i vurderingen af, hvordan alternativ splejsning har udviklet sig gennem tiden. Den største hindring består i, at mens de fleste andre genomiske egenskaber kan måles eller vurderes direkte ud fra genomiske sekvenser alene, kan der ikke opnås nøjagtige vurderinger af alternativ splejsning ud fra genomisk sekvensanalyse. Afhængigheden af tilgængeligheden af transkriptsekvenser til måling af AS sammen med den stærke bias, der skyldes ulige dækning af transkriptsekvenser, har vanskeliggjort den genomiske vurdering af AS i alle arter undtagen nogle få modelarter og gør det vanskeligt at foretage en direkte sammenligning mellem arter. Dette har bremset undersøgelsen af, hvordan alternativ splejsning har udviklet sig over tid, hvordan AS reguleres, og hvordan det kan relateres til andre genomiske egenskaber og især til fænotypen. Den stadigt stigende transkriptprofilering for mange flere arter kombineret med brugen af sammenlignelige indeksestimater vil gøre det muligt at behandle en række evolutionære spørgsmål vedrørende udviklingen af AS og dens konsekvenser for udviklingen af transkriptdiversitet og funktionel innovation.

Interessekonflikter

Forfatterne erklærer ingen interessekonflikter.

Akkreditering

Forfatterne ønsker at takke Humberto Gutierrez for kommentarer til tidligere versioner af denne artikel. Dette arbejde blev finansieret af UK-China Scholarship for Excellence og University of Bath Research Studentship til L. Chen, et CONACyT Scholarship til J. M. Tovar-Corona, og et Royal Society Dorothy Hodgkin Research Fellowship, Royal Society Research Grant og et Royal Society Research Grant for Fellows til A. O. Urrutia.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.