Alternatieve Splicing: A Potential Source of Functional Innovation in the Eukaryotic Genome

Abstract

Alternative splicing (AS) is een veel voorkomend posttranscriptioneel proces in eukaryote organismen, waarbij meerdere verschillende functionele transcripten worden geproduceerd uit één enkel gen. De vrijgave van het ontwerp van het menselijk genoom bracht een veel kleiner aantal genen aan het licht dan verwacht. Wegens de potentiële rol ervan bij de uitbreiding van de eiwitdiversiteit, is de belangstelling voor alternatieve splicing de laatste tien jaar toegenomen. Hoewel recente studies hebben aangetoond dat 94% van de menselijke multiexon genen AS ondergaan, blijft de evolutie van AS en dus zijn potentiële rol in functionele innovatie in eukaryote genomen grotendeels onontgonnen. Hier geven we een overzicht van de beschikbare gegevens over de evolutie van AS-prevalentie en functionele rol. Bovendien benadrukken we de noodzaak om te corrigeren voor het sterke effect van transcriptdekking in AS-detectie en zetten we een strategie uit om uiteindelijk de omvang van de rol van AS in functionele innovatie op een genomische schaal op te helderen.

1. Inleiding

Het eerste ontwerp van de sequentie van het menselijk genoom werd onthuld in februari 2001 en verrassend genoeg bleek het ~23000 genen te bevatten, slechts een fractie van het aantal genen dat oorspronkelijk was voorspeld . Om dit in perspectief te plaatsen: het genoom van de nematode C. elegans bevat ~20.000 genen. Het ontbreken van een verband tussen het aantal genen en de complexiteit van het organisme heeft geleid tot een toegenomen belangstelling voor alternatieve splicing (AS), aangezien is voorgesteld dat het een belangrijke factor is in de uitbreiding van de regulatorische en functionele complexiteit, eiwitdiversiteit, en de complexiteit van het organisme van hogere eukaryoten. Echter, ondanks de inspanningen van vele onderzoeksgroepen begrijpen we nog steeds heel weinig over de werkelijke rol die AS speelt in de evolutie van functionele innovatie – hier opgevat als het verschijnen van nieuwe functionele transcripten – die ten grondslag liggen aan de waargenomen toegenomen complexiteit van organismen.

Alternatieve splicing is een posttranscriptioneel proces in eukaryote organismen waarbij meerdere verschillende transcripten worden geproduceerd uit een enkel gen. Eerdere studies met behulp van high-throughput sequencing technologie hebben gemeld dat tot 92% ~ 94% van de menselijke multiexon genen AS ondergaan, vaak in een weefsel / ontwikkelingsfase-specifieke wijze. Met de ontwikkeling en voortdurende verbetering van transcriptieprofilering voor het gehele genoom en bioinformatica-algoritmen, begon de alomtegenwoordigheid van AS in het zoogdiergenoom duidelijk te worden. Het concept van één gen – één eiwit maakte plaats voor bewijsmateriaal voor het hoge percentage van AS in niet-menselijke soorten, zoals fruitvlieg, Arabidopsis en andere eukaryoten. Ondanks de vooruitgang in ons begrip en de karakterisering van AS blijven verschillende vragen onbeantwoord. Ten eerste heeft het grote verschil in transcriptdekking tussen soorten directe vergelijkingen van de prevalentie van alternatieve splicing in verschillende soorten bemoeilijkt. Ten tweede, zelfs als vergelijkbare AS schattingen tussen soorten zouden kunnen worden verkregen, is het onduidelijk in hoeverre eventuele veranderingen in AS prevalentie langs de evolutie hebben bijgedragen tot de algemene eiwitdiversiteit of eerder splicing ruis weerspiegelen. Tenslotte begrijpen we heel weinig over hoe AS geëvolueerd is doorheen de tijd en hoe dit verband houdt met functionele parameters van genen. Hier bespreken we hoe alternatieve splicing wordt gereguleerd en wat de recente vooruitgang is in ons begrip van de evolutie van alternatieve splicing.

2. Alternatieve Splicing en de regulatie ervan

In 1977 rapporteerden Chow et al. dat de 5′ en 3′ eindsequenties van verschillende adenovirus 2 (Ad2) mRNA’s varieerden, wat een nieuw mechanisme impliceerde voor de generatie van verschillende mRNA’s. Na deze studie werd ook alternatieve splicing gevonden in het gen dat codeert voor het schildklierhormoon calcitonine in zoogdiercellen. Latere studies toonden aan dat vele andere genen ook in staat waren om meer dan één transcript te genereren door verschillende secties uit de coderende regio’s weg te knippen (besproken in ).

Afhankelijk van de plaats van de weggesneden exonische segmenten – of als introns behouden blijven – kunnen splicing-gebeurtenissen in vier basistypes worden ingedeeld (figuur 1). Deze vier belangrijke vormen van splicing zijn (1) exon skipping (2) intron retention (3) alternatieve 5′ splicing site (5′ss), en (4) alternatieve 3′ splicing site (3′ss) . Daarnaast bieden wederzijds uitsluitende exonen, alternatieve initiatie en alternatieve polyadenylering nog twee andere mechanismen voor het genereren van verschillende transcriptisovormen. Bovendien kunnen verschillende soorten alternatieve splicing op combinatorische wijze voorkomen en kan één exon onderhevig zijn aan meer dan één AS-modus, bijvoorbeeld 5′ss en 3′ss op hetzelfde moment (figuur 1). De prevalentie van elk type van AS is gebleken te variëren tussen verschillende taxa. Verschillende studies hebben aangetoond dat exon skipping veel voorkomt in metazoan genomen, terwijl intron retention het meest voorkomende type AS is bij planten en schimmels.

Figuur 1

Verschillende typen van alternatieve splicing. De blauwe vakken zijn constitutieve exonen en de alternatief gesplicte regio’s in rood. Introns worden weergegeven door rechte lijnen tussen de vakken. Vier typen van gemeenschappelijke splicing gebeurtenissen werden geïdentificeerd: (1) exon skipping (2) intron retention (3) alternative 5′ splicing site (5′ss), en (4) alternative 3′ splicing site (3′ss).

Alternatieve splicing wordt strak gereguleerd door cis-elementen en door transacterende factoren die zich aan deze cis-elementen binden. Transacterende factoren, voornamelijk RNA-bindende eiwitten, moduleren de activiteit van het spliceosoom en cis-elementen zoals exonische splicing enhancers (ESE’s), exonische splicing silencers (ESS’s), intronic splicing enhancers (ISE’s), en intronic splicing silencers (ISS’s). Het canonieke mechanisme van AS suggereert dat serine/argininerijke (SR) proteïnen typisch binden aan ESEs, terwijl heterogene nucleaire ribonucleoproteïnen (hnRNP) de neiging hebben om te binden aan ESSs of ISSs. Gezien de cruciale rol van deze regulatoren in de splicing-machinerie, is het bekend dat cis- en transactiemutaties, die de splicingcode verstoren, ziekte kunnen veroorzaken (besproken in ). Er wordt geschat dat 15-60% van de mutaties ziekte veroorzaken door het splicingpatroon van genen aan te tasten ( en besproken in ). Bovendien is ook aangetoond dat AS wordt gereguleerd zonder de betrokkenheid van hulpsplitsingsfactoren en AS kan ook worden gecombineerd met andere posttranscriptionele gebeurtenissen zoals het gebruik van meerdere interne translatie-initiatieplaatsen, RNA-editing, mRNA-verval, en microRNA-binding en andere niet-coderende RNA’s , wat wijst op het bestaan van extra niet-canonieke mechanisme van AS die nog moeten worden geïdentificeerd.

Recentelijk is een directe rol van histon-modificaties in alternatieve splicing gerapporteerd, waarin histon-modificatie (H3-K27m3) het splicing resultaat beïnvloedt door het beïnvloeden van de rekrutering van splicing regulatoren via een chromatine-bindend eiwit in een aantal menselijke genen zoals FGFR2,TPM2,TPM1 en PKM2 . Bovendien is gerapporteerd dat CTCF-bevorderde RNA polymerase II-pauzes DNA-methylering koppelen aan splicing, waarmee het eerste bewijs is geleverd van ontwikkelingsregulering van splicingresultaten via erfelijke epigenetische markeringen. Bovendien zijn niet-coderende RNA’s ook naar voren gekomen als belangrijke determinanten van alternatieve splicing patronen. Daarom onthullen deze bevindingen een extra epigenetische laag in de regulering van transcriptie en alternatieve splicing . Genoomwijde genetische en epigenetische studies zijn daarom voorgesteld in ten minste 100 specifieke bloed celtypes , die hoge kwaliteit referentie epigenomen (met behulp van DNA-methylering en histon markeringen assays) met gedetailleerde genetische en transcriptoom gegevens (hele genoom sequencing, RNA-Seq, en miRNA-Seq) zal opleveren, waardoor we de mogelijkheid hebben om de genoomwijde invloed van epigenetische factoren in de regulering van AS in specifieke bloed celtypes te beoordelen. We verwachten dat de opkomst van vergelijkende epigenetica een ander perspectief zal bieden op de evolutie van het transcriptoom.

3. Identificatie van Alternatieve Splicing Gebeurtenissen

Alternatieve splicing is moeilijk te schatten op basis van genomische parameters alleen. Een aantal regulerende motieven voor AS zijn blootgelegd, maar de aanwezigheid van bekende alternatieve splicing motieven is geen garantie dat een gen daadwerkelijk alternatief gespliced is . Alternatieve splicingpatronen worden dus meestal beoordeeld aan de hand van transcriptgegevens. Voor elk gen van belang kunnen alternatieve splicing events worden geïdentificeerd met behulp van omgekeerde transcriptie polymerase kettingreactie (RT-PCR) uitgevoerd op een complementair DNA (cDNA) bibliotheek. In het laatste decennium is het door de verbetering van high-throughput transcriptoomtechnologieën mogelijk geworden om alternatieve splicingpatronen op een genoombrede schaal te beoordelen. Drie belangrijke bronnen van transcriptoomgegevens zijn gebruikt om splicingpatronen te beoordelen: uitgedrukte sequentietags (EST’s), splice-junction microarrays, en RNA-sequencing (RNA-Seq).

De eerste golf van genoombrede transcriptoomanalyse bestond uit directe sequentiebepaling van cDNA en EST’s die op grote schaal werden uitgevoerd, waardoor alternatieve splicinggebeurtenissen konden worden geïdentificeerd door cDNA/EST-sequenties uit te lijnen op het referentiegenoom. EST’s zijn 200-800 nucleotidebasen lange, niet-geëditeerde, willekeurig geselecteerde single-pass sequentie-lezingen afkomstig van cDNA-bibliotheken. Momenteel zijn er acht miljoen EST’s voor de mens, waaronder ongeveer één miljoen sequenties van kankerweefsels, en ongeveer 71 miljoen EST’s voor ongeveer 2000 soorten in dbEST . ESTs zijn echter gebaseerd op low-throughput Sanger sequencing en zijn geaggregeerd over een breed scala van weefsels, ontwikkelingstoestanden, en ziekten met behulp van zeer verschillende niveaus van gevoeligheid.

Meer recent, splice-junction microarrays en RNA-Seq zijn in toenemende mate gebruikt om kwantitatief te analyseren alternatieve splicing gebeurtenissen. Splicing microarrays richten zich met oligonucleotide probes op specifieke exonen of exon-exon juncties. De fluorescentie-intensiteit van individuele probes weerspiegelt het relatieve gebruik van alternatief splicing exonen in verschillende weefsels en cellijnen. Splice-junction microarrays met hoge dichtheid zijn een kosteneffectieve manier om eerder bekende exonen en AS events te testen met een laag vals-positief percentage. Het nadeel is dat het vereist voorafgaande kennis van bestaande AS varianten en gen structuren. Belangrijker is dat in tegenstelling tot RNA-Seq en EST, microarrays geen extra sequentie informatie.

RNA-Seq heeft zich ontpopt als een krachtige technologie voor transcriptoom analyse als gevolg van de mogelijkheid om miljoenen korte sequentie leest produceren. RNA-Seq experimenten bieden diepgaande informatie over de transcriptionele landschap . De steeds toenemende accumulatie van high-throughput data zal steeds rijkere mogelijkheden blijven bieden om verdere aspecten van AS te onderzoeken, zoals laagfrequente AS-gebeurtenissen alsmede weefselspecifieke en/of ontwikkelingsspecifieke AS-gebeurtenissen . Eerdere datasets bestaan uit RNA-lees sequenties van 50 bp of minder, waardoor de informatie over combinaties van AS-gebeurtenissen in een enkel transcript beperkt is, maar het is waarschijnlijk dat de lengte van korte lezingen in het komende decennium zal blijven toenemen. Met de toenemende capaciteit van next-generation sequencing (RNA-Seq) zal de studie van alternatieve spicing waarschijnlijk een revolutie ondergaan. De grotere diepte van sequencing van transcriptomen in de mens en andere soorten heeft ons begrip van het optreden van AS gebeurtenis en AS expressiepatronen in verschillende weefsels , ontwikkelingsstadia .

Transcript assemblage van sequentie-gebaseerde technologieën, zoals EST’s en RNA-Seq, kan zowel align-then-assemble of assemble-then-align gebruiken, afhankelijk van de kwaliteit van referentie-genoom en sequentiegegevens . Een algoritme kan worden gebruikt om AS-gebeurtenissen te detecteren door verschillende transcripten te vergelijken. Het detecteren van AS-isovormen, in tegenstelling tot enkelvoudige AS-gebeurtenissen, is echter nog steeds een uitdaging omdat korte sequenties weinig informatie verschaffen over de combinatie van exonen. Verschillende toepassingen zijn ontwikkeld voor transcript assemblage en AS isovormen detectie, verschillende strategieën en vergelijking van deze toepassingen zijn eerder herzien.

4. Prevalentie van alternatieve splicing in Eukaryotic Genomes

Initial whole genome analyses suggereerden dat 5%-30% van de menselijke genen waren alternatief gespliced (herzien in ). EST-gebaseerde AS databases identificeren AS gebeurtenissen in 40-60% van de menselijke genen, maar recentelijk is dit aantal steeds herzien met de laatste schattingen blijkt dat tot 94% van de menselijke multiexon genen meer dan een transcript produceren door alternatieve splicing . Inzicht in hoe alternatieve splicing is veranderd door de tijd heen kan inzichten verschaffen in hoe alternatieve splicing van invloed is geweest op transcript en eiwit diversiteit en fenotype evolutie. In fungi, AS wordt verondersteld zeldzaam te zijn als gevolg van het lage aantal exonen in gist . In planten is geschat dat ongeveer 20% van de genen AS ondergaan op basis van EST gegevens , een recente studie met behulp van RNA-Seq, echter, suggereert dat ten minste ongeveer 42% van de intron-bevattende genen in Arabidopsis zijn alternatief gesplict . Wij verwachten dat aanzienlijk hogere percentages van AS voorkomen zal worden ontdekt van verschillende eukaryoten gezien de diepgaande studies van transcriptoom met behulp van next-generation sequencing zoals RNA-Seq aan de gang zijn. Enkele studies hebben getracht de prevalentie van AS bij verschillende taxa te vergelijken, waarbij dieren over het algemeen een hogere AS-incidentie hebben dan planten en gewervelde dieren een hogere AS-incidentie dan ongewervelde dieren. Echter, deze studies zijn ofwel gebaseerd op beperkte gegevens of niet gecorrigeerd voor verschillen in transcript dekking.

Er zijn een aantal databases die AS-gegevens voor meerdere soorten te bieden. Echter, deze bestaande middelen zijn voornamelijk gericht op diersoorten en hebben een slechte dekking voor protist, schimmel, en plant genomen waardoor het moeilijk is om uiteenlopende taxa te vergelijken. Het belangrijkste is dat geen van deze middelen rekening houden met de goed gedocumenteerde effecten van differentiële transcript dekking over genen binnen en tussen soorten die sterk van invloed AS detectie tarieven. Willekeurige bemonstering is gebruikt en aangetoond dat de bias van transcriptdekking wordt geminimaliseerd (Figuur 2). We verwachten dat soortgelijke strategieën zullen worden gebruikt in toekomstige vergelijkende AS gegevensbronnen.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

Figuur 2

Totaal aantal transcripten beïnvloedt AS-detectie, maar bias kan worden gecorrigeerd door gebruik te maken van een steekproefmethode. AS-detectie in genen gedeeld door transcriptdekking voor de nematode (a en b) met behulp van de volledige transcriptdataset (a) of een willekeurige steekproefmethode (b).

5. Is alternatieve splicing functioneel of vooral ruis?

Als een toename van AS niveaus in gewervelde soorten in vergelijking met ongewervelde wordt bevestigd, gezien de beperkingen van de huidige proteomics middelen, is het moeilijk om de mate waarin alternatief gesplicte transcripten worden vertaald in een uitgebreid proteoom te beoordelen. De evolutie van veel fenotypes die we het meest associëren met de mens, zoals een langere levensduur, encefalisatie, of zelfs toegenomen complexiteit zijn gepaard gegaan met sterke reducties in effectieve populatiegrootte, mogelijk een verklaring voor de proliferatie van een verscheidenheid van genomische kenmerken in meer complexe organismen ( maar zie ). Daarom is het mogelijk dat toegenomen AS door evolutie het gevolg is van afwijkende splicing en daarom geen functionele rol speelt . Als alternatieve splicing is toegenomen langs de fylogenetische boom en het is inderdaad functioneel, dan kunnen we het volgende verwachten.(A) Transcripten moeten een lage incidentie van voortijdige stop codons hebben die hen kwetsbaar zou maken voor nonsens gemedieerd verval. Tussen 4% en 35% van AS menselijke transcripten blijken een voortijdig eindcodon te bevatten in menselijke en muizentranscripten. Deze transcripten bleken verrijkt te zijn met niet-geconserveerde exonen die waarschijnlijk frameverschuivingen veroorzaken. Het is onbekend of het aandeel van voortijdig eindcodon bevattende AS transcripten is veranderd langs de fylogenetische boom.(B) Er is voorgesteld dat de meeste alternatieve isovormen met een laag kopiegetal die in menselijke cellen worden geproduceerd, waarschijnlijk niet functioneel zijn. Een recente studie heeft aangetoond dat, hoewel kankerspecifieke alternatieve splicing varianten kunnen worden gevonden, deze gebeurtenissen meestal worden gevonden als single-copy gebeurtenissen en dus waarschijnlijk niet bijdragen aan de kern van kanker transcriptoom.(C) Behoud van alternatieve splicing gebeurtenissen tijdens de evolutie kan worden genomen als een indicator van hun functionele rol. De mate van instandhouding van AS is in veel soorten bestudeerd. De schatting varieert van 11% tot 67% tussen mens en muis. Met name de belangrijkste AS vormen hebben een hoger niveau van conservering dan de minder belangrijke vormen. Aan de andere kant variëren de geconserveerde AS vormen tussen verschillende AS; bijvoorbeeld, exon skipping tussen C. elegans en C. briggsae heeft meer dan 81% behoudsniveau laten zien, vergeleken met 28% voor intron retentie. (D) Aanwezigheid van identificeerbare functionele domeinen in AS gebieden kan ook een indicator zijn van functionele relevantie voor AS transcripten. Voor zover ons bekend zijn er geen rapporten over de prevalentie van functionele domeinen in AS gebieden bij modelsoorten. Om de aanwezigheid van functionele domeinen in AS transcripten te onderzoeken, stelden we een set van 267.996 AS events samen, verkregen uit de analyse van 8.315.254 ESTs van normale menselijke weefsels. Wij vonden dat ongeveer 50% van de AS gebieden bij de mens bekende functionele componenten bevatten met behulp van InterProScan dat 14 toepassingen bevat voor de voorspelling van eiwitdomeinen (figuur 3, zie methoden in ), wat een mogelijke functionele rol voor AS suggereert. De omvang van de variaties in de prevalentie van functionele domeinen onder AS-gebieden tussen soorten moet nog worden onderzocht, maar zou aanvullende inzichten verschaffen in de evolutie van AS.

Figuur 3

Percentage AS-gebieden met identificeerbare functionele domeinen, secundaire structuren, en stopcodons bij de mens. Functionele componenten werden geïdentificeerd met behulp van InterProScan, dat 14 toepassingen bevat voor de voorspelling van eiwitdomeinen, waaronder Pfam voor de voorspelling van eiwitdomeinen, SignalP 3.0 voor signaalpeptidevoorspellingen en TMHMM voor de voorspelling van transmembraandomeinen. PSORT II werd gebruikt om de waarschijnlijke subcellulaire lokalisatie van eiwitproducten te bepalen. Secundaire eiwitstructuren werden voorspeld door CLC Main Workbench 5.7, die gebaseerd is op geëxtraheerde eiwitsequenties uit de eiwit-databank (http://www.rcsb.org/pdb/).

De bovenstaande observaties suggereren samen dat hoewel alternatieve splicing-events inderdaad door de evolutie heen geconserveerd zijn, een aanzienlijk deel dat niet is en sommige het gevolg kunnen zijn van ruisende transcript splicing die niet bijdraagt aan de eiwitpool. Tot verdere studies met vergelijkbare AS indexen zal het echter onmogelijk zijn om in te schatten in welke mate de toename van AS niveaus langs de fylogenetische boom invloed heeft gehad op de pool van functionele transcripten.

6. Alternatieve Splicing en Gen-Duplicatie

Gene-duplicatie (GD) wordt beschouwd als een primaire bron van functionele innovatie in het genoom. Nieuw gedupliceerde genen kunnen evolueren functionele divergentie , en het wordt gedacht dat de sleutel in het stimuleren van de evolutie van de ontwikkeling en morfologische complexiteit in gewervelde dieren . Alternatieve splicing, als een prevalent mechanisme dat ook de eiwitdiversiteit verhoogt, is voorgesteld als een potentiële speler in de evolutie van eukaryoten. Door de relatie tussen gen duplicatie en alternatieve splicing te onderzoeken kunnen we beter begrijpen in hoeverre beide mechanismen gelijkwaardige middelen zijn voor eiwit diversificatie. Verschillende studies hebben een negatieve correlatie gerapporteerd tussen AS en genfamiliegrootte bij de mens, de muis en de worm (Tabel 1). Men zou gemakkelijk tot de conclusie kunnen komen dat AS en GD onderling verwisselbaar zijn en dat er een universele negatieve correlatie is van worm tot mens. Het verband tussen de twee variabelen is echter op zijn best marginaal en het is niet consistent wanneer singleton-genen worden meegerekend die een lager AS-niveau hebben in vergelijking met multigene families. Jin et al. suggereerden dat singletons meer evolutionaire vernauwing vertonen dan duplicaten, wat hun AS isovorm winst belemmert. In overeenstemming met deze hypothese vonden Lin et al. dat singletons verschillen van multigene families in verschillende aspecten die suggereren dat ze verschillende evolutionaire paden hebben. Zelfs als we ons alleen richten op multigene families, kan een negatieve correlatie tussen AS en genfamiliegrootte verklaard worden of een bijproduct zijn van AS en genfamiliegrootte covariantie met andere factoren. Bijvoorbeeld, genleeftijd en vooringenomen duplicatie zijn voorgesteld om de verklaring te zijn . Deze studie heeft twijfel doen rijzen over het verband tussen AS en GD en kan inderdaad steun verlenen aan de suggestie dat AS en GD weinig of geen gelijkenis vertonen wat betreft de effecten op eiwitsequentie, -structuur en -functie . Aangezien in de meeste studies slechts een klein aantal modelsoorten is onderzocht, is het moeilijk om de omvang van het verband tussen AS en GD te beoordelen. Bovendien kan de snapshot-benadering van het vergelijken van GFS en AS in een enkel genoom de ware relatie tussen AS en GFS verbergen.

0

Soorten Gegevens Alternatieve splicing Orthologie Bias controle Correlatie Referentie
Human Ensembl ASD’s AltSplice database BLSATP Exons, EST-dekking, genfamiliegrootte, aantal isovormen Negatieve correlatie
NCBI, UCSC GeneSplicer programma EnsMart Remove garbage EST, EST coverage, Negatieve correlatie
H-InvDB 5.0 Negatieve correlatie H-InvDB 5.0 BLAST Positieve correlatie wanneer alle genfamilies worden meegenomen. Negatieve correlatie binnen multigene families
Muis Ensembl ASD’s AltSplice database BLSATP Exons, EST-dekking, genfamiliegrootte, aantal isovormen Negatieve correlatie
NCBI, UCSC GeneSplicer programma EnsMart Verwijder afval EST, EST dekking, Negatieve correlatie
Riken’s FANTOM3 Riken’s FANTOM3 BLAST Positieve correlatie wanneer alle genfamilies worden meegenomen. Negatieve correlatie binnen multigene families
C. elegans WormPep WormPep BLAST Lager AS-voorkomen in multigene families
Rice TIGR 4.0 PASA programma BLASTP Verwijder genen die geen transcript bewijs hebben Multigene families hebben significant hogere AS incidentie dan singletons
Arabidopsis TAIR7 TAIR7 TAIR7 Multigene families hebben significant hogere AS-incidentie dan singletons
Tabel 1
Samenvatting voor het verband tussen AS en GFS.

7. Alternative Splicing’s Contribution to Functional Innovation

Alternative splicing is bejubeld als de ontbrekende bron van informatie in het genoom die verantwoordelijk is voor de evolutie van hogere complexiteit ondanks het vrijwel statische genenaantal bij metazoötische wezens gedurende de laatste 800 miljoen jaar. Wegmann et al. vonden dat de breedte van genexpressie positief gecorreleerd is met het aantal nieuwe transcript-isovormen en stelden voor dat de toename van genexpressiebreedte essentieel is voor het verwerven van nieuwe transcript-isovormen, die in stand gehouden zouden kunnen worden door een nieuwe vorm van balancerende selectie. Bovendien hebben experimentele en bio-informatica analyses aangetoond dat AS een verscheidenheid aan functionele mRNA’s en eiwitproducten kan genereren, met verschillende stabiliteitskenmerken, subcellulaire lokalisatie en functie, alsook in specifieke stadia van celdifferentiatie, geslachtsdifferentiatie en ontwikkeling.

Studies met enkelvoudige genen hebben voorbeelden gegeven waar alternatieve splicing kan leiden tot functionele innovatie voordat er gebeurtenissen van gen duplicatie hebben plaatsgevonden. Een dergelijk voorbeeld is dat van Troponine I (TnI), dat een sleutelrol speelt bij spiersamentrekking. In het genoom van vertebraten bestaat TnI in drie kopieën, die elk tot expressie komen in een verschillend spiertype (skeletspier, snelle en trage spier, en hartspier). In Ciona, een van de nauwste verwanten van vertebraten, is TnI aanwezig als één enkel gen. Interessant is echter dat het Ciona-gen drie verschillende alternatief gesplicte isovormen produceert, die elk lijken op het expressieprofiel van één van de vertebratengenen, hetgeen suggereert dat de specialisatie van de TnI-eiwitten om in elk spiertype te functioneren, voorafging aan de genduplicatie. Dit patroon van alternatieve splicing varianten in ancestrally enkele genen die lijken op expressie profielen van genen later gedupliceerd is ook gevonden in synapsin-2 genen in tetrapoda en MITF genen in teleost vissoorten . Deze voorbeelden suggereren dat alternatieve splicing een mechanisme kan zijn voor functionele innovatie voorafgaand aan gebeurtenissen van gen duplicatie via een van de drie mogelijke paden (figuur 4).

(a) Degeneratie van het splicing-signaal
(a) Degeneratie van het splicing-signaal
(b) Exonisatie van niet-coderend DNA of transposons
(b) Exonisatie van niet-coderend DNA of transposons
(c) Exonduplicatie en specialisatie van isovormen
(c) Exonduplicatie en specialisatie van isovormen

(a) Degeneratie van splicing-signalen
(a) Degeneratie van splicing-signalen(b) Exonisatie van niet-coderend DNA of transposons
(b) Exonisatie van niet-coderend DNA of transposons(c) Exon-duplicatie en specialisatie van isovormen
(c) Exon-duplicatie en specialisatie van isovormen
Figuur 4

Nieuwe AS-varianten kunnen een gespecialiseerde of nieuwe rol gaan spelen. Nieuwe splicingvarianten kunnen ontstaan door (a) mutaties in de exonherkenningsplaats van een constitutief exon en de daaropvolgende overname van AS-regelelementen. (b) Exonisatie van introns of introngebieden of transposable elementen met daaropvolgende overname van AS-regelgebieden. Nieuwe eiwitten kunnen met verschillende eiwitten interageren of in verschillende subcellulaire gebieden gelokaliseerd zijn. (c) Exon-duplicatie en daaropvolgende specialisatie functionele domeinen en AS-regelgebieden. Resulterende gespecialiseerde eiwitten kunnen gedeeltelijke rollen op zich nemen die relevant zijn in verschillende celtypes of ontwikkelingsstadia of resulteren in nieuwe interacties en functies.

Genenen kunnen ook verder alternatieve splicing en regulatie krijgen na duplicatie samen met de complexiteit van de orgaansystemen na de divergentie van protochordaten en vertebraten. Vergelijking tussen transcriptiefactoren Pax genen in vertebraten en amphioxus heeft aangetoond dat ten minste 52 gerapporteerde alternatieve-splicing gebeurtenissen in vertebraten vergeleken met 23 gebeurtenissen in amphioxus . Bovendien hebben de Pax-genen van vertebraten de meeste van hun voorouderlijke functies behouden en hebben ze ook hun expressie uitgebreid. Er is aangetoond dat nieuwe alternatieve splicing van Pax-genen de functionele domeininhoud (b.v. DNA-binding) en de transactivatiecapaciteiten van de resulterende eiwitproducten wijzigt. Bijvoorbeeld, een nieuw alternatief transcript van Pax3 kan een cMET reporter construct in de muis transactiveren. Deze extra isovormen van Pax3 zijn voorgesteld om een functionele rol te spelen in de verwerving van nieuwe rollen op de neurale plaat in vertebraten . Evenzo zijn vertebraten-specifieke AS-gebeurtenissen van exon 5a in Pax4 en Pax6 in verband gebracht met functionele rollen in de ontwikkeling van het oog van vertebraten. Daarom is het redelijk om de hypothese voor te stellen dat, naast gen duplicatie, alternatieve splicing een belangrijke rol speelt in het verwerven van nieuwe functies die bijdragen tot de complexiteit van de orgaansystemen na de divergentie van protochordaten en vertebraten . De potentiële rol van de toenemende prevalentie van AS in vertebraten in functionele innovatie zal in de toekomst grotendeels worden onderzocht in meer genfamilies of op genoombreed niveau, wat ons begrip van hoe AS bijdraagt aan functionele innovatie zal bevorderen.

8. Conclusie

Hier hebben we bewijsmateriaal van genoombrede studies besproken, evenals mogelijke wegen voor toekomstige vergelijkende studies voor het potentieel van alternatieve splicing als een bron van functionele innovatie tijdens de evolutie van het eukaryotische genoom. Hoewel het nu duidelijk is dat AS prevalent is in het menselijk genoom, blijven er nog obstakels bestaan bij de beoordeling van de wijze waarop alternatieve splicing in de loop van de tijd is geëvolueerd. Het belangrijkste obstakel ligt in het feit dat, terwijl de meeste andere genomische kenmerken rechtstreeks kunnen worden gemeten of geschat op basis van genomische sequenties alleen, geen nauwkeurige schattingen van alternatieve splicing kunnen worden verkregen op basis van genomische sequentieanalyse. De afhankelijkheid van de beschikbaarheid van transcriptsequenties om AS te meten, samen met de sterke bias als gevolg van de ongelijke transcriptdekking, heeft de genoombrede beoordeling van AS in alle soorten behalve een paar modelsoorten bemoeilijkt en bemoeilijkt elke directe vergelijking tussen soorten. Dit heeft de studie vertraagd van hoe alternatieve splicing in de loop van de tijd geëvolueerd is, hoe AS gereguleerd wordt, en hoe het verband kan houden met andere genomische kenmerken en het meest cruciale met het fenotype. De steeds toenemende transcript profilering voor veel meer soorten in combinatie met het gebruik van vergelijkbare index schattingen zal het mogelijk maken een aantal evolutionaire vragen over de evolutie van AS en de implicaties daarvan voor de evolutie van transcript diversiteit en functionele innovatie te beantwoorden.

Conflict of Interests

De auteurs verklaren geen belangenconflict.

Acknowledgments

De auteurs willen Humberto Gutierrez bedanken voor commentaar op eerdere versies van dit artikel. Dit werk werd gefinancierd door UK-China Scholarship for Excellence en University of Bath Research Studentship aan L. Chen, een CONACyT Scholarship aan J. M. Tovar-Corona, en een Royal Society Dorothy Hodgkin Research Fellowship, Royal Society Research Grant, en een Royal Society Research Grant for Fellows aan A. O. Urrutia.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.