Abstract
Lo splicing alternativo (AS) è un processo post-trascrizionale comune negli organismi eucariotici, attraverso il quale più trascrizioni funzionali distinte sono prodotte da un singolo gene. Il rilascio della bozza del genoma umano ha rivelato un numero di geni molto più piccolo del previsto. A causa del suo ruolo potenziale nell’espansione della diversità proteica, l’interesse per lo splicing alternativo è aumentato nell’ultimo decennio. Anche se studi recenti hanno dimostrato che il 94% dei geni umani multiexon subiscono AS, l’evoluzione di AS e quindi il suo ruolo potenziale nell’innovazione funzionale nei genomi eucariotici rimangono in gran parte inesplorati. Qui rivediamo le prove disponibili per quanto riguarda l’evoluzione della prevalenza di AS e il ruolo funzionale. Inoltre sottolineiamo la necessità di correggere il forte effetto della copertura dei trascritti nel rilevamento di AS e definiamo una strategia per chiarire in ultima analisi l’entità del ruolo di AS nell’innovazione funzionale su scala genomica.
1. Introduzione
La prima bozza della sequenza del genoma umano è stata svelata nel febbraio 2001 e sorprendentemente ha dimostrato di contenere ~23000 geni, solo una frazione del numero di geni originariamente previsto. Per mettere questo in prospettiva, ci sono ~ 20.000 geni nel genoma del nematode C. elegans. La mancanza di un’associazione tra il numero di geni e la complessità dell’organismo ha portato ad un maggiore interesse per lo splicing alternativo (AS), dato che è stato proposto come un fattore importante nell’espansione della complessità normativa e funzionale, della diversità proteica e della complessità dell’organismo degli eucarioti superiori. Tuttavia, nonostante i migliori sforzi di molti gruppi di ricerca, capiamo ancora molto poco sul ruolo effettivo giocato dall’AS nell’evoluzione dell’innovazione funzionale – qui intesa come la comparsa di nuove trascrizioni funzionali – alla base dell’aumentata complessità organismica osservata.
Lo splicing alternativo è un processo post-trascrizionale negli organismi eucarioti mediante il quale più trascrizioni distinte sono prodotte da un singolo gene. Studi precedenti utilizzando la tecnologia di sequenziamento ad alta capacità hanno riportato che fino al 92% ~ 94% dei geni umani multiexon subiscono AS, spesso in un tessuto / stadio di sviluppo-specifico modo. Con lo sviluppo e il costante miglioramento del profilo di trascrizione dell’intero genoma e degli algoritmi bioinformatici, l’ubiquità di AS nel genoma dei mammiferi ha cominciato a diventare chiara. Il concetto di un gene-una proteina ha lasciato il posto all’evidenza dell’alta percentuale di incidenza di AS nelle specie non umane, come il moscerino della frutta, l’Arabidopsis e altri eucarioti. Nonostante i progressi nella nostra comprensione e caratterizzazione di AS diverse domande rimangono senza risposta. In primo luogo, la grande differenza nella copertura del trascritto tra le specie ha ostacolato i confronti diretti della prevalenza dello splicing alternativo nelle diverse specie. In secondo luogo, anche se si potessero ottenere stime comparabili di AS tra le specie, non è chiaro in che misura i cambiamenti nella prevalenza di AS lungo l’evoluzione abbiano contribuito alla diversità proteica complessiva o piuttosto riflettano il rumore dello splicing. Infine, capiamo molto poco su come AS si è evoluto nel tempo e come questo è legato ai parametri funzionali dei geni. Qui esaminiamo come lo splicing alternativo è regolato e i recenti progressi nella nostra comprensione dell’evoluzione dello splicing alternativo.
2. Splicing alternativo e la sua regolazione
Nel 1977, Chow et al. riportarono che le sequenze terminali 5′ e 3′ di diversi mRNA dell’adenovirus 2 (Ad2) variavano, implicando un nuovo meccanismo per la generazione di diversi mRNA distinti. In seguito a questo studio, lo splicing alternativo è stato trovato anche nel gene che codifica l’ormone tiroideo calcitonina nelle cellule di mammifero. Studi successivi hanno rivelato che molti altri geni erano anche in grado di generare più di una trascrizione tagliando diverse sezioni dalle sue regioni codificanti (riviste in ).
A seconda della posizione dei segmenti esonici tagliati – o se gli introni vengono lasciati – gli eventi di splicing possono essere classificati in quattro tipi fondamentali (Figura 1). Queste quattro modalità principali di splicing sono (1) exon skipping (2) intron retention (3) alternativa 5′ sito di splicing (5′ss), e (4) alternativa 3′ sito di splicing (3′ss) . Inoltre, esoni mutuamente esclusivi, iniziazione alternativa e poliadenilazione alternativa forniscono altri due meccanismi per la generazione di varie isoforme di trascrizione. Inoltre, diversi tipi di splicing alternativo possono verificarsi in modo combinatorio e un esone può essere soggetto a più di una modalità AS, per esempio, 5′ss e 3′ss allo stesso tempo (Figura 1). La prevalenza di ogni tipo di AS è stata trovata per variare tra i diversi taxa. Diversi studi hanno dimostrato che il salto degli esoni è comune nei genomi dei metazoi, mentre la ritenzione degli introni è il tipo più comune di AS tra le piante e i funghi.
Diversi tipi di splicing alternativo. Le caselle blu sono esoni costitutivi e le regioni con splicing alternativo in rosso. Gli introni sono rappresentati da linee rette tra le scatole. Sono stati identificati quattro tipi di eventi di splicing comuni: (1) salto di esoni (2) ritenzione di introni (3) sito di splicing alternativo 5′ (5′ss), e (4) sito di splicing alternativo 3′ (3′ss).
Lo splicing alternativo è strettamente regolato da elementi cis e da fattori transacting che si legano a questi elementi cis. I fattori di transazione, principalmente proteine leganti l’RNA, modulano l’attività dello spliceosoma e degli elementi cis come gli esaltatori di splicing esonico (ESEs), i silenziatori di splicing esonico (ESSs), gli esaltatori di splicing intronico (ISEs) e i silenziatori di splicing intronico (ISSs). Il meccanismo canonico di AS suggerisce che le proteine ricche di serina/arginina (SR) si legano tipicamente a ESEs, mentre le ribonucleoproteine nucleari eterogenee (hnRNP) tendono a legarsi a ESSs o ISSs. Dati i ruoli cruciali di questi regolatori nel macchinario di splicing, le mutazioni cis e transacting, che interrompono il codice di splicing, sono note per causare malattie (riviste in ). È stato stimato che il 15-60% delle mutazioni causa la malattia influenzando il modello di splicing dei geni ( e rivisto in ). Inoltre, AS ha anche dimostrato di essere regolato senza il coinvolgimento di fattori di splicing ausiliari e AS può anche essere combinato con altri eventi post-trascrizionali come l’uso di più siti di iniziazione della traduzione interna, RNA editing, decadimento mRNA, e legame microRNA e altri RNA non codificanti, suggerendo l’esistenza di ulteriori meccanismi non canonici di AS che devono ancora essere identificati.
Di recente, è stato riportato un ruolo diretto delle modifiche degli istoni nello splicing alternativo, in cui la modifica degli istoni (H3-K27m3) influisce sul risultato dello splicing influenzando il reclutamento dei regolatori di splicing attraverso una proteina legante la cromatina in un certo numero di geni umani come FGFR2, TPM2, TPM1 e PKM2. Inoltre, è stato riportato che la pausa della RNA polimerasi II promossa da CTCF collega la metilazione del DNA allo splicing, fornendo la prima prova della regolazione dello sviluppo del risultato dello splicing attraverso marchi epigenetici ereditabili. Inoltre, gli RNA non codificanti sono emersi anche come determinanti chiave dei modelli di splicing alternativo. Pertanto questi risultati rivelano un ulteriore strato epigenetico nella regolazione della trascrizione e dello splicing alternativo. Studi genetici ed epigenetici a livello genomico, quindi, sono stati proposti in almeno 100 tipi specifici di cellule del sangue, che forniranno epigenomi di riferimento di alta qualità (utilizzando la metilazione del DNA e saggi di marcatura degli istoni) con dati genetici e trascrittomi dettagliati (sequenziamento del genoma intero, RNA-Seq, e miRNA-Seq), dandoci l’opportunità di valutare l’influenza a livello genomico dei fattori epigenetici nella regolazione di AS in tipi specifici di cellule del sangue. Ci aspettiamo che l’aumento dell’epigenetica comparativa fornisca una prospettiva diversa dell’evoluzione del trascrittoma.
3. Identificazione degli eventi di splicing alternativo
Lo splicing alternativo è difficile da stimare dai soli parametri genomici. Un certo numero di motivi regolatori per lo splicing alternativo sono stati scoperti, ma la presenza di motivi noti di splicing alternativo non garantisce che un gene sia effettivamente splicing alternativo. Così, i modelli di splicing alternativo sono generalmente valutati dall’esame dei dati di trascrizione. Per qualsiasi gene di interesse, gli eventi di splicing alternativo possono essere identificati utilizzando la reazione a catena della polimerasi di trascrizione inversa (RT-PCR) condotta su una libreria di DNA complementare (cDNA). Nell’ultimo decennio, con il miglioramento delle tecnologie del trascrittoma ad alto rendimento, è diventato possibile valutare i modelli di splicing alternativo su scala genomica. Tre fonti principali di dati del trascrittoma sono state utilizzate per valutare i modelli di splicing: i tag di sequenza espressi (EST), i microarray di giunzione di splicing e il sequenziamento dell’RNA (RNA-Seq).
La prima ondata di analisi del trascrittoma a livello genomico consisteva nel sequenziamento diretto di cDNA ed EST effettuato su larga scala, che ha permesso di identificare gli eventi di splicing alternativo allineando le sequenze di cDNA/EST al genoma di riferimento. Gli EST sono 200-800 basi nucleotidiche di lunghezza, non modificate, selezionate casualmente, letture di sequenza a passaggio singolo derivate da librerie di cDNA. Attualmente, ci sono otto milioni di EST per l’uomo, compreso circa un milione di sequenze da tessuti tumorali, e circa 71 milioni di EST per circa 2000 specie in dbEST. Tuttavia, gli EST sono basati sul sequenziamento Sanger a bassa produttività e sono aggregati su una vasta gamma di tessuti, stati di sviluppo e malattie utilizzando livelli di sensibilità molto diversi.
Più recentemente, i microarray di giunzione di splice e RNA-Seq sono stati sempre più utilizzati per analizzare quantitativamente gli eventi di splicing alternativo. I microarray di splicing mirano a specifici esoni o giunzioni esone-esone con sonde oligonucleotidiche. Le intensità fluorescenti delle singole sonde riflettono l’uso relativo degli esoni di splicing alternativo in diversi tessuti e linee cellulari. I microarray ad alta densità di giunzioni di splicing sono un modo economico per testare gli esoni precedentemente noti e gli eventi AS con un basso tasso di falsi positivi. Lo svantaggio è che richiede una conoscenza preliminare delle varianti AS esistenti e delle strutture geniche. Ancora più importante a differenza di RNA-Seq e EST, i microarray non forniscono informazioni aggiuntive sulla sequenza.
RNA-Seq è emerso come una potente tecnologia per l’analisi del trascrittoma grazie alla sua capacità di produrre milioni di brevi letture di sequenza. Gli esperimenti di RNA-Seq forniscono informazioni approfondite sul paesaggio trascrizionale. L’accumulo sempre maggiore di dati ad alta produttività continuerà a fornire opportunità sempre più ricche per indagare ulteriori aspetti dell’AS, come gli eventi AS a bassa frequenza e gli eventi AS specifici del tessuto e/o dello sviluppo. I primi set di dati consistono in sequenze di lettura dell’RNA di 50 bp o meno, limitando le informazioni sulle combinazioni di eventi AS in una singola trascrizione, ma è probabile che la lunghezza delle letture brevi continuerà ad aumentare nel prossimo decennio. Con la crescente capacità del sequenziamento di prossima generazione (RNA-Seq), lo studio della speziatura alternativa subirà probabilmente una rivoluzione. La maggiore profondità di sequenziamento dei trascrittomi nell’uomo e in altre specie ha aumentato la nostra comprensione del verificarsi dell’evento AS e dei modelli di espressione AS in diversi tessuti, fasi di sviluppo.
L’assemblaggio di trascrizioni di tecnologie basate sulla sequenza, come ESTs e RNA-Seq, può utilizzare sia align-then-assemble o assemble-then-align, a seconda della qualità del genoma di riferimento e dati di sequenza. Un algoritmo può essere impiegato per rilevare l’evento AS confrontando diverse trascrizioni. Tuttavia, il rilevamento di isoforme AS, in contrasto con il singolo evento AS, è ancora impegnativo perché le sequenze brevi forniscono poche informazioni in termini di combinazione di esoni. Diverse applicazioni sono state sviluppate per l’assemblaggio della trascrizione e il rilevamento delle isoforme AS, diverse strategie e il confronto di queste applicazioni sono state esaminate in precedenza.
4. Prevalenza dello splicing alternativo nei genomi eucariotici
Le analisi iniziali del genoma intero hanno suggerito che il 5%-30% dei geni umani sono stati splicati alternativamente (rivisto in ). I database EST-based AS identificano eventi AS nel 40-60% dei geni umani; tuttavia, recentemente questo numero è stato rivisto più e più volte con le ultime stime che mostrano che fino al 94% dei geni umani multiexon producono più di un trascritto attraverso lo splicing alternativo. Capire come lo splicing alternativo è cambiato nel tempo potrebbe fornire intuizioni su come lo splicing alternativo ha avuto un impatto sulla diversità delle trascrizioni e delle proteine e sull’evoluzione del fenotipo. Nei funghi, si ritiene che lo splicing alternativo sia raro a causa del basso numero di esoni nel lievito. Nelle piante è stato stimato che circa il 20% dei geni subiscono AS sulla base dei dati EST, un recente studio utilizzando RNA-Seq, tuttavia, suggerisce che almeno circa il 42% dei geni contenenti introni in Arabidopsis sono splicing alternativo. Ci aspettiamo che percentuali significativamente più elevate di occorrenza AS saranno scoperti da vari eucarioti dato gli studi approfonditi di trascrittoma utilizzando la prossima generazione di sequenziamento come RNA-Seq sono in corso. Alcuni studi hanno tentato di confrontare la prevalenza di AS tra diversi taxa con gli animali generalmente segnalati per avere una maggiore incidenza AS rispetto alle piante e i vertebrati che hanno una maggiore incidenza AS rispetto agli invertebrati. Tuttavia, questi studi sono basati su dati limitati o non sono riusciti a correggere le differenze nella copertura dei trascritti.
Esiste una serie di banche dati che forniscono dati AS per più specie. Tuttavia, queste risorse esistenti sono principalmente focalizzate sulle specie animali e hanno una scarsa copertura per i genomi di protisti, funghi e piante, rendendo così difficile il confronto tra taxa divergenti. Soprattutto, nessuna di queste risorse prende in considerazione gli effetti ben documentati della copertura differenziale di trascrizione tra i geni all’interno e tra le specie che influenza notevolmente i tassi di rilevamento AS. Il campionamento casuale è stato usato e dimostrato per minimizzare la distorsione della copertura dei trascritti (Figura 2). Ci aspettiamo che strategie simili saranno impiegate in future risorse di dati comparativi AS.
(a)
(b)
(a)
(b)
Il numero totale di trascrizioni influenza il rilevamento di AS ma gli errori possono essere corretti usando un metodo di campionamento. Rilevamento di AS nei geni diviso per la copertura dei trascritti per il nematode (a e b) usando il dataset completo dei trascritti (a) o un metodo di campionamento casuale (b).
5. Lo splicing alternativo è funzionale o per lo più solo rumore?
Se un aumento dei livelli di AS nelle specie vertebrate rispetto agli invertebrati è confermato, date le limitazioni delle attuali risorse proteomiche, è difficile valutare la misura in cui i trascritti con splicing alternativo sono tradotti in un proteoma espanso. L’evoluzione di molti fenotipi che più associamo all’essere umano, come la durata della vita più lunga, l’encefalizzazione, o anche una maggiore complessità, sono stati accompagnati da forti riduzioni della dimensione effettiva della popolazione, forse spiegando la proliferazione di una varietà di caratteristiche genomiche in organismi più complessi ( ma vedi ). Pertanto, è possibile che l’aumento dell’AS attraverso l’evoluzione derivi dallo splicing aberrante e che quindi non svolga alcun ruolo funzionale. Se lo splicing alternativo è aumentato lungo l’albero filogenetico ed è davvero funzionale, possiamo aspettarci quanto segue.(A) I trascritti dovrebbero avere una bassa incidenza di codoni di stop prematuri che li renderebbero vulnerabili al decadimento mediato dal nonsenso. Tra il 4% e il 35% dei trascritti umani AS sono stati trovati a contenere un codone di terminazione prematura nei trascritti umani e murini. Questi trascritti sono stati trovati per essere arricchiti in esoni non conservati che possono causare frame shift. Non è noto se la proporzione di trascrizioni AS contenenti codoni di terminazione prematura sia cambiata lungo l’albero filogenetico.(B) È stato proposto che la maggior parte delle isoforme alternative a basso numero di copie prodotte nelle cellule umane siano probabilmente non funzionali. Uno studio recente ha dimostrato che anche se le varianti di splicing alternativo specifiche per il cancro possono essere trovate, questi eventi si trovano per lo più come eventi a copia singola e quindi è improbabile che contribuiscano al trascrittoma centrale del cancro.(C) La conservazione degli eventi di splicing alternativo lungo l’evoluzione può essere presa come un indicatore del loro ruolo funzionale. I livelli di conservazione di AS sono stati studiati in molte specie. La stima varia dall’11% al 67% tra l’uomo e il topo. In particolare, le forme maggiori di AS tendono ad avere livelli di conservazione più alti rispetto alle forme minori. D’altra parte, le forme conservate AS variano tra i diversi AS; per esempio, exon skipping tra C. elegans e C. briggsae ha mostrato più di 81% livello di conservazione, rispetto al 28% per la ritenzione di introni .(D) Presenza di domini funzionali identificabili in aree AS può anche essere un indicatore di rilevanza funzionale per trascrizioni AS . A nostra conoscenza non ci sono rapporti sulla prevalenza di domini funzionali in aree AS in specie modello. Per esaminare la presenza di domini funzionali in trascrizioni AS, abbiamo compilato un set di 267.996 eventi AS ottenuti dall’analisi di 8.315.254 EST da tessuti umani normali. Abbiamo trovato che circa il 50% delle aree AS nell’uomo contengono componenti funzionali noti usando InterProScan che contiene 14 applicazioni per la predizione dei domini proteici (Figura 3, vedi metodi in ), suggerendo un possibile ruolo funzionale per AS. L’entità delle variazioni nella prevalenza di domini funzionali tra le aree AS tra le specie rimane da esplorare, ma fornirebbe ulteriori informazioni sull’evoluzione di AS.
Percentuale di aree AS contenenti domini funzionali identificabili, strutture secondarie e codoni di stop nell’uomo. I componenti funzionali sono stati identificati utilizzando InterProScan che contiene 14 applicazioni per la predizione dei domini proteici, tra cui Pfam per la predizione dei domini proteici, SignalP 3.0 per la predizione dei peptidi di segnale e TMHMM per la predizione dei domini transmembrana. PSORT II è stato utilizzato per identificare la probabile localizzazione subcellulare dei prodotti proteici. Le strutture secondarie delle proteine sono state previste da CLC Main Workbench 5.7, che si basa su sequenze di proteine estratte dalla banca dati delle proteine (http://www.rcsb.org/pdb/).
Preso insieme le osservazioni di cui sopra suggeriscono che, sebbene gli eventi di splicing alternativo siano effettivamente conservati nel corso dell’evoluzione, una parte significativa non lo è e alcuni possono derivare da uno splicing rumoroso della trascrizione che non contribuisce al pool delle proteine. Tuttavia, fino a quando ulteriori studi non utilizzeranno indici AS comparabili, sarà impossibile stimare in che misura gli aumenti dei livelli AS lungo l’albero filogenetico abbiano avuto un impatto sul pool di trascrizioni funzionali.
6. Splicing alternativo e duplicazione genica
La duplicazione genica (GD) è considerata una fonte primaria di innovazione funzionale nel genoma. I geni appena duplicati possono evolvere la divergenza funzionale, e si pensa che sia la chiave per guidare l’evoluzione della complessità dello sviluppo e della morfologia nei vertebrati. Lo splicing alternativo, come un meccanismo prevalente che aumenta anche la diversità delle proteine, è stato proposto come un potenziale giocatore nell’evoluzione degli eucarioti. Esaminando la relazione tra la duplicazione dei geni e lo splicing alternativo possiamo capire meglio in che misura entrambi i meccanismi sono mezzi equivalenti per la diversificazione delle proteine. Diversi studi hanno riportato una correlazione negativa tra AS e la dimensione della famiglia di geni nell’uomo e nel topo e nel verme (Tabella 1). È facile portare alla conclusione che AS e GD siano intercambiabili e che ci sia una correlazione negativa universale dal verme all’uomo. Tuttavia, la relazione tra le due variabili è marginale nel migliore dei casi e non è coerente quando si includono i geni singleton che hanno un livello di AS inferiore rispetto alle famiglie multigene. Jin et al. hanno suggerito che i singleton hanno più costrizione evolutiva dei duplicati che ostacola il loro guadagno di isoforme AS. Coerentemente con questa ipotesi, Lin et al. hanno trovato che i singleton differiscono dalle famiglie multigene in diversi aspetti, suggerendo che hanno percorsi evolutivi diversi. Anche se ci concentriamo solo sulle famiglie multigene, una correlazione negativa tra AS e la dimensione della famiglia di geni può essere spiegata o sottoprodotto di AS e covarianza della dimensione della famiglia di geni con altri fattori. Per esempio, l’età del gene e la duplicazione distorta sono state proposte come spiegazione. Questo studio ha messo in dubbio la relazione tra AS e GD e può effettivamente fornire supporto al suggerimento che AS e GD hanno poca o nessuna equivalenza riguardo agli effetti sulla sequenza, la struttura e la funzione delle proteine. Poiché la maggior parte degli studi ha esaminato un piccolo numero di specie modello, è difficile valutare la portata del legame tra AS e GD. Inoltre, l’approccio istantaneo di confrontare GFS e AS in un singolo genoma potrebbe nascondere la vera relazione tra AS e GFS.
|
7. Il contributo dello splicing alternativo all’innovazione funzionale
Lo splicing alternativo è stato salutato come la fonte mancante di informazioni nel genoma che spiega l’evoluzione di una maggiore complessità nonostante il numero di geni quasi statico nei metazoi negli ultimi 800 milioni di anni. Wegmann et al. hanno scoperto che l’ampiezza dell’espressione genica è positivamente correlata al numero di nuove isoforme di trascrizione e hanno proposto che l’aumento dell’ampiezza dell’espressione genica è essenziale per acquisire nuove isoforme di trascrizione, che potrebbero essere mantenute da una nuova forma di selezione equilibrante. Inoltre, le analisi sperimentali e bioinformatiche hanno dimostrato che l’AS può generare una varietà di mRNA funzionali e prodotti proteici, mostrando proprietà di stabilità distinte, localizzazione subcellulare e funzione così come in fasi specifiche nella differenziazione cellulare, differenziazione sessuale e sviluppo.
Gli studi su singoli geni hanno fornito esempi in cui lo splicing alternativo può portare all’innovazione funzionale prima che qualsiasi evento di duplicazione del gene abbia avuto luogo. Uno di questi esempi è quello della Troponina I (TnI), che svolge un ruolo chiave nella contrazione muscolare. Nel genoma dei vertebrati, TnI esiste in tre copie, ciascuna espressa in un diverso tipo di muscolo (scheletrico, veloce e lento, e cardiaco). In Ciona, uno dei parenti più stretti dei vertebrati, TnI è presente come un singolo gene. È interessante notare, tuttavia, che il gene Ciona produce tre distinte isoforme con splicing alternativo, ognuna delle quali assomiglia al profilo di espressione di uno dei geni dei vertebrati, suggerendo che la specializzazione delle proteine TnI per funzionare in ogni tipo di muscolo ha preceduto eventi di duplicazione del gene. Questo modello di varianti di splicing alternativo in geni ancestralmente singoli che assomigliano a profili di espressione di geni successivamente duplicati è stato trovato anche nei geni synapsin-2 in tetrapodi e geni MITF in specie di pesci teleostei. Questi esempi suggeriscono che lo splicing alternativo può essere un meccanismo di innovazione funzionale che precede eventi di duplicazione genica attraverso uno dei tre percorsi possibili (Figura 4).
(a) Degenerazione del segnale di splicing
(b) Esonizzazione di DNA nonDNA non codificante o trasposoni
(c) Duplicazione di esoni e specializzazione di isoforme
(a) Degenerazione del segnale di splicing
(b) Esonizzazione di DNA non codificante o trasposoni
(c) Duplicazione di esoni e specializzazione di isoforme
Le nuove varianti di AS possono assumere ruoli specializzati o nuovi. Le nuove varianti di splicing possono derivare da (a) mutazioni nel sito di riconoscimento degli esoni di un esone costitutivo e successiva acquisizione di elementi regolatori AS. (b) Esonizzazione di introni o regioni di introni o elementi trasponibili con successiva acquisizione di regioni regolatrici AS. Le nuove proteine possono interagire con diverse proteine o localizzarsi in diverse regioni subcellulari. (c) Duplicazione degli esoni e successiva specializzazione dei domini funzionali e delle regioni regolatrici AS. Le proteine specializzate risultanti possono assumere ruoli parziali rilevanti in diversi tipi di cellule o stadi di sviluppo o risultare in nuove interazioni e funzioni.
I geni possono anche guadagnare ulteriormente splicing alternativo e regolazione dopo la duplicazione insieme alla complessità dei sistemi di organi dopo la divergenza dei protocordati e vertebrati. Il confronto tra i fattori trascrizionali dei geni Pax nei vertebrati e negli anfiossi ha mostrato che almeno 52 eventi di splicing alternativo riportati nei vertebrati rispetto a 23 eventi negli anfiossi. Inoltre, i geni Pax dei vertebrati hanno mantenuto la maggior parte delle loro funzioni ancestrali e hanno anche ampliato la loro espressione. È stato dimostrato che il nuovo splicing alternativo dei geni Pax modifica il contenuto del dominio funzionale (ad esempio, il legame al DNA) e le capacità di transattivazione dei prodotti proteici risultanti. Per esempio, una nuova trascrizione alternativa di Pax3 può transattivare un costrutto reporter cMET nel topo. Queste isoforme aggiuntive di Pax3 sono state proposte per svolgere un ruolo funzionale nell’acquisizione di nuovi ruoli nella placca neurale nei vertebrati. Allo stesso modo, vertebrati-specifici eventi AS dell’esone 5a in Pax4 e Pax6 sono stati collegati a ruoli funzionali nello sviluppo dell’occhio vertebrato. Pertanto, è ragionevole proporre l’ipotesi che, oltre alla duplicazione del gene, lo splicing alternativo gioca ruoli importanti nell’acquisizione di nuove funzioni che contribuiscono alla complessità dei sistemi di organi dopo la divergenza dei protocordati e dei vertebrati. I ruoli potenziali della crescente prevalenza di AS nei vertebrati nell’innovazione funzionale saranno ampiamente esplorati in più famiglie di geni o a livello genomico in futuro, il che aumenterà la nostra comprensione di come AS contribuisce all’innovazione funzionale.
8. Conclusione
Qui abbiamo esaminato le prove da studi genomici così come le possibili vie per futuri studi comparativi per il potenziale dello splicing alternativo come fonte di innovazione funzionale durante l’evoluzione del genoma eucariotico. Mentre è ormai chiaro che lo splicing alternativo è prevalente nel genoma umano, rimangono ancora ostacoli nella valutazione di come lo splicing alternativo si sia evoluto nel tempo. L’ostacolo principale sta nel fatto che mentre la maggior parte delle altre caratteristiche genomiche possono essere misurate o stimate direttamente dalle sole sequenze genomiche, nessuna stima accurata dello splicing alternativo può essere ottenuta dall’analisi della sequenza genomica. La dipendenza dalla disponibilità di sequenze di trascrizione per misurare lo splicing alternativo insieme alla forte distorsione causata da una copertura disuguale delle trascrizioni ha ostacolato la valutazione genomica dello splicing alternativo in tutte le specie modello tranne alcune e rende difficile qualsiasi confronto diretto tra le specie. Questo ha rallentato lo studio di come lo splicing alternativo si sia evoluto nel tempo, di come l’AS sia regolato e di come possa essere collegato ad altre caratteristiche genomiche e soprattutto al fenotipo. La profilazione dei trascritti in continuo aumento per molte più specie, combinata con l’uso di stime di indici comparabili, permetterà di affrontare una serie di domande evolutive riguardanti l’evoluzione dell’AS e le sue implicazioni per l’evoluzione della diversità dei trascritti e l’innovazione funzionale.
Conflitto di interessi
Gli autori non dichiarano alcun conflitto di interessi.
Riconoscimenti
Gli autori desiderano ringraziare Humberto Gutierrez per i commenti sulle versioni precedenti di questo articolo. Questo lavoro è stato finanziato da UK-China Scholarship for Excellence e University of Bath Research Studentship a L. Chen, una borsa di studio CONACyT a J. M. Tovar-Corona, e una Royal Society Dorothy Hodgkin Research Fellowship, Royal Society Research Grant, e una Royal Society Research Grant for Fellows a A. O. Urrutia.