Splicing alternativ: A Potential Source of Functional Innovation in the Eukaryotic Genome

Abstract

Alternative splicing (AS) este un proces posttranscripțional comun în organismele eucariote, prin care mai multe transcripții funcționale distincte sunt produse de o singură genă. Publicarea proiectului genomului uman a dezvăluit un număr mult mai mic de gene decât se anticipa. Datorită rolului său potențial în extinderea diversității proteinelor, interesul pentru splicingul alternativ a crescut în ultimul deceniu. Deși studii recente au arătat că 94% din genele multiexonice umane sunt supuse AS, evoluția AS și, prin urmare, rolul său potențial în inovarea funcțională în genomurile eucariote rămân în mare parte neexplorate. Aici trecem în revistă dovezile disponibile în ceea ce privește evoluția prevalenței și rolul funcțional al AS. În plus, subliniem necesitatea de a corecta efectul puternic al acoperirii transcriptelor în detectarea AS și stabilim o strategie pentru a elucida, în cele din urmă, amploarea rolului AS în inovarea funcțională la scară genomică.

1. Introducere

Primul proiect al secvenței genomului uman a fost dezvăluit în februarie 2001 și, în mod surprinzător, s-a demonstrat că acesta conține ~23000 de gene, doar o fracțiune din numărul de gene prezise inițial . Pentru a pune acest lucru în perspectivă, există ~20.000 de gene în genomul nematodului C. elegans. Lipsa unei asocieri între numărul de gene și complexitatea organismului a dus la un interes sporit pentru splicingul alternativ (AS), având în vedere că acesta a fost propus ca fiind un factor major în extinderea complexității de reglementare și funcționale, a diversității proteinelor și a complexității organismului eucariotelor superioare . Cu toate acestea, în ciuda celor mai bune eforturi ale multor grupuri de cercetare, înțelegem încă foarte puțin despre rolul real jucat de AS în evoluția inovației funcționale – aici înțeleasă ca apariția unor transcripte funcționale noi – care stă la baza complexității crescute a organismului observate.

Splicarea alternativă este un proces posttranscripțional în organismele eucariote prin care se produc mai multe transcripte distincte dintr-o singură genă . Studii anterioare care utilizează tehnologia de secvențiere de mare randament au raportat că până la 92%~94% din genele multiexon umane suferă AS , adesea într-o manieră specifică pentru fiecare țesut/etapă de dezvoltare . Odată cu dezvoltarea și îmbunătățirea constantă a profilării transcripției întregului genom și a algoritmilor bioinformatici, a început să devină clară ubicuitatea AS în genomul mamiferelor. Conceptul de „o genă – o proteină” a cedat pe măsură ce au crescut dovezile cu privire la procentul ridicat de incidență a AS la speciile non-umane, cum ar fi musca de fructe, Arabidopsis și alte eucariote. În ciuda progreselor înregistrate în înțelegerea și caracterizarea SA, mai multe întrebări rămân fără răspuns. În primul rând, diferența mare în ceea ce privește acoperirea transcriptelor între specii a împiedicat comparațiile directe ale prevalenței splicingului alternativ la diferite specii . În al doilea rând, chiar dacă ar putea fi obținute estimări comparabile ale AS între specii, nu este clar în ce măsură orice modificări ale prevalenței AS de-a lungul evoluției au contribuit la diversitatea generală a proteinelor sau reflectă mai degrabă zgomotul de splicing. În cele din urmă, înțelegem foarte puțin despre modul în care AS a evoluat de-a lungul timpului și despre modul în care acest lucru este legat de parametrii funcționali ai genelor. Aici trecem în revistă modul în care este reglementat splicingul alternativ și progresele recente în înțelegerea evoluției splicingului alternativ.

2. Splicingul alternativ și reglementarea sa

În 1977, Chow et al. au raportat că secvențele terminale 5′ și 3′ ale mai multor ARNm ale adenovirusului 2 (Ad2) au variat, implicând un nou mecanism pentru generarea mai multor ARNm distincte. În urma acestui studiu, s-a descoperit splicing alternativ și în gena care codifică hormonul tiroidian calcitonina în celulele mamiferelor. Studii ulterioare au arătat că multe alte gene au fost, de asemenea, capabile să genereze mai mult de un transcript prin decuparea unor secțiuni diferite din regiunile sale codificatoare (revizuit în ).

În funcție de localizarea segmentelor exonice decupate – sau dacă intronii sunt lăsați înăuntru, evenimentele de splicing pot fi clasificate în patru tipuri de bază (figura 1). Aceste patru moduri majore de splicing sunt (1) omiterea exonului (2) reținerea intronului (3) situsul de splicing 5′ alternativ (5′ss) și (4) situsul de splicing 3′ alternativ (3′ss) . În plus, exonii care se exclud reciproc, inițierea alternativă și poliadenilarea alternativă oferă alte două mecanisme de generare a diferitelor izoforme de transcriere. Mai mult, diferite tipuri de splicing alternativ pot avea loc într-o manieră combinatorie și un exon poate fi supus mai multor moduri AS, de exemplu, 5′ss și 3′ss în același timp (figura 1). S-a constatat că prevalența fiecărui tip de AS variază de la un taxon la altul. Mai multe studii au arătat că omiterea exonilor este frecventă în genomurile metazoarelor, în timp ce retenția intronilor este cel mai frecvent tip de AS printre plante și ciuperci .

Figura 1

Diferite tipuri de splicing alternativ. Cutiile albastre reprezintă exoni constitutivi și regiunile splitate alternativ în roșu. Intronii sunt reprezentați prin linii drepte între cutii. Au fost identificate patru tipuri de evenimente comune de splicing: (1) omiterea exonului (2) retenția intronului (3) situsul de splicing alternativ 5′ (5′ss) și (4) situsul de splicing alternativ 3′ (3′ss).

Splicingul alternativ este strâns reglementat de elementele cis, precum și de factorii de tranzacție care se leagă de aceste elemente cis. Factorii transactanți, în principal proteine de legare a ARN-ului, modulează activitatea spliceosomului și a elementelor cis, cum ar fi stimulatorii de splicing exonic (ESEs), silențiatorii de splicing exonic (ESSs), stimulatorii de splicing intronic (ISEs) și silențiatorii de splicing intronic (ISSs). Mecanismul canonic al AS sugerează că proteinele bogate în serină/arginină (SR) se leagă de obicei de ESEs, în timp ce ribonucleoproteinele nucleare eterogene (hnRNP) tind să se lege de ESSs sau ISSs . Având în vedere rolurile cruciale ale acestor regulatori în mașinăria de splicing, se știe că mutațiile cis și tranzacționale, care perturbă codul de splicing, provoacă boli (revizuit în ). S-a estimat că 15-60% dintre mutații cauzează boli prin afectarea modelului de splicing al genelor ( și revizuit în ). În plus, s-a demonstrat, de asemenea, că AS este reglată fără implicarea factorilor auxiliari de splicing, iar AS poate fi, de asemenea, combinată cu alte evenimente posttranscripționale, cum ar fi utilizarea mai multor situsuri interne de inițiere a traducerii, editarea ARN, dezintegrarea ARNm și legarea microARN și a altor ARN necodificatori , ceea ce sugerează existența unor mecanisme necanonice suplimentare de AS care nu au fost încă identificate .

Recent, a fost raportat un rol direct al modificărilor histonice în splicingul alternativ, în care modificarea histonică (H3-K27m3) afectează rezultatul splicingului prin influențarea recrutării regulatorilor de splicing prin intermediul unei proteine de legare a cromatinei într-o serie de gene umane, cum ar fi FGFR2,TPM2,TPM1 și PKM2 . Mai mult decât atât, s-a raportat că pauza ARN polimerazei II promovată de CTCF leagă metilarea ADN-ului de splicing, furnizând prima dovadă a reglementării evolutive a rezultatului splicingului prin mărci epigenetice ereditare . În plus, ARN-urile necodificatoare au apărut, de asemenea, ca determinanți cheie ai modelelor de splicing alternativ . Prin urmare, aceste constatări dezvăluie un strat epigenetic suplimentar în reglementarea transcripției și a splicingului alternativ . Prin urmare, au fost propuse studii genetice și epigenetice la nivel genomic în cel puțin 100 de tipuri specifice de celule sanguine , care vor furniza epigenomuri de referință de înaltă calitate (utilizând teste de metilare a ADN-ului și mărci histonice) cu date genetice și transcriptomice detaliate (secvențierea întregului genom, RNA-Seq și miRNA-Seq), oferindu-ne posibilitatea de a evalua influența la nivel genomic a factorilor epigenetici în reglarea AS în tipuri specifice de celule sanguine. Ne așteptăm ca ascensiunea epigeneticii comparative să ofere o perspectivă diferită a evoluției transcriptomului.

3. Identificarea evenimentelor de splicing alternativ

Splicingul alternativ este dificil de estimat doar din parametrii genomici . Au fost descoperite o serie de motive de reglementare pentru AS, dar prezența motivelor de splicing alternativ cunoscute nu garantează că o genă este de fapt splicing alternativ . Astfel, modelele de splicing alternativ sunt, în general, evaluate în urma examinării datelor de transcriere. Pentru orice genă de interes, evenimentele de splicing alternativ pot fi identificate prin utilizarea reacției în lanț a polimerazei de transcripție inversă (RT-PCR) realizată pe o bibliotecă de ADN complementar (ADNc). În ultimul deceniu, pe măsură ce tehnologiile de transcriptom de mare capacitate s-au îmbunătățit, a devenit posibilă evaluarea modelelor de splicing alternativ la scară genomică. Trei surse principale de date transcriptomice au fost utilizate pentru a evalua modelele de splicing: etichete de secvență exprimată (EST), microplăci de joncțiune a îmbinării și secvențierea ARN (RNA-Seq).

Primul val de analiză a transcriptomului la nivel genomic a constat în secvențierea directă a ADNc și EST-uri realizată la scară largă , ceea ce a permis identificarea evenimentelor de splicing alternativ prin alinierea secvențelor ADNc/EST la genomul de referință. EST-urile sunt baze de 200-800 de nucleotide în lungime, needitate, selecționate la întâmplare, secvențe de secvență cu o singură trecere derivate din bibliotecile de ADNc . În prezent, există opt milioane de EST-uri pentru oameni, inclusiv aproximativ un milion de secvențe din țesuturi canceroase, și aproximativ 71 de milioane de EST-uri pentru aproximativ 2000 de specii în dbEST . Cu toate acestea, EST-urile se bazează pe secvențierea Sanger cu randament scăzut și sunt agregate pe o gamă largă de țesuturi, stări de dezvoltare și boli, folosind niveluri foarte diferite de sensibilitate.

Mai recent, microplăcile de joncțiune a îmbinării și RNA-Seq au fost utilizate din ce în ce mai mult pentru a analiza cantitativ evenimentele de splicing alternativ. Microrețelele de splicing vizează exoni specifici sau joncțiuni exon-exon cu sonde oligonucleotide. Intensitatea fluorescentă a sondelor individuale reflectă utilizarea relativă a exonilor de splicing alternativ în diferite țesuturi și linii celulare . Microrețelele de joncțiune de joncțiune de splice de înaltă densitate reprezintă o modalitate rentabilă de a testa exoni cunoscuți anterior și evenimente AS cu o rată fals pozitivă scăzută. Dezavantajul este că necesită cunoașterea prealabilă a variantelor AS existente și a structurilor genice. Mai important, spre deosebire de RNA-Seq și EST, microarrays nu furnizează informații suplimentare despre secvențe.

RNA-Seq a apărut ca o tehnologie puternică pentru analiza transcriptomului datorită capacității sale de a produce milioane de citiri de secvențe scurte . Experimentele RNA-Seq oferă informații aprofundate despre peisajul transcripțional . Acumularea din ce în ce mai mare de date de mare capacitate va continua să ofere oportunități tot mai bogate de investigare a altor aspecte ale AS, cum ar fi evenimentele AS de frecvență redusă, precum și evenimentele AS specifice țesutului și/sau specifice dezvoltării . Seturile de date anterioare constau în secvențe de citire a ARN-ului de 50 bp sau mai puțin, ceea ce limitează informațiile despre combinațiile de evenimente AS într-o singură transcripție, dar este probabil că lungimea citirilor scurte va continua să crească în următorul deceniu. Odată cu creșterea capacității de secvențiere de generație următoare (RNA-Seq), este posibil ca studiul condimentării alternative să sufere o revoluție . Adâncimea mai mare de secvențiere a transcriptomilor la om și la alte specii a sporit înțelegerea noastră cu privire la apariția evenimentului AS și a modelelor de expresie AS în diferite țesuturi , stadii de dezvoltare .

Asamblarea transcriptelor din tehnologiile bazate pe secvențe, cum ar fi EST și ARN-Seq, poate utiliza fie alinierea-și-asamblarea, fie asamblarea-și-alinierea, în funcție de calitatea genomului de referință și a datelor de secvență . Se poate utiliza un algoritm pentru a detecta evenimentul AS prin compararea diferitelor transcripte. Cu toate acestea, detectarea izoformelor AS, spre deosebire de evenimentul AS unic, este încă o provocare, deoarece secvențele scurte oferă puține informații în ceea ce privește combinația de exoni. Au fost dezvoltate mai multe aplicații pentru asamblarea transcriptelor și detectarea izoformelor AS, diferite strategii și compararea acestor aplicații au fost analizate anterior .

4. Prevalența splicării alternative în genomurile eucariote

Analizele inițiale ale întregului genom au sugerat că 5%-30% din genele umane au fost splicate alternativ (analizate în ). Bazele de date AS bazate pe EST identifică evenimente AS în 40-60% din genele umane ; cu toate acestea, recent, acest număr a fost revizuit de mai multe ori, cele mai recente estimări arătând că până la 94% din genele umane multiexonice produc mai mult de un transcript prin splicing alternativ . Înțelegerea modului în care splicingul alternativ s-a schimbat de-a lungul timpului ar putea oferi informații cu privire la modul în care splicingul alternativ a avut un impact asupra diversității transcriptelor și proteinelor și asupra evoluției fenotipurilor . La ciuperci, se crede că AS este rară din cauza numărului redus de exoni din drojdie . La plante, s-a estimat că aproximativ 20 % din gene sunt supuse AS pe baza datelor EST , însă un studiu recent care utilizează RNA-Seq sugerează că cel puțin aproximativ 42 % din genele care conțin introni din Arabidopsis sunt splitate alternativ . Ne așteptăm ca procente semnificativ mai mari de apariție a AS să fie descoperite la diverse eucariote, având în vedere că sunt în curs de desfășurare studii aprofundate ale transcriptomului cu ajutorul secvențierii de generație următoare, cum ar fi RNA-Seq. Câteva studii au încercat să compare prevalența AS între diferiți taxoni, animalele având, în general, o incidență mai mare a AS decât plantele și vertebratele având o incidență mai mare a AS decât nevertebratele . Cu toate acestea, aceste studii se bazează fie pe date limitate, fie nu au reușit să corecteze diferențele de acoperire a transcriptelor .

Există o serie de baze de date care furnizează date despre AS pentru mai multe specii . Cu toate acestea, aceste resurse existente se concentrează în principal asupra speciilor de animale și au o acoperire slabă pentru genomurile de protiste, ciuperci și plante, făcând astfel dificilă compararea taxonilor divergenți. Cel mai important, niciuna dintre aceste resurse nu ia în considerare efectele bine documentate ale acoperirii diferențiate a transcriptelor între gene în cadrul speciilor și între specii, ceea ce influențează foarte mult ratele de detectare a AS . A fost utilizată eșantionarea aleatorie și s-a demonstrat că aceasta minimizează distorsiunea acoperirii transcriptelor (figura 2). Ne așteptăm ca strategii similare să fie utilizate în viitoarele resurse comparative de date AS.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

Figura 2

Numărul total de transcrieri influențează detectarea AS, dar distorsiunea poate fi corectată prin utilizarea unei metode de eșantionare. Detectarea AS în gene împărțită la acoperirea transcriptelor pentru nematode (a și b) folosind setul complet de date de transcripte (a) sau o metodă de eșantionare aleatorie (b).

5. Este Splicingul alternativ funcțional sau în mare parte doar zgomot?

Dacă se confirmă o creștere a nivelurilor de AS la speciile de vertebrate în comparație cu cele de nevertebrate, având în vedere limitările resurselor proteomice actuale, este greu de evaluat măsura în care transcripțiile cu splicing alternativ sunt traduse într-un proteom extins. Evoluția multor fenotipuri pe care le asociem cel mai mult cu ființa umană, cum ar fi durata de viață mai mare, encefalizarea sau chiar complexitatea crescută, a fost însoțită de reduceri puternice ale dimensiunii efective a populației, explicând probabil proliferarea unei varietăți de caracteristici genomice în organismele mai complexe ( dar a se vedea ). Prin urmare, este posibil ca creșterea AS prin evoluție să rezulte din splicingul aberant și, prin urmare, să nu joace niciun rol funcțional . În cazul în care splicingul alternativ a crescut de-a lungul arborelui filogenetic și este într-adevăr funcțional, ne putem aștepta la următoarele: (A) Transcriptele ar trebui să aibă o incidență scăzută a codonilor de oprire prematură, ceea ce le-ar face vulnerabile la dezintegrarea mediată de nonsens. S-a constatat că între 4% și 35% din transcriptele umane AS conțin un codon de terminare prematură în transcriptele umane și de șoarece . S-a constatat că aceste transcripții au fost îmbogățite în exoni neconservați, susceptibili de a provoca schimbări de cadru. Nu se știe dacă proporția de transcripte AS care conțin codon de oprire prematură s-a modificat de-a lungul arborelui filogenetic.(B) S-a propus ca majoritatea izoformelor alternative cu număr redus de copii produse în celulele umane să fie probabil nefuncționale . Un studiu recent a arătat că, deși se pot găsi variante de replicare alternativă specifice cancerului, aceste evenimente se găsesc în cea mai mare parte ca evenimente cu o singură copie și, prin urmare, este puțin probabil să contribuie la transcriptomul de bază al cancerului .(C) Conservarea evenimentelor de replicare alternativă de-a lungul evoluției poate fi considerată un indicator al rolului lor funcțional. Nivelurile de conservare ale AS au fost studiate la multe specii. Estimarea variază de la 11% la 67% între om și șoarece . În special, formele majore de AS tind să aibă niveluri de conservare mai ridicate în comparație cu formele minore. Pe de altă parte, formele AS conservate variază între diferite AS; de exemplu, omiterea exonului între C. elegans și C. briggsae a arătat un nivel de conservare de peste 81%, comparativ cu 28% pentru retenția intronilor .(D) Prezența domeniilor funcționale identificabile în zonele AS poate fi, de asemenea, un indicator al relevanței funcționale pentru transcripții AS . După cunoștințele noastre, nu există rapoarte privind prevalența domeniilor funcționale în zonele AS la speciile model. Pentru a examina prezența domeniilor funcționale în transcriptele AS, am compilat un set de 267.996 de evenimente AS obținute din analiza a 8.315.254 de EST-uri din țesuturile umane normale. Am constatat că aproximativ 50% din zonele AS la om conțin componente funcționale cunoscute folosind InterProScan, care conține 14 aplicații pentru predicția domeniilor proteice (Figura 3, a se vedea metodele din ), sugerând un posibil rol funcțional pentru AS. Amploarea variațiilor în ceea ce privește prevalența domeniilor funcționale în rândul zonelor AS între specii rămâne de explorat, dar ar oferi informații suplimentare privind evoluția AS.

Figura 3

Penorarea zonelor AS care conțin domenii funcționale identificabile, structuri secundare și codoni de oprire la om. Componentele funcționale au fost identificate cu ajutorul InterProScan, care conține 14 aplicații pentru predicția domeniilor proteice , inclusiv Pfam pentru predicția domeniilor proteice , SignalP 3.0 pentru predicția peptidelor semnal , și TMHMM pentru predicția domeniilor transmembranare. PSORT II a fost utilizat pentru a identifica localizarea subcelulară probabilă a produselor proteice. Structurile secundare ale proteinelor au fost prezise de CLC Main Workbench 5.7, care se bazează pe secvențe de proteine extrase din banca de date a proteinelor (http://www.rcsb.org/pdb/).

Considerate împreună, observațiile de mai sus sugerează că, deși evenimentele de splicing alternativ sunt într-adevăr conservate de-a lungul evoluției, o proporție semnificativă nu sunt, iar unele pot rezulta din splicingul zgomotos al transcriptelor care nu contribuie la fondul de proteine. Cu toate acestea, până când nu se vor efectua studii suplimentare care să utilizeze indici AS comparabili, va fi imposibil să se estimeze măsura în care creșterile nivelurilor AS de-a lungul arborelui filogenetic au avut un impact asupra fondului de transcripte funcționale.

6. Splicing alternativ și duplicarea genelor

Duplicarea genelor (GD) este considerată o sursă principală de inovare funcțională în genom. Genele nou duplicate pot evolua cu divergențe funcționale , și se crede că este esențială în stimularea evoluției complexității dezvoltării și morfologice la vertebrate . Splicingul alternativ, ca mecanism predominant care crește, de asemenea, diversitatea proteinelor, a fost propus ca un jucător potențial în evoluția eucariotelor . Prin examinarea relației dintre duplicarea genelor și splicingul alternativ, putem înțelege mai bine în ce măsură ambele mecanisme sunt mijloace echivalente pentru diversificarea proteinelor. Mai multe studii au raportat o corelație negativă între AS și dimensiunea familiei de gene la om și la șoarece și vierme (tabelul 1). Este ușor să se ajungă la concluzia că AS și GD sunt interschimbabile și că există o corelație negativă universală de la vierme la om. Cu toate acestea, relația dintre cele două variabile este, în cel mai bun caz, marginală și nu este consecventă atunci când se includ genele singleton, care au un nivel mai scăzut de AS în comparație cu familiile multigene . Jin et al. au sugerat că genele singletone au mai multe constrângeri evolutive decât cele duplicate, ceea ce împiedică obținerea izoformei AS. În concordanță cu această ipoteză, Lin et al. au constatat că genele singletone diferă de familiile de gene multiple în mai multe aspecte, sugerând că acestea au căi evolutive diferite. Chiar dacă ne concentrăm doar asupra familiilor multigene, o corelație negativă între AS și dimensiunea familiei de gene poate fi explicată sau un produs secundar al covarianței AS și a dimensiunii familiei de gene cu alți factori. De exemplu, vârsta genelor și duplicarea părtinitoare au fost propuse ca fiind explicația . Acest studiu a pus sub semnul îndoielii relația dintre AS și GD și poate, într-adevăr, să ofere sprijin pentru sugestia că AS și GD au o echivalență mică sau deloc în ceea ce privește efectele asupra secvenței, structurii și funcției proteinelor . Deoarece majoritatea studiilor au examinat un număr mic de specii model, este dificil să se evalueze amploarea legăturii dintre AS și GD. În plus, abordarea instantanee de a compara GFS și AS într-un singur genom ar putea ascunde adevărata relație dintre AS și GFS.

.

.

Specii Date Splicing alternativ Ortologie Controlul biasului Corelație Referință
Uman Ensembl Baza de date AltSplice a ASD BLSATP Exoni, Acoperirea EST, dimensiunea familiei de gene, numărul de izoforme Corelație negativă
NCBI, UCSC Programul GeneSplicer EnsMart Remover garbage EST, EST coverage, Corelație negativă
H-InvDB 5.0 H-InvDB 5.0 BLAST Corelație pozitivă atunci când include toate familiile de gene. Corelație negativă în cadrul familiilor multigene
Mouse Ensembl Baza de date AltSplice a ASD BLSATP Exoni, Acoperirea EST, dimensiunea familiei de gene, numărul de izoforme Corelație negativă
NCBI, UCSC Programul GeneSplicer EnsMart Îndepărtarea EST de gunoi, acoperire EST, Corelație negativă
Riken’s FANTOM3 Riken’s FANTOM3 BLAST Corelație pozitivă atunci când include toate familiile de gene. Corelație negativă în cadrul familiilor multigene
C. elegans WormPep WormPep BLAST Observație AS mai mică în familiile multigene
Rice TIGR 4.0 Programul PASA BLASTP Îndepărtați genele care nu au dovezi de transcriere Familiile multigenice au o incidență a SA semnificativ mai mare decât cele singulare
Arabidopsis TAIR7 TAIR7 TAIR7 Familiile multigenice au o incidență semnificativ mai mare a AS decât cele singure
Tabel 1
Sinteză pentru relația dintre AS și GFS.

7. Contribuția splicingului alternativ la inovația funcțională

Splicingul alternativ a fost aclamat ca fiind sursa lipsă de informații din genom care explică evoluția unei complexități mai mari, în ciuda numărului aproape static de gene la metazoare în ultimii 800 de milioane de ani. Wegmann et al. au constatat că lățimea expresiei genice este corelată pozitiv cu numărul de noi izoforme de transcripție și au propus că creșterea lățimii expresiei genice este esențială pentru dobândirea de noi izoforme de transcripție, care ar putea fi menținută printr-o nouă formă de selecție de echilibrare. Mai mult decât atât, analizele experimentale și bioinformatice au arătat că AS poate genera o varietate de ARNm funcțional și produse proteice, prezentând proprietăți de stabilitate, localizare subcelulară și funcție distincte, precum și în etape specifice în diferențierea celulară , diferențierea sexuală și dezvoltare .

Studiile pe o singură genă au oferit exemple în care splicingul alternativ poate duce la inovare funcțională înainte de a avea loc orice eveniment de duplicare a genelor. Un astfel de exemplu este cel al troponinei I (TnI), care joacă un rol-cheie în contracția musculară. În genomul vertebratelor, TnI există în trei copii, fiecare fiind exprimată într-un tip de mușchi diferit (scheletic, rapid și lent și cardiac). La Ciona, una dintre cele mai apropiate rude ale vertebratelor, TnI este prezentă ca o singură genă. Cu toate acestea, este interesant faptul că gena din Ciona produce trei izoforme distincte cu splicing alternativ, fiecare dintre acestea semănând cu profilul de expresie al uneia dintre genele vertebratelor, ceea ce sugerează că specializarea proteinelor TnI pentru a funcționa în fiecare tip de mușchi a precedat evenimentele de duplicare a genelor. Acest model de variante de îmbinare alternativă în genele unice ancestrale care se aseamănă cu profilurile de expresie ale genelor duplicate ulterior a fost, de asemenea, constatat în cazul genelor sinapsin-2 la tetrapode și al genelor MITF la speciile de pești teleostești . Aceste exemple sugerează că splicingul alternativ poate fi un mecanism de inovare funcțională care precede evenimentele de duplicare a genelor prin una dintre cele trei căi posibile (figura 4).

(a) Degenerarea semnalului de splicing
(a) Degenerarea semnalului de splicing
(b) Exonizarea ADN-ului necodificator sau a transpozonilor
(b) Exonizarea ADN-ului necodificator sau a transpozonilor” src=”https://static-01.hindawi.com/articles/ijeb/volume-2012/596274/figures/596274.fig.004b.jpg”>
(b) Exonizarea ADN-ului necodificatorcodificatoare sau transpozoni
(c) Duplicarea exonilor și specializarea izoformelor
(c) Duplicarea exonilor și specializarea izoformelor

(a) Degenerarea semnalului de splicare
(a) Degenerarea semnalului de splicare(b) Exonizarea semnalelor non-codificatoare<img alt=
(b) Exonizarea ADN-ului necodificator sau a transpozonilor(c) Duplicarea exonilor și specializarea izoformelor
(c) Duplicarea exonilor și specializarea izoformelor

Figura 4

Variantele AS noi pot prelua roluri specializate sau noi. Variantele noi de splicing pot apărea din (a) mutații în situsul de recunoaștere a exonului unui exon constitutiv și dobândirea ulterioară a elementelor de reglare AS. (b) Exonizarea intronilor sau a regiunilor intronice sau a elementelor transpozabile cu dobândirea ulterioară a regiunilor de reglare AS. Proteinele noi pot interacționa cu proteine diferite sau se pot localiza în regiuni subcelulare diferite. (c) Duplicarea exonilor și specializarea ulterioară a domeniilor funcționale și a regiunilor de reglare AS. Proteinele specializate rezultate pot prelua roluri parțiale relevante în diferite tipuri de celule sau stadii de dezvoltare sau pot avea ca rezultat interacțiuni și funcții noi.

Genele pot, de asemenea, să dobândească în continuare splicing alternativ și reglare după duplicare, împreună cu complexitatea sistemelor de organe după divergența dintre protocordate și vertebrate. Comparația dintre genele factorilor de transcripție Pax la vertebrate și amphioxus a arătat că cel puțin 52 de evenimente de splicing alternativ raportate la vertebrate în comparație cu 23 de evenimente la amphioxus . Mai mult, genele Pax ale vertebratelor au păstrat majoritatea funcțiilor lor ancestrale și, de asemenea, și-au extins expresia . S-a demonstrat că splicingul alternativ nou al genelor Pax modifică conținutul domeniului funcțional (de exemplu, legarea la ADN) și capacitățile de transactivare ale produselor proteice rezultate . De exemplu, o nouă transcripție alternativă a Pax3 poate transactiva o construcție reporter cMET la șoarece . S-a propus ca aceste izoforme suplimentare ale Pax3 să joace un rol funcțional în dobândirea de noi roluri la nivelul plăcii neuronale la vertebrate . În mod similar, evenimentele AS specifice vertebratelor din exonul 5a în Pax4 și Pax6 au fost legate de roluri funcționale în dezvoltarea ochiului vertebratelor . Prin urmare, este rezonabil să se propună ipoteza că, pe lângă duplicarea genelor, splicingul alternativ joacă roluri importante în dobândirea unor funcții noi care contribuie la complexitatea sistemelor de organe după divergența dintre protocordate și vertebrate . Rolurile potențiale ale prevalenței crescânde a AS la vertebrate în inovarea funcțională vor fi explorate în mare măsură în mai multe familii de gene sau la nivel genomic în viitor, ceea ce ne va ajuta să înțelegem mai bine modul în care AS contribuie la inovarea funcțională.

8. Concluzie

Aici am trecut în revistă dovezile din studiile genomice, precum și posibilele căi pentru viitoarele studii comparative pentru potențialul splicingului alternativ ca sursă de inovare funcțională în timpul evoluției genomului eucariot. Deși în prezent este clar că AS este predominant în genomul uman, rămân încă obstacole în evaluarea modului în care splicingul alternativ a evoluat de-a lungul timpului. Principalul obstacol constă în faptul că, în timp ce majoritatea celorlalte caracteristici genomice pot fi măsurate sau estimate direct doar din secvențele genomice, nu se pot obține estimări precise ale splicingului alternativ din analiza secvențelor genomice. Dependența de disponibilitatea secvențelor de transcripte pentru a măsura AS, împreună cu puternica distorsiune cauzată de acoperirea inegală a transcriptelor, a împiedicat evaluarea genomică a AS la nivelul întregului genom, cu excepția câtorva specii model, și face dificilă orice comparație directă între specii. Acest lucru a încetinit studiul modului în care splicingul alternativ a evoluat de-a lungul timpului, modul în care este reglementat AS și modul în care poate fi legat de alte caracteristici genomice și, mai ales, de fenotip. Profilarea din ce în ce mai mare a transcriptelor pentru un număr mult mai mare de specii, combinată cu utilizarea unor estimări comparabile ale indicilor, va permite abordarea unei serii de întrebări evolutive privind evoluția AS și implicațiile acesteia pentru evoluția diversității transcriptelor și a inovației funcționale.

Conflict de interese

Autorii nu declară niciun conflict de interese.

Recunoștințe

Autorii doresc să mulțumească lui Humberto Gutierrez pentru comentariile privind versiunile anterioare ale acestei lucrări. Această lucrare a fost finanțată de UK-China Scholarship for Excellence și University of Bath Research Studentship pentru L. Chen, o bursă CONACyT pentru J. M. Tovar-Corona și o bursă de cercetare Royal Society Dorothy Hodgkin Research Fellowship, Royal Society Research Grant și o bursă de cercetare Royal Society Research Grant for Fellows pentru A. O. Urrutia.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.