Alternative Splicing: Uma fonte potencial de inovação funcional no genoma eucariótico

Abstract

Alternative splicing (AS) é um processo pós-transcritivo comum em organismos eucarióticos, pelo qual múltiplas transcrições funcionais distintas são produzidas a partir de um único gene. A liberação do esboço do genoma humano revelou um número muito menor de genes do que o previsto. Devido ao seu papel potencial na expansão da diversidade proteica, o interesse em em emendas alternativas tem aumentado ao longo da última década. Embora estudos recentes tenham mostrado que 94% dos genes humanos multiexões passam por AS, a evolução do AS e, portanto, seu papel potencial na inovação funcional em genomas eucarióticos permanecem em grande parte inexplorados. Aqui revisamos as evidências disponíveis a respeito da evolução da prevalência e do papel funcional do AS. Além disso, enfatizamos a necessidade de corrigir o forte efeito da cobertura da transcrição na detecção do AS e estabelecemos uma estratégia para, em última instância, elucidar a extensão do papel do AS na inovação funcional em uma escala genômica.

1. Introdução

O primeiro rascunho da sequência do genoma humano foi revelado em Fevereiro de 2001 e surpreendentemente foi mostrado que contém ~23000 genes, apenas uma fracção do número de genes originalmente previsto . Para colocar isto em perspectiva, existem ~20.000 genes no genoma do nemátodo C. elegans. A falta de uma associação entre o número de genes e a complexidade do organismo resultou em um aumento do interesse em em emendas alternativas (AS), dado que foi proposto ser um fator importante na expansão da complexidade regulatória e funcional, diversidade de proteínas e complexidade do organismo de eucariotas mais elevadas . No entanto, apesar dos melhores esforços de muitos grupos de pesquisa, ainda entendemos muito pouco sobre o papel real desempenhado pelo AS na evolução da inovação funcional – entendida como o aparecimento de novas transcrições funcionais -, que sustentam o aumento da complexidade do organismo observado.

A emenda alternativa é um processo pós-crítico em organismos eucarióticos pelo qual múltiplas transcrições distintas são produzidas a partir de um único gene . Estudos anteriores utilizando tecnologia de sequenciamento de alto rendimento relataram que até 92%~94% dos genes humanos multiexon passam por AS , frequentemente de uma forma específica para o tecido/estágio de desenvolvimento . Com o desenvolvimento e melhoria constante do perfil de transcrição do genoma inteiro e algoritmos bioinformáticos, a ubiqüidade do AS no genoma dos mamíferos começou a se tornar clara. O conceito de um gene – uma proteína deu lugar como evidência montada para a alta percentagem de incidência de AS em espécies não humanas, como a mosca da fruta, Arabidopsis e outros eucariotas. Apesar dos avanços na nossa compreensão e caracterização do AS, várias questões permanecem sem resposta. Primeiro, a grande diferença na cobertura transcrita entre espécies tem dificultado a comparação direta da prevalência de emendas alternativas em diferentes espécies. Em segundo lugar, mesmo que estimativas comparáveis de AS entre espécies pudessem ser obtidas, não está claro até que ponto quaisquer mudanças na prevalência de AS ao longo da evolução contribuíram para a diversidade proteica global ou melhor, refletem o ruído de emenda. Finalmente, entendemos muito pouco sobre como o AS evoluiu ao longo do tempo e como isto está relacionado com os parâmetros funcionais dos genes. Aqui revisamos como a alternativa é regulada e o progresso recente em nosso entendimento da evolução da emenda alternativa.

2. Emendas Alternativas e sua Regulação

Em 1977, Chow et al. relataram que 5′ e 3′ seqüências terminais de vários mRNAs adenovírus 2 (Ad2) variaram, implicando num novo mecanismo para a geração de vários mRNAs distintos. Após este estudo, também foi encontrada emenda alternativa no gene que codifica a calcitonina do hormônio tiroidiano em células de mamíferos. Estudos posteriores revelaram que muitos outros genes também foram capazes de gerar mais de uma transcrição através do corte de diferentes seções de suas regiões codificadoras (revisado em ).

Dependente da localização dos segmentos exônicos cortados – ou se os introns forem deixados dentro, os eventos de emenda podem ser classificados em quatro tipos básicos (Figura 1). Estes quatro modos principais de emenda são (1) exon saltar (2) retenção de intrões (3) alternativa 5′ site de emenda (5′ss), e (4) alternativa 3′ site de emenda (3′ss) . Além disso, exões mutuamente exclusivos, iniciação alternativa e poliadenilação alternativa fornecem dois outros mecanismos para gerar várias isoformas de transcrição. Além disso, diferentes tipos de emendas alternativas podem ocorrer de forma combinatória e um exon pode estar sujeito a mais de um modo AS, por exemplo, 5′ss e 3′ss ao mesmo tempo (Figura 1). Verificou-se que a prevalência de cada tipo de AS varia entre diferentes taxas. Vários estudos têm mostrado que o exon pulo é comum em genomas metazoários enquanto que a retenção de intron é o tipo mais comum de AS entre plantas e fungos .

Figura 1
Diferentes tipos de emendas alternativas. As caixas azuis são exões constituintes e, alternativamente, regiões emendadas em vermelho. Introns são representados por linhas retas entre as caixas. Quatro tipos de eventos comuns de emenda foram identificados: (1) exon skipping (2) intron retention (3) alternative 5′ splicing site (5′ss), e (4) alternative 3′ splicing site (3′ss).

Alternative splicing is tightly regulated by cis elements as well as transacting factors that bind to these cis elements. Fatores de transação, principalmente proteínas de ligação RNA, modulam a atividade do emenda e elementos cis tais como emendas exônicas (ESEs), silenciadores de emenda exônica (ESSs), emendas intrônicas (ISEs), e silenciadores de emenda intrônicos (ISSs). O mecanismo canônico do AS sugere que as proteínas serinas/argininas (SR) tipicamente se ligam aos ESEs, enquanto as ribonucleoproteínas nucleares heterogêneas (hnRNP) tendem a se ligar aos ESSs ou ISSs . Dado o papel crucial destes reguladores nas máquinas de emenda, sabe-se que os cis e as mutações de transacção, que perturbam o código de emenda, causam doenças (revisto em ). Foi estimado que 15-60% das mutações causam doenças ao afectar o padrão de emenda dos genes ( e revisto em ). Além disso, o AS também demonstrou ser regulado sem o envolvimento de fatores auxiliares de emenda e o AS também pode ser combinado com outros eventos pós-tradução, tais como o uso de múltiplos locais internos de iniciação de tradução, edição de RNA, decadência de mRNA, e ligação de microRNA e outros RNAs não-codificadores , sugerindo a existência de mecanismos adicionais nãocanônicos de AS que ainda não foram identificados.

Recentemente, um papel direto de modificações de histone em emendas alternativas tem sido relatado, no qual a modificação de histone (H3-K27m3) afeta o resultado da emenda, influenciando o recrutamento de reguladores de emenda via uma proteína de ligação de cromatina em vários genes humanos como FGFR2,TPM2,TPM1 e PKM2 . Além disso, tem sido relatado que a RNA polimerase II promovida pelo CTCF liga a metilação do DNA à emenda, fornecendo a primeira evidência de regulação do desenvolvimento do resultado da emenda através de marcas epigenéticas hereditárias. Além disso, RNAs não codificantes também surgiram como determinantes chave de padrões alternativos de emenda . Portanto, esses achados revelam uma camada epigenética adicional na regulação da transcrição e emendas alternativas . Estudos genomewide genéticos e epigenéticos, portanto, têm sido propostos em pelo menos 100 tipos específicos de células sangüíneas, que irão fornecer epigenomas de referência de alta qualidade (usando ensaios de metilação de DNA e marcas histônicas) com dados genéticos e transcriptômicos detalhados (seqüenciamento de genoma inteiro, RNA-Seq e miRNA-Seq), nos fornecendo uma oportunidade de avaliar a influência genomewide dos fatores epigenéticos na regulação do AS em tipos específicos de células sangüíneas. Estamos esperando que o aumento da epigenética comparativa forneça uma perspectiva diferente da evolução do transcriptoma.

3. Identificação de Eventos de Emenda Alternativa

A emenda alternativa é difícil de estimar apenas a partir de parâmetros genômicos . Uma série de motivos regulatórios para AS foram descobertos, mas a presença de motivos alternativos conhecidos de emenda não garante que um gene seja realmente emendado alternativamente . Assim, os padrões alternativos de emenda são geralmente avaliados a partir do exame dos dados de transcrição. Para qualquer gene de interesse, eventos alternativos de emenda podem ser identificados usando a transcrição reversa da reação em cadeia da polimerase (RT-PCR) conduzida em uma biblioteca complementar de DNA (cDNA). Durante a última década, à medida que as tecnologias de transcriptoma de alto rendimento melhoraram, tornou-se possível avaliar padrões alternativos de emenda em uma escala genômica. Três fontes principais de dados de transcriptoma têm sido usadas para avaliar padrões de emenda: tags de sequência expressa (ESTs), microarrays de função de emenda e sequenciamento de RNA (RNA-Seq).

A primeira onda de análise de transcriptoma do genoma consistiu no sequenciamento direto de cDNA e ESTs realizado em larga escala , o que permitiu identificar eventos alternativos de emenda através do alinhamento de sequências cDNA/EST com o genoma de referência. Os ESTs são bases de 200-800 nucleotídeos em comprimento, não editados, selecionados aleatoriamente em sequência única derivada de bibliotecas de cDNA . Atualmente, existem oito milhões de ESTs para humanos, incluindo cerca de um milhão de seqüências de tecidos cancerígenos, e cerca de 71 milhões de ESTs para cerca de 2000 espécies no dbEST . Entretanto, as ESTs são baseadas em seqüenciamento de Sanger de baixo rendimento e são agregadas em uma ampla gama de tecidos, estados de desenvolvimento e doenças usando níveis de sensibilidade amplamente diferentes.

Mais recentemente, microarrays de emenda e RNA-Seq têm sido cada vez mais usados para analisar quantitativamente eventos de emenda alternativos. Microarrays de emenda visam exons específicos ou junções exon-exon com sondas de oligonucleotídeos. As intensidades fluorescentes das sondas individuais refletem o uso relativo de exões em emendas alternadas em diferentes tecidos e linhas celulares. Microarrays de emenda de alta densidade são uma forma econômica de testar exons e eventos AS previamente conhecidos com baixa taxa de falsos positivos. A desvantagem é que requer conhecimento prévio das variantes de AS e estruturas gênicas existentes. Mais importante que RNA-Seq e EST, os microarrays não fornecem informações adicionais de seqüência.

RNA-Seq surgiu como uma tecnologia poderosa para análise de transcriptoma devido à sua capacidade de produzir milhões de leituras de seqüência curta. Os experimentos RNA-Seq fornecem informações profundas sobre a paisagem transcripcional . A acumulação cada vez maior de dados de alta produção continuará a fornecer oportunidades cada vez mais ricas para investigar mais aspectos do AS, tais como eventos AS de baixa frequência, bem como eventos AS específicos de tecidos e/ou eventos AS específicos de desenvolvimento . Os conjuntos de dados anteriores consistem em sequências de leitura de RNA de 50 bp ou menos, limitando a informação sobre combinações de eventos AS numa única transcrição, mas é provável que a duração de leituras curtas continue a aumentar na próxima década. Com a capacidade crescente de sequenciamento de próxima geração (RNA-Seq), o estudo do tempero alternativo provavelmente sofrerá uma revolução. A maior profundidade do seqüenciamento de transcriptomas em humanos e outras espécies aumentou nossa compreensão da ocorrência de eventos AS e padrões de expressão AS em diferentes tecidos , estágios de desenvolvimento .

Conjunto transcrito de tecnologias baseadas em sequência, tais como ESTs e RNA-Seq, pode usar tanto alinhamento-e-montagem como montagem-e-alinhamento, dependendo da qualidade do genoma de referência e dos dados de sequência . Um algoritmo pode ser empregado para detectar eventos AS através da comparação de diferentes transcrições. Entretanto, a detecção de isoformas AS, ao contrário de um único evento AS, ainda é um desafio porque seqüências curtas fornecem pouca informação em termos da combinação de exons. Várias aplicações foram desenvolvidas para a montagem de transcrições e detecção de isoformas AS, diferentes estratégias e comparação dessas aplicações foram revistas anteriormente .

4. Prevalência de Emendas Alternativas entre Genomas Eukaryotic

Análises iniciais de genoma inteiro sugeriram que 5%-30% dos genes humanos foram emendados alternadamente (revisados em ). Bases de dados AS baseadas em EST identificam eventos AS em 40-60% dos genes humanos; no entanto, recentemente este número foi revisto repetidamente com as últimas estimativas mostrando que até 94% dos genes humanos multiexon produzem mais de uma transcrição através da emenda alternativa . A compreensão de como a emenda alternativa mudou ao longo do tempo pode fornecer uma visão de como a emenda alternativa teve impacto na transcrição e na diversidade de proteínas e na evolução fenotípica. Em fungos, o AS é considerado raro devido ao baixo número de exônios em leveduras . Em plantas foi estimado que cerca de 20% dos genes passam por AS com base em dados EST , um estudo recente usando RNA-Seq, no entanto, sugere que pelo menos cerca de 42% dos genes intron-contidos em Arabidopsis são emendados alternativamente . Estamos esperando que porcentagens significativamente maiores de ocorrência de AS sejam descobertas a partir de vários eucariotas, dado que os estudos aprofundados de transcriptoma usando sequenciamento de próxima geração, como o RNA-Seq, estão em andamento. Alguns estudos têm tentado comparar a prevalência de AS entre diferentes táxons com animais geralmente relatados como tendo maior incidência de AS do que plantas e vertebrados com maior incidência de AS do que invertebrados . No entanto, esses estudos são baseados em dados limitados ou não corrigiram as diferenças na cobertura da transcrição .

Existem vários bancos de dados que fornecem dados de SA para múltiplas espécies . No entanto, esses recursos existentes estão focados principalmente em espécies animais e têm fraca cobertura para genomas protistas, fúngicos e vegetais, dificultando assim a comparação de taxas divergentes. Mais importante ainda, nenhum desses recursos leva em conta os efeitos bem documentados da cobertura diferencial de transcrição entre genes dentro e entre espécies, o que influencia muito as taxas de detecção de AS . A amostragem aleatória tem sido usada e mostrada para minimizar o viés da cobertura transcrita (Figura 2). Esperamos que estratégias similares sejam empregadas em futuros recursos de dados comparativos de AS.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

Figura 2
Número total de transcrição influencia a detecção de AS, mas o viés pode ser corrigido usando um método de amostragem. A detecção do SA em genes divididos pela cobertura da transcrição para o nemátodo (a e b) usando o conjunto de dados da transcrição completa (a) ou um método de amostragem aleatória (b).

5. A Emenda Alternativa é Funcional ou É Apenas Ruído?

Se se confirmar um aumento dos níveis de AS em espécies de vertebrados em comparação com invertebrados, dadas as limitações dos recursos proteómicos actuais, é difícil avaliar até que ponto, alternativamente, as transcrições emendadas são traduzidas num proteoma expandido. A evolução de muitos fenótipos que mais associamos ao ser humano, tais como maior longevidade, encefalização ou mesmo aumento da complexidade, tem sido acompanhada por reduções acentuadas no tamanho efetivo da população, possivelmente explicando a proliferação de uma variedade de características genômicas em organismos mais complexos ( mas veja ). Portanto, é possível que o aumento do EA através da evolução resulte de emendas aberrantes e, portanto, não desempenhe qualquer papel funcional. Se a emenda alternativa aumentou ao longo da árvore filogenética e é de fato funcional, podemos esperar o seguinte:(A) As transcrições devem ter uma baixa incidência de códons de parada prematura que as tornaria vulneráveis à decadência mediada sem sentido. Entre 4% e 35% das transcrições humanas de AS contêm um códon de terminação prematura em transcrições humanas e de ratos. Essas transcrições foram encontradas enriquecidas em exons não conservados, que podem causar mudanças de quadros. Não se sabe se a proporção de códon de terminação prematura contendo AS transcripts mudou ao longo da árvore filogenética.(B) Foi proposto que a maioria das isoformas alternativas de baixo número de cópias produzidas em células humanas são provavelmente não funcionais . Um estudo recente mostrou que, embora possam ser encontradas variantes de emendas alternativas específicas para o câncer, estes eventos são na sua maioria encontrados como eventos de cópia única e, portanto, improvável que contribuam para o núcleo do transcriptoma do câncer.(C) A conservação de eventos de emendas alternativas ao longo da evolução pode ser tomada como um indicador do seu papel funcional. Os níveis de conservação de AS têm sido estudados em muitas espécies. A estimativa varia de 11% a 67% entre o humano e o rato . Notavelmente, as formas principais de EA tendem a ter níveis de conservação mais altos em comparação com as formas menores. Por outro lado, as formas de AS conservadas variam entre diferentes AS; por exemplo, o salto exon entre C. elegans e C. briggsae mostrou mais de 81% de nível de conservação, comparado com 28% para a retenção de intron .(D) A presença de domínios funcionais identificáveis em áreas de AS também pode ser um indicador de relevância funcional para transcrições de AS . Para nosso melhor conhecimento não há relatos da prevalência de domínios funcionais em áreas de AS em espécies modelo. Para examinar a presença de domínios funcionais nas transcrições de AS, compilamos um conjunto de 267.996 eventos de AS obtidos a partir da análise de 8.315.254 ESTs a partir de tecidos humanos normais. Verificamos que cerca de 50% das áreas de SA em humanos contêm componentes funcionais conhecidos usando InterProScan que contém 14 aplicações para a previsão de domínios proteicos (Figura 3, ver métodos em ), sugerindo um possível papel funcional para SA. A extensão das variações na prevalência de domínios funcionais entre as áreas de AS entre espécies ainda não foi explorada, mas forneceria uma visão adicional sobre a evolução do AS.

Figura 3
Percentagem de áreas de AS contendo domínios funcionais identificáveis, estruturas secundárias, e códons de parada em humanos. Os componentes funcionais foram identificados usando InterProScan que contém 14 aplicações para a previsão de domínios proteicos , incluindo Pfam para a previsão de domínios proteicos , SignalP 3.0 para previsões de peptídeos de sinal , e TMHMM para as previsões de domínios transmembrana. O PSORT II foi usado para identificar a provável localização subcelular de produtos protéicos. Estruturas secundárias de proteínas foram previstas pelo CLC Main Workbench 5.7, que é baseado em seqüências de proteínas extraídas do banco de dados de proteínas (http://www.rcsb.org/pdb/).

Agregadas as observações acima sugerem que apesar de emendas alternativas serem de fato conservadas ao longo da evolução, uma proporção significativa não o é e algumas podem resultar de emendas ruidosas de transcrição que não contribuem para o pool de proteínas. Entretanto, até estudos adicionais usando índices de AS comparáveis será impossível estimar até que ponto os aumentos nos níveis de AS ao longo da árvore filogenética impactaram no pool de transcrições funcionais.

6. Emenda Alternativa e Duplicação de Gene

A duplicação de Gene (GD) é considerada uma fonte principal de inovação funcional no genoma. Genes recém-duplicados podem evoluir divergência funcional , e pensa-se que seja a chave para impulsionar a evolução da complexidade de desenvolvimento e morfologia dos vertebrados . A emenda alternativa, como mecanismo prevalecente que também aumenta a diversidade proteica, tem sido proposta como um jogador potencial na evolução dos eucariotas . Ao examinar a relação entre duplicação gênica e emenda alternativa, podemos entender melhor até que ponto ambos os mecanismos são meios equivalentes para a diversificação proteica. Vários estudos têm relatado uma correlação negativa entre o AS e o tamanho da família genética em humanos e ratos e vermes (Tabela 1). É fácil concluir que AS e GD são intercambiáveis e que existe uma correlação negativa universal do verme para o humano. Contudo, a relação entre as duas variáveis é, na melhor das hipóteses, marginal e não é consistente quando se incluem genes de um único botão que têm um nível de AS inferior ao das famílias multigenes . Jin et al. sugeriram que os singletons têm mais constrição evolutiva do que os duplicados, o que dificulta o ganho de isoforma AS. Consistentes com esta hipótese, Lin et al. descobriram que os singletons diferem das famílias multigenas em vários aspectos, sugerindo que eles têm caminhos evolutivos diferentes. Mesmo que nos concentremos apenas em famílias multigenas, uma correlação negativa entre o AS e o tamanho da família gênica pode ser explicada ou ser um subproduto da covariância do AS e do tamanho da família gênica com outros fatores. Por exemplo, a idade genética e a duplicação tendenciosa têm sido propostas como explicação. Este estudo lançou dúvidas sobre a relação entre o AS e o GD e pode de fato dar suporte à sugestão de que o AS e o GD têm pouca ou nenhuma equivalência em relação aos efeitos sobre a seqüência, estrutura e função da proteína. Como a maioria dos estudos examinou um pequeno número de espécies modelo, é difícil avaliar a extensão da relação entre o AS e o GD. Além disso, a abordagem instantânea da comparação entre AS e GFS em um único genoma pode esconder a verdadeira relação entre AS e GFS.

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

>

Espécie Dados Alternativa emenda Ortologia Controle de polarização Correlação Referência
Humano Ensemblagem Base de dados AltSplice daASD BLSATP Exões, Cobertura EST, tamanho da família genética, contagem de isoformas Correlação negativa
NCBI, UCSC Programa GeneSplicer EnsMart Remover lixo EST, cobertura EST, Correlação negativa >
H-InvDB 5.0 H-InvDB 5.0 BLAST Correlação positiva quando inclui todas as famílias de genes. Correlação negativa dentro de famílias multigenes
Mouse Ensemblage Base de dados AltSplice daASD BLSATP Exons, Cobertura EST, tamanho da família genética, contagem de isoformas Correlação negativa
NCBI, UCSC Programa GeneSplicer EnsMart Remover o lixo EST, cobertura EST, Relação negativa
FANTOM3 FANTOM3 FANTOM3 BLAST Relação positiva quando inclui todas as famílias de genes. Correlação negativa dentro de famílias multigenas
C. elegans WormPep WormPep BLAST Informação AS em famílias multigenes
Arroz TIGR 4.0 Programa PASA BLASTP Remover genes que não possuem evidência transcrita Famílias multigenas têm incidência significativamente maior de AS do que as singletons
Arabidopsis TAIR7 TAIR7 TAIR7 Famílias de multigene têm incidência significativamente mais alta de AS do que os monotons
> Tabela 1
Sumário para a relação entre AS e GFS.

A emenda alternativa tem sido saudada como a fonte de informação ausente no genoma, contabilizando a evolução de maior complexidade, apesar do número quase estático de genes em metazoans nos últimos 800 milhões de anos. Wegmann et al. descobriram que a largura da expressão gênica está positivamente correlacionada com o número de novas isoformas de transcrição e propuseram que o aumento da amplitude da expressão gênica é essencial para a aquisição de novas isoformas de transcrição, que poderiam ser mantidas por uma nova forma de seleção de equilíbrio. Além disso, análises experimentais e bioinformáticas demonstraram que o AS pode gerar uma variedade de mRNAs funcionais e produtos protéicos, exibindo distintas propriedades de estabilidade, localização subcelular e função, bem como em estágios específicos de diferenciação celular, diferenciação sexual e desenvolvimento .

Estudos de um único gene têm fornecido exemplos onde a emenda alternativa pode levar à inovação funcional antes que qualquer evento de duplicação de genes tenha ocorrido. Um desses exemplos é o da Troponina I (TnI), que desempenha um papel fundamental na contração muscular. No genoma vertebrado, a TnI existe em três cópias, cada uma expressa em um tipo muscular diferente (esquelético, rápido e lento, e cardíaco). Na Ciona, um dos parentes mais próximos dos vertebrados, a TnI, está presente como um único gene. Curiosamente, porém, o gene Ciona produz três isoformas distintas, cada uma delas semelhante ao perfil de expressão de um dos genes vertebrados, sugerindo que a especialização das proteínas TnI para funcionar em cada tipo muscular precedeu os eventos de duplicação de genes. Este padrão de variantes alternativas de emendas em genes ancestrais únicos que se assemelham a perfis de expressão de genes posteriormente duplicados foi também encontrado em genes synapsin-2 em tetrápodes e em genes MITF em espécies de peixes teleost. Estes exemplos sugerem que a emenda alternativa pode ser um mecanismo de inovação funcional que precede eventos de duplicação de genes através de um dos três caminhos possíveis (Figura 4).

(a) Degeneração do sinal de emenda
(a) Degeneração do sinal de emenda
(b) Exonização do DNA não codificador ou transposões
(b) Exonização do DNA não codificadorcodificação de DNA ou transposões
(c) Duplicação Exon e especialização de isoformas
(c) Duplicação Exon e especialização de isoformas

(a) Degeneração do sinal de emenda
(a) Degeneração do sinal de emenda(b) Exonização de nãoDNA codificador ou transposões
(b) Exonização de DNA não codificador ou transposões(c) Duplicação de Exon e especialização de isoformas
(c) Duplicação de Exon e especialização de isoformas

> Figura 4
>
Novel AS variants can take on specialised or novel roles. As novas variantes de emenda podem surgir de (a) mutações no local de reconhecimento exon de um exon constitutivo e posterior aquisição de elementos reguladores AS. (b) Exonização de introns ou regiões intron ou elementos transponíveis com posterior aquisição de regiões regulatórias de AS. Proteínas novas podem interagir com diferentes proteínas ou localizar-se em diferentes regiões subcelulares. (c) Exon duplicação e subseqüente especialização de domínios funcionais e regiões regulatórias de AS. As proteínas especializadas resultantes podem assumir papéis parciais relevantes em diferentes tipos celulares ou estágios de desenvolvimento ou resultar em novas interações e funções.

Genes também podem ganhar emendas e regulação alternativas após a duplicação, juntamente com a complexidade dos sistemas de órgãos após a divergência de protocordatas e vertebrados. A comparação entre os fatores transcripcionais Os genes de Pax em vertebrados e anfioxo tem mostrado que pelo menos 52 relataram eventos de emenda alternativa em vertebrados em comparação com 23 eventos em anfioxo . Além disso, os genes de vertebrados Pax têm mantido a maioria de suas funções ancestrais e também expandido sua expressão . Foi demonstrado que novas emendas alternativas dos genes Pax modificam o conteúdo do domínio funcional (por exemplo, ligação de DNA) e a capacidade de transação dos produtos protéicos resultantes. Por exemplo, uma nova transcrição alternativa de Pax3 pode transacionar a construção de um repórter cMET no mouse . Estas isoformas adicionais de Pax3 foram propostas para desempenhar um papel funcional na aquisição de novos papéis na placa neural em vertebrados . Da mesma forma, eventos AS específicos de vertebrados do exon 5a em Pax4 e Pax6 foram ligados a papéis funcionais no desenvolvimento do olho de vertebrados . Portanto, é razoável propor a hipótese de que, além da duplicação gênica, a emenda alternativa desempenha papéis importantes na aquisição de novas funções que contribuem para a complexidade dos sistemas de órgãos após a divergência de protocordados e vertebrados . Os papéis potenciais da crescente prevalência de AS em vertebrados na inovação funcional serão amplamente explorados em mais famílias de genes ou em nível de genoma no futuro, o que irá ampliar nossa compreensão de como o AS contribui para a inovação funcional.

8. Conclusão

Aqui temos revisado evidências de estudos em genoma, bem como possíveis caminhos para futuros estudos comparativos do potencial da emenda alternativa como fonte de inovação funcional durante a evolução do genoma eucariótico. Embora seja agora claro que o AS é predominante no genoma humano, ainda existem obstáculos na avaliação de como a emenda alternativa tem evoluído ao longo do tempo. O principal obstáculo está no fato de que enquanto a maioria das outras características genômicas podem ser medidas diretamente ou estimadas apenas a partir de seqüências genômicas, nenhuma estimativa precisa de emendas alternativas pode ser obtida a partir da análise da sequência genômica. A confiança na disponibilidade de sequências de transcrição para medir o AS juntamente com o forte viés trazido pela cobertura desigual da transcrição tem dificultado a avaliação genómica do AS em todas as espécies, excepto em algumas espécies modelo, e dificulta qualquer comparação directa entre espécies. Isto atrasou o estudo de como a emenda alternativa evoluiu ao longo do tempo, como o AS é regulado e como se pode relacionar com outras características genómicas e, mais crucialmente, com o fenótipo. O sempre crescente perfil de transcrição para muito mais espécies combinado com o uso de estimativas de índices comparáveis permitirá abordar uma série de questões evolutivas relativas à evolução do AS e suas implicações para a evolução da diversidade de transcrições e inovação funcional.

Conflito de Interesses

Os autores declaram não haver conflito de interesses.

Acreditos

Os autores agradecem a Humberto Gutierrez pelos comentários sobre versões anteriores deste artigo. Este trabalho foi financiado pela UK-China Scholarship for Excellence e University of Bath Research Studentship to L. Chen, uma bolsa CONACyT para J. M. Tovar-Corona, e uma Royal Society Dorothy Hodgkin Research Fellowship, Royal Society Research Grant, e uma Royal Society Research Grant for Fellows para A. O. Urrutia.

Deixe uma resposta

O seu endereço de email não será publicado.