Abstract
El splicing alternativo (AS) es un proceso postranscripcional común en los organismos eucariotas, por el que se producen múltiples transcritos funcionales distintos a partir de un único gen. La publicación del borrador del genoma humano reveló un número de genes mucho menor del previsto. Debido a su potencial papel en la ampliación de la diversidad proteica, el interés por el splicing alternativo ha aumentado en la última década. Aunque estudios recientes han demostrado que el 94% de los genes humanos multiexón se someten al AS, la evolución del AS y, por tanto, su papel potencial en la innovación funcional en los genomas eucariotas siguen siendo en gran medida inexplorados. Aquí revisamos la evidencia disponible sobre la evolución de la prevalencia de los AS y su papel funcional. Además, destacamos la necesidad de corregir el fuerte efecto de la cobertura de los transcritos en la detección de AS y establecemos una estrategia para dilucidar en última instancia el alcance del papel de AS en la innovación funcional a escala genómica.
1. Introducción
El primer borrador de la secuencia del genoma humano se dio a conocer en febrero de 2001 y, sorprendentemente, se demostró que contenía ~23000 genes, sólo una fracción del número de genes previsto originalmente . Para poner esto en perspectiva, hay ~20.000 genes en el genoma del nematodo C. elegans. La falta de asociación entre el número de genes y la complejidad del organismo ha dado lugar a un mayor interés por el splicing alternativo (AS), ya que se ha propuesto que es un factor importante en la expansión de la complejidad reguladora y funcional, la diversidad de proteínas y la complejidad del organismo de los eucariotas superiores . Sin embargo, a pesar de los esfuerzos de muchos grupos de investigación, todavía entendemos muy poco sobre el papel real que desempeña el AS en la evolución de la innovación funcional -entendida aquí como la aparición de nuevos transcritos funcionales- que sustenta el aumento de la complejidad del organismo observado.
El splicing alternativo es un proceso postranscripcional en los organismos eucariotas por el que se producen múltiples transcritos distintos a partir de un único gen . Estudios anteriores que utilizaron la tecnología de secuenciación de alto rendimiento han informado de que hasta el 92%~94% de los genes humanos multiexón se someten a AS , a menudo de una manera específica de tejido / etapa de desarrollo . Con el desarrollo y la mejora constante de los perfiles de transcripción de todo el genoma y de los algoritmos bioinformáticos, la ubicuidad de los AS en el genoma de los mamíferos empezó a quedar clara. El concepto de un gen-una proteína fue cediendo a medida que aumentaban las pruebas de la alta incidencia de AS en especies no humanas, como la mosca de la fruta, Arabidopsis y otros eucariotas. A pesar de los avances en el conocimiento y la caracterización de la EA, hay varias cuestiones que siguen sin respuesta. En primer lugar, la gran diferencia en la cobertura de los transcritos entre especies ha dificultado las comparaciones directas de la prevalencia del splicing alternativo en diferentes especies. En segundo lugar, aunque se pudieran obtener estimaciones comparables de AS entre especies, no está claro hasta qué punto los cambios en la prevalencia de AS a lo largo de la evolución han contribuido a la diversidad general de proteínas o reflejan más bien el ruido del splicing. Por último, entendemos muy poco sobre cómo ha evolucionado el AS a lo largo del tiempo y cómo está relacionado con los parámetros funcionales de los genes. Aquí revisamos cómo se regula el splicing alternativo y los avances recientes en nuestra comprensión de la evolución del splicing alternativo.
2. Splicing alternativo y su regulación
En 1977, Chow et al. informaron de que las secuencias terminales 5′ y 3′ de varios ARNm de adenovirus 2 (Ad2) variaban, lo que implicaba un nuevo mecanismo para la generación de varios ARNm distintos. Después de este estudio, también se encontró empalme alternativo en el gen que codifica la hormona tiroidea calcitonina en células de mamíferos. Estudios posteriores revelaron que muchos otros genes también podían generar más de un transcrito recortando diferentes secciones de sus regiones codificantes (revisado en ).
Dependiendo de la ubicación de los segmentos exónicos recortados -o si se dejan los intrones-, los eventos de splicing pueden clasificarse en cuatro tipos básicos (Figura 1). Estos cuatro modos principales de splicing son (1) omisión de exón (2) retención de intrón (3) sitio de splicing alternativo 5′ (5′ss), y (4) sitio de splicing alternativo 3′ (3′ss) . Además, los exones mutuamente excluyentes, la iniciación alternativa y la poliadenilación alternativa proporcionan otros dos mecanismos para generar varias isoformas de transcripción. Además, los diferentes tipos de splicing alternativo pueden ocurrir de forma combinada y un exón puede estar sujeto a más de un modo de AS, por ejemplo, 5′ss y 3′ss al mismo tiempo (Figura 1). Se ha encontrado que la prevalencia de cada tipo de AS varía entre los diferentes taxones. Varios estudios han demostrado que la omisión de exones es común en los genomas de los metazoos, mientras que la retención de intrones es el tipo de AS más común entre las plantas y los hongos .
Diferentes tipos de splicing alternativo. Los recuadros azules son exones constitutivos y las regiones de splicing alternativo en rojo. Los intrones están representados por líneas rectas entre los recuadros. Se identificaron cuatro tipos de eventos de splicing comunes: (1) omisión de exón (2) retención de intrón (3) sitio de empalme alternativo 5′ (5′ss), y (4) sitio de empalme alternativo 3′ (3′ss).
El empalme alternativo está estrechamente regulado por elementos cis así como por factores transactores que se unen a estos elementos cis. Los factores transactores, principalmente proteínas de unión al ARN, modulan la actividad del espliceosoma y de los elementos cis, como los potenciadores de empalme exónico (ESE), los silenciadores de empalme exónico (ESS), los potenciadores de empalme intrónico (ISE) y los silenciadores de empalme intrónico (ISS). El mecanismo canónico de AS sugiere que las proteínas ricas en serina/arginina (SR) suelen unirse a los ESE, mientras que las ribonucleoproteínas nucleares heterogéneas (hnRNP) tienden a unirse a los ESS o a los ISS. Dadas las funciones cruciales de estos reguladores en la maquinaria de empalme, se sabe que las mutaciones cis y transactantes, que interrumpen el código de empalme, causan enfermedades (revisado en ). Se ha estimado que entre el 15 y el 60% de las mutaciones causan enfermedades al afectar al patrón de splicing de los genes ( y revisado en ). Además, también se ha demostrado que el AS se regula sin la participación de factores auxiliares de empalme y el AS también puede combinarse con otros eventos postranscripcionales como el uso de múltiples sitios internos de iniciación de la traducción, la edición del ARN, la decadencia del ARNm y la unión de microARN y otros ARN no codificantes , lo que sugiere la existencia de un mecanismo adicional no canónico de AS que aún no se ha identificado .
Recientemente, se ha informado de un papel directo de las modificaciones de las histonas en el splicing alternativo, en el que la modificación de las histonas (H3-K27m3) afecta al resultado del splicing influyendo en el reclutamiento de los reguladores del splicing a través de una proteína de unión a la cromatina en una serie de genes humanos como FGFR2,TPM2,TPM1 y PKM2 . Además, se ha informado de que la pausa de la ARN polimerasa II promovida por CTCF vincula la metilación del ADN al splicing, proporcionando la primera evidencia de la regulación del desarrollo del resultado del splicing a través de marcas epigenéticas heredables . Además, los ARN no codificantes también han surgido como determinantes clave de los patrones de splicing alternativo. Por lo tanto, estos hallazgos revelan una capa epigenética adicional en la regulación de la transcripción y el splicing alternativo. Por lo tanto, se han propuesto estudios genómicos y epigenéticos en al menos 100 tipos específicos de células sanguíneas, que proporcionarán epigenomas de referencia de alta calidad (utilizando ensayos de metilación del ADN y marcas de histonas) con datos genéticos y transcriptómicos detallados (secuenciación del genoma completo, RNA-Seq y miRNA-Seq), lo que nos dará la oportunidad de evaluar la influencia genómica de los factores epigenéticos en la regulación del AS en tipos específicos de células sanguíneas. Esperamos que el aumento de la epigenética comparativa proporcione una perspectiva diferente de la evolución del transcriptoma.
3. Identificación de eventos de splicing alternativo
El splicing alternativo es difícil de estimar sólo a partir de parámetros genómicos . Se han descubierto varios motivos reguladores del AS, pero la presencia de motivos de splicing alternativo conocidos no garantiza que un gen esté realmente empalmado de forma alternativa . Por lo tanto, los patrones de splicing alternativo se evalúan generalmente a partir del examen de los datos de las transcripciones. Para cualquier gen de interés, los eventos de splicing alternativo pueden identificarse utilizando la reacción en cadena de la polimerasa de transcripción inversa (RT-PCR) realizada en una biblioteca de ADN complementario (cDNA). En la última década, con la mejora de las tecnologías del transcriptoma de alto rendimiento, ha sido posible evaluar los patrones de splicing alternativo a escala del genoma. Se han utilizado tres fuentes principales de datos del transcriptoma para evaluar los patrones de splicing: las etiquetas de secuencia expresada (EST), los microarrays de empalme y la secuenciación del ARN (RNA-Seq).
La primera oleada de análisis del transcriptoma en todo el genoma consistió en la secuenciación directa de cDNA y ESTs realizada a gran escala , lo que permitió identificar eventos de splicing alternativo alineando las secuencias de cDNA/ESTs con el genoma de referencia. Las ESTs son lecturas de secuencias de 200-800 nucleótidos de longitud, no editadas y seleccionadas aleatoriamente de una sola pasada, derivadas de bibliotecas de cDNA . En la actualidad, hay ocho millones de ESTs para humanos, incluyendo alrededor de un millón de secuencias de tejidos cancerosos, y alrededor de 71 millones de ESTs para alrededor de 2000 especies en dbEST . Sin embargo, las EST se basan en la secuenciación Sanger de bajo rendimiento y se agregan en una amplia gama de tejidos, estados de desarrollo y enfermedades utilizando niveles de sensibilidad muy diferentes.
Más recientemente, los microarrays de empalme y RNA-Seq se han utilizado cada vez más para analizar cuantitativamente los eventos de empalme alternativo. Los microarrays de empalme se dirigen a exones específicos o a uniones exón-exón con sondas de oligonucleótidos. Las intensidades fluorescentes de las sondas individuales reflejan el uso relativo de los exones de splicing alternativo en diferentes tejidos y líneas celulares. Los microarrays de empalme de alta densidad son una forma rentable de analizar exones previamente conocidos y eventos de AS con una baja tasa de falsos positivos. La desventaja es que requiere un conocimiento previo de las variantes de AS existentes y de las estructuras de los genes. Y lo que es más importante, a diferencia de RNA-Seq y EST, los microarrays no proporcionan información adicional sobre la secuencia.
RNA-Seq ha surgido como una potente tecnología para el análisis del transcriptoma debido a su capacidad para producir millones de lecturas de secuencias cortas. Los experimentos de RNA-Seq proporcionan información en profundidad sobre el paisaje transcripcional . La acumulación cada vez mayor de datos de alto rendimiento continuará proporcionando oportunidades cada vez más ricas para investigar otros aspectos de la EA, como los eventos de baja frecuencia de la EA, así como los eventos de la EA específicos del tejido y/o del desarrollo. Los conjuntos de datos anteriores consisten en secuencias de lecturas de ARN de 50 pb o menos, lo que limita la información sobre las combinaciones de eventos de EA en un único transcrito, pero es probable que la longitud de las lecturas cortas siga aumentando durante la próxima década. Con el aumento de la capacidad de la secuenciación de nueva generación (RNA-Seq), es probable que el estudio de la especificidad alternativa sufra una revolución. La mayor profundidad de la secuenciación de los transcriptomas en humanos y otras especies ha aumentado nuestra comprensión de la ocurrencia del evento AS y los patrones de expresión AS en diferentes tejidos , etapas de desarrollo .
El ensamblaje de transcriptomas de tecnologías basadas en secuencias, como ESTs y RNA-Seq, puede utilizar el método de alinear-en-ensamblar o ensamblar-en-alinear, dependiendo de la calidad del genoma de referencia y de los datos de la secuencia . Se puede emplear un algoritmo para detectar el evento AS mediante la comparación de diferentes transcripciones. Sin embargo, la detección de isoformas de AS, a diferencia de un solo evento de AS, sigue siendo un reto porque las secuencias cortas proporcionan poca información en cuanto a la combinación de exones. Se han desarrollado varias aplicaciones para el ensamblaje de transcritos y la detección de isoformas de AS, se han revisado previamente diferentes estrategias y la comparación de estas aplicaciones.
4. Prevalencia del splicing alternativo en los genomas eucariotas
Los primeros análisis del genoma completo sugirieron que entre el 5% y el 30% de los genes humanos estaban empalmados alternativamente (revisado en ). Las bases de datos de AS basadas en EST identifican eventos de AS en el 40-60% de los genes humanos ; sin embargo, recientemente este número ha sido revisado una y otra vez con las últimas estimaciones que muestran que hasta el 94% de los genes humanos multiexón producen más de un transcrito a través de splicing alternativo . Entender cómo ha cambiado el splicing alternativo a lo largo del tiempo podría proporcionar información sobre el impacto del splicing alternativo en la diversidad de transcritos y proteínas y en la evolución del fenotipo. En los hongos, se cree que el splicing alternativo es raro debido al bajo número de exones en la levadura. En las plantas se ha estimado que alrededor del 20% de los genes sufren AS basándose en los datos de EST, sin embargo, un estudio reciente utilizando RNA-Seq, sugiere que al menos aproximadamente el 42% de los genes que contienen intrones en Arabidopsis están empalmados alternativamente . Esperamos que se descubran porcentajes significativamente más altos de ocurrencia de AS en varios eucariotas, dado que los estudios en profundidad del transcriptoma utilizando la secuenciación de próxima generación, como el RNA-Seq, están en curso. Unos pocos estudios han intentado comparar la prevalencia de AS entre diferentes taxones, y se ha informado de que los animales tienen una mayor incidencia de AS que las plantas y que los vertebrados tienen una mayor incidencia de AS que los invertebrados. Sin embargo, estos estudios se basan en datos limitados o no han corregido las diferencias en la cobertura de los transcritos.
Existen varias bases de datos que proporcionan datos de AS para múltiples especies. Sin embargo, estos recursos existentes se centran principalmente en las especies animales y tienen poca cobertura para los genomas de protistas, hongos y plantas, lo que dificulta la comparación de taxones divergentes. Y lo que es más importante, ninguno de estos recursos tiene en cuenta los efectos bien documentados de la cobertura diferencial de los transcritos en los genes dentro de las especies y entre ellas, lo que influye enormemente en las tasas de detección de AS. Se ha utilizado el muestreo aleatorio y se ha demostrado que minimiza el sesgo de la cobertura de los transcritos (Figura 2). Esperamos que se empleen estrategias similares en futuros recursos de datos comparativos de AS.
(a)
(b)
(a)
(b)
El número total de transcritos influye en la detección de AS, pero el sesgo puede corregirse utilizando un método de muestreo. Detección de AS en genes dividida por la cobertura de transcripción para el nematodo (a y b) utilizando el conjunto de datos de transcripción completo (a) o un método de muestreo aleatorio (b).
5. ¿Es el empalme alternativo funcional o sólo un ruido?
Si se confirma un aumento de los niveles de AS en las especies vertebradas en comparación con los invertebrados, dadas las limitaciones de los recursos proteómicos actuales, es difícil evaluar hasta qué punto los transcritos empalmados alternativamente se traducen en un proteoma ampliado. La evolución de muchos de los fenotipos que más asociamos con el ser humano, como la mayor duración de la vida, la encefalización o incluso el aumento de la complejidad, ha ido acompañada de fuertes reducciones del tamaño efectivo de la población, lo que posiblemente explique la proliferación de una variedad de rasgos genómicos en los organismos más complejos ( pero véase ). Por lo tanto, es posible que el aumento de la AS a través de la evolución sea el resultado de un splicing aberrante y que, por lo tanto, no desempeñe ningún papel funcional . Si el splicing alternativo ha aumentado a lo largo del árbol filogenético y es realmente funcional, podemos esperar lo siguiente:(A) Los transcritos deberían tener una baja incidencia de codones de parada prematuros que los harían vulnerables a la decadencia mediada por el sinsentido. Se ha encontrado que entre el 4% y el 35% de los transcritos humanos AS contienen un codón de terminación prematuro en los transcritos humanos y de ratón . Se ha descubierto que estos transcritos están enriquecidos en exones no conservados que pueden causar cambios de marco. Se desconoce si la proporción de transcritos AS que contienen un codón de terminación prematuro ha cambiado a lo largo del árbol filogenético.(B) Se ha propuesto que la mayoría de las isoformas alternativas de bajo número de copias producidas en las células humanas probablemente no sean funcionales . Un estudio reciente ha demostrado que, aunque se pueden encontrar variantes de empalme alternativo específicas para el cáncer, estos eventos se encuentran en su mayoría como eventos de una sola copia y, por lo tanto, es poco probable que contribuyan al núcleo del transcriptoma del cáncer .(C) La conservación de los eventos de empalme alternativo a lo largo de la evolución puede tomarse como un indicador de su papel funcional. Los niveles de conservación de AS se han estudiado en muchas especies. La estimación oscila entre el 11% y el 67% entre el ser humano y el ratón . En particular, las formas principales de AS tienden a tener mayores niveles de conservación en comparación con las formas menores. Por otra parte, las formas de AS conservadas varían entre diferentes AS; por ejemplo, la omisión de exón entre C. elegans y C. briggsae ha mostrado un nivel de conservación superior al 81%, comparado con el 28% para la retención de intrones .(D) La presencia de dominios funcionales identificables en las áreas de AS también puede ser un indicador de la relevancia funcional de los transcritos AS . Hasta donde sabemos, no hay informes sobre la prevalencia de dominios funcionales en áreas de AS en especies modelo. Para examinar la presencia de dominios funcionales en los transcritos de AS, recopilamos un conjunto de 267.996 eventos de AS obtenidos del análisis de 8.315.254 EST de tejidos humanos normales. Descubrimos que alrededor del 50% de las áreas de AS en humanos contienen componentes funcionales conocidos utilizando InterProScan, que contiene 14 aplicaciones para la predicción de dominios de proteínas (Figura 3, ver métodos en ), lo que sugiere un posible papel funcional de AS. El alcance de las variaciones en la prevalencia de los dominios funcionales entre las áreas de AS entre las especies queda por explorar, pero proporcionaría conocimientos adicionales sobre la evolución de AS.
Porcentaje de áreas de AS que contienen dominios funcionales identificables, estructuras secundarias y codones de parada en humanos. Los componentes funcionales se identificaron utilizando InterProScan, que contiene 14 aplicaciones para la predicción de dominios de proteínas , incluyendo Pfam para la predicción de dominios de proteínas, SignalP 3.0 para las predicciones de péptidos señal, y TMHMM para las predicciones de dominios transmembrana. Se utilizó PSORT II para identificar la probable localización subcelular de los productos proteicos. Las estructuras secundarias de las proteínas se predijeron con CLC Main Workbench 5.7, que se basa en secuencias de proteínas extraídas del banco de datos de proteínas (http://www.rcsb.org/pdb/).
Tomadas en conjunto, las observaciones anteriores sugieren que, aunque los eventos de splicing alternativo se conservan a lo largo de la evolución, una proporción significativa no lo está y algunos pueden ser el resultado de un splicing de transcripción ruidoso que no contribuye al conjunto de proteínas. Sin embargo, hasta que no se realicen más estudios que utilicen índices de AS comparables, será imposible estimar hasta qué punto los aumentos en los niveles de AS a lo largo del árbol filogenético han repercutido en el conjunto de transcritos funcionales.
6. Empalme alternativo y duplicación de genes
La duplicación de genes (GD) se considera una fuente primordial de innovación funcional en el genoma. Los nuevos genes duplicados pueden evolucionar con divergencia funcional , y se cree que es clave para impulsar la evolución de la complejidad del desarrollo y la morfología en los vertebrados . El splicing alternativo, como mecanismo prevalente que también aumenta la diversidad proteica, se ha propuesto como un actor potencial en la evolución de los eucariotas . Al examinar la relación entre la duplicación de genes y el splicing alternativo podemos entender mejor hasta qué punto ambos mecanismos son medios equivalentes para la diversificación de proteínas. Varios estudios han informado de una correlación negativa entre el AS y el tamaño de la familia de genes en humanos, ratones y gusanos (Tabla 1). Es fácil llegar a la conclusión de que AS y GD son intercambiables y que existe una correlación negativa universal desde el gusano hasta el ser humano. Sin embargo, la relación entre las dos variables es marginal en el mejor de los casos y no es consistente cuando se incluyen los genes singleton que tienen un nivel de AS más bajo en comparación con las familias multigénicas . Jin et al. sugirieron que los singletons tienen una mayor constricción evolutiva que los duplicados, lo que dificulta su ganancia de isoformas AS. En consonancia con esta hipótesis, Lin et al. encontraron que los singletons difieren de las familias multigénicas en varios aspectos, lo que sugiere que tienen trayectorias evolutivas diferentes. Incluso si nos centramos sólo en las familias multigénicas, una correlación negativa entre la AS y el tamaño de la familia de genes puede explicarse o ser un subproducto de la covarianza de la AS y el tamaño de la familia de genes con otros factores. Por ejemplo, se ha propuesto como explicación la edad de los genes y la duplicación sesgada . Este estudio ha puesto en duda la relación entre AS y GD y puede, de hecho, proporcionar apoyo a la sugerencia de que AS y GD tienen poca o ninguna equivalencia en cuanto a los efectos sobre la secuencia, estructura y función de las proteínas . Como la mayoría de los estudios han examinado un pequeño número de especies modelo, es difícil evaluar el alcance de la relación entre AS y GD. Además, el enfoque instantáneo de comparar GFS y AS en un solo genoma podría ocultar la verdadera relación entre AS y GFS.
|
7. Contribución del splicing alternativo a la innovación funcional
El splicing alternativo ha sido aclamado como la fuente de información que faltaba en el genoma y que explicaba la evolución de una mayor complejidad a pesar del número casi estático de genes en los metazoos durante los últimos 800 millones de años. Wegmann et al. descubrieron que la amplitud de la expresión génica está positivamente correlacionada con el número de nuevas isoformas de transcripción y propusieron que el aumento de la amplitud de la expresión génica es esencial para la adquisición de nuevas isoformas de transcripción, que podría mantenerse mediante una nueva forma de selección de equilibrio. Además, los análisis experimentales y bioinformáticos han demostrado que el AS puede generar una variedad de ARNm funcionales y productos proteicos, mostrando distintas propiedades de estabilidad, localización subcelular y función, así como en etapas específicas de la diferenciación celular, la diferenciación sexual y el desarrollo.
Los estudios de un solo gen han proporcionado ejemplos en los que el splicing alternativo puede conducir a la innovación funcional antes de que se haya producido cualquier evento de duplicación génica. Uno de estos ejemplos es el de la troponina I (TnI), que desempeña un papel clave en la contracción muscular. En el genoma de los vertebrados, la TnI existe en tres copias, cada una de las cuales se expresa en un tipo de músculo diferente (esquelético, rápido y lento, y cardíaco). En Ciona, uno de los parientes más cercanos de los vertebrados, la TnI está presente como un único gen. Sin embargo, el gen de Ciona produce tres isoformas distintas empalmadas alternativamente, cada una de las cuales se asemeja al perfil de expresión de uno de los genes de los vertebrados, lo que sugiere que la especialización de las proteínas TnI para funcionar en cada tipo de músculo precedió a los eventos de duplicación del gen. Este patrón de variantes de empalme alternativo en genes ancestralmente únicos que se asemejan a los perfiles de expresión de genes posteriormente duplicados también se ha encontrado en los genes de la sinapsina-2 en tetrápodos y en los genes MITF en especies de peces teleósteos . Estos ejemplos sugieren que el splicing alternativo puede ser un mecanismo de innovación funcional que precede a los eventos de duplicación génica a través de una de las tres vías posibles (Figura 4).
(a) Degeneración de la señal de splicing
(b) Exonización de ADN noADN codificante o transposones
(c) Duplicación de exones y especialización de isoformas
(a) Degeneración de señales de empalme
(b) Exonización de ADN no codificante o transposones
(c) Duplicación de exones y especialización de isoformas
Las variantes de splicing novedosas pueden adoptar funciones especializadas o nuevas. Las variantes de empalme novedosas pueden surgir de (a) mutaciones en el sitio de reconocimiento del exón constitutivo y la subsiguiente adquisición de elementos reguladores de AS. (b) Exonización de intrones o regiones de intrones o elementos transponibles con la subsiguiente adquisición de regiones reguladoras de AS. Las nuevas proteínas pueden interactuar con diferentes proteínas o localizarse en diferentes regiones subcelulares. (c) Duplicación de exones y posterior especialización de dominios funcionales y regiones reguladoras de AS. Las proteínas especializadas resultantes pueden asumir papeles parciales relevantes en diferentes tipos de células o etapas de desarrollo o dar lugar a nuevas interacciones y funciones.
Los genes también pueden obtener empalmes alternativos y regulación después de la duplicación junto con la complejidad de los sistemas de órganos después de la divergencia de los protocordados y los vertebrados. La comparación entre los factores transcripcionales de los genes Pax en los vertebrados y los anfioxos ha demostrado que al menos 52 eventos de empalme alternativo reportados en los vertebrados en comparación con 23 eventos en los anfioxos . Además, los genes Pax de los vertebrados han mantenido la mayoría de sus funciones ancestrales y también han ampliado su expresión . Se ha demostrado que el nuevo splicing alternativo de los genes Pax modifica el contenido del dominio funcional (por ejemplo, la unión al ADN) y las capacidades de transactivación de los productos proteicos resultantes. Por ejemplo, una nueva transcripción alternativa de Pax3 puede transactivar un constructo reportero cMET en el ratón. Se ha propuesto que estas isoformas adicionales de Pax3 desempeñan un papel funcional en la adquisición de nuevos roles en la placa neural en los vertebrados . Del mismo modo, los eventos AS específicos de vertebrados del exón 5a en Pax4 y Pax6 se han relacionado con papeles funcionales en el desarrollo del ojo de los vertebrados . Por lo tanto, es razonable proponer la hipótesis de que, además de la duplicación de genes, el splicing alternativo juega un papel importante en la adquisición de nuevas funciones que contribuyen a la complejidad de los sistemas de órganos después de la divergencia de los protocordados y los vertebrados . Los papeles potenciales de la creciente prevalencia de AS en los vertebrados en la innovación funcional se explorará en gran medida en más familias de genes o a nivel genómico en el futuro, lo que aumentará nuestra comprensión de cómo AS contribuye a la innovación funcional.
8. Conclusión
Aquí hemos revisado la evidencia de los estudios genómicos, así como las posibles vías para futuros estudios comparativos para el potencial de splicing alternativo como una fuente de innovación funcional durante la evolución del genoma eucariótico. Aunque ahora está claro que el splicing alternativo es prevalente en el genoma humano, aún quedan obstáculos para evaluar cómo ha evolucionado el splicing alternativo a lo largo del tiempo. El principal obstáculo radica en que, mientras que la mayoría de las demás características genómicas pueden medirse o estimarse directamente a partir de las secuencias genómicas por sí solas, no es posible obtener estimaciones precisas del splicing alternativo a partir del análisis de las secuencias genómicas. La dependencia de la disponibilidad de las secuencias de transcripción para medir el AS, junto con el fuerte sesgo que supone la desigual cobertura de los transcritos, ha dificultado la evaluación genómica del AS en todas las especies, excepto en unas pocas especies modelo, y hace difícil cualquier comparación directa entre especies. Esto ha ralentizado el estudio de cómo ha evolucionado el splicing alternativo a lo largo del tiempo, cómo se regula el AS y cómo puede relacionarse con otras características genómicas y, sobre todo, con el fenotipo. La elaboración de perfiles de transcripción cada vez mayores para muchas más especies, combinada con el uso de estimaciones de índices comparables, permitirá abordar una serie de cuestiones evolutivas relativas a la evolución del AS y sus implicaciones para la evolución de la diversidad de transcripciones y la innovación funcional.
Conflicto de intereses
Los autores declaran no tener ningún conflicto de intereses.
Agradecimientos
Los autores desean agradecer a Humberto Gutiérrez sus comentarios sobre versiones anteriores de este trabajo. Este trabajo fue financiado por una beca de excelencia Reino Unido-China y una beca de investigación de la Universidad de Bath para L. Chen, una beca CONACyT para J. M. Tovar-Corona, y una beca de investigación Dorothy Hodgkin de la Royal Society, una beca de investigación de la Royal Society y una beca de investigación para becarios de la Royal Society para A. O. Urrutia.