El gen de la Enfermedad de Parkinson SNCA: Visión evolutiva y estructural con implicación patológica

Análisis filogenético

La relación evolutiva entre SNCA y sus putativos paralogos fue estimada por métodos NJ y ML (Fig. 1, ver Fig. Suplementaria S1). El análisis filogenético de la familia de la sinucleína reveló que dos eventos de duplicación han contribuido a la diversificación de esta familia. El primer evento de duplicación ha ocurrido en la raíz de los vertebrados, antes de la división tetrápodos-teleósteos, deducido en el paralogismo de SNCG y ancestro de SNCA/SNCB. Mientras que el segundo evento de duplicación ha ocurrido en la raíz del linaje de los sarcopterigios, después de la especiación de los peces teleósteos (SNCA/B) dio lugar a los paralogos SNCA y SNCB. También cabe destacar que las longitudes de rama de las proteínas SNCG son más largas que las de los otros dos paralogos, lo que sugiere que este paralogo puede haber evolucionado rápidamente en comparación con SNCA y SNCB. Las búsquedas de similitud bidireccional basadas en Blast no identifican ningún ortólogo de esta familia entre los invertebrados, lo que refuerza la suposición del origen específico de esta familia en los vertebrados (Fig. 1, ver Fig. Suplementaria S1).

Figura 1: Árbol de unión de vecinos de los miembros de la familia de la sinucleína.
figura1

Se utilizó la distancia p no corregida. Se utilizó la opción de eliminación completa. Los números de las ramas representan los valores bootstrap (basados en 1000 réplicas) que apoyan esa rama; sólo se presentan aquí los valores ≥50%. La barra de escala muestra la sustitución de aminoácidos por sitio.

Comparación de la tasa evolutiva del gen SNCA entre los sarcopterigios

Para estimar las diferencias de la tasa evolutiva del gen SNCA entre varios clados de sarcopterigios, los ortólogos de SNCA de miembros representativos de los hominoideos (humano, chimpancé, gorila, orangután), de miembros no hominoides (macaco, tití, mono ardilla, bushbaby), de mamíferos placentarios no primates (ratón, perro, vaca, elefante) y de tetrápodos no mamíferos (pollo, tortuga, rana, celacanto). Se estimaron las tasas de sustitución no sinónima (Ka/dN) y sinónima (Ks/dS) para cada grupo. La diferencia Ka-Ks (dN-dS) para los hominoideos fue de -2,241 (P = 0,014), para los no hominoideos fue de -4,716 (P = 0), para los mamíferos placentarios no primates fue de -6,1777 (P = 0) y para los tetrápodos no mamíferos fue de -7,085 (P = 0) (ver Tabla Suplementaria S1). En general, un valor de Ka inferior a Ks (Ka < Ks) sugiere una selección negativa, es decir, que las sustituciones no silenciosas han sido purgadas por la selección natural, mientras que el escenario inverso (Ka > Ks) implica una selección positiva, es decir, que las mutaciones ventajosas se han acumulado en el curso de la evolución. Sin embargo, la evidencia de selección positiva o negativa requiere que los valores sean significativamente diferentes entre sí41,42. Los resultados deducidos por la prueba z (Ka-Ks < 0, p < 0,05) sugieren que SNCA se ha desviado de la neutralidad durante la evolución mostrando la firma de la restricción de selección negativa dentro del linaje de sarcoptergios (véase la Tabla Suplementaria S1).

El análisis de la tasa evolutiva también se realizó para las copias putativas paralógicas de SNCA, es decir, SNCB y SNCG. La diferencia Ka-Ks (dN-dS) para SNCB se identificó como -1,661(P = 0,05) para los hominoideos, -4,708(P = 0) para los primates no hominoideos, -5,212(P = 0) para los mamíferos placentarios no primates y -2,992(P = 0,002) para los tetrápodos no mamíferos (ver Tabla Suplementaria S2). La diferencia Ka-Ks (dN-dS) para SNCG se identificó como -1,658(P = 0,05) para los hominoideos, -4,064(P = 0) para los primates no hominoideos, -5485(P = 0) para los mamíferos placentarios no primates, -6,306(P = 0) para los tetrápodos no mamíferos y -6,341(P = 0) para los peces (fugu, tetraodon, stickleback, medaka) (ver Tabla Suplementaria S3). Estos datos especifican que no sólo SNCA sino también otros dos miembros de la familia de la sinucleína han sido retenidos bajo una fuerte presión de selección purificadora entre los sarcopterigios analizados.

Organización de los dominios de SNCA

Con el fin de obtener una visión de la organización comparativa de los dominios, se llevó a cabo una anotación completa de los dominios del gen SNCA que incluía los ortólogos representativos de los sarcopterigios (humano, ratón, perro, pollo, celacanto), así como las copias paralógicas en el ser humano (SNCB y SNCG). Esta anotación reveló la arquitectura distintiva del gen SNCA que se compone del dominio alfa-hélice de unión a lípidos A2 N-terminal (1-60), el dominio del componente β no amiloide (NAC) (61-95) y el dominio ácido C-terminal (96-140) (Fig. 2a).

Figura 2: Representación esquemática.
figura2

(a) Organización de los dominios de la proteína SNCA. Vista esquemática de la organización comparativa de los dominios y motivos funcionales clave de SNCA a través de proteínas humanas paralogas y ortólogas de especies filogenéticamente distantes. Las longitudes de las proteínas están dibujadas aproximadamente a escala. Los dominios y motivos están codificados por colores. (b) Ventana que muestra los sitios bajo la restricción de selección negativa en SNCA entre los sarcopterigios. Los resultados se generan con Hyphy mediante la aplicación del método SLAC que utiliza el modelo global de codones y la máxima probabilidad para reconstruir la historia evolutiva.

El dominio de unión a lípidos N-terminal consta de 5 repeticiones imperfectas KXKEGV26, y estas repeticiones se identifican como altamente conservadas entre los ortólogos y paralogos analizados de SNCA humano en términos de número y posición (Fig. 2a). Se predice que esta región forma α-hélices anfipáticas, y se considera que está implicada en la interacción con fosfolípidos26.

El dominio NAC forma el núcleo amiloidogénico de SNCA26. El NAC está compuesto por el motivo GAV con la secuencia consenso VGGAVVTGV(66-74) y tres submotivos GXXX (donde X es cualquiera de Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser o Met)26. Entre los ortólogos analizados, el NAC se identificó como altamente conservado. Mientras que, entre sus copias homólogas, en SNCB la longitud de NAC (61-84) se redujo debido a la ausencia de un motivo GXXX y una repetición KXKEGV. Mientras que en SNCG no se identificó ningún submotivo GXXX. Entre los tres paralogos putativos, el motivo GAV estaba explícitamente presente sólo en SNCA (Fig. 2a). El NAC se considera extremadamente necesario para la agregación y fibrilación de SNCA26. Mientras que el GAV se supone que es el motivo responsable de este proceso de agregación25.

El dominio ácido C-terminal alberga el motivo de unión del cobre que contiene la secuencia consenso DPDNEA(119-124)43 que se encontró altamente conservada entre los ortólogos analizados de SNCA. El alineamiento múltiple de secuencias no identificó la conservación de este motivo entre los paralogos de SNCB y SNCG (Fig. 2a). Este dominio de SNCA está enriquecido en residuos ácidos y prolinas. Tres residuos de tirosina altamente conservados, que se consideran como una firma de la subfamilia de SNCA y SNCB, también se localizan en esta región26. También se propone que la unión del cobre acelera la agregación de SNCA e influye en sus efectos patológicos44.

Sustituciones específicas de linaje que han ocurrido durante la evolución entre los sarcopterigios analizados han sido mapeadas en SNCA humana con la ayuda de la técnica de reconstrucción de ancestros. Se clasificó que nueve sustituciones han ocurrido en la raíz del ancestro de los mamíferos. Mientras que dos sustituciones se produjeron en la raíz del linaje de los mamíferos placentarios no primates y una se produjo específicamente en el linaje de los catarrinos (hominoideos y monos del viejo mundo) (Fig. 2a) (Tabla 1). De estas 12 sustituciones identificadas, cinco (S64T, G68E, N87S, L94F, V95G) estaban confinadas hacia el NAC, mientras que seis (A101G, F107A, M112I, M113L, P129S, E132G) residían en el dominio ácido C-terminal. Sólo se identificó una sustitución (T53A) en la región N-terminal (Fig. 2a). A continuación se analizaron las propiedades fisicoquímicas de estas sustituciones de aminoácidos, lo que ilustró que aproximadamente todas las sustituciones que se han producido durante la evolución eran de tipo radical, excepto T53A y A101G (Tabla 1). Este análisis pone de manifiesto que el dominio de unión a lípidos N-terminal está muy conservado entre los ortólogos y paralogos analizados. Este hallazgo fue reforzado por el posicionamiento físico de cinco mutaciones específicas humanas previamente reportadas y asociadas con la enfermedad de Parkinson familiar, es decir, A30P3, E46K4, H50Q5, G51D6 y A53T7 en la SNCA humana. Los resultados revelaron el confinamiento de estas mutaciones explícitamente hacia el dominio N-terminal, lo que a su vez implica la importancia de la alta conservación de esta región no sólo con perspectiva funcional sino también para la patogénesis de la FPD (Fig. 2a). Con la ayuda del análisis de la ventana SLAC, parece que el dominio N-terminal se compone de 15 sitios restringidos negativamente, lo que defiende que las fuertes restricciones selectivas están operando su papel en la preservación de esta región durante la evolución de los sarcopterigios (Fig. 2b, véase la Tabla Suplementaria S4).

Tabla 1 Después de la divergencia del ancestro sarcopterigio, nueve cambios de aminoácidos fijos ocurrieron en la raíz de los mamíferos, mientras que dos ocurrieron específicamente en el linaje de los mamíferos placentarios no primates mientras que uno ocurrió específicamente en el linaje de los primates (catarrhini).

Evolución estructural de SNCA

Para inspeccionar aún más cómo la selección purificadora está desempeñando su papel en la definición de las restricciones espaciales de las proteínas SNCA ancestrales a nivel estructural, se realizó un estudio estructural comparativo. Se tomó como referencia la estructura de RMN de la SNCA humana (1XQ8) y se comparó con las proteínas ancestrales modeladas (Fig. 3). Las desviaciones estructurales se examinaron con la ayuda de los valores RMSD (Fig. 3, véase la Fig. Suplementaria S2A,B). Los resultados revelaron aspectos muy notables que no fueron anticipados por el análisis comparativo a nivel de secuencia. El análisis estructural comparativo sugiere que la estructura de SNCA ha pasado por una serie de transiciones para adquirir su conformación favorecida. Los modelos superpuestos de las proteínas SNCA ancestrales y 1XQ8 revelaron una región común desviada que abarcaba del 32 al 58 del dominio de unión a lípidos N-terminal de SNCA (Tabla 2). Estas desviaciones estructurales también se midieron con la ayuda de la cuantificación de las torsiones de la columna vertebral, lo que puso de manifiesto el hecho de que la región 32 a 58 de SNCA está evolucionando continuamente a nivel estructural, a pesar de su alta conservación de la secuencia (Tabla 2). También se identificó que se han incorporado sustituciones desestabilizadoras durante la evolución de SNCA con el objetivo de conseguir su conformación desordenada intrínseca, lo que implica las restricciones funcionales que hay detrás (Tabla 1). Así que parece lógico especular a partir de este enfoque de comparación estructural que durante la evolución de SNCA se han incorporado esas sustituciones que no sólo causaron la desestabilización de SNCA sino que también trajeron un cambio estructural drástico en la región identificada. Esta región crítica (32-58) también fue reconocida como crucial para la conformación adecuada no sólo del dominio de la hélice alfa N-terminal A2 sino también para el dominio NAC. Con la ayuda de técnicas de difracción de electrones y rayos X se ha informado de que la SNCA normal se ensambla a través de su región N-terminal, lo que de nuevo pone de manifiesto el importante papel de este dominio45.

Figura 3: Evolución estructural de las proteínas SNCA desde la escisión del último ancestro común de los sarcopterigios.
figura3

Se ha observado una divergencia estructural significativa hacia la SNCA humana tras la escisión del ancestro común de los sarcopterigios. Nueve sustituciones específicas se han producido en la raíz del linaje de los mamíferos que se mantiene en los primates y los mamíferos placentarios no primates después de la escisión del ancestro sarcopterigio. Mientras que, dos sustituciones se han producido específicamente en la raíz del linaje de los mamíferos placentarios no primates y una sustitución específica de los catarrinos se ha producido después de la escisión del ancestro común de los mamíferos. Los residuos desviados en términos de ángulos de torsión de la columna vertebral (Φ°,Ψ°) de la SNCA humana (1XQ8) se representan en color rojo. Las desviaciones estructurales se examinaron mediante los valores RMSD.

Tabla 2 Análisis de las desviaciones estructurales específicas del linaje en los ángulos de torsión de la columna vertebral de las proteínas SNCA ancestrales incorporando las sustituciones específicas del clado.

Intrigantemente, todas las mutaciones específicas humanas implicadas en la patogénesis de la FPD residen en esta región crucial, lo que significa que cualquier cambio en esta región será deletéreo debido a la fuerte selección y a las restricciones funcionales que se le imponen. Los modelos mutantes superpuestos con 1XQ8 identificaron cambios importantes hacia el dominio de unión a lípidos en A30P y H50Q, mientras que se observaron cambios importantes en los dominios de unión a lípidos y NAC en el caso de E46K y A53T. Sólo G51D mostró una alteración en la región NAC (ver Fig. S4A,B). Los cinco modelos mutantes tenían en común la región altamente desviada de 32 a 58. Se puede postular a partir de este análisis estructural comparativo que los efectos primarios y el papel de estas cinco mutaciones de SNCA en la patogénesis de la FPD pueden ser diferentes debido a sus morfologías estructurales diferenciales.

Además, para investigar las diferencias estructurales entre los paralogos humanos de SNCA, también se realizó un análisis estructural comparativo. Como las estructuras de RMN de SNCB y SNCG humanas no se han comunicado hasta ahora, sus estructuras se modelaron tomando como referencia la estructura de RMN de SNCA humana (1XQ8) y se evaluaron las desviaciones estructurales (véase la Fig.S5A,B suplementaria). Parece que las estructuras de SNCB y SNCG se desvían mucho de SNCA en el dominio N-terminal y NAC (Fig. 4).

Figura 4: Divergencia estructural entre los paralogos humanos de SNCA.
Figura 4

Se observaron importantes cambios estructurales en los dominios N-terminal de unión a lípidos y NAC debido a sustituciones específicas de los paralogos. Tras el primer evento de duplicación, el SNCA/B ancestral experimentó 19 cambios. Tras la segunda duplicación, SNCB y SNCA experimentaron 6 y 12 sustituciones respectivamente. Los residuos desviados en comparación con SNCA humano (1XQ8) están codificados por colores. Las desviaciones estructurales se evaluaron mediante los valores RMSD.

Análisis de las interacciones entre SNCA y el dominio coiled-coil de SNCAIP

Para investigar más a fondo la importancia de esta región crítica, se descifró su significado funcional con la ayuda del estudio de interacción. Para ello, se consideró la sinfilina-1 (SNCAIP), ya que la anotación del dominio de la sinfilina-1 reveló que se trata de una proteína de 919 a.a. (3745 pb) codificada por 10 exones17, que abarca seis repeticiones similares a la anquirina y un dominio coiled-coil central (510-557) (Fig. 5a). Se ha corroborado mediante técnicas bioquímicas y de RMN que SNCAIP interactúa con la región N-terminal de SNCA38. Aunque la función celular normal de estos socios de interacción es todavía desconocida, se ha informado de que SNCAIP se localiza durante el desarrollo en los terminales sinápticos y su asociación con las vesículas sinápticas está modulada por SNCA. En este contexto, SNCAIP se considera un socio sináptico de SNCA, lo que implica que esta interacción media las funciones sinápticas de SNCA, posiblemente mediante el anclaje de SNCA a la membrana de la vesícula46.

Figura 5
figura5

Vista esquemática (a) Organización de dominios de las proteínas SNCA y SNCAIP. Organización comparativa de los dominios y motivos funcionales clave de la SNCA humana y del dominio coiled-coil de la SNCAIP humana. Las longitudes de las proteínas están dibujadas aproximadamente a escala. Los dominios y motivos están codificados por colores. (b) Análisis de los complejos acoplados y de las interacciones de enlaces de hidrógeno. Representar las interacciones entre el SNCA ancestral de los sarcopterigios y el dominio coiled-coil de SNCAIP (2KES). (c) Representar las interacciones entre el SNCA humano (1XQ8) y el dominio coiled-coil del SNCAIP humano. Los residuos que interactúan en la región de interés (32-58) están codificados por colores. (d) Muestra la interacción entre el mutante modelado de SNCA-A30P y el dominio coiled-coil de SNCAIP humano. Las líneas punteadas muestran los enlaces de hidrógeno.

Para explorar el papel de la región crítica en la interacción, se realizó un análisis de acoplamiento. Se identificaron interacciones entre proteínas SNCA ancestrales de sarcopterigios, específicas de mamíferos y específicas de mamíferos placentarios no primates, lo que reveló que la interacción entre SNCA y el dominio coiled-coil de SNCAIP ha evolucionado con el paso del tiempo, es decir, han surgido interacciones específicas de linaje durante la historia evolutiva de los sarcopterigios (Fig. 5b). El análisis de las interacciones entre el SNCA específico de los humanos y el dominio coiled-coil del SNCAIP reveló que en la raíz de los catarrinos han evolucionado unas pocas interacciones específicas de linaje, es decir, Lys32, Tyr39 y Lys45 (véase la Fig. Suplementaria S6, véase la Tabla Suplementaria S5). Curiosamente, estas interacciones específicas de los humanos (catarrinos) residen en la región crítica identificada, lo que refuerza nuestra hipótesis de la importancia estructural y funcional de esta región y su papel vital en la patogénesis de la FPD (Fig. 5c).

El análisis de las interacciones entre los modelos mutantes de SNCA específico humano con SNCAIP reveló patrones de interacción alterados, mientras que algunas de las interacciones de tipo salvaje se conservaron también, lo que significa que SNCA y el dominio coiled-coil de SNCAIP no sólo interactúan en los individuos normales, sino también en los pacientes con FPD, sin embargo el patrón de las interacciones se encontró alterado. Los complejos acoplados de A30P-SNCAIP y E46K-SNCAIP revelaron que las interacciones se desplazaron por completo al dominio NAC, mientras que los complejos H50Q-SNCAIP y G51D-SNCAIP mostraron interacciones alteradas que implicaban los dominios N-terminal y NAC. Sólo las interacciones en A53T-SNCAIP se limitaron por completo al dominio N-terminal, pero el patrón se encontró alterado. Se puede suponer que las interacciones se alteraron debido al patrón de interacción diferencial de SNCA y SNCAIP, afectando así a sus afinidades de unión que, a su vez, influyen en la agregación de SNCA (Fig. 5d, véase la Fig.S7 suplementaria, véase la Tabla S6 suplementaria).

Deja una respuesta

Tu dirección de correo electrónico no será publicada.