Análise filogenética
Relação evolutiva entre SNCA e seus parálogos putativos foi estimada pelos métodos NJ e ML (Fig. 1, ver Figura Suplementar S1). A análise filogenética da família de sinucleína revelou que dois eventos de duplicação contribuíram para a diversificação desta família. O primeiro evento de duplicação ocorreu na raiz dos vertebrados, antes da divisão tetrápodes-teleost, deduzido no parálogo SNCG e ancestral da SNCA/SNCB. Enquanto o segundo evento de duplicação ocorreu na raiz da linhagem sarcoptérica, após a especiação do peixe teleost (SNCA/B) resultou em parálogos da SNCA e da SNCB. Vale notar também que os comprimentos dos ramos para as proteínas SNCG são mais longos que os dos outros dois parálogos, sugerindo que este parálogo pode ter evoluído rapidamente em comparação com a SNCA e SNCB. Pesquisas de similaridade bidirecional baseadas em explosão não identificam nenhum ortograma desta família entre os invertebrados, o que reforça a suposição de origem específica dos vertebrados desta família (Fig. 1, ver Figura Suplementar S1).
Comparação da taxa evolutiva do gene SNCA entre sarcopterígenos
Para estimar as diferenças da taxa evolutiva do gene SNCA entre vários clades de sarcopterígenos, os ortologs de SNCA de membros representativos dos hominoides (humanos, chimpanzé, gorila, orangotango), não-hominoides (macaque, tartaruga, macaco esquilo, bushbaby), mamíferos placentários não-primate (rato, cão, vaca, elefante) e tetrápodes não-mamíferos (galinha, tartaruga, rã, celacanto) foram obtidos. Taxas de substituição não sinônimas (Ka/dN) e sinônimas (Ks/dS) foram estimadas para cada grupo. E então o teste z foi aplicado para verificar a restrição de seleção nos grupos acima mencionados.
A diferença de Ka-Ks (dN-dS) para hominóides foi encontrada como -2,241 (P = 0,014), não-hominoides foi -4,716 (P = 0), mamíferos placentários não-primate foi -6,1777 (P = 0) e tetrápodes não-mamíferos foi -7,085 (P = 0) (ver Tabela Suplementar S1). Em geral, o valor de Ka inferior a Ks (Ka < Ks) sugere seleção negativa, ou seja, substituições não silenciosas foram purgadas por seleção natural, enquanto o cenário inverso (Ka > Ks) implica seleção positiva, ou seja, mutações vantajosas se acumularam durante o curso da evolução. Entretanto, a evidência para seleção positiva ou negativa requer que o valor seja significativamente diferente um do outro41,42. Resultados deduzidos pelo teste z (Ka-Ks < 0, p < 0,05) sugerem que a SNCA desviou-se da neutralidade durante a evolução mostrando a assinatura de restrição de seleção negativa dentro da linhagem sarcoptérica (ver Tabela Complementar S1).
A análise da taxa evolutiva também foi realizada para cópias parálogas putativas da SNCA, ou seja, SNCB e SNCG. A diferença Ka-Ks (dN-dS) para a SNCB foi identificada como -1,661(P = 0,05) para hominoides, -4,708(P = 0) para primatas não-hominoides, -5,212(P = 0) para mamíferos placentários não-primate e -2,992(P = 0,002) para tetrápodes não-mamíferos (ver Tabela Suplementar S2). A diferença de Ka-Ks (dN-dS) para SNCG foi identificada como -1,658(P = 0,05) para hominóides, -4,064(P = 0) para primatas não-hominoides, -5.485(P = 0) para mamíferos placentários não-primate, -6,306(P = 0) tetrápodes não-mamíferos e -6,341(P = 0) para peixes (fugu, tetraodon, stickleback, medaka) (ver Tabela Suplementar S3). Estes dados especificam que não apenas SNCA mas outros dois membros da família das sinucleinas também foram retidos sob forte pressão de seleção purificadora entre os sarcopterígenos analisados.
Organização do domínio da SNCA
A fim de obter uma visão comparativa da organização do domínio, a anotação completa do domínio do gene da SNCA foi realizada envolvendo os ortologs representativos dos sarcopterígenos (humano, rato, cão, galinha, celacanto), bem como as cópias análogas em humano (SNCB e SNCG). Esta anotação revelou a arquitetura distintiva do gene SNCA que é composto de N-terminal A2 lipídico de ligação alfa-hélice (1-60), não-amilóide β componente (NAC) domínio (61-95) e C-terminal ácido (96-140) (Fig. 2a).
N domínio de ligação lipídica terminal consiste em 5 repetições imperfeitas de KXKEGV26 , e estas repetições são identificadas como altamente conservadas entre ortologs e parólogos analisados de SNCA humana em termos de número e posição (Fig. 2a). Esta região está prevista para formar o núcleo amiloidogênico α-helices, e considerada envolvida na interação com fosfolipídios26,
NAC domínio forma o núcleo amiloidogênico do SNCA26. NAC composto de motivo GAV com VGGAVVVTGV(66-74) sequência de consenso e três sub-modos GXXX (onde X é qualquer um de Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser ou Met)26. Entre os ortologs analisados, o NAC foi identificado como altamente conservado. Enquanto que, entre suas cópias contra-paralógicas, na SNCB o comprimento do NAC (61-84) foi reduzido devido à ausência de um motivo GXXX e repetição do KXKEGV. Enquanto que na SNCG não foi identificado nenhum sub-modelo GXXX. Entre os três parálogos putativos, o motivo GAV estava explicitamente presente apenas na SNCA (Fig. 2a). O NAC é considerado extremamente necessário para a agregação e fibrilação da SNCA26. Enquanto o GAV é suposto como motivo de assinatura responsável por esse processo de agregação25,
C-terminal acidic domain abriga motivo de ligação de cobre contendo DPDNEA(119-124) seqüência consensual43 que foi encontrada altamente conservada entre os ortologs analisados da SNCA. O alinhamento de sequências múltiplas não conseguiu identificar a conservação deste motivo entre os parálogos da SNCB e SNCG (Fig. 2a). Este domínio da SNCA é enriquecido em resíduos ácidos e prolinas. Três resíduos de tirosina altamente conservados, que são considerados como uma assinatura subfamiliar da SNCA e da SNCB, também estão localizados nesta região26. Também é proposto que a ligação de cobre acelera a agregação da SNCA e influencia seus efeitos patológicos44,
Substituições específicas da linhagem que ocorreram durante a evolução entre os sarcopterígenos analisados foram mapeadas na SNCA humana com a ajuda da técnica de reconstrução dos ancestrais. Classificou-se que nove substituições ocorreram na raiz dos antepassados de mamíferos. Enquanto duas substituições ocorreram na raiz da linhagem de mamíferos placentários não-primate e uma ocorreu especificamente para a linhagem de catarros (hominóides e macacos do velho mundo) (Fig. 2a) (Tabela 1). Destas 12 substituições identificadas, cinco (S64T, G68E, N87S, L94F, V95G) estavam confinadas ao CNA, enquanto seis (A101G, F107A, M112I, M113L, P129S, E132G) residiam no domínio ácido terminal C. Apenas 1 substituição (T53A) foi identificada na região N-terminal (Fig. 2a). Foram então analisadas as propriedades físico-químicas dessas substituições de aminoácidos que ilustraram que aproximadamente todas as substituições que ocorreram durante a evolução foram do tipo radical, exceto T53A e A101G (Tabela 1). Esta análise destaca o domínio de ligação lipídica terminal N como altamente conservado entre os ortologs e paralogs analisados. Esse achado foi ainda reforçado pelo posicionamento físico de cinco mutações específicas humanas previamente relatadas associadas à doença de Parkinson familiar: A30P3, E46K4, H50Q5, G51D6 e A53T7 na SNCA humana. Os resultados revelaram o confinamento destas mutações explicitamente para o domínio N-terminal o que, por sua vez, implica o significado da alta conservação desta região não só com perspectiva funcional mas também para a patogénese da doença de Parkinson (Fig. 2a). Com a ajuda da análise da janela SLAC, parece que o domínio N-terminal é composto por 15 sítios negativamente constrangidos, o que defende ainda que fortes restrições selectivas estão a operar o seu papel na preservação desta região durante a evolução dos sarcoptergianos (Fig. 2b, ver Tabela Suplementar S4).
Evolução estrutural da SNCA
Para verificar melhor como a seleção purificadora está desempenhando seu papel na definição das restrições espaciais das proteínas SNCA ancestrais a nível estrutural, um estudo estrutural comparativo foi conduzido. A estrutura RMN de SNCA humana (1XQ8) foi tomada como referência e comparada com as proteínas ancestrais modeladas (Fig. 3). Os desvios estruturais foram examinados com o auxílio de valores de RMSD (Fig. 3, ver Figura Suplementar S2A,B). Os resultados revelaram aspectos muito notáveis que não foram antecipados pela análise comparativa a nível de sequência. A análise estrutural comparativa sugere que a estrutura da SNCA passou por séries de transições para adquirir a sua conformação favorecida. Modelos sobrepostos de proteínas de SNCA ancestrais e 1XQ8 revelaram região de desvio comum englobando 32 a 58 do domínio de ligação lipídica N-terminal de SNCA (Tabela 2). Esses desvios estruturais também foram medidos com a ajuda da quantificação das torções da espinha dorsal, o que evidenciou o fato de que a região 32 a 58 de SNCA está em contínua evolução a nível estrutural, apesar de sua alta conservação em seqüência (Tabela 2). Foi também identificado que foram incorporadas substituições desestabilizadoras durante a evolução da SNCA com o objectivo de alcançar a sua conformação desordenada intrínseca, o que implica os constrangimentos funcionais que lhe estão subjacentes (Tabela 1). Assim, parece lógico especular a partir desta abordagem de comparação estrutural que durante a evolução das SNCA foram incorporadas aquelas substituições que não só causaram a desestabilização das SNCA como também trouxeram uma mudança estrutural drástica na região identificada. Esta região crítica (32-58) também foi reconhecida como crucial para a conformação adequada não só do domínio da hélice alfa N-terminal A2, mas também do domínio NAC. Com a ajuda de técnicas de difração de elétrons e raios X, foi relatado que o SNCA normal se monta através de sua região N-terminal, o que mais uma vez destaca o papel significativo deste domínio45.
Intrigualmente, todas as mutações específicas humanas envolvidas na patogênese da FPD residem nesta região crucial, o que significa que qualquer mudança nesta região será deletéria por causa da forte seleção e restrições funcionais impostas a ela. Modelos mutantes sobrepostos com 1XQ8 identificaram grandes mudanças para o domínio de ligação lipídica em A30P e H50Q, enquanto que grandes mudanças foram observadas nos domínios de ligação lipídica e NAC no caso do E46K e A53T. Apenas o G51D mostrou alteração apenas na região CNA (ver Fig.S4A,B suplementar). Todos os cinco modelos mutantes apresentavam em comum uma região altamente desviada de 32 para 58. Pode-se postular a partir desta análise estrutural comparativa que os efeitos primários e o papel destas cinco mutações de SNCA na patogênese da FPD podem ser diferentes devido às suas morfologias estruturais diferenciais.
Outra forma de investigar as diferenças estruturais entre os parálogos humanos de SNCA, também foi realizada uma análise estrutural comparativa. Como as estruturas NMR da SNCB e SNCG humanas não foram relatadas até o momento, suas estruturas foram modeladas tomando como referência a estrutura NMR da SNCA humana (1XQ8) e os desvios estruturais foram avaliados (ver Figura Suplementar S5A,B). Parece que as estruturas SNCB e SNCG são altamente desviadas da SNCA no domínio N-terminal e NAC (Fig. 4).
Análise das interações entre a SNCA e o domínio da bobina de SNCAIP
A fim de investigar mais a importância desta região crítica, sua importância funcional foi então decifrada com a ajuda do estudo da interação. Para este propósito, a sinfilina-1 (SNCAIP) foi considerada, pois a anotação do domínio da sinfilina-1 revelou que ela é 919 a.a (3745 bp) proteína codificada por 10 exons17, englobando seis repetições de anquirina e um domínio central de bobina (510-557) (Fig. 5a). Tem sido confirmado a partir de técnicas bioquímicas e RMN que o SNCAIP interage com a região terminal N do SNCA38. Embora a função celular normal desses parceiros interativos ainda seja desconhecida, mas tem sido relatado que o SNCAIP está localizado desenvolvimente para terminais sinápticos e sua associação com vesículas sinápticas é modulada pelo SNCA. Neste contexto, SNCAIP é considerado como parceiro sináptico de SNCA, implicando que esta interação medeia as funções sinápticas da SNCA, possivelmente ancorando SNCA à membrana da vesícula46,
A fim de explorar o papel da região crítica na interação, foi realizada uma análise de acoplagem. Foram identificadas interações entre as proteínas SNCA específicas dos mamíferos sarcoptéricos ancestrais, mamíferos específicos e não primatas, que revelaram que a interação entre SNCA e o domínio da bobina de SNCAIP evoluiu com o passar do tempo, ou seja, interações específicas da linhagem surgiram durante a história evolutiva dos sarcoptéricos (Fig. 5b). A análise das interações entre SNCA específica de humanos e o domínio de bobinas de SNCAIP revelou que na raiz das catarrobras, poucas interações específicas de linhagem evoluíram, ou seja, Lys32, Tyr39, e Lys45 (veja a Figura Suplementar S6, veja a Tabela Suplementar S5). Curiosamente, estas interações específicas humanas (catarraminas) residem na região crítica identificada, o que reforça nossa hipótese da importância estrutural e funcional desta região e seu papel vital na patogênese da FPD (Fig. 5c).
Análise de interação entre modelos mutantes de SNCA específicos de humanos com SNCAIP revelou padrões de interação alterados enquanto algumas das interações do tipo selvagem também foram retidas, o que significa que SNCA e o domínio da bobina de SNCAIP não só interagem em indivíduos normais mas também nos pacientes com DPP, entretanto o padrão de interações foi encontrado alterado. Complexos bloqueados de A30P-SNCAIP e E46K-SNCAIP revelaram que as interações se deslocaram inteiramente para o domínio NAC enquanto que os complexos H50Q-SNCAIP e G51D-SNCAIP mostraram interações alteradas envolvendo os domínios N-terminal e NAC. Apenas as interações no A53T-SNCAIP foram confinadas inteiramente ao domínio N-terminal, mas o padrão foi encontrado alterado. Pode-se assumir que as interações se alteraram devido ao padrão de interação diferencial do SNCA e SNCAIP, afetando suas afinidades de ligação que, por sua vez, influenciam a agregação do SNCA (Fig. 5d, ver Fig.S7 Suplementar, ver Tabela Suplementar S6).