Analisi filogenetica
Il rapporto evolutivo tra SNCA e i suoi paraloghi putativi è stato stimato con metodi NJ e ML (Fig. 1, vedi Fig. S1 supplementare). L’analisi filogenetica della famiglia della sinucleina ha rivelato che due eventi di duplicazione hanno contribuito alla diversificazione di questa famiglia. Il primo evento di duplicazione è trasparso alla radice dei vertebrati, prima della scissione tetrapodi-teleoste, dedotta in SNCG paralog e antenato di SNCA/SNCB. Mentre il secondo evento di duplicazione è avvenuto alla radice del lignaggio dei sarcopterigi, dopo la speciazione dei pesci teleostei (SNCA/B) ha portato ai paraloghi SNCA e SNCB. Vale anche la pena notare che le lunghezze dei rami per le proteine SNCG sono più lunghe di quelle degli altri due paraloghi, suggerendo che questo paralogo può essersi evoluto rapidamente rispetto a SNCA e SNCB. Blast basato ricerche di somiglianza bidirezionale non riescono a identificare alcun ortologo di questa famiglia tra gli invertebrati che rafforza l’ipotesi di origine specifica vertebrata di questa famiglia (Fig. 1, vedi Fig. Supplementare S1).
Confronto del tasso evolutivo del gene SNCA tra i sarcopterigi
Al fine di stimare le differenze di tasso evolutivo del gene SNCA tra i vari cladi di sarcopterigi, gli ortologhi di SNCA da membri rappresentativi di ominoidi (umano, scimpanzé, gorilla, orangutan), non ominidi (macaco, uistitì, scimmia scoiattolo, bushbaby), non primati mammiferi placentari (topo, cane, mucca, elefante) e non-mammiferi tetrapodi (pollo, tartaruga, rana, celacanto) sono stati ottenuti. I tassi di sostituzione non sinonimi (Ka/dN) e sinonimi (Ks/dS) sono stati stimati per ogni gruppo. E poi è stato applicato lo z-test per controllare il vincolo di selezione sui gruppi sopra menzionati.
La differenza Ka-Ks (dN-dS) per gli ominoidi è stata trovata come -2,241 (P = 0,014), i non ominoidi era -4,716 (P = 0), i mammiferi placentari non primati era -6,1777 (P = 0) e i tetrapodi non mammiferi era -7,085 (P = 0) (vedi Tabella supplementare S1). In generale, il valore Ka inferiore a Ks (Ka < Ks) suggerisce la selezione negativa, cioè le sostituzioni non silenziose sono state eliminate dalla selezione naturale, mentre lo scenario inverso (Ka > Ks) implica la selezione positiva, cioè le mutazioni vantaggiose si sono accumulate nel corso dell’evoluzione. Tuttavia la prova della selezione positiva o negativa richiede che il valore sia significativamente diverso l’uno dall’altro41,42. Risultati dedotti da z-test (Ka-Ks < 0, p < 0,05) suggerisce che SNCA ha deviato dalla neutralità durante l’evoluzione mostrando la firma di vincolo di selezione negativa all’interno della stirpe sarcopterygian (vedi Tabella supplementare S1).
L’analisi del tasso evolutivo sono stati eseguiti anche per copie paraloghe putativo di SNCA, cioè SNCB e SNCG. La differenza Ka-Ks (dN-dS) per la SNCB è stata identificata come -1.661(P = 0.05) per gli ominoidi, -4.708(P = 0) per i primati non ominoidi, -5.212(P = 0) per i mammiferi placentari non primati e -2.992(P = 0.002) per i tetrapodi non mammiferi (vedi Tabella supplementare S2). La differenza Ka-Ks (dN-dS) per SNCG è stata identificata come -1.658(P = 0.05) per gli ominidi, -4.064(P = 0) per i primati non ominidi, -5.485(P = 0) per i mammiferi placentari non primati, -6.306(P = 0) tetrapodi non-mammiferi e -6.341(P = 0) per i pesci (fugu, tetraodon, spinarello, medaka) (vedi Tabella supplementare S3). Questi dati specificano che non solo SNCA ma altri due membri della famiglia della sinucleina sono stati mantenuti sotto una forte pressione di selezione purificante tra i sarcopterigi analizzati.
Organizzazione dei domini di SNCA
Al fine di ottenere una visione dell’organizzazione comparativa dei domini, l’annotazione completa dei domini del gene SNCA è stata effettuata coinvolgendo gli ortologhi rappresentativi dei sarcopterigi (umano, topo, cane, pollo, celacanto) così come le copie paraloghe in umano (SNCB e SNCG). Questa annotazione ha rivelato l’architettura distintiva del gene SNCA che è composto dal dominio N-terminale A2 dell’alfa-elica legante i lipidi (1-60), dal dominio della componente β non amiloide (NAC) (61-95) e dal dominio C-terminale acido (96-140) (Fig. 2a).
N-terminale dominio di legame lipidico è costituito da 5 KXKEGV imperfetta ripetizioni26, e queste ripetizioni sono identificati come altamente conservati tra gli ortologhi analizzati e paraloghi di SNCA umana in termini di numero e posizione (Fig. 2a). Questa regione è previsto per formare anfipatici α-eliche, e considerato coinvolto nell’interazione con fosfolipidi26.
dominio NAC forma il nucleo amiloidogenico di SNCA26. NAC comprendeva motivo GAV con VGGAVVTGV(66-74) sequenza di consenso e tre GXXX sub-motivi (dove X è uno qualsiasi di Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser o Met)26. Tra gli ortologhi analizzati, NAC è stato identificato come altamente conservato. Mentre, tra le sue copie controparagonali, nella SNCB la lunghezza di NAC (61-84) era ridotta a causa dell’assenza di un motivo GXXX e della ripetizione KXKEGV. Mentre nessun submotivo GXXX è stato identificato nella SNCG. Tra i tre paraloghi putativi, il motivo GAV era esplicitamente presente solo in SNCA (Fig. 2a). NAC è considerato estremamente necessario per l’aggregazione e la fibrillazione SNCA26. Mentre GAV è supposto come motivo firma responsabile di questo processo di aggregazione 25.
C-terminale dominio acido ospita rame motivo di legame contenente DPDNEA (119-124) sequenza di consenso 43 che è stato trovato altamente conservato tra gli ortologhi analizzati di SNCA. L’allineamento di sequenza multipla non è riuscito a identificare la conservazione di questo motivo tra i paraloghi della SNCB e della SNCG (Fig. 2a). Questo dominio della SNCA è arricchito in residui acidi e proline. Tre residui di tirosina altamente conservati, che sono considerati come una firma sottofamiglia di SNCA e SNCB, si trovano anche in questa regione26. È stato anche proposto che il legame del rame accelera l’aggregazione di SNCA e influenza i suoi effetti patologici44.
Sostituzioni specifiche del lignaggio che si sono verificate durante l’evoluzione tra i sarcopterigi analizzati sono stati mappati su SNCA umano con l’aiuto della tecnica di ricostruzione antenato. È stato classificato che nove sostituzioni si sono verificate alla radice dell’antenato dei mammiferi. Mentre due sostituzioni si sono verificate alla radice della stirpe dei mammiferi placentari non primati e una si è verificata specificamente alla stirpe dei catarrini (ominoidi e scimmie del vecchio mondo) (Fig. 2a) (Tabella 1). Di queste 12 sostituzioni identificate, cinque (S64T, G68E, N87S, L94F, V95G) sono risultate confinate verso il NAC, mentre sei (A101G, F107A, M112I, M113L, P129S, E132G) erano residenti nel dominio acido C-terminale. Solo 1 sostituzione (T53A) è stata identificata nella regione N-terminale (Fig. 2a). Le proprietà fisico-chimiche di queste sostituzioni aminoacidiche sono state poi analizzate che hanno illustrato che circa tutte le sostituzioni che si sono verificate durante l’evoluzione erano di tipo radicale tranne T53A e A101G (Tabella 1). Questa analisi evidenzia che il dominio di legame lipidico N-terminale è altamente conservato tra gli ortologhi e i paraloghi analizzati. Questa constatazione è stata ulteriormente rafforzata dal posizionamento fisico delle cinque mutazioni specifiche umane precedentemente riportate associate alla malattia di Parkinson familiare, cioè A30P3, E46K4, H50Q5, G51D6 e A53T7 su SNCA umano. I risultati hanno rivelato il confinamento di queste mutazioni esplicitamente verso il dominio N-terminale che a sua volta implica il significato di alta conservazione di questa regione non solo con prospettiva funzionale ma anche per la patogenesi della FPD (Fig. 2a). Con l’aiuto di SLAC-window analisi, sembra che il dominio N-terminale comprendeva 15 siti vincolati negativamente che sostiene ulteriormente che forti vincoli selettivi stanno operando il loro ruolo nel preservare questa regione durante l’evoluzione sarcopterygians (Fig. 2b, vedi tabella supplementare S4).
Evoluzione strutturale di SNCA
Per ispezionare ulteriormente come la selezione purificante svolge il suo ruolo nel definire i vincoli spaziali sulle proteine SNCA ancestrali a livello strutturale, è stato condotto uno studio strutturale comparativo. La struttura NMR del SNCA umano (1XQ8) è stata presa come riferimento e confrontata con le proteine ancestrali modellate (Fig. 3). Le deviazioni strutturali sono state esaminate con l’aiuto dei valori RMSD (Fig. 3, vedi Fig. supplementare S2A,B). I risultati hanno rivelato aspetti molto notevoli che non sono stati anticipati dall’analisi comparativa a livello di sequenza. L’analisi strutturale comparativa suggerisce che la struttura di SNCA è passata attraverso una serie di transizioni per acquisire la sua conformazione preferita. Modelli sovrapposti di proteine SNCA ancestrali e 1XQ8 rivelato comune deviato regione comprendeva 32 a 58 di N-terminale dominio legante lipidi di SNCA (Tabella 2). Queste deviazioni strutturali sono state misurate anche con l’aiuto della quantificazione delle torsioni della spina dorsale che ha evidenziato il fatto che la regione da 32 a 58 di SNCA è in continua evoluzione a livello strutturale, nonostante la sua alta conservazione della sequenza (Tabella 2). È stato anche identificato che le sostituzioni destabilizzanti sono state incorporate durante l’evoluzione di SNCA con lo scopo di raggiungere la sua conformazione intrinseca disordinata che implica i vincoli funzionali dietro di essa (Tabella 1). Quindi sembra logico speculare da questo approccio di confronto strutturale che durante l’evoluzione del SNCA sono state incorporate quelle sostituzioni che non solo hanno causato la destabilizzazione del SNCA, ma hanno anche portato un drastico cambiamento strutturale nella regione identificata. Questa regione critica (32-58) è stata anche riconosciuta cruciale per la corretta conformazione non solo del dominio N-terminale A2 alfa-elica ma anche per il dominio NAC. Con l’aiuto di tecniche di diffrazione di elettroni e raggi X è stato riportato che il SNCA normale si assembla attraverso la sua regione N-terminale che evidenzia ancora una volta il ruolo significativo di questo dominio45.
Intrigante, tutte le mutazioni specifiche umane coinvolte nella patogenesi della FPD risiedono in questa regione cruciale, il che significa che qualsiasi cambiamento in questa regione sarà deleterio a causa della forte selezione e dei vincoli funzionali imposti su di essa. I modelli mutanti sovrapposti con 1XQ8 hanno identificato importanti spostamenti verso il dominio di legame lipidico in A30P e H50Q, mentre il cambiamento maggiore è stato osservato nei domini di legame lipidico e NAC nel caso di E46K e A53T. Solo G51D ha mostrato la regione NAC alterata solo (vedi Fig.S4A,B). Tutti e cinque i modelli mutanti avevano una regione altamente deviata da 32 a 58 in comune. Si può postulare da questa analisi strutturale comparativa che gli effetti primari e il ruolo di queste cinque mutazioni SNCA nella patogenesi FPD possono essere diversi a causa delle loro morfologie strutturali differenziali.
Per indagare ulteriormente le differenze strutturali tra i paraloghi umani di SNCA, è stata condotta anche un’analisi strutturale comparativa. Poiché le strutture NMR di SNCB e SNCG umane non sono state riportate finora, le loro strutture sono state modellate prendendo la struttura NMR di SNCA umana (1XQ8) come riferimento e le deviazioni strutturali sono state valutate (vedi Fig. S5A,B). Sembra che le strutture SNCB e SNCG siano altamente deviate da SNCA al dominio N-terminale e NAC (Fig. 4).
Analisi delle interazioni tra SNCA e il dominio coiled-coil di SNCAIP
Al fine di indagare ulteriormente l’importanza di questa regione critica, il suo significato funzionale è stato decifrato con l’aiuto dello studio di interazione. A questo scopo, è stata presa in considerazione la sifilina-1 (SNCAIP), poiché l’annotazione del dominio della sifilina-1 ha rivelato che si tratta di una proteina di 919 a.a (3745 bp) codificata da 10 esoni17, comprendente sei ripetizioni anchiriniche e un dominio centrale a spirale (510-557) (Fig. 5a). È stato confermato da tecniche biochimiche e NMR che SNCAIP interagisce con la regione N-terminale di SNCA38. Sebbene la normale funzione cellulare di questi partner interagenti sia ancora sconosciuta, è stato riportato che SNCAIP è localizzato per lo sviluppo ai terminali sinaptici e la sua associazione con le vescicole sinaptiche è modulata da SNCA. In questo contesto, SNCAIP è considerato come partner sinaptico di SNCA, implicando che questa interazione media le funzioni sinaptiche di SNCA, possibilmente ancorando SNCA alla membrana delle vescicole46.
Al fine di esplorare il ruolo della regione critica nell’interazione, è stata condotta un’analisi di docking. Le interazioni sono state identificate tra le proteine SNCA ancestrali sarcopterygian, mammiferi specifici e non primati mammiferi placentari specifici, che ha rivelato che l’interazione tra SNCA e coiled-coil dominio di SNCAIP si è evoluto con il passare del tempo cioè interazioni specifiche lignaggio sono emerse durante la storia evolutiva sarcopterygian (Fig. 5b). L’analisi delle interazioni tra l’uomo specifico SNCA e il dominio coiled-coil di SNCAIP ha rivelato che alla radice dei catarrini, poche interazioni specifiche del lignaggio si sono evoluti cioè Lys32, Tyr39, e Lys45 (vedi Fig. supplementare S6, vedi Tabella supplementare S5). È interessante notare che queste interazioni specifiche per l’uomo (catarrini) risiedono nella regione critica identificata che rafforza la nostra ipotesi del significato strutturale e funzionale di questa regione e il suo ruolo vitale nella patogenesi FPD (Fig. 5c).
L’analisi delle interazioni tra i modelli mutanti di SNCA specifico umano con SNCAIP ha rivelato modelli di interazione alterati, mentre alcune delle interazioni wild type sono state mantenute, il che significa che SNCA e il dominio coiled-coil di SNCAIP non solo interagiscono negli individui normali ma anche nei pazienti FPD, tuttavia il modello di interazioni è stato trovato alterato. I complessi di A30P-SNCAIP e E46K-SNCAIP hanno rivelato che le interazioni si sono spostate interamente al dominio NAC, mentre i complessi H50Q-SNCAIP e G51D-SNCAIP hanno mostrato interazioni alterate che coinvolgono i domini N-terminale e NAC. Solo le interazioni in A53T-SNCAIP erano confinate interamente al dominio N-terminale ma il modello è stato trovato alterato. Si può ipotizzare che le interazioni alterate a causa del modello di interazione differenziale di SNCA e SNCAIP influenzando così le loro affinità di legame che a loro volta influenzano l’aggregazione SNCA (Fig. 5d, vedi Fig.S7 supplementare, vedi Tabella S6 supplementare).