Parkinsonsjukdomen SNCA: evolutionära och strukturella insikter med patologisk betydelse

Fylogenetisk analys

Det evolutionära förhållandet mellan SNCA och dess förmodade paraloger uppskattades med NJ- och ML-metoderna (fig. 1, se kompletterande fig. S1). Den fylogenetiska analysen av synukleinfamiljen visade att två duplikationshändelser har bidragit till diversifieringen av denna familj. Den första duplikationen ägde rum vid roten av ryggradsdjuren, före uppdelningen mellan tetrapoder och teleoster, vilket ledde till SNCG-paraloger och förfäder till SNCA/SNCB. Den andra duplikationshändelsen har inträffat vid roten av sarcopterygiernas släkt, efter artbestämningen av teleostfiskarna (SNCA/B), vilket resulterade i SNCA- och SNCB-paraloger. Det är också värt att notera att grenlängderna för SNCG-proteiner är längre än för de andra två paralogerna, vilket tyder på att denna paralog kan ha utvecklats snabbt i jämförelse med SNCA och SNCB. Blast-baserade dubbelriktade likhetssökningar identifierar inte någon ortolog av denna familj bland ryggradslösa djur, vilket stärker antagandet att denna familj har ett vertebratspecifikt ursprung (Fig. 1, se kompletterande figur S1).

Figur 1: Neighbor Joining tree of the synuclein family members.
figure1

Okorrigerad p-distans användes. Alternativet fullständig borttagning användes. Siffror på grenar representerar bootstrap-värden (baserade på 1000 replikeringar) som stöder den grenen; endast värden ≥50 % presenteras här. Skalstreck visar aminosyrasubstitution per plats.

Varje evolutionär hastighet för SNCA-genen bland sarcopterygians

För att uppskatta skillnaderna i evolutionär hastighet för SNCA-genen bland olika klasser av sarcopterygians, har ortologerna av SNCA från representativa medlemmar av hominoider (human, schimpans, gorilla, orangutang), icke-hominoider (makak, marmoset, ekorreapa, bushbaby), icke-primata placentala däggdjur (mus, hund, ko, elefant) och icke-däggdjur tetrapoder (kyckling, sköldpadda, groda, coelacanth) erhölls. Icke-synonyma (Ka/dN) och synonyma substitutionsfrekvenser (Ks/dS) uppskattades för varje grupp. Och sedan tillämpades z-test för att kontrollera selektionsbegränsningar på de ovan nämnda grupperna.

Den Ka-Ks (dN-dS) skillnaden för hominoider visade sig vara -2,241 (P = 0,014), icke-hominoider var -4,716 (P = 0), icke-primata placenta-däggdjur var -6,1777 (P = 0) och icke-mammalian tetrapoda var -7,085 (P = 0) (se kompletterande tabell S1). I allmänhet tyder ett Ka-värde som är lägre än Ks (Ka < Ks) på negativt urval, dvs. att icke-stumma substitutioner har rensats bort av det naturliga urvalet, medan det omvända scenariot (Ka > Ks) tyder på positivt urval, dvs. att fördelaktiga mutationer har ackumulerats under evolutionens gång. Bevisen för positivt eller negativt urval kräver dock att värdena skiljer sig signifikant från varandra41,42. De resultat som härleds från z-testet (Ka-Ks < 0, p < 0,05) tyder på att SNCA har avvikit från neutralitet under evolutionen, vilket visar signaturen av negativ selektionsbegränsning inom sarcopterygianernas släktlinje (se kompletterande tabell S1).

Analysen av den evolutionära hastigheten utfördes också för de förmodade paraloga kopiorna av SNCA, det vill säga SNCB och SNCG. Ka-Ks (dN-dS)-skillnaden för SNCB identifierades som -1,661(P = 0,05) för hominoider, -4,708(P = 0) för icke hominoida primater, -5,212(P = 0) för icke primitiva placenta-däggdjur och -2,992(P = 0,002) för icke däggdjurs tetrapoder (se kompletterande tabell S2). Ka-Ks (dN-dS) skillnaden för SNCG identifierades som -1,658(P = 0,05) för hominoider, -4,064(P = 0) för icke-hominoida primater, -5.485(P = 0) för icke-primata placenta-däggdjur, -6,306(P = 0) icke-däggdjur tetrapoder och -6,341(P = 0) för fiskar (fugu, tetraodon, pigghaj, medaka) (se kompletterande tabell S3). Dessa data specificerar att inte bara SNCA utan även de andra två medlemmarna i synukleinfamiljen har bevarats under ett starkt renande selektionstryck bland de analyserade sarcopterygians.

Domänorganisation av SNCA

För att få en inblick i den komparativa domänorganisationen utfördes en fullständig domänannotering av SNCA-genen som innebar de ortologer som är representativa för sarcopterygians (människa, mus, hund, kyckling, coelacanth) samt de paraloga kopiorna hos människa (SNCB och SNCG). Denna annotering avslöjade SNCA-genens distinkta arkitektur som består av N-terminal A2 lipidbindande alfahelixdomän (1-60), Non-amyloid β-komponent (NAC)-domän (61-95) och C-terminal surdomän (96-140) (Fig. 2a).

Figur 2: Schematisk representation.
figure2

(a) Domänorganisation av SNCA-proteinet. Schematisk bild av den jämförande organisationen av viktiga funktionella domäner och motiv av SNCA över mänskliga paraloga och ortologa proteiner från fylogenetiskt avlägsna arter. Proteinlängderna är ritade ungefär i skala. Domäner och motiv är färgkodade. (b) Fönster som visar de platser som omfattas av negativa selektionsbegränsningar i SNCA bland sarcopterygians. Resultaten genereras med Hyphy genom att implementera SLAC-metoden som använder global kodonmodell och maximal sannolikhet för att rekonstruera den evolutionära historien.

N-terminal lipidbindningsdomän består av 5 KXKEGV-imperfekta upprepningar26 , och dessa upprepningar identifieras som mycket konserverade bland analyserade ortologer och paraloger av mänsklig SNCA när det gäller antal och position (fig. 2a). Denna region förutspås bilda amfipatiska α-helices och anses vara involverad i interaktion med fosfolipider26.

NAC-domänen bildar SNCA:s amyloidogena kärna26. NAC består av GAV-motiv med VGGAVVVTGV(66-74) konsensussekvens och tre GXXX-submotiv (där X är något av Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser eller Met)26. Bland de analyserade ortologerna identifierades NAC som mycket konserverad. Bland de paraloga kopiorna i SNCB var NAC:s längd (61-84) minskad på grund av avsaknaden av ett GXXX-motiv och en KXKEGV-upprepning. Inget GXXX-submotiv identifierades i SNCG. Bland de tre förmodade paralogerna fanns GAV-motivet uttryckligen endast i SNCA (fig. 2a). NAC anses vara extremt nödvändigt för SNCA-aggregation och fibrillering26. GAV antas vara ett signaturmotiv som är ansvarigt för denna aggregeringsprocess25.

C-terminala sura domänen har ett kopparbindningsmotiv som innehåller konsensussekvensen DPDNEA(119-124)43 som befanns vara mycket konserverad bland de analyserade ortologerna av SNCA. Genom att anpassa flera sekvenser kunde man inte identifiera bevarandet av detta motiv bland SNCB:s och SNCG:s paraloger (fig. 2a). Denna domän av SNCA är berikad på sura rester och proliner. Tre mycket konserverade tyrosinrester, som anses vara en signatur för SNCA:s och SNCB:s underfamilj, finns också i denna region26. Det föreslås också att kopparbindning påskyndar aggregeringen av SNCA och påverkar dess patologiska effekter44.

Linjespecifika substitutioner som har inträffat under evolutionen bland analyserade sarcopterygians har kartlagts på människans SNCA med hjälp av tekniken för rekonstruktion av förfäder. Den klassificerade att nio substitutioner har inträffat vid roten av däggdjurens förfader. Medan två substitutioner inträffade vid roten av icke-primata placentala däggdjurs släkt och en inträffade specifikt till catarrhini-läkten (hominoider och gamla världens apor) (fig. 2a) (tabell 1). Av dessa 12 identifierade substitutioner befanns fem (S64T, G68E, N87S, L94F, V95G) vara begränsade till NAC, medan sex (A101G, F107A, M112I, M113L, P129S, E132G) fanns i den C-terminala sura domänen. Endast en substitution (T53A) identifierades i den N-terminala regionen (fig. 2a). Fysikalisk-kemiska egenskaper hos dessa aminosyrasubstitutioner analyserades sedan, vilket visade att ungefär alla substitutioner som har förekommit under evolutionen var av radikal typ utom T53A och A101G (tabell 1). Denna analys lyfter fram den N-terminala lipidbindningsdomänen som mycket konserverad bland de analyserade ortologerna och paralogerna. Detta resultat stärktes ytterligare av den fysiska placeringen av tidigare rapporterade fem människospecifika mutationer som är associerade med familjär Parkinsons sjukdom, dvs. A30P3, E46K4, H50Q5, G51D6 och A53T7 på mänsklig SNCA. Resultaten visade att dessa mutationer är uttryckligen begränsade till den N-terminala domänen, vilket i sin tur innebär att denna region är mycket välbevarad, inte bara ur funktionell synvinkel utan även för patogenesen av FPD (fig. 2a). Med hjälp av SLAC-window-analys visar det sig att den N-terminala domänen består av 15 negativt begränsade platser, vilket ytterligare visar att starka selektiva begränsningar spelar en roll för att bevara denna region under sarcopterygians evolution (Fig. 2b, se kompletterande tabell S4).

Tabell 1 Efter divergensen från sarkopterygiernas förfäder inträffade nio fasta aminosyraförändringar vid däggdjurens rot, varav två inträffade specifikt i icke-primata placenta-däggdjurslinjer medan en inträffade specifikt i primaternas (catarrhini) linjer.

Strukturell evolution av SNCA

För att ytterligare inspektera hur det renande urvalet utför sin roll när det gäller att definiera de rumsliga begränsningarna på förfädernas SNCA-proteiner på strukturell nivå genomfördes en jämförande strukturell studie. NMR-strukturen av humant SNCA (1XQ8) togs som referens och jämfördes med modellerade förfäders proteiner (fig. 3). Strukturella avvikelser undersöktes med hjälp av RMSD-värden (fig. 3, se kompletterande fig. S2A,B). Resultaten avslöjade mycket anmärkningsvärda aspekter som inte förväntades av den jämförande analysen på sekvensnivå. Jämförande strukturanalys tyder på att SNCA:s struktur har genomgått en rad övergångar för att få sin gynnade konformation. Överlagrade modeller av de ursprungliga SNCA-proteinerna och 1XQ8 avslöjade en gemensam avvikande region som omfattade 32 till 58 av SNCA:s N-terminala lipidbindningsdomän (tabell 2). Dessa strukturella avvikelser mättes också med hjälp av kvantifiering av ryggradstorsioner, vilket visade att SNCA:s region 32-58 kontinuerligt utvecklas på strukturell nivå, trots dess höga sekvensbevarande (tabell 2). Det konstaterades också att destabiliserande substitutioner har införlivats under SNCA:s utveckling i syfte att uppnå dess inneboende oordnade konformation, vilket innebär att det finns funktionella begränsningar bakom den (tabell 1). Det verkar därför logiskt att utifrån denna strukturella jämförelse spekulera att under SNCA:s utveckling har dessa substitutioner införlivats, vilket inte bara orsakade destabilisering av SNCA utan också medförde en drastisk strukturell förändring i den identifierade regionen. Denna kritiska region (32-58) erkändes också som avgörande för den korrekta konformationen av inte bara den N-terminala A2 alfahelixdomänen utan även för NAC-domänen. Med hjälp av elektron- och röntgendiffraktionsteknik har det rapporterats att normal SNCA samlas genom sin N-terminala region, vilket återigen understryker den viktiga roll som denna domän spelar45.

Figur 3: Strukturell utveckling av SNCA-proteiner sedan splittringen från den sista gemensamma sarcopterygiska förfadern.
figur3

Signifikant strukturell divergens mot det humana SNCA observerades efter splittringen från den gemensamma sarcopterygiska förfadern. Nio specifika substitutioner har inträffat vid roten av däggdjurslinjen som bibehålls hos primater och de icke-primata placentala däggdjuren efter splittringen från den sarkopterygiska förfadern. Två substitutioner har däremot inträffat specifikt vid roten av de icke-primata placentala däggdjurens släktlinje och en specifik substitution för Catarrhini har inträffat efter uppdelningen från den gemensamma däggdjursförfadern. Avvikande rester i termer av ryggradets torsionsvinklar (Φ°,Ψ°) från det mänskliga SNCA (1XQ8) representeras med röd färg. Strukturella avvikelser undersöktes med hjälp av RMSD-värden.

Tabell 2 Analys av de släktskapsspecifika strukturella avvikelserna i ryggradstorsionsvinklarna hos de ursprungliga SNCA-proteinerna genom att införliva de klassspecifika substitutionerna.

Intressant nog finns alla människospecifika mutationer som är involverade i FPD-patogenesen i denna viktiga region, vilket innebär att varje förändring i denna region kommer att vara skadlig på grund av det starka urvalet och de funktionella begränsningarna som den utsätts för. Överlagrade mutantmodeller med 1XQ8 identifierade stora förskjutningar mot den lipidbindande domänen i A30P och H50Q, medan stora förändringar observerades i lipidbindande och NAC-domäner när det gäller E46K och A53T. Endast G51D visade förändrad NAC-region endast (se kompletterande figur S4A, B). Alla fem mutantmodeller hade en mycket avvikande region från 32 till 58 gemensamt. Det kan postuleras från denna jämförande strukturella analys att de primära effekterna och rollen för dessa fem SNCA-mutationer i FPD-patogenesen kan vara olika på grund av deras olika strukturella morfologier.

För att ytterligare undersöka de strukturella skillnaderna mellan de mänskliga paralogerna av SNCA genomfördes också en jämförande strukturell analys. Eftersom NMR-strukturerna för mänskliga SNCB och SNCG hittills inte har rapporterats, modellerades deras strukturer genom att ta NMR-strukturen för mänsklig SNCA (1XQ8) som referens och de strukturella avvikelserna bedömdes (se kompletterande figur S5A,B). Det framgår att SNCB- och SNCG-strukturerna avviker kraftigt från SNCA vid N-terminalen och NAC-domänen (fig. 4).

Figur 4: Strukturell divergens mellan mänskliga paraloger av SNCA.
figur4

Större strukturella förskjutningar observerades i de N-terminala lipidbindande och NAC-domänerna på grund av paralogspecifika substitutioner. Efter den första duplikationshändelsen genomgick det ursprungliga SNCA/B 19 förändringar. Efter den andra duplikationen uppvisade SNCB och SNCA 6 respektive 12 substitutioner. Avvikande rester i jämförelse med mänsklig SNCA (1XQ8) är färgkodade. Strukturella avvikelser bedömdes med hjälp av RMSD-värden.

Analys av interaktionerna mellan SNCA och SNCAIP:s coiled-coil-domän

För att ytterligare undersöka betydelsen av denna kritiska region dechiffrerades sedan dess funktionella betydelse med hjälp av interaktionsstudier. För detta ändamål beaktades synfilin-1 (SNCAIP), eftersom domänannotering av synfilin-1 avslöjade att det är ett 919 a.a (3745 bp) protein som kodas av 10 exoner17 , omfattar sex ankyrinliknande upprepningar och en central coiled-coil-domän (510-557) (fig. 5a). Biokemiska och NMR-tekniker har bekräftat att SNCAIP interagerar med SNCA38:s N-terminala region. Även om den normala cellulära funktionen hos dessa interaktionspartners fortfarande är okänd har det rapporterats att SNCAIP är utvecklingsmässigt lokaliserad till synaptiska terminaler och att dess förening med synaptiska vesiklar moduleras av SNCA. I detta sammanhang betraktas SNCAIP som synaptisk partner till SNCA, vilket innebär att denna interaktion medierar SNCA:s synaptiska funktioner, möjligen genom att förankra SNCA till vesikelmembranet46.

Figur 5
figur5

Skematisk vy (a) Domänorganisation av SNCA- och SNCAIP-proteinerna. Jämförande organisation av viktiga funktionella domäner och motiv i humant SNCA och coiled-coil-domänen i humant SNCAIP. Proteinlängder är ritade ungefär i skala. Domäner och motiv är färgkodade. (b) Analys av de dockade komplexen och vätebindningsinteraktioner. Visar interaktioner mellan sarcopterygiernas ancestral SNCA och SNCAIP:s coiled-coil-domän (2KES). (c) Redovisar interaktioner mellan det mänskliga SNCA (1XQ8) och coiled-coil-domänen av det mänskliga SNCAIP. Interagerande rester som ligger i den intressanta regionen (32-58) är färgkodade. (d) Visar interaktion mellan den modellerade mutanten av SNCA-A30P och coiled-coil domänen av humant SNCAIP. Streckade linjer visar vätebindning.

För att utforska den kritiska regionens roll i interaktionen genomfördes en dockningsanalys. Interaktioner har identifierats mellan sarcopterygiska förfäder, däggdjursspecifika och icke-primata placenta-däggdjursspecifika SNCA-proteiner, vilket avslöjade att interaktionen mellan SNCA och SNCAIP:s coiled-coil-domän har utvecklats med tiden, dvs. att linje-specifika interaktioner har uppstått under sarcopterygiska evolutionära historia (fig. 5b). Interaktionsanalysen mellan människospecifika SNCA och SNCAIP:s coiled-coil-domän visade att vid roten av katarrhinerna har några få linjespecifika interaktioner utvecklats, dvs. Lys32, Tyr39 och Lys45 (se kompletterande figur S6, se kompletterande tabell S5). Intressant nog finns dessa människospecifika (catarrhines) interaktioner i den identifierade kritiska regionen, vilket stärker vår hypotes om den strukturella och funktionella betydelsen av denna region och dess viktiga roll i FPD-patogenesen (fig. 5c).

Interaktionsanalysen mellan mutantmodeller av människospecifika SNCA med SNCAIP avslöjade förändrade interaktionsmönster medan några av vildtypinteraktionerna också bibehölls, vilket innebär att SNCA och SNCAIP:s coiled-coil-domän inte bara interagerar hos normala individer utan även hos FPD-patienterna, men interaktionsmönstret visade sig vara förändrat. I de dockade komplexen A30P-SNCAIP och E46K-SNCAIP visade det sig att interaktionerna helt och hållet flyttades till NAC-domänen, medan komplexen H50Q-SNCAIP och G51D-SNCAIP uppvisade förändrade interaktioner som involverade N-terminala och NAC-domäner. Endast interaktioner i A53T-SNCAIP begränsades helt till den N-terminala domänen, men mönstret var förändrat. Det kan antas att interaktionerna förändrades på grund av olika interaktionsmönster mellan SNCA och SNCAIP, vilket påverkar deras bindningsaffinitet som i sin tur påverkar SNCA-aggregationen (fig. 5d, se kompletterande fig. S7, se kompletterande tabell S6).

Lämna ett svar

Din e-postadress kommer inte publiceras.