Fylogenetisk analyse
Evolutionært forhold mellem SNCA og dets formodede paraloger blev vurderet ved NJ- og ML-metoder (Fig. 1, se Supplerende Fig. S1). Fylogenetisk analyse af synucleinfamilien viste, at to duplikationsbegivenheder har bidraget til diversificeringen af denne familie. Den første duplikationsbegivenhed fandt sted ved roden af hvirveldyrene, før opdelingen mellem tetrapoder og teleoste, hvilket blev udledt af SNCG-paralogen og forfader til SNCA/SNCB. Den anden duplikationsbegivenhed er sket ved roden af sarcopterygiernes slægt, efter at teleostfisk (SNCA/B) er blevet artsbestemt, hvilket har resulteret i SNCA- og SNCB-paraloger. Det er også værd at bemærke, at grenlængderne for SNCG-proteinerne er længere end for de to andre paraloger, hvilket tyder på, at denne paralog kan have udviklet sig hurtigt i forhold til SNCA og SNCB. Blast-baserede bidirektionelle lighedssøgninger identificerer ikke nogen ortolog af denne familie blandt hvirvelløse dyr, hvilket styrker antagelsen om denne families hvirveldyrsspecifikke oprindelse (Fig. 1, se supplerende fig. S1).
Sammenligning af SNCA-genets udviklingshastighed blandt sarcopterygians
For at vurdere forskellene i SNCA-genets udviklingshastighed blandt forskellige klader af sarcopterygians, blev ortologerne af SNCA fra repræsentative medlemmer af hominoider (human, chimpanse, gorilla, orangutang), ikke-hominoider (makak, marmoset, egernabe, bushbaby), ikke-primate placentapattedyr (mus, hund, ko, elefant) og ikke-primate tetrapoder (kylling, skildpadde, frø, coelacanth) blev indhentet. Ikke-synonyme (Ka/dN) og synonyme substitutionsrater (Ks/dS) blev estimeret for hver gruppe. Og derefter blev der anvendt z-test for at kontrollere selektionsbegrænsningen på de ovennævnte grupper.
Den Ka-Ks (dN-dS) forskel for hominoider blev fundet som -2,241 (P = 0,014), ikke-hominoider var -4,716 (P = 0), ikke-primat placentapattedyr var -6,1777 (P = 0) og ikke-pattedyr tetrapoder var -7,085 (P = 0) (se supplerende tabel S1). Generelt tyder en Ka-værdi, der er lavere end Ks (Ka < Ks), på negativ selektion, dvs. at ikke-stumme substitutioner er blevet renset ud af den naturlige selektion, mens det omvendte scenario (Ka > Ks) indebærer positiv selektion, dvs. at fordelagtige mutationer er blevet akkumuleret i løbet af evolutionen. Beviset for positiv eller negativ selektion kræver imidlertid, at værdien er signifikant forskellig fra hinanden41,42. Resultater udledt ved z-test (Ka-Ks < 0, p < 0,05) tyder på, at SNCA har afveget fra neutralitet i løbet af evolutionen, hvilket viser signaturen af negativ selektionsbegrænsning inden for sarcopterygian slægten (se supplerende tabel S1).
Den evolutionære hastighedsanalyse blev også udført for formodede paralogiske kopier af SNCA, dvs. SNCB og SNCG. Ka-Ks (dN-dS)-forskellen for SNCB blev identificeret som -1,661(P = 0,05) for hominoider, -4,708(P = 0) for ikke-hominoide primater, -5,212(P = 0) for ikke-primate placentapattedyr og -2,992(P = 0,002) for ikke-primate tetrapoder (se Supplerende tabel S2). Ka-Ks (dN-dS) forskellen for SNCG blev identificeret som -1,658(P = 0,05) for hominoider, -4,064(P = 0) for ikke-hominoide primater, -5.485(P = 0) for ikke-primate placentapattedyr, -6,306(P = 0) ikke-pattedyr tetrapoder og -6,341(P = 0) for fisk (fugu, tetraodon, stimefisk, medaka) (se Supplerende tabel S3). Disse data angiver, at ikke kun SNCA, men også de to andre medlemmer af synucleinfamilien er blevet bevaret under et stærkt rensende selektionstryk blandt de analyserede sarcopterygiensere.
Domæneorganisation af SNCA
For at få et indblik i den komparative domæneorganisation blev der foretaget en komplet domæneannotation af SNCA-genet, som omfattede de ortologer, der er repræsentative for sarcopterygians (menneske, mus, hund, kylling, coelacanth) samt de paralogiske kopier i mennesket (SNCB og SNCG). Denne annotation afslørede SNCA-genets karakteristiske arkitektur, som består af det N-terminale A2 lipidbindende alfa-helix-domæne (1-60), Non-amyloid β-komponent (NAC)-domæne (61-95) og C-terminalt surt domæne (96-140) (Fig. 2a).
N-terminale lipidbindingsdomæne består af 5 KXKEGV ufuldstændige gentagelser26 , og disse gentagelser er identificeret som stærkt konserverede blandt analyserede ortologer og paraloger af menneskelig SNCA med hensyn til antal og position (fig. 2a). Denne region forudsiges at danne amfipatiske α-helixer og anses for at være involveret i interaktion med fosfolipider26.
NAC-domænet danner den amyloidogene kerne af SNCA26. NAC består af GAV-motivet med VGGAVVVTGV(66-74) konsensussekvens og tre GXXX-submotiver (hvor X er et af Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser eller Met)26. Blandt de analyserede ortologer blev NAC identificeret som meget konserveret. Mens NAC’s længde (61-84) var reduceret i SNCB blandt de tilsvarende paraloge kopier på grund af fraværet af et GXXX-motiv og en KXKEGV-repetition. Mens der ikke blev identificeret noget GXXX-submotiv i SNCG. Blandt de tre formodede paraloger var GAV-motivet kun eksplicit til stede i SNCA (fig. 2a). NAC anses for at være yderst nødvendigt for SNCA-aggregation og fibrillering26. Mens GAV formodes at være et signaturmotiv, der er ansvarlig for denne aggregeringsproces25.
C-terminale sure domæne indeholder et kobberbindingsmotiv, der indeholder DPDNEA(119-124)-konsensussekvensen43 , som blev fundet stærkt konserveret blandt de analyserede ortologer af SNCA. Multiple sekvenstilpasning kunne ikke identificere bevarelsen af dette motiv blandt SNCB- og SNCG-paraloger (fig. 2a). Dette domæne af SNCA er beriget med syreholdige rester og proliner. Tre stærkt konserverede tyrosinrester, der betragtes som en underfamiliesignatur for SNCA og SNCB, er også placeret i dette område26. Det foreslås også, at kobberbinding fremskynder aggregationen af SNCA og påvirker dens patologiske virkninger44.
Linjespecifikke substitutioner, der er sket i løbet af evolutionen blandt de analyserede sarcopterygians, er blevet kortlagt på menneskets SNCA ved hjælp af forfædrenes rekonstruktionsteknik. Det klassificerede, at ni substitutioner er sket ved roden af pattedyrs forfader. Mens to substitutioner opstod ved roden af ikke-primate placentapattedyrs slægtslinje, og en opstod specifikt for catarrhini’s (hominoider og old world monkeys) slægtslinje (fig. 2a) (tabel 1). Ud af disse 12 identificerede substitutioner viste fem (S64T, G68E, N87S, L94F, V95G) sig at være begrænset til NAC, mens seks (A101G, F107A, M112I, M113L, P129S, E132G) befandt sig i det C-terminale syreholdige domæne. Kun 1 substitution (T53A) blev identificeret i den N-terminale region (fig. 2a). Fysisk-kemiske egenskaber for disse aminosyresubstitutioner blev derefter analyseret, hvilket illustrerede, at omtrent alle de substitutioner, der er sket i løbet af evolutionen, var af radikal type undtagen T53A og A101G (tabel 1). Denne analyse fremhæver det N-terminale lipidbindingsdomæne som meget konserveret blandt de analyserede ortologer og paraloger. Dette resultat blev yderligere styrket af den fysiske placering af tidligere rapporterede fem humane specifikke mutationer, der er forbundet med familiær Parkinsons sygdom, dvs. A30P3, E46K4, H50Q5, G51D6 og A53T7, på humant SNCA. Resultaterne afslørede, at disse mutationer udtrykkeligt er begrænset til det N-terminale domæne, hvilket igen indebærer betydningen af den høje bevarelse af denne region, ikke kun med funktionelt perspektiv, men også for patogenese af FPD (Fig. 2a). Ved hjælp af SLAC-vindueanalyse viser det sig, at det N-terminale domæne består af 15 negativt begrænsede steder, hvilket yderligere viser, at stærke selektive begrænsninger spiller en rolle i bevarelsen af denne region i løbet af sarcopterygiens evolution (Fig. 2b, se supplerende tabel S4).
Strukturel evolution af SNCA
For yderligere at inspicere, hvordan rensende selektion udfører sin rolle ved at definere de rumlige begrænsninger på forfædres SNCA-proteiner på strukturelt niveau, blev der gennemført en sammenlignende strukturel undersøgelse. NMR-strukturen af menneskelig SNCA (1XQ8) blev taget som reference og sammenlignet med modellerede forfædte proteiner (Fig. 3). Strukturelle afvigelser blev undersøgt ved hjælp af RMSD-værdier (fig. 3, se supplerende fig. S2A,B). Resultaterne afslørede meget bemærkelsesværdige aspekter, som ikke var forventet ved sammenlignende analyse på sekvensniveau. Komparativ strukturanalyse tyder på, at SNCA’s struktur har gennemgået en række overgange for at opnå sin foretrukne konformation. Overlejrede modeller af forfødte SNCA-proteiner og 1XQ8 afslørede en fælles afvigende region, der omfattede 32 til 58 af SNCA’s N-terminale lipidbindingsdomæne (tabel 2). Disse strukturelle afvigelser blev også målt ved hjælp af kvantificering af rygsøjletorsioner, hvilket viste, at SNCA’s område 32-58 løbende udvikler sig på strukturelt niveau på trods af dets høje sekvensbevaringsgrad (tabel 2). Det blev også identificeret, at destabiliserende substitutioner er blevet inkorporeret i løbet af SNCA’s udvikling med det formål at opnå dens iboende uordnede konformation, hvilket indebærer de funktionelle begrænsninger bag den (tabel 1). Det synes derfor logisk at spekulere ud fra denne strukturelle sammenligning, at der i løbet af SNCA’s udvikling er blevet indarbejdet disse substitutioner, som ikke blot har forårsaget en destabilisering af SNCA, men også har medført et drastisk strukturelt skift i den identificerede region. Denne kritiske region (32-58) blev også anerkendt som værende afgørende for den korrekte konformation af ikke blot det N-terminale A2 alfahelixdomæne, men også for NAC-domænet. Ved hjælp af elektron- og røntgendiffraktionsteknikker er det blevet rapporteret, at normal SNCA samles gennem sin N-terminale region, hvilket igen understreger den vigtige rolle, som dette domæne spiller45.
Det er interessant, at alle humane specifikke mutationer, der er involveret i FPD-patogenese, befinder sig i denne afgørende region, hvilket betyder, at enhver ændring i denne region vil være skadelig på grund af den stærke selektion og de funktionelle begrænsninger, der er pålagt den. Overlejrede mutantmodeller med 1XQ8 identificerede store forskydninger mod lipidbindingsdomænet i A30P og H50Q, mens der blev observeret store ændringer i lipidbindings- og NAC-domæner i tilfælde af E46K og A53T. Kun G51D viste kun ændret NAC-region (se supplerende fig. S4A,B). Alle fem mutantmodeller havde en meget afvigende region fra 32 til 58 til fælles. Det kan postuleres fra denne sammenlignende strukturanalyse, at de primære virkninger og den rolle, som disse fem SNCA-mutationer spiller i FPD-patogenese, kan være forskellige på grund af deres forskellige strukturelle morfologier.
For yderligere at undersøge de strukturelle forskelle mellem de menneskelige paraloger af SNCA blev der også foretaget en sammenlignende strukturanalyse. Da NMR-strukturerne af menneskelig SNCB og SNCG ikke er blevet rapporteret hidtil, blev deres strukturer modelleret ved at tage NMR-strukturen af menneskelig SNCA (1XQ8) som reference, og de strukturelle afvigelser blev vurderet (se supplerende fig. S5A,B). Det fremgår, at SNCB- og SNCG-strukturerne er meget afvigende fra SNCA ved N-terminal- og NAC-domænet (fig. 4).
Analyse af interaktionerne mellem SNCA og SNCAIP’s coiled-coil domæne
For yderligere at undersøge betydningen af denne kritiske region blev dens funktionelle betydning derefter dechifreret ved hjælp af interaktionsundersøgelse. Til dette formål blev synfilin-1 (SNCAIP) taget i betragtning, da domæneannotation af synfilin-1 afslørede, at det er et 919 a.a (3745 bp) protein, der er kodet af 10 exoner17 , og som omfatter seks ankyrinlignende gentagelser og et centralt coiled-coil domæne (510-557) (Fig. 5a). Det er blevet bekræftet ved hjælp af biokemiske og NMR-teknikker, at SNCAIP interagerer med SNCA38’s N-terminale område. Selv om den normale cellulære funktion af disse interaktionspartnere stadig er ukendt, er det blevet rapporteret, at SNCAIP er udviklingsmæssigt lokaliseret til synaptiske terminaler, og at dets associering med synaptiske vesikler moduleres af SNCA. I denne sammenhæng betragtes SNCAIP som en synaptisk partner til SNCA, hvilket indebærer, at denne interaktion medierer SNCA’s synaptiske funktioner, muligvis ved at forankre SNCA til vesikelmembranen46.
For at undersøge den kritiske regions rolle i interaktionen blev der foretaget dockinganalyse. Der er blevet identificeret interaktioner mellem sarcopterygiske forfædre, pattedyrspecifikke og ikke-primatplacentale pattedyrs specifikke SNCA-proteiner, hvilket afslørede, at interaktionen mellem SNCA og coiled-coil domænet af SNCAIP har udviklet sig med tiden, dvs. at der er opstået slægtsspecifikke interaktioner i løbet af sarcopterygisk udviklingshistorie (fig. 5b). Interaktionsanalyse mellem menneskespecifik SNCA og SNCAIP’s coiled-coil domæne viste, at der ved roden af katarryginerne har udviklet sig få slægtsspecifikke interaktioner, dvs. Lys32, Tyr39 og Lys45 (se supplerende figur S6, se supplerende tabel S5). Det er interessant, at disse menneskespecifikke (catarrhines) interaktioner befinder sig i den identificerede kritiske region, hvilket styrker vores hypotese om den strukturelle og funktionelle betydning af denne region og dens afgørende rolle i FPD-patogenese (Fig. 5c).
Interaktionsanalyse mellem mutantmodeller af humane specifikke SNCA med SNCAIP afslørede ændrede interaktionsmønstre, mens nogle af wild type-interaktionerne også blev bevaret, hvilket betyder, at SNCA og SNCAIP’s coiled-coil domæne ikke kun interagerer hos normale individer, men også hos FPD-patienterne, men at interaktionsmønstret blev fundet ændret. Dockede komplekser af A30P-SNCAIP og E46K-SNCAIP viste, at interaktionerne flyttede sig helt til NAC-domænet, mens H50Q-SNCAIP- og G51D-SNCAIP-komplekser viste ændrede interaktioner, der involverede N-terminale og NAC-domæner. Kun interaktioner i A53T-SNCAIP var udelukkende begrænset til det N-terminale domæne, men mønstret blev fundet ændret. Det kan antages, at interaktionerne ændrede sig på grund af forskellige interaktionsmønstre for SNCA og SNCAIP, hvilket påvirker deres bindingsaffiniteter, som igen påvirker SNCA-aggregationen (fig. 5d, se supplerende fig. S7, se supplerende tabel S6).