The Parkinson Disease gene SNCA: Evolutionary and structural insights with pathological implication

Phylogenetic analysis

Evolutionaire verwantschap tussen SNCA en zijn putatieve paralogs werd geschat door NJ en ML methoden (Fig. 1, zie Supplementary Fig. S1). Fylogenetische analyse van de synucleïne familie toonde aan dat twee duplicatie gebeurtenissen hebben bijgedragen aan de diversificatie van deze familie. De eerste duplicatie gebeurtenis heeft plaatsgevonden aan de wortel van de vertebraten, voorafgaand aan de tetrapod-teleost split, afgeleid in SNCG paraloog en voorouder van SNCA / SNCB. De tweede duplicatie vond plaats aan de wortel van de lijn van de sarcopterygiën, na de speciatie van de teleostvissen (SNCA/B) en resulteerde in paralogen van SNCA en SNCB. Het is ook vermeldenswaard dat de taklengten voor SNCG-eiwitten langer zijn dan die van de andere twee paralogen, wat suggereert dat deze paraloog mogelijk snel geëvolueerd is in vergelijking met SNCA en SNCB. Blast-gebaseerde “bidirectional similarity searches” hebben geen ortholoog van deze familie bij ongewervelden gevonden, wat de veronderstelling versterkt dat deze familie specifiek voor vertebraten is ontstaan (Fig. 1, zie aanvullende fig. S1).

Figuur 1: Neighbor Joining tree of the synuclein family members.
figure1

Uncorrected p-distance was used. De optie voor volledige verwijdering werd gebruikt. Nummers op takken vertegenwoordigen bootstrap-waarden (gebaseerd op 1000 replicaties) die die tak ondersteunen; alleen de waarden ≥50% worden hier gepresenteerd. Schaalbalk toont aminozuursubstitutie per site.

Vergelijking van de evolutiesnelheid van het SNCA-gen bij sarcopterygiërs

Om de verschillen in evolutiesnelheid van het SNCA-gen bij diverse clades van sarcopterygiërs te kunnen schatten, zijn de orthologs van SNCA van representatieve leden van hominoïden (mens, chimpansee, gorilla, orang-oetan), niet-hominoïden (makaak, penseelaap, doodshoofdaapje, bushbaby), niet-primate placentale zoogdieren (muis, hond, koe, olifant) en non-mammalian tetrapods (kip, schildpad, kikker, coelacanth) werden verkregen. Niet synonieme (Ka/dN) en synonieme substitutie percentages (Ks/dS) werden geschat voor elke groep. En dan werd z-test toegepast om de selectiebeperking op de bovengenoemde groepen te controleren.

Het Ka-Ks (dN-dS) verschil voor hominoïden werd gevonden als -2,241 (P = 0,014), niet-hominoïden was -4,716 (P = 0), niet-primate placenta zoogdieren was -6,1777 (P = 0) en niet-mammalian tetrapods was -7,085 (P = 0) (zie Supplementary Table S1). In het algemeen suggereert een Ka waarde lager dan Ks (Ka < Ks) negatieve selectie, d.w.z. dat niet-stille substituties door natuurlijke selectie zijn uitgewist, terwijl het omgekeerde scenario (Ka > Ks) positieve selectie impliceert, d.w.z. dat voordelige mutaties zich in de loop van de evolutie hebben opgestapeld. Om aan te tonen dat er sprake is van positieve of negatieve selectie moeten de waarden echter significant van elkaar verschillen41,42. De resultaten van de z-test (Ka-Ks < 0, p < 0,05) wijzen erop dat SNCA in de loop van de evolutie van neutraliteit is afgeweken en de signatuur van negatieve selectie binnen de sarcopterygiën vertoont (zie aanvullende tabel S1).

De analyse van de evolutiesnelheid werd ook uitgevoerd voor veronderstelde paraloge kopieën van SNCA, d.w.z. SNCB en SNCG. Het Ka-Ks (dN-dS) verschil voor SNCB werd vastgesteld als -1,661(P = 0,05) voor hominoïden, -4,708(P = 0) voor niet-hominoïden primaten, -5,212(P = 0) voor niet-primate placenta zoogdieren en -2,992(P = 0,002) voor niet-mammalian tetrapods (zie Supplementary Table S2). Het Ka-Ks (dN-dS) verschil voor SNCG werd vastgesteld als -1.658(P = 0.05) voor hominoïden, -4.064(P = 0) voor niet-hominoïde primaten, -5.485(P = 0) voor niet-primate placenta zoogdieren, -6.306(P = 0) niet-mammalian tetrapods en -6.341(P = 0) voor vissen (fugu, tetraodon, stekelbaars, medaka) (zie Supplementary Table S3). Deze gegevens geven aan dat niet alleen SNCA maar ook de andere twee leden van de synucleïne-familie onder sterke zuiverende selectiedruk bij de geanalyseerde sarcopterygoten behouden zijn gebleven.

Domeinorganisatie van SNCA

Om inzicht te krijgen in de vergelijkende domeinorganisatie is een volledige domeinannotatie van het SNCA-gen uitgevoerd, waarbij zowel de orthologs van sarcopterygiën (mens, muis, hond, kip, coelacanth) als de paraloge exemplaren bij de mens (SNCB en SNCG) zijn betrokken. Deze annotatie onthulde de kenmerkende architectuur van het SNCA-gen dat bestaat uit het N-terminale A2 lipide bindende alpha helix domein (1-60), het Non-amyloid β component (NAC) domein (61-95) en het C-terminale zure domein (96-140) (Fig. 2a).

Figuur 2: Schematische weergave.
figure2

(a) Domeinorganisatie van het SNCA-eiwit. Schematische weergave van de vergelijkende organisatie van de belangrijkste functionele domeinen en motieven van SNCA in humane paraloge en orthologe eiwitten van fylogenetisch verafgelegen soorten. Eiwitlengtes zijn ongeveer op schaal getekend. Domeinen en motieven zijn met kleur gecodeerd. (b) Venster met de plaatsen onder de negatieve selectie beperking in SNCA bij sarcopterygians. De resultaten zijn gegenereerd met Hyphy door de SLAC-methode toe te passen, die gebruik maakt van een globaal codonmodel en maximale waarschijnlijkheid om de evolutionaire geschiedenis te reconstrueren.

N-terminale lipide bindend domein bestaat uit 5 KXKEGV onvolmaakte herhalingen26, en deze herhalingen zijn geïdentificeerd als zeer geconserveerd onder geanalyseerde orthologs en paralogs van menselijk SNCA in termen van aantal en positie (Fig. 2a). Voorspeld wordt dat deze regio amfipathische α-helften vormt, en beschouwd wordt als betrokken bij de interactie met fosfolipiden26.

NAC-domein vormt de amyloïdogene kern van SNCA26. NAC bestaat uit het GAV motief met VGGAVVTGV(66-74) consensus sequentie en drie GXXX sub-motieven (waarbij X een van Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser of Met is)26. Onder de geanalyseerde orthologen, werd NAC geïdentificeerd als zeer geconserveerd. Van zijn tegenhanger was de lengte van NAC (61-84) in de NMBS gereduceerd door de afwezigheid van een GXXX-motief en een KXKEGV-repeat. Terwijl in SNCG geen GXXX sub-motief werd geïdentificeerd. Van de drie vermeende paralogen was het GAV motief alleen expliciet aanwezig in SNCA (Fig. 2a). NAC wordt beschouwd als uiterst noodzakelijk voor SNCA-aggregatie en -fibrillatie26. Terwijl GAV wordt verondersteld als handtekening motief verantwoordelijk voor dit aggregatie proces25.

C-terminale zure domein herbergt koper bindend motief met DPDNEA(119-124) consensus sequentie43 die werd gevonden zeer geconserveerd onder de geanalyseerde orthologs van SNCA. Meervoudige sequentie alignment heeft geen behoud van dit motief onder SNCB en SNCG paralogs geïdentificeerd (Fig. 2a). Dit domein van SNCA is verrijkt met zure residuen en prolines. Drie sterk geconserveerde tyrosineresiduen, die beschouwd worden als een subfamiliesignatuur van SNCA en SNCB, bevinden zich ook in dit gebied26. Er wordt ook voorgesteld dat koperbinding de aggregatie van SNCA versnelt en de pathologische effecten ervan beïnvloedt44.

Lineage-specifieke substituties die tijdens de evolutie onder de geanalyseerde sarcopterygiën zijn opgetreden, zijn in kaart gebracht op menselijk SNCA met behulp van de voorouderreconstructietechniek. Negen substituties hebben zich voorgedaan aan de wortel van de voorouder van de zoogdieren. Terwijl twee substituties voorkwamen aan de wortel van de lijn van niet-primate placenta zoogdieren en één specifiek voorkwam bij de catarrhini’s (hominoïden en oude wereld apen) lijn (Fig. 2a) (Tabel 1). Van deze 12 geïdentificeerde substituties bleken er vijf (S64T, G68E, N87S, L94F, V95G) beperkt te zijn tot NAC, terwijl zes (A101G, F107A, M112I, M113L, P129S, E132G) zich ophielden in het C-terminale zure domein. Slechts 1 substitutie (T53A) werd geïdentificeerd in het N-terminale gebied (Fig. 2a). De fysisch-chemische eigenschappen van deze aminozuursubstituties werden vervolgens geanalyseerd, waaruit bleek dat ongeveer alle substituties die tijdens de evolutie zijn opgetreden van het radicale type waren, met uitzondering van T53A en A101G (tabel 1). Deze analyse toont aan dat het N-terminale lipide bindende domein sterk geconserveerd is onder de geanalyseerde orthologen en paralogen. Deze bevinding werd verder versterkt door de fysieke positionering van vijf eerder gerapporteerde humane specifieke mutaties geassocieerd met de ziekte van Parkinson, namelijk A30P3, E46K4, H50Q5, G51D6 en A53T7 op humaan SNCA. De resultaten toonden aan dat deze mutaties zich uitdrukkelijk beperkten tot het N-terminale domein, hetgeen op zijn beurt het belang impliceert van een hoge mate van conservering van deze regio, niet alleen vanuit functioneel oogpunt, maar ook voor de pathogenese van FPD (Fig. 2a). Met behulp van SLAC-vensteranalyse blijkt dat het N-terminale domein uit 15 negatief begrensde sites bestaat, wat er verder op wijst dat sterke selectieve beperkingen een rol spelen bij het behoud van deze regio tijdens de evolutie van de sarcopterygiën (Fig. 2b, zie aanvullende tabel S4).

Tabel 1 Na de divergentie van de sarcopterygische voorouder traden er negen vaste aminozuurveranderingen op aan de basis van de zoogdieren, waarvan er twee specifiek optraden in de niet-primate placenta zoogdierlijn, terwijl er één specifiek optrad in de primaatlijn (catarrhini).

Structurele evolutie van SNCA

Om verder na te gaan hoe zuiverende selectie zijn rol speelt bij het definiëren van de ruimtelijke beperkingen van voorouderlijke SNCA-eiwitten op structureel niveau, werd een vergelijkende structuurstudie uitgevoerd. NMR structuur van menselijk SNCA (1XQ8) werd als referentie genomen en vergeleken met gemodelleerde voorouderlijke eiwitten (Fig. 3). Structurele afwijkingen werden onderzocht met behulp van RMSD waarden (Fig. 3, zie supplementaire Fig. S2A,B). De resultaten onthulden zeer opmerkelijke aspecten die niet werden verwacht door vergelijkende analyse op sequentie-niveau. Vergelijkende structuuranalyse suggereert dat de structuur van SNCA een reeks overgangen heeft doorgemaakt om zijn gunstige conformatie te verkrijgen. Gesuperponeerde modellen van voorouderlijke SNCA-eiwitten en 1XQ8 onthulden gemeenschappelijke afwijkende regio’s die 32 tot 58 van het N-terminale lipide bindende domein van SNCA omvatten (tabel 2). Deze structurele afwijkingen werden ook gemeten met behulp van de kwantificering van de torsies in de ruggengraat, waaruit bleek dat het gebied 32-58 van SNCA voortdurend evolueert op structureel niveau, ondanks de hoge mate van behoud van de sequentie (tabel 2). Ook werd vastgesteld dat destabiliserende substituties tijdens de evolutie van SNCA zijn aangebracht met het doel de intrinsieke ongeordende conformatie te bereiken, hetgeen impliceert dat er functionele beperkingen aan ten grondslag liggen (Tabel 1). Het lijkt dus logisch om op grond van deze structuurvergelijking te speculeren dat tijdens de evolutie van SNCA deze substituties zijn aangebracht die niet alleen destabilisatie van SNCA hebben veroorzaakt, maar ook drastische structurele verschuivingen in de geïdentificeerde regio hebben teweeggebracht. Deze kritische regio (32-58) werd ook cruciaal geacht voor de juiste conformatie van niet alleen het N-terminale A2 alpha helix domein maar ook voor het NAC domein. Met behulp van elektronen- en röntgendiffractietechnieken is gerapporteerd dat normaal SNCA zich via het N-terminale gebied assembleert, hetgeen opnieuw de belangrijke rol van dit domein onderstreept45.

Figuur 3: Structurele evolutie van SNCA-eiwitten sinds de afsplitsing van de laatste gemeenschappelijke sarcopterygische voorouder.
figuur3

Significante structurele divergentie ten opzichte van menselijk SNCA werd waargenomen na de afsplitsing van de gemeenschappelijke sarcopterygische voorouder. Negen specifieke substituties zijn opgetreden aan de basis van de zoogdierlijn, die na de afsplitsing van de sarcopterygische voorouder behouden is gebleven bij primaten en de niet-primate placentale zoogdieren. Twee substituties zijn specifiek opgetreden aan de wortel van de niet-primate placenta zoogdieren lijn en een catarrhini specifieke substitutie is opgetreden na de afsplitsing van gemeenschappelijke zoogdieren voorouder. Afwijkende residuen in termen van backbone torsiehoeken (Φ °,Ψ °) van de menselijke SNCA (1XQ8) zijn weergegeven in rode kleur. Structurele afwijkingen werden onderzocht door RMSD waarden.

Tabel 2 Analyse van de lijnspecifieke structurele afwijkingen in de backbone torsiehoeken van de voorouderlijke SNCA-eiwitten door de opname van de clade-specifieke substituties.

Intrigerend is dat alle mensenspecifieke mutaties die betrokken zijn bij de pathogenese van FPD zich in deze cruciale regio bevinden, wat betekent dat elke verandering in deze regio schadelijk zal zijn vanwege de sterke selectie en de functionele beperkingen die eraan worden opgelegd. Gesuperponeerde mutantmodellen met 1XQ8 identificeerden grote verschuivingen naar het lipide bindende domein in A30P en H50Q, terwijl grote veranderingen werden waargenomen in lipide bindende en NAC domeinen in het geval van E46K en A53T. Alleen G51D vertoonde alleen een veranderde NAC-regio (zie supplementair fig. S4A,B). Alle vijf mutantmodellen hadden een sterk afwijkende regio van 32 tot 58 gemeen. Uit deze vergelijkende structuuranalyse kan worden afgeleid dat de primaire effecten en de rol van deze vijf SNCA mutaties in de pathogenese van FPD verschillend kunnen zijn vanwege hun verschillende structurele morfologieën.

Om de structurele verschillen tussen de humane paralogen van SNCA verder te onderzoeken, werd ook een vergelijkende structuuranalyse uitgevoerd. Aangezien de NMR structuren van menselijke SNCB en SNCG tot nu toe niet zijn gerapporteerd, werden hun structuren gemodelleerd door NMR structuur van menselijke SNCA (1XQ8) als referentie te nemen en de structurele afwijkingen werden beoordeeld (zie Supplementary Fig.S5A,B). Het blijkt dat SNCB- en SNCG-structuren sterk afwijken van SNCA in het N-terminale en NAC-domein (Fig. 4).

Figuur 4: Structurele divergentie tussen menselijke paralogen van SNCA.
figure4

Grote structurele verschuivingen werden waargenomen in de N-terminale lipidebindende en NAC-domeinen als gevolg van paralogische specifieke substituties. Na de eerste duplicatie onderging het voorouderlijke SNCA/B 19 veranderingen. Na de 2e duplicatie ondergingen SNCB en SNCA respectievelijk 6 en 12 substituties. Afwijkende residuen in vergelijking met menselijk SNCA (1XQ8) zijn met kleur gecodeerd. Structurele afwijkingen werden beoordeeld aan de hand van RMSD-waarden.

Analyse van de interacties tussen SNCA en het spiraalvormig domein van SNCAIP

Om het belang van deze kritische regio verder te onderzoeken, werd de functionele betekenis ervan vervolgens ontcijferd met behulp van interactiestudie. Voor dit doel werd synphilin-1 (SNCAIP) in aanmerking genomen, aangezien de domein annotatie van synphilin-1 onthulde dat het een 919 a.a (3745 bp) eiwit is dat wordt gecodeerd door 10 exonen17, dat zes ankyrineachtige herhalingen en één centraal spiraalvormig domein (510-557) omvat (Fig. 5a). Door biochemische en NMR technieken is bevestigd dat SNCAIP interageert met de N-terminale regio van SNCA38. Hoewel de normale cellulaire functie van deze interagerende partners nog onbekend is, is gerapporteerd dat SNCAIP ontwikkelingsgewijs gelokaliseerd is in synaptische terminals en dat zijn associatie met synaptische vesikels gemoduleerd wordt door SNCA. In deze context wordt SNCAIP beschouwd als synaptische partner van SNCA, wat impliceert dat deze interactie de synaptische functies van SNCA medieert, mogelijk door SNCA aan het vesikelmembraan te verankeren46.

Figuur 5
figuur 5

Schematische weergave (a) Domeinorganisatie van SNCA- en SNCAIP-eiwitten. Vergelijkende organisatie van de belangrijkste functionele domeinen en motieven van menselijk SNCA en het spiraalvormig domein van menselijk SNCAIP. Eiwitlengtes zijn ongeveer op schaal getekend. Domeinen en motieven zijn met kleur gecodeerd. (b) Analyse van de gedokte complexen en waterstofbrug interacties. Toon interacties tussen de sarcopterygian voorouder SNCA en coiled-coil domein van SNCAIP (2KES). (c) Weergave van interacties tussen het menselijke SNCA (1XQ8) en het coiled-coil domein van het menselijke SNCAIP. Interactie residuen liggend in het gebied van belang (32-58) zijn kleurgecodeerd. (d) Toont de interactie tussen de gemodelleerde mutant van SNCA-A30P en het coiled-coil domein van humaan SNCAIP. De stippellijnen geven de waterstofbruggen weer.

Om de rol van de kritische regio in de interactie te onderzoeken, is een docking-analyse uitgevoerd. Er zijn interacties geïdentificeerd tussen de voorouderlijke SNCA-eiwitten van sarcopterygiën, de specifieke SNCA-eiwitten van zoogdieren en de specifieke SNCA-eiwitten van niet-placentale zoogdieren, waaruit bleek dat de interactie tussen SNCA en het spiraalvormig domein van SNCAIP in de loop der tijd is geëvolueerd, d.w.z. dat er tijdens de evolutionaire geschiedenis van sarcopterygiën lijnspecifieke interacties zijn ontstaan (Fig. 5b). Interactie-analyse tussen mensenspecifiek SNCA en het spoel-domein van SNCAIP toonde aan dat aan de basis van catarrhines, enkele lijnspecifieke interacties zijn geëvolueerd, namelijk Lys32, Tyr39, en Lys45 (zie aanvullende Fig. S6, zie aanvullende tabel S5). Interessant is dat deze menselijke (catarrhines) specifieke interacties zich bevinden in de geïdentificeerde kritieke regio, hetgeen onze hypothese van het structurele en functionele belang van deze regio en haar vitale rol in de pathogenese van FPD versterkt (Fig. 5c).

Interactie analyse tussen mutant modellen van humaan specifiek SNCA met SNCAIP onthulde veranderde interactiepatronen, terwijl sommige van de wild type interacties ook werden behouden, wat betekent dat SNCA en coiled-coil domein van SNCAIP niet alleen interageren in normale individuen, maar ook in de FPD patiënten, maar het patroon van interacties werd veranderd gevonden. Gedokte complexen van A30P-SNCAIP en E46K-SNCAIP lieten zien dat de interacties zich volledig naar het NAC-domein verplaatsten, terwijl de complexen van H50Q-SNCAIP en G51D-SNCAIP veranderde interacties lieten zien waarbij de N-terminale en NAC-domeinen betrokken waren. Alleen de interacties in A53T-SNCAIP bleven volledig beperkt tot het N-terminale domein, maar het patroon bleek veranderd. Aangenomen kan worden dat de interacties veranderden als gevolg van een verschillend interactiepatroon van SNCA en SNCAIP, waardoor hun bindingsaffiniteit werd beïnvloed, die op zijn beurt weer van invloed was op de aggregatie van SNCA (Fig. 5d, zie aanvullende Fig.S7, zie aanvullende tabel S6).

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.