Fylogenetická analýza
Evoluční vztah mezi SNCA a jeho domnělými paralogy byl odhadnut metodami NJ a ML (obr. 1, viz Supplementary Fig. S1). Fylogenetická analýza rodiny synukleinů odhalila, že k diverzifikaci této rodiny přispěly dvě duplikační události. První duplikační událost se odehrála u kořene obratlovců, před rozštěpením tetrapodů a teleostů, z čehož se usuzuje na paralog SNCG a předka SNCA/SNCB. Zatímco druhá duplikace proběhla u kořene linie sarkoptýrů po speciaci teleostů (SNCA/B) a vedla ke vzniku paralogů SNCA a SNCB. Stojí také za povšimnutí, že délky větví u proteinů SNCG jsou delší než u ostatních dvou paralogů, což naznačuje, že se tento paralog mohl ve srovnání se SNCA a SNCB vyvíjet rychle. Při vyhledávání obousměrné podobnosti na základě Blast se nepodařilo identifikovat žádný ortolog této rodiny mezi bezobratlými, což posiluje předpoklad specifického původu této rodiny pro obratlovce (obr. 1, viz doplňkový obr. S1).
Srovnání evoluční rychlosti genu SNCA u sarkoptýrů
Aby bylo možné odhadnout rozdíly v evoluční rychlosti genu SNCA u různých kladů sarkoptýrů, byly ortology genu SNCA ze zástupců hominoidů (člověk, šimpanz, gorila, orangutan), nehominoidů (makak, marmoška, opice veverka, křovinář), placentálních savců, kteří nejsou primáty (myš, pes, kráva, slon), a tetrapodů, kteří nejsou savci (kuře, želva, žába, coelacanth). Pro každou skupinu byly odhadnuty míry nesynonymních (Ka/dN) a synonymních substitucí (Ks/dS). A poté byl použit z-test pro kontrolu selekčního omezení u výše uvedených skupin.
Rozdíl Ka-Ks (dN-dS) pro hominoidy byl zjištěn jako -2,241 (P = 0,014), nehominoidy -4,716 (P = 0), neprimátí placentální savci -6,1777 (P = 0) a nesamčí tetrapody -7,085 (P = 0) (viz doplňková tabulka S1). Obecně platí, že hodnota Ka nižší než Ks (Ka < Ks) naznačuje negativní selekci, tj. netlumené substituce byly vyčištěny přírodním výběrem, zatímco opačný scénář (Ka > Ks) znamená pozitivní selekci, tj. v průběhu evoluce se nahromadily výhodné mutace. Důkaz pozitivní nebo negativní selekce však vyžaduje, aby se hodnoty od sebe výrazně lišily41,42. Výsledky odvozené pomocí z-testu (Ka-Ks < 0, p < 0,05) naznačují, že SNCA se v průběhu evoluce odchýlila od neutrality, což ukazuje na znak negativního selekčního omezení v rámci sarkoptýří linie (viz doplňková tabulka S1).
Analýza evoluční rychlosti byla provedena také pro domnělé paralogní kopie SNCA, tj. pro SNCB a SNCG. Rozdíl Ka-Ks (dN-dS) pro SNCB byl identifikován jako -1,661(P = 0,05) u hominoidů, -4,708(P = 0) u nehominoidních primátů, -5,212(P = 0) u placentálních savců, kteří nejsou primáty, a -2,992(P = 0,002) u tetrapodů, kteří nejsou savci (viz doplňková tabulka S2). Rozdíl Ka-Ks (dN-dS) pro SNCG byl zjištěn jako -1,658(P = 0,05) pro hominoidy, -4,064(P = 0) pro nehominoidní primáty, -5.485(P = 0) pro placentální savce, kteří nejsou primáti, -6,306(P = 0) pro tetrapodní neprimáty a -6,341(P = 0) pro ryby (fugu, tetraodon, stickleback, medaka) (viz doplňková tabulka S3). Tyto údaje upřesňují, že nejen SNCA, ale i další dva členové rodiny synukleinů se mezi analyzovanými sarkoptýry zachovali pod silným purifikačním selekčním tlakem.
Doménová organizace genu SNCA
S cílem získat vhled do srovnávací doménové organizace byla provedena kompletní doménová anotace genu SNCA zahrnující ortology reprezentující sarkoptýry (člověk, myš, pes, kuře, coelacanth) a také paralogní kopie u člověka (SNCB a SNCG). Tato anotace odhalila charakteristickou architekturu genu SNCA, která se skládá z N-koncové domény alfa šroubovice vázající lipidy A2 (1-60), domény neamyloidní složky β (NAC) (61-95) a C-koncové kyselé domény (96-140) (obr. 1). 2a).
N-terminální lipidová vazebná doména se skládá z 5 nedokonalých repetic KXKEGV26 a tyto repetice jsou identifikovány jako vysoce konzervované mezi analyzovanými ortology a paralogy lidské SNCA z hlediska počtu a polohy (obr. 2a). Předpokládá se, že tato oblast tvoří amfipatické α-šroubovice a že se podílí na interakci s fosfolipidy26.
Doména NAC tvoří amyloidogenní jádro SNCA26. NAC se skládá z motivu GAV s konsenzuální sekvencí VGGAVVTGV(66-74) a tří submotivů GXXX (kde X je některý z Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser nebo Met)26 . Mezi analyzovanými ortology byl NAC identifikován jako vysoce konzervovaný. Zatímco mezi jeho protějškovými kopiemi v SNCB byla délka NAC (61-84) zkrácena v důsledku absence jednoho motivu GXXX a opakování KXKEGV. Zatímco u SNCG nebyl identifikován žádný submotiv GXXX. Ze tří domnělých paralogů byl motiv GAV explicitně přítomen pouze v SNCA (obr. 2a). NAC je považován za mimořádně nezbytný pro agregaci a fibrilaci SNCA26. Zatímco GAV se předpokládá jako signální motiv zodpovědný za tento agregační proces25.
C-koncová kyselá doména ukrývá vazebný motiv mědi obsahující konsenzuální sekvenci DPDNEA(119-124)43 , která byla mezi analyzovanými ortology SNCA shledána vysoce konzervovanou. Vícenásobným zarovnáním sekvencí se nepodařilo identifikovat zachování tohoto motivu mezi paralogy SNCB a SNCG (obr. 2a). Tato doména SNCA je obohacena o kyselé zbytky a proliny. V této oblasti se také nacházejí tři vysoce konzervované tyrozinové zbytky, které jsou považovány za podpis podrodiny SNCA a SNCB26. Předpokládá se také, že vazba mědi urychluje agregaci SNCA a ovlivňuje její patologické účinky44.
Na lidském SNCA byly pomocí techniky rekonstrukce předků zmapovány liniově specifické substituce, k nimž došlo během evoluce mezi analyzovanými sarkofágními živočichy. Ta klasifikovala, že u kořene savčího předka došlo k devíti substitucím. Zatímco dvě substituce se vyskytly u kořene linie placentálních savců, kteří nejsou primáty, a jedna specificky u linie katarrhini (hominoidi a opice starého světa) (obr. 2a) (tab. 1). Z těchto 12 identifikovaných záměn bylo pět (S64T, G68E, N87S, L94F, V95G) omezeno na NAC, zatímco šest (A101G, F107A, M112I, M113L, P129S, E132G) se nacházelo v C-koncové kyselé doméně. Pouze jedna substituce (T53A) byla identifikována v N-koncové oblasti (obr. 2a). Poté byly analyzovány fyzikálně-chemické vlastnosti těchto aminokyselinových záměn, které ukázaly, že přibližně všechny záměny, k nimž došlo během evoluce, byly radikálového typu s výjimkou T53A a A101G (tab. 1). Tato analýza poukazuje na N-terminální lipidovou vazebnou doménu jako vysoce konzervovanou mezi analyzovanými ortology a paralogy. Toto zjištění bylo dále posíleno fyzickým umístěním dříve popsaných pěti specifických lidských mutací spojených s familiární Parkinsonovou chorobou, tj. mutací A30P3, E46K4, H50Q5, G51D6 a A53T7 na lidském SNCA. Výsledky odhalily, že tyto mutace jsou explicitně omezeny na N-koncovou doménu, z čehož vyplývá význam vysoké konzervace této oblasti nejen z funkčního hlediska, ale také pro patogenezi FPD (obr. 2a). Pomocí SLAC-window analýzy se ukázalo, že N-terminální doména se skládá z 15 negativně omezených míst, což dále potvrzuje, že silná selekční omezení působí svou roli při zachování této oblasti během evoluce sarkoptýrů (obr. 2b, viz doplňková tabulka S4).
Strukturní evoluce SNCA
Pro další kontrolu toho, jak purifikační selekce plní svou roli při definování prostorových omezení předků proteinů SNCA na strukturní úrovni, byla provedena srovnávací strukturní studie. NMR struktura lidské SNCA (1XQ8) byla vzata jako referenční a porovnána s modelovanými proteiny předků (obr. 3). Strukturní odchylky byly zkoumány pomocí hodnot RMSD (obr. 3, viz doplňkový obr. S2A,B). Výsledky odhalily velmi pozoruhodné aspekty, které srovnávací analýza na úrovni sekvence nepředpokládala. Srovnávací strukturní analýza naznačuje, že struktura SNCA prošla řadou přechodů, aby získala svou preferovanou konformaci. Superponované modely ancestrálních proteinů SNCA a 1XQ8 odhalily společnou odchylnou oblast zahrnující 32 až 58 N-koncové lipidové vazebné domény SNCA (tab. 2). Tyto strukturní odchylky byly rovněž měřeny pomocí kvantifikace torzí páteře, což poukázalo na skutečnost, že oblast 32 až 58 SNCA se na strukturní úrovni neustále vyvíjí, a to i přes její vysokou sekvenční zachovalost (tab. 2). Bylo také zjištěno, že během evoluce SNCA byly začleněny destabilizující substituce s cílem dosáhnout její vnitřní neuspořádané konformace, což implikuje funkční omezení, která za ní stojí (tab. 1). Na základě tohoto přístupu strukturního srovnání se tedy zdá být logické spekulovat, že během evoluce SNCA byly začleněny ty substituce, které nejen způsobily destabilizaci SNCA, ale také přinesly drastický strukturní posun v identifikované oblasti. Tato kritická oblast (32-58) byla rovněž uznána za klíčovou pro správnou konformaci nejen N-koncové domény alfa šroubovice A2, ale i pro doménu NAC. Pomocí technik elektronové a rentgenové difrakce bylo zjištěno, že normální SNCA se skládá prostřednictvím své N-koncové oblasti, což opět zdůrazňuje významnou úlohu této domény45.
Zajímavé je, že všechny mutace specifické pro člověka, které se podílejí na patogenezi FPD, se nacházejí v této klíčové oblasti, což znamená, že jakákoli změna v této oblasti bude škodlivá z důvodu silné selekce a funkčních omezení, která jsou na ni kladena. Superponované mutantní modely s 1XQ8 identifikovaly hlavní posuny směrem k doméně vázající lipidy u A30P a H50Q, zatímco hlavní změna byla pozorována v doménách vázajících lipidy a NAC v případě E46K a A53T. Pouze u G51D byla změněna pouze oblast NAC (viz doplňkový obr. S4A,B). Všech pět mutantních modelů mělo společnou vysoce odchylnou oblast od 32 do 58. Na základě této srovnávací strukturní analýzy lze postulovat, že primární účinky a úloha těchto pěti mutací SNCA v patogenezi FPD se mohou lišit kvůli jejich rozdílné strukturní morfologii.
Dále byla za účelem zkoumání strukturních rozdílů mezi lidskými paralogy SNCA provedena také srovnávací strukturní analýza. Jelikož NMR struktury lidských SNCB a SNCG nebyly dosud uvedeny, byly jejich struktury modelovány na základě NMR struktury lidské SNCA (1XQ8) jako referenční a byly posouzeny strukturní odchylky (viz doplňkový obr. S5A,B). Ukazuje se, že struktury SNCB a SNCG se od SNCA silně odchylují na N-konci a v doméně NAC (obr. 4).
Analýza interakcí mezi SNCA a coiled-coil doménou SNCAIP
Pro další zkoumání významu této kritické oblasti byl pak její funkční význam rozluštěn pomocí interakční studie. Za tímto účelem byl vzat v úvahu synfilin-1 (SNCAIP), neboť doménová anotace synfilinu-1 odhalila, že se jedná o 919 a.a (3745 bp) protein kódovaný 10 exony17, zahrnující šest ankyrinu podobných repetic a jednu centrální coiled-coil doménu (510-557) (obr. 5a). Na základě biochemických a NMR technik bylo potvrzeno, že SNCAIP interaguje s N-koncovou oblastí SNCA38. Normální buněčná funkce těchto interagujících partnerů je sice stále neznámá, ale bylo zjištěno, že SNCAIP je vývojově lokalizován v synaptických terminálech a jeho asociace se synaptickými vezikuly je modulována SNCA. V této souvislosti je SNCAIP považován za synaptického partnera SNCA, což znamená, že tato interakce zprostředkovává synaptické funkce SNCA, pravděpodobně ukotvením SNCA k membráně vezikul46.
S cílem prozkoumat úlohu kritické oblasti v interakci byla provedena dokovací analýza. Byly identifikovány interakce mezi sarkoptýřími předky, specifickými savčími proteiny a specifickými proteiny SNCA placentálních savců, které nejsou primáty, což odhalilo, že interakce mezi SNCA a doménou vinuté spirály SNCAIP se vyvíjela s postupem času, tj. během evoluční historie sarkoptýrů se objevily interakce specifické pro jednotlivé linie (obr. 5b). Analýza interakcí mezi SNCA specifickou pro člověka a coiled-coil doménou SNCAIP odhalila, že u kořene katarrhinů se vyvinulo několik liniově specifických interakcí, tj. interakce Lys32, Tyr39 a Lys45 (viz doplňkový obr. S6, viz doplňková tabulka S5). Je zajímavé, že tyto interakce specifické pro člověka (katarrhiny) se nacházejí v identifikované kritické oblasti, což posiluje naši hypotézu o strukturálním a funkčním významu této oblasti a její zásadní roli v patogenezi FPD (obr. 5c).
Analýza interakcí mezi mutantními modely lidského specifického SNCA se SNCAIP odhalila změněné vzorce interakcí, zatímco některé interakce divokého typu byly také zachovány, což znamená, že SNCA a coiled-coil doména SNCAIP interagují nejen u normálních jedinců, ale také u pacientů s FPD, avšak vzorec interakcí byl zjištěn změněný. Dokované komplexy A30P-SNCAIP a E46K-SNCAIP odhalily, že interakce se zcela přesunuly do domény NAC, zatímco komplexy H50Q-SNCAIP a G51D-SNCAIP vykazovaly změněné interakce zahrnující N-terminální a NAC domény. Pouze interakce v A53T-SNCAIP byly zcela omezeny na N-terminální doménu, ale jejich vzorec byl shledán pozměněným. Lze předpokládat, že interakce se změnily v důsledku rozdílného interakčního vzorce SNCA a SNCAIP, což ovlivnilo jejich vazebné afinity, které následně ovlivňují agregaci SNCA (obr. 5d, viz doplňkový obr. S7, viz doplňková tabulka S6).
.