Phylogenetic analysis
Az SNCA és feltételezett paralógjai közötti evolúciós kapcsolatot NJ és ML módszerekkel becsültük (1. ábra, lásd az S1 kiegészítő ábrát). A synuclein család filogenetikai elemzése kimutatta, hogy két duplikációs esemény járult hozzá e család diverzifikációjához. Az első duplikációs esemény a gerincesek gyökerénél, a tetrapoda-teleost szétválást megelőzően következett be, és az SNCG paralóg és az SNCA/SNCB őse volt. Míg a második duplikációs esemény a szarkopterygiumok gyökerénél, a teleosthalak (SNCA/B) egyedfejlődése után következett be, és az SNCA és SNCB paralógokat eredményezett. Érdemes megjegyezni azt is, hogy az SNCG fehérjék ághossza hosszabb, mint a másik két paralógé, ami arra utal, hogy ez a paralóg az SNCA-hoz és az SNCB-hez képest gyorsan fejlődhetett. A Blast-alapú kétirányú hasonlósági keresések nem azonosították e család egyetlen ortológját sem a gerinctelenek között, ami megerősíti a feltételezést, hogy e család gerinces specifikus eredetű (ábra. 1, lásd az S1. kiegészítő ábrát).
Az SNCA gén evolúciós sebességének összehasonlítása a sarcopterygiák között
Az SNCA gén evolúciós sebességkülönbségének a sarcopterygiák különböző kládjai közötti becslése érdekében a hominoidák reprezentatív tagjainak (ember, csimpánz, gorilla, orangután), nem-hominoidák (makákó, mormota, mókusmajom, bokormajom), nem-pláza emlősök (egér, kutya, tehén, elefánt) és nem-emlős tetrapodák (csirke, teknősbéka, béka, bojtorján) képviselőitől kaptuk. A nem szinonim (Ka/dN) és szinonim szubsztitúciós rátákat (Ks/dS) minden csoportra vonatkozóan megbecsültük. Majd z-próbát alkalmaztunk a fent említett csoportok szelekciós kényszerének ellenőrzésére.
A Ka-Ks (dN-dS) különbség a hominoidák esetében -2,241 (P = 0,014), a nem-hominoidák esetében -4,716 (P = 0), a nem főemlős placenta emlősök esetében -6,1777 (P = 0) és a nem emlős tetrapodák esetében -7,085 (P = 0) volt (lásd az S1 kiegészítő táblázatot). Általánosságban elmondható, hogy a Ks-nél alacsonyabb Ka érték (Ka < Ks) negatív szelekcióra utal, azaz a nem csendes szubsztitúciókat a természetes szelekció eltüntette, míg a fordított forgatókönyv (Ka > Ks) pozitív szelekcióra utal, azaz az evolúció során előnyös mutációk halmozódtak fel. A pozitív vagy negatív szelekció bizonyításához azonban az szükséges, hogy az értékek jelentősen eltérjenek egymástól41,42. A z-próbával levezetett eredmények (Ka-Ks < 0, p < 0,05) arra utalnak, hogy az SNCA az evolúció során eltért a semlegességtől, ami a negatív szelekciós kényszer aláírását mutatja a sarcopterygian vonalban (lásd az S1 kiegészítő táblázatot).
Az evolúciós sebesség elemzését az SNCA feltételezett paralóg példányaira, azaz az SNCB-re és az SNCG-re is elvégeztük. A Ka-Ks (dN-dS) különbség az SNCB esetében a hominoidák esetében -1,661(P = 0,05), a nem hominoid főemlősök esetében -4,708(P = 0), a nem főemlős placenta emlősök esetében -5,212(P = 0) és a nem emlős tetrapodák esetében -2,992(P = 0,002) volt (lásd az S2. kiegészítő táblázatot). A Ka-Ks (dN-dS) különbség az SNCG esetében a hominoidák esetében -1,658(P = 0,05), a nem hominoid főemlősök esetében -4,064(P = 0), a nem hominoid főemlősök esetében -5.485(P = 0) a nem főemlős placenta emlősökre, -6,306(P = 0) a nem emlős tetrapodákra és -6,341(P = 0) a halakra (fugu, tetraodon, stickleback, medaka) (lásd az S3 kiegészítő táblázatot). Ezek az adatok azt mutatják, hogy nemcsak az SNCA, hanem a synuclein család másik két tagja is erős tisztító szelekciós nyomás alatt maradt meg az elemzett sarcopterygiák között.
A SNCA doménszerveződése
Az összehasonlító doménszerveződésbe való betekintés érdekében elvégeztük az SNCA gén teljes doménannotációját, amely magában foglalta a szarkopterygiákból reprezentatív ortológokat (ember, egér, kutya, csirke, coelacanth), valamint a humán paralóg példányokat (SNCB és SNCG). Ez az annotáció feltárta az SNCA gén jellegzetes felépítését, amely az N-terminális A2 lipidkötő alfa-hélix doménből (1-60), a nem amiloid β komponens (NAC) doménből (61-95) és a C-terminális savas doménből (96-140) áll (ábra). 2a).
Az N-terminális lipidkötő domén 5 KXKEGV tökéletlen ismétlődésből26 áll, és ezek az ismétlődések a humán SNCA elemzett ortológjai és paralógjai között számukat és pozíciójukat tekintve erősen konzerváltnak bizonyultak (2a. ábra). Ez a régió az előrejelzések szerint amfipatikus α-hélixeket képez, és úgy vélik, hogy részt vesz a foszfolipidekkel való kölcsönhatásban26.
A NAC domén alkotja az SNCA amiloidogén magját26. A NAC a VGGAVVTGV(66-74) konszenzus szekvenciával rendelkező GAV motívumból és három GXXX szubmotívumból áll (ahol X a Gly, Ala, Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser vagy Met bármelyike)26 . Az elemzett ortológok közül a NAC-ot magas konzerváltságúnak azonosították. Míg az ellenpárhuzamos példányai közül az SNCB-ben a NAC hossza (61-84) csökkent az egyik GXXX motívum és a KXKEGV ismétlés hiánya miatt. Míg az SNCG-ben nem azonosítottak GXXX almotívumot. A három feltételezett paralóg közül a GAV-motívum kifejezetten csak az SNCA-ban volt jelen (2a. ábra). A NAC-ot rendkívül szükségesnek tartják az SNCA aggregációjához és fibrillációjához26. Míg a GAV-t az aggregációs folyamatért felelős motívumnak tartják25.
A C-terminális savas domén DPDNEA(119-124) konszenzus szekvenciát43 tartalmazó rézkötő motívumot tartalmaz, amely az SNCA elemzett ortológjai között erősen konzerváltnak bizonyult. A többszörös szekvenciaillesztés nem azonosította ennek a motívumnak a konzerváltságát az SNCB és SNCG paralógok között (2a. ábra). Az SNCA e doménje savas maradékokban és prolinokban gazdag. Három erősen konzervált tirozin-maradvány, amelyek az SNCA és az SNCB alcsalád jellegzetességének tekinthetők, szintén ebben a régióban található26. Azt is javasolják, hogy a rézkötés felgyorsítja az SNCA aggregációját, és befolyásolja annak patológiai hatásait44.
Az elemzett szarkofágok között az evolúció során bekövetkezett vonalspecifikus szubsztitúciókat az emberi SNCA-n az ősök rekonstrukciós technikája segítségével térképezték fel. Besorolták, hogy kilenc szubsztitúció történt az emlősök ősének gyökerénél. Míg két szubsztitúció a nem főemlős placenta emlősök ősvonalának gyökerénél történt, egy pedig kifejezetten a catarrhini (hominoidák és óvilági majmok) ősvonalánál (2a. ábra) (1. táblázat). Az azonosított 12 szubsztitúcióból öt (S64T, G68E, N87S, L94F, V95G) a NAC felé korlátozódott, míg hat (A101G, F107A, M112I, M113L, P129S, E132G) a C-terminális savas doménben helyezkedett el. Csak 1 szubsztitúciót (T53A) azonosítottak az N-terminális régióban (2a. ábra). Ezután elemeztük ezen aminosavcserék fizikai-kémiai tulajdonságait, ami azt mutatta, hogy a T53A és A101G kivételével megközelítőleg minden, az evolúció során bekövetkezett szubsztitúció radikális típusú volt (1. táblázat). Ez az elemzés kiemeli, hogy az N-terminális lipidkötő domén erősen konzervált az elemzett ortológok és paralógok között. Ezt a megállapítást tovább erősítette a korábban bejelentett öt, a familiáris Parkinson-kórral összefüggésbe hozott humán specifikus mutáció, azaz az A30P3, E46K4, H50Q5, G51D6 és A53T7 fizikai elhelyezkedése az emberi SNCA-n. Az eredmények azt mutatták, hogy ezek a mutációk kifejezetten az N-terminális doménre korlátozódnak, ami viszont arra utal, hogy ez a régió nemcsak funkcionális szempontból, hanem az FPD patogenezise szempontjából is nagymértékben konzervált (2a. ábra). A SLAC-ablakelemzés segítségével úgy tűnik, hogy az N-terminális domén 15 negatívan korlátozott helyből áll, ami azt támasztja alá, hogy az erős szelekciós korlátok szerepet játszanak e régió megőrzésében a szarkopterygiák evolúciója során (2b. ábra, lásd az S4. kiegészítő táblázatot).
A SNCA szerkezeti evolúciója
Azért, hogy tovább vizsgáljuk, hogyan tölti be a tisztító szelekció a szerepét az ősi SNCA-fehérjék térbeli korlátozásának szerkezeti szintű meghatározásában, összehasonlító szerkezeti vizsgálatot végeztünk. A humán SNCA (1XQ8) NMR-szerkezetét vettük referenciának, és összehasonlítottuk a modellezett ősi fehérjékkel (3. ábra). A szerkezeti eltéréseket az RMSD-értékek segítségével vizsgáltuk (3. ábra, lásd S2A,B kiegészítő ábra). Az eredmények nagyon figyelemre méltó szempontokat tártak fel, amelyeket a szekvencia szintű összehasonlító elemzés nem várt. Az összehasonlító szerkezeti elemzés azt sugallja, hogy az SNCA szerkezete átmenetek sorozatán ment keresztül, hogy elnyerje kedvező konformációját. Az ősi SNCA-fehérjék és az 1XQ8 egymásra helyezett modelljei feltárták, hogy az SNCA N-terminális lipidkötő doménjének 32-58 részét magában foglaló közös eltéréses régiót (2. táblázat). Ezeket a szerkezeti eltéréseket a gerinctorziók számszerűsítésével is mértük, ami rávilágított arra a tényre, hogy az SNCA 32-58-as régiója a nagyfokú szekvencia-konzerváltság ellenére szerkezeti szinten folyamatosan fejlődik (2. táblázat). Azt is megállapították, hogy az SNCA evolúciója során destabilizáló szubsztitúciókat építettek be azzal a céllal, hogy elérjék a belső rendezetlen konformációt, ami a mögötte álló funkcionális kényszereket feltételezi (1. táblázat). Logikusnak tűnik tehát, hogy ebből a szerkezeti összehasonlító megközelítésből arra lehet következtetni, hogy az SNCA evolúciója során olyan szubsztitúciókat építettek be, amelyek nemcsak az SNCA destabilizációját okozták, hanem drasztikus szerkezeti változást is eredményeztek az azonosított régióban. Ezt a kritikus régiót (32-58) nemcsak az N-terminális A2 alfa-hélix domén, hanem a NAC domén megfelelő konformációja szempontjából is kulcsfontosságúnak ismerték fel. Elektron- és röntgendiffrakciós technikák segítségével arról számoltak be, hogy a normál SNCA az N-terminális régióján keresztül épül fel, ami ismét rávilágít e domén jelentős szerepére45.
Érdekes módon az FPD patogenezisében szerepet játszó összes humánspecifikus mutáció ebben a kritikus régióban található, ami azt jelenti, hogy bármilyen változás ebben a régióban káros lesz a rá nehezedő erős szelekciós és funkcionális korlátok miatt. Az 1XQ8-mal szuperponált mutáns modellek az A30P és a H50Q esetében jelentős eltolódásokat azonosítottak a lipidkötő domén felé, míg az E46K és az A53T esetében a lipidkötő és a NAC doménben észleltek jelentős változást. Egyedül a G51D mutatott csak megváltozott NAC-régiót (lásd a kiegészítő S4A,B ábrát). Mind az öt mutáns modellben közös volt a 32 és 58 közötti nagymértékben eltérő régió. Ebből az összehasonlító szerkezeti elemzésből feltételezhető, hogy az öt SNCA-mutáció elsődleges hatása és szerepe az FPD patogenezisében eltérő lehet a különböző szerkezeti morfológiák miatt.
Az SNCA humán paralógjai közötti szerkezeti különbségek további vizsgálatára összehasonlító szerkezeti elemzést is végeztünk. Mivel a humán SNCB és SNCG NMR-szerkezetét eddig nem közölték, szerkezetüket a humán SNCA (1XQ8) NMR-szerkezetét véve referenciának modelleztük, és értékeltük a szerkezeti eltéréseket (lásd a kiegészítő S5A,B ábrát). Úgy tűnik, hogy az SNCB és SNCG szerkezetek nagymértékben eltérnek az SNCA-tól az N-terminális és a NAC doménnél (4. ábra).
Az SNCA és az SNCAIP tekercses-tekercses doménje közötti kölcsönhatások elemzése
A kritikus régió jelentőségének további vizsgálata érdekében ezután interakcióvizsgálat segítségével megfejtettük funkcionális jelentőségét. Ehhez a synphilin-1 (SNCAIP) doménjét vettük figyelembe, mivel a synphilin-1 domén annotációjából kiderült, hogy ez egy 919 a.a (3745 bp) fehérje, amelyet 10 exon17 kódol, hat ankyrinszerű ismétlődést és egy központi coiled-coil domént (510-557) foglal magában (5a. ábra). Biokémiai és NMR technikákkal megerősítették, hogy az SNCAIP kölcsönhatásba lép az SNCA38 N-terminális régiójával. Bár ezeknek a kölcsönhatási partnereknek a normális sejtfunkciója még ismeretlen, de arról számoltak be, hogy az SNCAIP fejlődési szempontból a szinaptikus terminálokhoz lokalizálódik, és a szinaptikus vezikulákkal való társulását az SNCA modulálja. Ebben az összefüggésben az SNCAIP-et az SNCA szinaptikus partnerének tekintik, ami arra utal, hogy ez a kölcsönhatás közvetíti az SNCA szinaptikus funkcióit, valószínűleg azáltal, hogy lehorgonyozza az SNCA-t a vezikulamembránhoz46.
A kritikus régió kölcsönhatásban betöltött szerepének feltárása érdekében dokkoló analízist végeztünk. Interakciókat azonosítottunk a szarkofág ős, emlős specifikus és nem főemlős placenta emlős specifikus SNCA fehérjék között, ami azt mutatta, hogy az SNCA és az SNCAIP tekercses-tekercses doménje közötti kölcsönhatás az idő előrehaladtával fejlődött, azaz a szarkofág evolúciós története során vonal specifikus kölcsönhatások alakultak ki (5b. ábra). A humánspecifikus SNCA és az SNCAIP tekercses-tekercses doménje közötti kölcsönhatáselemzés kimutatta, hogy a katarzisok gyökerénél néhány vonalspecifikus kölcsönhatás alakult ki, azaz a Lys32, Tyr39 és Lys45 (lásd a Kiegészítő S6. ábrát, lásd a Kiegészítő S5. táblázatot). Érdekes módon ezek a humán (catarrhines) specifikus kölcsönhatások az azonosított kritikus régióban találhatók, ami megerősíti hipotézisünket e régió strukturális és funkcionális jelentőségéről és az FPD patogenezisében betöltött létfontosságú szerepéről (5c. ábra).
A humán specifikus SNCA és az SNCAIP mutáns modelljei közötti interakcióelemzés megváltozott kölcsönhatási mintázatokat mutatott, míg a vad típusú kölcsönhatások egy része is megmaradt, ami azt jelenti, hogy az SNCA és az SNCAIP tekercses-tekercses doménje nem csak a normál egyedekben, hanem az FPD-s betegekben is kölcsönhat, azonban a kölcsönhatások mintázata megváltozottnak bizonyult. Az A30P-SNCAIP és az E46K-SNCAIP dokkolt komplexei azt mutatták, hogy a kölcsönhatások teljes egészében a NAC-domén felé tolódtak el, míg a H50Q-SNCAIP és a G51D-SNCAIP komplexek az N-terminális és a NAC-domén bevonásával megváltozott kölcsönhatásokat mutattak. Csak az A53T-SNCAIP-ben lévő kölcsönhatások korlátozódtak teljes egészében az N-terminális doménre, de a mintázat megváltozott. Feltételezhető, hogy a kölcsönhatások az SNCA és az SNCAIP eltérő kölcsönhatási mintázata miatt változtak meg, így befolyásolva kötési affinitásukat, ami viszont befolyásolja az SNCA aggregációt (5d. ábra, lásd az S7. kiegészítő ábrát, lásd az S6. kiegészítő táblázatot).