Analiza filogenetyczna
Powiązania ewolucyjne pomiędzy SNCA i jego paralogami oceniono metodami NJ i ML (ryc. 1, patrz Supplementary Fig. S1). Analiza filogenetyczna rodziny synuklein wykazała, że dwa zdarzenia duplikacyjne przyczyniły się do zróżnicowania tej rodziny. Pierwsza duplikacja nastąpiła u kręgowców, przed rozłamem tetrapoda-teleosta, a jej wynikiem jest paralog SNCG i przodek SNCA/SNCB. Natomiast druga duplikacja nastąpiła u nasady linii sarkopterygii, po specjacji ryb teleostów (SNCA/B), dając paralogi SNCA i SNCB. Warto również zauważyć, że długości gałęzi dla białek SNCG są dłuższe niż dla pozostałych dwóch paralogów, co sugeruje, że ten paralog mógł szybko ewoluować w porównaniu z SNCA i SNCB. Poszukiwania dwukierunkowego podobieństwa oparte na Blast nie zidentyfikowały żadnego ortologa tej rodziny wśród bezkręgowców, co wzmacnia przypuszczenie o specyficznym dla kręgowców pochodzeniu tej rodziny (Fig. 1, patrz Supplementary Fig. S1).
Porównanie tempa ewolucji genu SNCA wśród sarcopterygian
W celu oszacowania różnic tempa ewolucji genu SNCA wśród różnych kladów sarcopterygian, ortologi SNCA od reprezentatywnych członków hominoidów (człowiek, szympans, goryl, orangutan), niehominoidów (makak, marmozeta, małpa wiewiórcza, buszbaby), ssaków łożyskowych (mysz, pies, krowa, słoń) oraz czworonogów nie będących ssakami (kurczak, żółw, żaba, koelakant). Dla każdej grupy oszacowano współczynniki substytucji niesynonimicznej (Ka/dN) i synonimicznej (Ks/dS). A następnie z-test został zastosowany w celu sprawdzenia ograniczenia selekcji na wyżej wymienionych grup.
The Ka-Ks (dN-dS) różnica dla hominoidów znaleziono jako -2.241 (P = 0.014), non-hominoidy był -4.716 (P = 0), ssaki łożyskowe nie naczelne był -6.1777 (P = 0) i non-mammalian tetrapoda był -7.085 (P = 0) (patrz Tabela uzupełniająca S1). Ogólnie rzecz biorąc, wartość Ka niższa niż Ks (Ka < Ks) sugeruje negatywną selekcję, tj. nieme substytucje zostały usunięte przez dobór naturalny, podczas gdy odwrotny scenariusz (Ka > Ks) sugeruje pozytywną selekcję, tj. korzystne mutacje nagromadziły się w trakcie ewolucji. Dowód na pozytywną lub negatywną selekcję wymaga jednak, aby wartości te były znacząco różne od siebie41,42. Wyniki wydedukowane przez z-test (Ka-Ks < 0, p < 0.05) sugerują, że SNCA odchylił się od neutralności podczas ewolucji, pokazując sygnaturę negatywnego ograniczenia selekcyjnego w obrębie linii sarcopterygian (patrz Tabela Uzupełniająca S1).
Analiza tempa ewolucji została również przeprowadzona dla przypuszczalnych paralogicznych kopii SNCA, tj. SNCB i SNCG. Różnica Ka-Ks (dN-dS) dla SNCB została określona jako -1,661(P = 0,05) dla hominoidów, -4,708(P = 0) dla naczelnych niehominoidalnych, -5,212(P = 0) dla ssaków łożyskowych niebędących naczelnymi i -2,992(P = 0,002) dla czworonogów niebędących ssakami (patrz Tabela S2 Suplementów). Różnica Ka-Ks (dN-dS) dla SNCG została zidentyfikowana jako -1,658(P = 0,05) dla hominoidów, -4,064(P = 0) dla naczelnych niehominoidalnych, -5.485(P = 0) dla ssaków łożyskowych nie będących naczelnymi, -6.306(P = 0) dla czworonogów nie będących ssakami i -6.341(P = 0) dla ryb (fugu, tetraodon, ciernik, medaka) (patrz Tabela Uzupełniająca S3). Dane te wskazują, że nie tylko SNCA, ale także dwaj inni członkowie rodziny synuklein zostali zachowani pod silną presją selekcji oczyszczającej wśród analizowanych sarkopterygianów.
Organizacja domenowa SNCA
W celu uzyskania wglądu w porównawczą organizację domenową, przeprowadzono pełną anotację domenową genu SNCA obejmującą ortologów reprezentatywnych dla sarkopterygian (człowiek, mysz, pies, kurczak, koelakant), jak również kopie paralogiczne u człowieka (SNCB i SNCG). Anotacja ta ujawniła charakterystyczną architekturę genu SNCA, która składa się z N-końcowej domeny A2 helisy alfa wiążącej lipidy (1-60), domeny nieamyloidowego składnika β (NAC) (61-95) oraz C-końcowej domeny kwasowej (96-140) (ryc. 2a).
N-końcowa domena wiążąca lipidy składa się z 5 niedoskonałych powtórzeń KXKEGV26, a powtórzenia te są identyfikowane jako wysoce konserwowane wśród analizowanych ortologów i paralogów ludzkiego SNCA pod względem liczby i pozycji (Rys. 2a). Przewiduje się, że region ten tworzy amfipatyczne α-helisy i uważa się, że jest zaangażowany w interakcje z fosfolipidami26.
Domena NAC tworzy amyloidogenny rdzeń SNCA26. NAC składa się z motywu GAV z sekwencją konsensusową VGGAVVTGV(66-74) i trzech podmotywów GXXX (gdzie X jest dowolnym z Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser lub Met)26. Wśród analizowanych ortologów, NAC został zidentyfikowany jako wysoce konserwatywny. Natomiast w SNCB, wśród jego przeciwnych paralogicznych kopii, długość NAC (61-84) była zredukowana z powodu braku jednego motywu GXXX oraz powtórzenia KXKEGV. Natomiast w SNCG nie zidentyfikowano żadnego podmotywu GXXX. Spośród trzech przypuszczalnych paralogów, motyw GAV był wyraźnie obecny tylko w SNCA (Rys. 2a). NAC jest uważany za niezwykle potrzebny do agregacji i fibrylacji SNCA26. Natomiast motyw GAV jest uważany za charakterystyczny motyw odpowiedzialny za ten proces agregacji25.
C-końcowa kwaśna domena zawiera motyw wiążący miedź, zawierający sekwencję konsensusową DPDNEA(119-124)43 , która okazała się wysoce konserwowana wśród analizowanych ortologów SNCA. Wielokrotne wyrównanie sekwencji nie wykazało zachowania tego motywu wśród paralogów SNCB i SNCG (Rys. 2a). Ta domena SNCA jest wzbogacona w reszty kwasowe i proliny. W tym regionie znajdują się również trzy wysoce konserwowane reszty tyrozynowe, które są uważane za sygnaturę podrodziny SNCA i SNCB26. Proponuje się również, że wiązanie miedzi przyspiesza agregację SNCA i wpływa na jego patologiczne działanie44.
Specyficzne dla linii substytucje, które wystąpiły podczas ewolucji wśród analizowanych sarkopterygianów, zostały zmapowane na ludzkim SNCA za pomocą techniki rekonstrukcji przodków. Sklasyfikowano, że dziewięć substytucji wystąpiło u korzenia przodka ssaków. Podczas gdy dwie substytucje wystąpiły u korzeni linii ssaków łożyskowych nie będących naczelnymi, a jedna wystąpiła u linii catarrhini (hominoidy i małpy starego świata) (ryc. 2a) (tab. 1). Spośród tych 12 zidentyfikowanych substytucji, pięć (S64T, G68E, N87S, L94F, V95G) zostało zidentyfikowanych jako ograniczone do NAC, podczas gdy sześć (A101G, F107A, M112I, M113L, P129S, E132G) było zlokalizowanych w C-końcowej domenie kwasowej. Tylko 1 substytucja (T53A) została zidentyfikowana w regionie N-końcowym (Rys. 2a). Następnie przeanalizowano właściwości fizykochemiczne tych substytucji aminokwasowych, co wykazało, że w przybliżeniu wszystkie substytucje, które wystąpiły podczas ewolucji, były typu rodnikowego, z wyjątkiem T53A i A101G (Tabela 1). Analiza ta wykazała, że N-końcowa domena wiążąca lipidy jest wysoce konserwatywna wśród analizowanych ortologów i paralogów. A30P3, E46K4, H50Q5, G51D6 i A53T7 na ludzkiej SNCA. Wyniki ujawniły, że mutacje te ograniczają się wyraźnie do domeny N-końcowej, co z kolei sugeruje znaczenie wysokiego stopnia zachowania tego regionu nie tylko w perspektywie funkcjonalnej, ale również w patogenezie FPD (Rys. 2a). Z pomocą analizy SLAC-window, okazuje się, że N-końcowa domena składa się z 15 negatywnie ograniczonych miejsc, co dodatkowo przemawia za tym, że silne selektywne ograniczenia odgrywają swoją rolę w zachowaniu tego regionu podczas ewolucji sarkopterygianów (Ryc. 2b, patrz Supplementary Table S4).
Ewolucja strukturalna SNCA
Aby dokładniej zbadać, w jaki sposób selekcja oczyszczająca spełnia swoją rolę w definiowaniu ograniczeń przestrzennych na ancestralnych białkach SNCA na poziomie strukturalnym, przeprowadzono porównawcze badania strukturalne. Jako odniesienie przyjęto strukturę NMR ludzkiego SNCA (1XQ8) i porównano ją z modelowanymi białkami przodków (ryc. 3). Odchylenia strukturalne badano za pomocą wartości RMSD (Ryc. 3, patrz Supplementary Fig. S2A,B). Wyniki ujawniły bardzo interesujące aspekty, których nie przewidywała analiza porównawcza na poziomie sekwencji. Porównawcza analiza strukturalna sugeruje, że struktura SNCA przeszła przez szereg przejść, aby uzyskać swoją ulubioną konformację. Nałożone modele ancestralnych białek SNCA i 1XQ8 ujawniły wspólny region odchyleń obejmujący od 32 do 58 N-końcowej domeny wiążącej lipidy SNCA (Tabela 2). Te strukturalne odchylenia zostały również zmierzone za pomocą kwantyfikacji skręceń szkieletu, co podkreśliło fakt, że region 32 do 58 SNCA ulega ciągłej ewolucji na poziomie strukturalnym, pomimo wysokiego stopnia zachowania sekwencji (Tabela 2). Stwierdzono również, że destabilizujące substytucje zostały wprowadzone podczas ewolucji SNCA w celu osiągnięcia jego wewnętrznej nieuporządkowanej konformacji, co implikuje stojące za tym ograniczenia funkcjonalne (Tabela 1). Logicznym wydaje się więc spekulowanie na podstawie tego strukturalnego porównania, że podczas ewolucji SNCA zostały włączone te substytucje, które nie tylko spowodowały destabilizację SNCA, ale także przyniosły drastyczne zmiany strukturalne w zidentyfikowanym regionie. Ten krytyczny region (32-58) został również uznany za kluczowy dla prawidłowej konformacji nie tylko N-końcowej domeny A2 alfa helisy, ale również dla domeny NAC. Przy pomocy technik dyfrakcji elektronowej i rentgenowskiej stwierdzono, że normalne SNCA składa się poprzez swój region N-końcowy, co ponownie podkreśla istotną rolę tej domeny45.
Intrygująco, wszystkie specyficzne dla człowieka mutacje zaangażowane w patogenezę FPD rezydują w tym kluczowym regionie, co oznacza, że każda zmiana w tym regionie będzie szkodliwa z powodu silnej selekcji i ograniczeń funkcjonalnych nałożonych na niego. Nałożone modele mutantów z 1XQ8 zidentyfikowały główne przesunięcia w kierunku domeny wiążącej lipidy w A30P i H50Q, podczas gdy główne zmiany zaobserwowano w domenach wiążących lipidy i NAC w przypadku E46K i A53T. Jedynie G51D wykazywał zmieniony tylko region NAC (patrz Suplementary Fig.S4A,B). Wszystkie pięć zmutowanych modeli miało silnie odchylony region od 32 do 58. Można postulować na podstawie tej porównawczej analizy strukturalnej, że pierwotne efekty i rola tych pięciu mutacji SNCA w patogenezie FPD mogą być różne z powodu ich zróżnicowanej morfologii strukturalnej.
Dalej, aby zbadać różnice strukturalne wśród ludzkich paralogów SNCA, przeprowadzono również porównawczą analizę strukturalną. Ponieważ struktury NMR ludzkich SNCB i SNCG nie zostały dotychczas przedstawione, ich struktury zostały wymodelowane przy użyciu struktury NMR ludzkiego SNCA (1XQ8) jako odniesienia i oceniono odchylenia strukturalne (patrz Suplementary Fig.S5A,B). Okazuje się, że struktury SNCB i SNCG są wysoce odchylone od SNCA w domenie N-końcowej i NAC (Ryc. 4).
Analiza oddziaływań między SNCA a domeną coiled-coil SNCAIP
Aby dokładniej zbadać znaczenie tego krytycznego regionu, rozszyfrowano jego znaczenie funkcjonalne za pomocą badania interakcji. W tym celu wzięto pod uwagę synfilinę-1 (SNCAIP), ponieważ anotacja domeny synfiliny-1 ujawniła, że jest to białko o długości 919 a.a (3745 bp) kodowane przez 10 eksonów17, obejmujące sześć powtórzeń ankyrinopodobnych i jedną centralną domenę coiled-coil (510-557) (ryc. 5a). Techniki biochemiczne i NMR potwierdziły, że SNCAIP oddziałuje z N-końcowym regionem SNCA38. Chociaż normalna funkcja komórkowa tych oddziałujących partnerów jest nadal nieznana, ale stwierdzono, że SNCAIP jest rozwojowo zlokalizowany w zakończeniach synaptycznych, a jego asocjacja z pęcherzykami synaptycznymi jest modulowana przez SNCA. W tym kontekście SNCAIP jest uważany za synaptycznego partnera SNCA, co sugeruje, że interakcja ta pośredniczy w synaptycznych funkcjach SNCA, prawdopodobnie poprzez zakotwiczenie SNCA do błony pęcherzyków46.
W celu zbadania roli regionu krytycznego w interakcji, przeprowadzono analizę dokowania. Zidentyfikowano interakcje pomiędzy ancestralnymi białkami SNCA sarkopterygian, specyficznymi dla ssaków i specyficznymi dla ssaków naczelnych, co ujawniło, że interakcje pomiędzy SNCA i domeną coiled-coil SNCAIP ewoluowały wraz z upływem czasu, tj. interakcje specyficzne dla linii rozwojowych pojawiły się podczas historii ewolucyjnej sarkopterygian (ryc. 5b). Analiza interakcji między SNCA specyficznym dla człowieka a domeną cewki SNCAIP ujawniła, że u korzeni katarrkinów rozwinęło się kilka specyficznych dla linii interakcji, tj. Lys32, Tyr39 i Lys45 (patrz Suplementary Fig. S6, patrz Supplementary Table S5). Co ciekawe, te specyficzne dla człowieka (kataryny) interakcje występują w zidentyfikowanym regionie krytycznym, co wzmacnia naszą hipotezę o strukturalnym i funkcjonalnym znaczeniu tego regionu i jego istotnej roli w patogenezie FPD (ryc. 5c).
Analiza interakcji pomiędzy zmutowanymi modelami ludzkiego specyficznego SNCA z SNCAIP ujawniła zmienione wzory interakcji, podczas gdy niektóre z interakcji typu dzikiego zostały zachowane, co oznacza, że SNCA i domena coiled-coil SNCAIP nie tylko oddziałują u osób zdrowych, ale także u pacjentów z FPD, jednak wzór interakcji został zmieniony. Kompleksy A30P-SNCAIP i E46K-SNCAIP wykazały, że oddziaływania przesunęły się całkowicie do domeny NAC, podczas gdy kompleksy H50Q-SNCAIP i G51D-SNCAIP wykazały zmienione interakcje z udziałem domen N-końcowych i NAC. Jedynie oddziaływania w kompleksie A53T-SNCAIP były w całości ograniczone do domeny N-końcowej, ale ich wzór był zmieniony. Można przypuszczać, że interakcje uległy zmianie ze względu na różny wzór interakcji SNCA i SNCAIP, co wpłynęło na ich powinowactwo wiążące, które z kolei wpłynęło na agregację SNCA (ryc. 5d, patrz Supplementary Fig.S7, patrz Supplementary Table S6).