Phylogenetische Analyse
Die evolutionäre Beziehung zwischen SNCA und seinen mutmaßlichen Paralogen wurde mit NJ- und ML-Methoden geschätzt (Abb. 1, siehe ergänzende Abb. S1). Die phylogenetische Analyse der Synucleinfamilie ergab, dass zwei Duplikationsereignisse zur Diversifizierung dieser Familie beigetragen haben. Das erste Duplikationsereignis ereignete sich an der Wurzel der Wirbeltiere, vor der Aufspaltung in Tetrapoden und Teleosteer, und führte zum SNCG-Paralog und Vorläufer von SNCA/SNCB. Das zweite Duplikationsereignis fand an der Wurzel der Sarkopterygier-Linie statt, nach der Speziation der Teleosteer (SNCA/B), was zu den Paralogen von SNCA und SNCB führte. Bemerkenswert ist auch, dass die Zweiglängen der SNCG-Proteine länger sind als die der anderen beiden Paraloge, was darauf hindeutet, dass sich dieser Paralog im Vergleich zu SNCA und SNCB schnell entwickelt haben könnte. Blast-basierte bidirektionale Ähnlichkeitssuchen konnten kein Ortholog dieser Familie bei Wirbeltieren identifizieren, was die Annahme eines wirbeltierspezifischen Ursprungs dieser Familie untermauert (Abb. 1, siehe ergänzende Abb. S1). 1, siehe ergänzende Abb. S1).
Vergleich der Evolutionsrate des SNCA-Gens unter den Sarkopterygiern
Um die Unterschiede in der Evolutionsrate des SNCA-Gens unter den verschiedenen Kladen der Sarkopterygier abzuschätzen, wurden die Orthologe von SNCA von repräsentativen Mitgliedern der Hominoiden (Mensch, Schimpanse, Gorilla, Orang-Utan), von Nicht-Hominoiden (Makake, Marmoset, Totenkopfäffchen, Buschbaby), von nicht-primatenartigen plazentaren Säugetieren (Maus, Hund, Kuh, Elefant) und von nicht-säugetierartigen Tetrapoden (Huhn, Schildkröte, Frosch, Quastenflosser) erhalten. Die nicht synonymen (Ka/dN) und synonymen Substitutionsraten (Ks/dS) wurden für jede Gruppe geschätzt. Dann wurde der z-Test angewandt, um den Selektionszwang für die oben genannten Gruppen zu überprüfen.
Der Ka-Ks (dN-dS) Unterschied für Hominoiden betrug -2,241 (P = 0,014), für Nicht-Hominoiden -4,716 (P = 0), für nicht-primatische plazentale Säugetiere -6,1777 (P = 0) und für nicht-säugetierische Tetrapoden -7,085 (P = 0) (siehe ergänzende Tabelle S1). Im Allgemeinen deutet ein Ka-Wert, der niedriger als Ks ist (Ka < Ks), auf eine negative Selektion hin, d. h. nicht stumme Substitutionen wurden durch natürliche Selektion beseitigt, während das umgekehrte Szenario (Ka > Ks) eine positive Selektion impliziert, d. h. vorteilhafte Mutationen haben sich im Laufe der Evolution angesammelt. Der Beweis für eine positive oder negative Selektion erfordert jedoch, dass sich die Werte signifikant voneinander unterscheiden41,42. Die durch den z-Test ermittelten Ergebnisse (Ka-Ks < 0, p < 0,05) deuten darauf hin, dass SNCA im Laufe der Evolution von der Neutralität abgewichen ist, was auf einen negativen Selektionszwang innerhalb der Sarkopterygia-Abstammung hindeutet (siehe ergänzende Tabelle S1).
Die Analyse der Evolutionsrate wurde auch für mutmaßliche paraloge Kopien von SNCA, d. h. SNCB und SNCG, durchgeführt. Die Ka-Ks (dN-dS)-Differenz für SNCB wurde mit -1,661(P = 0,05) für Hominoide, -4,708(P = 0) für nicht-hominoide Primaten, -5,212(P = 0) für nicht-primatische plazentale Säugetiere und -2,992(P = 0,002) für nicht-säugetierische Tetrapoden ermittelt (siehe ergänzende Tabelle S2). Die Ka-Ks (dN-dS) Differenz für SNCG wurde als -1.658(P = 0.05) für Hominoide, -4.064(P = 0) für nicht-hominoide Primaten, -5.485(P = 0) für nicht-primatenähnliche Säugetiere, -6.306(P = 0) für nicht-säugetierähnliche Tetrapoden und -6.341(P = 0) für Fische (Fugu, Tetraodon, Stichling, Medaka) (siehe ergänzende Tabelle S3). Diese Daten zeigen, dass nicht nur SNCA, sondern auch zwei andere Mitglieder der Synuclein-Familie unter starkem Selektionsdruck bei den analysierten Sarkopterygiern erhalten geblieben sind.
Domänenorganisation von SNCA
Um einen Einblick in die vergleichende Domänenorganisation zu erhalten, wurde eine vollständige Domänenannotation des SNCA-Gens durchgeführt, die die Orthologe von Sarkopterygiern (Mensch, Maus, Hund, Huhn, Quastenflosser) sowie die paranalogen Kopien beim Menschen (SNCB und SNCG) einschloss. Diese Annotation offenbarte die charakteristische Architektur des SNCA-Gens, die aus einer N-terminalen A2-Lipid-bindenden Alpha-Helix-Domäne (1-60), einer Nicht-Amyloid-β-Komponente (NAC)-Domäne (61-95) und einer C-terminalen sauren Domäne (96-140) besteht (Abb. 2a).
Die N-terminale Lipidbindungsdomäne besteht aus 5 unvollkommenen KXKEGV-Wiederholungen26, und diese Wiederholungen sind unter den analysierten Orthologen und Paralogen des menschlichen SNCA in Bezug auf Anzahl und Position als hoch konserviert identifiziert worden (Abb. 2a). Es wird vorhergesagt, dass diese Region amphipathische α-Helices bildet, und es wird angenommen, dass sie an der Interaktion mit Phospholipiden beteiligt ist26.
Die NAC-Domäne bildet den amyloidogenen Kern von SNCA26. Die NAC-Domäne besteht aus dem GAV-Motiv mit der Konsensussequenz VGGAVVTGV(66-74) und drei GXXX-Submotiven (wobei X ein beliebiges Gly, Ala, Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser oder Met ist)26. Unter den analysierten Orthologen wurde NAC als hoch konserviert identifiziert. Im Gegensatz dazu war die Länge von NAC (61-84) in der SNCB aufgrund des Fehlens eines GXXX-Motivs und der KXKEGV-Wiederholung geringer als bei den anderen paranalogen Kopien. In SNCG wurde hingegen kein GXXX-Submotiv identifiziert. Von den drei mutmaßlichen Paralogen war das GAV-Motiv explizit nur in SNCA vorhanden (Abb. 2a). NAC gilt als äußerst notwendig für die Aggregation und Fibrillation von SNCA26. Das GAV-Motiv wird als Signaturmotiv für diesen Aggregationsprozess vermutet25.
Die C-terminale saure Domäne beherbergt ein Kupferbindungsmotiv, das die Konsensussequenz DPDNEA(119-124) enthält43 , die bei den untersuchten Orthologen von SNCA als hoch konserviert angesehen wurde. Durch mehrfaches Sequenzalignment konnte die Erhaltung dieses Motivs bei den SNCB- und SNCG-Paralogen nicht festgestellt werden (Abb. 2a). Diese Domäne von SNCA ist mit sauren Resten und Prolinen angereichert. Drei hochkonservierte Tyrosinreste, die als Signatur der Unterfamilien von SNCA und SNCB gelten, befinden sich ebenfalls in dieser Region26. Es wird auch vermutet, dass die Kupferbindung die Aggregation von SNCA beschleunigt und seine pathologischen Wirkungen beeinflusst44.
Die stammbaumspezifischen Substitutionen, die im Laufe der Evolution bei den untersuchten Sarkopterygiern aufgetreten sind, wurden mit Hilfe der Technik der Ahnenrekonstruktion auf dem menschlichen SNCA abgebildet. Dabei wurde festgestellt, dass neun Substitutionen an der Wurzel des Säugetiervorfahren stattgefunden haben. Zwei Substitutionen traten an der Wurzel des Stammbaums der nicht-primatenartigen Plazentasäugetiere auf und eine speziell bei den Katarrhini (Hominoiden und Altweltaffen) (Abb. 2a) (Tabelle 1). Von diesen 12 identifizierten Substitutionen waren fünf (S64T, G68E, N87S, L94F, V95G) auf NAC beschränkt, während sechs (A101G, F107A, M112I, M113L, P129S, E132G) in der C-terminalen sauren Domäne zu finden waren. Nur eine Substitution (T53A) wurde in der N-terminalen Region identifiziert (Abb. 2a). Die physikalisch-chemischen Eigenschaften dieser Aminosäuresubstitutionen wurden anschließend analysiert. Dabei zeigte sich, dass ungefähr alle Substitutionen, die im Laufe der Evolution aufgetreten sind, vom radikalischen Typ waren, mit Ausnahme von T53A und A101G (Tabelle 1). Diese Analyse zeigt, dass die N-terminale Lipidbindungsdomäne unter den untersuchten Orthologen und Paralogen hoch konserviert ist. Dieses Ergebnis wurde durch die physische Positionierung von fünf zuvor berichteten humanspezifischen Mutationen, die mit der familiären Parkinson-Krankheit assoziiert sind, d. h. A30P3, E46K4, H50Q5, G51D6 und A53T7, auf der menschlichen SNCA noch verstärkt. Die Ergebnisse zeigten, dass sich diese Mutationen explizit auf die N-terminale Domäne beschränken, was wiederum auf die Bedeutung der hohen Konservierung dieser Region nicht nur in funktioneller Hinsicht, sondern auch für die Pathogenese der FPD hinweist (Abb. 2a). Mit Hilfe der SLAC-Fensteranalyse zeigt sich, dass die N-terminale Domäne aus 15 negativ eingeschränkten Stellen besteht, was wiederum dafür spricht, dass starke selektive Einschränkungen ihre Rolle bei der Erhaltung dieser Region während der Evolution der Sarkopterygier spielen (Abb. 2b, siehe ergänzende Tabelle S4).
Strukturelle Evolution der SNCA
Um weiter zu untersuchen, wie die reinigende Selektion ihre Rolle bei der Definition der räumlichen Beschränkungen der angestammten SNCA-Proteine auf struktureller Ebene ausübt, wurde eine vergleichende Strukturstudie durchgeführt. Die NMR-Struktur der menschlichen SNCA (1XQ8) wurde als Referenz genommen und mit modellierten Vorläuferproteinen verglichen (Abb. 3). Strukturelle Abweichungen wurden mit Hilfe der RMSD-Werte untersucht (Abb. 3, siehe ergänzende Abb. S2A,B). Die Ergebnisse enthüllten sehr bemerkenswerte Aspekte, die von der vergleichenden Analyse auf Sequenzebene nicht erwartet worden waren. Die vergleichende Strukturanalyse deutet darauf hin, dass die Struktur von SNCA eine Reihe von Übergängen durchlaufen hat, um ihre bevorzugte Konformation zu erhalten. Die übereinander gelegten Modelle der Vorläuferproteine von SNCA und 1XQ8 zeigten, dass die gemeinsame abweichende Region 32 bis 58 der N-terminalen Lipidbindungsdomäne von SNCA umfasst (Tabelle 2). Diese strukturellen Abweichungen wurden auch mit Hilfe der Quantifizierung von Rückgratverdrehungen gemessen, was die Tatsache unterstrich, dass sich die Region 32 bis 58 von SNCA trotz ihrer hohen Sequenzerhaltung kontinuierlich auf struktureller Ebene weiterentwickelt (Tabelle 2). Es wurde auch festgestellt, dass destabilisierende Substitutionen während der SNCA-Evolution mit dem Ziel eingebaut wurden, die intrinsische ungeordnete Konformation zu erreichen, was auf funktionelle Beschränkungen schließen lässt (Tabelle 1). Es erscheint daher logisch, auf der Grundlage dieses Strukturvergleichs zu spekulieren, dass während der SNCA-Evolution jene Substitutionen eingebaut wurden, die nicht nur eine Destabilisierung der SNCA bewirkten, sondern auch eine drastische Strukturverschiebung in der identifizierten Region. Diese kritische Region (32-58) wurde auch als entscheidend für die richtige Konformation nicht nur der N-terminalen A2-alpha-Helix-Domäne, sondern auch der NAC-Domäne erkannt. Mit Hilfe von Elektronen- und Röntgenbeugungstechniken wurde berichtet, dass sich normales SNCA durch seine N-terminale Region zusammensetzt, was wiederum die wichtige Rolle dieser Domäne unterstreicht45.
Interessanterweise befinden sich alle humanspezifischen Mutationen, die an der FPD-Pathogenese beteiligt sind, in dieser entscheidenden Region, was bedeutet, dass jede Veränderung in dieser Region aufgrund der starken Selektion und der funktionellen Einschränkungen, die ihr auferlegt werden, schädlich ist. Überlagerte Mutantenmodelle mit 1XQ8 ergaben größere Verschiebungen in Richtung der Lipidbindungsdomäne bei A30P und H50Q, während bei E46K und A53T größere Veränderungen in den Lipidbindungs- und NAC-Domänen beobachtet wurden. Nur G51D zeigte nur eine veränderte NAC-Region (siehe ergänzende Abb. S4A,B). Alle fünf Mutantenmodelle hatten eine stark abweichende Region zwischen 32 und 58 gemeinsam. Diese vergleichende Strukturanalyse lässt vermuten, dass die primären Auswirkungen und die Rolle dieser fünf SNCA-Mutationen in der FPD-Pathogenese aufgrund ihrer unterschiedlichen strukturellen Morphologien unterschiedlich sein können.
Um die strukturellen Unterschiede zwischen den menschlichen Paralogen von SNCA zu untersuchen, wurde außerdem eine vergleichende Strukturanalyse durchgeführt. Da die NMR-Strukturen von menschlichem SNCB und SNCG bisher nicht bekannt sind, wurden ihre Strukturen anhand der NMR-Struktur von menschlichem SNCA (1XQ8) als Referenz modelliert und die strukturellen Abweichungen bewertet (siehe ergänzende Abb. S5A und B). Es zeigt sich, dass die Strukturen von SNCB und SNCG in der N-terminalen und NAC-Domäne stark von SNCA abweichen (Abb. 4).
Analyse der Wechselwirkungen zwischen SNCA und der Coiled-Coil-Domäne von SNCAIP
Um die Bedeutung dieser kritischen Region weiter zu untersuchen, wurde ihre funktionelle Bedeutung mit Hilfe einer Interaktionsstudie entschlüsselt. Zu diesem Zweck wurde Synphilin-1 (SNCAIP) in Betracht gezogen, da die Annotation der Domäne von Synphilin-1 ergab, dass es sich um ein 919 a.a (3745 bp) großes Protein handelt, das von 10 Exons17 kodiert wird und sechs ankyrinartige Wiederholungen und eine zentrale Coiled-Coil-Domäne (510-557) umfasst (Abb. 5a). Durch biochemische und NMR-Techniken wurde bestätigt, dass SNCAIP mit der N-terminalen Region von SNCA38 interagiert. Obwohl die normale zelluläre Funktion dieser interagierenden Partner noch unbekannt ist, wurde berichtet, dass SNCAIP entwicklungsbedingt in synaptischen Terminals lokalisiert ist und seine Verbindung mit synaptischen Vesikeln durch SNCA moduliert wird. In diesem Zusammenhang wird SNCAIP als synaptischer Partner von SNCA angesehen, was bedeutet, dass diese Interaktion die synaptischen Funktionen von SNCA vermittelt, möglicherweise durch Verankerung von SNCA an der Vesikelmembran46.
Um die Rolle der kritischen Region bei der Interaktion zu untersuchen, wurde eine Docking-Analyse durchgeführt. Es wurden Interaktionen zwischen sarcopterygischen Vorfahren, säugetierspezifischen und nicht-primatenartigen plazentalen Säugetier-SNCA-Proteinen identifiziert, die zeigten, dass sich die Interaktion zwischen SNCA und der Coiled-Coil-Domäne von SNCAIP im Laufe der Zeit entwickelt hat, d. h., dass stammesspezifische Interaktionen während der Evolutionsgeschichte der Sarkopterygier entstanden sind (Abb. 5b). Die Interaktionsanalyse zwischen dem human-spezifischen SNCA und der Coiled-Coil-Domäne von SNCAIP ergab, dass sich an der Wurzel der Catarrhinen nur wenige stammesspezifische Interaktionen entwickelt haben, nämlich Lys32, Tyr39 und Lys45 (siehe ergänzende Abb. S6, siehe ergänzende Tabelle S5). Interessanterweise befinden sich diese humanen (catarrhines) spezifischen Interaktionen in der identifizierten kritischen Region, was unsere Hypothese der strukturellen und funktionellen Bedeutung dieser Region und ihrer entscheidenden Rolle in der FPD-Pathogenese stärkt (Abb. 5c).
Die Interaktionsanalyse zwischen den Mutantenmodellen von humanem spezifischem SNCA und SNCAIP ergab veränderte Interaktionsmuster, während einige der Wildtyp-Interaktionen beibehalten wurden, was darauf hindeutet, dass SNCA und die Coiled-Coil-Domäne von SNCAIP nicht nur bei normalen Personen, sondern auch bei FPD-Patienten interagieren, jedoch wurde ein verändertes Interaktionsmuster festgestellt. Angedockte Komplexe von A30P-SNCAIP und E46K-SNCAIP zeigten, dass sich die Wechselwirkungen vollständig auf die NAC-Domäne verlagern, während H50Q-SNCAIP- und G51D-SNCAIP-Komplexe veränderte Wechselwirkungen zeigten, an denen die N-terminalen und NAC-Domänen beteiligt waren. Nur die Interaktionen in A53T-SNCAIP beschränkten sich vollständig auf die N-terminale Domäne, aber das Muster wurde verändert gefunden. Es kann davon ausgegangen werden, dass sich die Wechselwirkungen aufgrund des unterschiedlichen Interaktionsmusters von SNCA und SNCAIP verändert haben, was sich auf ihre Bindungsaffinitäten auswirkt, die wiederum die SNCA-Aggregation beeinflussen (Abb. 5d, siehe ergänzende Abb. S7, siehe ergänzende Tabelle S6).