Analyse phylogénétique
La relation évolutive entre SNCA et ses paralogues putatifs a été estimée par des méthodes NJ et ML (Fig. 1, voir Fig. supplémentaire S1). L’analyse phylogénétique de la famille des synucléines a révélé que deux événements de duplication ont contribué à la diversification de cette famille. Le premier événement de duplication a eu lieu à la racine des vertébrés, avant la séparation tétrapode-téléostéen, déduit dans le paralogue de SNCG et ancêtre de SNCA/SNCB. Tandis que le second événement de duplication s’est produit à la racine de la lignée des sarcoptérygiens, après la spéciation des poissons téléostéens (SNCA/B) et a donné lieu à des paralogues de SNCA et SNCB. Il est également intéressant de noter que la longueur des branches des protéines SNCG est plus longue que celle des deux autres paralogues, ce qui suggère que ce paralogue a pu évoluer rapidement par rapport à SNCA et SNCB. Les recherches de similarité bidirectionnelle basées sur Blast n’ont pas permis d’identifier d’orthologue de cette famille chez les invertébrés, ce qui renforce l’hypothèse d’une origine spécifique aux vertébrés de cette famille (Fig. 1, voir la figure supplémentaire S1).
Comparaison du taux d’évolution du gène SNCA parmi les sarcoptérygiens
Afin d’estimer les différences de taux d’évolution du gène SNCA parmi les divers clades de sarcoptérygiens, les orthologues de SNCA des membres représentatifs des hominoïdes (humain, chimpanzé, gorille, orang-outan), non-hominoïdes (macaque, ouistiti, singe écureuil, bushbaby), mammifères placentaires non primates (souris, chien, vache, éléphant) et tétrapodes non-mammifères (poulet, tortue, grenouille, coelacanthe). Les taux de substitution non synonymes (Ka/dN) et synonymes (Ks/dS) ont été estimés pour chaque groupe. Et puis le test z a été appliqué pour vérifier la contrainte de sélection sur les groupes mentionnés ci-dessus.
La différence Ka-Ks (dN-dS) pour les hominoïdes a été trouvée comme -2,241 (P = 0,014), les non-hominoïdes était -4,716 (P = 0), les mammifères placentaires non primates était -6,1777 (P = 0) et les tétrapodes non-mammifères était -7,085 (P = 0) (voir le tableau supplémentaire S1). En général, une valeur Ka inférieure à Ks (Ka < Ks) suggère une sélection négative, c’est-à-dire que les substitutions non silencieuses ont été purgées par la sélection naturelle, tandis que le scénario inverse (Ka > Ks) implique une sélection positive, c’est-à-dire que des mutations avantageuses se sont accumulées au cours de l’évolution. Cependant, la preuve d’une sélection positive ou négative exige que les valeurs soient significativement différentes les unes des autres41,42. Les résultats déduits par le test z (Ka-Ks < 0, p < 0,05) suggèrent que SNCA a dévié de la neutralité au cours de l’évolution, montrant la signature d’une contrainte de sélection négative au sein de la lignée des sarcoptérygiens (voir le tableau supplémentaire S1).
L’analyse du taux d’évolution a également été effectuée pour les copies paralogues putatives de SNCA, c’est-à-dire SNCB et SNCG. La différence Ka-Ks (dN-dS) pour SNCB a été identifiée comme étant de -1,661(P = 0,05) pour les hominoïdes, -4,708(P = 0) pour les primates non-hominoïdes, -5,212(P = 0) pour les mammifères placentaires non-primates et -2,992(P = 0,002) pour les tétrapodes non-mammifères (voir tableau supplémentaire S2). La différence Ka-Ks (dN-dS) pour le SNCG a été identifiée comme -1,658(P = 0,05) pour les hominoïdes, -4,064(P = 0) pour les primates non-hominoïdes, -5.485(P = 0) pour les mammifères placentaires non primates, -6,306(P = 0) pour les tétrapodes non mammaliens et -6,341(P = 0) pour les poissons (fugu, tetraodon, épinoche, medaka) (voir tableau supplémentaire S3). Ces données précisent que non seulement SNCA mais aussi les deux autres membres de la famille des synucléines ont été conservés sous une forte pression de sélection purificatrice chez les sarcoptérygiens analysés.
Organisation des domaines de SNCA
Afin d’avoir un aperçu de l’organisation comparative des domaines, une annotation complète des domaines du gène SNCA a été réalisée impliquant les orthologues représentatifs des sarcoptérygiens (humain, souris, chien, poulet, cœlacanthe) ainsi que les copies paralogues chez l’homme (SNCB et SNCG). Cette annotation a révélé l’architecture distinctive du gène SNCA qui est composé du domaine d’hélice alpha de liaison aux lipides A2 N-terminal (1-60), du domaine de composant β non-amyloïde (NAC) (61-95) et du domaine acide C-terminal (96-140) (Fig. 2a).
Le domaine de liaison lipidique N-terminal est constitué de 5 répétitions imparfaites KXKEGV26, et ces répétitions sont identifiées comme hautement conservées parmi les orthologues et paralogues analysés de la SNCA humaine en termes de nombre et de position (figure 2a). Cette région est prédite pour former des α-hélices amphipathiques, et considérée comme étant impliquée dans l’interaction avec les phospholipides26.
Le domaine NAC forme le noyau amyloïdogène de SNCA26. Le domaine NAC comprend le motif GAV avec la séquence consensus VGGAVVTGV(66-74) et trois sous-motifs GXXX (où X est l’un des Gly, Ala, Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser ou Met)26. Parmi les orthologues analysés, la NAC a été identifiée comme hautement conservée. Alors que, parmi ses copies homologues, dans la SNCB la longueur de la NAC (61-84) a été réduite en raison de l’absence d’un motif GXXX et de la répétition KXKEGV. Alors qu’aucun sous-motif GXXX n’a été identifié dans la SNCG. Parmi les trois paralogues putatifs, le motif GAV était explicitement présent dans SNCA seulement (Fig. 2a). La SNCA est considérée comme extrêmement nécessaire pour l’agrégation et la fibrillation de la SNCA26. Alors que GAV est supposé être le motif de signature responsable de ce processus d’agrégation25.
Le domaine acide C-terminal abrite un motif de liaison au cuivre contenant la séquence consensus DPDNEA(119-124)43 qui s’est avérée hautement conservée parmi les orthologues analysés de SNCA. L’alignement de séquences multiples n’a pas permis d’identifier la conservation de ce motif parmi les paralogues de SNCB et SNCG (Fig. 2a). Ce domaine de la SNCA est enrichi en résidus acides et en prolines. Trois résidus tyrosine hautement conservés, qui sont considérés comme une signature de la sous-famille de SNCA et SNCB, sont également situés dans cette région26. Il est également proposé que la liaison au cuivre accélère l’agrégation de la SNCA et influence ses effets pathologiques44.
Les substitutions spécifiques aux lignées qui se sont produites au cours de l’évolution parmi les sarcoptérygiens analysés ont été cartographiées sur la SNCA humaine à l’aide de la technique de reconstruction des ancêtres. Il a été classé que neuf substitutions ont eu lieu à la racine de l’ancêtre mammifère. Deux substitutions se sont produites à la racine de la lignée des mammifères placentaires non primates et une s’est produite spécifiquement dans la lignée des catarrhini (hominoïdes et singes de l’ancien monde) (Fig. 2a) (Tableau 1). Sur ces 12 substitutions identifiées, cinq (S64T, G68E, N87S, L94F, V95G) se sont avérées être confinées vers la NAC, tandis que six (A101G, F107A, M112I, M113L, P129S, E132G) résidaient dans le domaine acide C-terminal. Seule une substitution (T53A) a été identifiée dans la région N-terminale (Fig. 2a). Les propriétés physico-chimiques de ces substitutions d’acides aminés ont ensuite été analysées, ce qui a montré qu’approximativement toutes les substitutions survenues au cours de l’évolution étaient de type radicalaire, à l’exception de T53A et A101G (Tableau 1). Cette analyse met en évidence le domaine de liaison lipidique N-terminal comme étant hautement conservé parmi les orthologues et paralogues analysés. Cette constatation a été renforcée par le positionnement physique de cinq mutations spécifiques humaines précédemment rapportées et associées à la maladie de Parkinson familiale, à savoir A30P3, E46K4, H50Q5, G51D6 et A53T7, sur la SNCA humaine. Les résultats ont révélé le confinement de ces mutations de manière explicite vers le domaine N-terminal, ce qui implique l’importance de la conservation élevée de cette région non seulement d’un point de vue fonctionnel mais aussi pour la pathogenèse de la maladie de Parkinson (Fig. 2a). Avec l’aide de l’analyse SLAC-window, il apparaît que le domaine N-terminal comprenait 15 sites à contrainte négative, ce qui plaide en outre pour que de fortes contraintes sélectives opèrent leur rôle dans la préservation de cette région au cours de l’évolution des sarcoptérygiens (Fig. 2b, voir le tableau supplémentaire S4).
Évolution structurale de SNCA
Pour inspecter davantage la façon dont la sélection purificatrice joue son rôle en définissant les contraintes spatiales sur les protéines SNCA ancestrales au niveau structural, une étude structurale comparative a été menée. La structure RMN de la SNCA humaine (1XQ8) a été prise comme référence et comparée aux protéines ancestrales modélisées (Fig. 3). Les déviations structurelles ont été examinées à l’aide des valeurs RMSD (Fig. 3, voir Fig. supplémentaire S2A,B). Les résultats ont révélé des aspects très remarquables qui n’étaient pas prévus par l’analyse comparative au niveau de la séquence. L’analyse structurale comparative suggère que la structure de la SNCA est passée par une série de transitions pour acquérir sa conformation préférée. Les modèles superposés des protéines SNCA ancestrales et de 1XQ8 ont révélé une région déviante commune englobant 32 à 58 du domaine de liaison lipidique N-terminal de SNCA (tableau 2). Ces déviations structurelles ont également été mesurées à l’aide de la quantification des torsions du squelette, ce qui a mis en évidence le fait que la région 32 à 58 de la SNCA évolue continuellement au niveau structurel, malgré la conservation élevée de sa séquence (tableau 2). Il a également été identifié que des substitutions déstabilisantes ont été incorporées au cours de l’évolution de la SNCA dans le but d’obtenir sa conformation désordonnée intrinsèque, ce qui implique des contraintes fonctionnelles (Tableau 1). Il semble donc logique de supposer, à partir de cette approche de comparaison structurelle, que ces substitutions ont été incorporées au cours de l’évolution de la SNCA, ce qui a non seulement provoqué la déstabilisation de la SNCA, mais aussi un changement structurel radical dans la région identifiée. Cette région critique (32-58) a également été reconnue comme cruciale pour la conformation correcte non seulement du domaine de l’hélice alpha A2 N-terminal mais aussi du domaine NAC. A l’aide de techniques de diffraction d’électrons et de rayons X, il a été rapporté que la SNCA normale s’assemble par sa région N-terminale, ce qui souligne à nouveau le rôle significatif de ce domaine45.
Intriguant, toutes les mutations spécifiques humaines impliquées dans la pathogenèse de la FPD résident dans cette région cruciale ce qui signifie que tout changement dans cette région sera délétère en raison de la forte sélection et des contraintes fonctionnelles qui lui sont imposées. Les modèles de mutants superposés avec 1XQ8 ont identifié des déplacements majeurs vers le domaine de liaison aux lipides dans A30P et H50Q, tandis qu’un changement majeur a été observé dans les domaines de liaison aux lipides et NAC dans le cas de E46K et A53T. Seul G51D a montré une modification de la région NAC uniquement (voir la figure supplémentaire S4A,B). Les cinq modèles mutants avaient en commun une région fortement déviante de 32 à 58. Il peut être postulé à partir de cette analyse structurelle comparative que les effets primaires et le rôle de ces cinq mutations SNCA dans la pathogenèse de la FPD peuvent être différents en raison de leurs morphologies structurelles différentielles.
Plus loin pour étudier les différences structurelles entre les paralogues humains de la SNCA, une analyse structurelle comparative a également été réalisée. Comme les structures RMN de la SNCB et de la SNCG humaines n’ont pas été rapportées jusqu’à présent, leurs structures ont été modélisées en prenant la structure RMN de la SNCA humaine (1XQ8) comme référence et les écarts structurels ont été évalués (voir figure supplémentaire S5A,B). Il apparaît que les structures de SNCB et SNCG sont fortement déviées de SNCA au niveau du domaine N-terminal et NAC (Fig. 4).
Analyse des interactions entre SNCA et le domaine coiled-coil de SNCAIP
Afin d’approfondir l’importance de cette région critique, sa signification fonctionnelle a ensuite été décryptée à l’aide d’une étude d’interaction. À cette fin, la synphiline-1 (SNCAIP) a été considérée, car l’annotation du domaine de la synphiline-1 a révélé qu’il s’agit d’une protéine de 919 a.a (3745 bp) codée par 10 exons17, englobant six répétitions de type ankyrine et un domaine central à enroulement (510-557) (Fig. 5a). Il a été corroboré par des techniques biochimiques et de RMN que SNCAIP interagit avec la région N-terminale de SNCA38. Bien que la fonction cellulaire normale de ces partenaires d’interaction soit encore inconnue, il a été signalé que SNCAIP est localisé au cours du développement aux terminaux synaptiques et que son association avec les vésicules synaptiques est modulée par SNCA. Dans ce contexte, SNCAIP est considéré comme partenaire synaptique de SNCA, ce qui implique que cette interaction médiatise les fonctions synaptiques de SNCA, peut-être en ancrant SNCA à la membrane de la vésicule46.
Afin d’explorer le rôle de la région critique dans l’interaction, une analyse de docking a été réalisée. Des interactions ont été identifiées entre les protéines SNCA ancestrales des sarcoptérygiens, spécifiques des mammifères et spécifiques des mammifères placentaires non primates, ce qui a révélé que l’interaction entre la SNCA et le domaine coiled-coil de la SNCAIP a évolué avec le temps, c’est-à-dire que des interactions spécifiques à la lignée ont émergé au cours de l’histoire évolutive des sarcoptérygiens (Fig. 5b). L’analyse des interactions entre le SNCA spécifique à l’homme et le domaine coiled-coil du SNCAIP a révélé qu’à la racine des catarrhines, quelques interactions spécifiques à une lignée ont évolué, à savoir Lys32, Tyr39 et Lys45 (voir la figure supplémentaire S6, voir le tableau supplémentaire S5). De manière intéressante, ces interactions spécifiques à l’homme (catarrhines) résident dans la région critique identifiée, ce qui renforce notre hypothèse de l’importance structurelle et fonctionnelle de cette région et de son rôle vital dans la pathogenèse de la FPD (Fig. 5c).
L’analyse des interactions entre les modèles mutants de la SNCA spécifique humaine avec la SNCAIP a révélé des schémas d’interaction altérés alors que certaines des interactions de type sauvage étaient également conservées, ce qui signifie que la SNCA et le domaine coiled-coil de la SNCAIP n’interagissent pas seulement chez les individus normaux mais aussi chez les patients FPD, cependant le schéma des interactions a été trouvé altéré. Les complexes empilés de A30P-SNCAIP et E46K-SNCAIP ont révélé que les interactions se déplacent entièrement vers le domaine NAC, tandis que les complexes H50Q-SNCAIP et G51D-SNCAIP ont montré des interactions altérées impliquant les domaines N-terminal et NAC. Seules les interactions dans le complexe A53T-SNCAIP étaient entièrement confinées au domaine N-terminal, mais le schéma était modifié. On peut supposer que les interactions ont été modifiées en raison du schéma d’interaction différentiel de SNCA et SNCAIP, ce qui affecte leurs affinités de liaison qui, à leur tour, influencent l’agrégation de SNCA (Fig. 5d, voir Fig. S7 supplémentaire, voir Tableau S6 supplémentaire).