Gena SNCA a bolii Parkinson: Perspective evolutive și structurale cu implicații patologice

Analiză filogenetică

Relația evolutivă dintre SNCA și paralogii săi putativi a fost estimată prin metode NJ și ML (Fig. 1, vezi Fig. Suplimentară S1). Analiza filogenetică a familiei de sinucleine a arătat că două evenimente de duplicare au contribuit la diversificarea acestei familii. Primul eveniment de duplicare a avut loc la rădăcina vertebratelor, înainte de diviziunea tetrapod-teleost, dedusă în paralogul SNCG și strămoșul SNCA/SNCB. În timp ce al doilea eveniment de duplicare a avut loc la rădăcina neamului sarcopterigian, după speciația peștilor teleoste (SNCA/B), ceea ce a dus la paralogii SNCA și SNCB. De asemenea, este demn de remarcat faptul că lungimile ramurilor pentru proteinele SNCG sunt mai mari decât cele ale celorlalți doi paralogi, ceea ce sugerează că acest paralog ar fi putut evolua rapid în comparație cu SNCA și SNCB. Căutările de similaritate bidirecțională bazate pe blast nu reușesc să identifice niciun ortolog al acestei familii în rândul nevertebratelor, ceea ce întărește ipoteza originii specifice vertebratelor a acestei familii (Fig. 1, a se vedea Fig. Suplimentară S1).

Figura 1: Arborele Neighbor Joining al membrilor familiei de sinucleine.
figura1

A fost utilizată distanța p necorectată. A fost utilizată opțiunea de deleție completă. Numerele de pe ramuri reprezintă valorile bootstrap (pe baza a 1000 de repetări) care susțin acea ramură; aici sunt prezentate doar valorile ≥50%. Bara de scară arată substituția de aminoacizi per situs.

Compararea ratei de evoluție a genei SNCA între sarcopterygians

Pentru a estima diferențele de rată de evoluție a genei SNCA între diverse clade de sarcopterygians, ortologii SNCA de la membrii reprezentativi ai hominoidelor (om, cimpanzeu, gorilă, urangutan), non-hominoide (macac, marmoset, maimuță veveriță, bushbaby), mamifere placentare non-primate (șoarece, câine, vacă, elefant) și tetrapode non-mamifere (pui, broască țestoasă, broască, celacant). Pentru fiecare grup au fost estimate ratele de substituție nesinonimă (Ka/dN) și sinonimă (Ks/dS). Și apoi a fost aplicat testul z pentru a verifica constrângerea de selecție asupra grupurilor menționate mai sus.

Diferența Ka-Ks (dN-dS) pentru hominoide a fost găsită ca fiind de -2,241 (P = 0,014), non-hominoide a fost de -4,716 (P = 0), mamiferele placentare non-primate a fost de -6,1777 (P = 0) și tetrapodele non-mamifere a fost de -7,085 (P = 0) (a se vedea tabelul suplimentar S1). În general, o valoare Ka mai mică decât Ks (Ka < Ks) sugerează o selecție negativă, adică substituțiile nesilențioase au fost epurate de selecția naturală, în timp ce scenariul invers (Ka > Ks) implică o selecție pozitivă, adică mutațiile avantajoase s-au acumulat pe parcursul evoluției. Cu toate acestea, dovezile de selecție pozitivă sau negativă necesită ca valoarea să fie semnificativ diferită una de cealaltă41,42. Rezultatele deduse prin testul z (Ka-Ks < 0, p < 0,05) sugerează că SNCA a deviat de la neutralitate în timpul evoluției, arătând semnătura constrângerii de selecție negativă în cadrul neamului sarcopterygian (a se vedea tabelul suplimentar S1).

Analizele ratei de evoluție au fost efectuate, de asemenea, pentru copii paralogi putativi ai SNCA, și anume SNCB și SNCG. Diferența Ka-Ks (dN-dS) pentru SNCB a fost identificată ca fiind de -1,661(P = 0,05) pentru hominoide, -4,708(P = 0) pentru primatele non-hominoide, -5,212(P = 0) pentru mamiferele placentare non-primate și -2,992(P = 0,002) pentru tetrapode nemamifere (a se vedea tabelul suplimentar S2). Diferența Ka-Ks (dN-dS) pentru SNCG a fost identificată ca fiind de -1,658(P = 0,05) pentru hominoide, -4,064(P = 0) pentru primate non-hominoide, -5.485(P = 0) pentru mamiferele placentare non-primate, -6,306(P = 0) tetrapode nemamifere și -6,341(P = 0) pentru pești (fugu, tetraodon, stickleback, medaka) (a se vedea tabelul suplimentar S3). Aceste date specifică faptul că nu numai SNCA, ci și alți doi membri ai familiei de sinucleine au fost, de asemenea, reținuți sub o puternică presiune de selecție purificatoare în rândul sarcopterigienilor analizați.

Organizarea domenială a SNCA

Pentru a obține o perspectivă asupra organizării comparative a domeniilor, a fost efectuată o adnotare completă a domeniilor genei SNCA, implicând ortologii reprezentativi de la sarcopterygiani (om, șoarece, câine, pui, celacant), precum și copiile paraloge la om (SNCB și SNCG). Această adnotare a scos la iveală arhitectura distinctivă a genei SNCA, care este alcătuită din domeniul alfa-helix de legare a lipidelor A2 N-terminal (1-60), domeniul componentei β neamiloide (NAC) (61-95) și domeniul acid C-terminal (96-140) (Fig. 2a).

Figura 2: Reprezentare schematică.
figura2

(a) Organizarea domenială a proteinei SNCA. Vedere schematică a organizării comparative a domeniilor și motivelor funcționale cheie ale SNCA în cadrul proteinelor umane paraloge și ortologe din specii îndepărtate filogenetic. Lungimile proteinelor sunt desenate aproximativ la scară. Domeniile și motivele sunt codificate prin culori. (b) Fereastră care afișează situsurile aflate sub constrângerea de selecție negativă în SNCA în rândul sarcopterygienilor. Rezultatele sunt generate cu Hyphy prin implementarea metodei SLAC, care utilizează modelul global al codonului și probabilitatea maximă pentru a reconstrui istoria evoluției.

Domeniul de legare a lipidelor la partea N-terminală este format din 5 repetări imperfecte KXKEGV26, iar aceste repetări sunt identificate ca fiind foarte conservate între ortologii și paralogii analizați ai SNCA uman în ceea ce privește numărul și poziția (Fig. 2a). Se preconizează că această regiune formează α-helice amfipatice și se consideră că este implicată în interacțiunea cu fosfolipidele26.

Domeniul NAC formează nucleul amiloidogenic al SNCA26. NAC este alcătuit din motivul GAV cu secvența consensuală VGGAVVVTGV(66-74) și trei submotive GXXX (unde X este oricare dintre Gly, Ala,Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser sau Met)26. Dintre ortologii analizați, NAC a fost identificat ca fiind foarte bine conservat. În timp ce, printre copiile sale contra-paraloge, în SNCB, lungimea NAC (61-84) a fost redusă datorită absenței unui motiv GXXX și a repetiției KXKEGV. În timp ce în SNCG nu a fost identificat niciun submotiv GXXX. Dintre cei trei paralogi putativi, motivul GAV a fost prezent în mod explicit doar în SNCA (Fig. 2a). NAC este considerat ca fiind extrem de necesar pentru agregarea și fibrilația SNCA26. În timp ce GAV este presupus a fi motivul semnătură responsabil pentru acest proces de agregare25.

Domeniul acid C-terminal găzduiește un motiv de legare a cuprului care conține secvența consensuală DPDNEA(119-124)43 care s-a dovedit a fi extrem de conservată între ortologii analizați ai SNCA. Alinierea secvențelor multiple nu a reușit să identifice conservarea acestui motiv între paralogii SNCB și SNCG (Fig. 2a). Acest domeniu al SNCA este îmbogățit în reziduuri acide și proline. Trei reziduuri de tirozină foarte conservate, care sunt considerate ca o semnătură de subfamilie a SNCA și SNCB, sunt, de asemenea, localizate în această regiune26. Se propune, de asemenea, că legarea cuprului accelerează agregarea SNCA și influențează efectele sale patologice44.

Substituțiile specifice liniei care au avut loc în timpul evoluției în rândul sarcopterigienilor analizați au fost cartografiate pe SNCA uman cu ajutorul tehnicii de reconstrucție a strămoșilor. Aceasta a clasificat că nouă substituții au avut loc la rădăcina strămoșului mamiferelor. În timp ce două substituții au avut loc la rădăcina descendenței mamiferelor placentare non-primate și una a avut loc în mod specific la descendența catarrhini (hominoide și maimuțe din lumea veche) (Fig. 2a) (Tabelul 1). Dintre aceste 12 substituții identificate, cinci (S64T, G68E, N87S, L94F, V95G) s-au dovedit a fi limitate la NAC, în timp ce șase (A101G, F107A, M112I, M113L, P129S, E132G) au fost localizate în domeniul acid C-terminal. Doar o singură substituție (T53A) a fost identificată în regiunea N-terminală (Fig. 2a). Proprietățile fizico-chimice ale acestor substituții de aminoacizi au fost apoi analizate, ceea ce a ilustrat faptul că aproximativ toate substituțiile care au avut loc în timpul evoluției au fost de tip radical, cu excepția T53A și A101G (Tabelul 1). Această analiză evidențiază domeniul N-terminal de legare a lipidelor ca fiind foarte conservat între ortologii și paralogii analizați. Această constatare a fost întărită și mai mult de poziționarea fizică a celor cinci mutații specifice umane raportate anterior, asociate cu boala Parkinson familială, și anume A30P3, E46K4, H50Q5, G51D6 și A53T7 pe SNCA uman. Rezultatele au arătat că aceste mutații se limitează în mod explicit la domeniul N-terminal, ceea ce, la rândul său, implică semnificația unei conservări ridicate a acestei regiuni nu numai din punct de vedere funcțional, ci și pentru patogeneza FPD (Fig. 2a). Cu ajutorul analizei SLAC-window, se pare că domeniul N-terminal cuprindea 15 situsuri cu constrângeri negative, ceea ce susține în continuare că constrângerile selective puternice își exercită rolul în conservarea acestei regiuni în timpul evoluției sarcopterygienilor (Fig. 2b, a se vedea tabelul suplimentar S4).

Tabelul 1 După divergența de la strămoșul sarcopterygian, la rădăcina mamiferelor au avut loc nouă modificări de aminoacizi fixi, în timp ce două au avut loc în mod specific în descendența mamiferelor placentare non-primate, în timp ce una a avut loc în mod specific în descendența primatelor (catarrhini).

Evoluția structurală a SNCA

Pentru a inspecta în continuare modul în care selecția purificatoare își îndeplinește rolul în definirea constrângerilor spațiale asupra proteinelor SNCA ancestrale la nivel structural, a fost efectuat un studiu structural comparativ. Structura RMN a SNCA uman (1XQ8) a fost luată ca referință și comparată cu proteinele ancestrale modelate (Fig. 3). Abaterile structurale au fost examinate cu ajutorul valorilor RMSD (Fig. 3, a se vedea Fig. Suplimentară S2A,B). Rezultatele au dezvăluit aspecte foarte remarcabile care nu au fost anticipate de analiza comparativă la nivel de secvență. Analiza structurală comparativă sugerează că structura SNCA a trecut printr-o serie de tranziții pentru a dobândi conformația sa favorizată. Modelele suprapuse ale proteinelor SNCA ancestrale și 1XQ8 au dezvăluit o regiune comună deviată care cuprinde 32 până la 58 din domeniul de legare a lipidelor N-terminal al SNCA (tabelul 2). Aceste deviații structurale au fost, de asemenea, măsurate cu ajutorul cuantificării torsiunilor coloanei vertebrale, ceea ce a evidențiat faptul că regiunea 32-58 a SNCA evoluează continuu la nivel structural, în ciuda conservării secvenței sale ridicate (tabelul 2). S-a identificat, de asemenea, faptul că substituțiile destabilizatoare au fost încorporate în timpul evoluției SNCA cu scopul de a obține conformația sa intrinsecă dezordonată, ceea ce implică constrângerile funcționale din spatele acesteia (tabelul 1). Prin urmare, pare logic să se speculeze, pe baza acestei abordări de comparație structurală, că în timpul evoluției SNCA au fost încorporate acele substituții care nu numai că au cauzat destabilizarea SNCA, dar au adus și o schimbare structurală drastică în regiunea identificată. Această regiune critică (32-58) a fost, de asemenea, recunoscută ca fiind crucială pentru conformația adecvată nu numai a domeniului alfa-helix A2 alfa N-terminal, ci și pentru domeniul NAC. Cu ajutorul tehnicilor de difracție a electronilor și a razelor X, s-a raportat că SNCA normal se asamblează prin regiunea sa N-terminală, ceea ce evidențiază din nou rolul semnificativ al acestui domeniu45.

Figura 3: Evoluția structurală a proteinelor SNCA de la despărțirea de ultimul strămoș comun sarcopterygian.
figura3

Direcția structurală semnificativă față de SNCA uman a fost observată după despărțirea de strămoșul comun sarcopterygian. Nouă substituții specifice au avut loc la rădăcina neamului mamiferelor, care se păstrează la primate și la mamiferele placentare non-primate după despărțirea de strămoșul sarcopterygian. Pe de altă parte, două substituții au avut loc în mod specific la rădăcina neamului mamiferelor placentare non-primate și o substituție specifică catarrhini a avut loc după despărțirea de strămoșul comun al mamiferelor. Reziduurile deviate în ceea ce privește unghiurile de torsiune ale coloanei vertebrale (Φ°,Ψ°) din SNCA uman (1XQ8) sunt reprezentate în culoarea roșie. Abaterile structurale au fost examinate prin valorile RMSD.

Tabelul 2 Analiza abaterilor structurale specifice neamului în ceea ce privește unghiurile de torsiune ale coloanei vertebrale ale proteinelor SNCA ancestrale prin încorporarea substituțiilor specifice cladelor.

În mod curios, toate mutațiile specifice umane implicate în patogeneza FPD rezidă în această regiune crucială, ceea ce semnifică faptul că orice modificare în această regiune va fi dăunătoare din cauza selecției puternice și a constrângerilor funcționale impuse asupra ei. Modelele mutante suprapuse cu 1XQ8 au identificat schimbări majore spre domeniul de legare a lipidelor în cazul A30P și H50Q, în timp ce în cazul E46K și A53T au fost observate schimbări majore în domeniile de legare a lipidelor și NAC. Doar G51D a prezentat modificări doar în regiunea NAC (a se vedea Fig. Suplimentară S4A,B). Toate cele cinci modele mutante aveau în comun o regiune foarte deviată de la 32 la 58. Se poate postula din această analiză structurală comparativă că efectele primare și rolul acestor cinci mutații SNCA în patogeneza FPD pot fi diferite din cauza morfologiilor lor structurale diferențiate.

În continuare, pentru a investiga diferențele structurale dintre paralogii umani ai SNCA, a fost efectuată și o analiză structurală comparativă. Deoarece structurile RMN ale SNCB și SNCG umane nu au fost raportate până în prezent, structurile lor au fost modelate luând ca referință structura RMN a SNCA uman (1XQ8) și au fost evaluate abaterile structurale (a se vedea Fig. suplimentară S5A,B). Se pare că structurile SNCB și SNCG sunt puternic deviate de SNCA la nivelul domeniului N-terminal și NAC (Fig. 4).

Figura 4: Divergența structurală între paralogii umani ai SNCA.
figură4

S-au observat schimbări structurale majore în domeniile N-terminal de legare a lipidelor și NAC din cauza substituțiilor specifice paralogilor. După primul eveniment de duplicare, SNCA/B ancestral a suferit 19 modificări. După a doua duplicare, SNCB și SNCA au suferit 6 și, respectiv, 12 substituții. Reziduurile deviate în comparație cu SNCA uman (1XQ8) sunt codificate prin culoare. Abaterile structurale au fost evaluate prin valorile RMSD.

Analiza interacțiunilor dintre SNCA și domeniul cu spirală spiralată al SNCAIP

Pentru a investiga în continuare importanța acestei regiuni critice, semnificația sa funcțională a fost apoi descifrată cu ajutorul studiului de interacțiune. În acest scop, a fost luată în considerare sinfilina-1 (SNCAIP), deoarece adnotarea domeniului sinfilinei-1 a dezvăluit că este o proteină de 919 a.a (3745 pb) codificată de 10 exoni17 , care cuprinde șase repetări asemănătoare cu cele ale anchirinei și un domeniu central cu spirală spiralată (510-557) (Fig. 5a). S-a confirmat prin tehnici biochimice și RMN că SNCAIP interacționează cu regiunea N-terminală a SNCA38. Cu toate că funcția celulară normală a acestor parteneri de interacțiune este încă necunoscută, dar s-a raportat că SNCAIP este localizat din punct de vedere al dezvoltării la terminalele sinaptice și că asocierea sa cu veziculele sinaptice este modulată de SNCA. În acest context, SNCAIP este considerat partener sinaptic al SNCA, ceea ce implică faptul că această interacțiune mediază funcțiile sinaptice ale SNCA, posibil prin ancorarea SNCA la membrana veziculelor46.

Figura 5
figura 5

Vederea schematică (a) Organizarea domenială a proteinelor SNCA și SNCAIP. Organizarea comparativă a domeniilor și motivelor funcționale cheie ale SNCA uman și a domeniului cu spirală spiralată al SNCAIP uman. Lungimile proteinelor sunt desenate aproximativ la scară. Domeniile și motivele sunt codificate prin culoare. (b) Analiza complexelor andocate și a interacțiunilor prin legături de hidrogen. Afișează interacțiunile dintre SNCA ancestral sarcopterygian și domeniul spiralat al SNCAIP (2KES). (c) Reprezintă interacțiunile dintre SNCA uman (1XQ8) și domeniul cu spirală spiralată al SNCAIP uman. Reziduurile de interacțiune situate în regiunea de interes (32-58) sunt codificate prin culoare. (d) Reprezintă interacțiunea dintre mutantul modelat al SNCA-A30P și domeniul cu spirală spiralată al SNCAIP uman. Liniile punctate arată legătura de hidrogen.

Pentru a explora rolul regiunii critice în interacțiune, s-a efectuat o analiză de docking. Au fost identificate interacțiuni între proteinele SNCA specifice strămoșilor sarcopterygieni, specifice mamiferelor și specifice mamiferelor placentare non-primate, ceea ce a relevat faptul că interacțiunea dintre SNCA și domeniul cu spirală spiralată al SNCAIP a evoluat odată cu trecerea timpului, adică au apărut interacțiuni specifice de neam în timpul istoriei evolutive a sarcopterygienilor (Fig. 5b). Analiza interacțiunii dintre SNCA specifică omului și domeniul spiralat în spirală spiralată al SNCAIP a arătat că, la rădăcina catarinelor, au evoluat câteva interacțiuni specifice de neam, și anume Lys32, Tyr39 și Lys45 (a se vedea Fig. suplimentară S6, a se vedea tabelul suplimentar S5). Este interesant faptul că aceste interacțiuni specifice oamenilor (catarrhines) rezidă în regiunea critică identificată, ceea ce întărește ipoteza noastră privind semnificația structurală și funcțională a acestei regiuni și rolul său vital în patogeneza FPD (Fig. 5c).

Analiza interacțiunii dintre modelele mutante ale SNCA specific uman cu SNCAIP a relevat modele de interacțiune modificate, în timp ce unele dintre interacțiunile de tip sălbatic au fost și ele păstrate, ceea ce înseamnă că SNCA și domeniul cu bobină spiralată al SNCAIP interacționează nu numai la indivizii normali, ci și la pacienții cu FPD, însă modelul de interacțiune a fost găsit modificat. Complecșii andocați ai A30P-SNCAIP și E46K-SNCAIP au arătat că interacțiunile s-au deplasat în întregime către domeniul NAC, în timp ce complexele H50Q-SNCAIP și G51D-SNCAIP au arătat interacțiuni modificate care implică domeniile N-terminal și NAC. Doar interacțiunile din A53T-SNCAIP au fost limitate în întregime la domeniul N-terminal, dar s-a constatat că modelul a fost modificat. Se poate presupune că interacțiunile s-au modificat din cauza modelului de interacțiune diferențiat al SNCA și SNCAIP, afectând astfel afinitățile lor de legare care, la rândul lor, influențează agregarea SNCA (Fig. 5d, a se vedea Fig. suplimentară S7, a se vedea Tabelul suplimentar S6).

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.