The Parkinson Disease gene SNCA: Evolutionary and structural insights with pathological implication

Phylogenetic analysis

SNCAとその推定パラログ間の進化的関係をNJ法とML法で推定(図1、補図S1参照)した。 シヌクレインファミリーの系統解析の結果、2つの重複事象がこのファミリーの多様化に寄与していることが明らかになった。 最初の重複事象は四肢動物と獣弓動物の分岐前の脊椎動物の根元で起こったもので、SNCGパラログとSNCA/SNKBの祖先が推定された。 一方、2回目の重複は、脊椎動物の根元で、魚類の種分化の後に起こり、SNCAとSNCBのパラログをもたらした(SNCA/B)。 また、SNCGタンパク質の分岐長は他の2つのパラログよりも長いことから、このパラログはSNCAやSNCBと比較して急速に進化した可能性がある。 ブラストを用いた双方向の類似性検索では、無脊椎動物の間でこのファミリーのオーソログを見つけることができず、このファミリーが脊椎動物に特有であるという仮定を補強している(Fig. 図1:シヌクレインファミリーメンバーの近傍結合木(Neighbor Joining tree)

figure1

Uncorrected p-distance is used.これは、シヌクレインファミリーメンバーの近傍結合木(Neighbor Joining tree)である。 Complete-deletion オプションを使用。 枝の数字はその枝を支持するブートストラップ値(1000回の反復に基づく)を表し、ここでは50%以上の値のみを示す。 スケールバーは部位ごとのアミノ酸置換を示す。

肉食動物間でのSNCA遺伝子の進化率の比較

肉食動物の様々なクレード間でのSNCA遺伝子の進化率の違いを推定するために、ヒト科の代表メンバー(ヒト, チンパンジー、ゴリラ、オランウータン)、非ホミノイド(マカク、マーモセット、リスザル、ブッシュベビー)、非霊長類胎盤哺乳類(マウス、イヌ、ウシ、ゾウ)、非哺乳類四足動物(ニワトリ、カメ、カエル、シーラカンス)を入手した。 各グループについて、非同義置換率(Ka/dN)および同義置換率(Ks/dS)を推定した。

ホミノイドのKa-Ks(dN-dS)差は-2.241(P = 0.014)、非ホミノイドは-4.716(P = 0)、非霊長類の哺乳類は-6.1777(P = 0)、非哺乳類の四肢動物は-7.085(P = 0)でした(補足表S1参照)。 一般に、KaがKsより小さい場合(Ka < Ks)には負の選択、すなわち非無音置換が自然選択によって排除されたことを、逆のシナリオ(Ka > Ks)には正の選択、すなわち有利な突然変異が進化の過程で蓄積されたことを意味すると考えられている。 しかし、正選択や負選択の証拠となるのは、その値が互いに有意に異なることである41,42。 また、SNCAのパラロガスコピーとされるSNCBとSNCGについても進化速度解析を行った結果、SNCAは進化の過程で中立から外れ、負の選択制約を受けていることが示唆された(補足表S1参照)。 SNCBのKa-Ks(dN-dS)差はホミノイドで-1.661(P = 0.05)、非ホミノイドの霊長類で-4.708(P = 0)、非霊長類の胎盤哺乳類で-5.212(P = 0)、非哺乳類の四足動物で-2.992(P = 0.002 )であると特定した(付表S2参照)。 SNCGのKa-Ks(dN-dS)差は、ホミノイドで-1.658(P = 0.05)、非ホミノイド霊長類で-4.064(P = 0)、-5.0(P = 0)と同定されました。485(P = 0)、非霊長類の胎盤哺乳類では-6.306(P = 0)、非哺乳類の四足動物では-6.341(P = 0)、魚類(フグ、テトラオドン、ハリヨ、メダカ)でも-6.0(P = 0)となった(補足表S3参照)。 このデータから、解析した肉食動物ではSNCAだけでなく、他の2つのシヌクレインファミリーも強い精製淘汰圧の下で保持されていることが明らかになった。

SNCAのドメイン構成

ドメイン構成を比較検討するために、ヒト、マウス、イヌ、ニワトリ、シーラカンスの代表的な肉食動物オルソログとヒトのパラロガス(SNCB、SNCG)を対象にSNCA遺伝子の完全ドメインアノテーションが実施された。 このアノテーションにより、SNCA遺伝子は、N末端のA2脂質結合αヘリックスドメイン(1-60)、Non-amyloid β component(NAC)ドメイン(61-95)、C末端の酸性ドメイン(96-140)からなる特徴ある構造であることが明らかになりました(Fig. 2a)。

図2:模式図。
figure2

(a) SNCAタンパク質のドメイン構成。 ヒトのパラロガスおよび系統的に離れた種からのオルソログタンパク質にわたるSNCAの主要な機能ドメインおよびモチーフの比較構成を示す概略図である。 タンパク質の長さはほぼ縮尺通りに描かれている。 ドメインとモチーフは色分けされている。 (b) 肉食動物におけるSNCAの負の選択制約下にある部位を表示したウインドウ。 結果はHyphyでグローバルコドンモデルと最尤法を用いて進化史を再構築するSLAC法を実装して作成した。

N末端の脂質結合ドメインは5つのKXKEGV不完全反復26からなり、この反復は数、位置の面でヒトSNCAの解析されたオルソログやパラログで高い保存性が確認されている(図2a)。 この領域は両親媒性のα-ヘリックスを形成することが予測され、リン脂質との相互作用に関与していると考えられている26.

NAC domainはSNCAのアミロイド形成の核となる26. NACはVGGAVVTGV(66-74)のコンセンサス配列を持つGAVモチーフと3つのGXXXサブモチーフ(XはGly, Ala, Val, Ile, Leu, Phe, Tyr, Trp, Thr, Ser or Metのいずれか)からなる26。 解析されたオルソログの中で、NACは高度に保存されていることが確認された。 一方、SNCBでは、GXXXモチーフとKXKEGVの繰り返しがないため、NACの長さ(61-84)は短縮されている。 一方、SNCGではGXXXサブモチーフは確認されなかった。 3つの推定パラログのうち、GAVモチーフはSNCAのみに明示的に存在していた(図2a)。 NACはSNCAの凝集と線維化に極めて必要であると考えられている26。

C末端酸性ドメインにはDPDNEA(119-124)コンセンサス配列43を含む銅結合モチーフがあり、SNCAの解析対象オーソログの中で高い保存性が見出された。 複数配列アラインメントでは、SNCBとSNCGのパラログ間でこのモチーフの保存を確認することはできなかった(図2a)。 SNCAのこのドメインは、酸性残基とプロリンに富んでいる。 また、SNCAとSNCBのサブファミリーの特徴として考えられている3つの高度に保存されたチロシン残基も、この領域に位置している26。 また、銅の結合はSNCAの凝集を促進し、その病的作用に影響を与えることが提唱されている44。

ヒトSNCAについて、祖先再構築法を用いて、解析した肉食動物が進化の過程で起こした系統特異的置換をマップした。 その結果,哺乳類祖先の根元で9つの置換が起きていることが判明した。 一方、非霊長類である胎盤哺乳類の祖先には2つの置換が、カタルヒニ類(ホミノイドと旧世界ザル)の祖先には1つの置換が発生していた(図2a)(Table 1)。 これら12個の置換のうち、5個(S64T, G68E, N87S, L94F, V95G)はNACに、6個(A101G, F107A, M112I, M113L, P129S, E132G)はC末端の酸性ドメインに存在することが明らかにされた。 N末端領域では1つの置換(T53A)のみが確認された(図2a)。 これらのアミノ酸置換の物理化学的性質を解析したところ、T53AとA101Gを除いて、進化の過程で生じた置換はほぼすべてラジカル型であることが示された(表1)。 この解析から、N末端の脂質結合ドメインは、解析したオーソログやパラログの間で高度に保存されていることが明らかになった。 この発見は、家族性パーキンソン病に関連する5つのヒト特異的変異(A30P3、E46K4、H50Q5、G51D6、A53T7)がヒトSNCA上に位置することにより、さらに強化された。 その結果、これらの変異は明らかにN末端領域に集中しており、この領域が機能的な観点だけでなく、FPDの発症にも重要であることが示唆されました(図2a)。 また、SLAC-window解析により、N-末端ドメインは15個の負の制約を受ける部位で構成されていることがわかり、さらに、強い選択的制約が進化の過程でこの領域を維持する役割を担っていることが提唱された(図2b、補足表S4参照)。

Table 1 Sarcopterygian ancestorから分岐した後、哺乳類の根元で9つの固定アミノ酸の変化が起こったが、2つは非霊長類の胎盤動物の系統で、1つは霊長類の系統(catarhini)で特異的に発生したものであった。

Structural evolution of SNCA

祖先のSNCAタンパク質の空間的制約を定義する浄化選択の役割をさらに検証するために、比較構造研究を実施した。 ヒトSNCA(1XQ8)のNMR構造を参照とし、モデル化された祖先タンパク質と比較した(図3)。 構造上のずれをRMSD値で検討した(図3、補足図S2A,B参照)。 その結果、配列レベルでの比較解析では予想できなかった、非常に顕著な点が明らかになった。 比較構造解析の結果、SNCAは一連の遷移を経て、好ましいコンフォメーションを獲得していることが示唆された。 SNCAの祖先タンパク質と1XQ8のモデルを重ね合わせたところ、SNCAのN末端脂質結合ドメインの32から58の部分に共通の乖離領域があることがわかった(表2)。 これらの構造的偏差は、バックボーンねじれの定量化によって測定され、SNCAの32から58の領域は、高い配列保存にもかかわらず、構造レベルで継続的に進化しているという事実が浮き彫りになった(Table 2)。 また、SNCAが進化する過程で、その本質的な無秩序構造を達成するために、不安定化する置換が組み込まれていることが確認され、これはその背後にある機能的制約を示唆している(表1)。 したがって、この構造比較のアプローチから、SNCAが進化する過程で、SNCAの不安定化を引き起こすだけでなく、同定された領域で劇的な構造変化をもたらす置換が組み込まれたと推測することは論理的であると思われる。 この重要な領域(32-58)は、N末端A2αヘリックスドメインだけでなく、NACドメインの適切なコンフォメーションにも重要であると認識された。 電子線およびX線回折の技術を用いると、通常のSNCAはN-末端領域を通して集合することが報告されており、このドメインの重要な役割が再び強調されている45。

Figure 3: SNCAタンパク質の構造進化(最後の共通sarcopterygian祖先からの分岐以降)
figure3

共通sarcopterygian祖先の分岐以降、ヒトSNCAへの著しい構造の分岐が観察された。 哺乳類系統の根元では9つの特異的な置換が起こっており、これはサル類祖先から分かれた後も霊長類や非霊長類の胎生哺乳類で保持されている。 一方、共通の哺乳類祖先から分かれた後、2つの置換が非霊長類の根元で、1つのcatarhini特異的置換が起きている。 ヒトSNCA(1XQ8)から骨格ねじれ角(Φ°,Ψ°)の点で乖離した残基を赤色で示した。 構造上の偏差はRMSD値で調べた。

表2 クレード特異的置換を取り入れた祖先SNCAタンパク質の骨格ねじれ角の系統特異的構造偏差の分析。

興味深いことに、FPDの病因に関わるすべてのヒト特有の突然変異はこの重要な領域に存在し、これは、この領域に強い選択と機能的制約が課されているため、この領域のいかなる変化も致命的であることを意味する。 1XQ8を用いた変異体モデルを重ね合わせると、A30PとH50Qでは脂質結合ドメインへの大きなシフトが、E46KとA53Tでは脂質結合ドメインとNACドメインに大きな変化が観察されることが確認された。 G51DはNAC領域のみ変化していた(補足図S4A,B参照)。 5つの変異型に共通して、32から58の領域が大きくずれていた。

さらに、SNCAのヒトパラログ間の構造の違いを調べるために、比較構造解析も行った。 ヒトSNCBとSNCGのNMR構造はこれまで報告されていないため、ヒトSNCA(1XQ8)のNMR構造を参考に構造をモデル化し、構造上のずれを評価した(補足図S5A,B参照)。 その結果、SNCBとSNCGの構造はN末端とNACドメインにおいてSNCAから大きく乖離していることがわかった(図4)。

figure4

N末端の脂質結合ドメインとNACドメインに、パラロガス特有の置換による大きな構造変化が観察された。 SNCA/Bの祖先は1回目の重複の後、19の変化を経験した。 SNCBは6回、SNCAは12回の置換を受けた。 ヒトSNCA(1XQ8)との比較では、乖離した残基が色分けされている。 構造的な偏差はRMSD値で評価した。

SNCAとSNCAIPのコイルドコイルドドメインとの相互作用の解析

この重要領域の重要性をさらに調べるために、その機能的意味を相互作用研究の助けを借りて解読することとした。 この目的のために、シンフィリン-1(SNCAIP)を検討した。シンフィリン-1のドメインアノテーションにより、10個のエキソン17でコードされる919 a.a(3745 bp)のタンパク質で、6個のアンキリン様反復配列と1個の中央コイルドコイルドドメイン(510-557)が包含されていることが判明した(図5a)。 SNCAIPはSNCA38のN-末端領域と相互作用することが生化学的およびNMR的手法により確認されている。 これらの相互作用パートナーの正常な細胞機能はまだ不明であるが、SNCAIPは発生的にシナプス末端に局在し、シナプス小胞との会合がSNCAによって調節されることが報告されている。 図5

図5

Schematic view (a) SNCAとSNCAIPタンパク質のドメイン構成. ヒトSNCAの主要機能ドメインおよびモチーフとヒトSNCAIPのコイルドコイルドドメインの比較組織。 タンパク質の長さはほぼ縮尺通りに描かれている。 ドメインとモチーフは色分けされている。 (b) ドッキングした複合体の解析と水素結合の相互作用。 サルオガセの祖先SNCAとSNCAIPのコイルドコイルドドメインの相互作用を表示(2KES)。 (c)ヒトSNCA(1XQ8)とヒトSNCAIPのコイルドコイルドドメインとの間の相互作用を示す。 注目領域(32-58)に存在する相互作用残基を色分けしている。 (d) SNCA-A30Pのモデル化変異体とヒトSNCAIPのコイルドコイルドドメインとの相互作用を示す。 点線は水素結合を示す。

相互作用における重要領域の役割を調べるために、ドッキング解析を行った。 その結果、SNCAとSNCAIPのコイルドコイルドドメインとの相互作用が時間の経過とともに進化していること、すなわち、系統特異的な相互作用が肉食動物の進化史の中で出現していることが明らかになった(図5b)。 ヒト特異的SNCAとSNCAIPのコイルドコイルドドメインとの相互作用解析の結果、ネコ科動物の根元では、Lys32、Tyr39、Lys45といった系統特異的相互作用はほとんど進化していないことがわかった(補足図S6、補足表S5を参照)。 興味深いことに、これらのヒト(カタルーニャ)特異的な相互作用は、同定された重要領域に存在しており、この領域の構造的・機能的重要性とFPD発症における重要な役割についての我々の仮説が強化された(図5c)。

ヒト特異的SNCAの変異体モデルとSNCAIPの相互作用解析では、野生型の相互作用の一部が保持される一方で、相互作用のパターンが変化していることがわかりました。 A30P-SNCAIPとE46K-SNCAIPのドッキング複合体では、相互作用が完全にNACドメインに移行していた。一方、H50Q-SNCAIPとG51D-SNCAIP複合体では、N末端とNACドメインが関わる相互作用に変化がみられた。 A53T-SNCAIPでは、相互作用は完全にN末端ドメインに限定されていたが、パターンが変化していることが分かった。 SNCAとSNCAIPの相互作用パターンが異なるために相互作用が変化し、その結果、SNCAの凝集に影響を与える結合親和性が変化したと考えられる(図5d、補足図S7、補足表S6参照)

コメントを残す

メールアドレスが公開されることはありません。