Abstract
Alternative splicing (AS) jest powszechnym procesem posttranskrypcyjnym w organizmach eukariotycznych, w którym z jednego genu powstaje wiele różnych funkcjonalnych transkryptów. Po opublikowaniu szkicu ludzkiego genomu okazało się, że liczba genów jest znacznie mniejsza niż przewidywano. Ze względu na jego potencjalną rolę w zwiększaniu różnorodności białek, zainteresowanie alternatywnym splicingiem wzrosło w ciągu ostatniej dekady. Chociaż ostatnie badania wykazały, że 94% ludzkich genów multieksonowych ulega AS, ewolucja AS, a tym samym jej potencjalna rola w funkcjonalnej innowacji w genomach eukariotycznych, pozostaje w dużej mierze niezbadana. W tym miejscu dokonujemy przeglądu dostępnych dowodów dotyczących ewolucji częstości występowania i roli funkcjonalnej AS. Dodatkowo podkreślamy potrzebę korekty silnego efektu pokrycia transkryptów w detekcji AS i przedstawiamy strategię, która pozwoli ostatecznie wyjaśnić zakres roli AS w innowacjach funkcjonalnych na skalę genomiczną.
1. Wprowadzenie
Pierwszy projekt sekwencji ludzkiego genomu został odsłonięty w lutym 2001 roku i zaskakująco okazało się, że zawiera on ~23000 genów, tylko ułamek liczby genów pierwotnie przewidywanych . Dla porównania, w genomie nicieni C. elegans znajduje się ~20 000 genów. Brak związku między liczbą genów a złożonością organizmu spowodował wzrost zainteresowania alternatywnym splicingiem (AS), ponieważ uznano, że jest on głównym czynnikiem zwiększającym złożoność regulacyjną i funkcjonalną, różnorodność białek i złożoność organizmu wyższych eukariontów. Jednakże, pomimo najlepszych wysiłków wielu grup badawczych, nadal niewiele wiemy na temat rzeczywistej roli AS w ewolucji innowacji funkcjonalnych, rozumianych jako pojawianie się nowych transkryptów funkcjonalnych, leżących u podstaw obserwowanej zwiększonej złożoności organizmów.
Alternatywny splicing jest procesem potranskrypcyjnym w organizmach eukariotycznych, w którym wiele różnych transkryptów jest produkowanych z jednego genu. Wcześniejsze badania z wykorzystaniem technologii sekwencjonowania o wysokiej wydajności wykazały, że do 92%~94% ludzkich genów multieksonowych ulega AS, często w sposób specyficzny dla danej tkanki/etapu rozwoju. Wraz z rozwojem i ciągłym ulepszaniem profilowania transkrypcji całego genomu oraz algorytmów bioinformatycznych, wszechobecność AS w genomie ssaków zaczęła stawać się jasna. Koncepcja jeden gen – jedno białko odeszła do lamusa, gdy pojawiły się dowody na wysoki odsetek występowania AS u gatunków innych niż człowiek, takich jak muszka owocowa, Arabidopsis i inne eukarionty. Pomimo postępu w naszym rozumieniu i charakterystyce ZZSK, kilka pytań pozostaje bez odpowiedzi. Po pierwsze, duża różnica w pokryciu transkryptów między gatunkami utrudnia bezpośrednie porównania częstości występowania alternatywnego splicingu u różnych gatunków. Po drugie, nawet gdyby udało się uzyskać porównywalne szacunki AS między gatunkami, nie jest jasne, w jakim stopniu zmiany w częstości występowania AS na przestrzeni ewolucji przyczyniły się do ogólnej różnorodności białek, czy raczej odzwierciedlają szum splicingowy. Wreszcie, bardzo niewiele wiemy o tym, jak AS ewoluowała w czasie i jak jest to związane z parametrami funkcjonalnymi genów. Tutaj dokonujemy przeglądu sposobu regulacji alternatywnego splicingu i ostatnich postępów w naszym zrozumieniu ewolucji alternatywnego splicingu.
2. Alternatywny splicing i jego regulacja
W 1977 roku Chow i wsp. donieśli, że 5′ i 3′ końcowe sekwencje kilku adenowirusowych 2 (Ad2) mRNA różniły się, sugerując nowy mechanizm generowania kilku różnych mRNA. Po tych badaniach alternatywny splicing stwierdzono również w genie koduj±cym hormon tarczycy – kalcytoninę w komórkach ssaków. Późniejsze badania ujawniły, że wiele innych genów również było w stanie wygenerować więcej niż jeden transkrypt poprzez wycięcie różnych odcinków ze swoich regionów kodujących (przegląd w ).
Zależnie od lokalizacji wyciętych segmentów egzonicznych – lub pozostawienia intronów – zdarzenia splicingowe można podzielić na cztery podstawowe typy (Rysunek 1). Te cztery główne tryby splicingu to: (1) pominięcie eksonu (2) zatrzymanie intronu (3) alternatywne 5′ miejsce splicingu (5′ss) oraz (4) alternatywne 3′ miejsce splicingu (3′ss). Ponadto, wzajemnie wykluczające się eksony, alternatywna inicjacja i alternatywna poliadenylacja zapewniają dwa inne mechanizmy generowania różnych izoform transkryptu. Co więcej, różne typy alternatywnego splicingu mogą zachodzić w sposób kombinatoryczny, a jeden ekson może podlegać więcej niż jednemu trybowi AS, na przykład 5′ss i 3′ss w tym samym czasie (Rysunek 1). Stwierdzono, że częstość występowania każdego typu AS jest różna u różnych taksonów. Kilka badań wykazało, że pomijanie eksonów jest powszechne w genomach metazoanów, podczas gdy retencja intronów jest najczęstszym typem AS wśród roślin i grzybów .
Różne typy alternatywnego splicingu. Niebieskie ramki to eksony konstytutywne, a na czerwono regiony splicowane alternatywnie. Introny są reprezentowane przez linie proste między ramkami. Zidentyfikowano cztery typy wspólnych zdarzeń splicingowych: (1) pominięcie eksonu (2) zatrzymanie intronu (3) alternatywne miejsce 5′ splicingu (5′ss), i (4) alternatywne miejsce 3′ splicingu (3′ss).
Alternatywny splicing jest ściśle regulowany przez elementy cis, jak również czynniki transaktywujące, które wiążą się z tymi elementami cis. Czynniki transaktywujące, głównie białka wiążące RNA, modulują aktywność spliceosomu i elementów cis, takich jak egzoniczne wzmacniacze splicingu (ESEs), egzoniczne tłumiki splicingu (ESSs), introniczne wzmacniacze splicingu (ISEs) i introniczne tłumiki splicingu (ISSs). Kanoniczny mechanizm AS sugeruje, że białka bogate w serynę/argininę (SR) wiążą się z ESEs, podczas gdy heterogenne jądrowe rybonukleoproteiny (hnRNP) wiążą się z ESSs lub ISSs. Ze względu na kluczow± rolę tych regulatorów w mechanizmach splicingu, znane s± mutacje cis i transaktywne, które zaburzaj± kod splicingu, powoduj±c choroby (przegląd w ). Oszacowano, że 15-60% mutacji wywołuje choroby poprzez wpływ na wzorzec splicingu genów ( i przejrzane w ). Ponadto wykazano również, że AS jest regulowany bez udziału pomocniczych czynników splicingowych, a AS może być również połączony z innymi zdarzeniami potranskrypcyjnymi, takimi jak wykorzystanie wielu wewnętrznych miejsc inicjacji translacji, redagowanie RNA, rozpad mRNA oraz wiązanie mikroRNA i innych niekodujących RNA, co sugeruje istnienie dodatkowych niekanonicznych mechanizmów AS, które nie zostały jeszcze zidentyfikowane.
Ostatnio doniesiono o bezpośredniej roli modyfikacji histonów w alternatywnym splicingu, w którym modyfikacja histonów (H3-K27m3) wpływa na wynik splicingu poprzez wpływ na rekrutację regulatorów splicingu za pośrednictwem białka wiążącego chromatynę w wielu ludzkich genach, takich jak FGFR2,TPM2,TPM1 i PKM2 . Ponadto stwierdzono, że pauzowanie polimerazy RNA II promowane przez CTCF łączy metylację DNA ze splicingiem, dostarczając pierwszych dowodów na rozwojową regulację wyniku splicingu poprzez dziedziczne znaki epigenetyczne. Ponadto, niekodujące RNA również okazały się kluczowymi czynnikami determinującymi alternatywne wzorce splicingu. Dlatego wyniki te ujawniają dodatkową warstwę epigenetyczną w regulacji transkrypcji i alternatywnego splicingu. Zaproponowano zatem przeprowadzenie genomowych badań genetycznych i epigenetycznych w co najmniej 100 specyficznych typach komórek krwi, które dostarczą wysokiej jakości referencyjnych epigenomów (przy użyciu metylacji DNA i oznaczeń histonów) wraz ze szczegółowymi danymi genetycznymi i transkryptomowymi (sekwencjonowanie całego genomu, RNA-Seq i miRNA-Seq), zapewniając nam możliwość oceny genomowego wpływu czynników epigenetycznych w regulacji AS w specyficznych typach komórek krwi. Spodziewamy się, że powstanie epigenetyki porównawczej zapewni inną perspektywę ewolucji transkryptomu.
3. Identyfikacja alternatywnych zdarzeń splicingowych
Alternatywny splicing jest trudny do oszacowania na podstawie samych parametrów genomowych. Odkryto wiele motywów regulacyjnych dla AS, ale obecność znanych motywów alternatywnego splicingu nie gwarantuje, że gen jest rzeczywiście alternatywnie splicowany. Tak więc, wzorce alternatywnego splicingu są zazwyczaj oceniane na podstawie analizy danych transkryptów. Dla każdego interesującego nas genu, alternatywny splicing może być zidentyfikowany przy użyciu reakcji łańcuchowej polimerazy z odwrotną transkrypcją (RT-PCR) przeprowadzonej na bibliotece komplementarnego DNA (cDNA). W ostatniej dekadzie, wraz z rozwojem technologii transkryptomowych o wysokiej wydajności, możliwa stała się ocena wzorców alternatywnego splicingu w skali całego genomu. Trzy główne źródła danych transkryptomu zostały wykorzystane do oceny wzorców splicingu: znaczniki sekwencji wyrażonych (ESTs), mikromacierze połączeń splice-junction i sekwencjonowanie RNA (RNA-Seq).
Pierwsza fala genomowej analizy transkryptomu polegała na bezpośrednim sekwencjonowaniu cDNA i EST przeprowadzonym na dużą skalę , co pozwoliło na identyfikację alternatywnych zdarzeń splicingowych poprzez wyrównanie sekwencji cDNA/EST do genomu referencyjnego. ESTs to nieedytowane, losowo wybrane jednoprzebiegowe odczyty sekwencji o długości 200-800 zasad nukleotydowych, pochodzące z bibliotek cDNA. Obecnie w dbEST znajduje się osiem milionów EST dla człowieka, w tym około miliona sekwencji z tkanek nowotworowych, oraz około 71 milionów EST dla około 2000 gatunków. EST są jednak oparte na sekwencjonowaniu Sangera o niskiej wydajności i są agregowane w szerokim zakresie tkanek, stanów rozwojowych i chorób przy użyciu bardzo różnych poziomów czułości.
Ostatnio mikromacierze splice-junction i RNA-Seq były coraz częściej wykorzystywane do ilościowej analizy alternatywnych zdarzeń splicingowych. Mikromacierze splicingowe celują w specyficzne eksony lub połączenia ekson-ekson z sondami oligonukleotydowymi. Intensywność fluorescencji poszczególnych sond odzwierciedla względne wykorzystanie alternatywnie splicingowanych eksonów w różnych tkankach i liniach komórkowych. Mikromacierze połączeń splice-junction o dużej gęstości są opłacalnym sposobem badania wcześniej poznanych eksonów i zdarzeń AS z niskim odsetkiem wyników fałszywie dodatnich. Wadą tego rozwiązania jest to, że wymaga ono wcześniejszej znajomości istniejących wariantów AS i struktury genów. Co ważniejsze, w przeciwieństwie do RNA-Seq i EST, mikromacierze nie dostarczają dodatkowych informacji o sekwencji.
RNA-Seq wyłonił się jako potężna technologia do analizy transkryptomu ze względu na swoją zdolność do produkcji milionów krótkich odczytów sekwencji. Eksperymenty RNA-Seq dostarczają dogłębnych informacji na temat krajobrazu transkrypcyjnego. Stale rosnąca akumulacja danych o wysokiej wydajności będzie nadal zapewniać coraz bogatsze możliwości badania dalszych aspektów ZZSK, takich jak zdarzenia ZZSK o niskiej częstotliwości, jak również zdarzenia ZZSK specyficzne dla tkanki i/lub rozwoju. Wcześniejsze zestawy danych składają się z sekwencji odczytów RNA o długości 50 bp lub mniejszej, co ogranicza informacje o kombinacjach zdarzeń AS w pojedynczym transkrypcie, ale jest prawdopodobne, że długość krótkich odczytów będzie nadal rosła w ciągu następnej dekady. Wraz z rosnącą wydajnością sekwencjonowania następnej generacji (RNA-Seq) badania nad alternatywnym doprawianiem prawdopodobnie przejdą rewolucję. Większa głębokość sekwencjonowania transkryptomów u ludzi i innych gatunków zwiększyła nasze zrozumienie występowania zdarzeń AS i wzorców ekspresji AS w różnych tkankach, etapach rozwoju.
Transcript assembly of sequence-based technologies, such as ESTs and RNA-Seq, can use either align-then-assemble or assemble-then-align, depending on the quality of reference genome and sequence data . Algorytm może być zastosowany do wykrywania zdarzeń AS poprzez porównywanie różnych transkryptów. Jednakże, wykrywanie izoform AS, w przeciwieństwie do pojedynczego przypadku AS, jest nadal trudne, ponieważ krótkie sekwencje dostarczają niewiele informacji na temat kombinacji eksonów. Kilka aplikacji zostało opracowanych do składania transkryptów i wykrywania izoform AS, różne strategie i porównanie tych aplikacji zostały przejrzane wcześniej .
4. Prevalence of Alternative Splicing across Eukaryotic Genomes
Wstępne analizy całego genomu sugerowały, że 5%-30% ludzkich genów było alternatywnie splicowanych (przejrzane w ). Bazy danych AS oparte na EST identyfikują przypadki AS w 40-60% ludzkich genów; jednak ostatnio liczba ta była wielokrotnie weryfikowana, a najnowsze szacunki wskazują, że aż 94% ludzkich genów multieksonowych wytwarza więcej niż jeden transkrypt w wyniku alternatywnego splicingu. Zrozumienie, w jaki sposób alternatywny splicing zmieniał się w czasie, może dostarczyć wiedzy na temat wpływu alternatywnego splicingu na różnorodność transkryptów i białek oraz ewolucję fenotypów. U grzybów AS jest uważany za rzadki ze względu na niską liczbę eksonów w drożdżach. W roślinach szacuje się, że około 20% genów ulega AS na podstawie danych EST, jednak ostatnie badania z wykorzystaniem RNA-Seq sugerują, że co najmniej około 42% genów zawierających introny w Arabidopsis ulega alternatywnemu splicingowi. Spodziewamy się, że znacznie wyższy procent występowania AS zostanie odkryty u różnych eukariotów, biorąc pod uwagę trwające dogłębne badania transkryptomu przy użyciu sekwencjonowania następnej generacji, takie jak RNA-Seq. W kilku badaniach podjęto próbę porównania częstości występowania ZZN wśród różnych taksonów, przy czym generalnie stwierdzono, że zwierzęta mają wyższą częstość występowania ZZN niż rośliny, a kręgowce mają wyższą częstość występowania ZZN niż bezkręgowce. Jednakże badania te są albo oparte na ograniczonych danych, albo nie udało się skorygować różnic w pokryciu transkryptów .
Istnieje pewna liczba baz danych, które dostarczają danych na temat AS dla wielu gatunków. Jednak te istniejące zasoby koncentrują się głównie na gatunkach zwierząt i mają słabe pokrycie genomów protistów, grzybów i roślin, co utrudnia porównywanie rozbieżnych taksonów. Co najważniejsze, żaden z tych zasobów nie bierze pod uwagę dobrze udokumentowanych efektów zróżnicowanego pokrycia transkryptów przez geny w obrębie i pomiędzy gatunkami, co znacznie wpływa na wskaźniki wykrywalności AS. Wykorzystano losowe pobieranie próbek i wykazano, że minimalizuje ono tendencyjność pokrycia transkryptów (Rysunek 2). Oczekujemy, że podobne strategie zostaną zastosowane w przyszłych zasobach danych porównawczych AS.
(a)
(b)
(a)
(b)
Całkowita liczba transkryptów wpływa na wykrywanie AS, ale błąd można skorygować stosując metodę próbkowania. Wykrywanie AS w genach podzielonych przez pokrycie transkryptów dla nicieni (a i b) przy użyciu pełnego zestawu danych transkryptów (a) lub metody losowego próbkowania (b).
5. Czy alternatywne rozszczepianie jest funkcjonalne czy to tylko szum?
Jeśli wzrost poziomu AS u kręgowców w porównaniu do bezkręgowców zostanie potwierdzony, biorąc pod uwagę ograniczenia obecnych zasobów proteomiki, trudno jest ocenić, w jakim stopniu alternatywnie splicowane transkrypty są tłumaczone na rozszerzony proteom. Ewolucji wielu fenotypów, które najbardziej kojarzymy z człowiekiem, takich jak dłuższe życie, encefalizacja, a nawet zwiększona złożoność, towarzyszyły gwałtowne redukcje efektywnej wielkości populacji, być może wyjaśniające rozprzestrzenianie się różnych cech genomicznych w bardziej złożonych organizmach ( ale patrz ). Dlatego możliwe jest, że zwiększona AS na drodze ewolucji wynika z aberrantnego splicingu i dlatego nie odgrywa żadnej funkcjonalnej roli . Jeśli alternatywny splicing wzrósł wzdłuż drzewa filogenetycznego i jest on rzeczywiście funkcjonalny, możemy oczekiwać następujących rzeczy.(A) Transkrypty powinny mieć niską częstość występowania przedwczesnych kodonów stop, co uczyniłoby je podatnymi na nonsensowny mediowany rozpad. Między 4% a 35% ludzkich transkryptów AS zawiera kodon przedwczesnego zakończenia w transkryptach ludzkich i mysich. Stwierdzono, że transkrypty te są wzbogacone w niekonserwowane eksony, które mogą powodować przesunięcia ramki. Nie wiadomo, czy proporcja transkryptów AS zawierających kodon przedwczesnego zakończenia zmieniała się wzdłuż drzewa filogenetycznego.(B) Zaproponowano, że większość alternatywnych izoform o niskiej liczbie kopii wytwarzanych w komórkach ludzkich jest prawdopodobnie niefunkcjonalna. Ostatnie badania wykazały, że chociaż można znaleźć specyficzne dla nowotworów warianty alternatywnego splicingu, są one w większości przypadków występujące jako pojedyncze kopie, a zatem jest mało prawdopodobne, aby przyczyniały się do głównego transkryptomu nowotworu.(C) Zachowanie alternatywnego splicingu wzdłuż ewolucji można uznać za wskaźnik ich funkcjonalnej roli. Poziomy zachowania AS były badane u wielu gatunków. Szacunki wahają się od 11% do 67% między człowiekiem a myszą. Warto zauważyć, że główne formy AS charakteryzują się wyższym poziomem zachowania w porównaniu z formami mniejszymi. Z drugiej strony, konserwowane formy AS różnią się pomiędzy różnymi AS; na przykład, pomijanie eksonów pomiędzy C. elegans i C. briggsae wykazało ponad 81% poziom konserwacji, w porównaniu do 28% dla retencji intronów.(D) Obecność identyfikowalnych domen funkcjonalnych w obszarach AS może być również wskaźnikiem znaczenia funkcjonalnego transkryptów AS. Według naszej najlepszej wiedzy nie ma doniesień na temat występowania domen funkcjonalnych w obszarach AS u gatunków modelowych. Aby zbadać obecność domen funkcjonalnych w transkryptach AS, skompilowaliśmy zestaw 267 996 zdarzeń AS uzyskanych z analizy 8 315 254 ESTs z prawidłowych tkanek ludzkich. Stwierdziliśmy, że około 50% obszarów AS u człowieka zawiera znane komponenty funkcjonalne przy użyciu InterProScan, który zawiera 14 aplikacji do przewidywania domen białkowych (Figura 3, patrz metody w ), sugerując możliwą funkcjonalną rolę AS. Zakres różnic w częstości występowania domen funkcjonalnych wśród obszarów AS między gatunkami pozostaje do zbadania, ale dostarczyłby dodatkowych spostrzeżeń na temat ewolucji AS.
Odsetek obszarów AS zawierających możliwe do zidentyfikowania domeny funkcjonalne, struktury drugorzędowe i kodony stop u człowieka. Składniki funkcjonalne zostały zidentyfikowane przy użyciu InterProScan, który zawiera 14 aplikacji do przewidywania domen białkowych, w tym Pfam do przewidywania domen białkowych, SignalP 3.0 do przewidywania peptydów sygnałowych i TMHMM do przewidywania domen transmembranowych. PSORT II został użyty do identyfikacji prawdopodobnej lokalizacji subkomórkowej produktów białkowych. Wtórne struktury białek przewidywano za pomocą CLC Main Workbench 5.7, który bazuje na wyodrębnionych sekwencjach białek z banku danych białek (http://www.rcsb.org/pdb/).
Powyższe obserwacje sugerują, że chociaż alternatywne splicingi są rzeczywiście konserwowane w toku ewolucji, to znaczna ich część nie jest, a niektóre z nich mogą wynikać z hałaśliwego splicingu transkryptów, nie przyczyniając się do powstania puli białek. Jednakże, dopóki nie zostaną przeprowadzone dalsze badania z użyciem porównywalnych wskaźników AS, niemożliwe będzie oszacowanie stopnia, w jakim wzrost poziomu AS wzdłuż drzewa filogenetycznego wpłynął na pulę funkcjonalnych transkryptów.
6. Alternative Splicing and Gene Duplication
Duplikacja genów (GD) jest uważana za główne źródło innowacji funkcjonalnych w genomie. Nowo zduplikowane geny mogą ewoluować w kierunku funkcjonalnej dywergencji i uważa się, że jest to klucz do ewolucji złożoności rozwojowej i morfologicznej u kręgowców. Alternatywny splicing, jako powszechny mechanizm, który również zwiększa różnorodność białek, został zaproponowany jako potencjalny gracz w ewolucji eukariotów. Badając związek między duplikacją genów a alternatywnym splicingiem, możemy lepiej zrozumieć, w jakim stopniu oba mechanizmy są równoważnymi środkami różnicowania białek. W kilku badaniach odnotowano ujemną korelację między AS a wielkością rodziny genów u ludzi, myszy i robaków (Tabela 1). Łatwo można dojść do wniosku, że AS i GD są wymienne i istnieje uniwersalna ujemna korelacja od robaka do człowieka. Jednak związek między tymi dwiema zmiennymi jest w najlepszym przypadku marginalny i nie jest spójny, gdy uwzględni się geny singletonowe, które mają niższy poziom AS w porównaniu z rodzinami wielogenowymi. Jin i wsp. zasugerowali, że geny singletonowe mają więcej ewolucyjnych zwężeń niż duplikaty, co utrudnia im uzyskanie izoformy AS. Zgodnie z tą hipotezą Lin i wsp. stwierdzili, że geny singletonowe różnią się od rodzin wielogenowych w kilku aspektach, co sugeruje, że mają one różne ścieżki ewolucyjne. Nawet jeśli skupimy się tylko na rodzinach wielogenowych, ujemna korelacja między AS a wielkością rodziny genów może być wyjaśniona lub być produktem ubocznym kowariancji AS i wielkości rodziny genów z innymi czynnikami. Na przykład, wiek genu i tendencyjna duplikacja zostały zaproponowane jako wyjaśnienie . Badanie to poddało w wątpliwość związek między AS i GD i może rzeczywiście zapewnić wsparcie dla sugestii, że AS i GD mają niewielką lub żadną równoważność dotyczącą wpływu na sekwencję, strukturę i funkcję białka. Ponieważ większość badań dotyczyła niewielkiej liczby gatunków modelowych, trudno jest ocenić zakres związku między AS i GD. Ponadto migawkowe podejście polegające na porównywaniu GFS i AS w jednym genomie może ukrywać prawdziwy związek między AS i GFS.
|
7. Alternative Splicing’s Contribution to Functional Innovation
Alternative splicing został okrzyknięty brakującym źródłem informacji w genomie odpowiadającym za ewolucję wyższej złożoności pomimo niemal statycznej liczby genów u metazoanów w ciągu ostatnich 800 milionów lat. Wegmann i wsp. stwierdzili, że szerokość ekspresji genów jest pozytywnie skorelowana z liczbą nowych izoform transkryptów i zaproponowali, że wzrost szerokości ekspresji genów jest niezbędny do pozyskiwania nowych izoform transkryptów, co może być utrzymywane przez nową formę selekcji równoważącej. Co więcej, analizy eksperymentalne i bioinformatyczne wykazały, że AS może generować różnorodne funkcjonalne mRNA i produkty białkowe, wykazujące odmienne właściwości stabilności, lokalizację subkomórkową i funkcję, a także w specyficznych etapach różnicowania komórek, różnicowania płciowego i rozwoju .
Badania pojedynczego genu dostarczyły przykładów, w których alternatywne splicing może prowadzić do innowacji funkcjonalnych, zanim jakiekolwiek zdarzenia duplikacji genu miały miejsce. Jednym z takich przykładów jest ten z Troponiny I (TnI), która odgrywa kluczową rolę w skurczu mięśni. W genomie kręgowców TnI występuje w trzech kopiach, z których każda ulega ekspresji w innym typie mięśnia (szkieletowym, szybkim i wolnym oraz sercowym). U Ciona, jednego z najbliższych krewnych kręgowców, TnI występuje jako pojedynczy gen. Co ciekawe jednak, gen Ciona produkuje trzy różne alternatywnie splicowane izoformy, z których każda przypomina profil ekspresji jednego z genów kręgowców, co sugeruje, że specjalizacja białek TnI do funkcjonowania w każdym typie mię¶ni poprzedziła duplikację genów. Ten wzór alternatywnych wariantów splicingowych w przodkach pojedynczych genów przypominających profile ekspresji genów później zduplikowanych został również znaleziony w genach synapsyny-2 u czworonogów i genach MITF u ryb teleostatycznych. Przykłady te sugerują, że alternatywny splicing może być mechanizmem innowacji funkcjonalnej poprzedzającej duplikację genów jedną z trzech możliwych dróg (Ryc. 4).
(a) Degeneracja sygnału splicingowego
(b) Egzonizacja niekodującegokodującego DNA lub transpozonów
(c) Duplikacja egzonów i specjalizacja izoform
(a) Degeneracja sygnału splicingu
(b) Egzonizacja niekodującego DNA lub transpozonów
(c) Duplikacja egzonów i specjalizacja izoform
Nowe warianty AS mogą przyjmować wyspecjalizowane lub nowe role. Nowe warianty splicingowe mogą powstać w wyniku (a) mutacji w miejscu rozpoznawania egzonu konstytutywnego i późniejszego nabycia elementów regulacyjnych AS. (b) eksonizacji intronów, regionów intronowych lub elementów transpozycyjnych z następowym nabyciem regionów regulatorowych AS. Nowe białka mogą oddziaływać z różnymi białkami lub lokalizować się w różnych regionach subkomórkowych. (c) Duplikacja eksonu i następująca po niej specjalizacja domen funkcjonalnych i regionów regulatorowych AS. Wynikające z tego wyspecjalizowane białka mogą przyjmować częściowe role istotne w różnych typach komórek lub etapach rozwoju lub skutkować nowymi interakcjami i funkcjami.
Geny mogą również dalej zyskiwać alternatywny splicing i regulację po duplikacji wraz ze złożonością systemów organowych po dywergencji protochordatów i kręgowców. Porównanie czynników transkrypcyjnych genów Pax u kręgowców i amfiplazm wykazało, że co najmniej 52 zgłoszone zdarzenia alternatywnego splicingu u kręgowców w porównaniu do 23 zdarzeń u amfiplazm. Ponadto, geny Pax kręgowców zachowały większość swoich funkcji rodowych, a także rozszerzyły swoją ekspresję. Wykazano, że nowy alternatywny splicing genów Pax może modyfikować zawartość domen funkcjonalnych (np. wiązanie DNA) i zdolności transaktywacyjne powstałych produktów białkowych. Na przykład, nowy alternatywny transkrypt Pax3 może transaktywować konstrukt reporterowy cMET u myszy. Zaproponowano, że te dodatkowe izoformy Pax3 odgrywają funkcjonalną rolę w nabywaniu nowych ról na płytce neuronalnej u kręgowców. Podobnie, specyficzne dla kręgowców zdarzenia AS eksonu 5a w Pax4 i Pax6 zostały powiązane z funkcjonalnymi rolami w rozwoju oka kręgowców. Dlatego uzasadnione jest postawienie hipotezy, że oprócz duplikacji genów, alternatywny splicing odgrywa ważną rolę w nabywaniu nowych funkcji, przyczyniając się do złożoności układów narządów po rozejściu się protochrzęstnych i kręgowców. Potencjalne role rosnącej częstości występowania AS u kręgowców w innowacjach funkcjonalnych będą w dużej mierze badane w większej liczbie rodzin genów lub na poziomie genomu w przyszłości, co pogłębi nasze zrozumienie tego, w jaki sposób AS przyczynia się do innowacji funkcjonalnych.
8. Wnioski
W tym miejscu dokonaliśmy przeglądu dowodów z badań genomowych, jak również możliwych dróg dla przyszłych badań porównawczych dla potencjału alternatywnego splicingu jako źródła innowacji funkcjonalnych podczas ewolucji genomu eukariotycznego. Chociaż jest już jasne, że AS jest powszechny w ludzkim genomie, nadal istnieją przeszkody w ocenie, jak alternatywny splicing ewoluował w czasie. Główna przeszkoda polega na tym, że podczas gdy większość innych cech genomu może być bezpośrednio zmierzona lub oszacowana na podstawie samych sekwencji genomowych, nie można uzyskać dokładnych oszacowań alternatywnego splicingu na podstawie analizy sekwencji genomowych. Poleganie na dostępności sekwencji transkryptów do pomiaru AS wraz z silną tendencyjnością wynikającą z nierównomiernego pokrycia transkryptów utrudnia genomową ocenę AS u wszystkich, poza kilkoma modelowymi, gatunków i utrudnia bezpośrednie porównania między gatunkami. Spowolniło to badania nad tym, jak alternatywny splicing ewoluował w czasie, jak AS jest regulowany i jak może być powiązany z innymi cechami genomicznymi, a przede wszystkim z fenotypem. Stale rosnące profilowanie transkryptów u wielu gatunków w połączeniu z zastosowaniem porównywalnych szacunków indeksów pozwoli odpowiedzieć na szereg pytań ewolucyjnych dotyczących ewolucji AS i jej implikacji dla ewolucji różnorodności transkryptów i innowacji funkcjonalnych.
Konflikt interesów
Autorzy nie zgłaszają konfliktu interesów.
Podziękowania
Autorzy pragną podziękować Humberto Gutierrezowi za komentarze do wcześniejszych wersji tej pracy. Praca ta była finansowana przez UK-China Scholarship for Excellence i University of Bath Research Studentship dla L. Chen, CONACyT Scholarship dla J. M. Tovar-Corona oraz Royal Society Dorothy Hodgkin Research Fellowship, Royal Society Research Grant, and Royal Society Research Grant for Fellows dla A. O. Urrutia.