Alternatives Spleißen: Eine potenzielle Quelle funktioneller Innovation im eukaryontischen Genom

Abstract

Alternatives Spleißen (AS) ist ein in eukaryontischen Organismen weit verbreiteter posttranskriptiver Prozess, bei dem aus einem einzigen Gen mehrere unterschiedliche funktionelle Transkripte entstehen. Die Veröffentlichung des Entwurfs des menschlichen Genoms ergab eine viel geringere Anzahl von Genen als erwartet. Aufgrund seiner potenziellen Rolle bei der Erweiterung der Proteinvielfalt hat das Interesse am alternativen Spleißen in den letzten zehn Jahren zugenommen. Obwohl neuere Studien gezeigt haben, dass 94 % der menschlichen Multiexon-Gene alternativ gespleißt werden, ist die Evolution des alternativen Spleißens und damit seine potenzielle Rolle bei der funktionellen Innovation in eukaryontischen Genomen noch weitgehend unerforscht. In diesem Beitrag werden die verfügbaren Erkenntnisse über die Evolution der AS-Prävalenz und ihre funktionelle Rolle zusammengefasst. Darüber hinaus betonen wir die Notwendigkeit, den starken Effekt der Transkriptabdeckung bei der Erkennung von AS zu korrigieren, und stellen eine Strategie vor, um letztendlich das Ausmaß der Rolle von AS bei der funktionellen Innovation auf genomischer Ebene aufzuklären.

1. Einleitung

Der erste Entwurf der menschlichen Genomsequenz wurde im Februar 2001 veröffentlicht, und überraschenderweise stellte sich heraus, dass er ~23000 Gene enthält, nur einen Bruchteil der ursprünglich vorhergesagten Anzahl von Genen. Zum Vergleich: Das Genom des Fadenwurms C. elegans enthält etwa 20.000 Gene. Das Fehlen eines Zusammenhangs zwischen der Anzahl der Gene und der Komplexität des Organismus hat zu einem verstärkten Interesse an alternativem Spleißen (AS) geführt, da man davon ausgeht, dass es ein wichtiger Faktor für die Ausweitung der regulatorischen und funktionellen Komplexität, der Proteinvielfalt und der Komplexität des Organismus höherer Eukaryonten ist. Trotz der Bemühungen vieler Forschungsgruppen wissen wir jedoch immer noch sehr wenig über die tatsächliche Rolle, die AS bei der Evolution funktioneller Innovationen – hier verstanden als das Auftreten neuartiger funktioneller Transkripte – spielt, die der beobachteten erhöhten Komplexität der Organismen zugrunde liegen.

Alternatives Spleißen ist ein posttranskriptiver Prozess in eukaryontischen Organismen, durch den mehrere unterschiedliche Transkripte aus einem einzigen Gen entstehen. Frühere Studien mit Hochdurchsatz-Sequenzierungstechnologie haben berichtet, dass bis zu 92-94 % der menschlichen Multiexon-Gene AS durchlaufen, oft in einer gewebe- und entwicklungsstadienspezifischen Weise. Mit der Entwicklung und ständigen Verbesserung von Transkriptionsprofilen für das gesamte Genom und bioinformatischen Algorithmen wurde die Allgegenwart von AS im Säugetiergenom immer deutlicher. Das Konzept „ein Gen – ein Protein“ trat in den Hintergrund, als sich die Beweise für das häufige Vorkommen von AS bei nicht menschlichen Arten wie der Fruchtfliege, Arabidopsis und anderen Eukaryoten häuften. Trotz der Fortschritte im Verständnis und in der Charakterisierung von AS bleiben mehrere Fragen unbeantwortet. Erstens hat der große Unterschied in der Transkriptabdeckung zwischen den Arten direkte Vergleiche der Prävalenz des alternativen Spleißens in verschiedenen Arten erschwert. Zweitens: Selbst wenn vergleichbare AS-Schätzungen zwischen den Arten möglich wären, ist unklar, inwieweit Veränderungen in der AS-Prävalenz im Laufe der Evolution zur allgemeinen Proteinvielfalt beigetragen haben oder eher ein Spleißrauschen widerspiegeln. Schließlich wissen wir nur sehr wenig darüber, wie sich AS im Laufe der Zeit entwickelt hat und wie dies mit den funktionellen Parametern von Genen zusammenhängt. Hier geben wir einen Überblick über die Regulierung des alternativen Spleißens und die jüngsten Fortschritte in unserem Verständnis der Evolution des alternativen Spleißens.

2. Alternatives Spleißen und seine Regulierung

Im Jahr 1977 berichteten Chow et al., dass die 5′- und 3′-Terminalsequenzen mehrerer Adenovirus 2 (Ad2)-mRNAs variierten, was auf einen neuen Mechanismus für die Erzeugung mehrerer unterschiedlicher mRNAs hindeutet. Im Anschluss an diese Studie wurde auch im Gen für das Schilddrüsenhormon Calcitonin in Säugetierzellen alternatives Spleißen festgestellt. Spätere Studien zeigten, dass auch viele andere Gene in der Lage sind, mehr als ein Transkript zu erzeugen, indem sie verschiedene Abschnitte aus ihren kodierenden Regionen herausschneiden (nachzulesen in ).

Abhängig von der Lage der herausgeschnittenen exonischen Segmente – oder wenn Introns belassen werden – lassen sich die Spleißvorgänge in vier Grundtypen einteilen (Abbildung 1). Diese vier Hauptarten des Spleißens sind (1) Exon-Skipping, (2) Intron-Retention, (3) alternative 5′-Spleißstellen (5′ss) und (4) alternative 3′-Spleißstellen (3′ss). Darüber hinaus bieten wechselseitig exklusive Exons, alternative Initiation und alternative Polyadenylierung zwei weitere Mechanismen zur Erzeugung verschiedener Transkript-Isoformen. Darüber hinaus können verschiedene Arten des alternativen Spleißens auf kombinatorische Weise auftreten, und ein Exon kann mehr als einem AS-Modus unterliegen, z. B. 5′ss und 3′ss zur gleichen Zeit (Abbildung 1). Es wurde festgestellt, dass die Prävalenz der einzelnen AS-Typen in den verschiedenen Taxa unterschiedlich ist. Mehrere Studien haben gezeigt, dass Exon-Skipping in Genomen von Metazoen häufig vorkommt, während Intron-Retention die häufigste Art von AS bei Pflanzen und Pilzen ist.

Abbildung 1

Unterschiedliche Arten von alternativem Spleißen. Die blauen Kästen sind konstitutive Exons und alternativ gespleißte Regionen in rot. Introns sind durch gerade Linien zwischen den Kästen dargestellt. Es wurden vier Arten von gemeinsamen Spleißereignissen identifiziert: (1) Exon-Skipping, (2) Intron-Retention, (3) alternative 5′-Spleißstelle (5′ss) und (4) alternative 3′-Spleißstelle (3′ss).

Alternatives Spleißen wird durch cis-Elemente sowie durch transagierende Faktoren, die an diese cis-Elemente binden, streng reguliert. Transacting-Faktoren, hauptsächlich RNA-bindende Proteine, modulieren die Aktivität des Spleißosoms und der cis-Elemente wie exonische Spleiß-Enhancer (ESEs), exonische Spleiß-Silencer (ESSs), intronische Spleiß-Enhancer (ISEs) und intronische Spleiß-Silencer (ISSs). Der kanonische Mechanismus von AS legt nahe, dass Serin/Arginin-reiche (SR) Proteine typischerweise an ESSs binden, während heterogene nukleare Ribonukleoproteine (hnRNP) dazu neigen, an ESSs oder ISSs zu binden. Angesichts der entscheidenden Rolle dieser Regulatoren in der Spleißmaschinerie sind Cis- und Transaktormutationen, die den Spleißcode stören, als krankheitsverursachend bekannt (Übersicht in ). Man schätzt, dass 15-60 % der Mutationen Krankheiten verursachen, weil sie das Spleißmuster von Genen beeinträchtigen ( und nachzulesen in ). Darüber hinaus hat sich gezeigt, dass AS auch ohne die Beteiligung von Hilfsspleißfaktoren reguliert wird, und AS kann auch mit anderen posttranskriptionellen Ereignissen wie der Nutzung mehrerer interner Translationsinitiationsstellen, RNA-Editierung, mRNA-Zerfall und microRNA-Bindung und anderen nichtcodierenden RNAs kombiniert werden, was auf die Existenz zusätzlicher nichtkanonischer Mechanismen von AS hindeutet, die noch identifiziert werden müssen.

In jüngster Zeit wurde über eine direkte Rolle von Histonmodifikationen beim alternativen Spleißen berichtet, wobei die Histonmodifikation (H3-K27m3) das Spleißergebnis beeinflusst, indem sie die Rekrutierung von Spleißregulatoren über ein chromatinbindendes Protein in einer Reihe von menschlichen Genen wie FGFR2, TPM2, TPM1 und PKM2 beeinflusst. Darüber hinaus wurde berichtet, dass das von CTCF geförderte Pausieren der RNA-Polymerase II die DNA-Methylierung mit dem Spleißen verbindet, was den ersten Beweis für eine entwicklungsbedingte Regulierung des Spleißergebnisses durch vererbbare epigenetische Markierungen liefert. Darüber hinaus haben sich auch nicht-kodierende RNAs als Schlüsselfaktoren für alternative Spleißmuster erwiesen. Daher zeigen diese Ergebnisse eine zusätzliche epigenetische Ebene bei der Regulierung der Transkription und des alternativen Spleißens auf. Daher wurden genomweite genetische und epigenetische Studien an mindestens 100 spezifischen Blutzelltypen vorgeschlagen, die qualitativ hochwertige Referenz-Epigenome (unter Verwendung von DNA-Methylierungs- und Histonmarkierungstests) mit detaillierten genetischen und Transkriptomdaten (Ganzgenomsequenzierung, RNA-Seq und miRNA-Seq) liefern und uns die Möglichkeit geben, den genomweiten Einfluss epigenetischer Faktoren bei der Regulierung von AS in spezifischen Blutzelltypen zu bewerten. Wir erwarten, dass der Aufstieg der vergleichenden Epigenetik eine andere Perspektive auf die Evolution des Transkriptoms bieten wird.

3. Identifizierung alternativer Spleißereignisse

Alternatives Spleißen lässt sich nur schwer allein anhand genomischer Parameter abschätzen. Es wurde eine Reihe von regulatorischen Motiven für AS aufgedeckt, aber das Vorhandensein bekannter alternativer Spleißmotive ist keine Garantie dafür, dass ein Gen tatsächlich alternativ gespleißt wird. Daher werden alternative Spleißmuster im Allgemeinen anhand der Untersuchung von Transkriptdaten bewertet. Für jedes Gen von Interesse können alternative Spleißereignisse mit Hilfe der reversen Transkriptions-Polymerase-Kettenreaktion (RT-PCR) identifiziert werden, die mit einer Bibliothek komplementärer DNA (cDNA) durchgeführt wird. Mit der Verbesserung der Transkriptomtechnologien mit hohem Durchsatz ist es in den letzten zehn Jahren möglich geworden, alternative Spleißmuster auf genomweiter Ebene zu bewerten. Drei Hauptquellen von Transkriptomdaten wurden zur Bewertung von Spleißmustern verwendet: ESTs (expressed sequence tags), Mikroarrays für Spleißverbindungen und RNA-Sequenzierung (RNA-Seq).

Die erste Welle der genomweiten Transkriptomanalyse bestand in der direkten Sequenzierung von cDNA und ESTs, die in großem Maßstab durchgeführt wurde und die Identifizierung alternativer Spleißereignisse durch Ausrichtung von cDNA/EST-Sequenzen am Referenzgenom ermöglichte. ESTs sind 200-800 Nukleotidbasen lange, unbearbeitete, zufällig ausgewählte Single-Pass-Sequenz-Reads, die aus cDNA-Bibliotheken stammen. Derzeit gibt es acht Millionen ESTs für den Menschen, darunter etwa eine Million Sequenzen aus Krebsgeweben, und etwa 71 Millionen ESTs für rund 2000 Arten in dbEST . Die ESTs basieren jedoch auf Sanger-Sequenzierung mit geringem Durchsatz und werden über eine Vielzahl von Geweben, Entwicklungsstadien und Krankheiten mit sehr unterschiedlicher Empfindlichkeit aggregiert.

In jüngster Zeit werden zunehmend Spleiß-Mikroarrays und RNA-Seq zur quantitativen Analyse alternativer Spleißvorgänge eingesetzt. Spleiß-Mikroarrays zielen mit Oligonukleotid-Sonden auf spezifische Exons oder Exon-Exon-Verbindungen ab. Die Fluoreszenzintensitäten der einzelnen Sonden spiegeln die relative Verwendung alternativ spleißender Exons in verschiedenen Geweben und Zelllinien wider. Microarrays mit hoher Dichte für Spleißverbindungen sind eine kostengünstige Möglichkeit, bereits bekannte Exons und AS-Ereignisse mit einer geringen Falsch-Positiv-Rate zu untersuchen. Der Nachteil ist, dass sie Vorkenntnisse über bestehende AS-Varianten und Genstrukturen erfordern. Noch wichtiger ist, dass Microarrays im Gegensatz zu RNA-Seq und EST keine zusätzlichen Sequenzinformationen liefern.

RNA-Seq hat sich zu einer leistungsstarken Technologie für die Transkriptomanalyse entwickelt, da sie Millionen von kurzen Sequenzleseabschnitten erzeugen kann. RNA-Seq-Experimente liefern ausführliche Informationen über die Transkriptionslandschaft. Die ständig wachsende Ansammlung von Hochdurchsatzdaten wird auch in Zukunft immer mehr Möglichkeiten bieten, weitere Aspekte der AS zu untersuchen, wie z. B. niedrigfrequente AS-Ereignisse sowie gewebespezifische und/oder entwicklungsspezifische AS-Ereignisse. Frühere Datensätze bestehen aus RNA-Leseseabschnitten von 50 bp oder weniger, was die Informationen über Kombinationen von AS-Ereignissen in einem einzigen Transkript einschränkt, aber es ist wahrscheinlich, dass die Länge der kurzen Lesungen im nächsten Jahrzehnt weiter zunehmen wird. Mit der zunehmenden Kapazität der Sequenzierung der nächsten Generation (RNA-Seq) wird die Untersuchung des alternativen Spicings wahrscheinlich eine Revolution erleben. Die größere Tiefe der Sequenzierung von Transkriptomen beim Menschen und anderen Spezies hat unser Verständnis für das Auftreten von AS-Ereignissen und AS-Expressionsmustern in verschiedenen Geweben und Entwicklungsstadien verbessert.

Die Transkript-Assemblierung von sequenzbasierten Technologien wie ESTs und RNA-Seq kann je nach Qualität der Referenzgenom- und Sequenzdaten entweder nach dem Prinzip „align-then-assemble“ oder „assemble-then-align“ erfolgen. Ein Algorithmus kann eingesetzt werden, um AS-Ereignisse durch den Vergleich verschiedener Transkripte zu erkennen. Die Erkennung von AS-Isoformen im Gegensatz zu einem einzelnen AS-Ereignis ist jedoch nach wie vor eine Herausforderung, da kurze Sequenzen wenig Informationen über die Kombination von Exons liefern. Es wurden mehrere Anwendungen für die Transkriptassemblierung und den Nachweis von AS-Isoformen entwickelt; verschiedene Strategien und Vergleiche dieser Anwendungen wurden bereits besprochen.

4. Prävalenz des alternativen Spleißens in eukaryotischen Genomen

Anfängliche Ganzgenomanalysen legten nahe, dass 5-30 % der menschlichen Gene alternativ gespleißt sind (besprochen in ). EST-basierte AS-Datenbanken weisen AS-Ereignisse in 40-60 % der menschlichen Gene nach; in letzter Zeit wurde diese Zahl jedoch immer wieder revidiert, wobei die neuesten Schätzungen zeigen, dass bis zu 94 % der menschlichen Multiexon-Gene mehr als ein Transkript durch alternatives Spleißen produzieren. Das Verständnis, wie sich das alternative Spleißen im Laufe der Zeit verändert hat, könnte Aufschluss darüber geben, wie sich das alternative Spleißen auf die Transkript- und Proteinvielfalt und die Phänotypentwicklung ausgewirkt hat. Bei Pilzen wird angenommen, dass AS aufgrund der geringen Anzahl von Exons in Hefe selten vorkommt. Bei Pflanzen schätzt man auf der Grundlage von EST-Daten, dass etwa 20 % der Gene alternativ gespleißt werden. Eine kürzlich durchgeführte Studie mit RNA-Seq deutet jedoch darauf hin, dass mindestens 42 % der intronhaltigen Gene in Arabidopsis alternativ gespleißt werden. Wir gehen davon aus, dass bei verschiedenen Eukaryonten ein wesentlich höherer Prozentsatz an alternativ gespleißten Genen entdeckt werden wird, da derzeit eingehende Studien des Transkriptoms unter Verwendung von Next-Generation-Sequencing wie RNA-Seq durchgeführt werden. Einige wenige Studien haben versucht, die AS-Prävalenz zwischen verschiedenen Taxa zu vergleichen, wobei Tiere im Allgemeinen eine höhere AS-Inzidenz als Pflanzen und Wirbeltiere eine höhere AS-Inzidenz als Wirbellose aufweisen. Diese Studien basieren jedoch entweder auf begrenzten Daten oder haben es versäumt, Unterschiede in der Transkriptabdeckung zu korrigieren.

Es gibt eine Reihe von Datenbanken, die AS-Daten für mehrere Arten liefern. Diese vorhandenen Ressourcen konzentrieren sich jedoch in erster Linie auf Tierarten und haben eine geringe Abdeckung für Protisten-, Pilz- und Pflanzengenome, was den Vergleich unterschiedlicher Taxa erschwert. Vor allem aber berücksichtigt keine dieser Ressourcen die gut dokumentierten Auswirkungen der unterschiedlichen Transkriptabdeckung von Genen innerhalb und zwischen verschiedenen Arten, die die AS-Erkennungsraten stark beeinflussen. Es hat sich gezeigt, dass zufällige Stichproben die Verzerrung der Transkriptabdeckung minimieren (Abbildung 2). Wir erwarten, dass ähnliche Strategien in zukünftigen vergleichenden AS-Datenressourcen eingesetzt werden.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

Abbildung 2

Die Gesamtzahl der Transkripte beeinflusst die AS-Erkennung, doch kann die Verzerrung durch die Verwendung einer Stichprobenmethode korrigiert werden. AS-Erkennung in Genen geteilt durch die Transkriptabdeckung für den Fadenwurm (a und b) unter Verwendung des gesamten Transkriptdatensatzes (a) oder einer Stichprobenmethode (b).

5. Ist alternatives Spleißen funktionell oder meist nur Rauschen?

Wenn ein Anstieg der AS-Werte bei Wirbeltieren im Vergleich zu Wirbellosen bestätigt wird, ist es angesichts der Beschränkungen der derzeitigen Proteomik-Ressourcen schwierig, das Ausmaß zu beurteilen, in dem alternativ gespleißte Transkripte in ein erweitertes Proteom übersetzt werden. Die Evolution vieler Phänotypen, die wir am ehesten mit dem Menschen in Verbindung bringen, wie z. B. längere Lebensdauer, Enzephalisierung oder sogar erhöhte Komplexität, ging mit einer starken Verringerung der effektiven Populationsgröße einher, was möglicherweise die Verbreitung einer Vielzahl von genomischen Merkmalen in komplexeren Organismen erklärt (siehe jedoch). Daher ist es möglich, dass die Zunahme von AS im Laufe der Evolution auf abweichendes Spleißen zurückzuführen ist und daher keine funktionelle Rolle spielt. Wenn alternatives Spleißen entlang des Stammbaums zugenommen hat und tatsächlich funktionell ist, können wir Folgendes erwarten:(A) Transkripte sollten eine geringe Häufigkeit von vorzeitigen Stoppcodons aufweisen, die sie anfällig für Nonsense-vermittelten Zerfall machen würden. Es wurde festgestellt, dass zwischen 4 % und 35 % der menschlichen AS-Transkripte ein vorzeitiges Abbruchcodon in den Transkripten von Mensch und Maus enthalten. Es wurde festgestellt, dass diese Transkripte in nicht konservierten Exons angereichert sind, die wahrscheinlich Frame-Shifts verursachen. Es ist nicht bekannt, ob sich der Anteil der AS-Transkripte, die ein vorzeitiges Stoppcodon enthalten, entlang des phylogenetischen Stammbaums verändert hat.(B) Es wurde vorgeschlagen, dass die meisten alternativen Isoformen mit geringer Kopienzahl, die in menschlichen Zellen produziert werden, wahrscheinlich nicht funktionell sind. Eine kürzlich durchgeführte Studie hat gezeigt, dass krebsspezifische alternative Spleißvarianten zwar gefunden werden können, diese Ereignisse jedoch meist als Einzelkopien auftreten und daher wahrscheinlich nicht zum Kerntranskriptom von Krebs beitragen.(C) Die Erhaltung von alternativen Spleißereignissen im Laufe der Evolution kann als Indikator für ihre funktionelle Rolle angesehen werden. Der Erhaltungsgrad von AS wurde bei vielen Arten untersucht. Die Schätzungen reichen von 11 % bis 67 % zwischen Mensch und Maus. Vor allem die großen AS-Formen weisen im Vergleich zu den kleinen Formen einen höheren Erhaltungsgrad auf. Andererseits variieren die konservierten AS-Formen zwischen den verschiedenen AS; so hat z. B. das Exon-Skipping zwischen C. elegans und C. briggsae ein Konservierungsniveau von mehr als 81 % gezeigt, verglichen mit 28 % bei der Intron-Retention .(D) Das Vorhandensein identifizierbarer funktioneller Domänen in AS-Bereichen kann auch ein Indikator für die funktionelle Bedeutung von AS-Transkripten sein. Nach unserem Kenntnisstand gibt es keine Berichte über das Vorhandensein funktioneller Domänen in AS-Bereichen bei Modellarten. Um das Vorhandensein von funktionellen Domänen in AS-Transkripten zu untersuchen, haben wir einen Satz von 267.996 AS-Ereignissen zusammengestellt, die aus der Analyse von 8.315.254 ESTs aus normalem menschlichem Gewebe stammen. Wir fanden heraus, dass etwa 50 % der AS-Bereiche beim Menschen mit Hilfe von InterProScan, das 14 Anwendungen für die Vorhersage von Proteindomänen enthält (Abbildung 3, siehe Methoden in ), bekannte funktionelle Komponenten enthalten, was auf eine mögliche funktionelle Rolle von AS hinweist. Das Ausmaß der Variationen in der Prävalenz funktioneller Domänen unter den AS-Bereichen zwischen den Spezies muss noch erforscht werden, würde aber zusätzliche Erkenntnisse über die Evolution von AS liefern.

Abbildung 3

Anteil der AS-Bereiche, die identifizierbare funktionelle Domänen, Sekundärstrukturen und Stoppcodons beim Menschen enthalten. Funktionelle Komponenten wurden mithilfe von InterProScan identifiziert, das 14 Anwendungen für die Vorhersage von Proteindomänen enthält, darunter Pfam für die Vorhersage von Proteindomänen, SignalP 3.0 für Signalpeptidvorhersagen und TMHMM für die Vorhersage von Transmembrandomänen. PSORT II wurde verwendet, um die wahrscheinliche subzelluläre Lokalisierung von Proteinprodukten zu ermitteln. Sekundäre Proteinstrukturen wurden mit CLC Main Workbench 5.7 vorhergesagt, das auf extrahierten Proteinsequenzen aus der Proteindatenbank (http://www.rcsb.org/pdb/) basiert.

Die obigen Beobachtungen lassen darauf schließen, dass alternative Spleißereignisse zwar in der Tat über die gesamte Evolution hinweg konserviert sind, ein beträchtlicher Teil davon jedoch nicht, und einige davon könnten aus verrauschtem Transkriptspleißen resultieren, das nicht zum Proteinpool beiträgt. Solange jedoch keine weiteren Studien mit vergleichbaren AS-Indizes durchgeführt werden, ist es unmöglich, das Ausmaß abzuschätzen, in dem sich die Zunahme des AS-Niveaus entlang des Stammbaums auf den Pool funktioneller Transkripte ausgewirkt hat.

6. Alternatives Spleißen und Genduplikation

Die Genduplikation (GD) gilt als Hauptquelle funktioneller Innovation im Genom. Neu duplizierte Gene können funktionelle Divergenz entwickeln, und es wird angenommen, dass sie der Schlüssel für die Evolution der Entwicklungs- und morphologischen Komplexität bei Wirbeltieren sind. Alternatives Spleißen, ein weit verbreiteter Mechanismus, der auch die Proteinvielfalt erhöht, wurde als potenzieller Akteur in der Evolution der Eukaryoten vorgeschlagen. Durch die Untersuchung der Beziehung zwischen Genduplikation und alternativem Spleißen können wir besser verstehen, inwieweit beide Mechanismen gleichwertige Mittel zur Diversifizierung von Proteinen sind. Mehrere Studien haben eine negative Korrelation zwischen AS und der Größe der Genfamilien bei Mensch, Maus und Wurm festgestellt (Tabelle 1). Daraus kann man leicht den Schluss ziehen, dass AS und GD austauschbar sind und dass es eine universelle negative Korrelation zwischen Wurm und Mensch gibt. Die Beziehung zwischen den beiden Variablen ist jedoch bestenfalls marginal, und sie ist nicht konsistent, wenn man Einzelgene einbezieht, die im Vergleich zu Multigenfamilien ein niedrigeres AS-Niveau aufweisen. Jin et al. schlugen vor, dass Singletons eine stärkere evolutionäre Verengung aufweisen als Duplikate, was ihren Zuwachs an AS-Isoformen behindert. In Übereinstimmung mit dieser Hypothese fanden Lin et al. heraus, dass sich Singletons in mehreren Aspekten von Multigenfamilien unterscheiden, was darauf hindeutet, dass sie unterschiedliche evolutionäre Pfade aufweisen. Selbst wenn wir uns nur auf Multigene-Familien konzentrieren, kann eine negative Korrelation zwischen AS und Genfamiliengröße durch die Kovarianz von AS und Genfamiliengröße mit anderen Faktoren erklärt werden. So wurden zum Beispiel das Alter der Gene und die einseitige Duplikation als Erklärung vorgeschlagen. Diese Studie hat Zweifel an der Beziehung zwischen AS und GD aufkommen lassen und könnte in der Tat die Vermutung unterstützen, dass AS und GD in Bezug auf die Auswirkungen auf Proteinsequenz, -struktur und -funktion wenig oder gar nicht gleichwertig sind. Da die meisten Studien nur eine kleine Anzahl von Modellarten untersucht haben, ist es schwierig, das Ausmaß des Zusammenhangs zwischen AS und GD zu beurteilen. Darüber hinaus könnte der Ansatz, GFS und AS in einem einzigen Genom zu vergleichen, die wahre Beziehung zwischen AS und GFS verschleiern.

Spezies Daten Alternatives Spleißen Orthologie Vorspannung Korrelation Referenz
Human Ensembl ASD’s AltSplice database BLSATP Exons, EST-Abdeckung, Genfamiliengröße, Isoformzahl Negative Korrelation
NCBI, UCSC GeneSplicer-Programm EnsMart Entfernen von EST-Müll, EST-Abdeckung, Negative Korrelation
H-InvDB 5.0 H-InvDB 5.0 BLAST Positive Korrelation bei Einbeziehung aller Genfamilien. Negative Korrelation innerhalb von Multigenfamilien
Maus Ensembl ASD’s AltSplice database BLSATP Exons, EST-Abdeckung, Genfamiliengröße, Isoformzahl Negative Korrelation
NCBI, UCSC GeneSplicer Programm EnsMart Entferne Müll EST, EST Abdeckung, Negative Korrelation
Riken’s FANTOM3 Riken’s FANTOM3 BLAST Positive Korrelation bei Einbeziehung aller Genfamilien. Negative Korrelation innerhalb von Multigenfamilien
C. elegans WormPep WormPep BLAST Niedrigeres AS-Vorkommen in Multigenfamilien
Rice TIGR 4.0 PASA-Programm BLASTP Entfernen von Genen ohne Transkriptionsnachweis Multigene Familien haben eine signifikant höhere AS-Inzidenz als Singletons
Arabidopsis TAIR7 TAIR7 TAIR7 Multigene Familien haben eine signifikant höhere AS-Inzidenz als Singletons
Tabelle 1
Zusammenfassung für die Beziehung zwischen AS und GFS.

7. Der Beitrag des alternativen Spleißens zur funktionellen Innovation

Alternatives Spleißen wurde als die fehlende Informationsquelle im Genom gepriesen, die für die Evolution höherer Komplexität verantwortlich ist, obwohl die Anzahl der Gene in den Metazoen in den letzten 800 Millionen Jahren nahezu unverändert geblieben ist. Wegmann et al. fanden heraus, dass die Breite der Genexpression positiv mit der Anzahl neuer Transkript-Isoformen korreliert ist, und schlugen vor, dass die Zunahme der Genexpressionsbreite für den Erwerb neuer Transkript-Isoformen wesentlich ist, was durch eine neue Form der ausgleichenden Selektion aufrechterhalten werden könnte. Darüber hinaus haben experimentelle und bioinformatische Analysen gezeigt, dass AS eine Vielzahl funktioneller mRNAs und Proteinprodukte hervorbringen kann, die unterschiedliche Stabilitätseigenschaften, subzelluläre Lokalisierungen und Funktionen aufweisen und in bestimmten Stadien der Zelldifferenzierung, der Geschlechtsdifferenzierung und der Entwicklung auftreten.

Studien an einzelnen Genen haben Beispiele dafür geliefert, dass alternatives Spleißen zu funktionellen Innovationen führen kann, bevor eine Genduplikation stattgefunden hat. Ein solches Beispiel ist das Troponin I (TnI), das eine Schlüsselrolle bei der Muskelkontraktion spielt. Im Wirbeltiergenom existiert TnI in drei Kopien, die jeweils in einem anderen Muskeltyp (Skelettmuskel, schneller und langsamer Muskel sowie Herzmuskel) exprimiert werden. In Ciona, einem der engsten Verwandten der Wirbeltiere, liegt TnI in Form eines einzigen Gens vor. Interessanterweise produziert das Ciona-Gen jedoch drei verschiedene alternativ gespleißte Isoformen, die jeweils dem Expressionsprofil eines der Wirbeltiergene ähneln, was darauf hindeutet, dass die Spezialisierung der TnI-Proteine auf die Funktion in den einzelnen Muskeltypen der Genduplikation vorausging. Dieses Muster alternativer Spleißvarianten in ursprünglich einzelnen Genen, die den Expressionsprofilen von später duplizierten Genen ähneln, wurde auch bei Synapsin-2-Genen in Tetrapoden und MITF-Genen in Teleost-Fischarten gefunden. Diese Beispiele deuten darauf hin, dass alternatives Spleißen ein Mechanismus für funktionelle Innovation sein kann, der den Ereignissen der Genduplikation auf einem der drei möglichen Wege vorausgeht (Abbildung 4).

(a) Degeneration des Spleißsignals
(a) Degeneration des Spleißsignals
(b) Exonisierung nicht-kodierender DNA oder Transposons
(b) Exonisierung nichtkodierender DNA oder Transposons
(c) Exon-Duplikation und Spezialisierung von Isoformen
(c) Exon-Duplikation und Spezialisierung von Isoformen

(a) Spleißsignal-Degeneration
(a) Spleißsignal-Degeneration(b) Exonisierung von nichtkodierender DNA oder Transposons
(b) Exonisierung nicht-kodierender DNA oder Transposons(c) Exon-Duplikation und Spezialisierung von Isoformen
(c) Exon-Duplikation und Spezialisierung von Isoformen

Abbildung 4

Neue AS-Varianten können spezialisierte oder neuartige Aufgaben übernehmen. Neuartige Spleißvarianten können entstehen durch (a) Mutationen in der Exon-Erkennungsstelle eines konstitutiven Exons und anschließende Übernahme von AS-Regulierungselementen. (b) Exonisierung von Introns oder Intronregionen oder transponierbaren Elementen mit anschließender Übernahme von AS-Regulationsbereichen. Neue Proteine können mit verschiedenen Proteinen interagieren oder in verschiedenen subzellulären Regionen lokalisiert werden. (c) Exon-Duplikation und anschließende Spezialisierung funktioneller Domänen und AS-Regulationsregionen. Die daraus resultierenden spezialisierten Proteine können Teilrollen übernehmen, die für verschiedene Zelltypen oder Entwicklungsstadien relevant sind, oder zu neuartigen Interaktionen und Funktionen führen.

Gene können nach der Duplikation auch weiter alternativ gespleißt und reguliert werden, zusammen mit der Komplexität der Organsysteme nach der Divergenz von Protochordaten und Wirbeltieren. Ein Vergleich zwischen den Transkriptionsfaktoren der Pax-Gene in Wirbeltieren und Amphibien hat gezeigt, dass mindestens 52 alternative Spleißereignisse in Wirbeltieren im Vergleich zu 23 Ereignissen in Amphibien gemeldet wurden. Darüber hinaus haben die Pax-Gene der Wirbeltiere die meisten ihrer angestammten Funktionen beibehalten und ihre Expression erweitert. Es hat sich gezeigt, dass neuartiges alternatives Spleißen von Pax-Genen den Inhalt der funktionellen Domäne (z. B. DNA-Bindung) und die Transaktivierungskapazität der resultierenden Proteinprodukte verändert. So kann beispielsweise ein neuartiges alternatives Transkript von Pax3 ein cMET-Reporter-Konstrukt in der Maus transaktivieren. Es wird angenommen, dass diese zusätzlichen Isoformen von Pax3 eine funktionelle Rolle bei der Übernahme neuer Aufgaben in der neuralen Platte von Wirbeltieren spielen. In ähnlicher Weise wurden vertebratenspezifische AS-Ereignisse von Exon 5a in Pax4 und Pax6 mit funktionellen Rollen bei der Entwicklung des Auges von Wirbeltieren in Verbindung gebracht. Daher liegt die Hypothese nahe, dass neben der Genduplikation das alternative Spleißen eine wichtige Rolle bei der Erlangung neuer Funktionen spielt, die zur Komplexität der Organsysteme nach der Divergenz von Protochordaten und Wirbeltieren beitragen. Die potentielle Rolle der zunehmenden Prävalenz von AS bei Wirbeltieren in der funktionellen Innovation wird in Zukunft in mehr Genfamilien oder auf genomweiter Ebene erforscht werden, was unser Verständnis darüber, wie AS zur funktionellen Innovation beiträgt, vertiefen wird.

8. Schlussfolgerung

Hier haben wir Beweise aus genomweiten Studien sowie mögliche Wege für zukünftige vergleichende Studien für das Potential des alternativen Spleißens als eine Quelle der funktionellen Innovation während der Evolution des eukaryotischen Genoms überprüft. Obwohl nun klar ist, dass AS im menschlichen Genom weit verbreitet ist, gibt es immer noch Hindernisse bei der Bewertung, wie sich alternatives Spleißen im Laufe der Zeit entwickelt hat. Das Haupthindernis besteht darin, dass die meisten anderen genomischen Merkmale direkt gemessen oder allein anhand der genomischen Sequenzen geschätzt werden können, während für das alternative Spleißen keine genauen Schätzungen anhand der genomischen Sequenzanalyse möglich sind. Die Abhängigkeit von der Verfügbarkeit von Transkriptsequenzen zur Messung von AS in Verbindung mit der starken Verzerrung durch ungleiche Transkriptabdeckung hat die genomweite Bewertung von AS bei allen außer einigen wenigen Modellarten erschwert und macht einen direkten Vergleich zwischen den Arten schwierig. Dies hat die Untersuchung der Frage verlangsamt, wie sich alternatives Spleißen im Laufe der Zeit entwickelt hat, wie AS reguliert wird und wie es mit anderen genomischen Merkmalen und vor allem mit dem Phänotyp zusammenhängt. Die immer umfangreichere Erstellung von Transkriptprofilen für viel mehr Arten in Verbindung mit der Verwendung vergleichbarer Indexschätzungen wird es ermöglichen, eine Reihe von evolutionären Fragen zur Entwicklung von AS und deren Auswirkungen auf die Entwicklung der Transkriptdiversität und der funktionellen Innovation anzugehen.

Interessenkonflikt

Die Autoren erklären, dass keine Interessenkonflikte bestehen.

Danksagungen

Die Autoren danken Humberto Gutierrez für Kommentare zu früheren Versionen dieser Arbeit. Diese Arbeit wurde durch ein UK-China Scholarship for Excellence und ein University of Bath Research Studentship für L. Chen, ein CONACyT-Stipendium für J. M. Tovar-Corona und ein Royal Society Dorothy Hodgkin Research Fellowship, Royal Society Research Grant und ein Royal Society Research Grant for Fellows für A. O. Urrutia finanziert.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.