Épissage alternatif : Une source potentielle d’innovation fonctionnelle dans le génome eucaryote

Abstract

L’épissage alternatif (EA) est un processus posttranscriptionnel commun dans les organismes eucaryotes, par lequel de multiples transcrits fonctionnels distincts sont produits à partir d’un seul gène. La publication de l’ébauche du génome humain a révélé un nombre de gènes beaucoup plus faible que prévu. En raison de son rôle potentiel dans l’accroissement de la diversité des protéines, l’intérêt pour l’épissage alternatif s’est accru au cours de la dernière décennie. Bien que des études récentes aient montré que 94% des gènes multiexons humains subissent un EA, l’évolution de l’EA et donc son rôle potentiel dans l’innovation fonctionnelle dans les génomes eucaryotes restent largement inexplorés. Nous examinons ici les preuves disponibles concernant l’évolution de la prévalence et du rôle fonctionnel des AS. En outre, nous soulignons la nécessité de corriger le fort effet de la couverture de la transcription dans la détection de la SA et nous exposons une stratégie pour finalement élucider l’étendue du rôle de la SA dans l’innovation fonctionnelle à l’échelle génomique.

1. Introduction

La première ébauche de la séquence du génome humain a été dévoilée en février 2001 et, de manière surprenante, il a été montré qu’elle contenait ~23000 gènes, soit seulement une fraction des nombres de gènes initialement prédits . Pour mettre cela en perspective, il y a ~20 000 gènes dans le génome du nématode C. elegans. L’absence d’association entre le nombre de gènes et la complexité de l’organisme a suscité un intérêt accru pour l’épissage alternatif (EA), car il a été proposé qu’il soit un facteur majeur dans l’expansion de la complexité réglementaire et fonctionnelle, de la diversité des protéines et de la complexité de l’organisme des eucaryotes supérieurs. Cependant, malgré les meilleurs efforts de nombreux groupes de recherche, nous comprenons encore très peu le rôle réel joué par l’EA dans l’évolution de l’innovation fonctionnelle – ici comprise comme l’apparition de nouvelles transcriptions fonctionnelles – sous-tendant l’augmentation de la complexité organisationnelle observée.

L’épissage alternatif est un processus posttranscriptionnel dans les organismes eucaryotes par lequel de multiples transcriptions distinctes sont produites à partir d’un seul gène . Des études antérieures utilisant la technologie de séquençage à haut débit ont rapporté que jusqu’à 92%~94% des gènes multiexons humains subissent l’AS , souvent d’une manière spécifique au tissu / stade de développement . Avec le développement et l’amélioration constante du profilage de la transcription du génome entier et des algorithmes bioinformatiques, l’omniprésence de la SA dans le génome des mammifères a commencé à devenir claire. Le concept d’un gène et d’une protéine a été abandonné au fur et à mesure que s’accumulaient les preuves de l’incidence élevée des SA chez les espèces non humaines, comme la mouche du vinaigre, Arabidopsis et d’autres eucaryotes. Malgré les progrès réalisés dans notre compréhension et notre caractérisation de la SA, plusieurs questions restent sans réponse. Premièrement, la grande différence de couverture des transcriptions entre les espèces a empêché les comparaisons directes de la prévalence de l’épissage alternatif dans différentes espèces. Deuxièmement, même si des estimations comparables de l’épissage alternatif entre les espèces pouvaient être obtenues, il n’est pas clair dans quelle mesure les changements dans la prévalence de l’épissage alternatif au cours de l’évolution ont contribué à la diversité globale des protéines ou reflètent plutôt le bruit de l’épissage. Enfin, nous comprenons très peu de choses sur la façon dont l’AS a évolué au fil du temps et sur la façon dont cela est lié aux paramètres fonctionnels des gènes. Nous passons ici en revue la façon dont l’alternatif est régulé et les progrès récents dans notre compréhension de l’évolution de l’épissage alternatif.

2. L’épissage alternatif et sa régulation

En 1977, Chow et al. ont rapporté que les séquences terminales 5′ et 3′ de plusieurs ARNm d’adénovirus 2 (Ad2) variaient, impliquant un nouveau mécanisme pour la génération de plusieurs ARNm distincts. À la suite de cette étude, un épissage alternatif a également été mis en évidence dans le gène codant pour l’hormone thyroïdienne calcitonine dans les cellules de mammifères. Des études ultérieures ont révélé que de nombreux autres gènes étaient également capables de générer plus d’un transcrit en découpant différentes sections de ses régions codantes (revues dans ).

Selon l’emplacement des segments exoniques découpés – ou si les introns sont laissés en place – les événements d’épissage peuvent être classés en quatre types de base (figure 1). Ces quatre principaux modes d’épissage sont (1) le saut d’exon (2) la rétention d’intron (3) le site d’épissage 5′ alternatif (5′ss), et (4) le site d’épissage 3′ alternatif (3′ss) . En outre, les exons mutuellement exclusifs, l’initiation alternative et la polyadénylation alternative fournissent deux autres mécanismes pour générer diverses isoformes de transcription. De plus, différents types d’épissage alternatif peuvent se produire de manière combinatoire et un exon peut être soumis à plus d’un mode d’AS, par exemple, 5′ss et 3′ss en même temps (Figure 1). On a constaté que la prévalence de chaque type de SA varie entre différents taxons. Plusieurs études ont montré que le saut d’exon est commun dans les génomes des métazoaires alors que la rétention d’intron est le type de SA le plus commun chez les plantes et les champignons .

Figure 1

Différents types d’épissage alternatif. Les cases bleues représentent les exons constitutifs et les régions épissées alternativement en rouge. Les introns sont représentés par des lignes droites entre les boîtes. Quatre types d’événements d’épissage communs ont été identifiés : (1) saut d’exon (2) rétention d’intron (3) site d’épissage 5′ alternatif (5′ss), et (4) site d’épissage 3′ alternatif (3′ss).

L’épissage alternatif est étroitement régulé par des éléments cis ainsi que par des facteurs transactants qui se lient à ces éléments cis. Les facteurs de transacting, principalement des protéines de liaison à l’ARN, modulent l’activité du spliceosome et des éléments cis tels que les exhausteurs d’épissage exonique (ESEs), les silencieux d’épissage exonique (ESSs), les exhausteurs d’épissage intronique (ISEs) et les silencieux d’épissage intronique (ISSs). Le mécanisme canonique de l’AS suggère que les protéines riches en sérine/arginine (SR) se lient généralement aux ESS, tandis que les ribonucléoprotéines nucléaires hétérogènes (hnRNP) ont tendance à se lier aux ESS ou aux ISS. Étant donné les rôles cruciaux de ces régulateurs dans la machinerie d’épissage, les mutations cis et transactantes, qui perturbent le code d’épissage, sont connues pour provoquer des maladies (revues dans ). On estime que 15 à 60 % des mutations provoquent des maladies en affectant le modèle d’épissage des gènes ( et revu dans ). En outre, il a également été démontré que le SA est régulé sans l’implication de facteurs d’épissage auxiliaires et que le SA peut également être combiné avec d’autres événements posttranscriptionnels tels que l’utilisation de multiples sites internes d’initiation de la traduction, l’édition de l’ARN, la désintégration de l’ARNm et la liaison des microARN et d’autres ARN non codants , ce qui suggère l’existence d’un mécanisme non canonique supplémentaire du SA qui reste à identifier .

Récemment, un rôle direct des modifications d’histones dans l’épissage alternatif a été signalé, dans lequel la modification d’histone (H3-K27m3) affecte le résultat de l’épissage en influençant le recrutement des régulateurs d’épissage via une protéine de liaison à la chromatine dans un certain nombre de gènes humains tels que FGFR2,TPM2,TPM1 et PKM2 . En outre, il a été signalé que la pause de l’ARN polymérase II promue par le CTCF lie la méthylation de l’ADN à l’épissage, fournissant la première preuve de la régulation développementale du résultat de l’épissage par des marques épigénétiques héréditaires. En outre, les ARN non codants sont également apparus comme des déterminants clés des modèles d’épissage alternatif. Ces résultats révèlent donc une couche épigénétique supplémentaire dans la régulation de la transcription et de l’épissage alternatif. Des études génétiques et épigénétiques à l’échelle du génome ont donc été proposées pour au moins 100 types de cellules sanguines spécifiques, ce qui permettra d’obtenir des épigénomes de référence de haute qualité (à l’aide de tests de méthylation de l’ADN et de marques d’histones) avec des données génétiques et transcriptomiques détaillées (séquençage du génome entier, RNA-Seq et miRNA-Seq), ce qui nous permettra d’évaluer l’influence génomique des facteurs épigénétiques dans la régulation de la SA dans des types de cellules sanguines spécifiques. Nous nous attendons à ce que la montée de l’épigénétique comparative fournisse une perspective différente de l’évolution du transcriptome.

3. Identification des événements d’épissage alternatif

L’épissage alternatif est difficile à estimer à partir des seuls paramètres génomiques . Un certain nombre de motifs régulateurs de l’AS ont été découverts, mais la présence de motifs d’épissage alternatif connus ne garantit pas qu’un gène soit réellement épissé alternativement . Ainsi, les motifs d’épissage alternatif sont généralement évalués à partir de l’examen des données de transcription. Pour tout gène d’intérêt, les événements d’épissage alternatif peuvent être identifiés à l’aide d’une réaction en chaîne de la polymérase par transcription inverse (RT-PCR) réalisée sur une bibliothèque d’ADN complémentaire (ADNc). Au cours de la dernière décennie, avec l’amélioration des technologies de transcriptome à haut débit, il est devenu possible d’évaluer les schémas d’épissage alternatif à l’échelle du génome. Trois sources principales de données transcriptomiques ont été utilisées pour évaluer les schémas d’épissage : les étiquettes de séquences exprimées (EST), les microréseaux de jonction d’épissage et le séquençage de l’ARN (RNA-Seq).

La première vague d’analyse du transcriptome à l’échelle du génome a consisté en un séquençage direct de l’ADNc et des EST réalisé à grande échelle , ce qui a permis d’identifier les événements d’épissage alternatif en alignant les séquences d’ADNc/EST sur le génome de référence. Les EST sont des séquences d’une longueur de 200 à 800 bases nucléotidiques, non éditées, sélectionnées au hasard et dérivées de bibliothèques d’ADNc. Actuellement, il existe huit millions d’EST pour l’homme, dont environ un million de séquences provenant de tissus cancéreux, et environ 71 millions d’EST pour environ 2000 espèces dans dbEST . Cependant, les EST sont basées sur le séquençage Sanger à faible débit et sont agrégées sur un large éventail de tissus, d’états de développement et de maladies en utilisant des niveaux de sensibilité très différents.

Plus récemment, les microréseaux de jonction d’épissage et RNA-Seq ont été de plus en plus utilisés pour analyser quantitativement les événements d’épissage alternatif. Les microréseaux d’épissage ciblent des exons spécifiques ou des jonctions exon-exon avec des sondes oligonucléotidiques. Les intensités de fluorescence des sondes individuelles reflètent l’utilisation relative des exons d’épissage alternatif dans différents tissus et lignées cellulaires. Les microréseaux de jonction d’épissage à haute densité sont un moyen rentable de tester des exons et des événements d’épissage alternatif connus avec un faible taux de faux positifs. L’inconvénient est qu’elles nécessitent une connaissance préalable des variantes de SA et des structures génétiques existantes. Plus important encore, contrairement à RNA-Seq et EST, les microarrays ne fournissent pas d’informations supplémentaires sur la séquence.

RNA-Seq a émergé comme une technologie puissante pour l’analyse du transcriptome en raison de sa capacité à produire des millions de lectures de séquences courtes . Les expériences RNA-Seq fournissent des informations approfondies sur le paysage transcriptionnel . L’accumulation croissante de données à haut débit continuera à offrir des possibilités toujours plus riches d’étudier d’autres aspects de la SA, tels que les événements de SA de faible fréquence ainsi que les événements de SA spécifiques aux tissus et/ou au développement. Les ensembles de données antérieurs se composent de séquences de lecture d’ARN de 50 pb ou moins, ce qui limite les informations sur les combinaisons d’événements de SA dans un seul transcrit, mais il est probable que la longueur des lectures courtes continuera à augmenter au cours de la prochaine décennie. Avec la capacité croissante du séquençage de nouvelle génération (RNA-Seq), l’étude de l’épissage alternatif va probablement connaître une révolution. La plus grande profondeur de séquençage des transcriptomes chez l’homme et d’autres espèces a augmenté notre compréhension de l’occurrence de l’événement AS et des modèles d’expression AS dans différents tissus , stades de développement .

L’assemblage de transcription des technologies basées sur la séquence, telles que les EST et l’ARN-Seq, peut utiliser soit aligner-et-assembler, soit assembler-et-aligner, en fonction de la qualité du génome de référence et des données de séquence . Un algorithme peut être utilisé pour détecter les événements AS en comparant différents transcrits. Cependant, la détection d’isoformes d’AS, par opposition à un événement d’AS unique, reste difficile car les séquences courtes fournissent peu d’informations en termes de combinaison d’exons. Plusieurs applications ont été développées pour l’assemblage des transcriptions et la détection des isoformes AS, différentes stratégies et la comparaison de ces applications ont été examinées précédemment .

4. Prévalence de l’épissage alternatif à travers les génomes eucaryotes

Les analyses initiales du génome entier ont suggéré que 5 % à 30 % des gènes humains étaient épissés alternativement (examinés dans ). Les bases de données d’AS basées sur les EST identifient des événements d’AS dans 40-60% des gènes humains ; cependant, récemment, ce nombre a été révisé à plusieurs reprises, les dernières estimations montrant que jusqu’à 94% des gènes humains multiexons produisent plus d’un transcrit par épissage alternatif . La compréhension de l’évolution de l’épissage alternatif au fil du temps pourrait permettre de comprendre l’impact de l’épissage alternatif sur la diversité des transcriptions et des protéines et sur l’évolution des phénotypes. Chez les champignons, on pense que l’épissage alternatif est rare en raison du faible nombre d’exons chez la levure. Chez les plantes, on a estimé qu’environ 20 % des gènes subissent un épissage alternatif sur la base des données EST, mais une étude récente utilisant RNA-Seq suggère qu’au moins environ 42 % des gènes contenant des introns chez Arabidopsis sont épissés alternativement. Nous nous attendons à ce que des pourcentages beaucoup plus élevés d’occurrence de l’épissage alternatif soient découverts chez divers eucaryotes, étant donné que des études approfondies du transcriptome utilisant le séquençage de nouvelle génération, comme le RNA-Seq, sont en cours. Quelques études ont tenté de comparer la prévalence du SA entre différents taxons, les animaux présentant généralement une incidence de SA supérieure à celle des plantes et les vertébrés une incidence de SA supérieure à celle des invertébrés. Cependant, ces études sont basées sur des données limitées ou n’ont pas réussi à corriger les différences dans la couverture des transcriptions .

Il existe un certain nombre de bases de données qui fournissent des données sur le SA pour de multiples espèces . Cependant, ces ressources existantes sont principalement axées sur les espèces animales et ont une faible couverture pour les génomes de protistes, de champignons et de plantes, ce qui rend difficile la comparaison de taxons divergents. Plus important encore, aucune de ces ressources ne tient compte des effets bien documentés de la couverture différentielle des transcriptions entre les gènes au sein d’une même espèce et entre les espèces, ce qui influence considérablement les taux de détection des SA. L’échantillonnage aléatoire a été utilisé et a montré qu’il minimisait le biais de la couverture des transcriptions (figure 2). Nous nous attendons à ce que des stratégies similaires soient employées dans les futures ressources de données comparatives sur les SA.

(a)
(a)
(b)
(b)

(a)
(a)(b)
(b)

Figure 2

Le nombre total de transcriptions influence la détection des SA mais le biais peut être corrigé en utilisant une méthode d’échantillonnage. Détection d’AS dans les gènes divisés par la couverture des transcriptions pour le nématode (a et b) en utilisant l’ensemble complet de données de transcription (a) ou une méthode d’échantillonnage aléatoire (b).

5. L’épissage alternatif est-il fonctionnel ou surtout du bruit ?

Si une augmentation des niveaux d’AS chez les vertébrés par rapport aux invertébrés est confirmée, étant donné les limites des ressources protéomiques actuelles, il est difficile d’évaluer dans quelle mesure les transcrits épissés alternativement sont traduits en un protéome élargi. L’évolution de nombreux phénotypes que nous associons le plus à l’être humain, tels que l’allongement de la durée de vie, l’encéphalisation ou même une complexité accrue, s’est accompagnée de fortes réductions de la taille effective des populations, ce qui explique peut-être la prolifération d’une variété de caractéristiques génomiques dans les organismes plus complexes ( mais voir ). Il est donc possible que l’augmentation de la SA au cours de l’évolution résulte d’un épissage aberrant et qu’elle ne joue donc aucun rôle fonctionnel . Si l’épissage alternatif a augmenté le long de l’arbre phylogénétique et qu’il est effectivement fonctionnel, nous pouvons nous attendre à ce qui suit : (A) Les transcrits devraient avoir une faible incidence de codons stop prématurés, ce qui les rendrait vulnérables à la désintégration médiée par le non-sens. On a constaté qu’entre 4 et 35 % des transcrits humains AS contiennent un codon de terminaison prématuré dans les transcrits humains et de souris . On a constaté que ces transcriptions étaient enrichies en exons non conservés susceptibles de provoquer des décalages de cadre. On ne sait pas si la proportion de transcrits AS contenant un codon de terminaison prématuré a changé le long de l’arbre phylogénétique. (B) Il a été proposé que la plupart des isoformes alternatives à faible nombre de copies produites dans les cellules humaines soient probablement non fonctionnelles. Une étude récente a montré que, bien que l’on puisse trouver des variantes d’épissage alternatif spécifiques du cancer, ces événements sont principalement des événements à copie unique et il est donc peu probable qu’ils contribuent au transcriptome principal du cancer. (C) La conservation des événements d’épissage alternatif au cours de l’évolution peut être considérée comme un indicateur de leur rôle fonctionnel. Les niveaux de conservation des AS ont été étudiés chez de nombreuses espèces. L’estimation varie de 11 % à 67 % entre l’homme et la souris . Notamment, les formes majeures de SA ont tendance à avoir des niveaux de conservation plus élevés que les formes mineures. D’autre part, les formes conservées de SA varient entre les différentes SA ; par exemple, le saut d’exon entre C. elegans et C. briggsae a montré un niveau de conservation de plus de 81 %, contre 28 % pour la rétention d’intron. (D) La présence de domaines fonctionnels identifiables dans les zones de SA peut également être un indicateur de la pertinence fonctionnelle des transcrits de SA. À notre connaissance, il n’existe aucun rapport sur la prévalence des domaines fonctionnels dans les zones AS chez les espèces modèles. Pour examiner la présence de domaines fonctionnels dans les transcrits AS, nous avons compilé un ensemble de 267 996 événements AS obtenus à partir de l’analyse de 8 315 254 EST provenant de tissus humains normaux. Nous avons constaté qu’environ 50 % des domaines AS chez l’homme contiennent des composants fonctionnels connus en utilisant InterProScan qui contient 14 applications pour la prédiction des domaines protéiques (figure 3, voir les méthodes dans ), ce qui suggère un rôle fonctionnel possible pour les AS. L’étendue des variations de la prévalence des domaines fonctionnels parmi les zones de SA entre les espèces reste à explorer mais fournirait des informations supplémentaires sur l’évolution de la SA.

Figure 3

Pourcentage de zones de SA contenant des domaines fonctionnels identifiables, des structures secondaires et des codons stop chez l’homme. Les composants fonctionnels ont été identifiés à l’aide d’InterProScan qui contient 14 applications pour la prédiction des domaines protéiques , y compris Pfam pour la prédiction des domaines protéiques , SignalP 3.0 pour les prédictions des peptides signaux , et TMHMM pour les prédictions des domaines transmembranaires . PSORT II a été utilisé pour identifier la localisation subcellulaire probable des produits protéiques. Les structures secondaires des protéines ont été prédites par CLC Main Workbench 5.7, qui est basé sur des séquences de protéines extraites de la banque de données des protéines (http://www.rcsb.org/pdb/).

Les observations ci-dessus suggèrent que, bien que les événements d’épissage alternatif soient effectivement conservés au cours de l’évolution, une proportion significative ne l’est pas et certains peuvent résulter d’un épissage de transcription bruyant ne contribuant pas au pool de protéines. Cependant, jusqu’à ce que d’autres études utilisant des indices AS comparables, il sera impossible d’estimer dans quelle mesure les augmentations des niveaux AS le long de l’arbre phylogénétique ont eu un impact sur le pool de transcrits fonctionnels.

6. Epissage alternatif et duplication de gènes

La duplication de gènes (GD) est considérée comme une source primordiale d’innovation fonctionnelle dans le génome. Les gènes nouvellement dupliqués peuvent évoluer vers une divergence fonctionnelle , et on pense qu’elle est la clé de l’évolution de la complexité développementale et morphologique chez les vertébrés . L’épissage alternatif, un mécanisme répandu qui augmente également la diversité des protéines, a été proposé comme un acteur potentiel de l’évolution des eucaryotes. En examinant la relation entre la duplication des gènes et l’épissage alternatif, nous pouvons mieux comprendre dans quelle mesure ces deux mécanismes sont des moyens équivalents de diversification des protéines. Plusieurs études ont rapporté une corrélation négative entre l’AS et la taille des familles de gènes chez l’homme, la souris et le ver (tableau 1). Il est facile d’en conclure que la SA et la GD sont interchangeables et qu’il existe une corrélation négative universelle du ver à l’homme. Cependant, la relation entre les deux variables est au mieux marginale et elle n’est pas cohérente lorsque l’on inclut les gènes singletons qui ont un niveau d’AS inférieur à celui des familles multigéniques. Jin et al. ont suggéré que les singletons ont plus de constriction évolutive que les duplicatas, ce qui entrave leur gain d’isoforme AS. En accord avec cette hypothèse, Lin et al. ont trouvé que les singletons diffèrent des familles multigéniques dans plusieurs aspects suggérant qu’ils ont des chemins évolutifs différents. Même si nous nous concentrons uniquement sur les familles multigéniques, une corrélation négative entre l’AS et la taille de la famille de gènes peut s’expliquer ou être un sous-produit de la covariance de l’AS et de la taille de la famille de gènes avec d’autres facteurs. Par exemple, l’âge des gènes et la duplication biaisée ont été proposés comme explication . Cette étude a jeté le doute sur la relation entre la SA et la MG et peut en effet apporter un soutien à la suggestion selon laquelle la SA et la MG ont peu ou pas d’équivalence en ce qui concerne les effets sur la séquence, la structure et la fonction des protéines. Comme la plupart des études n’ont porté que sur un petit nombre d’espèces modèles, il est difficile d’évaluer l’étendue du lien entre la SA et la GD. En outre, l’approche instantanée consistant à comparer la GD et la SA dans un seul génome pourrait cacher la véritable relation entre la SA et la GD.

.

.

Espèces Données Epissage alternatif Orthologie Contrôle de biais Corrélation Référence
Humain Ensembl Base de données AltSplice de l’ASD BLSATP Exons, Couverture EST, taille de la famille de gènes, nombre d’isoformes Corrélation négative
NCBI, UCSC Programme GeneSplicer EnsMart Suppression des EST inutiles, couverture EST, Corrélation négative
H-InvDB 5.0 H-InvDB 5.0 BLAST Corrélation positive lorsqu’elle inclut toutes les familles de gènes. Corrélation négative au sein des familles multigéniques
Souris Ensembl Base de données AltSplice de l’ASD BLSATP Exons, Couverture EST, taille de la famille de gènes, nombre d’isoformes Corrélation négative
NCBI, UCSC Programme GeneSplicer EnsMart Eliminer les EST inutiles, couverture EST, Corrélation négative
FANTOM3 de Riken FANTOM3 de Riken BLAST Corrélation positive lorsqu’elle inclut toutes les familles de gènes. Corrélation négative au sein des familles multigéniques
C. elegans WormPep WormPep BLAST Plus faible occurrence des AS dans les familles multigéniques
Rice TIGR 4.0 Programme PASA BLASTP Supprimer les gènes qui manquent de preuves de transcription Les familles multigènes ont une incidence de SA significativement plus élevée que les singletons
Arabidopsis TAIR7 TAIR7 TAIR7 Les familles multigéniques ont une incidence de SA significativement plus élevée que les singletons
Tableau 1
Résumé pour la relation entre SA et SGF.

7. Contribution de l’épissage alternatif à l’innovation fonctionnelle

L’épissage alternatif a été salué comme la source d’information manquante dans le génome expliquant l’évolution d’une plus grande complexité malgré le nombre de gènes quasi statique chez les métazoaires au cours des 800 derniers millions d’années. Wegmann et al. ont découvert que la largeur de l’expression des gènes est positivement corrélée au nombre de nouvelles isoformes de transcription et ont proposé que l’augmentation de la largeur de l’expression des gènes soit essentielle à l’acquisition de nouvelles isoformes de transcription, qui pourraient être maintenues par une nouvelle forme de sélection équilibrante. De plus, des analyses expérimentales et bioinformatiques ont montré que l’AS peut générer une variété d’ARNm fonctionnels et de produits protéiques, présentant des propriétés de stabilité, une localisation subcellulaire et une fonction distinctes, ainsi qu’à des stades spécifiques de la différenciation cellulaire, de la différenciation sexuelle et du développement.

Des études sur un seul gène ont fourni des exemples où l’épissage alternatif peut conduire à une innovation fonctionnelle avant que des événements de duplication de gènes aient eu lieu. Un tel exemple est celui de la Troponine I (TnI), qui joue un rôle clé dans la contraction musculaire. Dans le génome des vertébrés, la TnI existe en trois copies, chacune exprimée dans un type de muscle différent (squelettique, rapide et lent, et cardiaque). Chez Ciona, l’un des plus proches parents des vertébrés, la TnI est présente sous la forme d’un seul gène. Cependant, il est intéressant de noter que le gène de Ciona produit trois isoformes distinctes épissées alternativement, chacune ressemblant au profil d’expression de l’un des gènes des vertébrés, ce qui suggère que la spécialisation des protéines TnI pour fonctionner dans chaque type de muscle a précédé les événements de duplication du gène. Ce modèle de variantes d’épissage alternatif dans des gènes ancestralement uniques ressemblant aux profils d’expression de gènes dupliqués ultérieurement a également été trouvé dans les gènes synapsin-2 chez les tétrapodes et les gènes MITF chez les poissons téléostéens. Ces exemples suggèrent que l’épissage alternatif peut être un mécanisme d’innovation fonctionnelle précédant les événements de duplication de gènes par l’une des trois voies possibles (figure 4).

(a) Dégénérescence du signal d'épissage
(a) Dégénérescence du signal d’épissage
(b) Exonisation d'ADN non codant ou de transposons
(b) Exonération d’ADN noncodant ou de transposons
(c) Duplication d'exons et spécialisation des isoformes
(c) Duplication d’exons et spécialisation des isoformes

(a) Dégénérescence du signal d'épissage
(a) Dégénérescence du signal d’épissage(b) Exonération de l'ADN noncodant ou de transposons
(b) Exonération d’ADN non codant ou de transposons(c) Duplication d'exons et spécialisation d'isoformes
(c) Duplication d’exons et spécialisation d’isoformes

Figure 4

De nouveaux variants d’AS peuvent assumer des rôles spécialisés ou nouveaux. Les nouveaux variants d’épissage peuvent provenir (a) de mutations dans le site de reconnaissance de l’exon d’un exon constitutif et de l’acquisition ultérieure d’éléments régulateurs de l’AS. (b) Exonération d’introns ou de régions d’introns ou d’éléments transposables avec acquisition ultérieure de régions régulatrices AS. Les nouvelles protéines peuvent interagir avec différentes protéines ou se localiser dans différentes régions subcellulaires. (c) Duplication d’exons et spécialisation ultérieure de domaines fonctionnels et de régions régulatrices AS. Les protéines spécialisées qui en résultent peuvent assumer des rôles partiels pertinents dans différents types de cellules ou stades de développement ou donner lieu à de nouvelles interactions et fonctions.

Les gènes peuvent également gagner encore en épissage alternatif et en régulation après la duplication, parallèlement à la complexité des systèmes d’organes après la divergence des protochordés et des vertébrés. La comparaison entre les facteurs de transcription des gènes Pax chez les vertébrés et les amphioxus a montré qu’au moins 52 événements d’épissage alternatif ont été signalés chez les vertébrés, contre 23 événements chez les amphioxus. En outre, les gènes Pax des vertébrés ont conservé la plupart de leurs fonctions ancestrales et ont également étendu leur expression. Il a été démontré qu’un nouvel épissage alternatif des gènes Pax modifie le contenu du domaine fonctionnel (par exemple, la liaison à l’ADN) et les capacités de transactivation des produits protéiques résultants. Par exemple, un nouveau transcrit alternatif de Pax3 peut transactiver une construction de rapporteur cMET chez la souris. On a proposé que ces isoformes supplémentaires de Pax3 jouent un rôle fonctionnel dans l’acquisition de nouveaux rôles au niveau de la plaque neurale chez les vertébrés. De même, les événements AS spécifiques aux vertébrés de l’exon 5a de Pax4 et Pax6 ont été liés à des rôles fonctionnels dans le développement de l’œil des vertébrés. Par conséquent, il est raisonnable de proposer l’hypothèse selon laquelle, outre la duplication des gènes, l’épissage alternatif joue un rôle important dans l’acquisition de nouvelles fonctions contribuant à la complexité des systèmes organiques après la divergence des protochordés et des vertébrés. Les rôles potentiels de la prévalence croissante de l’AS chez les vertébrés dans l’innovation fonctionnelle seront largement explorés dans plus de familles de gènes ou au niveau du génome entier à l’avenir, ce qui permettra d’approfondir notre compréhension de la façon dont l’AS contribue à l’innovation fonctionnelle.

8. Conclusion

Nous avons ici passé en revue les preuves provenant d’études à l’échelle du génome ainsi que les pistes possibles pour de futures études comparatives pour le potentiel de l’épissage alternatif comme source d’innovation fonctionnelle au cours de l’évolution du génome eucaryote. S’il est désormais clair que l’AS est prévalent dans le génome humain, des obstacles subsistent dans l’évaluation de l’évolution de l’épissage alternatif au cours du temps. Le principal obstacle réside dans le fait que si la plupart des autres caractéristiques génomiques peuvent être directement mesurées ou estimées à partir des seules séquences génomiques, aucune estimation précise de l’épissage alternatif ne peut être obtenue à partir de l’analyse des séquences génomiques. La dépendance à l’égard de la disponibilité des séquences de transcription pour mesurer l’épissage alternatif, ainsi que le biais important dû à une couverture inégale des transcriptions, ont entravé l’évaluation de l’épissage alternatif à l’échelle du génome dans toutes les espèces modèles, à l’exception de quelques unes, et rendent difficile toute comparaison directe entre les espèces. Cela a ralenti l’étude de l’évolution de l’épissage alternatif au fil du temps, de la régulation de l’AS et de sa relation avec d’autres caractéristiques génomiques et, surtout, avec le phénotype. Le profilage toujours plus important des transcriptions pour beaucoup plus d’espèces, combiné à l’utilisation d’estimations d’indices comparables, permettra d’aborder un certain nombre de questions évolutives concernant l’évolution de l’AS et ses implications pour l’évolution de la diversité des transcriptions et l’innovation fonctionnelle.

Conflit d’intérêts

Les auteurs ne déclarent aucun conflit d’intérêts.

Remerciements

Les auteurs souhaitent remercier Humberto Gutierrez pour ses commentaires sur les versions précédentes de cet article. Ce travail a été financé par une bourse d’excellence Royaume-Uni-Chine et une bourse de recherche de l’Université de Bath à L. Chen, une bourse CONACyT à J. M. Tovar-Corona, et une bourse de recherche Dorothy Hodgkin de la Royal Society, une subvention de recherche de la Royal Society et une subvention de recherche de la Royal Society pour les boursiers à A. O. Urrutia.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.