Introduction aux données PDB

L’archive PDB est un dépôt de coordonnées atomiques et d’autres informations décrivant lesprotéines et autres macromolécules biologiques importantes. Les biologistes structurels utilisent des méthodes telles que la cristallographie aux rayons X, la spectroscopie RMN et la cryo-microscopie électronique pour déterminer l’emplacement de chaque atome les uns par rapport aux autres dans la molécule.Ils déposent ensuite ces informations, qui sont ensuite annotées et diffusées publiquement dans les archives par la wwPDB.

La PDB, en croissance constante, est le reflet de la recherche qui se déroule dans les laboratoires du monde entier. Cela peut rendre l’utilisation de la base de données dans la recherche et l’éducation à la fois passionnante et difficile. Les structures sont disponibles pour un grand nombre de protéines et d’acides nucléiques impliqués dans les processus centraux de la vie. Vous pouvez donc consulter les archives de la PDB pour trouver des structures de ribosomes, d’oncogènes, de cibles médicamenteuses et même de virus entiers. Cependant, il peut être difficile de trouver les informations dont vous avez besoin, car la PDB archive un grand nombre de structures différentes. Vous trouverez souvent plusieurs structures pour une molécule donnée, ou des structures partielles, ou des structures qui ont été modifiées ou inactivées par rapport à leur forme native.

Le Guide pour comprendre les données PDB est conçu pour vous aider à commencer à tracer un chemin à travers ce matériel, et vous aider à éviter quelques pièges courants. Ces chapitres sont étroitement liés les uns aux autres. Pour commencer, sélectionnez un sujet dans le menu de droite, ou sélectionnez un sujet ci-dessous :

  • Données PDB

    Les informations primaires stockées dans les archives PDB consistent en des fichiers de coordonnées pour les molécules biologiques. Ces fichiers répertorient les atomes de chaque protéine, ainsi que leur localisation dans l’espace en 3D. Ces fichiers sont disponibles dans plusieurs formats (PDB, mmCIF, XML). Un fichier PDB typique comprend une grande section « d’en-tête » de texte qui résume la protéine, des informations sur la citation et les détails de la solution de la structure, suivie de la séquence et d’une longue liste d’atomes et de leurs coordonnées. L’archive contient également les observations expérimentales qui sont utilisées pour déterminer ces coordonnées atomiques.

  • Visualisation des structures

    Bien que vous puissiez visualiser les fichiers PDB directement à l’aide d’un éditeur de texte, il est souvent plus utile d’utiliser un programme de navigation ou de visualisation pour les regarder. Les outils en ligne, tels que ceux du site PDB du RCSB, vous permettent de rechercher et d’explorer les informations contenues dans l’en-tête PDB, y compris les informations sur les méthodes expérimentales et la chimie et la biologie de la protéine. Une fois que vous avez trouvé les entrées PDB qui vous intéressent, vous pouvez utiliser des programmes de visualisation qui vous permettent de lire dans le fichier PDB, d’afficher la structure de la protéine sur votre ordinateur et de créer des images personnalisées de celle-ci.Ces programmes comprennent aussi souvent des outils d’analyse qui vous permettent de mesurer les distances et les angles de liaison, et d’identifier les caractéristiques structurelles intéressantes.

  • Lecture des fichiers de coordonnées

    Lorsque vous commencez à explorer les structures dans les archives PDB, vous devrez savoir quelques choses sur les fichiers de coordonnées. Dans une entrée typique, vous trouverez un mélange diversifié de molécules biologiques, de petites molécules, d’ions et d’eau. Souvent, vous pouvez utiliser les noms et les ID des chaînes pour vous aider à les trier. Dans les structures déterminées par cristallographie, les atomes sont annotés avec des facteurs de température qui décrivent leur vibration et des occupations qui indiquent s’ils sont vus dans plusieurs conformations. Les structures RMN comprennent souvent plusieurs modèles différents de la molécule.

  • Défis potentiels

    Vous pouvez rencontrer plusieurs défis en explorant les archives PDB. Par exemple, de nombreuses structures,notamment celles déterminées par cristallographie, ne comprennent que des informations sur une partie de l’assemblage biologique fonctionnel. Heureusement, la PDB peut vous aider dans ce domaine. De même, de nombreuses entrées de la PDB ne contiennent pas les parties de la molécule qui n’ont pas été observées lors de l’expérience. Il s’agit notamment de structures qui ne comprennent que des positions de carbone alpha, de structures avec des boucles manquantes, de structures de domaines individuels ou de sous-unités d’une molécule plus grande. En outre, la plupart des entrées de structures cristallographiques ne comportent pas d’informations sur les atomes d’hydrogène.

Sauf indication contraire, cette rubrique est rédigée et illustrée par David S. Goodsell.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.