Alignement de séquencesEn bio-informatique, l'alignement de séquences (ou alignement séquentiel) est une manière de représenter deux ou plusieurs séquences de macromolécules biologiques (ADN, ARN ou protéines) les unes sous les autres, de manière à en faire ressortir les régions homologues ou similaires. L'objectif de l'alignement est de disposer les composants (nucléotides ou acides aminés) pour identifier les zones de concordance. Ces alignements sont réalisés par des programmes informatiques dont l'objectif est de maximiser le nombre de coïncidences entre nucléotides ou acides aminés dans les différentes séquences.
Biologie structuralevignette|droite|Structure 3D de la myoglobine du grand cachalot (PDB ID 1MBO), la première protéine dont la structure a été résolue par cristallographie aux rayons X par John Kendrew et al. en 1958. La biologie structurale est la branche de la biologie qui étudie la structure et l'organisation spatiale des macromolécules biologiques, principalement les protéines et les acides nucléiques.
Structural genomicsStructural genomics seeks to describe the 3-dimensional structure of every protein encoded by a given genome. This genome-based approach allows for a high-throughput method of structure determination by a combination of experimental and modeling approaches. The principal difference between structural genomics and traditional structural prediction is that structural genomics attempts to determine the structure of every protein encoded by the genome, rather than focusing on one particular protein.
Modélisation de protéines par homologiethumb|Modélisation de protéines par homologie La modélisation de protéines par homologie, également connue sous le nom de modélisation comparative des protéines, se réfère à la construction d’un modèle d’une protéine « cible », dont la résolution est de niveau atomique, à partir de sa séquence d’acides aminés et d'une structure expérimentale tridimensionnelle d’une protéine homologue connexe (le « modèle »).
Domaine protéiqueredresse=1.15|vignette|Exemples de structures de protéines organisées en domaines distincts. Le domaine de couleur brique, appelé domaine PH, est commun aux deux protéines,. Sa fonction est de fixer le phosphatidylinositol-3,4,5-trisphosphate (PIP3) Un domaine protéique est une partie d'une protéine capable d'adopter une structure de manière autonome ou partiellement autonome du reste de la molécule. C'est un élément modulaire de la structure des protéines qui peuvent ainsi être composées de l'assemblage de plusieurs de ces domaines.
Multiple sequence alignmentMultiple sequence alignment (MSA) may refer to the process or the result of sequence alignment of three or more biological sequences, generally protein, DNA, or RNA. In many cases, the input set of query sequences are assumed to have an evolutionary relationship by which they share a linkage and are descended from a common ancestor. From the resulting MSA, sequence homology can be inferred and phylogenetic analysis can be conducted to assess the sequences' shared evolutionary origins.
Protein Data BankLa banque de données sur les protéines ou BDP du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data Bank ou PDB est une collection mondiale de données sur la structure tridimensionnelle (ou structure 3D) de macromolécules biologiques : protéines, essentiellement, et acides nucléiques. Ces structures sont essentiellement déterminées par cristallographie aux rayons X ou par spectroscopie RMN. Ces données expérimentales sont déposées dans la PDB par des biologistes et des biochimistes du monde entier et appartiennent au domaine public.
Protein designProtein design is the rational design of new protein molecules to design novel activity, behavior, or purpose, and to advance basic understanding of protein function. Proteins can be designed from scratch (de novo design) or by making calculated variants of a known protein structure and its sequence (termed protein redesign). Rational protein design approaches make protein-sequence predictions that will fold to specific structures.
CASPCritical Assessment of Structure Prediction (CASP), sometimes called Critical Assessment of Protein Structure Prediction, is a community-wide, worldwide experiment for protein structure prediction taking place every two years since 1994. CASP provides research groups with an opportunity to objectively test their structure prediction methods and delivers an independent assessment of the state of the art in protein structure modeling to the research community and software users.
Séquence conservéeEn biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.
Protéines intrinsèquement désordonnéesLes protéines intrinsèquement désordonnées ou intrinsèquement non structurées sont des protéines qui manquent de structure tridimensionnelle stable, ce qui leur confère une forte plasticité qui est à l'origine de leur importance dans les phénomènes biologiques. Une protéine peut être totalement désordonnée, mais le cas le plus courant est celui où seulement une partie de la molécule, plus ou moins longue, est désordonnée (exemple : ).
Repliement des protéinesthumb|right|300px|Repliement des protéines Le repliement des protéines est le processus physique par lequel un polypeptide se replie dans sa structure tridimensionnelle caractéristique dans laquelle il est fonctionnel. Chaque protéine commence sous forme de polypeptide, transcodée depuis une séquence d'ARNm en une chaîne linéaire d'acides aminés. Ce polypeptide ne possède pas à ce moment de structure tridimensionnelle développée (voir côté gauche de la figure).
Bio-informatiqueLa bioinformatique (ou bio-informatique), est un champ de recherche multidisciplinaire de la biotechnologie où travaillent de concert biologistes, médecins, informaticiens, mathématiciens, physiciens et bioinformaticiens, dans le but de résoudre un problème scientifique posé par la biologie. Plus généralement, la bio-informatique est l'application de la statistique et de l'informatique à la science biologique. Le spécialiste qui travaille à mi-chemin entre ces sciences et l'informatique est appelé bioinformaticien ou bionaute.
Structural alignmentStructural alignment attempts to establish homology between two or more polymer structures based on their shape and three-dimensional conformation. This process is usually applied to protein tertiary structures but can also be used for large RNA molecules. In contrast to simple structural superposition, where at least some equivalent residues of the two structures are known, structural alignment requires no a priori knowledge of equivalent positions.
Structure primairevignette|Structure des protéines, en particulier la structure primaire En biochimie, la structure primaire d'une biomolécule non-ramifiée comme une protéine ou un brin d'ADN ou d'ARN, est la séquence de nucléotides ou d'acides aminés du début à la fin de la molécule. Autrement dit, la structure primaire représente l'exacte composition chimique et la séquence de ses sous-unités monomériques. La structure primaire d'un polymère biologique détermine largement sa forme tridimensionnelle, connue sous le nom de structure tertiaire.
Amarrage macromoléculaireL'amarrage macromoléculaire (en macromolecular docking) est la modélisation informatique de la structure quaternaire de complexes formés par plusieurs macromolécules biologiques en interaction. Les modélisations les plus courantes étant celles des complexes protéine-protéine et protéine-acide nucléique. L'amarrage vise à prédire la structure tri-dimensionnelle du complexe telle qu'elle est dans l'organisme vivant. La procédure peut produire plusieurs structures candidates qui vont ensuite être classées suivant leur pertinence d'apparaître dans la nature.
Structure secondairethumb|200px|Schéma de la structure tridimensionnelle de la protéine myoglobine. Cette structure contient de hélices α mais pas de feuillets β. Cette protéine est la première dont la structure a été résolue par cristallographie en 1958, par Max Perutz et John Kendrew, ce qui leur a valu l'attribution du prix Nobel de chimie en 1962. En biochimie et en biologie structurale, la structure secondaire se rapporte uniquement à la description de la structure tridimensionnelle localement adoptée par certains segments de molécules biologiques (molécules définies comme étant des biopolymères, comme c’est le cas pour les protéines et les acides nucléiques (ADN/ARN)).
Modélisation de protéines par enfilageLa modélisation d'une protéine par enfilage ou modélisation par reconnaissance des repliements est une technique utilisée pour modéliser des protéines dont on souhaite qu'elles présentent les mêmes coudes que des structures de protéines connues, mais qui ne possèdent pas de protéines homologues recensées dans la banque de données sur les protéines (PDB). Elle s'oppose donc à la méthode de prédiction de structure basée sur la modélisation par homologie.
Rosetta@homeRosetta@home est un projet de calcul distribué ouvert le . Son objectif est déterminer la structure de protéines, afin de pouvoir élaborer des traitements contre les principales pathologies humaines. Ce projet est mené par le laboratoire du professeur de l'université de Washington. En , le projet a une puissance de calcul de 156 téraFLOPS. Rosetta@home est un projet informatique de calcul distribué qui utilise le système BOINC disponible sur les plates formes Windows, Linux, et Mac OS X.
Structure tertiaireEn biochimie, la structure tertiaire ou tridimensionnelle est le repliement dans l'espace d'une chaîne polypeptidique. Ce repliement donne sa fonctionnalité à la protéine, notamment par la formation du site actif des enzymes. . La structure tertiaire correspond au degré d'organisation supérieur aux hélices α ou aux feuillets β. Ces protéines possèdent des structures secondaires associées le long de la chaîne polypeptidique. Le repliement et la stabilisation de protéines à structure tertiaire dépend de plusieurs types de liaisons faibles qui stabilisent l'édifice moléculaire.