Domaine protéiqueredresse=1.15|vignette|Exemples de structures de protéines organisées en domaines distincts. Le domaine de couleur brique, appelé domaine PH, est commun aux deux protéines,. Sa fonction est de fixer le phosphatidylinositol-3,4,5-trisphosphate (PIP3) Un domaine protéique est une partie d'une protéine capable d'adopter une structure de manière autonome ou partiellement autonome du reste de la molécule. C'est un élément modulaire de la structure des protéines qui peuvent ainsi être composées de l'assemblage de plusieurs de ces domaines.
GlobineLes globines sont des protéines globulaires dont on pense qu'elles partagent un ancêtre commun, c'est-à-dire qu'elles forment une famille de protéines. Elles présentent toutes le repliement globine, qui fait intervenir huit hélices α. Ce sont des hémoprotéines intervenant dans le stockage ou le transport de l'oxygène : la myoglobine et l'hémoglobine sont deux membres éminents de cette famille, présente chez de très nombreux êtres vivants.
Matrice de similaritéLes matrices de similarité ou matrices de substitution sont des matrices utilisées en bioinformatique pour réaliser des alignements de séquences biologiques reliées évolutivement. Elles permettent de donner un score de similarité ou de ressemblance entre deux acides aminés. Ces matrices, M, sont des matrices 20 x 20 (pour les 20 acides aminés protéinogènes standards) qui recensent l'ensemble des scores M(a,b) obtenus lorsqu'on substitue l'acide aminé a à l'acide b dans un alignement.
Super-famille de protéinesUne superfamille (ou super-famille) de protéines est le regroupement le plus large (clade) de protéines pour lesquelles il est possible d'identifier un ancêtre commun par homologie. Cet ancêtre commun est généralement déduit par et similitude mécanique, même lorsque aucune similitude entre les séquences n'est détectable. Les super-familles contiennent généralement plusieurs familles de protéines présentant des similitudes de séquences au sein de ces familles.
Séquence conservéeEn biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.
Structure des protéinesLa structure des protéines est la composition en acides aminés et la conformation en trois dimensions des protéines. Elle décrit la position relative des différents atomes qui composent une protéine donnée. Les protéines sont des macromolécules de la cellule, dont elles constituent la « boîte à outils », lui permettant de digérer sa nourriture, produire son énergie, de fabriquer ses constituants, de se déplacer, etc. Elles se composent d'un enchaînement linéaire d'acides aminés liés par des liaisons peptidiques.
Séquence homologueEn biologie moléculaire, les séquences homologues sont deux ou plusieurs séquences nucléotidiques partageant une origine évolutive commune, c'est-à-dire présentant une homologie au sens de l'évolution moléculaire. Deux segments d'ADN distincts sont susceptibles d'avoir une origine commune à la suite d'une spéciation (orthologie), d'une duplication (paralogie) ou d'un transfert horizontal de gènes.
UniProtUniProt est une base de données de séquences de protéines. Son nom dérive de la contraction de Universal Protein Resource (base de données universelle de protéines). C'est une base de données ouverte, stable et accessible en ligne, elle est issue de la consolidation de l'ensemble des données produites par la communauté scientifique. UniProt est une base annotée, hiérarchisée où chaque séquence est accompagnée d'un ensemble riche de métadonnées et de liens vers de nombreuses autres bases de données : bibliographiques, phylogénétiques, nucléotidiques.
Structure primairevignette|Structure des protéines, en particulier la structure primaire En biochimie, la structure primaire d'une biomolécule non-ramifiée comme une protéine ou un brin d'ADN ou d'ARN, est la séquence de nucléotides ou d'acides aminés du début à la fin de la molécule. Autrement dit, la structure primaire représente l'exacte composition chimique et la séquence de ses sous-unités monomériques. La structure primaire d'un polymère biologique détermine largement sa forme tridimensionnelle, connue sous le nom de structure tertiaire.
Triade catalytiqueredresse=1.5|vignette| Site actif de la protéase TEV (), une peptidase très sélective du virus de la gravure du tabac, montrant le substrat en noir et les résidus de la triade catalytique en rouge, ici l'aspartate (acide), l'histidine (base) et la cystéine (nucléophile). En biologie moléculaire, on désigne généralement par triade catalytique les trois résidus d'acides aminés qui interviennent ensemble dans le site actif de certaines hydrolases et transférases telles que des peptidases, des amidases, des estérases, des lipases et des β-lactamases.
Multiple sequence alignmentMultiple sequence alignment (MSA) may refer to the process or the result of sequence alignment of three or more biological sequences, generally protein, DNA, or RNA. In many cases, the input set of query sequences are assumed to have an evolutionary relationship by which they share a linkage and are descended from a common ancestor. From the resulting MSA, sequence homology can be inferred and phylogenetic analysis can be conducted to assess the sequences' shared evolutionary origins.
Alignement de séquencesEn bio-informatique, l'alignement de séquences (ou alignement séquentiel) est une manière de représenter deux ou plusieurs séquences de macromolécules biologiques (ADN, ARN ou protéines) les unes sous les autres, de manière à en faire ressortir les régions homologues ou similaires. L'objectif de l'alignement est de disposer les composants (nucléotides ou acides aminés) pour identifier les zones de concordance. Ces alignements sont réalisés par des programmes informatiques dont l'objectif est de maximiser le nombre de coïncidences entre nucléotides ou acides aminés dans les différentes séquences.
PeptidaseLes peptidases (ou protéases ou enzymes protéolytiques) sont des enzymes qui brisent les liaisons peptidiques des protéines. On parle alors de coupure protéolytique ou de protéolyse. Ce processus implique l'utilisation d'une molécule d'eau ce qui les classe parmi les hydrolases. Les fonctions biologiques des protéases sont variées : elles interviennent dans la maturation des protéines, dans la digestion des aliments, dans la coagulation sanguine, dans le remodelage des tissus au cours du développement de l'organisme et dans la cicatrisation.
Site actifLe site actif désigne en catalyse la partie du catalyseur qui va interagir avec le(s) substrat(s) pour former le(s) produit(s). Cette notion concerne tous les types de catalyseurs, mais on l'associe généralement aux enzymes. Le site actif des catalyseurs fait l'objet d'études poussées dans le cadre de la recherche de nouveaux catalyseurs et de l'étude des mécanismes réactionnels en biochimie.. Or, si la structure du site actif est modifié, la catalyse ne peut avoir lieu.
Protéase à cystéineUne protéase à cystéine, ou parfois protéase à thiol, est une peptidase dont le résidu d'acide aminé nucléophile de la triade (ou diade) catalytique est une cystéine. Comme toutes les peptidases, ces enzymes catalysent l'hydrolyse de certaines liaisons peptidiques de protéines. On trouve couramment de telles enzymes dans les fruits, par exemple la papaye, l'ananas, la figue et le kiwi, leur concentration tendant à être plus élevée lorsque le fruit n'est pas mûr ; on en trouve en fait plus généralement dans un grand nombre de plantes.