Publication

Detection and sequence/structure mapping of biophysical constraints to protein variation in saturated mutational libraries and protein sequence alignments with a dedicated server

Concepts associés (16)

In bioinformatics, sequence analysis is the process of subjecting a DNA, RNA or peptide sequence to any of a wide range of analytical methods to understand its features, function, structure, or evolution. Methodologies used include sequence alignment, searches against biological databases, and others. Since the development of methods of high-throughput production of gene and protein sequences, the rate of addition of new sequences to the databases increased very rapidly.

Structural alignment

Structural alignment attempts to establish homology between two or more polymer structures based on their shape and three-dimensional conformation. This process is usually applied to protein tertiary structures but can also be used for large RNA molecules. In contrast to simple structural superposition, where at least some equivalent residues of the two structures are known, structural alignment requires no a priori knowledge of equivalent positions.

Alignement de séquences

En bio-informatique, l'alignement de séquences (ou alignement séquentiel) est une manière de représenter deux ou plusieurs séquences de macromolécules biologiques (ADN, ARN ou protéines) les unes sous les autres, de manière à en faire ressortir les régions homologues ou similaires. L'objectif de l'alignement est de disposer les composants (nucléotides ou acides aminés) pour identifier les zones de concordance. Ces alignements sont réalisés par des programmes informatiques dont l'objectif est de maximiser le nombre de coïncidences entre nucléotides ou acides aminés dans les différentes séquences.

Multiple sequence alignment

Multiple sequence alignment (MSA) may refer to the process or the result of sequence alignment of three or more biological sequences, generally protein, DNA, or RNA. In many cases, the input set of query sequences are assumed to have an evolutionary relationship by which they share a linkage and are descended from a common ancestor. From the resulting MSA, sequence homology can be inferred and phylogenetic analysis can be conducted to assess the sequences' shared evolutionary origins.

Prédiction de la structure des protéines

La prédiction de la structure des protéines est l'inférence de la structure tridimensionnelle des protéines à partir de leur séquences d'acides aminés, c'est-à-dire la prédiction de leur pliage et de leur structures secondaire et tertiaire à partir de leur structure primaire. La prédiction de la structure est fondamentalement différente du problème inverse de la conception des protéines. Elle est l'un des objectifs les plus importants poursuivis par la bioinformatique et la chimie théorique.

Modélisation de protéines par enfilage

La modélisation d'une protéine par enfilage ou modélisation par reconnaissance des repliements est une technique utilisée pour modéliser des protéines dont on souhaite qu'elles présentent les mêmes coudes que des structures de protéines connues, mais qui ne possèdent pas de protéines homologues recensées dans la banque de données sur les protéines (PDB). Elle s'oppose donc à la méthode de prédiction de structure basée sur la modélisation par homologie.

Séquence conservée

En biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.

Super-famille de protéines

Une superfamille (ou super-famille) de protéines est le regroupement le plus large (clade) de protéines pour lesquelles il est possible d'identifier un ancêtre commun par homologie. Cet ancêtre commun est généralement déduit par et similitude mécanique, même lorsque aucune similitude entre les séquences n'est détectable. Les super-familles contiennent généralement plusieurs familles de protéines présentant des similitudes de séquences au sein de ces familles.

Espace de suites ℓp

En mathématiques, l'espace est un exemple d'espace vectoriel, constitué de suites à valeurs réelles ou complexes et qui possède, pour 1 ≤ p ≤ ∞, une structure d'espace de Banach. Considérons l'espace vectoriel réel R, c'est-à-dire l'espace des n-uplets de nombres réels. La norme euclidienne d'un vecteur est donnée par : Mais pour tout nombre réel p ≥ 1, on peut définir une autre norme sur R, appelée la p-norme, en posant : pour tout vecteur . Pour tout p ≥ 1, R muni de la p-norme est donc un espace vectoriel normé.

Famille de protéines

Une famille de protéines est un ensemble de protéines généralement codées par une famille de gènes. Les familles de protéines regroupent des protéines ayant des caractéristiques proches en termes de structure, de fonction enzymatique et de fonction cellulaire. Le terme famille de protéines peut être employé pour décrire un groupe de protéines non apparentées mais partageant une fonction commune, par exemple, les protéines de choc thermique, la désignation correcte serait ici de parler de classe de protéines.

Séquence (acide nucléique)

vignette| Séquence d'un ARN messager faisant apparaître ses codons. La séquence d'un acide nucléique — ADN ou ARN — est la succession des nucléotides qui le constituent. Cette succession contient l'information génétique portée par ces polynucléotides, de sorte qu'on la qualifie également de séquence génétique ou parfois de séquence nucléotidique. Elle peut être déterminée par des méthodes de séquençage de l'ADN. Les séquences nucléotidiques sont conventionnellement écrites dans le sens , qui est celui dans lequel sont lues et synthétisées ces biomolécules.

Suite spectrale

En algèbre homologique et en topologie algébrique, une suite spectrale est une suite de modules différentiels (En,dn) tels que En+1 = H(En) = Ker dn / dn est l'homologie de En. Elles permettent donc de calculer des groupes d'homologie par approximations successives. Elles ont été introduites par Jean Leray en 1946. Il y a plusieurs manières en pratique pour obtenir une telle suite. Historiquement, depuis 1950, les arguments des suites spectrales ont été un outil performant pour la recherche, notamment dans la théorie de l'homotopie.

Serre spectral sequence

In mathematics, the Serre spectral sequence (sometimes Leray–Serre spectral sequence to acknowledge earlier work of Jean Leray in the Leray spectral sequence) is an important tool in algebraic topology. It expresses, in the language of homological algebra, the singular (co)homology of the total space X of a (Serre) fibration in terms of the (co)homology of the base space B and the fiber F. The result is due to Jean-Pierre Serre in his doctoral dissertation. Let be a Serre fibration of topological spaces, and let F be the (path-connected) fiber.

Biomolecular structure

Biomolecular structure is the intricate folded, three-dimensional shape that is formed by a molecule of protein, DNA, or RNA, and that is important to its function. The structure of these molecules may be considered at any of several length scales ranging from the level of individual atoms to the relationships among entire protein subunits. This useful distinction among scales is often expressed as a decomposition of molecular structure into four levels: primary, secondary, tertiary, and quaternary.

Protein engineering

Protein engineering is the process of developing useful or valuable proteins through the design and production of unnatural polypeptides, often by altering amino acid sequences found in nature. It is a young discipline, with much research taking place into the understanding of protein folding and recognition for protein design principles. It has been used to improve the function of many enzymes for industrial catalysis. It is also a product and services market, with an estimated value of $168 billion by 2017.

Conglomérat (géologie)

En pétrographie, un conglomérat est une roche détritique (issue de la dégradation mécanique d'autres roches) composée de morceaux discernables liés entre eux par un ciment naturel. Pour être considérés comme discernables, les morceaux doivent mesurer plus de (en dessous de cette taille, on aurait affaire à un grès et non plus à un conglomérat). Les conglomérats sont le plus souvent de nature sédimentaire, mais ils peuvent également être volcaniques.