Publication

A systematic molecular dynamics study of nearest-neighbor effects on base pair and base pair step conformations and fluctuations in B-DNA

Concepts associés (32)

In molecular biology, the term double helix refers to the structure formed by double-stranded molecules of nucleic acids such as DNA. The double helical structure of a nucleic acid complex arises as a consequence of its secondary structure, and is a fundamental component in determining its tertiary structure. The term entered popular culture with the publication in 1968 of The Double Helix: A Personal Account of the Discovery of the Structure of DNA by James Watson.

Modélisation moléculaire

thumb|Animation d'un modèle compact d'ADN en forme B|327x327px|alt=Modèle de l'ADN en forme B La modélisation moléculaire est un ensemble de techniques pour modéliser ou simuler le comportement de molécules. Elle est utilisée pour reconstruire la structure tridimensionnelle de molécules, en particulier en biologie structurale, à partir de données expérimentales comme la cristallographie aux rayons X. Elle permet aussi de simuler le comportement dynamique des molécules et leur mouvements internes.

Dynamique moléculaire

La dynamique moléculaire est une technique de simulation numérique permettant de modéliser l'évolution d'un système de particules au cours du temps. Elle est particulièrement utilisée en sciences des matériaux et pour l'étude des molécules organiques, des protéines, de la matière molle et des macromolécules. En pratique, la dynamique moléculaire consiste à simuler le mouvement d'un ensemble de quelques dizaines à quelques milliers de particules dans un certain environnement (température, pression, champ électromagnétique, conditions aux limites.

Acide désoxyribonucléique

vignette|Structure de la double hélice d'ADN. vignette|Structure chimique de l'ADN illustrant les quatre configurations des paires AT et GC entre les deux armatures de la double hélice, constituées d'une alternance de phosphate et de désoxyribose. L'acide désoxyribonucléique, ou ADN, est une macromolécule biologique présente dans presque toutes les cellules ainsi que chez de nombreux virus. L'ADN contient toute l'information génétique, appelée génome, permettant le développement, le fonctionnement et la reproduction des êtres vivants.

Amarrage (moléculaire)

vignette|Petite molécule amarrée à une protéine. Dans le domaine de la modélisation moléculaire, l’amarrage (en anglais docking) est une méthode qui calcule l'orientation préférée d'une molécule vers une seconde lorsqu'elles sont liées pour former un complexe stable. Connaître l'orientation préférée sert à prévoir la solidité de l'union entre deux molécules. Les associations entre des molécules d'importance biologique, telles que les protéines, les acides nucléiques, les glucides et les matières grasses jouent un rôle essentiel dans la transduction de signal.

Implicit solvation

Implicit solvation (sometimes termed continuum solvation) is a method to represent solvent as a continuous medium instead of individual “explicit” solvent molecules, most often used in molecular dynamics simulations and in other applications of molecular mechanics. The method is often applied to estimate free energy of solute-solvent interactions in structural and chemical processes, such as folding or conformational transitions of proteins, DNA, RNA, and polysaccharides, association of biological macromolecules with ligands, or transport of drugs across biological membranes.

Nucleic acid structure prediction

Nucleic acid structure prediction is a computational method to determine secondary and tertiary nucleic acid structure from its sequence. Secondary structure can be predicted from one or several nucleic acid sequences. Tertiary structure can be predicted from the sequence, or by comparative modeling (when the structure of a homologous sequence is known).

Modèle d'eau

En chimie numérique, les modèles d'eau classiques sont utilisés pour la simulation de l'eau et des solutions aqueuses (avec ce qu'on appelle un solvant explicite, par opposition aux modèles à solvants implicites). Ces modèles utilisent généralement les approximations de la mécanique moléculaire. De nombreux et différents modèles ont été proposés ; ils peuvent être classés en fonction du nombre de points employés pour définir le modèle (atomes plus sites spécifiques), de la rigidité ou de la flexibilité de la structure, ou encore de la prise en compte des effets de polarisation.

Séquence conservée

En biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.

Structure de l'ARN

thumb|right|300 px|Structure 3D d'un ARN régulateur (riboswitch) La structure de l'ARN décrit l'arrangement des paires de bases et de la conformation de l'ARN en trois dimensions. L'ARN étant trouvé le plus souvent sous forme de simple-brin dans la cellule, il se replie en effet sur lui-même en formant des appariements Watson-Crick intramoléculaires. Ceci conduit à la formation de régions localement en hélice et de régions en boucle où les bases ne sont pas appariées.

ADN polymérase

thumb|right|250px|La réplication de l'ADN par une ADN polymérase. Une ADN polymérase est une enzyme faisant partie du complexe enzymatique intervenant dans la réplication de l’ADN au cours du cycle cellulaire lors de la phase S, mais aussi dans des processus de réparation et de recombinaison de l'ADN. Les ADN polymérases utilisent des désoxyribonucléosides triphosphate comme base pour la synthèse d'un brin d'ADN, en utilisant un autre brin d'ADN comme matrice.

Sens 5' vers 3'

Le est le sens de synthèse des acides nucléiques par une ADN polymérase ou une ARN polymérase. Par convention, on oriente le brin d'acide nucléique de gauche à droite en fonction des groupes libres sur les nucléotides localisés à chaque extrémité (5′ ou 3′). Nucléotide vignette |redresse=2 |alt=furanose |Représentation schématique d'un furanose, un ose possédant un hétérocycle à 5 carbones. Les atomes de carbone de ce pentose sont numérotés de 1′ à 5′. Dans un nucléotide, la base azotée se lie au carbone 1′ et le phosphate au 5′.

Génome

Le génome (//), ou plus rarement génôme, est l'ensemble du matériel génétique d'une espèce codé dans son acide désoxyribonucléique (ADN), à l'exception de certains virus dont le génome est constitué d'acide ribonucléique (ARN). Il contient en particulier tous les gènes codant des protéines ou correspondant à des ARN structurés. Il se décompose donc en séquences codantes (transcrites en ARN messagers et traduites en protéines) et non codantes (non transcrites, ou transcrites en ARN, mais non traduites).

Paire de bases

vignette|Paire de base GC avec ses 3 liaisons hydrogène intermoléculaires vignette|Paire de base AT avec ses 2 liaisons hydrogène intermoléculaires vignette|Les paires de bases (en gris clair) relient les deux brins de l'ADN (en gris foncé) Une paire de bases () est l'appariement de deux bases nucléiques situées sur deux brins complémentaires d'ADN ou ARN. Cet appariement est effectué par des ponts hydrogène. Il y a quatre types de bases nucléiques : A-T-C-G, ces lettres pour Adénine, Thymine, Cytosine et Guanine.

Protéine

redresse=1.36|vignette|Représentation d'une protéine, ici deux sous-unités d'une molécule d'hémoglobine. On observe les représentées en couleur, ainsi que deux des quatre molécules d'hème, qui sont les groupes prosthétiques caractéristiques de cette protéine. redresse=1.36|vignette|Liaison peptidique –CO–NH– au sein d'un polypeptide. Le motif constitue le squelette de la protéine, tandis que les groupes liés aux sont les chaînes latérales des résidus d'acides aminés.

Dénaturation de l'ADN

La dénaturation de l'ADN, ou fonte de l'ADN, est un processus qui conduit à transformer un double brin d'ADN en deux simples brins, en rompant les liaisons hydrogène entre les bases nucléiques des deux chaînes complémentaires de l'ADN. Cette dénaturation peut être réalisée in vitro en soumettant l'ADN à tout agent chimique ou physique capable de déstabiliser les liaisons hydrogène, comme le pH, la température, certains solvants, des concentrations ioniques élevées, des agents alcalins,...

Sequence analysis

In bioinformatics, sequence analysis is the process of subjecting a DNA, RNA or peptide sequence to any of a wide range of analytical methods to understand its features, function, structure, or evolution. Methodologies used include sequence alignment, searches against biological databases, and others. Since the development of methods of high-throughput production of gene and protein sequences, the rate of addition of new sequences to the databases increased very rapidly.

Structure des protéines

La structure des protéines est la composition en acides aminés et la conformation en trois dimensions des protéines. Elle décrit la position relative des différents atomes qui composent une protéine donnée. Les protéines sont des macromolécules de la cellule, dont elles constituent la « boîte à outils », lui permettant de digérer sa nourriture, produire son énergie, de fabriquer ses constituants, de se déplacer, etc. Elles se composent d'un enchaînement linéaire d'acides aminés liés par des liaisons peptidiques.

Structure primaire

vignette|Structure des protéines, en particulier la structure primaire En biochimie, la structure primaire d'une biomolécule non-ramifiée comme une protéine ou un brin d'ADN ou d'ARN, est la séquence de nucléotides ou d'acides aminés du début à la fin de la molécule. Autrement dit, la structure primaire représente l'exacte composition chimique et la séquence de ses sous-unités monomériques. La structure primaire d'un polymère biologique détermine largement sa forme tridimensionnelle, connue sous le nom de structure tertiaire.

Méthode des k plus proches voisins

En intelligence artificielle, plus précisément en apprentissage automatique, la méthode des k plus proches voisins est une méthode d’apprentissage supervisé. En abrégé KPPV ou k-PPV en français, ou plus fréquemment k-NN ou KNN, de l'anglais k-nearest neighbors. Dans ce cadre, on dispose d’une base de données d'apprentissage constituée de N couples « entrée-sortie ». Pour estimer la sortie associée à une nouvelle entrée x, la méthode des k plus proches voisins consiste à prendre en compte (de façon identique) les k échantillons d'apprentissage dont l’entrée est la plus proche de la nouvelle entrée x, selon une distance à définir.