Séquence conservéeEn biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.
Séquence régulatriceLes séquences régulatrices, appelées aussi séquence-cis, sont une partie de l’ADN non codant (séquences du génome qui ne sont pas traduites en protéines) et qui influent sur le niveau de transcription des gènes. Elles sont reconnues par des facteurs de transcription, appelés facteur-trans, qui agissent de différentes façons, en augmentant ou en diminuant l’expression du gène. Les séquences régulatrices interviennent ainsi au niveau de l’initiation de la transcription dans la régulation de l'expression des gènes.
Interférence par ARNUn ARN interférent est un acide ribonucléique (ARN) simple ou double brin dont l'interférence avec un ARN messager spécifique conduit à sa dégradation et à la diminution de sa traduction en protéine. Dans la mesure où l'ARN joue un rôle crucial dans l'expression des gènes, l'ARN interférent permet de bloquer celle-ci en rendant « silencieux » tel ou tel gène. Ce phénomène a été découvert dans les années 1990, valant à Andrew Z. Fire et Craig C. Mello le prix Nobel de physiologie et de médecine en 2006.
Acide ribonucléique messagervignette|Représentation schématique de la synthèse et de la maturation d'un ARN messager dans une cellule eucaryote. L'acide ribonucléique messager, ARN messager, ou ARNm (en anglais, mRNA, pour messenger ribonucleic acid), est une molécule intermédiaire d'acide ribonucléique (ARN), consistant en une copie transitoire d'une portion de l'ADN correspondant à un ou plusieurs gènes d'un organisme biologique. L'ARNm est utilisé comme intermédiaire par les cellules pour la synthèse des protéines.
Séquence codantevignette|Schéma simplifié du dogme central de la biologie moléculaire. Certaines séquences d'ADN subissent une transcription afin de générer un ARN messager primaire. Cet ARNm subit différentes transformations, notamment l'épissage, par lequel les introns sont enlevés, pour générer un transcrit mature. Finalement, les ribosomes traduisent la séquence codante en protéine. La séquence codante est indiquée en vert.
Acide ribonucléiquevignette|Structure tridimensionnelle d'un ARN régulateur (riboswitch). vignette|Structure moléculaire de l'ARN. L'acide ribonucléique ou ARN (en anglais, RNA, pour ribonucleic acid) est un acide nucléique présent chez pratiquement tous les êtres vivants, et aussi chez certains virus. L'ARN est très proche chimiquement de l'ADN et il est d'ailleurs en général synthétisé dans les cellules à partir d'un segment d'ADN matrice dont il est une copie.
Conserved non-coding sequenceA conserved non-coding sequence (CNS) is a DNA sequence of noncoding DNA that is evolutionarily conserved. These sequences are of interest for their potential to regulate gene production. CNSs in plants and animals are highly associated with transcription factor binding sites and other cis-acting regulatory elements. Conserved non-coding sequences can be important sites of evolutionary divergence as mutations in these regions may alter the regulation of conserved genes, producing species-specific patterns of gene expression.
Nucleic acid structure predictionNucleic acid structure prediction is a computational method to determine secondary and tertiary nucleic acid structure from its sequence. Secondary structure can be predicted from one or several nucleic acid sequences. Tertiary structure can be predicted from the sequence, or by comparative modeling (when the structure of a homologous sequence is known).
Régulation de l'expression des gènesLa régulation de l'expression des gènes désigne l'ensemble de mécanismes mis en œuvre pour passer de l'information génétique incluse dans une séquence d'ADN à un produit de gène fonctionnel (ARN ou protéine). Elle a pour effet de moduler, d'augmenter ou de diminuer la quantité des produits de l'expression des gènes (ARN, protéines). Toutes les étapes allant de la séquence d'ADN au produit final peuvent être régulées, que ce soit la transcription, la maturation des ARNm, la traduction des ARNm ou la stabilité des ARNm et protéines.
Structure secondairethumb|200px|Schéma de la structure tridimensionnelle de la protéine myoglobine. Cette structure contient de hélices α mais pas de feuillets β. Cette protéine est la première dont la structure a été résolue par cristallographie en 1958, par Max Perutz et John Kendrew, ce qui leur a valu l'attribution du prix Nobel de chimie en 1962. En biochimie et en biologie structurale, la structure secondaire se rapporte uniquement à la description de la structure tridimensionnelle localement adoptée par certains segments de molécules biologiques (molécules définies comme étant des biopolymères, comme c’est le cas pour les protéines et les acides nucléiques (ADN/ARN)).
Expression génétiqueL'expression des gènes, encore appelée expression génique ou expression génétique, désigne l'ensemble des processus biochimiques par lesquels l'information héréditaire stockée dans un gène est lue pour aboutir à la fabrication de molécules qui auront un rôle actif dans le fonctionnement cellulaire, comme les protéines ou les ARN. Même si toutes les cellules d'un organisme partagent le même génome, certains gènes ne sont exprimés que dans certaines cellules, à certaines périodes de la vie de l'organisme ou sous certaines conditions.
3'-UTRLa région 3' non traduite, ou 3'-UTR (de anglais, three prime Untranslated Transcribed Region) est la partie de l’ARN messager (ARNm) qui suit le codon STOP (à l'extrémité 3'). Une molécule d’ARNm est transcrite à partir de la séquence d’ADN pour être traduite plus tard en protéine. Plusieurs parties de l’ARNm ne sont pas traduites en protéine, dont la coiffe ou 5'-cap, les régions 5'-UTR et 3'-UTR et la queue poly(A). La partie 3'-UTR contient souvent des régions qui influencent l’expression des gènes après la transcription.
Prédiction de gènesEn bio-informatique, la prédiction de gènes consiste à identifier les zones de l'ADN qui correspondent à des gènes (le reste étant non codant). Les méthodes par similitudes, aussi appelées méthodes par homologie ou méthodes extrinsèques, consistent à utiliser des informations extérieures au génome pour trouver les gènes. Plus précisément, ces méthodes consistent à comparer la séquence étudiée avec des séquences connues, rassemblées dans les bases de données.
Protein function predictionProtein function prediction methods are techniques that bioinformatics researchers use to assign biological or biochemical roles to proteins. These proteins are usually ones that are poorly studied or predicted based on genomic sequence data. These predictions are often driven by data-intensive computational procedures. Information may come from nucleic acid sequence homology, gene expression profiles, protein domain structures, text mining of publications, phylogenetic profiles, phenotypic profiles, and protein-protein interaction.
Biais d'usage du codeLe biais d'usage du code (RSCU, pour Relative Synonymous Codon Usage en anglais) désigne l'utilisation préférentielle d'un des triplets de nucléotides ou codons possibles pour coder un acide aminé. En effet, il existe en général plusieurs combinaisons de trois nucléotides codant le même acide-aminé (sauf pour la méthionine et le tryptophane), appelés codons synonymes, mais certaines de ces combinaisons sont en général utilisées préférentiellement par la cellule.
Prédiction dynamiqueLa prédiction dynamique est une méthode inventée par Newton et Leibniz. Newton l’a appliquée avec succès au mouvement des planètes et de leurs satellites. Depuis elle est devenue la grande méthode de prédiction des mathématiques appliquées. Sa portée est universelle. Tout ce qui est matériel, tout ce qui est en mouvement, peut être étudié avec les outils de la théorie des systèmes dynamiques. Mais il ne faut pas en conclure que pour connaître un système il est nécessaire de connaître sa dynamique.
Réseaux de régulation géniquedroite|vignette|360x360px| Structure d'un réseau de régulation génique droite|vignette|360x360px| Processus de contrôle d'un réseau de régulation génique Un réseau de régulation génique (ou génétique ) ( RRG ), réseau de régulation des gènes ou réseaux de régulation transcriptionnelle est un ensemble de régulateurs moléculaires qui interagissent entre eux et avec d'autres substances dans une cellule pour moduler l'expression génique de l'ARNm et des protéines qui, à leur tour, déterminent la fonction de la c
Binding siteIn biochemistry and molecular biology, a binding site is a region on a macromolecule such as a protein that binds to another molecule with specificity. The binding partner of the macromolecule is often referred to as a ligand. Ligands may include other proteins (resulting in a protein-protein interaction), enzyme substrates, second messengers, hormones, or allosteric modulators. The binding event is often, but not always, accompanied by a conformational change that alters the protein's function.
Prédiction de la structure des protéinesLa prédiction de la structure des protéines est l'inférence de la structure tridimensionnelle des protéines à partir de leur séquences d'acides aminés, c'est-à-dire la prédiction de leur pliage et de leur structures secondaire et tertiaire à partir de leur structure primaire. La prédiction de la structure est fondamentalement différente du problème inverse de la conception des protéines. Elle est l'un des objectifs les plus importants poursuivis par la bioinformatique et la chimie théorique.
Biomolecular structureBiomolecular structure is the intricate folded, three-dimensional shape that is formed by a molecule of protein, DNA, or RNA, and that is important to its function. The structure of these molecules may be considered at any of several length scales ranging from the level of individual atoms to the relationships among entire protein subunits. This useful distinction among scales is often expressed as a decomposition of molecular structure into four levels: primary, secondary, tertiary, and quaternary.