Gène chevauchantEn génétique, un gène est dit chevauchant s'il est superposé, partiellement ou totalement, à un autre gène et exprime une protéine différente de ce dernier. Il peut s'agir de séquences codantes superposées transcrites avec un décalage du cadre de lecture, de l'expression du brin d'ADN complémentaire de la région codante d'un autre gène, de gènes exprimés chacun sur un brin d'ADN complémentaire et qui ne se superposent qu'à leur extrémité 3', voire d'un gène inclus dans l'intron d'un autre gène.
Projet de séquençage de génomeLes projets de séquençage de génome sont des projets scientifiques qui ont pour but d'obtenir les séquences complètes des génomes de différents organismes: bactéries, plantes, champignons, animaux, et humain. Ce travail nécessite la séquence de l'ADN de chacun des chromosomes de l'espèce. Pour une bactérie, il n'y a qu'un chromosome à séquencer. Pour l'espèce humaine, qui possède 22 paires de chromosomes et 2 chromosomes sexuels (X et Y), il y a 24 chromosomes à séquencer. Le projet génome humain est abouti depuis 2003.
Functional genomicsFunctional genomics is a field of molecular biology that attempts to describe gene (and protein) functions and interactions. Functional genomics make use of the vast data generated by genomic and transcriptomic projects (such as genome sequencing projects and RNA sequencing). Functional genomics focuses on the dynamic aspects such as gene transcription, translation, regulation of gene expression and protein–protein interactions, as opposed to the static aspects of the genomic information such as DNA sequence or structures.
Protein function predictionProtein function prediction methods are techniques that bioinformatics researchers use to assign biological or biochemical roles to proteins. These proteins are usually ones that are poorly studied or predicted based on genomic sequence data. These predictions are often driven by data-intensive computational procedures. Information may come from nucleic acid sequence homology, gene expression profiles, protein domain structures, text mining of publications, phylogenetic profiles, phenotypic profiles, and protein-protein interaction.
Protein–protein interaction predictionProtein–protein interaction prediction is a field combining bioinformatics and structural biology in an attempt to identify and catalog physical interactions between pairs or groups of proteins. Understanding protein–protein interactions is important for the investigation of intracellular signaling pathways, modelling of protein complex structures and for gaining insights into various biochemical processes.
Recombinaison homologuethumb | 275px | alt=Schéma du chromosome 1 après recombinaison homologue | Figure 1. La recombinaison homologue peut produire de nouvelles combinaisons d'allèles entre les chromosomes parentaux, notamment lors de la méiose.La recombinaison homologue est un type de recombinaison génétique où les séquences de nucléotides sont échangées entre des molécules d'ADN identiques (homologues) ou similaires (Figure 1). Au sens large, la recombinaison homologue est un mécanisme ubiquitaire de réparation des cassures double-brins de l'ADN.
Génomique comparativeLa génomique comparative est l'étude comparative de la structure en fonction des génomes de différentes espèces. Elle permet d'identifier et de comprendre les effets de la sélection sur l'organisation et l'évolution des génomes. Ce nouvel axe de recherche bénéficie de l'augmentation du nombre de génomes séquencés et de la puissance des outils informatiques. Une des applications majeures de la génomique comparative est la découverte de gènes et de leurs séquences régulatrices non codantes basée sur le principe de conservation.
Séquençage de l'ADNcadre|Résultat du séquençage par la méthode de Sanger. L'ordre de chaque bande indique la position d'un nucléotide A,T,C ou G Le séquençage de l'ADN consiste à déterminer l'ordre d'enchaînement des nucléotides pour un fragment d’ADN donné. La séquence d’ADN contient l’information nécessaire aux êtres vivants pour survivre et se reproduire. Déterminer cette séquence est donc utile aussi bien pour les recherches visant à savoir comment vivent les organismes que pour des sujets appliqués.
Métagénomiquevignette|300px|À titre d'exemple : Indices comparés de biodiversité pour 19 métagénomes marins échantillonnés par l'expédition , tels qu'analysés avec GenGIS. La métagénomique ou génomique environnementale est une méthode d'étude du contenu génétique d'échantillons issus d'environnements complexes (ex : intestin, océan, sols, air, etc.) prélevés dans la nature (par opposition à des échantillons cultivés en laboratoire).
Transcriptomevignette|Puces à ADN employée pour analyser l'expression de gènes humains à gauche, de souris à droite. Le transcriptome est l'ensemble des ARN issus de la transcription du génome. L'analyse transcriptomique peut caractériser le transcriptome d'un tissu particulier, d'un type cellulaire, ou comparer les transcriptomes entre différentes conditions expérimentales.
GénomiqueLa génomique est une discipline de la biologie moderne. Elle étudie le fonctionnement d'un organisme, d'un organe, d'un cancer, etc. à l'échelle du génome, au lieu de se limiter à l'échelle d'un seul gène. La génomique se divise en deux branches : La génomique structurale, qui se charge du séquençage du génome entier ; La génomique fonctionnelle, qui vise à déterminer la fonction et l'expression des gènes séquencés en caractérisant le transcriptome et le protéome. La génomique est l'équivalent de la métabolomique pour les métabolites.
Assemblage (bio-informatique)En bio-informatique, l'assemblage consiste à aligner et/ou fusionner des fragments d'ADN ou d'ARN issus d'une plus longue séquence afin de reconstruire la séquence originale. Il s'agit d'une étape d'analyse in silico qui succède au séquençage de l'ADN ou de l'ARN d'un organisme unique, d'une colonie de clones (bactériens par exemple), ou encore d'un mélange complexe d'organismes. Le problème de l'assemblage peut être comparé à celui de la reconstruction du texte d'un livre à partir de plusieurs copies de celui-ci, préalablement déchiquetées en petits morceaux.
ProtéomeLe protéome est l'ensemble des protéines exprimées dans une cellule, une partie d'une cellule (membranes, organites) ou un groupe de cellules (organe, organisme, groupe d'organismes) dans des conditions données et à un moment donné. Ce terme d'origine anglo-saxonne a été inventé en 1994 par Mark Wilkins de l'Université Macquarie de Sydney. Il provient de la contraction de protéine et génome car le protéome est aux protéines ce que le génome est pour les gènes.
Prédiction de la structure des protéinesLa prédiction de la structure des protéines est l'inférence de la structure tridimensionnelle des protéines à partir de leur séquences d'acides aminés, c'est-à-dire la prédiction de leur pliage et de leur structures secondaire et tertiaire à partir de leur structure primaire. La prédiction de la structure est fondamentalement différente du problème inverse de la conception des protéines. Elle est l'un des objectifs les plus importants poursuivis par la bioinformatique et la chimie théorique.
TranscriptomiqueLa transcriptomique est l'étude de l'ensemble des ARN messagers produits lors du processus de transcription d'un génome. Elle repose sur la quantification systématique de ces ARNm, ce qui permet d'avoir une indication relative du taux de transcription de différents gènes dans des conditions données. Plusieurs techniques permettent d'avoir accès à cette information, en particulier celle des puces à ADN, celle de la PCR quantitative ou encore celle du séquençage systématique d'ADN complémentaires. Métatransc
Modèle de Markov cachéUn modèle de Markov caché (MMC, terme et définition normalisés par l’ISO/CÉI [ISO/IEC 2382-29:1999]) — (HMM)—, ou plus correctement (mais non employé) automate de Markov à états cachés, est un modèle statistique dans lequel le système modélisé est supposé être un processus markovien de paramètres inconnus. Contrairement à une chaîne de Markov classique, où les transitions prises sont inconnues de l'utilisateur mais où les états d'une exécution sont connus, dans un modèle de Markov caché, les états d'une exécution sont inconnus de l'utilisateur (seuls certains paramètres, comme la température, etc.