Whole genome sequencingWhole genome sequencing (WGS), also known as full genome sequencing, complete genome sequencing, or entire genome sequencing, is the process of determining the entirety, or nearly the entirety, of the DNA sequence of an organism's genome at a single time. This entails sequencing all of an organism's chromosomal DNA as well as DNA contained in the mitochondria and, for plants, in the chloroplast. Whole genome sequencing has largely been used as a research tool, but was being introduced to clinics in 2014.
GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Projet de séquençage de génomeLes projets de séquençage de génome sont des projets scientifiques qui ont pour but d'obtenir les séquences complètes des génomes de différents organismes: bactéries, plantes, champignons, animaux, et humain. Ce travail nécessite la séquence de l'ADN de chacun des chromosomes de l'espèce. Pour une bactérie, il n'y a qu'un chromosome à séquencer. Pour l'espèce humaine, qui possède 22 paires de chromosomes et 2 chromosomes sexuels (X et Y), il y a 24 chromosomes à séquencer. Le projet génome humain est abouti depuis 2003.
GénomeLe génome (//), ou plus rarement génôme, est l'ensemble du matériel génétique d'une espèce codé dans son acide désoxyribonucléique (ADN), à l'exception de certains virus dont le génome est constitué d'acide ribonucléique (ARN). Il contient en particulier tous les gènes codant des protéines ou correspondant à des ARN structurés. Il se décompose donc en séquences codantes (transcrites en ARN messagers et traduites en protéines) et non codantes (non transcrites, ou transcrites en ARN, mais non traduites).
Projet Génome humainvignette|Le génome humain est constitué de l'ensemble de l'information portée par nos 23 paires de chromosomes. Le (PGH, ou HGP pour l'anglais Human Genome Project) est un programme lancé fin 1988 dont la mission était d'établir le séquençage complet de l'ADN du génome humain. Son achèvement a été annoncé le . Le nouveau projet lancé dans la foulée en , ENCODE (Encyclopedia of DNA Elements), donne des résultats importants sur l'ADN non codant humain.
Reference genomeA reference genome (also known as a reference assembly) is a digital nucleic acid sequence database, assembled by scientists as a representative example of the set of genes in one idealized individual organism of a species. As they are assembled from the sequencing of DNA from a number of individual donors, reference genomes do not accurately represent the set of genes of any single individual organism. Instead a reference provides a haploid mosaic of different DNA sequences from each donor.
Produit géniqueA gene product is the biochemical material, either RNA or protein, resulting from expression of a gene. A measurement of the amount of gene product is sometimes used to infer how active a gene is. Abnormal amounts of gene product can be correlated with disease-causing alleles, such as the overactivity of oncogenes which can cause cancer. A gene is defined as "a hereditary unit of DNA that is required to produce a functional product".
Human genomeThe human genome is a complete set of nucleic acid sequences for humans, encoded as DNA within the 23 chromosome pairs in cell nuclei and in a small DNA molecule found within individual mitochondria. These are usually treated separately as the nuclear genome and the mitochondrial genome. Human genomes include both protein-coding DNA sequences and various types of DNA that does not encode proteins. The latter is a diverse category that includes DNA coding for non-translated RNA, such as that for ribosomal RNA, transfer RNA, ribozymes, small nuclear RNAs, and several types of regulatory RNAs.
Taux de GCLe taux de GC (ou pourcentage de GC, ou coefficient de Chargaff) d'une séquence d'ADN est défini comme la proportion de bases nucléiques de cette séquence étant soit une guanine (G), soit une cytosine (C). Il existe deux bases nucléiques supplémentaires, l'adénine (A) et la thymine (T), entrant dans la composition de l'ADN. De plus, la cytosine est toujours liée à la guanine, et l'adénine est toujours liée à la thymine. Ainsi, le taux de GC exprime aussi le pourcentage de liaisons G-C dans la molécule d'ADN.
Bacterial genomeBacterial genomes are generally smaller and less variant in size among species when compared with genomes of eukaryotes. Bacterial genomes can range in size anywhere from about 130 kbp to over 14 Mbp. A study that included, but was not limited to, 478 bacterial genomes, concluded that as genome size increases, the number of genes increases at a disproportionately slower rate in eukaryotes than in non-eukaryotes. Thus, the proportion of non-coding DNA goes up with genome size more quickly in non-bacteria than in bacteria.
Transfert horizontal de gènesvignette|alt=Il s'agit d'une image représentant l'arbre de la vie à 3 domaines. Des croisements entre branches de cet arbre (qui est donc en fait un réseau) indique que la transmission de matériel génétique n'est pas seulement verticale, au long de la descendance, mais que certains évènements horizontaux, entre individus, existent.|Arbre phylogénétique à trois domaines montrant les possibles transferts horizontaux, notamment ceux postulés par la théorie endosymbiotique.
Bio-informatiqueLa bioinformatique (ou bio-informatique), est un champ de recherche multidisciplinaire de la biotechnologie où travaillent de concert biologistes, médecins, informaticiens, mathématiciens, physiciens et bioinformaticiens, dans le but de résoudre un problème scientifique posé par la biologie. Plus généralement, la bio-informatique est l'application de la statistique et de l'informatique à la science biologique. Le spécialiste qui travaille à mi-chemin entre ces sciences et l'informatique est appelé bioinformaticien ou bionaute.
Expression génétiqueL'expression des gènes, encore appelée expression génique ou expression génétique, désigne l'ensemble des processus biochimiques par lesquels l'information héréditaire stockée dans un gène est lue pour aboutir à la fabrication de molécules qui auront un rôle actif dans le fonctionnement cellulaire, comme les protéines ou les ARN. Même si toutes les cellules d'un organisme partagent le même génome, certains gènes ne sont exprimés que dans certaines cellules, à certaines périodes de la vie de l'organisme ou sous certaines conditions.
Génomique comparativeLa génomique comparative est l'étude comparative de la structure en fonction des génomes de différentes espèces. Elle permet d'identifier et de comprendre les effets de la sélection sur l'organisation et l'évolution des génomes. Ce nouvel axe de recherche bénéficie de l'augmentation du nombre de génomes séquencés et de la puissance des outils informatiques. Une des applications majeures de la génomique comparative est la découverte de gènes et de leurs séquences régulatrices non codantes basée sur le principe de conservation.
Enzymeredresse=1.5|vignette| Représentation d'une α-glucosidase () avec à sa droite le substrat au-dessus des produits de réaction . redresse=1.5|vignette|Diagramme d'une réaction catalysée montrant l'énergie E requise à différentes étapes suivant l'axe du temps t. Les substrats A et B en conditions normales requièrent une quantité d'énergie E1 pour atteindre l'état de transition A...B, à la suite duquel le produit de réaction AB peut se former. L'enzyme E crée un microenvironnement dans lequel A et B peuvent atteindre l'état de transition A.
Gene OntologyGene Ontology est un projet bio-informatique destiné à structurer la description des gènes et des produits géniques dans le cadre d'une ontologie commune à toutes les espèces. Ce projet, qui s'inscrit dans la démarche plus large d'Open Biomedical Ontologies (OBO) regroupant d'autres projets bio-informatiques dans le domaine biomédical, poursuit trois objectifs : gérer et enrichir son vocabulaire contrôlé décrivant les gènes et leurs produits, gérer les annotations, c'est-à-dire les informations rattachées aux gènes et à leurs produits, fournir les outils permettant d'accéder aux informations structurées dans le cadre du projet.
Sequence analysisIn bioinformatics, sequence analysis is the process of subjecting a DNA, RNA or peptide sequence to any of a wide range of analytical methods to understand its features, function, structure, or evolution. Methodologies used include sequence alignment, searches against biological databases, and others. Since the development of methods of high-throughput production of gene and protein sequences, the rate of addition of new sequences to the databases increased very rapidly.
Acide ribonucléique de transfertLes acides ribonucléiques de transfert, ou ARN de transfert ou ARNt, sont de courts ARN, longs de 75 à 95 nucléotides, qui interviennent lors de la synthèse des protéines dans la cellule. Ce sont des intermédiaires clés dans la traduction du message génétique et dans la lecture du code génétique. Ils apportent les acides aminés au ribosome, la machine cellulaire responsable de l'assemblage des protéines à partir de l'information génétique contenue dans l'ARN messager.
Sequence profiling toolA sequence profiling tool in bioinformatics is a type of software that presents information related to a genetic sequence, gene name, or keyword input. Such tools generally take a query such as a DNA, RNA, or protein sequence or ‘keyword’ and search one or more databases for information related to that sequence. Summaries and aggregate results are provided in standardized format describing the information that would otherwise have required visits to many smaller sites or direct literature searches to compile.
Métagénomiquevignette|300px|À titre d'exemple : Indices comparés de biodiversité pour 19 métagénomes marins échantillonnés par l'expédition , tels qu'analysés avec GenGIS. La métagénomique ou génomique environnementale est une méthode d'étude du contenu génétique d'échantillons issus d'environnements complexes (ex : intestin, océan, sols, air, etc.) prélevés dans la nature (par opposition à des échantillons cultivés en laboratoire).