Whole genome sequencingWhole genome sequencing (WGS), also known as full genome sequencing, complete genome sequencing, or entire genome sequencing, is the process of determining the entirety, or nearly the entirety, of the DNA sequence of an organism's genome at a single time. This entails sequencing all of an organism's chromosomal DNA as well as DNA contained in the mitochondria and, for plants, in the chloroplast. Whole genome sequencing has largely been used as a research tool, but was being introduced to clinics in 2014.
GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Mycobacterium lepraeMycobacterium leprae (ou bacille de Hansen) est la bactérie responsable de la lèpre chez l'homme (et le tatou). C'est un bacille intracellulaire, pléomorphique (le plus souvent en forme de bâtonnet), acido-alcoolo-résistant, à métabolisme aérobie. Il apparaît en microscopie optique (après coloration de Ziehl-Neelsen) sous forme d'amas ou de chaînettes. Il a été mis en évidence en 1873 par le médecin norvégien Gerhard Armauer Hansen qui le cherchait dans des lésions cutanées d'un patient atteint de lèpre.
Séquençage de l'ADNcadre|Résultat du séquençage par la méthode de Sanger. L'ordre de chaque bande indique la position d'un nucléotide A,T,C ou G Le séquençage de l'ADN consiste à déterminer l'ordre d'enchaînement des nucléotides pour un fragment d’ADN donné. La séquence d’ADN contient l’information nécessaire aux êtres vivants pour survivre et se reproduire. Déterminer cette séquence est donc utile aussi bien pour les recherches visant à savoir comment vivent les organismes que pour des sujets appliqués.
Projet de séquençage de génomeLes projets de séquençage de génome sont des projets scientifiques qui ont pour but d'obtenir les séquences complètes des génomes de différents organismes: bactéries, plantes, champignons, animaux, et humain. Ce travail nécessite la séquence de l'ADN de chacun des chromosomes de l'espèce. Pour une bactérie, il n'y a qu'un chromosome à séquencer. Pour l'espèce humaine, qui possède 22 paires de chromosomes et 2 chromosomes sexuels (X et Y), il y a 24 chromosomes à séquencer. Le projet génome humain est abouti depuis 2003.
Bacterial genomeBacterial genomes are generally smaller and less variant in size among species when compared with genomes of eukaryotes. Bacterial genomes can range in size anywhere from about 130 kbp to over 14 Mbp. A study that included, but was not limited to, 478 bacterial genomes, concluded that as genome size increases, the number of genes increases at a disproportionately slower rate in eukaryotes than in non-eukaryotes. Thus, the proportion of non-coding DNA goes up with genome size more quickly in non-bacteria than in bacteria.
GénomeLe génome (//), ou plus rarement génôme, est l'ensemble du matériel génétique d'une espèce codé dans son acide désoxyribonucléique (ADN), à l'exception de certains virus dont le génome est constitué d'acide ribonucléique (ARN). Il contient en particulier tous les gènes codant des protéines ou correspondant à des ARN structurés. Il se décompose donc en séquences codantes (transcrites en ARN messagers et traduites en protéines) et non codantes (non transcrites, ou transcrites en ARN, mais non traduites).
Projet Génome humainvignette|Le génome humain est constitué de l'ensemble de l'information portée par nos 23 paires de chromosomes. Le (PGH, ou HGP pour l'anglais Human Genome Project) est un programme lancé fin 1988 dont la mission était d'établir le séquençage complet de l'ADN du génome humain. Son achèvement a été annoncé le . Le nouveau projet lancé dans la foulée en , ENCODE (Encyclopedia of DNA Elements), donne des résultats importants sur l'ADN non codant humain.
Human genomeThe human genome is a complete set of nucleic acid sequences for humans, encoded as DNA within the 23 chromosome pairs in cell nuclei and in a small DNA molecule found within individual mitochondria. These are usually treated separately as the nuclear genome and the mitochondrial genome. Human genomes include both protein-coding DNA sequences and various types of DNA that does not encode proteins. The latter is a diverse category that includes DNA coding for non-translated RNA, such as that for ribosomal RNA, transfer RNA, ribozymes, small nuclear RNAs, and several types of regulatory RNAs.
MycobacteriumMycobacterium, la Mycobactérie, est un genre de bactéries de la famille des Mycobacteriaceae. Ce sont des bacilles aérobies assez longs et fins, asporulés et acapsulés. Leur paroi présente une structure particulière, riche en cires (acides mycoliques) qui leur permet de retenir les colorants malgré l'action combinée d'acide dilué et d'alcool. Cette paroi leur confère une grande résistance aux antiseptiques, à certains antibiotiques, aux macrophages. Ils sont dits « bacilles acido-alcoolo-résistants » ou BAAR.
IlluminaIllumina, Inc. est une société américaine constituée en , qui développe, fabrique et commercialise des systèmes intégrés pour l'analyse de la variation génétique et la fonction biologique. Grâce à ses technologies, la société fournit une gamme de produits et services qui servent les marchés du séquençage, génotypage et expression génétique. En 2013, cette technologie avait réduit le coût de séquençage de l'ADN à , comparé à 1 million de dollars en 2007.
Gène chevauchantEn génétique, un gène est dit chevauchant s'il est superposé, partiellement ou totalement, à un autre gène et exprime une protéine différente de ce dernier. Il peut s'agir de séquences codantes superposées transcrites avec un décalage du cadre de lecture, de l'expression du brin d'ADN complémentaire de la région codante d'un autre gène, de gènes exprimés chacun sur un brin d'ADN complémentaire et qui ne se superposent qu'à leur extrémité 3', voire d'un gène inclus dans l'intron d'un autre gène.
Massive parallel sequencingMassive parallel sequencing or massively parallel sequencing is any of several high-throughput approaches to DNA sequencing using the concept of massively parallel processing; it is also called next-generation sequencing (NGS) or second-generation sequencing. Some of these technologies emerged between 1993 and 1998 and have been commercially available since 2005. These technologies use miniaturized and parallelized platforms for sequencing of 1 million to 43 billion short reads (50 to 400 bases each) per instrument run.
LèpreLa (ou maladie de Hansen) est une maladie infectieuse chronique due à Mycobacterium leprae, une bactérie proche de l'agent responsable de la tuberculose, identifiée par le Norvégien Gerhard Armauer Hansen en . Celle-ci touche les nerfs périphériques, la peau et les muqueuses, en provoquant des infirmités sévères. Elle est endémique dans certains pays tropicaux (en particulier d'Asie). La lèpre est une maladie peu contagieuse.
Exome sequencingExome sequencing, also known as whole exome sequencing (WES), is a genomic technique for sequencing all of the protein-coding regions of genes in a genome (known as the exome). It consists of two steps: the first step is to select only the subset of DNA that encodes proteins. These regions are known as exons—humans have about 180,000 exons, constituting about 1% of the human genome, or approximately 30 million base pairs. The second step is to sequence the exonic DNA using any high-throughput DNA sequencing technology.
Gène de novoUn gène de novo est un gène nouveau qui ne provient pas de gènes préexistants mais de l'ADN non codant. Son apparition se produit chez un individu, pas dans l'espèce entière ; il se répand ensuite sous l'effet de la sélection naturelle ou de la dérive génétique, et s'améliore sous la pression sélective. Inconnus jusqu'en 2006, les gènes de novo pourraient constituer quelques dizaines de pour cent des gènes de nombreuses espèces. À la fin du il était admis que de nouveaux gènes ne peuvent apparaître que par la modification ou la recombinaison de gènes préexistants.
Reference genomeA reference genome (also known as a reference assembly) is a digital nucleic acid sequence database, assembled by scientists as a representative example of the set of genes in one idealized individual organism of a species. As they are assembled from the sequencing of DNA from a number of individual donors, reference genomes do not accurately represent the set of genes of any single individual organism. Instead a reference provides a haploid mosaic of different DNA sequences from each donor.
Agent infectieuxUn est un agent biologique pathogène responsable d'une maladie infectieuse. Les agents infectieux sont majoritairement des micro-organismes, notamment des bactéries et des virus. Cependant, certains agents pathogènes ne sont pas des organismes (les prions), d'autres ne sont pas microscopiques (les vers parasites). Le pouvoir pathogène d'un agent infectieux mesure sa capacité à provoquer une maladie chez un organisme hôte. La virulence d'un agent infectieux mesure sa capacité à se développer dans un organisme (pouvoir invasif) et à y sécréter des toxines (pouvoir toxique).
Clinical metagenomic sequencingClinical metagenomic next-generation sequencing (mNGS) is the comprehensive analysis of microbial and host genetic material (DNA or RNA) in clinical samples from patients by next-generation sequencing. It uses the techniques of metagenomics to identify and characterize the genome of bacteria, fungi, parasites, and viruses without the need for a prior knowledge of a specific pathogen directly from clinical specimens.
Taille du génomevignette|Arbre phylogénétique indiquant la taille des génomes chez les organismes des trois domaines du monde vivant: les bactéries Bacteria (en bleu), les archées Archaea (en vert) et les eucaryotes Eucarya (en rouge). La taille du génome correspond à la quantité d'ADN contenue dans une copie d'un génome. La taille d'un génome est également appelée valeur C.