Transcription (biologie)En biologie moléculaire, la transcription est la première étape de l'expression génique basée sur l'ADN, au cours de laquelle un segment particulier d'ADN est « copié » en ARN par une enzyme appelée ARN polymérase. Chez les eucaryotes, la transcription se déroule dans le noyau des cellules. Certains types d'ARN appélés « ARN non codants » n'ont pas vocation à être traduits en protéines et peuvent jouer un rôle régulateur ou structurel (par exemple les ARN ribosomiques).
Régulation de la transcriptionLa régulation de la transcription est la phase du contrôle de l'expression des gènes agissant au niveau de la transcription de l'ADN. Cette régulation modifiera la quantité d'ARN produit. Cette régulation est principalement effectuée par la modulation du taux de transcription par l'intervention de facteurs de transcription qui se classent en deux catégories : les éléments cis-regulateurs géniques, en coopération avec les facteurs transprotéiques. Il existe également des mécanismes de régulation de la terminaison de la transcription.
Séquençage de l'ADNcadre|Résultat du séquençage par la méthode de Sanger. L'ordre de chaque bande indique la position d'un nucléotide A,T,C ou G Le séquençage de l'ADN consiste à déterminer l'ordre d'enchaînement des nucléotides pour un fragment d’ADN donné. La séquence d’ADN contient l’information nécessaire aux êtres vivants pour survivre et se reproduire. Déterminer cette séquence est donc utile aussi bien pour les recherches visant à savoir comment vivent les organismes que pour des sujets appliqués.
Facteur de transcriptionvignette|upright=2.2|Schéma simplifié du mécanisme d'un activateur. Un facteur de transcription est une protéine nécessaire à l'initiation ou à la régulation de la transcription d'un gène dans l'ensemble du vivant (procaryote ou eucaryote). Elle interagit avec l'ADN et l'ARN-polymérase. Il existe une classification complexe des facteurs de transcription. Les facteurs généraux de la transcription, impliqués dans la composition de la machinerie transcriptionnelle basale organisée autour de l'ARN polymérase II.
Promoteur (biologie)Un promoteur, ou séquence promotrice, est une région de l'ADN située à proximité d'un gène et indispensable à la transcription de l'ADN en ARN. Le promoteur est la zone de l'ADN sur laquelle se fixe initialement l'ARN polymérase, avant de démarrer la synthèse de l'ARN. Les séquences promotrices sont en général situées en amont du site de démarrage de la transcription. Un promoteur est aussi constitué de plusieurs séquences régulatrices de l'expression du gène, soit spécifiques à un tissu ou groupe de tissus, soit ubiquitaires, c'est-à-dire les mêmes pour tous les tissus.
Dinucléotide CpGredresse=1.75|vignette| Îlot CpG (à gauche) montrant une concentration dix fois plus élevée en dinucléotides CpG (en jaune) par rapport à une séquence typique du génome (à droite) où on les trouve tous les cent nucléotides environ.L'îlot CpG représenté ici est un promoteur, dont le codon d'initiation — — est souligné en rouge. Un dinucléotide CpG, parfois appelé site CpG en référence à l'anglais CpG site, est un segment d'ADN de deux nucléotides dont la séquence de bases nucléiques est CG.
ChIP-SeqLe séquençage ChIP-Seq, également connu en tant que séquençage ChIP, est une méthode utilisée pour analyser les interactions entre protéines et l'ADN. Le ChIP-Seq est une technique permettant d’étudier les interactions ADN/protéine à l’échelle du génome. Il s'agit d'une approche basée sur une technique innovante de séquençage qui permet de déterminer rapidement la séquence des fragments immunoprécipités par immunoprécipitation de chromatine (ChIP). Cette technique, dite de ChIP-Seq, fut publiée en 2007 par l’équipe du Prof.
Boîte TATALa boîte TATA (TATA box ou Goldberg-Hogness box en anglais) est une séquence d'ADN (un élément cis-régulateur) présente au niveau de la séquence promotrice d'une partie des gènes des eucaryotes . Cette séquence d'ADN codée TATA se situe à environ 25 nucléotides en amont du premier nucléotide transcrit (N+1). Cette séquence sert en partie de lieu de reconnaissance à l'ARN polymérase chez les eucaryotes. Chez les procaryotes, il existe aussi un autre ensemble de séquence jouant un rôle similaire.
Exome sequencingExome sequencing, also known as whole exome sequencing (WES), is a genomic technique for sequencing all of the protein-coding regions of genes in a genome (known as the exome). It consists of two steps: the first step is to select only the subset of DNA that encodes proteins. These regions are known as exons—humans have about 180,000 exons, constituting about 1% of the human genome, or approximately 30 million base pairs. The second step is to sequence the exonic DNA using any high-throughput DNA sequencing technology.
GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
SéquençageEn biochimie, le séquençage consiste à déterminer l'ordre linéaire des composants d'une macromolécule (les acides aminés d'une protéine, les nucléotides d'un acide nucléique comme l'ADN, les monosaccharides d'un polysaccharide, etc.). En génétique, le séquençage concerne la détermination de la séquence des gènes voire des chromosomes, voire du génome complet, ce qui techniquement revient à effectuer le séquençage de l'ADN constituant ces gènes ou ces chromosomes.
ARN polymérase IL'ARN polymérase I, ou Pol I, est une nucléotidyltransférase présente chez les eucaryotes supérieurs. C'est l'une des ARN polymérases des eucaryotes, avec , et . Elle réalise la transcription de l'ARN ribosomique — hormis l'ARN ribosomique 5S, synthétisé par l'ARN polymérase III — et produit de la sorte environ 80 % des ARN totaux d'une cellule. Il s'agit d'une enzyme de constituée de protéiques dont la structure cristalline a été résolue à chez Saccharomyces cerevisiae en 2013.
Sanger sequencingSanger sequencing is a method of DNA sequencing that involves electrophoresis and is based on the random incorporation of chain-terminating dideoxynucleotides by DNA polymerase during in vitro DNA replication. After first being developed by Frederick Sanger and colleagues in 1977, it became the most widely used sequencing method for approximately 40 years. It was first commercialized by Applied Biosystems in 1986. More recently, higher volume Sanger sequencing has been replaced by next generation sequencing methods, especially for large-scale, automated genome analyses.
Séquençage shotgunEn génétique, le séquençage shotgun (littéralement séquençage "fusil de chasse") est une méthode utilisée pour séquencer des brins d'ADN aléatoires. On l'appelle ainsi par analogie avec le modèle de tir quasi-aléatoire en pleine expansion d'un fusil de chasse : cette métaphore illustre le caractère aléatoire de la fragmentation initiale de l'ADN génomique où l'on "arrose" tout le génome, un peu comme se dispersent les plombs de ce type d'arme à feu.
ARN polymérase IIredresse=1.5|vignette|Représentation d'une ARN poylmérase II de Saccharomyces cerevisiae. L'ARN polymérase II (RNAP II ou Pol II) est une nucléotidyltransférase présente dans les cellules des eucaryotes. C'est l'une des ARN polymérases de ces organismes, avec l'ARN polymérase I, l'ARN polymérase III et l'ARN polymérase IV. Elle réalise la transcription de l'ADN pour produire l'ARN prémessager et l'essentiel des petits ARN nucléaires et des micro-ARN.
Massive parallel sequencingMassive parallel sequencing or massively parallel sequencing is any of several high-throughput approaches to DNA sequencing using the concept of massively parallel processing; it is also called next-generation sequencing (NGS) or second-generation sequencing. Some of these technologies emerged between 1993 and 1998 and have been commercially available since 2005. These technologies use miniaturized and parallelized platforms for sequencing of 1 million to 43 billion short reads (50 to 400 bases each) per instrument run.
Whole genome sequencingWhole genome sequencing (WGS), also known as full genome sequencing, complete genome sequencing, or entire genome sequencing, is the process of determining the entirety, or nearly the entirety, of the DNA sequence of an organism's genome at a single time. This entails sequencing all of an organism's chromosomal DNA as well as DNA contained in the mitochondria and, for plants, in the chloroplast. Whole genome sequencing has largely been used as a research tool, but was being introduced to clinics in 2014.
Expression génétiqueL'expression des gènes, encore appelée expression génique ou expression génétique, désigne l'ensemble des processus biochimiques par lesquels l'information héréditaire stockée dans un gène est lue pour aboutir à la fabrication de molécules qui auront un rôle actif dans le fonctionnement cellulaire, comme les protéines ou les ARN. Même si toutes les cellules d'un organisme partagent le même génome, certains gènes ne sont exprimés que dans certaines cellules, à certaines périodes de la vie de l'organisme ou sous certaines conditions.
ARN polymérase IIIAvec l'ARN polymérase I, l'ARN polymérase II et l'ARN polymérase IV, l'ARN polymérase III (Pol III) est l'une des ARN polymérases présentes dans les cellules eucaryotes qui réalisent la transcription de l'ADN en ARN à l'intérieur du noyau. Elle appartient à la famille des nucléotidyltransférases. Elle réalise spécifiquement la transcription des gènes codant des petits ARN non codants comme l'ARN ribosomique 5S, les ARN de transfert et d'autres petits ARN tels que l'ARNsn U6, l'ARN de voûte, l'ARNsn 7SK, plusieurs micro-ARN, ainsi que plusieurs petits ARN nucléolaires.
Third-generation sequencingThird-generation sequencing (also known as long-read sequencing) is a class of DNA sequencing methods currently under active development. Third generation sequencing technologies have the capability to produce substantially longer reads than second generation sequencing, also known as next-generation sequencing. Such an advantage has critical implications for both genome science and the study of biology in general. However, third generation sequencing data have much higher error rates than previous technologies, which can complicate downstream genome assembly and analysis of the resulting data.