PhylogénieLa phylogenèse ou phylogénie, du grec ancien , « tribu, famille, clan » et , « création », est l'étude des liens de parenté (relations phylogénétiques ou phylétiques) entre les êtres vivants et ceux qui ont disparu : entre individus (niveau généalogique ; seule une généalogie individuelle peut répondre à la question « qui est l'ancêtre de qui ? », tandis qu'une phylogénie de groupe peut répondre à la question « qui est le plus proche parent de qui ? ») ; entre populations (à l'intérieur d'une même espèce qu
Phylogénétique moléculairevignette|Séquençage moléculaire La phylogénétique moléculaire est l'utilisation de séquences de macromolécules biologiques pour obtenir des informations sur l'histoire évolutive des organismes vivants, et notamment sur leurs liens de parenté (leur phylogénie). C'est un important outil d'étude parmi ceux de l'évolution moléculaire. Le produit d'une analyse de phylogénétique moléculaire est soit un arbre phylogénétique, soit un graphe du réseau phylogénétique.
Computational phylogeneticsComputational phylogenetics is the application of computational algorithms, methods, and programs to phylogenetic analyses. The goal is to assemble a phylogenetic tree representing a hypothesis about the evolutionary ancestry of a set of genes, species, or other taxa. For example, these techniques have been used to explore the family tree of hominid species and the relationships between specific genes shared by many types of organisms.
Inférence bayésienne en phylogénieL'inférence bayésienne de la phylogénie est la combinaison des informations dans l'a priori et dans la vraisemblance des données pour créer la soi-disant probabilité postérieure des arbres, qui est la probabilité que l'arbre soit correct compte tenu des données, de l'a priori et du modèle de vraisemblance. L'inférence bayésienne a été introduite dans la phylogénétique moléculaire dans les années 1990 par trois groupes indépendants : Bruce Rannala et Ziheng Yang à Berkeley, Bob Mau à Madison, et Shuying Li à l'Université de l'Iowa, les deux derniers étant doctorants à l'époque.
Arbre phylogénétiquevignette|upright=1.5|Arbre phylogénétique, basé sur le génome d'après Ciccarelli et al. (2006), mettant en évidence les trois domaines du vivant : les eucaryotes en rose (animaux, champignons, plantes et protistes), les bactéries en bleu, et les archées en vert. Un arbre phylogénétique est un arbre schématique qui montre les relations de parenté entre des groupes d'êtres vivants. Chacun des nœuds de l'arbre représente l'ancêtre commun de ses descendants ; le nom qu'il porte est celui du clade formé des groupes frères qui lui appartiennent, non celui de l'ancêtre qui reste impossible à déterminer.
Classification phylogénétiqueLa classification phylogénétique ou classification cladistique est une forme de classification des êtres vivants qui repose sur leur phylogénie. Elle prend son origine dans les travaux d'une école de taxonomie dite systématique phylogénétique ou systématique cladistique ou cladisme. Cette approche a pour objectif de rendre compte des relations de parenté entre les taxons, s’agissant seulement de l'apparentement, c'est-à-dire des relations de groupes frères et non des relations généalogiques d'ancêtres à descendants, entre des groupes d'organismes quel que soit leur rang taxonomique.
Sciences numériquesLes sciences numériques (traduction de l'anglais computational sciences), autrement dénommées calcul scientifique ou informatique scientifique, ont pour objet la construction de modèles mathématiques et de méthodes d'analyse quantitative, en se basant sur l'utilisation des sciences du numérique, pour analyser et résoudre des problèmes scientifiques. Cette approche scientifique basée sur un recours massif aux modélisations informatiques et mathématiques et à la simulation se décline en : médecine numérique, biologie numérique, archéologie numérique, mécanique numérique, par exemple.
Phylogenetic comparative methodsPhylogenetic comparative methods (PCMs) use information on the historical relationships of lineages (phylogenies) to test evolutionary hypotheses. The comparative method has a long history in evolutionary biology; indeed, Charles Darwin used differences and similarities between species as a major source of evidence in The Origin of Species. However, the fact that closely related lineages share many traits and trait combinations as a result of the process of descent with modification means that lineages are not independent.
Ancestral sequence reconstructionAncestral sequence reconstruction (ASR) – also known as ancestral gene/sequence reconstruction/resurrection – is a technique used in the study of molecular evolution. The method uses related sequences to reconstruct an "ancestral" gene from a multiple sequence alignment. The method can be used to 'resurrect' ancestral proteins and was suggested in 1963 by Linus Pauling and Emile Zuckerkandl. In the case of enzymes, this approach has been called paleoenzymology (British: palaeoenzymology).
Maximum de parcimonieLes méthodes de maximum de parcimonie, ou plus simplement méthodes de parcimonie ou encore parcimonie de Wagner, sont une méthode statistique non-paramétrique très utilisée, notamment pour l'inférence phylogénétique. Cette méthode permet de construire des arbres de classification hiérarchique après enracinement, lesquels permettent d'obtenir des informations sur la structure de parenté d'un ensemble de taxons. Sous l'hypothèse du maximum de parcimonie, l'arbre phylogénétique « préféré » est celui qui requiert le plus petit nombre de changements évolutifs.
Cladistiquevignette|300x300px|Cladogramme représentant les relations de degré de parenté entre taxons représentant les archées, les eucaryotes et les procaryotes. La cladistique (ou systématique phylogénétique) est la théorie des clades et des cladogrammes (du grec ancien , « branche »), et de la reconstruction des relations de parenté entre les êtres vivants. Un clade (groupe monophylétique) est un groupe dont tous les membres sont plus apparentés entre eux qu'avec n'importe quel autre groupe, et un cladogramme (arbre phylogénétique) est une hiérarchie de clades.
Microbial phylogeneticsMicrobial phylogenetics is the study of the manner in which various groups of microorganisms are genetically related. This helps to trace their evolution. To study these relationships biologists rely on comparative genomics, as physiology and comparative anatomy are not possible methods. Microbial phylogenetics emerged as a field of study in the 1960s, scientists started to create genealogical trees based on differences in the order of amino acids of proteins and nucleotides of genes instead of using comparative anatomy and physiology.
Computational statisticsComputational statistics, or statistical computing, is the bond between statistics and computer science. It means statistical methods that are enabled by using computational methods. It is the area of computational science (or scientific computing) specific to the mathematical science of statistics. This area is also developing rapidly, leading to calls that a broader concept of computing should be taught as part of general statistical education.
Tabulation-separated valuesTab-separated values (TSV) is a simple, for storing tabular data. Records are separated by newlines, and values within a record are separated by tab characters. The TSV format is thus a delimiter-separated values format, similar to comma-separated values. TSV is a simple file format that is widely supported, so it is often used in data exchange to move tabular data between different computer programs that support the format. For example, a TSV file might be used to transfer information from a database to a spreadsheet.
Méthode expérimentaleLes méthodes expérimentales scientifiques consistent à tester la validité d'une hypothèse, en reproduisant un phénomène (souvent en laboratoire) et en faisant varier un paramètre. Le paramètre que l'on fait varier est impliqué dans l'hypothèse. Le résultat de l'expérience valide ou non l'hypothèse. La démarche expérimentale est appliquée dans les recherches dans des sciences telles que, par exemple, la biologie, la physique, la chimie, l'informatique, la psychologie, ou encore l'archéologie.
Comma-separated values, connu sous le sigle CSV, est un format texte ouvert représentant des données tabulaires sous forme de valeurs séparées par des virgules. Ce format n'a jamais vraiment fait l'objet d'une spécification formelle. Toutefois, la décrit la forme la plus courante et établit son type MIME « text/csv », enregistré auprès de l'IANA. Un fichier CSV est un fichier texte, par opposition aux formats dits « binaires ». Chaque ligne du texte correspond à une ligne du tableau et les virgules correspondent aux séparations entre les colonnes.
Évolution (biologie)En biologie, l’évolution est la transformation du monde vivant au cours du temps, qui se manifeste par des changements phénotypiques des organismes à travers les générations. Ces changements généralement graduels (mais pouvant être rapides ou lents) peuvent aboutir, à partir d’une seule espèce (dite « espèce-mère »), à la formation de nouvelles variétés périphériques devenant progressivement des « espèces-filles ». Inversement, la fusion de deux lignées par hybridation ou par symbiogenèse entre deux populations d'espèces différentes peuvent produire une troisième espèce nouvelle.
Bootstrap (statistiques)En statistiques, les techniques de bootstrap sont des méthodes d'inférence statistique basées sur la réplication multiple des données à partir du jeu de données étudié, selon les techniques de rééchantillonnage. Elles datent de la fin des années 1970, époque où la possibilité de calculs informatiques intensifs devient abordable. On calculait depuis près d'un siècle des estimations : mesures de dispersion (variance, écart-type), intervalles de confiance, tables de décision pour des tests d'hypothèse, etc.
Standard MLStandard ML (SML) is a general-purpose, modular, functional programming language with compile-time type checking and type inference. It is popular among compiler writers and programming language researchers, as well as in the development of theorem provers. Standard ML is a modern dialect of ML, the language used in the Logic for Computable Functions (LCF) theorem-proving project. It is distinctive among widely used languages in that it has a formal specification, given as typing rules and operational semantics in The Definition of Standard ML.
Maximum de vraisemblanceEn statistique, l'estimateur du maximum de vraisemblance est un estimateur statistique utilisé pour inférer les paramètres de la loi de probabilité d'un échantillon donné en recherchant les valeurs des paramètres maximisant la fonction de vraisemblance. Cette méthode a été développée par le statisticien Ronald Aylmer Fisher en 1922. Soient neuf tirages aléatoires x1, ..., x9 suivant une même loi ; les valeurs tirées sont représentées sur les diagrammes ci-dessous par des traits verticaux pointillés.