Publication

A metric for phylogenetic trees based on matching

Concepts associés (32)

vignette|upright=1.5|Arbre phylogénétique, basé sur le génome d'après Ciccarelli et al. (2006), mettant en évidence les trois domaines du vivant : les eucaryotes en rose (animaux, champignons, plantes et protistes), les bactéries en bleu, et les archées en vert. Un arbre phylogénétique est un arbre schématique qui montre les relations de parenté entre des groupes d'êtres vivants. Chacun des nœuds de l'arbre représente l'ancêtre commun de ses descendants ; le nom qu'il porte est celui du clade formé des groupes frères qui lui appartiennent, non celui de l'ancêtre qui reste impossible à déterminer.

Regroupement hiérarchique

Dans le domaine de l'analyse et de la classification automatique de données, le regroupement hiérarchique est un partitionnement de données ou clustering, au moyen de diverses méthodes, dites « ascendantes » et « descendantes ». Les méthodes dites « descendantes » partent d’une solution générale vers une autre plus spécifique. Les méthodes de cette catégorie démarrent avec une seule classe contenant la totalité puis se divisent à chaque étape selon un critère jusqu’à l’obtention d’un ensemble de classes différentes.

Phylogénie

La phylogenèse ou phylogénie, du grec ancien , « tribu, famille, clan » et , « création », est l'étude des liens de parenté (relations phylogénétiques ou phylétiques) entre les êtres vivants et ceux qui ont disparu : entre individus (niveau généalogique ; seule une généalogie individuelle peut répondre à la question « qui est l'ancêtre de qui ? », tandis qu'une phylogénie de groupe peut répondre à la question « qui est le plus proche parent de qui ? ») ; entre populations (à l'intérieur d'une même espèce qu

Partitionnement de données

vignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.

Computational phylogenetics

Computational phylogenetics is the application of computational algorithms, methods, and programs to phylogenetic analyses. The goal is to assemble a phylogenetic tree representing a hypothesis about the evolutionary ancestry of a set of genes, species, or other taxa. For example, these techniques have been used to explore the family tree of hominid species and the relationships between specific genes shared by many types of organisms.

Classification phylogénétique

La classification phylogénétique ou classification cladistique est une forme de classification des êtres vivants qui repose sur leur phylogénie. Elle prend son origine dans les travaux d'une école de taxonomie dite systématique phylogénétique ou systématique cladistique ou cladisme. Cette approche a pour objectif de rendre compte des relations de parenté entre les taxons, s’agissant seulement de l'apparentement, c'est-à-dire des relations de groupes frères et non des relations généalogiques d'ancêtres à descendants, entre des groupes d'organismes quel que soit leur rang taxonomique.

Single-linkage clustering

In statistics, single-linkage clustering is one of several methods of hierarchical clustering. It is based on grouping clusters in bottom-up fashion (agglomerative clustering), at each step combining two clusters that contain the closest pair of elements not yet belonging to the same cluster as each other. This method tends to produce long thin clusters in which nearby elements of the same cluster have small distances, but elements at opposite ends of a cluster may be much farther from each other than two elements of other clusters.

Phylogénétique moléculaire

vignette|Séquençage moléculaire La phylogénétique moléculaire est l'utilisation de séquences de macromolécules biologiques pour obtenir des informations sur l'histoire évolutive des organismes vivants, et notamment sur leurs liens de parenté (leur phylogénie). C'est un important outil d'étude parmi ceux de l'évolution moléculaire. Le produit d'une analyse de phylogénétique moléculaire est soit un arbre phylogénétique, soit un graphe du réseau phylogénétique.

Mesure (mathématiques)

En mathématiques, une mesure positive (ou simplement mesure quand il n'y a pas de risque de confusion) est une fonction qui associe une grandeur numérique à certains sous-ensembles d'un ensemble donné. Il s'agit d'un important concept en analyse et en théorie des probabilités. Intuitivement, la mesure d'un ensemble ou sous-ensemble est similaire à la notion de taille, ou de cardinal pour les ensembles discrets. Dans ce sens, la mesure est une généralisation des concepts de longueur, aire ou volume dans des espaces de dimension 1, 2 ou 3 respectivement.

Arbre B

En informatique, un arbre B (appelé aussi B-arbre par analogie au terme anglais « B-tree ») est une structure de données en arbre équilibré. Les arbres B sont principalement mis en œuvre dans les mécanismes de gestion de bases de données et de systèmes de fichiers. Ils stockent les données sous une forme triée et permettent une exécution des opérations d'insertion et de suppression en temps toujours logarithmique. Le principe est de permettre aux nœuds parents de posséder plus de deux nœuds enfants : c'est une généralisation de l’arbre binaire de recherche.

Arbre AVL

En informatique théorique, les arbres AVL ont été historiquement les premiers arbres binaires de recherche automatiquement équilibrés. Dans un arbre AVL, les hauteurs des deux sous-arbres d'un même nœud diffèrent au plus de un. La recherche, l'insertion et la suppression sont toutes en dans le pire des cas. L'insertion et la suppression nécessitent d'effectuer des rotations. La dénomination « arbre AVL » provient des noms respectifs de ses deux inventeurs, respectivement et , qui l'ont publié en 1962 sous le titre An Algorithm for the Organization of Information.

Maximum de parcimonie

Les méthodes de maximum de parcimonie, ou plus simplement méthodes de parcimonie ou encore parcimonie de Wagner, sont une méthode statistique non-paramétrique très utilisée, notamment pour l'inférence phylogénétique. Cette méthode permet de construire des arbres de classification hiérarchique après enracinement, lesquels permettent d'obtenir des informations sur la structure de parenté d'un ensemble de taxons. Sous l'hypothèse du maximum de parcimonie, l'arbre phylogénétique « préféré » est celui qui requiert le plus petit nombre de changements évolutifs.

Mesure de Radon

In mathematics (specifically in measure theory), a Radon measure, named after Johann Radon, is a measure on the σ-algebra of Borel sets of a Hausdorff topological space X that is finite on all compact sets, outer regular on all Borel sets, and inner regular on open sets. These conditions guarantee that the measure is "compatible" with the topology of the space, and most measures used in mathematical analysis and in number theory are indeed Radon measures.

Phylogenetic comparative methods

Phylogenetic comparative methods (PCMs) use information on the historical relationships of lineages (phylogenies) to test evolutionary hypotheses. The comparative method has a long history in evolutionary biology; indeed, Charles Darwin used differences and similarities between species as a major source of evidence in The Origin of Species. However, the fact that closely related lineages share many traits and trait combinations as a result of the process of descent with modification means that lineages are not independent.

Mesure extérieure

La notion de mesure extérieure (ou mesure extérieure au sens de Carathéodory) est un concept, dû au mathématicien Constantin Carathéodory, qui généralise dans un cadre axiomatique une construction utilisée par Henri Lebesgue pour définir la mesure de Lebesgue des parties Lebesgue-mesurables de la droite réelle. Soit un ensemble.

Arbre

vignette|Les arbres sont notamment représentés par des espèces du groupe des plantes à fleurs comme ces jacarandas au Zimbabwe. vignette|Même les arbres les plus majestueux commencent leur existence sous forme de modestes plantules, comme celle-ci de hêtre (Fagus sylvatica). vignette|Les arbres contribuent significativement au bien-être et à la subsistance des sociétés humaines. De nombreuses espèces produisent des fruits comestibles, comme ici l'arbre à pain (Artocarpus altilis).

Arbre binaire

En informatique, un arbre binaire est une structure de données qui peut se représenter sous la forme d'une hiérarchie dont chaque élément est appelé nœud, le nœud initial étant appelé racine. Dans un arbre binaire, chaque élément possède au plus deux éléments fils au niveau inférieur, habituellement appelés gauche et droit. Du point de vue de ces éléments fils, l'élément dont ils sont issus au niveau supérieur est appelé père. Au niveau le plus élevé, niveau 0, il y a un nœud racine.

Distance de Levenshtein

La 'distance de Levenshtein' est une distance, au sens mathématique du terme, donnant une mesure de la différence entre deux chaînes de caractères. Elle est égale au nombre minimal de caractères qu'il faut supprimer, insérer ou remplacer pour passer d’une chaîne à l’autre. Elle a été proposée par Vladimir Levenshtein en 1965. Elle est également connue sous les noms de distance d'édition ou de déformation dynamique temporelle, notamment en reconnaissance de formes et particulièrement en reconnaissance vocale.

NP-difficile

vignette|300px|Mise en évidence d'un problème NP-difficile si Problème P ≟ NP. Un problème NP-difficile est, en théorie de la complexité, un problème appartenant à la classe NP-difficile, ce qui revient à dire qu'il est au moins aussi difficile que les problèmes les plus difficiles de la classe NP. Ainsi, un problème H est NP-difficile, si tout problème L de la classe NP peut être réduit en temps polynomial à H. Si un problème NP-difficile est dans NP, alors c'est un problème NP-complet.

Self-balancing binary search tree

In computer science, a self-balancing binary search tree (BST) is any node-based binary search tree that automatically keeps its height (maximal number of levels below the root) small in the face of arbitrary item insertions and deletions. These operations when designed for a self-balancing binary search tree, contain precautionary measures against boundlessly increasing tree height, so that these abstract data structures receive the attribute "self-balancing".