Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
Grappe de serveursOn parle de grappe de serveurs, de cluster, de groupement de serveurs ou de ferme de calcul (computer cluster en anglais) pour désigner des techniques consistant à regrouper plusieurs ordinateurs indépendants appelés nœuds (node en anglais), afin de permettre une gestion globale et de dépasser les limitations d'un ordinateur pour : augmenter la disponibilité ; faciliter la montée en charge ; permettre une répartition de la charge ; faciliter la gestion des ressources (processeur, mémoire vive, disques durs,
Amas de galaxiesUn amas de galaxies, ou amas galactique, est l'association de plus d'une centaine de galaxies liées entre elles par la gravitation. En dessous de 100, on parle plutôt de groupe de galaxies, même si la frontière entre groupe et amas n'est pas clairement définie. Ces amas se caractérisent par leur forme spécifique (sphérique, symétrique ou quelconque), ainsi que par la répartition et leurs nombres de galaxies (jusqu'à plusieurs milliers). Ils se sont formés il y a 10 milliards d'années et plus.
Amas globulaireEn astronomie, un amas globulaire est un amas stellaire très dense, contenant typiquement une centaine de milliers d'étoiles distribuées dans une sphère dont la taille varie d'une vingtaine à quelques centaines d'années-lumière. Leur densité est ainsi nettement plus élevée que celle des amas ouverts. Les étoiles de ces amas sont généralement des géantes rouges. On compte globulaires dans notre galaxie, la Voie lactée. Mais il en existe sans doute d'autres, qui restent indétectables parce que masqués par le disque galactique.
Champ de force (chimie)vignette|Un champ de force peut par exemple être utilisé afin de minimiser l'énergie d'étirement de cette molécule d'éthane. Dans le cadre de la mécanique moléculaire, un champ de force est un ensemble de potentiels et de paramètres permettant de décrire la structure de l'énergie potentielle d'un système de particules (typiquement, des atomes, mais non exclusivement). L'usage de l'expression champ de force en chimie et biologie numériques diffère ainsi de celui de la physique, où il indique en général un gradient négatif d'un potentiel scalaire.
Chimie numériqueLa chimie numérique ou chimie informatique, parfois aussi chimie computationnelle, est une branche de la chimie et de la physico-chimie qui utilise les lois de la chimie théorique exploitées dans des programmes informatiques spécifiques afin de calculer structures et propriétés d'objets chimiques tels que les molécules, les solides, les agrégats atomiques (ou clusters), les surfaces, etc., en appliquant autant que possible ces programmes à des problèmes chimiques réels.
Chimie quantiqueLa chimie quantique est une branche de la chimie théorique qui applique la mécanique quantique aux systèmes moléculaires pour étudier les processus et les propriétés chimiques. Le comportement électronique et nucléaire des molécules étant responsable des propriétés chimiques, il ne peut être décrit adéquatement qu'à partir de l'équation du mouvement quantique (équation de Schrödinger) et des autres postulats fondamentaux de la mécanique quantique. Cette nécessité a motivé le développement de concepts (notamment orbitale moléculaire.
Amas stellaireUn amas stellaire est une concentration locale d'étoiles d'origine commune et liées entre elles par la gravitation, dans un espace dont les dimensions peuvent atteindre 200 pc. Ces objets sont classés en plusieurs familles selon leur aspect ; ce sont, par compacité croissante : les associations stellaires, les amas ouverts et les amas globulaires. Les amas stellaires se maintiennent par l'attraction gravitationnelle mutuelle de leurs membres.
Repliement des protéinesthumb|right|300px|Repliement des protéines Le repliement des protéines est le processus physique par lequel un polypeptide se replie dans sa structure tridimensionnelle caractéristique dans laquelle il est fonctionnel. Chaque protéine commence sous forme de polypeptide, transcodée depuis une séquence d'ARNm en une chaîne linéaire d'acides aminés. Ce polypeptide ne possède pas à ce moment de structure tridimensionnelle développée (voir côté gauche de la figure).
Amas ouvertEn astronomie, un amas ouvert est un amas stellaire groupant environ de 100 à étoiles de même âge liées entre elles par la gravitation, et dont le diamètre varie de 1,5 à 15 pc, avec une moyenne de 4 à 5 pc. Les amas ouverts sont peu lumineux et s’observent essentiellement dans notre Galaxie, où ils se situent dans le plan galactique, et dans les galaxies proches : les deux Nuages de Magellan et la galaxie d’Andromède. On pense qu'ils se forment au sein des nuages moléculaires, les grands nuages de gaz et de poussières qui constituent les nébuleuses diffuses.
Regroupement hiérarchiqueDans le domaine de l'analyse et de la classification automatique de données, le regroupement hiérarchique est un partitionnement de données ou clustering, au moyen de diverses méthodes, dites « ascendantes » et « descendantes ». Les méthodes dites « descendantes » partent d’une solution générale vers une autre plus spécifique. Les méthodes de cette catégorie démarrent avec une seule classe contenant la totalité puis se divisent à chaque étape selon un critère jusqu’à l’obtention d’un ensemble de classes différentes.
Méthode ab initio de chimie quantiqueLes méthodes ab initio de chimie quantique sont des méthodes de chimie numérique basées sur la chimie quantique. La méthode ab initio la plus simple de calcul de structure électronique est le schéma Hartree-Fock (HF), dans laquelle la répulsion coulombienne électron-électron n'est pas spécifiquement prise en compte. Seul son effet moyen est inclus dans le calcul. Lorsque la taille de la base est augmentée, l'énergie et la fonction d'onde tendent vers une limite appelée limite Hartree-Fock.
Structure tertiaireEn biochimie, la structure tertiaire ou tridimensionnelle est le repliement dans l'espace d'une chaîne polypeptidique. Ce repliement donne sa fonctionnalité à la protéine, notamment par la formation du site actif des enzymes. . La structure tertiaire correspond au degré d'organisation supérieur aux hélices α ou aux feuillets β. Ces protéines possèdent des structures secondaires associées le long de la chaîne polypeptidique. Le repliement et la stabilisation de protéines à structure tertiaire dépend de plusieurs types de liaisons faibles qui stabilisent l'édifice moléculaire.
Boîte quantiqueUne boîte quantique ou point quantique, aussi connu sous son appellation anglophone de quantum dot, est une nanostructure de semi-conducteurs. De par sa taille et ses caractéristiques, elle se comporte comme un puits de potentiel qui confine les électrons (et les trous) dans les trois dimensions de l'espace, dans une région d'une taille de l'ordre de la longueur d'onde des électrons (longueur d'onde de De Broglie), soit quelques dizaines de nanomètres dans un semi-conducteur.
Méthode du cluster coupléLa méthode du cluster couplé, ou théorie du cluster couplé (expression souvent abrégée en « cluster couplé », en anglais coupled cluster) est une technique numérique de description des systèmes à plusieurs corps. Son utilisation la plus répandue est comme méthode ab initio de chimie quantique post-Hartree-Fock en chimie numérique. Il est basé sur la méthode d'orbitale moléculaire Hartree-Fock et lui ajoute un terme de correction afin de prendre en compte la corrélation électronique.
Domaine protéiqueredresse=1.15|vignette|Exemples de structures de protéines organisées en domaines distincts. Le domaine de couleur brique, appelé domaine PH, est commun aux deux protéines,. Sa fonction est de fixer le phosphatidylinositol-3,4,5-trisphosphate (PIP3) Un domaine protéique est une partie d'une protéine capable d'adopter une structure de manière autonome ou partiellement autonome du reste de la molécule. C'est un élément modulaire de la structure des protéines qui peuvent ainsi être composées de l'assemblage de plusieurs de ces domaines.
K-moyennesLe partitionnement en k-moyennes (ou k-means en anglais) est une méthode de partitionnement de données et un problème d'optimisation combinatoire. Étant donnés des points et un entier k, le problème est de diviser les points en k groupes, souvent appelés clusters, de façon à minimiser une certaine fonction. On considère la distance d'un point à la moyenne des points de son cluster ; la fonction à minimiser est la somme des carrés de ces distances.
Protéineredresse=1.36|vignette|Représentation d'une protéine, ici deux sous-unités d'une molécule d'hémoglobine. On observe les représentées en couleur, ainsi que deux des quatre molécules d'hème, qui sont les groupes prosthétiques caractéristiques de cette protéine. redresse=1.36|vignette|Liaison peptidique –CO–NH– au sein d'un polypeptide. Le motif constitue le squelette de la protéine, tandis que les groupes liés aux sont les chaînes latérales des résidus d'acides aminés.
Mécanique quantiqueLa mécanique quantique est la branche de la physique théorique qui a succédé à la théorie des quanta et à la mécanique ondulatoire pour étudier et décrire les phénomènes fondamentaux à l'œuvre dans les systèmes physiques, plus particulièrement à l'échelle atomique et subatomique. Elle fut développée dans les années 1920 par une dizaine de physiciens européens, pour résoudre des problèmes que la physique classique échouait à expliquer, comme le rayonnement du corps noir, l'effet photo-électrique, ou l'existence des raies spectrales.
Clustering high-dimensional dataClustering high-dimensional data is the cluster analysis of data with anywhere from a few dozen to many thousands of dimensions. Such high-dimensional spaces of data are often encountered in areas such as medicine, where DNA microarray technology can produce many measurements at once, and the clustering of text documents, where, if a word-frequency vector is used, the number of dimensions equals the size of the vocabulary.