Covariance matrixIn probability theory and statistics, a covariance matrix (also known as auto-covariance matrix, dispersion matrix, variance matrix, or variance–covariance matrix) is a square matrix giving the covariance between each pair of elements of a given random vector. Any covariance matrix is symmetric and positive semi-definite and its main diagonal contains variances (i.e., the covariance of each element with itself). Intuitively, the covariance matrix generalizes the notion of variance to multiple dimensions.
Universvignette|redresse=1.8|Représentation à l'échelle logarithmique de l'Univers observable. Au centre figure le Système solaire et, à mesure qu'on s'en éloigne, les étoiles proches, le bras de Persée, la Voie lactée, les galaxies proches, le réseau des structures à grande échelle, le fond diffus cosmologique et, à la périphérie, le plasma invisible du Big Bang. L'Univers, au sens cosmologique, est l'ensemble de tout ce qui existe, décrit à partir d'observations scientifiques et régi par des lois physiques.
Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
Galaxy ZooGalaxy Zoo est un projet astronomique en ligne qui propose aux internautes de collaborer au projet de classifier plus d'un million de galaxies. Les internautes bénévoles doivent travailler sur des images prises par le programme Sloan Digital Sky Survey et décider si les galaxies sont elliptiques ou spirales et signaler si elles possèdent des particularités comme avoir des spirales en forme de barre ou bien avoir subi des transformations. Le but de ce recensement est de valider les différents modèles galactiques proposés par les scientifiques.
Fond diffus cosmologiqueLe fond diffus cosmologique (FDC, ou CMB pour l'anglais cosmic microwave background, « fond cosmique de micro-ondes ») est un rayonnement électromagnétique très homogène observé dans toutes les directions du ciel et dont le pic d'émission est situé dans le domaine des micro-ondes. On le qualifie de diffus parce qu'il ne provient pas d'une ou plusieurs sources localisées, et de cosmologique parce que, selon l'interprétation qu'on en fait, il est présent dans tout l'Univers (le cosmos).
Relevé du décalage vers le rougedroite|vignette|300x300px|Le rendu des données du relevé 2dFGRS En astronomie, un relevé du décalage vers le rouge (en anglais redshift survey) est un relevé astronomique d'une section du ciel pour mesurer le décalage vers le rouge (redshift) des objets célestes. Il s'agit habituellement de galaxies, mais parfois aussi d'autres objets tels que les amas de galaxies ou les quasars. À l'aide de la loi de Hubble, le décalage vers le rouge peut être utilisé pour estimer la distance entre un objet et la Terre.
Sample mean and covarianceThe sample mean (sample average) or empirical mean (empirical average), and the sample covariance or empirical covariance are statistics computed from a sample of data on one or more random variables. The sample mean is the average value (or mean value) of a sample of numbers taken from a larger population of numbers, where "population" indicates not number of people but the entirety of relevant data, whether collected or not. A sample of 40 companies' sales from the Fortune 500 might be used for convenience instead of looking at the population, all 500 companies' sales.
Galaxievignette|redresse=1.5|M51, la Galaxie du Tourbillon, un exemple typique de galaxie spirale. Une galaxie est une structure cosmique formée par le rassemblement d'étoiles et de leurs planètes éventuelles, de gaz, de poussière interstellaire, peut-être essentiellement de matière noire, et contenant souvent un trou noir supermassif en son centre. Les galaxies peuvent elles-mêmes se rassembler en groupes de galaxies, eux-mêmes pouvant se structurer en amas et superamas de galaxies.
Estimation of covariance matricesIn statistics, sometimes the covariance matrix of a multivariate random variable is not known but has to be estimated. Estimation of covariance matrices then deals with the question of how to approximate the actual covariance matrix on the basis of a sample from the multivariate distribution. Simple cases, where observations are complete, can be dealt with by using the sample covariance matrix.
K-moyennesLe partitionnement en k-moyennes (ou k-means en anglais) est une méthode de partitionnement de données et un problème d'optimisation combinatoire. Étant donnés des points et un entier k, le problème est de diviser les points en k groupes, souvent appelés clusters, de façon à minimiser une certaine fonction. On considère la distance d'un point à la moyenne des points de son cluster ; la fonction à minimiser est la somme des carrés de ces distances.
StatistiqueLa statistique est la discipline qui étudie des phénomènes à travers la collecte de données, leur traitement, leur analyse, l'interprétation des résultats et leur présentation afin de rendre ces données compréhensibles par tous. C'est à la fois une branche des mathématiques appliquées, une méthode et un ensemble de techniques. ce qui permet de différencier ses applications mathématiques avec une statistique (avec une minuscule). Le pluriel est également souvent utilisé pour la désigner : « les statistiques ».
Vide (astronomie)En astronomie, un vide est un espace dont la densité de matière est extrêmement faible situé entre des filaments galactiques reliant des superamas, les plus grandes structures de l'univers. Ces vides ont généralement un diamètre allant de 11 à 150 Mpc. Lorsque des vides prennent de telles dimensions, ils sont parfois appelés supervides. Les vides situés dans des régions à forte densité de matière sont plus petits que ceux situés dans des régions moins denses de l'univers.
Formation et évolution des galaxiesL'étude de la formation et de l'évolution des galaxies s'intéresse aux processus ayant abouti à la formation d'un univers hétérogène à partir d'une prémisse homogène, à la formation des premières galaxies (processus appelé galactogenèse), à la façon dont les galaxies changent avec le temps, et aux processus qui ont conduit à la grande variété des structures observées parmi les galaxies proches. C'est l'un des domaines de recherche les plus actifs en astrophysique.
Galaxie à sursauts de formation d'étoilesUne galaxie à sursaut de formation d'étoiles ou galaxie à flambée (de formation) d'étoiles (starburst galaxy en anglais) est une galaxie présentant un taux exceptionnel de formation d'étoiles par rapport aux taux observés dans la plupart des galaxies. Ce phénomène est limité dans le temps et constitue une étape dans la vie d'une galaxie. On déduit des observations que les sursauts de formation d'étoiles dans une galaxie résultent principalement d'une collision, ou d'une interaction avec une ou plusieurs galaxies proches.
Simulation de phénomènesLa simulation de phénomènes est un outil utilisé dans le domaine de la recherche et du développement. Elle permet d'étudier les réactions d'un système à différentes contraintes pour en déduire les résultats recherchés en se passant d'expérimentation. Les systèmes technologiques (infrastructures, véhicules, réseaux de communication, de transport ou d'énergie) sont soumis à différentes contraintes et actions. Le moyen le plus simple d'étudier leurs réactions serait d'expérimenter, c'est-à-dire d'exercer l'action souhaitée sur l'élément en cause pour observer ou mesurer le résultat.
Décalage vers le rougeLe décalage vers le rouge (en en anglais) est un phénomène astronomique de décalage vers les grandes longueurs d'onde des raies spectrales et de l'ensemble du spectre — ce qui se traduit par un décalage vers le rouge pour le spectre visible — observé parmi les objets astronomiques lointains. À la suite des travaux de Lemaître et Hubble c'est un phénomène bien documenté, considéré comme la preuve initiale de l'expansion de l'Univers et du modèle cosmologique avec le Big Bang.
Big BangLe Big Bang (« Grand Boum ») est un modèle cosmologique utilisé par les scientifiques pour décrire l'origine et l'évolution de l'Univers. De façon générale, le terme « Big Bang » est associé à toutes les théories qui décrivent notre Univers comme issu d'une dilatation rapide. Par extension, il est également associé à cette époque dense et chaude qu’a connue l’Univers il y a d’années, sans que cela préjuge de l’existence d’un « instant initial » ou d’un commencement à son histoire.
Determining the number of clusters in a data setDetermining the number of clusters in a data set, a quantity often labelled k as in the k-means algorithm, is a frequent problem in data clustering, and is a distinct issue from the process of actually solving the clustering problem. For a certain class of clustering algorithms (in particular k-means, k-medoids and expectation–maximization algorithm), there is a parameter commonly referred to as k that specifies the number of clusters to detect.
Statistique descriptiveLa statistique descriptive est la branche des statistiques qui regroupe les nombreuses techniques utilisées pour décrire un ensemble relativement important de données. L'objectif de la statistique descriptive est de décrire, c'est-à-dire de résumer ou représenter, par des statistiques, les données disponibles quand elles sont nombreuses. Toute description d'un phénomène nécessite d'observer ou de connaître certaines choses sur ce phénomène. Les observations disponibles sont toujours constituées d'ensemble d'observations synchrones.
Galaxie naineUne galaxie naine est une petite galaxie composée de 100 millions à quelques milliards d'étoiles, un nombre relativement faible par rapport aux 200 à 400 milliards d'étoiles estimés de la Voie lactée. Ces galaxies gravitent souvent autour de galaxies plus importantes comme la Voie lactée, la galaxie d'Andromède ou la galaxie du Triangle. La Voie lactée possède plus d'une trentaine de galaxies naines connues qui gravitent autour d'elle. La plus grande d'entre elles est le Grand Nuage de Magellan, d'un diamètre d'environ 15000 années-lumière.