Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
Determining the number of clusters in a data setDetermining the number of clusters in a data set, a quantity often labelled k as in the k-means algorithm, is a frequent problem in data clustering, and is a distinct issue from the process of actually solving the clustering problem. For a certain class of clustering algorithms (in particular k-means, k-medoids and expectation–maximization algorithm), there is a parameter commonly referred to as k that specifies the number of clusters to detect.
Radar à synthèse d'ouverturethumb|upright=1.5|Image prise par un radar à synthèse d'ouverture, monté sur satellite, de l'île de Tenerife aux îles Canaries, montrant les détails géographiques et la végétation en fausses couleurs. Un radar à synthèse d'ouverture (RSO) est un qui permet d'obtenir des images en deux dimensions ou des reconstitutions tridimensionnelles d'objets visés, tels des paysages. Pour cela, il effectue un traitement des données reçues afin d'améliorer la résolution en azimut. Le traitement effectué permet d'affiner l'ouverture de l'antenne.
Interferometric synthetic-aperture radarInterferometric synthetic aperture radar, abbreviated InSAR (or deprecated IfSAR), is a radar technique used in geodesy and remote sensing. This geodetic method uses two or more synthetic aperture radar (SAR) images to generate maps of surface deformation or digital elevation, using differences in the phase of the waves returning to the satellite or aircraft. The technique can potentially measure millimetre-scale changes in deformation over spans of days to years.
K-moyennesLe partitionnement en k-moyennes (ou k-means en anglais) est une méthode de partitionnement de données et un problème d'optimisation combinatoire. Étant donnés des points et un entier k, le problème est de diviser les points en k groupes, souvent appelés clusters, de façon à minimiser une certaine fonction. On considère la distance d'un point à la moyenne des points de son cluster ; la fonction à minimiser est la somme des carrés de ces distances.
Modèle numérique de terrainUn modèle numérique de terrain (MNT) est une représentation de la topographie (altimétrie et/ou bathymétrie) d’une zone terrestre (ou d'une planète tellurique) sous une forme adaptée à son utilisation par un calculateur numérique (ordinateur). droite|300px|vignette|Le Modèle Numérique de Terrain (MNT) ne prend pas en compte les éléments situés au-dessus de la surface contrairement à un Modèle Numérique d'Élévation (MNE) Un modèle numérique de terrain (MNT) est une représentation en 2,5D de la surface d'un terrain ou d'une planète, créée à partir des données d'altitude du terrain.
Correlation clusteringClustering is the problem of partitioning data points into groups based on their similarity. Correlation clustering provides a method for clustering a set of objects into the optimum number of clusters without specifying that number in advance. Cluster analysis In machine learning, correlation clustering or cluster editing operates in a scenario where the relationships between the objects are known instead of the actual representations of the objects.
TélédétectionLa télédétection est l'ensemble des techniques utilisées pour déterminer à distance les propriétés d'objets naturels ou artificiels à partir des rayonnements qu'ils émettent ou réfléchissent. Les techniques de télédétection comprennent l'ensemble du processus : la capture et l'enregistrement de l'énergie d'un rayonnement émis ou réfléchi par les objets observés, le traitement des données résultantes et enfin l'analyse des données finales. Ce processus met en œuvre un capteur (appareil photographique, laser, radar, sonar, lidar, sismographe, gravimètre,.
ElevationThe elevation of a geographic location is its height above or below a fixed reference point, most commonly a reference geoid, a mathematical model of the Earth's sea level as an equipotential gravitational surface (see Geodetic datum § Vertical datum). The term elevation is mainly used when referring to points on the Earth's surface, while altitude or geopotential height is used for points above the surface, such as an aircraft in flight or a spacecraft in orbit, and depth is used for points below the surface.
Ressource hydriqueLa ressource hydrique, ou ressource en eau, comprend, au sens large, toutes les eaux accessibles comme ressources, c'est-à-dire utiles et disponibles pour l'être humain, les végétaux qu'il cultive, le bétail qu'il élève et les écosystèmes, à différents points du cycle de l'eau. Cette ressource est limitée en quantité et en qualité (surtout en zone sèche). Elle est indispensable à la vie et à la plupart des activités humaines, telles que l'agriculture, l'industrie et aux usages domestiques (alimentation en eau potable).
Radar imageurvignette|Image prise par un radar à synthèse d'ouverture (RSO), monté sur satellite, de l'île de Tenerife aux îles Canaries, montrant les détails géographiques et la végétation en fausses couleurs Un radar imageur est un radar actif qui émet un faisceau d'impulsions dans le domaine des longueurs d'onde centimétriques ou millimétriques pour représenter en deux ou trois dimensions l'environnement exploré. Cette imagerie a des applications tant civiles que militaires.
Eau potablethumb|L'eau distribuée au robinet en France doit répondre aux normes de qualité des eaux destinées à la consommation humaine, édictées au niveau européen. Une eau liquide est dite potable (du latin potabilis, qui signifie « qui peut être bu ») lorsqu'elle présente certaines caractéristiques la rendant propre à la consommation humaine. Les standards de référence dans ce domaine diffèrent selon les époques, les pays et, dans certains pays, selon l'autorité responsable de la définition.
Purification de l'eauvignette|Usine de traitement de l'eau à Fontburn, dans le nord de l'Angleterre. La purification de l'eau regroupe l'ensemble des techniques et méthodes permettant d'obtenir de l'« eau de procédé » à partir d'eau potable. Beaucoup d'industries utilisent de l'eau douce pour leurs procédés de production. L'eau de procédé peut avoir différents noms – et différentes caractéristiques – selon l'industrie et l'application, par exemple : « eau purifiée » et « eau pour préparation injectable » (eau PPI) dans l'industrie pharmaceutique ; « eau ultrapure » ou « eau » en microélectronique.
Imagerie spatialethumb|Première image de la Terre prise par un satellite en orbite. Elle montre une zone éclairée par le Soleil dans l'océan Pacifique et la couverture nuageuse. L'image a été faite alors que le satellite Explorer 6 se trouvait à environ d'altitude, le . thumb|La région des Grands lacs vus depuis l'ISS en 2013 par l'astronaute canadien Chris Hadfield. L'imagerie spatiale est une technique d'observation à distance qui repose sur la prise d'images dans le domaine optique (lumière visible, infrarouge et ultraviolet) depuis l'espace par des équipements installés à bord de satellites artificiels.
Système d'information géographiqueUn système d'information géographique ou SIG (en anglais, geographic information system ou GIS) est un système d'information conçu pour recueillir, stocker, traiter, analyser, gérer et présenter tous les types de données spatiales et géographiques. L’acronyme SIG est parfois utilisé pour définir les « sciences de l’information géographique » ou « études sur l’information géospatiale ». Cela se réfère aux carrières ou aux métiers qui impliquent l'usage de systèmes d’information géographique et, dans une plus large mesure, qui concernent les disciplines de la géo-informatique (ou géomatique).
Pollution de l'eauvignette|Les détritus de type déchets ménagers sont souvent indicateurs de pollutions (métaux lourds, micro-organismes) posant des problèmes de santé publique, notamment dans les régions où les eaux de surfaces sont utilisées pour la boisson, la lessive, la vaisselle, se laver, faire la cuisine, etc.). vignette|Les pollutions les plus spectaculaires (par des sels de fer ici) ne sont pas toujours les plus toxiques, mais de fortes concentrations d'un produit non réputé toxique (fer, sel par exemple) peuvent faire disparaître la plupart des formes de vie.
Réutilisation ou recyclage des eaux uséesLa réutilisation des eaux usées, ou recyclage, consiste à récupérer les eaux usées après plusieurs traitements destinés à en éliminer les impuretés, afin de stocker et d'employer cette eau à nouveau. Le recyclage remplit donc un double objectif d’économie de la ressource : il permet à la fois d'économiser les ressources en amont en les réutilisant, mais aussi de diminuer le volume des rejets pollués. L'intérêt en est cependant limité quand il n'y a pas de tension quantitative sur la ressource en eau dans le secteur concerné.
Réduction de la dimensionnalitévignette|320x320px|Animation présentant la projection de points en deux dimensions sur les axes obtenus par analyse en composantes principales, une méthode populaire de réduction de la dimensionnalité La réduction de la dimensionnalité (ou réduction de (la) dimension) est un processus étudié en mathématiques et en informatique, qui consiste à prendre des données dans un espace de grande dimension, et à les remplacer par des données dans un espace de plus petite dimension.
Partitionnement spectralEn informatique théorique, le partitionnement spectral ou spectral clustering en anglais, est un type de partitionnement de données prenant en compte les propriétés spectrales de l'entrée. Le partitionnement spectral utilise le plus souvent les vecteurs propres d'une matrice de similarités. Par rapport à des algorithmes classiques comme celui des k-moyennes, cette technique offre l'avantage de classer des ensembles de données de structure « non-globulaire », dans un espace de représentation adéquat.
Kernel principal component analysisIn the field of multivariate statistics, kernel principal component analysis (kernel PCA) is an extension of principal component analysis (PCA) using techniques of kernel methods. Using a kernel, the originally linear operations of PCA are performed in a reproducing kernel Hilbert space. Recall that conventional PCA operates on zero-centered data; that is, where is one of the multivariate observations.