Publication

On the estimation of geodesic paths on sampled manifolds under random projections

Concepts associés (20)

Nonlinear dimensionality reduction, also known as manifold learning, refers to various related techniques that aim to project high-dimensional data onto lower-dimensional latent manifolds, with the goal of either visualizing the data in the low-dimensional space, or learning the mapping (either from the high-dimensional space to the low-dimensional embedding or vice versa) itself. The techniques described below can be understood as generalizations of linear decomposition methods used for dimensionality reduction, such as singular value decomposition and principal component analysis.

Géodésique

En géométrie, une géodésique est la généralisation d'une ligne droite du plan ou de l'espace euclidien, au cadre des surfaces, ou plus généralement des variétés ou des espaces métriques. Elles sont étroitement liées à la notion de plus court chemin relativement à un calcul de distance sur un tel espace. Ainsi, le plus court chemin (ou les plus courts chemins, s'il en existe plusieurs), entre deux points est toujours une géodésique. Mais plus précisément, on appelle géodésique une courbe qui, à l'échelle locale, relie les points en minimisant la distance.

Geodesics on an ellipsoid

The study of geodesics on an ellipsoid arose in connection with geodesy specifically with the solution of triangulation networks. The figure of the Earth is well approximated by an oblate ellipsoid, a slightly flattened sphere. A geodesic is the shortest path between two points on a curved surface, analogous to a straight line on a plane surface. The solution of a triangulation network on an ellipsoid is therefore a set of exercises in spheroidal trigonometry .

Réduction de la dimensionnalité

vignette|320x320px|Animation présentant la projection de points en deux dimensions sur les axes obtenus par analyse en composantes principales, une méthode populaire de réduction de la dimensionnalité La réduction de la dimensionnalité (ou réduction de (la) dimension) est un processus étudié en mathématiques et en informatique, qui consiste à prendre des données dans un espace de grande dimension, et à les remplacer par des données dans un espace de plus petite dimension.

Recherche des plus proches voisins

La recherche des plus proches voisins, ou des k plus proches voisins, est un problème algorithmique classique. De façon informelle le problème consiste, étant donné un point à trouver, dans un ensemble d'autres points, quels sont les k plus proches. La recherche de voisinage est utilisée dans de nombreux domaines, tels la reconnaissance de formes, le clustering, l'approximation de fonctions, la prédiction de séries temporelles et même les algorithmes de compression (recherche d'un groupe de données le plus proche possible du groupe de données à compresser pour minimiser l'apport d'information).

Méthode des k plus proches voisins

En intelligence artificielle, plus précisément en apprentissage automatique, la méthode des k plus proches voisins est une méthode d’apprentissage supervisé. En abrégé KPPV ou k-PPV en français, ou plus fréquemment k-NN ou KNN, de l'anglais k-nearest neighbors. Dans ce cadre, on dispose d’une base de données d'apprentissage constituée de N couples « entrée-sortie ». Pour estimer la sortie associée à une nouvelle entrée x, la méthode des k plus proches voisins consiste à prendre en compte (de façon identique) les k échantillons d'apprentissage dont l’entrée est la plus proche de la nouvelle entrée x, selon une distance à définir.

Positionnement multidimensionnel

Le positionnement multidimensionnel est un ensemble de techniques statistiques utilisées dans le domaine de la visualisation d'information pour explorer les similarités dans les données. Le positionnement multidimentionnel est un cas particulier d'analyse multivariée. Typiquement, un algorithme de positionnement multidimensionnel part d'une matrice de similarité entre tous les points pour affecter à chaque point une position dans un espace à dimensions. Pour = 2 ou = 3, les positions peuvent être visualisées sur un plan ou dans un volume par un nuage de points.

Espace de longueur

En mathématiques, un espace de longueur est un espace métrique particulier, qui généralise la notion de variété riemannienne : la distance y est définie par une fonction vérifiant une axiomatique la rendant proche de l'idée concrète de distance. Les espaces de longueur ont été étudiés au début du par et sous le nom d'espaces métriques intrinsèques, et réintroduits plus récemment par Mikhaïl Gromov. Soit X un espace topologique. Une courbe dans X est une application continue , où I est un intervalle de .

Euclidean distance

In mathematics, the Euclidean distance between two points in Euclidean space is the length of a line segment between the two points. It can be calculated from the Cartesian coordinates of the points using the Pythagorean theorem, therefore occasionally being called the Pythagorean distance. These names come from the ancient Greek mathematicians Euclid and Pythagoras, although Euclid did not represent distances as numbers, and the connection from the Pythagorean theorem to distance calculation was not made until the 18th century.

Geodesics in general relativity

In general relativity, a geodesic generalizes the notion of a "straight line" to curved spacetime. Importantly, the world line of a particle free from all external, non-gravitational forces is a particular type of geodesic. In other words, a freely moving or falling particle always moves along a geodesic. In general relativity, gravity can be regarded as not a force but a consequence of a curved spacetime geometry where the source of curvature is the stress–energy tensor (representing matter, for instance).

Courbure de Gauss

vignette|De gauche à droite : une surface de courbure de Gauss négative (un hyperboloïde), une surface de courbure nulle (un cylindre), et une surface de courbure positive (une sphère). vignette|Certains points du tore sont de courbure positive (points elliptiques) et d'autres de courbure négative (points hyperboliques) La courbure de Gauss, parfois aussi appelée courbure totale, d'une surface paramétrée X en X(P) est le produit des courbures principales. De manière équivalente, la courbure de Gauss est le déterminant de l'endomorphisme de Weingarten.

Elastic map

Elastic maps provide a tool for nonlinear dimensionality reduction. By their construction, they are a system of elastic springs embedded in the data space. This system approximates a low-dimensional manifold. The elastic coefficients of this system allow the switch from completely unstructured k-means clustering (zero elasticity) to the estimators located closely to linear PCA manifolds (for high bending and low stretching modules). With some intermediate values of the elasticity coefficients, this system effectively approximates non-linear principal manifolds.

Fléau de la dimension

Le fléau de la dimension ou malédiction de la dimension (curse of dimensionality) est un terme inventé par Richard Bellman en 1961 pour désigner divers phénomènes qui ont lieu lorsque l'on cherche à analyser ou organiser des données dans des espaces de grande dimension alors qu'ils n'ont pas lieu dans des espaces de dimension moindre. Plusieurs domaines sont concernés et notamment l'apprentissage automatique, la fouille de données, les bases de données, l'analyse numérique ou encore l'échantillonnage.

Dimension

Le terme dimension, du latin dimensio « action de mesurer », désigne d’abord chacune des grandeurs d’un objet : longueur, largeur et profondeur, épaisseur ou hauteur, ou encore son diamètre si c'est une pièce de révolution. L’acception a dérivé de deux façons différentes en physique et en mathématiques. En physique, la dimension qualifie une grandeur indépendamment de son unité de mesure, tandis qu’en mathématiques, la notion de dimension correspond au nombre de grandeurs nécessaires pour identifier un objet, avec des définitions spécifiques selon le type d’objet (algébrique, topologique ou combinatoire notamment).

Géométrie euclidienne

La géométrie euclidienne commence avec les Éléments d'Euclide, qui est à la fois une somme des connaissances géométriques de l'époque et une tentative de formalisation mathématique de ces connaissances. Les notions de droite, de plan, de longueur, d'aire y sont exposées et forment le support des cours de géométrie élémentaire. La conception de la géométrie est intimement liée à la vision de l'espace physique ambiant au sens classique du terme.

Topologie en basses dimensions

En mathématiques, la topologie en basses dimensions est la branche de la topologie qui concerne les variétés de dimension inférieure ou égale à quatre. Des sujets représentatifs en sont l'étude des variétés de dimension 3 et la théorie des nœuds et des tresses. Elle fait partie de la topologie géométrique. Un certain nombre d'avancées, à partir des années 1960, ont mis l'accent sur les basses dimensions en topologie.

Distance (géographie)

La distance en géographie peut être entendue comme la longueur de l'intervalle ou du trajet séparant deux ou plusieurs lieux. La distance est la marque d'une séparation, son franchissement nécessite obligatoirement une dépense énergétique. Les formules contenues dans cet article permettent de calculer les distances entre des points qui sont définis par leurs coordonnées géographiques à l'aide de la notion de latitude et de longitude. Calculer la distance entre deux coordonnées géographiques nécessite un certain degré d'abstraction.

Forêt d'arbres décisionnels

vignette|Illustration du principe de construction d'une forêt aléatoire comme agrégation d'arbre aléatoires. En apprentissage automatique, les forêts d'arbres décisionnels (ou forêts aléatoires de l'anglais random forest classifier) forment une méthode d'apprentissage ensembliste. Ils ont été premièrement proposées par Ho en 1995 et ont été formellement proposées en 2001 par Leo Breiman et Adele Cutler. Cet algorithme combine les concepts de sous-espaces aléatoires et de bagging.

Dimension de Hausdorff

En mathématiques, et plus précisément en topologie, la dimension de Hausdorff d'un espace métrique (X,d) est un nombre réel positif ou nul, éventuellement l'infini. Introduite en 1918 par le mathématicien Felix Hausdorff, elle a été développée par Abram Besicovitch, c'est pourquoi elle est parfois appelée dimension de Hausdorff-Besicovitch. L'exemple le plus simple est l'espace euclidien de dimension (au sens des espaces vectoriels) égale à n (ou plus généralement un espace vectoriel réel de dimension n muni d'une distance associée à une norme) : sa dimension de Hausdorff d est aussi égale à n, dimension de l'espace vectoriel.

Point (géométrie)

thumb|Points dans un plan euclidien. En géométrie, un point est le plus petit élément constitutif de l'espace géométrique, c'est-à-dire un lieu au sein duquel on ne peut distinguer aucun autre lieu que lui-même. géométrie euclidienne Le point, selon Euclide, est . On peut aussi dire plus simplement qu'un point ne désigne pas un objet mais un emplacement. Il n'a donc aucune dimension, longueur, largeur, épaisseur, volume ou aire. Sa seule caractéristique est sa position. On dit parfois qu'il est « infiniment petit ».