Régression linéaireEn statistiques, en économétrie et en apprentissage automatique, un modèle de régression linéaire est un modèle de régression qui cherche à établir une relation linéaire entre une variable, dite expliquée, et une ou plusieurs variables, dites explicatives. On parle aussi de modèle linéaire ou de modèle de régression linéaire. Parmi les modèles de régression linéaire, le plus simple est l'ajustement affine. Celui-ci consiste à rechercher la droite permettant d'expliquer le comportement d'une variable statistique y comme étant une fonction affine d'une autre variable statistique x.
Régression logistiqueEn statistiques, la régression logistique ou modèle logit est un modèle de régression binomiale. Comme pour tous les modèles de régression binomiale, il s'agit d'expliquer au mieux une variable binaire (la présence ou l'absence d'une caractéristique donnée) par des observations réelles nombreuses, grâce à un modèle mathématique. En d'autres termes d'associer une variable aléatoire de Bernoulli (génériquement notée ) à un vecteur de variables aléatoires . La régression logistique constitue un cas particulier de modèle linéaire généralisé.
Multinomial logistic regressionIn statistics, multinomial logistic regression is a classification method that generalizes logistic regression to multiclass problems, i.e. with more than two possible discrete outcomes. That is, it is a model that is used to predict the probabilities of the different possible outcomes of a categorically distributed dependent variable, given a set of independent variables (which may be real-valued, binary-valued, categorical-valued, etc.).
Régression polynomialePolyreg scheffe.svg thumb|Régression sur un nuage de points par un polynôme de degré croissant. La régression polynomiale est une analyse statistique qui décrit la variation d'une variable aléatoire expliquée à partir d'une fonction polynomiale d'une variable aléatoire explicative. C'est un cas particulier de régression linéaire multiple, où les observations sont construites à partir des puissances d'une seule variable.
Régression (statistiques)En mathématiques, la régression recouvre plusieurs méthodes d’analyse statistique permettant d’approcher une variable à partir d’autres qui lui sont corrélées. Par extension, le terme est aussi utilisé pour certaines méthodes d’ajustement de courbe. En apprentissage automatique, on distingue les problèmes de régression des problèmes de classification. Ainsi, on considère que les problèmes de prédiction d'une variable quantitative sont des problèmes de régression tandis que les problèmes de prédiction d'une variable qualitative sont des problèmes de classification.
MaïsLe maïs (Zea mays L., ou Zea mays subsp. mays (autonyme)), appelé blé d’Inde au Canada, est une plante herbacée tropicale annuelle de la famille des Poacées (graminées), largement cultivée comme céréale pour ses grains riches en amidon, mais aussi comme plante fourragère. Le terme désigne aussi le grain de maïs lui-même. Cette espèce, originaire du Mexique, constituait l'aliment de base des Amérindiens avant l'arrivée en Amérique de Christophe Colomb.
Ordinal regressionIn statistics, ordinal regression, also called ordinal classification, is a type of regression analysis used for predicting an ordinal variable, i.e. a variable whose value exists on an arbitrary scale where only the relative ordering between different values is significant. It can be considered an intermediate problem between regression and classification. Examples of ordinal regression are ordered logit and ordered probit.
Blé d'hiverthumb|Épi de blé d'hiver. Un « blé d'hiver » ou «blé d'automne» est un blé semé en automne pour germer et former en jeunes plants qui restent en phase végétative pendant l'hiver, avant de renouer avec la croissance au début du printemps. Il s'agit généralement de Triticum aestivum. La classification en blé d'hiver ou blé de printemps est commune et se réfère traditionnellement à la période pendant laquelle la plante est cultivée dans l'hémisphère Nord.
Machine à vecteurs de supportLes machines à vecteurs de support ou séparateurs à vaste marge (en anglais support-vector machine, SVM) sont un ensemble de techniques d'apprentissage supervisé destinées à résoudre des problèmes de discrimination et de régression. Les SVM sont une généralisation des classifieurs linéaires. Les séparateurs à vaste marge ont été développés dans les années 1990 à partir des considérations théoriques de Vladimir Vapnik sur le développement d'une théorie statistique de l'apprentissage : la théorie de Vapnik-Tchervonenkis.
Blévignette|Épi de blé.« Blé » est un terme générique qui désigne plusieurs céréales appartenant au genre Triticum. Ce sont des plantes annuelles de la famille des graminées, cultivées dans de très nombreux pays. Le mot « blé » désigne également le « grain » (caryopse) produit par ces plantes. Le blé fait partie des trois grandes céréales avec le maïs et le riz. C'est, avec environ de tonnes annuelles, la troisième par l'importance de la récolte mondiale et, avec le riz, la plus consommée par l'homme.
Maïs génétiquement modifiévignette|Le 25 juillet 2004, plant de maïs OGM arraché par un membre français de l'organisation "les faucheurs volontaires". Un maïs génétiquement modifié est une variété cultivée (cultivar) de maïs (Zea mays) dont le patrimoine génétique a été modifié par l'Homme. Lorsque des gènes étrangers sont introduits par transgénèse dans le génome du maïs, on parle de « maïs transgénique ». La plupart des maïs génétiquement modifiés sont des variétés transgéniques qui se classent dans deux grandes catégories : les variétés résistantes à des insectes ravageurs (maïs Bt) et les variétés résistantes à des herbicides.
Ridge regressionRidge regression is a method of estimating the coefficients of multiple-regression models in scenarios where the independent variables are highly correlated. It has been used in many fields including econometrics, chemistry, and engineering. Also known as Tikhonov regularization, named for Andrey Tikhonov, it is a method of regularization of ill-posed problems. It is particularly useful to mitigate the problem of multicollinearity in linear regression, which commonly occurs in models with large numbers of parameters.
Elastic net regularizationIn statistics and, in particular, in the fitting of linear or logistic regression models, the elastic net is a regularized regression method that linearly combines the L1 and L2 penalties of the lasso and ridge methods. The elastic net method overcomes the limitations of the LASSO (least absolute shrinkage and selection operator) method which uses a penalty function based on Use of this penalty function has several limitations. For example, in the "large p, small n" case (high-dimensional data with few examples), the LASSO selects at most n variables before it saturates.
Échantillonnage (statistiques)thumb|Exemple d'échantillonnage aléatoire En statistique, l'échantillonnage désigne les méthodes de sélection d'un sous-ensemble d'individus (un échantillon) à l'intérieur d'une population pour estimer les caractéristiques de l'ensemble de la population. Cette méthode présente plusieurs avantages : une étude restreinte sur une partie de la population, un moindre coût, une collecte des données plus rapide que si l'étude avait été réalisé sur l'ensemble de la population, la réalisation de contrôles destructifs Les résultats obtenus constituent un échantillon.
Trois sœurs (agriculture)thumb|upright|Association courge-haricot-maïs dans la milpa amérindienne. La technique agricole dite des trois sœurs, ou Milpa, est une culture en symbiose mixte de culture associée de courges, de maïs et de haricots grimpants (habituellement le haricot tépari ou le haricot commun). Ce mode de culture associée représente les trois principales cultures pratiquées traditionnellement par diverses communautés autochtones d'Amérique du Nord et d'Amérique centrale.
Soil moistureSoil moisture is the water content of the soil. It can be expressed in terms of volume or weight. Soil moisture measurement can be based on in situ probes (e.g., capacitance probes, neutron probes) or remote sensing methods. Water that enters a field is removed from a field by runoff, drainage, evaporation or transpiration.
Soil testSoil test may refer to one or more of a wide variety of soil analysis conducted for one of several possible reasons. Possibly the most widely conducted soil tests are those done to estimate the plant-available concentrations of plant nutrients, in order to determine fertilizer recommendations in agriculture. Other soil tests may be done for engineering (geotechnical), geochemical or ecological investigations. In agriculture, a soil test commonly refers to the analysis of a soil sample to determine nutrient content, composition, and other characteristics such as the acidity or pH level.
Gestion de versionsthumb|Exemple d'arbre de gestion de versions La gestion de versions ( ou revision control) consiste à gérer l'ensemble des versions d'un ou plusieurs fichiers (généralement en texte). Essentiellement utilisée dans le domaine de la création de logiciels, elle concerne surtout la gestion des codes source. Cette activité étant fastidieuse et relativement complexe, un appui logiciel est presque indispensable. À cet effet, il existe différents logiciels de gestion de versions qui, bien qu'ayant des concepts communs, apportent chacun leur propre vocabulaire et leurs propres usages.
Jeux d'entrainement, de validation et de testEn apprentissage automatique, une tâche courante est l'étude et la construction d'algorithmes qui peuvent apprendre et faire des prédictions sur les données. De tels algorithmes fonctionnent en faisant des prédictions ou des décisions basées sur les données, en construisant un modèle mathématique à partir des données d'entrée. Ces données d'entrée utilisées pour construire le modèle sont généralement divisées en plusieurs jeux de données .
Distributed version controlIn software development, distributed version control (also known as distributed revision control) is a form of version control in which the complete codebase, including its full history, is mirrored on every developer's computer. Compared to centralized version control, this enables automatic management branching and merging, speeds up most operations (except pushing and pulling), improves the ability to work offline, and does not rely on a single location for backups.