Ridge regressionRidge regression is a method of estimating the coefficients of multiple-regression models in scenarios where the independent variables are highly correlated. It has been used in many fields including econometrics, chemistry, and engineering. Also known as Tikhonov regularization, named for Andrey Tikhonov, it is a method of regularization of ill-posed problems. It is particularly useful to mitigate the problem of multicollinearity in linear regression, which commonly occurs in models with large numbers of parameters.
Régression linéaireEn statistiques, en économétrie et en apprentissage automatique, un modèle de régression linéaire est un modèle de régression qui cherche à établir une relation linéaire entre une variable, dite expliquée, et une ou plusieurs variables, dites explicatives. On parle aussi de modèle linéaire ou de modèle de régression linéaire. Parmi les modèles de régression linéaire, le plus simple est l'ajustement affine. Celui-ci consiste à rechercher la droite permettant d'expliquer le comportement d'une variable statistique y comme étant une fonction affine d'une autre variable statistique x.
Regularized least squaresRegularized least squares (RLS) is a family of methods for solving the least-squares problem while using regularization to further constrain the resulting solution. RLS is used for two main reasons. The first comes up when the number of variables in the linear system exceeds the number of observations. In such settings, the ordinary least-squares problem is ill-posed and is therefore impossible to fit because the associated optimization problem has infinitely many solutions.
Elastic net regularizationIn statistics and, in particular, in the fitting of linear or logistic regression models, the elastic net is a regularized regression method that linearly combines the L1 and L2 penalties of the lasso and ridge methods. The elastic net method overcomes the limitations of the LASSO (least absolute shrinkage and selection operator) method which uses a penalty function based on Use of this penalty function has several limitations. For example, in the "large p, small n" case (high-dimensional data with few examples), the LASSO selects at most n variables before it saturates.
Théorie de la fonctionnelle de la densitéLa théorie de la fonctionnelle de la densité (DFT, sigle pour Density Functional Theory) est une méthode de calcul quantique permettant l'étude de la structure électronique, en principe de manière exacte. Au début du , il s'agit de l'une des méthodes les plus utilisées dans les calculs quantiques aussi bien en physique de la matière condensée qu'en chimie quantique en raison de son application possible à des systèmes de tailles très variées, allant de quelques atomes à plusieurs centaines.
Amarrage (moléculaire)vignette|Petite molécule amarrée à une protéine. Dans le domaine de la modélisation moléculaire, l’amarrage (en anglais docking) est une méthode qui calcule l'orientation préférée d'une molécule vers une seconde lorsqu'elles sont liées pour former un complexe stable. Connaître l'orientation préférée sert à prévoir la solidité de l'union entre deux molécules. Les associations entre des molécules d'importance biologique, telles que les protéines, les acides nucléiques, les glucides et les matières grasses jouent un rôle essentiel dans la transduction de signal.
Chimie numériqueLa chimie numérique ou chimie informatique, parfois aussi chimie computationnelle, est une branche de la chimie et de la physico-chimie qui utilise les lois de la chimie théorique exploitées dans des programmes informatiques spécifiques afin de calculer structures et propriétés d'objets chimiques tels que les molécules, les solides, les agrégats atomiques (ou clusters), les surfaces, etc., en appliquant autant que possible ces programmes à des problèmes chimiques réels.
Régularisation (mathématiques)vignette|Les courbes bleues et vertes correspondent à deux modèles differents, tous les deux étant des solutions possibles du problème consistant à décrire les coordonnées de tous les points rouges. L'application d'une régularisation favorise le modèle moins complexe correspondant à la courbe verte. Dans le domaine des mathématiques et des statistiques, et plus particulièrement dans le domaine de l'apprentissage automatique, la régularisation fait référence à un processus consistant à ajouter de l'information à un problème, s'il est mal posé ou pour éviter le surapprentissage.
Bayesian linear regressionBayesian linear regression is a type of conditional modeling in which the mean of one variable is described by a linear combination of other variables, with the goal of obtaining the posterior probability of the regression coefficients (as well as other parameters describing the distribution of the regressand) and ultimately allowing the out-of-sample prediction of the regressand (often labelled ) conditional on observed values of the regressors (usually ).
Énergie potentielleL'énergie potentielle d'un système physique est l'énergie liée à une interaction, qui a la capacité de se transformer en d'autres formes d'énergie, le plus souvent en énergie cinétique, une énergie de mouvement. La force qui modélise l'interaction est une force conservative c'est-à-dire que son travail ne dépend pas du chemin suivi lors du déplacement, mais uniquement du point de départ et du point d'arrivée : .
Champ de force (chimie)vignette|Un champ de force peut par exemple être utilisé afin de minimiser l'énergie d'étirement de cette molécule d'éthane. Dans le cadre de la mécanique moléculaire, un champ de force est un ensemble de potentiels et de paramètres permettant de décrire la structure de l'énergie potentielle d'un système de particules (typiquement, des atomes, mais non exclusivement). L'usage de l'expression champ de force en chimie et biologie numériques diffère ainsi de celui de la physique, où il indique en général un gradient négatif d'un potentiel scalaire.
Lasso (statistiques)En statistiques, le lasso est une méthode de contraction des coefficients de la régression développée par Robert Tibshirani dans un article publié en 1996 intitulé Regression shrinkage and selection via the lasso. Le nom est un acronyme anglais : Least Absolute Shrinkage and Selection Operator. Bien que cette méthode fut utilisée à l'origine pour des modèles utilisant l'estimateur usuel des moindres carrés, la pénalisation lasso s'étend facilement à de nombreux modèles statistiques tels que les modèles linéaires généralisés, les modèles à risque proportionnel, et les M-estimateurs.
Hélice alphathumb|redresse|Exemple d'hélice alpha. L’hélice alpha (hélice α) est une structure secondaire courante des protéines. Elle est formée par une chaîne polypeptidique de forme hélicoïdale à pas de rotation droit dans laquelle chaque groupe N-H de la chaîne principale d'un acide aminé forme une liaison hydrogène avec le groupe C=O de la chaîne principale du quatrième acide aminé le précédant. Cette structure secondaire est parfois appelée hélice α de Pauling-Corey-Branson.
Local-density approximationLocal-density approximations (LDA) are a class of approximations to the exchange–correlation (XC) energy functional in density functional theory (DFT) that depend solely upon the value of the electronic density at each point in space (and not, for example, derivatives of the density or the Kohn–Sham orbitals). Many approaches can yield local approximations to the XC energy. However, overwhelmingly successful local approximations are those that have been derived from the homogeneous electron gas (HEG) model.
Dynamique moléculaireLa dynamique moléculaire est une technique de simulation numérique permettant de modéliser l'évolution d'un système de particules au cours du temps. Elle est particulièrement utilisée en sciences des matériaux et pour l'étude des molécules organiques, des protéines, de la matière molle et des macromolécules. En pratique, la dynamique moléculaire consiste à simuler le mouvement d'un ensemble de quelques dizaines à quelques milliers de particules dans un certain environnement (température, pression, champ électromagnétique, conditions aux limites.
Grand potentialThe grand potential or Landau potential or Landau free energy is a quantity used in statistical mechanics, especially for irreversible processes in open systems. The grand potential is the characteristic state function for the grand canonical ensemble. Grand potential is defined by where U is the internal energy, T is the temperature of the system, S is the entropy, μ is the chemical potential, and N is the number of particles in the system.
Potentiel interatomiqueLe potentiel interatomique est un modèle d'énergie potentielle servant à décrire l'interaction entre atomes et, par extension, entre molécules. Il permet d'accéder à nombre de quantités optiques, thermodynamiques, mécaniques et de transport de la matière. Les atomes à température ambiante peuvent s'associer spontanément pour former des molécules stables. Cela implique une force attractive à longue distance et répulsive à faible distance, et par suite nulle à la valeur d'équilibre de la liaison.
Théorie des bandesredresse=1.5|vignette|Représentation schématique des bandes d'énergie d'un solide. représente le niveau de Fermi. thumb|upright=1.5|Animation sur le point de vue quantique sur les métaux et isolants liée à la théorie des bandes En physique de l'état solide, la théorie des bandes est une modélisation des valeurs d'énergie que peuvent prendre les électrons d'un solide à l'intérieur de celui-ci. De façon générale, ces électrons n'ont la possibilité de prendre que des valeurs d'énergie comprises dans certains intervalles, lesquels sont séparés par des bandes d'énergie interdites (ou bandes interdites).
Énergie potentielle électrostatiqueL'énergie potentielle électrostatique (ou simplement énergie électrostatique) d'une charge électrique q placée en un point P baignant dans un potentiel électrique est définie comme le travail à fournir pour transporter cette charge depuis l'infini jusqu'à la position P. Elle vaut donc : si l'on se place dans le cas où les sources générant le potentiel électrique V sont distribuées dans une région bornée de l'espace, ce qui permet d'attribuer une valeur nulle du potentiel à l'infini.
Régression logistiqueEn statistiques, la régression logistique ou modèle logit est un modèle de régression binomiale. Comme pour tous les modèles de régression binomiale, il s'agit d'expliquer au mieux une variable binaire (la présence ou l'absence d'une caractéristique donnée) par des observations réelles nombreuses, grâce à un modèle mathématique. En d'autres termes d'associer une variable aléatoire de Bernoulli (génériquement notée ) à un vecteur de variables aléatoires . La régression logistique constitue un cas particulier de modèle linéaire généralisé.