Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.
RentabilitéLa rentabilité est le rapport entre un revenu obtenu ou prévu et les ressources employées pour l'obtenir. La notion s'applique notamment aux entreprises, mais aussi à tout autre investissement. La rentabilité rétrospective est le rapport entre un résultat comptable et les moyens en passifs mis en œuvre pour l'obtenir. La rentabilité prévisionnelle est le rapport entre un gain de trésorerie projeté et la valeur d'un investissement nécessaire pour générer ce gain.
Événement climatique extrêmeUn événement climatique extrême ou événement météorologique extrême est un phénomène météorologique caractérisé par sa rareté, son intensité ou les dégâts qu'il provoque, selon la définition retenue. Les canicules, vagues de froid, cyclones tropicaux, sécheresses en sont des exemples. La fréquence et l'intensité de certains événements climatiques extrêmes augmentent en conséquence du réchauffement climatique d'origine anthropique.
Erreur quadratique moyenneEn statistiques, l’erreur quadratique moyenne d’un estimateur d’un paramètre de dimension 1 (mean squared error (), en anglais) est une mesure caractérisant la « précision » de cet estimateur. Elle est plus souvent appelée « erreur quadratique » (« moyenne » étant sous-entendu) ; elle est parfois appelée aussi « risque quadratique ».
Biais de sélectionDans une étude statistique, le terme biais de sélection désigne une erreur systématique faite lors de la sélection des sujets à étudier. Ce terme regroupe tous les biais pouvant conduire à ce que les sujets effectivement observés lors d'une enquête ne constituent pas un groupe représentatif des populations censées être étudiées et ne permettent donc pas de répondre aux questions posées dans le protocole. Les biais de sélection se produisent lors de l'échantillonnage, c'est-à-dire lors de la sélection d'un échantillon représentatif de la population étudiée.
Échantillon biaiséEn statistiques, le mot biais a un sens précis qui n'est pas tout à fait le sens habituel du mot. Un échantillon biaisé est un ensemble d'individus d'une population, censé la représenter, mais dont la sélection des individus a introduit un biais qui ne permet alors plus de conclure directement pour l'ensemble de la population. Un échantillon biaisé n'est donc pas un échantillon de personnes biaisées (bien que ça puisse être le cas) mais avant tout un échantillon sélectionné de façon biaisée.
Mean squared prediction errorIn statistics the mean squared prediction error (MSPE), also known as mean squared error of the predictions, of a smoothing, curve fitting, or regression procedure is the expected value of the squared prediction errors (PE), the square difference between the fitted values implied by the predictive function and the values of the (unobservable) true value g. It is an inverse measure of the explanatory power of and can be used in the process of cross-validation of an estimated model.
DonnéeUne donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée. Cela peut être une description élémentaire qui vise à objectiver une réalité, le résultat d'une comparaison entre deux événements du même ordre (mesure) soit en d'autres termes une observation ou une mesure. La donnée brute est dépourvue de tout raisonnement, supposition, constatation, probabilité.
Systemic biasSystemic bias is the inherent tendency of a process to support particular outcomes. The term generally refers to human systems such as institutions. Systemic bias is related to and overlaps conceptually with institutional bias and structural bias, and the terms are often used interchangeably. According to Oxford Reference, institutional bias is "a tendency for the procedures and practices of particular institutions to operate in ways which result in certain social groups being advantaged or favoured and others being disadvantaged or devalued.
Biais médiatiqueUn biais médiatique est une tendance des médias à présenter involontairement les informations, idées ou évènements d'une façon altérée par un apriori ou une conviction. Le phénomène de biais médiatique est connu des attachés de presse, des états-majors du monde politique, et bien entendu des médias eux-mêmes. Il s'ensuit une course au positionnement. Une étude de 2014 analyse l’envergure et les différentes formes de biais médiatiques.
Résidu (statistiques)In statistics and optimization, errors and residuals are two closely related and easily confused measures of the deviation of an observed value of an element of a statistical sample from its "true value" (not necessarily observable). The error of an observation is the deviation of the observed value from the true value of a quantity of interest (for example, a population mean). The residual is the difference between the observed value and the estimated value of the quantity of interest (for example, a sample mean).
Attribution des événements extrêmesL'attribution d'événements extrêmes, également connue sous le nom de science de l'attribution, est l'étude des rapports de causalité entre le réchauffement climatique et les événements climatiques extrêmes. Un article paru en 2004 dans la revue Nature est généralement considéré comme la première étude scientifique d'attribution. Il estime que l'influence humaine a au moins doublé le risque d'une vague de chaleur dépassant le seuil de magnitude de la vague de chaleur historique de 2003 en Europe.
Racine de l'erreur quadratique moyenneLa racine de l'erreur quadratique moyenne (REQM) ou racine de l'écart quadratique moyen (en anglais, root-mean-square error ou RMSE, et root-mean-square deviation ou RMSD) est une mesure fréquemment utilisée des différences entre les valeurs (valeurs d'échantillon ou de population) prédites par un modèle ou estimateur et les valeurs observées (ou vraies valeurs). La REQM représente la racine carrée du deuxième moment d'échantillonnage des différences entre les valeurs prédites et les valeurs observées.
Biais (distorsion)Dans diverses disciplines, un biais est une erreur systématique ou une simplification abusive. vignette|L'interprétation des formes aléatoires apparaissant à la surface de la Lune constitue un exemple courant de biais perceptuel causé par la paréidolie (processus tendant à discerner une forme familière parmi des formes aléatoires). Les biais peuvent être transmis implicitement avec le contexte culturel.
Maximum de vraisemblanceEn statistique, l'estimateur du maximum de vraisemblance est un estimateur statistique utilisé pour inférer les paramètres de la loi de probabilité d'un échantillon donné en recherchant les valeurs des paramètres maximisant la fonction de vraisemblance. Cette méthode a été développée par le statisticien Ronald Aylmer Fisher en 1922. Soient neuf tirages aléatoires x1, ..., x9 suivant une même loi ; les valeurs tirées sont représentées sur les diagrammes ci-dessous par des traits verticaux pointillés.
Méthode des moindres carrésLa méthode des moindres carrés, indépendamment élaborée par Legendre et Gauss au début du , permet de comparer des données expérimentales, généralement entachées d’erreurs de mesure, à un modèle mathématique censé décrire ces données. Ce modèle peut prendre diverses formes. Il peut s’agir de lois de conservation que les quantités mesurées doivent respecter. La méthode des moindres carrés permet alors de minimiser l’impact des erreurs expérimentales en « ajoutant de l’information » dans le processus de mesure.
Reduced chi-squared statisticIn statistics, the reduced chi-square statistic is used extensively in goodness of fit testing. It is also known as mean squared weighted deviation (MSWD) in isotopic dating and variance of unit weight in the context of weighted least squares. Its square root is called regression standard error, standard error of the regression, or standard error of the equation (see ) It is defined as chi-square per degree of freedom: where the chi-squared is a weighted sum of squared deviations: with inputs: variance , observations O, and calculated data C.
Ancrage (psychologie)En psychologie, l’ancrage désigne la difficulté à se départir d'une première impression. C'est un biais de jugement qui pousse à se fier à l'information reçue en premier dans une prise de décision. Dans les débats publics, « l'effet d'ancrage » donne une prime aux personnes qui ont la capacité de prise de parole publique (expert, militant, journaliste, contestataire contre les institutions...), plus encore si leur point de vue est argumenté et que ceux qui les écoutent n'ont qu'une vague opinion sur le sujet.
Heuristique de disponibilitéEn psychologie, l'heuristique de disponibilité est un mode de raisonnement qui consiste à se baser uniquement ou principalement sur les informations immédiatement disponibles en mémoire, sans chercher à en acquérir de nouvelles concernant la situation. Cette heuristique du jugement peut engendrer des biais cognitifs, appelés biais de disponibilité. L'heuristique de disponibilité ne mène pas forcément à des conclusions biaisées. Il peut s'agir d'un mode de raisonnement efficace qui permet de résoudre un problème avec un effort cognitif minimal.
Retour sur investissementLe retour sur investissement (RSI ou rentabilité du capital investi), parfois appelé rendement, taux de rendement, taux de profit ou encore ROI (terme anglais, return on investment), désigne un ratio financier qui mesure le montant d'argent gagné ou perdu, par rapport à la somme initialement investie dans un investissement. Pour un investissement financier, ce ratio est généralement exprimé en pourcentage plutôt qu'en valeur décimale. Pour un investissement productif à durée de vie courte ou indéterminée (achat / développement de logiciels par exemple), ce sera l’inverse.