Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.
Traitement de donnéesEn informatique, le terme traitement de données ou traitement électronique des données renvoie à une série de processus qui permettent d'extraire de l'information ou de produire du savoir à partir de données brutes. Ces processus, une fois programmés, sont le plus souvent automatisés à l'aide d'ordinateurs. Si les résultats finaux produits par ces processus sont destinés à des humains, leur présentation est souvent essentielle pour en apprécier la valeur. Cette appréciation est cependant variable selon les personnes.
GenèveGenève est une ville suisse située à l'extrémité sud-ouest du Léman. Elle est la deuxième ville la plus peuplée de Suisse après Zurich, et le chef-lieu de la République et canton de Genève (GE). Au , la ville comptait dans , mais à la même date, son aire métropolitaine transfrontalière, définie par Eurostat et l'OFS suivant la méthodologie des zones urbaines fonctionnelles, c'est-à-dire l'agglomération et la couronne périurbaine, comptait dans à cheval sur la Suisse et la France.
DonnéeUne donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée. Cela peut être une description élémentaire qui vise à objectiver une réalité, le résultat d'une comparaison entre deux événements du même ordre (mesure) soit en d'autres termes une observation ou une mesure. La donnée brute est dépourvue de tout raisonnement, supposition, constatation, probabilité.
Exploration de donnéesL’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.
Canton de GenèveLe canton de Genève (GE), officiellement la République et canton de Genève, est l'un des de la Suisse. Son chef-lieu est Genève. Au , la population du canton s’établit à . Il s’agit du successeur de la république de Genève, indépendante depuis le jusqu'à son intégration dans la République française en 1798. Elle retrouve son indépendance le après le départ des armées de , puis devient un canton suisse le . La république et canton de Genève occupe une superficie modeste, inférieure à celle du district de Nyon, mais elle est densément peuplée, car elle abrite la seconde ville de Suisse.
Modélisation des donnéesDans la conception d'un système d'information, la modélisation des données est l'analyse et la conception de l'information contenue dans le système afin de représenter la structure de ces informations et de structurer le stockage et les traitements informatiques. Il s'agit essentiellement d'identifier les entités logiques et les dépendances logiques entre ces entités.
Data dredgingvignette|Exemple de Data dredging. Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui . Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking).
Consolidation informatiqueLa consolidation est en informatique le regroupement cohérent de données. Elle concerne généralement des données organisées logiquement ou liées entre elles. Plus spécifiquement pour les tableurs, il s’agit du regroupement de plusieurs tableaux issus de feuilles différentes (les feuilles sont des composantes des tableurs) voire de classeurs différents. La consolidation de données consiste à rassembler plusieurs données semblables afin d’obtenir un rapport plus facile à consulter que l’information brute présente sur le serveur, avec le moins de perte d’information possible.
Conventions de Genèvevignette|Fac-similé de l'original de la première convention de Genève (1864). Les conventions de Genève sont des traités internationaux fondamentaux dans le domaine du droit international humanitaire. Elles dictent les règles de conduite à adopter en période de conflits armés, et notamment la protection des civils, des membres de l'aide humanitaire, des blessés ou encore, des prisonniers de guerre. La première convention de Genève date de 1864. Cependant, les textes qui sont en vigueur aujourd’hui ont été écrits après la Seconde Guerre mondiale.
Data storageData storage is the recording (storing) of information (data) in a storage medium. Handwriting, phonographic recording, magnetic tape, and optical discs are all examples of storage media. Biological molecules such as RNA and DNA are considered by some as data storage. Recording may be accomplished with virtually any form of energy. Electronic data storage requires electrical power to store and retrieve data. Data storage in a digital, machine-readable medium is sometimes called digital data.
Efficacité énergétique (économie)En économie, l’efficacité énergétique ou efficience énergétique désigne l'état de fonctionnement d'un système pour lequel la consommation d’énergie est minimisée pour un service rendu identique. C'est un cas particulier de la notion d’efficience. Elle concerne notamment les transports motorisés, les métiers du bâtiment et l'industrie (ces derniers étant responsables respectivement d'environ 40 % et 25 % de la consommation énergétique totale de l'Union européenne).
Construction durableLécoconstruction ou construction durable est la création, la restauration, la rénovation ou la réhabilitation d'un bâtiment en lui permettant de respecter au mieux l'écologie à chaque étape de la construction, et plus tard, de son utilisation (chauffage, consommation d'énergie, rejet des divers flux : eau, déchets). Cette notion, apparue à la fin des années 1940 cherche aussi à intégrer le plus respectueusement possible le bâti dans le milieu naturel en utilisant au mieux des ressources peu transformées, locales, saines, et dans le milieu urbain, de travail ou rural en favorisant les liens sociaux.
Bâtiment (construction)Un bâtiment au sens commun est une construction immobilière, réalisée par intervention humaine, destinée d'une part à servir d'abri, c'est-à-dire à protéger des intempéries des personnes, des biens et des activités, d'autre part à manifester leur permanence comme fonction sociale, politique ou culturelle. Un bâtiment est un ouvrage d'un seul tenant composé de corps de bâtiments couvrant des espaces habitables lorsqu'il est d'une taille importante.
Data wranglingData wrangling, sometimes referred to as data munging, is the process of transforming and mapping data from one "raw" data form into another format with the intent of making it more appropriate and valuable for a variety of downstream purposes such as analytics. The goal of data wrangling is to assure quality and useful data. Data analysts typically spend the majority of their time in the process of data wrangling compared to the actual analysis of the data.
Données brutesLes données brutes (aussi connu comme données primaires) sont les données non interprétées émanant d'une source primaire, ayant des caractéristiques liées à celle-ci et qui n'ont été soumises à aucun traitement ou toute autre manipulation. Les données brutes peuvent être entrées dans un programme informatique ou utilisées dans des procédures manuelles telles que l'analyse statistique d'une enquête. Il peut s'agir des données binaires des périphériques de stockage électroniques comme les lecteurs de disque dur.