Publication

Multi-agent reinforcement learning for adaptive demand response in smart cities

Concepts associés (28)

En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.

Apprentissage par renforcement profond

L'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.

Q-learning

vignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.

Offre et demande

L'offre et la demande est un modèle économique de détermination des prix dans un marché. Notamment utilisé en microéconomie, ce modèle énonce que, certaines hypothèses étant respectées, le fonctionnement d'un marché permet au prix unitaire du bien vendu sur ce marché de varier jusqu'à ce que où la quantité demandée soit égale à la quantité fournie. Il résulte ainsi un équilibre économique entre le prix offert et la quantité demandée.

Dynamic demand (electric power)

Dynamic Demand is the name of a semi-passive technology to support demand response by adjusting the load demand on an electrical power grid. It is also the name of an independent not-for-profit organization in the UK supported by a charitable grant from the Esmée Fairbairn Foundation, dedicated to promoting this technology. The concept is that by monitoring the frequency of the power grid, as well as their own controls, intermittent domestic and industrial loads switch themselves on/off at optimal moments to balance the overall grid load with generation, reducing critical power mismatches.

Réponse à la demande

La réponse à la demande (demand response) comprend, de manière générale, tous les moyens mis en place pour changer le profil de consommation de l'électricité par les utilisateurs et donc la consommation totale électrique. D'après la Federal Energy Regulatory Commission américaine, elle est le changement d'utilisation de l'électricité par le consommateur final par rapport à l'usage habituel en réponse aux changements de prix de l'électricité au cours du temps, ou des remboursements destinés à diminuer l'usage de l'électricité lors de maxima des prix dans le marché de gros ou lors d'instabilité du réseau électrique.

Discrimination par les prix

vignette|Illustration de la discrimination par les prix des articles La discrimination par les prix désigne la modulation par agent des prix de son offre en fonction des caractéristiques connues ou supposées de la demande. Classiquement, on distingue trois types de discriminations par les prix en fonction de l'information dont dispose l'agent discriminateur : Discrimination de premier type, ou discrimination parfaite : le prix est fixé en fonction de la qualité de l'acheteur.

Système multi-agents

En informatique, un système multi-agent (SMA) est un système composé d'un ensemble d'agents (un processus, un robot, un être humain, une fourmi etc.), actifs dans un certain environnement et interagissant selon certaines règles. Un agent est une entité caractérisée par le fait qu'elle est, au moins partiellement, autonome, ce qui exclut un pilotage centralisé du système global.

Pricing

Pricing is the process whereby a business sets the price at which it will sell its products and services, and may be part of the business's marketing plan. In setting prices, the business will take into account the price at which it could acquire the goods, the manufacturing cost, the marketplace, competition, market condition, brand, and quality of product. Pricing is a fundamental aspect of product management and is one of the four Ps of the marketing mix, the other three aspects being product, promotion, and place.

Maîtrise de la demande en énergie

La notion de maîtrise de la demande en énergie (qui comprend celle de maîtrise de la demande en électricité) souvent dite MDE (en anglais, energy demand management (EDM), demand-side management (DSM) ou demand-side response (DSR)), regroupe des actions d'économies d'énergie développées du côté du consommateur final, et non du producteur d'énergie (bien que ce dernier puisse y contribuer). La MDE a été initiée dans les années 1990, aux États-Unis et en Europe principalement (dont en France avec le soutien de l'AFME devenue ADEME).

Agent intelligent

En intelligence artificielle, un agent intelligent (AI) est une entité autonome capable de percevoir son environnement grâce à des capteurs et aussi d'agir sur celui-ci via des effecteurs afin de réaliser des objectifs. Un agent intelligent peut également apprendre ou utiliser des connaissances pour pouvoir réaliser ses objectifs. Ils peuvent être simples ou complexes. Par exemple, un simple système réactif, comme le thermostat est considéré comme étant un agent intelligent.

Apprentissage automatique

L'apprentissage automatique (en anglais : machine learning, « apprentissage machine »), apprentissage artificiel ou apprentissage statistique est un champ d'étude de l'intelligence artificielle qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'« apprendre » à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Plus largement, il concerne la conception, l'analyse, l'optimisation, le développement et l'implémentation de telles méthodes.

Demand

In economics, demand is the quantity of a good that consumers are willing and able to purchase at various prices during a given time. The relationship between price and quantity demand is also called the demand curve. Demand for a specific item is a function of an item's perceived necessity, price, perceived quality, convenience, available alternatives, purchasers' disposable income and tastes, and many other options. Innumerable factors and circumstances affect a consumer's willingness or to buy a good.

Demand curve

In a demand schedule, a demand curve is a graph depicting the relationship between the price of a certain commodity (the y-axis) and the quantity of that commodity that is demanded at that price (the x-axis). Demand curves can be used either for the price-quantity relationship for an individual consumer (an individual demand curve), or for all consumers in a particular market (a market demand curve). It is generally assumed that demand curves slope down, as shown in the adjacent image.

Réseau de neurones artificiels

Un réseau de neurones artificiels, ou réseau neuronal artificiel, est un système dont la conception est à l'origine schématiquement inspirée du fonctionnement des neurones biologiques, et qui par la suite s'est rapproché des méthodes statistiques. Les réseaux de neurones sont généralement optimisés par des méthodes d'apprentissage de type probabiliste, en particulier bayésien.

Dynamic pricing

Dynamic pricing, also referred to as surge pricing, demand pricing, or time-based pricing, is a revenue management pricing strategy in which businesses set flexible prices for products or services based on current market demands. Businesses are able to change prices based on algorithms that take into account competitor pricing, supply and demand, and other external factors in the market. Dynamic pricing is a common practice in several industries such as hospitality, tourism, entertainment, retail, electricity, and public transport.

Signal-prix

Le prix d'un objet, d'un produit ou d'un service dépend de nombreux facteurs, dont l'offre et la demande. Un prix peut cependant être artificiellement plafonné, soutenu ou diminué, par une volonté d'une autorité compétente et du législateur, ou par la volonté commune d'un nombre suffisant de vendeurs. Il peut l'être illégalement via une entente sur les prix ou par des cartels, ou via le dumping économique, social ou environnemental.

Réseau électrique

Un réseau électrique est un ensemble d'infrastructures énergétiques plus ou moins disponibles permettant d'acheminer l'électricité des centres de production vers les consommateurs. Il est constitué de lignes électriques exploitées à différents niveaux de tension, connectées entre elles dans des postes électriques. Les postes électriques permettent de répartir l'électricité et de la faire passer d'une tension à l'autre grâce aux transformateurs.

Price elasticity of demand

A good's price elasticity of demand (, PED) is a measure of how sensitive the quantity demanded is to its price. When the price rises, quantity demanded falls for almost any good, but it falls more for some than for others. The price elasticity gives the percentage change in quantity demanded when there is a one percent increase in price, holding everything else constant. If the elasticity is −2, that means a one percent price rise leads to a two percent decline in quantity demanded.

Réseaux antagonistes génératifs

En intelligence artificielle, les réseaux antagonistes génératifs (RAG) parfois aussi appelés réseaux adverses génératifs (en anglais generative adversarial networks ou GANs) sont une classe d'algorithmes d'apprentissage non supervisé. Ces algorithmes ont été introduits par . Ils permettent de générer des images avec un fort degré de réalisme. Un GAN est un modèle génératif où deux réseaux sont placés en compétition dans un scénario de théorie des jeux. Le premier réseau est le générateur, il génère un échantillon (ex.