Système de récompenseLe système de récompense / renforcement aussi appelé système hédonique, est un système fonctionnel fondamental des mammifères, situé dans le cerveau, le long du faisceau médian du télencéphale. Ce système de « récompenses » est indispensable à la survie, car il fournit la motivation nécessaire à la réalisation d'actions ou de comportements adaptés, permettant de préserver l'individu et l'espèce (prise de risque nécessaire à la survie, recherche de nourriture, reproduction, évitement des dangers, etc.).
Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Apprentissage de représentationsEn apprentissage automatique, l'apprentissage des caractéristiques ou apprentissage des représentations est un ensemble de techniques qui permet à un système de découvrir automatiquement les représentations nécessaires à la détection ou à la classification des caractéristiques à partir de données brutes. Cela remplace l'ingénierie manuelle des fonctionnalités et permet à une machine d'apprendre les fonctionnalités et de les utiliser pour effectuer une tâche spécifique.
Plasticité synaptiqueLa plasticité synaptique, en neurosciences, désigne la capacité des synapses à moduler, à la suite d'un événement particulier - une augmentation ou une diminution ponctuelle et significative de leur activité - l'efficacité de la transmission du signal électrique d'un neurone à l'autre et à conserver, à plus ou moins long terme, une "trace" de cette modulation. De manière schématique, l'efficacité de la transmission synaptique, voire la synapse elle-même, est maintenue et modulée par l'usage qui en est fait.
Plasticité fonction du temps d'occurrence des impulsionsLa (en Spike-timing-dependent plasticity, STDP) est un processus de modification du poids des synapses. Cette modification dépend du moment de déclenchement du potentiel d'action dans les neurones pré- et post-synaptique. Ce processus permettrait d'expliquer partiellement le développement cérébral et la mémorisation, en provoquant potentialisation à long terme (en Long-term potentiation, LTP) et dépression à long terme (en Long-term depression, LTD) des synapses.
Apprentissage automatiqueL'apprentissage automatique (en anglais : machine learning, « apprentissage machine »), apprentissage artificiel ou apprentissage statistique est un champ d'étude de l'intelligence artificielle qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'« apprendre » à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Plus largement, il concerne la conception, l'analyse, l'optimisation, le développement et l'implémentation de telles méthodes.
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
ApprentissageL’apprentissage est un ensemble de mécanismes menant à l'acquisition de savoir-faire, de savoirs ou de connaissances. L'acteur de l'apprentissage est appelé apprenant. On peut opposer l'apprentissage à l'enseignement dont le but est de dispenser des connaissances et savoirs, l'acteur de l'enseignement étant l'enseignant.
Brain stimulation rewardBrain stimulation reward (BSR) is a pleasurable phenomenon elicited via direct stimulation of specific brain regions, originally discovered by James Olds and Peter Milner. BSR can serve as a robust operant reinforcer. Targeted stimulation activates the reward system circuitry and establishes response habits similar to those established by natural rewards, such as food and sex. Experiments on BSR soon demonstrated that stimulation of the lateral hypothalamus, along with other regions of the brain associated with natural reward, was both rewarding as well as motivation-inducing.
Système nerveux autonomeLe système nerveux autonome aussi appelé système nerveux végétatif est la partie du système nerveux périphérique responsable des fonctions non soumises au contrôle volontaire. Il contrôle notamment les muscles lisses (digestion, vascularisation...), les muscles cardiaques, la majorité des glandes exocrines (digestion, sudation...) et certaines glandes endocrines. Le système nerveux autonome contient des neurones périphériques mais aussi centraux.
Temporal difference learningLe Temporal Difference (TD) learning est une classe d'algorithmes d'apprentissage par renforcement sans modèle. Ces algorithmes échantillonnent l'environnement de manière aléatoire à la manière des méthodes de Monte Carlo. Ils mettent à jour la politique (i.e. les actions à prendre dans chaque état) en se basant sur les estimations actuelles, comme les méthodes de programmation dynamique. Les méthodes TD ont un lien avec les modèles TD dans l'apprentissage animal. vignette|151x151px|Diagramme backup.
Système nerveux périphériquethumb|upright=1.3|Schéma du système nerveux avec le système nerveux périphérique en bleu et le système nerveux central en rouge. Le système nerveux périphérique (SNP) est la partie du système nerveux formée des ganglions et des nerfs à l'extérieur du cerveau et de la moelle épinière. Sa fonction principale est de faire circuler l'information entre les organes et le système nerveux central (SNC). À l'inverse du SNC, le SNP n'est pas protégé par les os du crane et de la colonne ; il n'est pas non plus recouvert par la barrière hémato-encéphalique qui assure l'isolation du SNC.
Système nerveux parasympathiqueLe système nerveux parasympathique ou système vagal ou encore appelé parasympathique est une des trois divisions du système nerveux autonome (SNA) ou viscéral, avec le système nerveux orthosympathique et le système nerveux entérique. Le SNA régule les fonctions corporelles qui ne sont pas sous le contrôle volontaire de l'individu. Le parasympathique, quant à lui, travaille en opposition au système nerveux (ortho)sympathique. Ce dernier activant le corps en réponse à des stimuli stressants.
Apprentissage auto-superviséL'apprentissage auto-supervisé ("self-supervised learning" en anglais) (SSL) est une méthode d'apprentissage automatique. Il apprend à partir d'échantillons de données non étiquetés. Il peut être considéré comme une forme intermédiaire entre l'apprentissage supervisé et non supervisé. Il est basé sur un réseau de neurones artificiels. Le réseau de neurones apprend en deux étapes. Tout d'abord, la tâche est résolue sur la base de pseudo-étiquettes qui aident à initialiser les poids du réseau.
Système nerveux somatiqueLe système nerveux somatique est la partie du système nerveux périphérique qui commande les mouvements et la position du corps et permet de percevoir par la peau diverses sensations (toucher, chaleur, douleur) et de découvrir par les autres organes des sens le milieu environnant (vision, audition, olfaction). Il est constitué de neurones sensitifs et de neurones moteurs.
Spécification fonctionnelleLa spécification fonctionnelle est la description des fonctions d'un logiciel en vue de sa réalisation. La spécification fonctionnelle décrit dans le détail la façon dont les exigences seront prises en compte. Un exemple d'exigence est l'adaptation d'un progiciel à l'utilisateur en ce qui concerne la langue (le français dans les pays francophones). Une spécification fonctionnelle est indépendante de la façon dont sera réalisé le logiciel en question. Elle doit être exprimée en termes de fonctions et non pas en termes de solutions.
Système nerveux sympathiqueLe système nerveux sympathique ou système nerveux orthosympathique ou adrénergique, est une des trois parties du système nerveux autonome. Les deux autres parties sont le système nerveux entérique et le système nerveux parasympathique, ce dernier déclenchant (la plupart du temps) des réponses antagonistes au système nerveux sympathique. Il est responsable du contrôle d'un grand nombre d'activités automatiques de l'organisme, telles que le rythme cardiaque ou la contraction des muscles lisses.
Apprentissage non superviséDans le domaine informatique et de l'intelligence artificielle, l'apprentissage non supervisé désigne la situation d'apprentissage automatique où les données ne sont pas étiquetées (par exemple étiquetées comme « balle » ou « poisson »). Il s'agit donc de découvrir les structures sous-jacentes à ces données non étiquetées. Puisque les données ne sont pas étiquetées, il est impossible à l'algorithme de calculer de façon certaine un score de réussite.
Non-functional requirementIn systems engineering and requirements engineering, a non-functional requirement (NFR) is a requirement that specifies criteria that can be used to judge the operation of a system, rather than specific behaviours. They are contrasted with functional requirements that define specific behavior or functions. The plan for implementing functional requirements is detailed in the system design. The plan for implementing non-functional requirements is detailed in the system architecture, because they are usually architecturally significant requirements.
Système nerveux central250px|Le système nerveux central Central nervous system.svg Le système nerveux central (ou névraxe) - parfois désigné par son abréviation, SNC - est la partie du système nerveux comprenant l'encéphale et la moelle spinale. Le système nerveux central est ainsi nommé parce qu'il contient la majeure partie du système nerveux, mais aussi et surtout parce qu'il intègre les informations qu'il reçoit et coordonne ces signaux centraux pour influer sur l'activité de toutes les parties du corps des animaux bilatéralement symétriques (ou Bilateria ; ce sont tous les animaux multicellulaires, sauf les éponges et les animaux à symétrie radiale (ou radiata) tels que les méduses).