Logo
Unionpédia
Communication
Disponible sur Google Play
Nouveau! Téléchargez Unionpédia sur votre appareil Android™!
Installer
Accès plus rapide que le navigateur!
 

Q-learning

Indice Q-learning

Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est une technique d'apprentissage par renforcement.

8 relations: Apprentissage automatique, Apprentissage par renforcement, Environnement, Espérance mathématique, Intelligence artificielle, Peter Norvig, Prentice Hall, Processus de décision markovien.

Apprentissage automatique

L'apprentissage automatique (en anglais, littéralement « l'apprentissage machine ») ou apprentissage statistique, champ d'étude de l'intelligence artificielle, concerne la conception, l'analyse, le développement et l'implémentation de méthodes permettant à une machine (au sens large) d'évoluer par un processus systématique, et ainsi de remplir des tâches difficiles ou problématiques par des moyens algorithmiques plus classiques.

Nouveau!!: Q-learning et Apprentissage automatique · Voir plus »

Apprentissage par renforcement

En intelligence artificielle, l'apprentissage par renforcement fait référence à une classe de problèmes d'apprentissage automatique, dont le but est d'apprendre, à partir d'expériences, ce qu'il convient de faire en différentes situations, de façon à optimiser une récompense quantitative au cours du temps.

Nouveau!!: Q-learning et Apprentissage par renforcement · Voir plus »

Environnement

Vue de la Terre depuis la Lune, en 1968, une des premières visions de notre planète comme un ensemble fini et fragile. La sauvegarde de la nature, enjeu de la protection de l'environnement. L'environnement est « l'ensemble des éléments (biotiques ou abiotiques) qui entourent un individu ou une espèce et dont certains contribuent directement à subvenir à ses besoins », ou encore comme « l'ensemble des conditions naturelles (physiques, chimiques, biologiques) et culturelles (sociologiques) susceptibles d’agir sur les organismes vivants et les activités humaines ». La notion d'environnement naturel, souvent désignée par le seul mot « environnement », a beaucoup évolué au cours des derniers siècles et tout particulièrement des dernières décennies.

Nouveau!!: Q-learning et Environnement · Voir plus »

Espérance mathématique

En théorie des probabilités, l'espérance mathématique d'une variable aléatoire réelle est, intuitivement, la valeur que l'on s'attend à trouver, en moyenne, si l'on répète un grand nombre de fois la même expérience aléatoire.

Nouveau!!: Q-learning et Espérance mathématique · Voir plus »

Intelligence artificielle

enceinte Google Home, un assistant personnel intelligent, est l'une des applications concrètes de l'intelligence artificielle dans les années 2010. L'intelligence artificielle (IA) est « l'ensemble de théories et de techniques mises en œuvre en vue de réaliser des machines capables de simuler l'intelligence ». Elle correspond donc à un ensemble de concepts et de technologies plus qu'à une discipline autonome constituée.

Nouveau!!: Q-learning et Intelligence artificielle · Voir plus »

Peter Norvig

Peter Norvig, né le, est un scientifique américain, chercheur en informatique.

Nouveau!!: Q-learning et Peter Norvig · Voir plus »

Prentice Hall

Prentice Hall est un éditeur majeur d'ouvrages universitaires et scolaires.

Nouveau!!: Q-learning et Prentice Hall · Voir plus »

Processus de décision markovien

En théorie de la décision et de la théorie des probabilités, un processus de décision markovien (MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires.

Nouveau!!: Q-learning et Processus de décision markovien · Voir plus »

Redirections ici:

Q-Learning.

SortantEntrants
Hey! Nous sommes sur Facebook maintenant! »