Logo
Unionpédia
Communication
Disponible sur Google Play
Nouveau! Téléchargez Unionpédia sur votre appareil Android™!
Installer
Accès plus rapide que le navigateur!
 

Q-learning

Indice Q-learning

Dans le ''Q-learning'', l'agent exécute une action a en fonction de l'état ''s'' et d'une fonction ''Q''. Il perçoit alors le nouvel état s' et une récompense ''r'' de l'environnement. Il met alors à jour la fonction ''Q''. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement.

18 relations: Apprentissage automatique, Apprentissage par renforcement, Apprentissage profond, Atari 2600, Cambridge University Press, Environnement, Espérance mathématique, Google DeepMind, Intelligence artificielle, Jeu vidéo, Moyenne pondérée, Nombre réel, Peter Norvig, Prentice Hall, Processus de décision markovien, Programme informatique, Pseudo-code, SARSA.

Apprentissage automatique

L'apprentissage automatique.

Nouveau!!: Q-learning et Apprentissage automatique · Voir plus »

Apprentissage par renforcement

En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps.

Nouveau!!: Q-learning et Apprentissage par renforcement · Voir plus »

Apprentissage profond

L'apprentissage profond.

Nouveau!!: Q-learning et Apprentissage profond · Voir plus »

Atari 2600

L’Atari 2600, à l’origine appelée Atari VCS, est une console de jeux vidéo de deuxième génération produite par Atari entre 1977 et 1992.

Nouveau!!: Q-learning et Atari 2600 · Voir plus »

Cambridge University Press

Cambridge University Press ou CUP (en français, Presses universitaires de Cambridge) est une maison d'édition universitaire britannique rattachée à l’université de Cambridge.

Nouveau!!: Q-learning et Cambridge University Press · Voir plus »

Environnement

Vue de la Terre depuis la Lune, en 1968, une des premières visions de notre planète comme un ensemble fini et fragile. La sauvegarde de la nature, enjeu de la protection de l'environnement. L'environnement est « l'ensemble des éléments (biotiques et abiotiques) qui entourent un individu ou une espèce et dont certains contribuent directement à subvenir à ses besoins », ou encore « l'ensemble des conditions naturelles (physiques, chimiques, biologiques) et culturelles (sociologiques) susceptibles d’agir sur les organismes vivants et les activités humaines ».

Nouveau!!: Q-learning et Environnement · Voir plus »

Espérance mathématique

Avec un dé on peut obtenir chaque nombre entre 1 et 6 avec une probabilité de 1/6. Ainsi, l'espérance vaut \frac(1+2+3+4+5+6)6.

Nouveau!!: Q-learning et Espérance mathématique · Voir plus »

Google DeepMind

Google DeepMind est une entreprise spécialisée dans l'intelligence artificielle appartenant à Google.

Nouveau!!: Q-learning et Google DeepMind · Voir plus »

Intelligence artificielle

assistants personnels intelligents sont l'une des applications concrètes de l'intelligence artificielle dans les années 2010. L'intelligence artificielle (IA) est un ensemble de théories et de techniques visant à réaliser des machines capables de simuler l'intelligence humaine.

Nouveau!!: Q-learning et Intelligence artificielle · Voir plus »

Jeu vidéo

Un jeu vidéo est un jeu électronique doté d'une interface utilisateur permettant une interaction humaine ludique en générant un retour visuel sur un dispositif vidéo.

Nouveau!!: Q-learning et Jeu vidéo · Voir plus »

Moyenne pondérée

La moyenne pondérée est la moyenne d'un certain nombre de valeurs affectées de coefficients.

Nouveau!!: Q-learning et Moyenne pondérée · Voir plus »

Nombre réel

En mathématiques, un nombre réel est un nombre qui peut être représenté par une partie entièreCette partie entière par troncature, désignant les chiffres « à gauche de la virgule » ne correspond pas forcément à la partie entière par défaut: dans le cas d’un nombre réel négatif comme, la partie entière par défaut vaut.

Nouveau!!: Q-learning et Nombre réel · Voir plus »

Peter Norvig

Peter Norvig, né le, est un scientifique américain, chercheur en informatique.

Nouveau!!: Q-learning et Peter Norvig · Voir plus »

Prentice Hall

Prentice Hall est un éditeur majeur d'ouvrages universitaires et scolaires.

Nouveau!!: Q-learning et Prentice Hall · Voir plus »

Processus de décision markovien

En théorie de la décision et de la théorie des probabilités, un processus de décision markovien (en anglais, MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires.

Nouveau!!: Q-learning et Processus de décision markovien · Voir plus »

Programme informatique

Un programme informatique est un ensemble d'instructions et d’opérations destinées à être exécutées par un ordinateur.

Nouveau!!: Q-learning et Programme informatique · Voir plus »

Pseudo-code

En programmation, le pseudo-code, également appelé LDA (pour Langage de Description d'Algorithmes) est une façon de décrire un algorithme en langage presque naturel, sans référence à un langage de programmation en particulier.

Nouveau!!: Q-learning et Pseudo-code · Voir plus »

SARSA

En intelligence artificielle, plus précisément en apprentissage par renforcement, SARSA est un algorithme d'apprentissage.

Nouveau!!: Q-learning et SARSA · Voir plus »

Redirections ici:

Q-Learning.

SortantEntrants
Hey! Nous sommes sur Facebook maintenant! »