18 relations: Apprentissage automatique, Apprentissage par renforcement, Apprentissage profond, Atari 2600, Cambridge University Press, Environnement, Espérance mathématique, Google DeepMind, Intelligence artificielle, Jeu vidéo, Moyenne pondérée, Nombre réel, Peter Norvig, Prentice Hall, Processus de décision markovien, Programme informatique, Pseudo-code, SARSA.
Apprentissage automatique
L'apprentissage automatique.
Nouveau!!: Q-learning et Apprentissage automatique · Voir plus »
Apprentissage par renforcement
En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps.
Nouveau!!: Q-learning et Apprentissage par renforcement · Voir plus »
Apprentissage profond
L'apprentissage profond.
Nouveau!!: Q-learning et Apprentissage profond · Voir plus »
Atari 2600
L’Atari 2600, à l’origine appelée Atari VCS, est une console de jeux vidéo de deuxième génération produite par Atari entre 1977 et 1992.
Nouveau!!: Q-learning et Atari 2600 · Voir plus »
Cambridge University Press
Cambridge University Press ou CUP (en français, Presses universitaires de Cambridge) est une maison d'édition universitaire britannique rattachée à l’université de Cambridge.
Nouveau!!: Q-learning et Cambridge University Press · Voir plus »
Environnement
Vue de la Terre depuis la Lune, en 1968, une des premières visions de notre planète comme un ensemble fini et fragile. La sauvegarde de la nature, enjeu de la protection de l'environnement. L'environnement est « l'ensemble des éléments (biotiques et abiotiques) qui entourent un individu ou une espèce et dont certains contribuent directement à subvenir à ses besoins », ou encore « l'ensemble des conditions naturelles (physiques, chimiques, biologiques) et culturelles (sociologiques) susceptibles d’agir sur les organismes vivants et les activités humaines ».
Nouveau!!: Q-learning et Environnement · Voir plus »
Espérance mathématique
Avec un dé on peut obtenir chaque nombre entre 1 et 6 avec une probabilité de 1/6. Ainsi, l'espérance vaut \frac(1+2+3+4+5+6)6.
Nouveau!!: Q-learning et Espérance mathématique · Voir plus »
Google DeepMind
Google DeepMind est une entreprise spécialisée dans l'intelligence artificielle appartenant à Google.
Nouveau!!: Q-learning et Google DeepMind · Voir plus »
Intelligence artificielle
assistants personnels intelligents sont l'une des applications concrètes de l'intelligence artificielle dans les années 2010. L'intelligence artificielle (IA) est un ensemble de théories et de techniques visant à réaliser des machines capables de simuler l'intelligence humaine.
Nouveau!!: Q-learning et Intelligence artificielle · Voir plus »
Jeu vidéo
Un jeu vidéo est un jeu électronique doté d'une interface utilisateur permettant une interaction humaine ludique en générant un retour visuel sur un dispositif vidéo.
Nouveau!!: Q-learning et Jeu vidéo · Voir plus »
Moyenne pondérée
La moyenne pondérée est la moyenne d'un certain nombre de valeurs affectées de coefficients.
Nouveau!!: Q-learning et Moyenne pondérée · Voir plus »
Nombre réel
En mathématiques, un nombre réel est un nombre qui peut être représenté par une partie entièreCette partie entière par troncature, désignant les chiffres « à gauche de la virgule » ne correspond pas forcément à la partie entière par défaut: dans le cas d’un nombre réel négatif comme, la partie entière par défaut vaut.
Nouveau!!: Q-learning et Nombre réel · Voir plus »
Peter Norvig
Peter Norvig, né le, est un scientifique américain, chercheur en informatique.
Nouveau!!: Q-learning et Peter Norvig · Voir plus »
Prentice Hall
Prentice Hall est un éditeur majeur d'ouvrages universitaires et scolaires.
Nouveau!!: Q-learning et Prentice Hall · Voir plus »
Processus de décision markovien
En théorie de la décision et de la théorie des probabilités, un processus de décision markovien (en anglais, MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires.
Nouveau!!: Q-learning et Processus de décision markovien · Voir plus »
Programme informatique
Un programme informatique est un ensemble d'instructions et d’opérations destinées à être exécutées par un ordinateur.
Nouveau!!: Q-learning et Programme informatique · Voir plus »
Pseudo-code
En programmation, le pseudo-code, également appelé LDA (pour Langage de Description d'Algorithmes) est une façon de décrire un algorithme en langage presque naturel, sans référence à un langage de programmation en particulier.
Nouveau!!: Q-learning et Pseudo-code · Voir plus »
SARSA
En intelligence artificielle, plus précisément en apprentissage par renforcement, SARSA est un algorithme d'apprentissage.
Nouveau!!: Q-learning et SARSA · Voir plus »