Logo
Unionpédia
Communication
Disponible sur Google Play
Nouveau! Téléchargez Unionpédia sur votre appareil Android™!
Gratuit
Accès plus rapide que le navigateur!
 

Apprentissage par renforcement et Q-learning

Raccourcis: Différences, Similitudes, Jaccard similarité Coefficient, Références.

Différence entre Apprentissage par renforcement et Q-learning

Apprentissage par renforcement vs. Q-learning

En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. Dans le ''Q-learning'', l'agent exécute une action a en fonction de l'état ''s'' et d'une fonction ''Q''. Il perçoit alors le nouvel état s' et une récompense ''r'' de l'environnement. Il met alors à jour la fonction ''Q''. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement.

Similitudes entre Apprentissage par renforcement et Q-learning

Apprentissage par renforcement et Q-learning ont 6 choses en commun (em Unionpédia): Apprentissage automatique, Espérance mathématique, Intelligence artificielle, Jeu vidéo, Processus de décision markovien, SARSA.

Apprentissage automatique

L'apprentissage automatique.

Apprentissage automatique et Apprentissage par renforcement · Apprentissage automatique et Q-learning · Voir plus »

Espérance mathématique

Avec un dé on peut obtenir chaque nombre entre 1 et 6 avec une probabilité de 1/6. Ainsi, l'espérance vaut \frac(1+2+3+4+5+6)6.

Apprentissage par renforcement et Espérance mathématique · Espérance mathématique et Q-learning · Voir plus »

Intelligence artificielle

assistants personnels intelligents sont l'une des applications concrètes de l'intelligence artificielle dans les années 2010. L'intelligence artificielle (IA) est un ensemble de théories et de techniques visant à réaliser des machines capables de simuler l'intelligence humaine.

Apprentissage par renforcement et Intelligence artificielle · Intelligence artificielle et Q-learning · Voir plus »

Jeu vidéo

Un jeu vidéo est un jeu électronique doté d'une interface utilisateur permettant une interaction humaine ludique en générant un retour visuel sur un dispositif vidéo.

Apprentissage par renforcement et Jeu vidéo · Jeu vidéo et Q-learning · Voir plus »

Processus de décision markovien

En théorie de la décision et de la théorie des probabilités, un processus de décision markovien (en anglais, MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires.

Apprentissage par renforcement et Processus de décision markovien · Processus de décision markovien et Q-learning · Voir plus »

SARSA

En intelligence artificielle, plus précisément en apprentissage par renforcement, SARSA est un algorithme d'apprentissage.

Apprentissage par renforcement et SARSA · Q-learning et SARSA · Voir plus »

La liste ci-dessus répond aux questions suivantes

Comparaison entre Apprentissage par renforcement et Q-learning

Apprentissage par renforcement a 46 relations, tout en Q-learning a 18. Comme ils ont en commun 6, l'indice de Jaccard est 9.38% = 6 / (46 + 18).

Références

Cet article montre la relation entre Apprentissage par renforcement et Q-learning. Pour accéder à chaque article à partir de laquelle l'information a été extraite, s'il vous plaît visitez:

Hey! Nous sommes sur Facebook maintenant! »