Table des matières
4 relations: Apprentissage par renforcement, Bandit manchot (mathématiques), Intelligence artificielle, Recherche arborescente Monte-Carlo.
Apprentissage par renforcement
En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps.
Voir Algorithme UCB et Apprentissage par renforcement
Bandit manchot (mathématiques)
Une rangée de machines à sous à Las Vegas. En mathématiques, plus précisément en théorie des probabilités, le problème du bandit manchot (généralisable en problème du bandit à K bras ou problème du bandit à N bras) se formule de manière imagée de la façon suivante: un utilisateur (un agent), face à des machines à sous, doit décider quelles machines jouer.
Voir Algorithme UCB et Bandit manchot (mathématiques)
Intelligence artificielle
assistants personnels intelligents sont l'une des applications concrètes de l'intelligence artificielle dans les années 2010. L'intelligence artificielle (IA) est un ensemble de théories et de techniques visant à réaliser des machines capables de simuler l'intelligence humaine.
Voir Algorithme UCB et Intelligence artificielle
Recherche arborescente Monte-Carlo
En informatique, et plus précisément en intelligence artificielle, la recherche arborescente Monte Carlo ou Monte Carlo tree search (MCTS) est un algorithme de recherche heuristique utilisé dans le cadre de la prise de décision.

