Nous travaillons à restaurer l'application Unionpedia sur le Google Play Store
SortantEntrants
🌟Nous avons simplifié notre design pour une meilleure navigation !
Instagram Facebook X LinkedIn
Votre propre Unionpédia avec votre logo et votre domaine, à partir de 9,99 USD/mois
Créer mon Unionpédia

Algorithme UCB

Indice Algorithme UCB

En intelligence artificielle, plus précisément en apprentissage par renforcement, l'algorithme UCB (pour Upper Confidence Bounds) est une stratégie pour le problème du bandit manchot, qui consiste à exploiter les choix fructueux et à explorer les choix peu explorées jusqu'à présent.

Table des matières

  1. 4 relations: Apprentissage par renforcement, Bandit manchot (mathématiques), Intelligence artificielle, Recherche arborescente Monte-Carlo.

Apprentissage par renforcement

En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps.

Voir Algorithme UCB et Apprentissage par renforcement

Bandit manchot (mathématiques)

Une rangée de machines à sous à Las Vegas. En mathématiques, plus précisément en théorie des probabilités, le problème du bandit manchot (généralisable en problème du bandit à K bras ou problème du bandit à N bras) se formule de manière imagée de la façon suivante: un utilisateur (un agent), face à des machines à sous, doit décider quelles machines jouer.

Voir Algorithme UCB et Bandit manchot (mathématiques)

Intelligence artificielle

assistants personnels intelligents sont l'une des applications concrètes de l'intelligence artificielle dans les années 2010. L'intelligence artificielle (IA) est un ensemble de théories et de techniques visant à réaliser des machines capables de simuler l'intelligence humaine.

Voir Algorithme UCB et Intelligence artificielle

Recherche arborescente Monte-Carlo

En informatique, et plus précisément en intelligence artificielle, la recherche arborescente Monte Carlo ou Monte Carlo tree search (MCTS) est un algorithme de recherche heuristique utilisé dans le cadre de la prise de décision.

Voir Algorithme UCB et Recherche arborescente Monte-Carlo