Votre propre Unionpédia avec votre logo et votre domaine, à partir de 9,99 USD/mois

Temporal difference learning

Le Temporal Difference (TD) learning est une classe d'algorithmes d'apprentissage par renforcement sans modèle.

Table des matières

5 relations: Algorithme acteur-critique, Apprentissage par renforcement, Apprentissage par renforcement profond, Richard Sutton, Voies dopaminergiques.

Algorithme acteur-critique

En apprentissage par renforcement, l'algorithme acteur-critique est un algorithme de difference temporelle utilisant la descente de gradients.

Voir Temporal difference learning et Algorithme acteur-critique

Apprentissage par renforcement

En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps.

Voir Temporal difference learning et Apprentissage par renforcement

Apprentissage par renforcement profond

L'apprentissage par renforcement profond (en anglais: deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais: machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais: deep learning).

Voir Temporal difference learning et Apprentissage par renforcement profond

Richard Sutton

Richard Sutton est un informaticien canadien, enseignant en informatique à l'université de l'Alberta.

Voir Temporal difference learning et Richard Sutton

Voies dopaminergiques

Les principales voies dopaminergiques du cerveau humain. Les voies dopaminergiques, parfois appelées projections dopaminergiques, sont l'ensemble de fibres de projection dans le cerveau qui synthétisent et libèrent le neurotransmetteur dopamine.

Voir Temporal difference learning et Voies dopaminergiques

Unionpédia est une carte conceptuelle ou réseau sémantique organisée comme une encyclopédie ou un dictionnaire. Il donne une brève définition de chaque concept et de ses relations.

Ceci est une carte mentale en ligne géant qui sert de base pour les schémas conceptuels. Il est libre d'utiliser et de chaque article ou document peut être téléchargé. Il est un outil, ressources ou de référence pour l'étude, la recherche, l'éducation, l'apprentissage ou de l'enseignement, qui peut être utilisé par les enseignants, les éducateurs, les élèves ou étudiants; pour le monde universitaire: à l'école, primaire, secondaire, l'école secondaire, au milieu, un collège, diplôme technique, collégial, universitaire, baccalauréat, de maîtrise ou de doctorat; pour les papiers, des rapports, des projets, des idées, de la documentation, des enquêtes, des résumés, ou une thèse. Voici la définition, l'explication, la description ou la signification de chaque importantes sur lesquelles vous avez besoin d'informations, et une liste de leurs concepts connexes comme un glossaire. Disponible en français, anglais, espagnol, portugais, japonais, chinois, allemand, italien, polonais, néerlandais, russe, arabe, hindi, suédois, ukrainien, hongrois, catalan, tchèque, hébreu, danois, finlandais, indonésien, norvégien, roumain, turc, vietnamien, coréen, thaïlandais, grec, bulgare, croate, slovaque, lituanien, philippin, letton, estonien et slovène. Plus de langues bientôt.

Les informations sont basées sur des articles de Wikipedia et d'autres projets Wikimedia, et elles sont disponibles sous la Licence Creative Commons Attribution-Partage dans les Mêmes Conditions.

Unionpédia n'est ni approuvée ni affiliée à la Wikimedia Foundation.

Google Play, Android et le logo Google Play sont des marques de Google Inc.

Politique de confidentialité

Autres langues