Logo
Unionpédia
Communication
Disponible sur Google Play
Nouveau! Téléchargez Unionpédia sur votre appareil Android™!
Gratuit
Accès plus rapide que le navigateur!
 

Espérance mathématique et Q-learning

Raccourcis: Différences, Similitudes, Jaccard similarité Coefficient, Références.

Différence entre Espérance mathématique et Q-learning

Espérance mathématique vs. Q-learning

Avec un dé on peut obtenir chaque nombre entre 1 et 6 avec une probabilité de 1/6. Ainsi, l'espérance vaut \frac(1+2+3+4+5+6)6. Dans le ''Q-learning'', l'agent exécute une action a en fonction de l'état ''s'' et d'une fonction ''Q''. Il perçoit alors le nouvel état s' et une récompense ''r'' de l'environnement. Il met alors à jour la fonction ''Q''. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement.

Similitudes entre Espérance mathématique et Q-learning

Espérance mathématique et Q-learning ont une chose en commun (en Unionpédia): Moyenne pondérée.

Moyenne pondérée

La moyenne pondérée est la moyenne d'un certain nombre de valeurs affectées de coefficients.

Espérance mathématique et Moyenne pondérée · Moyenne pondérée et Q-learning · Voir plus »

La liste ci-dessus répond aux questions suivantes

Comparaison entre Espérance mathématique et Q-learning

Espérance mathématique a 77 relations, tout en Q-learning a 18. Comme ils ont en commun 1, l'indice de Jaccard est 1.05% = 1 / (77 + 18).

Références

Cet article montre la relation entre Espérance mathématique et Q-learning. Pour accéder à chaque article à partir de laquelle l'information a été extraite, s'il vous plaît visitez:

Hey! Nous sommes sur Facebook maintenant! »