Reinforcement Learning from Human Feedback
De Wiki BackProp
Aller à la navigation
Aller à la recherche
Reinforcement Learning from Human Feedback (RLHF)
https://huggingface.co/blog/rlhf
Menu de navigation
Outils personnels
Se connecter
Espaces de noms
Page
Discussion
français
développé
replié
Affichages
Lire
Voir le texte source
Voir l’historique
Plus
développé
replié
Rechercher
Navigation
Accueil
Modifications récentes
Page au hasard
Aide concernant MediaWiki
Outils
Pages liées
Suivi des pages liées
Pages spéciales
Version imprimable
Lien permanent
Informations sur la page