小不点搜索 登录

用RLHF的方法解读论语

[视频作者] jurejoy
[视频时长] 30:12
#论语,大模型,LLM,openai,DPO,PPO,huggingface,Chatgpt,RLHF,AI研究所#
[视频类型] 计算机技术
用RLHF的方法解读论语,解读openai使用的技术,涉及到PPO方法,DPO方法,以及论语的解读心得与大模型的合理学习使用 Hugging face TRL repo: https://github.com/huggingface/trl/blob/98845b9282c9971f6eae370eac9633653d2d050e/README.md PPO 论文: https://arxiv.org/pdf/2203.02155.pdf https://arxiv.org/pdf/1707.0634
用RLHF的方法解读论语
以上内容由小不点搜索引擎从网站www.bilibili.com自动化索引镜像而来,不代表网站的即时内容,也无法确保其有效性;仅限个人学习使用,禁止商用。如有任何异议,请使用举报删除
影音视频访问链接
以下链接为影音视频“用RLHF的方法解读论语”在线访问地址,点击链接就可以访问查看啦