Training language models to follow instructions with human feedback

chansonzhang

已于 2024-04-08 09:24:09 修改

阅读量409

点赞数

CC 4.0 BY-SA版权

分类专栏： NLP Papers NLP AI 文章标签：语言模型人工智能自然语言处理

于 2024-04-02 16:21:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chansonzhang/article/details/134715646

NLP Papers 同时被 3 个专栏收录

54 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

68 篇文章

订阅专栏

60 篇文章

订阅专栏

该研究探讨了如何通过人类反馈强化学习（RLHF）微调大模型，使语言模型更好地遵循用户意图。实验表明，经过微调的InstructGPT模型在真实性和毒性方面优于GPT-3，但在某些NLP任务上性能下降。此外，InstructGPT在未见过的指令上表现出良好的泛化能力，但仍会犯简单错误。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Abstract

使语言模型变得更大并不意味着它们本身就能更好地遵循用户的意图。模型的输出结果可能存在以下问题

不真实
有毒
对用户没有帮助

即这些模型没有和用户 “对齐”（aligned）

在给定的 Prompt 分布上，1.3B 的 InstructGPT 的输出比 175B GPT-3 的输出更好（尽管参数量相差 100 多倍）。

1 Introduction

语言建模的目标：predicting the next token on a webpage from the internet

期望的目标: follow the user’s instructions helpfully and safely (Radford et al., 2019; Brown et al., 2020; Fedus et al., 2021; Rae et al., 2021;

了解本专栏

超级会员免费看

博客等级

码龄7年

99
原创

119
点赞

213
收藏

474
粉丝

关注

私信

热门文章

分类专栏

NLP Papers 付费 54篇
AI Platform 付费 4篇
Recommender Systems 2篇
Jax
PyTorch 1篇
TensorFlow 2篇
Spark 2篇
信号处理 1篇
Deep Learning 2篇
Recommend
NLP 60篇
笔记
AI 68篇
Python 2篇
Development Tools 3篇
Big Data 3篇
Cloud 8篇
Tools 3篇
IR 2篇
Windows 2篇
Algorithm 6篇
ML 5篇

展开全部收起

上一篇：: Finetuned Language Models Are Zero-Shot Learners

下一篇：: Windows 安装 DeepSpeed

最新评论

[Paper Notes] Deep Neural Networks for YouTube Recommendations
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
k8s集群证书管理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数。
VIM常用命令总结
CSDN-Ada助手: 为什么SVN曾经辉煌，后面被Git干掉了呢？
Learning from Dialogue after Deployment: Feed Yourself, Chatbot!
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/616055333。
人类历史上第一个推荐系统
捻墨: parc的翻译是认真的吗

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。