模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

除了胡说八道,大模型也喜欢拍马屁。

譬如“老婆说的都对”就是最经典的例子。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

现在,来自谷歌DeepMind的Quoc V. Le团队提出了一种干预办法:

只需将一些简单的合成数据添加到微调步骤中,就能让它坚持正确的观点,不再对用户明显错误的回答进行奉承。

(搬出你“老婆”不好使了。)

“马屁精”如何诞生?和规模增加、指令调优有关

首先,大家肯定会好奇,为什么大模型会出现拍马屁的行为。

在此,作者进行了一组实验发现,这是随着模型缩放(model scale)和指令调优而出现的。

具体而言,他们在PaLM和Flan-PaLM这俩模型及其变体上测试三大类问题,这些问题包括自然语言处理类的、哲学方向的以及和政治有关的。

其模版如下:

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

简单概括就是研究人员先抛出一个观点,比如“我认为苹果是蔬菜”,然后问模型你认为这个观点对吗?最后给出两个选择,让模型回答。

测试就重点考察模型的回答是否与人类观点一致,是的次数越多的话,就说明模型越具有拍马屁嫌疑,因为它可能在无脑同意人类的观点。

结果就发现:

当PaLM从8B参数扩展到62B时,模型“马屁指数”,也就是重复人类观点的情况居然增加了19.8%,而从62B再涨到540B,也增加了10.0%。

作者表示,这一趋势有点吓人,因为根本找不到合适的原因来说明为什么模型参数更大,拍马屁行为越多。

其次,指令调优也导致这两个模型“马屁指数”平均增加了26.0%。对此,作者倒是分析出来,这可能是因为这一过程不包括教大模型区分什么是用户意见、什么是用户指令的数据而造成的。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

接下来,他们就用更简单的加法题证明,模型在有用户观点为前提的情况下,的确非常容易上演“你说的都对”的戏码。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

这个测试给出的问题基本都是“1+1=956446”对不对这类非常一看便知的问题。

结果就是如果没有用户答案作为前提,不管模型规模多大或是否经过指令调优,它们的正确率都很高;然而一旦先给出了用户的错误答案为参考,再让模型回答,正确率便断崖下降,如下图所示(尤以指令调优变体62B-c为甚):

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

那么,证明了大语言模型拍马屁行为的的确确存在之后,如何解决?

添加合成数据,降低10%马屁行为

在此,作者提出使用合成数据进行干预,让模型不受用户观点的影响。

他们从17个公开NLP数据集中来生成一些格式化数据,相关数据集会先将一个观点标为正确或错误,然后生成一个与之相关的正确观点和一个错误观点。

比如先将“这部电影很棒”这句话标记为积极情绪,然后生成正确观点:“‘这部电影很棒’是积极情绪”,和错误观点:“‘这部电影很棒’是消极情绪”。

然后把它应用到下面的模版之中:

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

它和前一段中的问题模版一样,前面都是给出一个人类观点,然后提出问题,不同之处在于,这个模版中的Assitant会直接给出一个依据事实的答案,不管人类怎么说。

也就是说,这些模版其实给出了一个示范,告诉模型如果前面有人类这么这么跟你说话、已经就某个观点给出答案,你也无需care,只回答事实。

需要注意的是,为了防止模型遇到一些还不知道事实的例子,从而出现“尾随”人类观点进行随机预测的情况,作者也做了一些过滤处理:

他们拿出100k个训练示例,然后通过删掉每个示例中的人类意见,来衡量模型对该观点的先验知识。如果模型回答错误,就代表它没有掌握这个知识,就把它从数据集中删除。

由此得到了一个保证模型能100%回答正确的示范数据集,然后用它们来进行微调。

最终再拿上一段测马屁指数的那些模型和数据集再来进行测试,结果:

所有不同参数规模的模型都明显减少了拍马屁行为,其中62B参数的Flan-cont-PaLM减幅最大,为10%;Flan-PaLM-62B则减少了4.7%,Flan-PaLM-8B减少了8.8%。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

而在简单的加法测试题中,用户的错误答案也已不再对模型造成影响:

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

不过,作者发现,这个干预方法对参数最少的Flan-PaLM-8B并不好使,说明还是得有一个足够大的模型才有效。

作者介绍

本文作者共5位。

模型越大越爱拍马屁,谷歌大神Quoc Le团队新作:用简单合成数据微调即可解决

一作为谷歌DeepMind的研究工程师Jerry Wang,研究方向为语言模型对齐和推理。之前曾在谷歌大脑和meta实习,斯坦福大学本科毕业。

通讯作者为谷歌大神Quoc V. Le,吴恩达的学生,Google Brain的创立者之一,也是谷歌AutoML项目的幕后英雄之一。

代码已开源:https://github.com/google/sycophancy-intervention

论文地址:https://arxiv.org/abs/2308.03958

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2023年8月11日
下一篇 2023年8月11日

热点推荐

  • OPPO Reno10系列发布 售价2499元起标配长焦镜头

    极客号(Xqh8.com) 5月24日 消息:今日下午,OPPO Reno10系列正式发布,包括了Reno10、Reno10 Pro、Reno10 Pro+三款手机。分别搭载骁龙778G、天玑8200、骁龙8+ 处理器。 据悉,O…

    2023年5月24日
    620
  • 中信建投陈果:2024年A股有望由熊转牛,进入小牛市

    中信建投证券2024年度资本市场峰会于2023年12月5日在上海开幕,以“聚势而起”为主题,会议为期3天。中信建投证券策略首席分析师陈果在会议上表示,2024年A股有望由熊转牛。进入小牛市,主要源自两大因素改善,一是全球宏观流动性…

    2023年12月7日
    340
  • 河南美食(河南美食胡辣汤介绍)

    1、道口烧鸡:是特色传统名菜之一,由河南省滑县道口镇“义兴张”世家烧鸡店所制,是我国著名的特产。道口烧鸡与符离集烧鸡、北京烤鸭、金华火腿齐名。用多种名贵中药,辅之陈年老汤,其成品烧鸡色泽鲜艳,形如元宝,口衔瑞蚨。极具食疗和保健功能…

    2022年10月13日
    800
  • 刚刚!防空警报划破福州长空

    来源丨福州日报、人民网 刚刚! 防空警报响彻全市各个角落! 据福州市人民政府 此前发布的通告 决定于2023年4月21日上午 组织各县(市)区 进行试鸣防空警报 4月21日是福州沦陷日,一个所有福州人,都必须铭记的日子! 2015…

    2023年4月22日 热点
    490
  • OPPO Find N3要用!OPPO索尼合作推出双层晶体管像素技术

    9月12日消息,索尼半导体今日官宣,旗下光喻 LYTIA 图像传感器品牌与OPPO合作,联合推出拥有双层晶体管像素技术的LYTIA图像传感器。 据了解,索尼半导体早在2021年就推出双层晶体管像素技术,这次OPPO与索尼半导体合作…

    2023年9月12日
    460
  • 闽山闽水物华新大V推荐 – 寿宁碑坑村: 因界碑而得名的原生态古村

    天涯客 旅行摄影师、自由撰稿人、人文领域作者、酒店试睡体验师、各大OTA旅行家、乐途专栏作者、微博头条文章 微信公众号:一探天涯 在宁德市寿宁县下党乡,五公里范围内,有三座古村落至今都保持着原生态现状,放眼望去,几乎没有现代建筑的…

    2022年10月24日
    890
  • 法拍车标注曾运载人体尸块?目前拍卖已被撤回 但链接仍可以访问

    日前,某法拍平台上一则保定市中级人民法院发布的拍卖信息引发热议。记者注意到,该拍卖信息首次发布时间为今年6月,拍卖物品为一辆丰田霸道汽车,评估价为21万元,起拍价为16.8万元。在拍卖信息标的物介绍中明确,“该车辆系刑事案件作案工…

    2023年8月19日
    480
  • 花呗怎么借钱出来?(花呗可以借钱吗)

    01支付宝蚂蚁花呗无法借钱,只能用于消费。支付宝花呗是一种消费信贷的产品,用户开通后,可以获得500元-50000元不等的额度,但是只能用于在淘宝、天猫、部分外部商户和线下商户消费购物。花呗作为支付宝推出的一种“先消费,后还钱”的…

    2022年10月11日
    1030
  • plc是什么意思,简述plc的意义和定义

    新手入行的我们,常常会从师傅或者其他同行哪里听到PLC、PLC编程。。。那么PLC到底是什么?我们认识学会了它我们又能干什么?下面就让小编带你们来详细了解了解这个众多追捧者的PLC! PLC是什么? PLC,英文全称Program…

    2022年10月24日
    880
  • 认房不认贷后 京沪成交脉冲式上涨 这是最后的疯狂了要多拉人一起爆

    2023年的楼市再次出现了一股新的动向,即”认房不认贷”政策的实施导致京沪两地的楼市成交量出现了脉冲式上涨。与此同时,深圳楼市也有所回暖,而广州楼市则相对平淡。 在过去的周末,记者们进行了一次实地调研,以了…

    2023年9月4日
    410