OpenAI 的 GPT-4 变得「懒惰」和「愚蠢」:或被 MoE 彻底重塑导致性能下降

世界上最强大的人工智能模型似乎变得不那么强大了。这让业内人士开始谈论可能会对该系统进行重大重新设计。

OpenAI 的 GPT-4 变得「懒惰」和「愚蠢」:或被 MoE 彻底重塑导致性能下降

最近几周,OpenAI 的 GPT-4 的用户们纷纷抱怨性能下降,有些人将这个模型与以前的推理能力和其他输出进行比较,称其变得「懒散」和「更笨」。

在 Twitter 上和 OpenAI 的在线开发者论坛上,用户们发表了对弱化逻辑、更多错误响应、追踪不到提供的信息、难以按照指令操作、忘记在基本软件代码中添加括号以及只记住最近的提示等问题的不满。

一位使用 GPT-4 来帮助编写网站功能的开发者写道:「现在的 GPT-4 令人失望。就像你开了一个月的法拉利,然后突然变成了一辆破旧的皮卡车。我不确定是否愿意为此付费。」

Roblox 的产品负责人 Peter Yang 在推特上表示,该模型生成速度更快,但质量更差。「只是一些简单的问题,比如使文本更清晰、更简洁,以及生成想法,」他补充道。「在我看来,写作质量下降了。」他问是否有其他人注意到了这一点。

另一位名为 Frazier MacLeod 的用户回答说:「我发现它变得更懒散了。」

Christi Kennedy 在 OpenAI 的开发者论坛上写道,GPT-4 开始一遍又一遍地循环输出代码和其他信息。

从缓慢且昂贵,到快速且不准确

与今年年初的情况相比,这是一个相当大的变化。当时 OpenAI 通过 ChatGPT 和 GPT-4 的推出赢得了全世界的赞誉,科技行业也在翘首以待 GPT-4 的发布。ChatGPT 最初运行在 GPT-3 和 GPT-3.5 上,它们是支撑其神奇回答的巨大基础 AI 模型。

更大的 GPT-4 于三月份推出,并迅速成为开发者和其他科技行业内部的首选模型。它被认为是目前最强大的广泛可用的 AI 模型,并且是多模态的,可以理解图像和文本输入。

在尝试这个新模型后的最初热潮之后,一些人对使用 GPT-4 的账单感到震惊。Lamini 创业公司的首席执行官 Sharon Zhou 表示,它的速度很慢,但非常准确。

忒修斯之船

然而,几周前情况发生了变化。GPT-4 的速度变快了,但性能明显下降,这引发了整个 AI 社区对重大变化正在发生的讨论,Zhou 和其他专家表示。

他们认为 OpenAI 正在创建几个较小的 GPT-4 模型,这些模型的行为类似于大模型,但运行成本更低。

据 Zhou 称,这种方法被称为专家混合(Mixture of Experts,MoE)。这些较小的专家模型分别针对不同的任务和领域进行训练。可能会有一个用于生物学、物理学、化学等的小型生物学家 GPT-4。当一个 GPT-4 用户提出问题时,新系统知道将查询发送给哪个专家模型。新系统可能会决定将查询发送给两个或更多的专家模型,以防万一,然后将结果混合在一起。

Zhou 表示:「这个想法已经存在一段时间了,这是自然而然的下一步。」

Zhou 将这种情况比作「忒修斯之船」思想实验,在这个实验中,船的部分逐渐被更换,引发了一个问题:在哪个时刻它成为了一个全新的船?

她说:「OpenAI 正在将 GPT-4 转变为一支由较小船只组成的小型舰队。」「从我的角度来看,这是一个新模型。有人可能会说它是一样的。」

本周,几位 AI 专家在推特上发布了他们声称是 GPT-4 架构细节的内容。初创公司创始人 Yam Peleg 在推特上表示,OpenAI 通过使用 16 个专家的混合模型来降低成本。Semianalysis 在本周写了关于 GPT-4 内部工作原理的文章。

开发者和黑客 George Hotz 在最近的一期播客中描述了 GPT-4 的「八路混合模型」。meta 的 PyTorch 开源 AI 项目联合创始人 Soumith Chintala 对 Hotz 的评论表示了支持。

在看到本周在线泄露的消息后,Allen 人工智能研究所的创始首席执行官 Oren Etzioni 在一封电子邮件中写道:「我推测这些猜测大致是准确的,但我没有得到证实。」

他解释说,使用 MOE 方法有两个主要的技术原因:生成更好的响应,以及更便宜、更快的响应。

他补充说:「『正确的』混合将同时给你带来这两个好处,但通常在成本和质量之间存在权衡。」「在这种情况下,OpenAI 似乎在为降低成本而牺牲了一些质量。这些模型很难进行评估(什么样的响应更好?在什么情况下?),所以这只是凭经验而非科学的观察。

2022 年,OpenAI 的总裁 Greg Brockman 与其同事 Lilian Weng 共同撰写的研究中提到了 MOE 方法。他们写道:「使用专家混合(Mixture-of-Experts,MoE)方法,仅使用网络的一小部分来计算任何一个输入的输出。一个例子是通过推理时的门控机制选择使用哪个权重集合。」「这样做可以在不增加计算成本的情况下增加更多参数。每个权重集合被称为『专家』,希望网络能够学习将专业计算和技能分配给每个专家。」

最近几周 GPT-4 性能下降的情况可能与这种训练有关,OpenAI 正在推出这一批较小的专家级 GPT-4 模型,Zhou 表示。

Zhou 解释说:「当用户对其进行测试时,我们会提出许多不同的问题。它的表现可能不太好,但它正在从我们这里收集数据,并且会不断改进和学习。」

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年7月13日 21:53
下一篇 2023年7月13日 22:03

热点推荐

  • 是在下输了是什么梗

    网络上经常有很多好玩的梗和词语出现,最近一段时间是在下输了这个更非常火爆,不少小伙伴表示一头雾水,那么是在下输了是什么梗?是在下输了是什么意思?出自哪里?下面小编为大家带来是在下输了梗的含义及出处介绍,感兴趣的小伙伴一起来看一下吧…

    热点 2023年8月17日
    107
  • 虢怎么读(昉怎么读)

    guó。有两种意思。1、中国周代诸侯国名:东虢(在今河南省郑州市西北)。西虢(在今陕西省宝鸡县东,后迁到今河南省陕县东南)。 2、姓。虢国是西周初期的重要诸侯封国。周武王灭商后,周文王的两个弟弟分别被封为东、西虢国国君,虢仲封东虢…

    热点 2022年10月11日
    170
  • 介绍8大自媒体联盟(你知道的自媒体联盟有哪些)

    赵宏民2月21日报道 自媒体这么火,我家人都知道了。关于自媒体,我将自己的研究感悟先后撰写成数十篇文章,发布在我的自媒体平台,这里就不在赘述了,今天谈下自媒体联盟。你知道目前中国有多少自媒体联盟吗?也许每个人的答案都不一样,据了解…

    热点 2022年10月15日
    198
  • 高圆圆是什么星座?(高圆圆是什么星座)

    提起高圆圆是什么星座,大家都知道,有人问高圆圆是什么星座?,你知道这是怎么回事?其实高圆圆是什么星座?,下面就一起来看看高圆圆是什么星座,希望能够帮助到大家! 高圆圆什么血型星座 高圆圆星座、血型: 天秤座, a型 高圆圆(197…

    热点 2023年5月2日
    186
  • 县政府被问天价雕塑连回6个不知道 715万雕塑引争议

    河南省平顶山市鲁山县人民政府官网上的一篇题为《中国牛郎织女文化之乡》文章显示,牛郎织女的故事发源于鲁山,形成于鲁山,扎根于鲁山,并流传至全国及至世界各地。 2023年8月22日七夕节,鲁山县的“牛郎织女”雕塑揭幕。此后,这座花费7…

    热点 2023年8月29日
    105
  • 三张信用卡循环还房贷(三张信用卡循环还款账单日)

    可以这么操作啊,没多大问题。 但是有几个风险需要规避一下,首先你的收入一定要覆盖按揭还款的金额加上每个月刷卡的手续费。 在这种情况下,其实是没有多大的风险,只要自己了解信用卡,对信用卡会玩就可以了。很多朋友都是这么操作的。 其次就…

    热点 2022年10月7日
    157
  • 衣服是怎么制作的(衣服怎么做成的)

    人靠衣装马靠鞍,一件好看的衣服,对于我们的颜值影响也是非常大的。想必很多姑娘都梦想着能够穿上自己制作的衣服,那一定是一种非常兴奋的状态。那么你知道衣服的制作方法是怎样的吗?其实只要三个小步骤,你也能做出好看的衣服,我们一起来看看吧…

    2022年10月11日 热点
    172
  • 快穿小说排名榜前十(快穿小说排名完本前十名)

    十大公认最好看的快穿小说 十大公认最好看的快穿小说:《我靠嘴炮刷副本》作者:少年梦话 简介:我叫乐景,我穿梭无尽世界,只为追寻自由、知识和真理。《快穿失败以后》作者:云上浅酌 简介:简禾有个感化人渣反派系统。 以下是一些好看的快穿…

    热点 2024年1月6日
    115
  • PS5新机型什么时候发售(ps5新机型什么时候出)

    索尼旗下的PS5游戏主机相信很多游戏玩家在用,而此前有传闻称,索尼将推出PS5全新版本的游戏主机,据最新消息,索尼终于推出了的那款曝光已久可拆卸光驱版PS5主机。那么,PS5新机型什么时候发售呢?据悉,PS5新型号将于今年11月在…

    热点 2023年10月11日
    108
  • 道家典籍百度云合集(道家典籍)

    今天小编给各位分享道家典籍的知识,其中也会对道家典籍百度云合集进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧! 道家有那些经典名著? 道家名著有《道德经》、《庄子》、《列子》、《皇极经世》、《文子》、《田子》…

    热点 2023年5月10日
    130

发表回复

登录后才能评论