重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

【新智元导读】OpenAI再次开源,是科技大厂的「施舍」还是开源社区的「救赎」?

就在刚刚,根据The Information的最新爆料,OpenAI即将发布一款全新的开源大语言模型。

虽然目前还不清楚,OpenAI是不是打算利用即将开源的模型,来抢占Vicuna或其他开源模型的市场份额。

但几乎可以肯定的是,新模型的能力大概率无法与GPT-4甚至GPT-3.5相竞争。

毕竟,270亿美元的估值也决定了,OpenAI最先进的模型将会被用于商业目的,尽管前两个版本的GPT都是开源的。

对此,OpenAI的发言人没有回应置评请求。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

羊驼家族开源大爆发

十天前,谷歌的一份内部文件泄漏。在这篇名为《我们没有护城河,OpenAI也没有》的文章里,作者沉痛控诉了开源对于谷歌和OpenAI的沉重打击。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

的确,在这次军备竞赛中,谷歌和OpenAI似乎都不是赢家,因为开源社区正在吃掉属于它们的「利益」。

ChatGPT一出,引爆了全球的LLM革命。然而,OpenAI不Open,很多公司和开发者只能看着干着急。

此时,meta站出来发布了LLaMA,为全世界开发者谋了一把福利。

本来呢,meta承诺的是LLaMA会对非商用的研究用例开源,可是谁能想到,仅在发布一周后,LLaMA的权重忽然在4chan上泄漏了,瞬间就引发了数千次下载。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

这场「史诗级泄漏」,直接让开源LLM领域变了天。短短几周内,各种ChatGPT平替就以迅雷不及掩耳之势呈爆炸式增长。

Alpaca、Vicuna、Koala、ChatLLaMA 、FreedomGPT、ColossalChat……简直堪称是「羊驼家族」大爆炸。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

其实,早在羊驼之前,开源模型就曾破灭过OpenAI的野心。

当时,刚刚发布的Dall-E2凭借着惊艳的文生图效果,在网上引起了不小的轰动。

然而,当OpenAI还在试图兜售API时,一款开源替代突然横空出世——Stable Diffusion。

随着Stable Diffusion的迅速崛起,Dall-E2也很快就被开发者们抛在了脑后。

开源大模型,要颠覆硅谷大厂?

UC Berkeley的计算机教授Ion Stoica正是使用meta的研究开发Vicuna的学者之一。

为了提高Vicuna的能力,Stoica和同事们正在努力增加模型中的计算数量,这将有助于处理涉及推理的任务,比如写代码。

开发Vicuna的是一个伯克利的团队,每年的预算为数百万美元,其中大约50万美元来自包括微软、谷歌和亚马逊在内的上市公司。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

UC Berkeley的计算机教授Ion Stoica表示,现在的免费AI模型,在性能上已经「相当接近」谷歌和OpenAI的专有模型了,毫无疑问,大多数开发者最终都会选择免费模型。

一方面,开源模型可以让开发者使用自己的数据来解决特定的问题。

另一方面,像Vicuna这种模型的训练成本甚至可以低至几百美元,而且还不用向大厂支付昂贵的使用费。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

https://lmsys.org/blog/2023-03-30-vicuna/

如果Stoica的看法正确,开源AI必将颠覆谷歌、OpenAI、微软等出售专有模型使用权的大厂的商业计划。

Vicuna的质量和开源AI的寒武纪大爆发,让谷歌工程师Luke Sernau警告同事,谷歌在努力追赶OpenAI时,太过关注专有软件了。

这份备忘录迅速在整个行业内引起了共鸣——即使Sernau或许高估了开源AI的能力,低估了它们的成本和风险,但大多数从业者都同意,meta非常有可能从中获益。

比如,meta在内部会使用AI模型进行内容推荐和广告定位,当开发者改进meta的模型时,meta就可以把这些改进纳入自己内部的AI。

meta CEO小扎对此筹谋已久。

4月,在他与分析师的一次电话会议中,他曾这样谈到公司的策略——

谷歌倒是没有完全采用专有的方式来处理AI软件。

早在2020年,谷歌就发布了一个开源语言模型T5,让开发者可以构建能够执行翻译和摘要任务的软件。随后,谷歌又发布了一个更先进的Flan-T5。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

但是,根据Stoica和其他从业者的说法,meta发布的软件能够在谷歌模型的基础上做出显著改进,这让开发者选择meta模型的可能性大大增加了。

不过,Stoica表示,谷歌在开源软件方面仍有两个优势。

1. 如果谷歌利用其不向外部开放的用户数据,模型在某些专业领域(如内容推荐)的表现可能会更好。

不过,谷歌发言人表示,公司并没有在现有用户数据上训练其基础模型。

2. 搜索公司在管理大规模计算机基础设施方面的专长,意味着它能够以更低的成本来运行模型,包括为云客户提供服务。

与此同时,OpenAI在收集数百万人与ChatGPT互动方式的数据上,已经抢得了先机,这会更有助于OpenAI改进AI软件,更不用提它和微软的合作协议。

开源的繁荣,是大厂的「施舍」?

不过,这种建立在开源基础上的繁荣,是不稳定的。

目前大多数的开源,仍然依赖于资金雄厚的大公司发布的巨型模型。如果OpenAI和meta决定关闭业务,繁荣的开源社区,可能就会变得萧条。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

比如,现在许多开源平替是基于meta的LLaMA构建的。

而其他模型使用的是名为Pile的大型公共数据集,由开源非营利组织EleutherAI整理。

EleutherAI之所以存在,是因为OpenAI的开放性意味着一群开发者能够逆向了解GPT-3是如何制作的,然后在空闲时间里创建自己的模型。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

但一切都可能改变。

OpenAI已经不再Open,meta也在考虑限制开源,防止初创公司利用开源代码做坏事。

meta AI的执行董事Joelle Pineau表示,现在向外部人员开放代码是正确,但他并不确定,在未来五年内meta还会采用相同的策略。

如果这种Close的趋势继续下去,那么不仅开源社区会被抛弃,下一代的AI突破也会重新回到那些最大、最不差钱的AI实验室手中。

显然,AI大模型的制造和使用方式的未来,正处于一个十字路口。

如果OpenAI曾经吝啬,就不会有如今的开源盛况

其他人也在权衡,这种开源的自由竞争带来的回报更大,还是风险更大。

就在meta AI发布LLaMA的同时,Hugging Face推出了一个门禁机制,下载平台上的模型之前,用户必须申请访问并获得批准,这是为了限制那些有合法理由的人。

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

「我并不是一个开源的布道者,」Hugging Face的首席伦理科学家Margaret Mitchell说。「我能看到不开源的意义。」

大模型广泛使用的一个弊端,就是可能造成AI色情产品的泛滥。

Mitchell曾在谷歌工作,并创立了AI道德团队,她对于模型被滥用的风险十分了解。因此,她赞成meta AI以有控制的方式发布模型。

同时,OpenAI也在关闭水龙头。GPT-4发布时,并没有公布架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等细节,理由是「鉴于像GPT-4这样的大规模模型的竞争格局和安全影响」。

这种限制反应了OpenAI心态上的变化。联合创始人兼首席科学家Ilya Sutskever表示,OpenAI过去的开放性是一个错误。

OpenAI的政策研究员Sandhini Agarwal说:「以前,如果某样东西是开源的,也许一小群修理工会关心。但现在,整个环境已经改变。开源真的可以加速发展,导致竞争。」

时间倒回三年前,如果OpenAI在公布GPT-3的细节时,就秉持着同样的原则,那就不会有EleutherAI的出现,也就不会有蓬勃的开源创新。

今天,EleutherAI在开源生态系统中发挥着举足轻重的作用。Pile被用来训练多个开源项目,包括Stability AI的StableLM。

但随着GPT-4、5、6被锁死,开源社区可能会再次被落在几家大公司后面。

他们会困在上一代模型中,如果想取得进步,只能闭门造车。

参考资料:

https://www.technologyreview.com/2023/05/12/1072950/open-source-ai-google-openai-eleuther-meta/

https://www.theinformation.com/articles/open-source-ai-is-gaining-on-google-and-chatgpt

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2023年5月16日
下一篇 2023年5月16日

热点推荐

  • 哈基米是什么网络用语(哈基米是什么歌曲里的)

    最近网上又有不少新的梗火了,其中哈基米这个梗在抖音等各大平台中人气也是非常高的,大家对这个梗十分好奇。哈基米是什么网络用语,大家对哈基米到底是什么意思也是好奇不断,据悉在抖音很多视频中都可以听到关于哈基米的背景歌曲,下面来看下关于…

    2023年5月27日
    460
  • 美国经济总量是多少_美国经济总量

    美国经济第几 排名第一的经济体是美国,其GDP为294万亿美元,同比增长6%,比第二名的中国和第三名的日本加起来的总和还要多。 世界经济大国前十排名分别是:美国、中国、日本、德国、印度、英国、阿联酋、法国、意大利、巴西。 总之,根…

    2023年6月18日
    460
  • 网络企业品牌推广的思路和措施(网络怎么推广)

    网络怎么推广(网络企业品牌推广的思路和措施) 三、B2B企业信息推广 B2B是企业与企业之间进行数据信息的交换、传递,开展交易活动的商业模式,它将企业内部网和企业的产品及服务,通过 B2B 网站或移动客户端与客户紧密结合起来,通过…

    2022年10月12日
    890
  • 医院非法采血致患者感染艾滋病 患者死亡后家属获赔近80万

    【医院非法采血致患者感染艾滋病确诊18年后死亡获赔近80万】近日,辽宁葫芦岛中级人民法院审结一起医疗损害责任纠纷案件。张某就医时因医院非法采血感染艾滋病,确诊18年后感染新冠病毒死亡。一审法院认为,张某死亡,其感染艾滋病占有主要因…

    2023年7月19日
    400
  • 刺身是什么意思 刺身怎么吃

    刺身是日本料理中最具特色的美食,是将新鲜的鱼贝类生切成片,蘸调味料直接食用的鱼料理。   古时日本北海道渔民在供应生鱼片时,由于去皮后的鱼片不易辨清种类,故经常会取一些鱼皮,用竹签将鱼皮刺在鱼片上,以方便大家识别。这刺在鱼片上的竹…

    2023年6月5日
    450
  • 老师乘凉却让5名幼儿暴晒罚站? 已对教师通报批评

    5月19日,市民称蚌埠一幼儿园内5名小朋友在太阳下罚站,老师一旁乘凉。园方回应其他媒体称老师在让孩子拍球。教体局称因孩子做操不规范让他们重做,已对教师通报批评。

    2023年5月20日
    540
  • 七月七给情人发多少红包(七月七日给情人送啥礼物)

    对于七夕情人节大家还是有非常多的问题想要咨询的,其中关于七夕情人节这一天表白红包应该怎么发也是最多人在问的。七月七给情人发多少红包?不同的红包数字寓意也是不一样的,比如520元红包寓意我爱你,下面给大家分享适合七夕节发给情人的红包…

    2023年8月21日
    410
  • 央视中秋晚会:周冬雨王一博同台唱歌,檀健次毛晓彤热舞!

    9月10日,是传统节日中秋节。作为传统佳节,定然少不了各种节目,最受网友们关注的自然是央视的中秋晚会。这次的央视中秋晚会请来的艺人也有很多明星加盟,有李玉刚、尚雯婕、李荣浩、谭维维、王一博、李克勤等等。央视的晚会依然是如此地有诗情…

    2022年9月11日 热点
    830
  • 唐朝是怎么灭亡的?有那么多内幕,他最昏庸!

    盛极一时的唐朝是如何灭亡的,他的惨烈程度到哪样?似乎都成了后世的“楷模”。安史之乱后的唐朝已经没有了什么实权,特别是到了唐朝最后的几十年,皇帝几乎都是节度使和宦官的玩物,可以随意处置。唐朝就是这样被这两股势力一点点的蚕食掉,而走向…

    2022年12月15日 热点
    680
  • 首艘国产大型邮轮完成首次海上试航

    图为正在进行首次海上试航的首艘国产大型邮轮。徐晨辉 陆佳骏摄影报道(人民视觉) 本报上海7月25日电 (记者方敏)24日,首艘国产大型邮轮在拖轮的牵引下,缓缓靠泊于中国船舶集团有限公司旗下上海外高桥造船有限公司的4号码头,圆满完成…

    2023年7月26日
    390