LLaMA核心原作多半离职，Meta AI内幕曝光！算力争夺撕破脸，大模型团队成员连换三轮

投稿号 • 2023年9月6日 18:13 • 热点 • 阅读 115

【新智元导读】meta内部上演了最戏剧性的一幕，算力短缺纷争不断，LLaMA核心作者超半数已经离职。甚至，连大模型开发团队进行了三轮重组，meta全力赶超谷歌微软的路还有多远?

过去6个月，ChatGPT的爆火，彻底让meta坐不住了。

从2月开始开源大模型系列LLaMA的发布，到Llama2升级、再到编码模型Code Llama，meta可谓是赌上所有去ALL IN AI。

在开源社区，Llama系列模型的免费研究和商用，直接点燃了平替模型裂变的火种。

可是，meta在风光的同时，AI团队正面临着离职潮。

The Information独家报道，因内部算力之争，LLaMA和OPT项目的团队成员，大半已经辞职。

甚至，meta直接弃掉他们正研发能与PaLM匹敌的模型，将meta AI的两个实验室团队重组，以专注研发Llama2。

meta大部分研究人员的离职，恰恰暴露了，算力短缺是布局生成式AI的核心难题。

LLaMA论文14位作者，一半离职

在外界看来，科技巨头拥有比大多数公司更多的计算资源。一些公司包括meta在内，在招聘AI研究人员时，一致强调自己是「GPU RICH」。

但事实上，自己心知肚明，meta的计算资源供应方面也存在限制。

由此，算力纷争便在内部团队开启，让许多人弃meta而去。

具体来讲，今年2月发布的初代LLaMA模型中的14位作者，已经超过一半的人全部离职。

有的转向AI初创公司，有的加入了科技巨头。

论文地址:https://arxiv.org/pdf/2302.13971.pdf

离开meta的研究科学家和工程师包括原LLaMA论文的作者之一Timothée Lacroix、Guillaume Lample和Marie-Anne Lachaux。

他们现在在法国初创公司Mistral AI工作，该公司由Lacroix和Lample于6月共同创办。

还有其中的一位作者——meta AI的研究总监Armand Joulin已经在5月离开了meta，目前已加入苹果。

meta人工智能研究实验室「基础AI研究」的负责人Joelle Pineau在接受采访时表示:

meta正在面临的离职潮，恰恰凸显了大型科技公司在应对对人工智能人才需求激增的挑战。

大模型浪潮当前，各大科技公司唯恐落后，急于将AI接入自家产品和服务。

Riviera Partners的高管Kyle Langworthy称，「求贤若渴」的公司们，都排着队想挖角meta的人工智能研究人员。

2月份的时候，继LLaMA的发布点燃社区热情后，小扎曾连夜对外官宣了公司的大动作:成立顶级产品团队，专注AIGC。

简言之，小扎将meta未来的核心重点放在，生成式人工智能，以试图追赶谷歌、微软、OpenAI等竞争对手。

而曾经在2021年All In的「元宇宙」，也被放在了次要的位置。

紧接着，meta时不时地发布并开源了在人工智能领域的最新研究，包括通用视觉模型SAM「分割一切」、多模态AI模型ImageBind、Llama2、Code Llama等等。

这些研究一经发布，都在开源社区引起了很大的反响，得到一致好评。

而现在，随着有经验的研究人员流失，meta在追赶竞争对手的路上多了一重阻碍。

那么，具体是怎么回事，让这些高级研究人员愤而离去?

LLaMA和OPT的算力之争

2013年，Yann LeCun入职meta后，担任AI研究主管时成立了人工智能研究实验室meta AI（原FAIR）。

除了在加利福尼亚州门洛帕克和纽约设立主要实验室（LeCun的所在地），meta AI还在蒙特利尔(Pineau的所在地)、巴黎、伦敦和西雅图设有分部。

meta AI实验室的成立，主要致力于AI的研究，将人工智能应用在翻译、MRI扫描等各种场景。

但是，ChatGPT横空出世之后，公司的高管们对AI更深层次融入产品的要求，变得更加急切。

其实，在ChatGPT发布之前，meta也一直在开发自己的LLM。

2022年5月，meta AI的一个北美团队对外公布，并开源了大模型OPT-175B。

meta声称，这个模型的能耗要比GPT-3低，尽管这两个模型在训练期间学习的内容，在数量上是一样的。

几个月后，该团队开始着手开发第二个更大的模型，旨在与谷歌的PaLM竞争。

与此同时，另一个位于巴黎的meta AI团队，已经开始着手开发一个单独的大型语言模型，也就是LLaMA。

知情人士表示，这个模型比OPT要小。研究团队认为较小的模型在推理时会高效。

随之问题就来了，分别来自北美和巴黎两个实验室的团队，开启了获取算力资源之争，进而加剧了内部团队的纷争。

尤其是，LLaMA团队感觉自己被忽视了，自己的模型小，但获得的计算资源比北美的OPT团队少的多。

「基础AI研究」的负责人Joelle Pineau表示，

如果meta AI的员工就分配发生争议，就会提交到上级，也就是Pineau这一层去处理。

在采访中，Pineau承认在LLaMA和OPT团队之间在算力分配上有些紧张，并补充道，「我们试图找到一条路，听取每个人的发声，即使无法去满足每个人的需求。」

对某些研究人员来说，这感觉像是一场竞赛。

meta AI的一些高管也在质疑，为什么两个团队都做着相似的项目，但又互相竞争有限的资源。

2月巨变

两个团队之间的紧张关系，到今年2月达到了高潮。

恰在这个月，为了追赶竞争对手，meta AI首次将LLaMA作为开源模型发布，授权用于研究目的。

其实，在发布的前一周，meta AI的联合主管兼巴黎分部负责人Antoine Bordes就离开了meta，而对外的离职原因是⼯作时间与加州⼀样让自己筋疲⼒尽。

现在，Bordes已经加入了人工智能公司Helsing。

知情人士表示，他的离职进一步，让LLaMA团队与北美的高管隔离开来。另外，Pineau也承认了Bordes的离职为团队「带来了一些不确定性」。

这不仅仅是LLaMA团队研究士气受挫的问题，与此同时，OPT团队在过去几个月里，一直也在面临人员流失的问题。

据称，OPT团队正在研发的更大型的模型，直接被meta放弃。也不难理解，OPT的人员流失，和这个决定有着直接的关系。

根据研究作者linkedin个人资料，19位OPT论文的作者中，也有一半人已离职meta。

论文地址:https://arxiv.org/pdf/2205.01068.pdf

「基础AI研究」的负责人Pineau无奈地表示，「当所有团队都想在这个时候升级模型，那时你要么选择其中一个，要么就让他们合作。」

团队重组，定位不清

在这一切发生的同时，meta AI也被公司的频繁地变动搞得焦头烂额。

自从去年11月开始，小扎进行了数次全公司范围的裁员。其中，meta AI也没能幸免。

今年2月，meta AI领导人决定将相互竞争LLaMA和OPT团队的一些成员聚集起来，正式成立「生成式AI」团队，（由前苹果高管Ahmad Al-Dahle负责），同时也从meta AI抽调了大量人员。

其实，我们在Llama2论文中，可以看到不少LLaMA和OPT作者的身影。

比如OPT的团队中，Moya Chen、Todor Mihaylov、Punit Singh Koura加入「生成式AI」团队。

初代LLaMA团队中，Hugo Touvron、Thibaut Lavril、Xavier Martinet、Marie-Anne Lachaux、Naman Goyal、Aurelien Rodriguez加入「生成式AI」团队。

有趣的是，在Llama2的致谢中，提到的4位最先发起这项研究的团队，其中三位已经离职，目前仅有Edouard Grave还在。

尽管备受赞誉的开源模型LLaMA取得了不小的成功，但随着meta对人工智能研究态度的不断变化，研究人员之间的紧张关系仍在酝酿。

传统上来讲，meta AI拥有一种由研究人员主导的自下而上的文化，从而使团队能够专注于AI领域，并取得突破性的进展。

但随着小扎越来越倾向于将AI融入meta的应用程序之中，meta AI的关注点也随之缩小——解散了那些不以产品为导向的研究，比如蛋白质折叠。

与此同时，新的项目也在生成式AI团队和meta AI之间「反复横跳」。

比如，meta在7月发布的Llama2，以及在8月发布的专攻代码生成的Code Llama，就是分别由两个团队负责的。

对此，Pineau表示，「这个领域发展得实在是太快了，我们现在还在探索，哪个项目应该由meta AI来负责?哪个项目又该由生成式AI团队来负责?」

台前，开源模型光鲜靓丽，而幕后，AI研究人员离职潮涌、算力纷争、团队重组，为meta倾力AI赶超对手带来了许多不确定性因素。

参考资料:

https://www.theinformation.com/articles/inside-metas-ai-drama-internal-feuds-over-compute-power?rc=epv9gi

声明：本文内容整理自网络，观点仅代表原作者本人，投稿号仅提供信息发布服务。如有侵权，请联系管理员。

0 0

关于作者

投稿号

36.9K 文章

0 评论

0 粉丝

这个人很懒，什么都没有留下～

带你穿越清明上河图！DragNUWA惊艳亮相：一拖一拽让静图秒变视频

上一篇 2023年9月6日 18:13

ChatGPT上线“论文神器”插件！无需关键字即可搜索2亿文章，链接绝对保真

下一篇 2023年9月6日 18:13

热点
请问大写的壹贰叁到十整怎么写？
大写的壹贰叁到十整写法为：壹、贰、叁、肆、伍、陆、柒、捌、玖、拾。大写数字是中国特有的数字书写方式，利用与数字同音的汉字取代数字，以防止数目被涂改。据考证，大写数字最早是由武则天发明，后经朱元璋改进完善。大写的壹贰叁到十整写法为…
投稿号
热点 2023年5月8日
1950
热点
女子被孩子气哭哭着给母亲打电话弟弟、弟媳上门“撑腰”
据潇湘晨报最新消息，11月4日，河南开封，女子带三个孩子被气哭打电话和母亲哭诉，弟弟、弟媳立马上门“撑腰”。刘女士称，当天让孩子们洗完澡去写作业，孩子们却躺在沙发上玩手机，说他们还回嘴，自己被气哭和母亲打电话诉委屈，弟弟和弟媳得…
投稿号
热点 2023年11月6日
1020
热点
手机铃声英文排行榜前十名2023(手机铃声英文排行榜)
有什么好听的英文铃声男生唱的 1、《1492征服日堂》（英文全称：《1492 conquest of paradise 》）是一首世上名曲，本作品属于《1492 conquest of paradise 1492征服日堂/哥伦布传…
投稿号
热点 2023年12月26日
1250
热点
又上热搜！张雪峰称国内考试卷考生留学卷家庭网友点赞大实话：本人无奈
快科技12月13日消息，据国内媒体报道称，张雪峰在一考研冲刺讲座演讲时称，参加国内升学考试，卷的是考生个人。在张雪峰看来，国内考研非常卷，最主要的原因是评价体系相对来讲比较单一，国内考大学也很卷，考大学的评价标准就是成绩，因为其…
投稿号
热点 2023年12月14日
1240
热点
请问路由器哪个牌子最好信号最稳定？
市面上好用的路由器有tp-link、华三、水星、腾达、华为、360、小米、友讯、Fast等，可以根据自己的预算和带宽选择合适的路由器。如果房间很大的话可以尝试购买分布式路由器，这个是有一个作为主要端口连接网线，然后其他的就会连接到…
投稿号
热点 2022年12月7日
1310
热点
网络语言rbq什么意思？
对于“rbq”这个词有很多种解释，正常一点解释就是“惹不起”。还有一层深层比较有内涵的意思就是“肉便器”，指可以任人随意发泄性欲的人。与妓女的差别在于，肉便器显得更卑微，更可以任人摆布，像器具一样。对于“rbq”这个词，各位可能…
投稿号
热点 2023年5月9日
1580
热点
肖战新电影将上线，这次都在酒里，《射雕》不远
肖战新电影将上线，这次都在酒里，《射雕》不远。肖战和贾樟柯合作的微电影即将上线，这无疑是一件令人期待的事情。在这部微电影中，肖战将再次展现他的演技和魅力，而贾樟柯则将用他的镜头语言呈现出不一样的故事和情感。青岛啤酒，作为中国最具…
投稿号
热点 2023年7月18日
1150
热点
原帅23分拿到全明星三分球大赛冠军，不服不行
原帅23分拿到全明星三分球大赛冠军，不服不行 2022年CBA全明星正赛，南方全明星队100-88战胜北方全明星队，连续五届赢下全明星正赛，赵睿再度荣膺MVP。今年我最关注的是明星赛三分大赛决赛，我想看看CUBA历史三分王邬挺嘉…
投稿号
热点 2022年12月4日
1790
热点
张嘉倪杨蓉的好皮肤全靠“以油养肤”？用对方法，养出清透少女肌
这两年流行“以油养肤”，作为现在最火的保养方法之一，用过的有惊叹好用的：“皮肤不干了，更亮更滋润，屏障功能也增强了。”这其中就包括不少女明星，比如张嘉倪就在社交平台上分享过，自己会在秋冬季节日常的护肤步骤中，添加一些美容油，增加滋…
投稿号
热点 2023年12月15日
1080
热点
夏威夷大火约1300人失踪目前搜救工作仍在进行
据美媒报道，夏威夷州毛伊岛大火的死亡人数已经上升至99人。夏威夷州长格林预计在未来几天内死亡人数还将大幅增加。这场火灾被认为是美国一个多世纪以来最为致命的火灾之一。格林表示，这次火灾是夏威夷历史上最严重的自然灾害，恢复工作将需要…
投稿号
热点 2023年8月15日
1180

发表回复

登录后才能评论

LLaMA核心原作多半离职，Meta AI内幕曝光！算力争夺撕破脸，大模型团队成员连换三轮

关于作者

热点推荐

发表回复