官方的Code Llama开源:免费商用,神秘版本接近GPT-4

GPT-4:在代码生成这块,你们依然是「弟弟」。

今日,meta 的开源 Llama 模型家族迎来了一位新成员 —— 专攻代码生成的基础模型 Code Llama。

作为 Llama2的代码专用版本,Code Llama 基于特定的代码数据集在其上进一步微调训练而成。

meta 表示,Code Llama 的开源协议与 Llama2一样,免费用于研究以及商用目的。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

相关论文《Code Llama: Open Foundation Models for Code》已经公布,足足有47页,作者有25位。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

论文地址:https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/

GitHub 地址:https://github.com/facebookresearch/codellama

Code Llama 系列模型有三个版本,参数量分别为7B、13B 和34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Code Llama 稳定支持了最高10万 token 的上下文生成。下图2为 Code Llama 的微调流程。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

就其效果来说,Code Llama 的不同版本在 Humaneval 和 MBPP 数据集上的一次生成通过率(pass@1)都可以超越 GPT-3.5。

另外,Code Llama 的「Unnatural」34B 版本在 Humaneval 数据集上的 pass@1接近了 GPT-4(62.2% vs67.0%)。meta 没有发布这个版本,但通过一小部分高质量编码数据的训练实现了明显的效果改进。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

这个特殊版本引起了很多人的注意,其中就有特斯拉前 AI 总监、回归 OpenAI 的 Andrej Karpathy。

文中虽然提到它是「在15000个 unnatural 指令上微调的 Code Llama-Python34B 版本」,但 Karpathy 仍然对这个「神秘的名称、模糊的描述、碾压其他的保密模型」感到很好奇。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

Code Llama 如何工作

Code Llama 编码能力非常强,它可以根据代码和自然语言提示生成代码(例如用户输入提示「帮我写一个输出斐波那契序列的函数。」) 它还可帮助用户进行代码补全和调试代码。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

三个参数版本的 Code Llama 模型都使用了500B 的代码 tokens 和代码相关数据进行训练。7B 和13B 基础和指令模型也经过了 FIM(fill-in-the-middle)训练,从而允许将代码插入到现有代码中,这意味着它们可以支持开箱即用的代码补全等任务。

下表为 Code Llama 的训练数据集。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

有了这三种模型,不同的服务和延迟要求都能得到满足。例如,7B 模型可以在单个 GPU 上运行;34B 模型能够返回最佳结果并提供更好的编码辅助,但就速度而言,较小的7B 和13B 模型速度更快,更适合低延迟任务,例如实时代码补全。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

Code Llama 不仅提供了多达100000个上下文 token 的稳定生成,所有模型的训练 token 序列也高达16000。

除了作为生成更长程序的先决条件外,拥有更长的输入序列也为 Code Llama 带来新的功能。例如,用户可以为模型提供来自他们代码库的更多上下文,以使生成的代码更相关。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

值得一提的是,meta 更进一步微调了 Code Llama 的两个附加变体:Code Llama – Python 和 Code Llama – Instruct。

Code Llama-Python 是 Code Llama 的一种变体,其在 Python 代码的100B token 上进一步微调。下表为 Code Llama-Python 的训练数据集。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

Code Llama – Instruct 是 Code Llama 的指令微调和对齐变体,能够更好地理解输入提示。meta 建议在使用 Code Llama 进行代码生成时使用 Code Llama – Instruct 变体,因为 Code Llama – Instruct 已经过微调,可以用自然语言生成有用且安全的答案。

meta 表示,他们不建议使用 Code Llama 或 Code Llama – Python 执行一般的自然语言任务,因为这两个模型都不是为遵循自然语言指令而设计的。Code Llama 专门用于特定于代码的任务,不适合作为其他任务的基础模型。

使用 Code Llama 模型时,用户必须遵守许可和使用政策。

Code Llama 性能如何

meta 使用了 Humaneval 和 MBPP(Mostly Basic Python Programming)两个编码基准进行测试。其中,Humaneval 测试模型基于文档字符串(docstrings)完成代码的能力,MBPP 测试模型基于描述编写代码的能力。

结果表明,Code Llama 的性能优于开源、特定于代码任务的 LLM,并且优于自家 Llama2。例如,Code Llama34B 在 Humaneval 上得分为53.7%,在 MBPP 上得分为56.2%,与其他最先进的开源解决方案相比是最好的,与 ChatGPT 相当。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

不过,Code Llama 也存在风险,meta 表示构建负责任地 AI 模型至关重要,他们在发布 Code Llama 之前采取了许多安全措施。作为红队测试工作的一部分,meta 对 Code Llama 生成恶意代码的风险进行了定量评估。他们创建了一些提示,以试图让模型生成恶意代码,并将 Code Llama 对这些提示的响应与 ChatGPT (GPT3.5Turbo) 进行比较。结果发现,Code Llama 的回答更安全。

由此看来,编码能力不是特别强的 Llama2,这个坑已被 Code Llama 填上了。meta 希望 Code Llama 的出现能够激励其他研究者基于 Llama2为研究和商业产品创建新的创新工具。

参考链接:

https://ai.meta.com/blog/code-llama-large-language-model-coding/

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年8月25日 15:12
下一篇 2023年8月25日 15:13

热点推荐

  • 自热火锅反应原理(自煮火锅什么原理)

    最近随着天气渐渐变冷,火锅也成为我们首选的美食,当然这事的,方便火锅更是受到很多人的宠爱,因为它真的是太方便了,不受时间地点的限制,不用火不用电,只需要加上一瓶凉水15分钟就能吃到热气腾腾的火锅!这种方便甚至于超过了方便面!一直以…

    2022年10月3日 热点
    179
  • 俄罗斯旅游攻略花费(俄罗斯旅游攻略)

    本文主要讲的是俄罗斯旅游攻略,以及和俄罗斯旅游攻略花费相关的知识,如果觉得本文对您有所帮助,不要忘了将本文分享给朋友。 去俄罗斯旅游要注意什么? 其实没那么多顾虑,就是你要学会一些日常的俄语,毕竟老毛子们会说英语的太少了。但是像莫…

    热点 2023年4月24日
    123
  • 龙珠超战斗力排名(龙珠超战斗力排行榜)

    转生史莱姆战斗力排行榜 妖族的“黑暗大帝”奇伊·库利姆索恩。代表傲慢,居住在北方大陆白冰宫最强的妖王(像魔兽世界里的巫妖王)。三大最古老恶魔之一(其实是最早的一个)。米莉姆·纳瓦,龙族“灭霸”。 TOP13:克雷曼 四百年前诞生的…

    热点 2023年9月28日
    280
  • 奔驰女辱骂市政工人“叫花子” ,官方:已依法处理

    22日,福建漳平市城市管理局、漳平市公安局发布情况通报,近日,一段“小车车主与施工作业工人发生争执”的视频在网上传播,引发网民关注。事发后,市城市管理局、市公安局等相关部门立即开展核查处置。经查,闽F7***S车主叶某(女,38岁…

    热点 2023年11月24日
    140
  • 比较内向的男孩适合什么工作(性格内向的人适合做什么工作)

    性格内向的人到底适合做什么? 不会说话、不会拍马屁、不会表达,实在是太难了。 别人口中的笑话 从没想过一个从没上过台,胆子小又容易紧张的人,有一天竟然能站在这三尺讲台上。 印象最深的是高二那年,班主任也就是我们的语文老师给了全班学…

    2022年10月5日 热点
    187
  • 10岁~12岁应该学国画吗?

    简要回答 中国有着很多的历史文化,其中在书法方面有着很丰富的历史。其中比较有名的就是国画,是一种可以装裱的卷轴画。而现今也会有很多孩子出于个人兴趣从而去学习一些技能来充实自己。所以学习国画没有应不应该,而是孩子的兴趣如何! 01 …

    热点 2022年12月3日
    142
  • 江西航空回应老太辱骂女子反被升舱:全是经济舱 没有升舱

    央广网南昌6月27日消息 近日,“老太太坐飞机强行换座被拒,疯狂辱骂年轻女子,反被升为商务舱”事件在网络上持续发酵,引起网友纷纷吐槽。6月26日晚,央广网记者独家采访涉事航空公司江西航空,了解相关情况,江西航空回应网友质疑:并不存…

    热点 2023年6月28日
    122
  • 曼谷百丽宫枪击案凶手成绩优异但沉迷游戏

    在枪击事件发生后,曼谷市区的一些旅游区域出现了一些安全问题,给本应愉快旅行的游客带来了不小的恐惧和伤害。这次事件的加害者竟然是一名未成年人,让人感到十分惊讶。 这个14岁的男孩来自一个优越的家庭,他的父亲是一名大学教师,受过良好的…

    热点 2023年10月7日
    115
  • 全国专科学校排行榜名单(全国专科学校排行榜)

    国内大专排名前十位的院校 1、黄河水利职业技术学院宗旨是为了培养高质量的技术技能人才,该学校在水利行业拥有非常出色的实力,在全国高职专科类大学排名中名列第一。王牌专业为大数据与会计。 2、深圳职业技术学院、山东商业职业技术学院、金…

    热点 2023年10月30日
    128
  • 李乃文和李小冉私下关系怎么样 李小冉结婚后有没有怀孕

    李乃文和李小冉的关系很好,两个人是搭档,他们也是朋友。他们都是实力派演员,合作起来也很默契。 他们合作过电视剧《美好生活》和《我们的日子》,他们是老搭档了。 李小冉要比李乃文小两岁,他们都是演员,李小冉是北京舞蹈学院毕业,而李乃文…

    热点 2023年5月8日
    161

发表回复

登录后才能评论