官方的Code Llama开源:免费商用,神秘版本接近GPT-4

GPT-4:在代码生成这块,你们依然是「弟弟」。

今日,meta 的开源 Llama 模型家族迎来了一位新成员 —— 专攻代码生成的基础模型 Code Llama。

作为 Llama2的代码专用版本,Code Llama 基于特定的代码数据集在其上进一步微调训练而成。

meta 表示,Code Llama 的开源协议与 Llama2一样,免费用于研究以及商用目的。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

相关论文《Code Llama: Open Foundation Models for Code》已经公布,足足有47页,作者有25位。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

论文地址:https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/

GitHub 地址:https://github.com/facebookresearch/codellama

Code Llama 系列模型有三个版本,参数量分别为7B、13B 和34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Code Llama 稳定支持了最高10万 token 的上下文生成。下图2为 Code Llama 的微调流程。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

就其效果来说,Code Llama 的不同版本在 Humaneval 和 MBPP 数据集上的一次生成通过率(pass@1)都可以超越 GPT-3.5。

另外,Code Llama 的「Unnatural」34B 版本在 Humaneval 数据集上的 pass@1接近了 GPT-4(62.2% vs67.0%)。meta 没有发布这个版本,但通过一小部分高质量编码数据的训练实现了明显的效果改进。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

这个特殊版本引起了很多人的注意,其中就有特斯拉前 AI 总监、回归 OpenAI 的 Andrej Karpathy。

文中虽然提到它是「在15000个 unnatural 指令上微调的 Code Llama-Python34B 版本」,但 Karpathy 仍然对这个「神秘的名称、模糊的描述、碾压其他的保密模型」感到很好奇。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

Code Llama 如何工作

Code Llama 编码能力非常强,它可以根据代码和自然语言提示生成代码(例如用户输入提示「帮我写一个输出斐波那契序列的函数。」) 它还可帮助用户进行代码补全和调试代码。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

三个参数版本的 Code Llama 模型都使用了500B 的代码 tokens 和代码相关数据进行训练。7B 和13B 基础和指令模型也经过了 FIM(fill-in-the-middle)训练,从而允许将代码插入到现有代码中,这意味着它们可以支持开箱即用的代码补全等任务。

下表为 Code Llama 的训练数据集。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

有了这三种模型,不同的服务和延迟要求都能得到满足。例如,7B 模型可以在单个 GPU 上运行;34B 模型能够返回最佳结果并提供更好的编码辅助,但就速度而言,较小的7B 和13B 模型速度更快,更适合低延迟任务,例如实时代码补全。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

Code Llama 不仅提供了多达100000个上下文 token 的稳定生成,所有模型的训练 token 序列也高达16000。

除了作为生成更长程序的先决条件外,拥有更长的输入序列也为 Code Llama 带来新的功能。例如,用户可以为模型提供来自他们代码库的更多上下文,以使生成的代码更相关。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

值得一提的是,meta 更进一步微调了 Code Llama 的两个附加变体:Code Llama – Python 和 Code Llama – Instruct。

Code Llama-Python 是 Code Llama 的一种变体,其在 Python 代码的100B token 上进一步微调。下表为 Code Llama-Python 的训练数据集。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

Code Llama – Instruct 是 Code Llama 的指令微调和对齐变体,能够更好地理解输入提示。meta 建议在使用 Code Llama 进行代码生成时使用 Code Llama – Instruct 变体,因为 Code Llama – Instruct 已经过微调,可以用自然语言生成有用且安全的答案。

meta 表示,他们不建议使用 Code Llama 或 Code Llama – Python 执行一般的自然语言任务,因为这两个模型都不是为遵循自然语言指令而设计的。Code Llama 专门用于特定于代码的任务,不适合作为其他任务的基础模型。

使用 Code Llama 模型时,用户必须遵守许可和使用政策。

Code Llama 性能如何

meta 使用了 Humaneval 和 MBPP(Mostly Basic Python Programming)两个编码基准进行测试。其中,Humaneval 测试模型基于文档字符串(docstrings)完成代码的能力,MBPP 测试模型基于描述编写代码的能力。

结果表明,Code Llama 的性能优于开源、特定于代码任务的 LLM,并且优于自家 Llama2。例如,Code Llama34B 在 Humaneval 上得分为53.7%,在 MBPP 上得分为56.2%,与其他最先进的开源解决方案相比是最好的,与 ChatGPT 相当。

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

不过,Code Llama 也存在风险,meta 表示构建负责任地 AI 模型至关重要,他们在发布 Code Llama 之前采取了许多安全措施。作为红队测试工作的一部分,meta 对 Code Llama 生成恶意代码的风险进行了定量评估。他们创建了一些提示,以试图让模型生成恶意代码,并将 Code Llama 对这些提示的响应与 ChatGPT (GPT3.5Turbo) 进行比较。结果发现,Code Llama 的回答更安全。

由此看来,编码能力不是特别强的 Llama2,这个坑已被 Code Llama 填上了。meta 希望 Code Llama 的出现能够激励其他研究者基于 Llama2为研究和商业产品创建新的创新工具。

参考链接:

https://ai.meta.com/blog/code-llama-large-language-model-coding/

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2023年8月25日
下一篇 2023年8月25日

热点推荐

  • 洛阳发布高温红色预警!涉及这6个区

    洛阳市气象台7月8日7时55分发布高温红色预警信号:预计未来24小时老城区、西工区、瀍河区、涧西区、洛龙区、伊滨区最高气温将升至40℃以上,请注意防范。 防御指南: 1.政府及相关部门按照职责采取防暑降温应急措施,保障生产、消防、…

    2023年7月8日
    510
  • 环保也要做成分党,年轻人是怎么想的?

    题图|视觉中国曾经,很多年轻人都觉得捡破烂这件事有点丢人,是无业游民的生计,或是退休大妈们不得已的“运动”;而如今,捡破烂已经成为年轻人的生活艺术。在豆瓣小组“捡垃圾即是艺术”有6万多名成员,还有了专有名词叫“stooping…

    2022年10月21日 热点
    760
  • 余温他却喜欢过门什么意思(余温他却喜欢过门什么意思)

    最近一段时间抖音上悬溺这首歌非常火爆,很多短视频都是使用这首歌当背景音乐,其中有一句歌词是余温他却喜欢过门,那么余温他却喜欢过门什么意思?余温他却喜欢过门表达什么感情?下面小编为大家带来余温他却喜欢过门含义介绍,感兴趣的小伙伴一起…

    2023年9月7日
    510
  • 网易起诉暴雪退还3亿元:涉及国服玩家退款、未售游戏商品等

    驱动中国2023年4月24日消息,近日,上海网之易网络科技发展有限公司就暴雪娱乐有限公司违反系列许可协议在上海提起诉讼,要求退还3亿欠款。 该款项包括网之易已全额支付的《魔兽世界》等停服游戏相关退款、未售游戏商品库存的预付款项、数…

    2023年5月11日
    560
  • 最受欢迎十大游戏(最受欢迎游戏排名)

    steam2022年度最佳游戏排行2022年度最受欢迎游戏榜单排名 植物大战僵尸2童话森林是2022年最新推出的一个全新玩法steam游戏模式,独特的童话植物以及僵尸形象都汇聚一堂,经典放置的塔防玩法,更加刺激和紧凑的闯关节奏!重…

    2023年7月17日
    510
  • 《三体》动画首播播放量破亿,但国民IP也面临“口碑两极分化”

    搜狐娱乐讯(胡图图/文)“宇宙很大,生活更大。”昨日(12月10日),国民级IP《三体》动画正式上线。目前,该动画累计播放量已经破亿,堪称近年来破亿动作最快的动画,也是某平台投资成本最高、制作体量最大的作品。 《三体》动画是根据作…

    2022年12月12日
    730
  • 男子民政局大厅内疯狂殴打妻子,警方赶到,监督两人办理离婚手续

    近日,江苏盐城有网友爆料称,在民政局一男子疯狂的殴打妻子,而后工作人员前去劝阻,但是男子始终根本不听劝,无奈之下,工作人员只能选择报警,警方达到之后,监督两人办理了离婚手续,随后两人离开了。 在如此青天白日、大庭广众之下,男子竟然…

    2023年7月13日
    490
  • “你的头发影响了你80%的颜值”:康王创始人87岁再出山,挑战5天不洗头!

    author:美姐精挑细选头发影响女人气质!长得漂亮、穿得好看都没用,一旦油头有头皮屑,只会让人觉得邋遢。更致命还显头秃加脸大:这个时候一款好的洗发水就必不可少了!过去我们总是说“外国的月亮比较圆”,平时咱们粉丝随便逛个超市,都会…

    2022年10月7日 热点
    940
  • 亲荐几座“活着的古城”,居游合一、游居共享,虽小众却意义重大

    《唐宫夜宴》中那些唐俑装扮的舞者,还有博物馆里Q萌可爱的文创雪糕……似乎让古迹和文物“活”起来,对于文化的传承和城市魅力的提升更具影响力和号召力。最现实的例子就是那些“居游合一”的斑驳古城,想必对于热爱旅游的你来说一定不陌生。 正…

    2022年10月22日
    920
  • 新手爬山需要注意什么

    简要回答 爬山受到了众多小伙伴的青睐,因为人们在爬山的过程中,可以远离城市的喧嚣,也可以适当的释放身心。不过在爬山的时候,也需要多加注意,特别是新手朋友。要是新手朋友之前没有爬过山,一定要适量的运动。 01 毕竟爬山需要足够的体力…

    2023年7月21日
    500