LLM-Adapters:将各种适配器集成到大型语言模型中

投稿号(tougaohao.com)8月17日 消息:来自新加坡科技设计大学和新加坡管理大学的研究人员发布了一篇题为《LLM-Adapters: An Adapter Family for Parameter-Efficient Fine-Tuning of Large Language Models》的论文。该论文介绍了一种名为 LLM-Adapters 的适配器系列,用于大型语言模型的参数高效微调。该适配器系列可在不影响模型性能的情况下减少微调所需的参数数量,从而提高微调效率。

LLM-Adapters:将各种适配器集成到大型语言模型中

代码:https://github.com/AGI-Edgerunners/LLM-Adapters

LLM-Adapters 框架包含了最先进的开放访问大型语言模型,如 LLaMA、BLOOM、OPT 和 GPT-J,以及广泛使用的适配器,具体如下:

1、串联适配器(Series Adapter):在每个Transformer块的多头自注意力层和前馈层后串联地添加瓶颈前馈层,如图1(a)所示。

LLM-Adapters:将各种适配器集成到大型语言模型中

2、并行适配器(Parallel Adapter): 如图1(b)所示,将瓶颈前馈层与每个Transformer层的多头自注意力层和前馈层并行地集成。

LLM-Adapters:将各种适配器集成到大型语言模型中

3、LoRA:如图1(c)所示,向现有层中注入低秩可训练矩阵,实现参数高效微调。

LLM-Adapters:将各种适配器集成到大型语言模型中

LLM-Adapters框架设计在研究、efficient、模块化和可扩展方面表现良好,允许集成新的适配器和用新的更大规模的语言模型进行评估。

为了评估 LLM-Adapters 中的适配器的有效性,作者在6个数学推理数据集上进行了实验。实验结果表明,在简单的数学推理任务上,使用较小规模语言模型的参数高效微调仅需要很少的可训练参数,就能达到强大语言模型在零样本推断中可比的性能。总体而言,LLM-Adapters 框架提供了一个有希望的框架来微调大型语言模型用于下游任务。

核心功能:

适配器集成:将各种适配器(如 LoRA、AdapterH、AdapterP、Parallel)集成到 LLMs 中,提供灵活的模型适配能力。

参数高效微调:使用适配器进行参数高效微调,减少参数量,节省训练时间和计算资源。

支持多种任务:适用于各种 NLP 任务,如语言生成、问答、机器翻译等。

提供预训练模型:集成了 LLaMa、OPT、BLOOM 和 GPT-J 等最先进的预训练模型,可直接使用。

简化模型训练和推理:提供训练和推理代码示例,简化模型训练和推理流程。

LLM-Adapters 是一个强大的工具,可帮助用户快速搭建和优化大型语言模型,并在各种 NLP 任务上取得优秀的性能。

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年8月17日 18:06
下一篇 2023年8月17日 18:14

热点推荐

  • 飞机选座最佳位置(飞机选座图解)

    一、B737 来自B-5768 隶属于南航贵州分公司 有个人PTV 收纳在座椅的扶手里 清晰度真的是感人 360p都算不上的直视感 座椅扶手还有设置USB接口 PTV的控制手柄也很复古 只能实现调节音量等按钮操作 非触控 来自B-…

    2022年10月9日 热点
    158
  • 郎平微博女排精神(郎平微博)

    本文主要讲的是郎平微博,以及和郎平微博女排精神相关的知识,如果觉得本文对您有所帮助,不要忘了将本文分享给朋友。 女排朱婷昨日起诉造谣者,让我们来看看是怎么回事儿 1、是因为有五名网友捏造事实,对国家运动员进行语言攻击,情节较为严重…

    热点 2023年6月13日
    121
  • 陆正耀再战咖啡市场(陆正耀再战咖啡市场 首店9块9一杯)

    不难发现,在现如今的咖啡市场中,除了一部分专精做咖啡的独立咖啡馆之外,已经很少有只做咖啡的咖啡品牌了,包括星巴克、喜茶在内的一众咖啡品牌,要么是咖啡加餐饮模式的咖餐厅,要么是像星巴克这样的咖啡、茶饮、轻食甜点为一体的咖啡厅。 当然…

    热点 2022年10月24日
    192
  • 很突然!他在睡梦中去世……

    很突然!他在睡梦中去世 …… 今天一早,多家外媒报道了曾出演过《绝命毒师》等多部美剧的美国男演员迈克·巴塔耶Mike Batayeh去世的消息。 根据他的讣告, Mike Batayeh是在当地时间6月1日在其密歇根州的家中,因突…

    2023年6月11日 热点
    129
  • 帅小伙淡定走出考场:随便考考

    【196cm帅小伙淡定走出考场:随便考考,我已被录取了!身份不简单】6月7日,安徽马鞍山。一名考生淡定走出高考考场,面对镜头,他笑着回应:随便考考, 多家饭店因在凉皮内放黄瓜丝被罚 企查查APP显示,近日,上海米帆餐饮管理有限公司…

    热点 2023年6月8日
    112
  • 网络推广必懂的几个方法(怎么通过网络推广)

    怎么通过网络推广(网络推广_互联网_IT/计算机_专业资料) 一、 网络推广方法 1、 论坛发帖推广 选择人气旺的论坛如百度贴吧或者天涯社区发帖宣传购物 产品,因为明显的广告帖会很容易被管理员删除。那么我们就可 以从侧面宣传购物,…

    热点 2022年10月10日
    150
  • 俄罗斯卖给印度的原油为啥不用卢布结算来自

    这个问题的答案涉及国际经济和政治上的复杂因素。对袭中于印度购买俄罗斯原油的交易,虽然卢布可以作为一种价值媒介,但是拍启山交易的规模庞大,换算成卢布会存在实际操作上的风岁格未海卫光孙黄视险和困难。特别是在当前旁姿国际形势下,美国实行…

    热点 2023年8月10日
    138
  • 抖音乐仔2分40秒视频(抖音乐)

    提起抖音乐,大家都知道,有人问抖音乐仔2分40秒视频,你知道这是怎么回事?其实抖音乐仔2分40秒视频,下面就一起来看看抖音乐,希望能够帮助到大家! 抖音上的配乐在哪里找? 1.直接选择 在抖音app中,点击中间“+”按钮,开始录制…

    热点 2023年5月4日
    369
  • w就啊啊啊啊啊是什么梗

    如今网上各种各样的玩梗方式很多,电竞圈也是一个经常产生热梗的地方。比如“w就啊啊啊啊啊”就是最近非常火的一个热梗,不过大部分伙伴对此都还是一头雾水,根本不知道这表达的意思是什么,下面小编就带大家来看看这个梗的相关内容介绍,一起来看…

    热点 2023年6月29日
    150
  • 半藏森林克隆人年入可达72万是真的吗

    据悉,小冰公司“克隆人计划”在国内的首批AI网红明星克隆人上线啦。昨天,小冰宣布首批网红明星克隆人已提前上线,其中包括此前饱受争议的“半藏森林”。据媒体报道,半藏森林克隆人年入可达72万,这是真的吗?具体是怎么回事呢?下面我们来了…

    热点 2023年6月3日
    127

发表回复

登录后才能评论