DeepMind发布新模型Mirasol3B:更高效处理音频、视频数据

极客号(Daydx.com)11月16日 消息:Google DeepMind日前悄然宣布了其人工智能研究的重大进展,推出了一款名为“Mirasol3B”的新型自回归模型,旨在提升对长视频输入的理解能力。该新模型展示了一种颠覆性的多模态学习方法,以更综合和高效的方式处理音频、视频和文本数据。

DeepMind发布新模型Mirasol3B:更高效处理音频、视频数据

Google Research的软件工程师Isaac Noble和Google DeepMind的研究科学家Anelia Angelova共同撰写的博客文章中指出,构建多模态模型的挑战在于模态的异构性。他们解释说:“一些模态可能在时间上同步(例如音频、视频),但与文本不对齐。此外,视频和音频信号中的大量数据远远大于文本,因此在将它们结合在多模态模型中时,视频和音频通常无法完全消耗,需要进行不成比例的压缩。对于更长的视频输入,这一问题变得更加严重。”

多模态学习的新方法

为了解决这一复杂性,Google的Mirasol3B模型将多模态建模解耦为分开的自回归模型,根据模态的特性处理输入。“我们的模型包括一个用于时间同步模态(音频和视频)的自回归组件,以及一个用于不一定时间对齐但仍然是序列的模态(例如标题或描述)的单独的自回归组件,”Noble和Angelova解释道。

Google可能会探索在YouTube等领域应用该模型的可能性。作为全球最大的在线视频平台之一,YouTube是公司的主要收入来源之一。该模型理论上可以用于提升用户体验和参与度,例如生成视频的字幕和摘要,回答问题并提供反馈,创建个性化推荐和广告,以及让用户使用多模态输入和输出创建和编辑自己的视频。

例如,该模型可以基于视觉和音频内容生成视频的字幕和摘要,并允许用户通过关键词、主题或情感搜索和过滤视频。这有望提高视频的可访问性和可发现性,帮助用户更轻松快速地找到他们想要的内容。

该消息在人工智能社区引起了浓厚的兴趣和激动,同时也有一些怀疑和批评。一些专家赞扬了该模型的多功能性和可扩展性,并对其在各个领域的潜在应用寄予厚望。但也有人质疑为何没有提供代码、模型权重、训练数据甚至API。这引发了关于该技术在实际应用中的可行性的讨论。

这一宣布标志着人工智能和机器学习领域的重要里程碑,展示了Google在开发前沿技术方面的雄心和领导地位。然而,这也为AI的研究人员、开发者、监管机构和用户提供了一项挑战和机会,需要确保该模型及其应用符合社会的道德、社会和环境价值观和标准。

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2023年11月16日
下一篇 2023年11月16日

热点推荐

  • 俄军久攻不下,普京会用战术核武器吗??美专家:有三种可能

    文/肥佬茄子 在损失了大量装备、新兵战斗力难以成形的当下,俄军无疑面临着严峻挑战。在这种情况下,普京动用战术核武器来挽回不利局面、夺取胜利的可能性,也被越来越多的学者所提起。 (俄军损失的装甲车被遗弃在路边) 据路透社12月20日…

    2023年1月8日 热点
    680
  • 开网店真的能赚钱吗(开网店赚钱吗)

    我全是野路子。 文/吴鹤鸣 编辑/易琬玉 “爸爸,我想开网店。” 2016年暑假,17岁的余枝宣坐在父亲车里,在历经两个月的店铺装修、做好第一件样品、联系代工厂等一系列的准备后,余枝宣终于鼓起勇气向父亲报告。她还差一点钱。 “你需…

    2022年10月8日 热点
    760
  • 开门红!元旦档总票房超15亿

    2024年元旦档票房超15亿元,远超去年元旦档。 据灯塔专业版数据,截至1月1日21时,2024年元旦档(2023年12月30日-2024年1月1日)档期票房达15.17亿元,刷新中国影史元旦档票房纪录,《一闪一闪亮星星》《年会不…

    2024年1月3日
    230
  • 【一竞技DOTA2】iG和G2俱乐部合作原iG战队更名为G2×iG

    1、12月8号,iG电子竞技俱乐部宣布与欧洲G2电子竞技俱乐部正式在DOTA2领域达成合作,原iG旗下DOTA2战队改名为G2×iG,这也标志着G2正式进军DOTA2领域。 G2是欧洲著名的电子竞技俱乐部,旗下多个项目都获得过辉煌…

    2023年12月11日
    290
  • 微商朋友圈推广引流文案怎么写(微商怎么引流推广)

    微商行业内,人人皆知宣传引流的重要性。在这个过程中,宣传文案的撰写是重点。今天,我就来谈谈如何撰写微商引流文案。 (一) 在我看来,一篇好的文案应具备两大特性,一是文章的曝光率要高、宣传面要广,要具备非常强的传播性。二是文章的内容…

    2022年10月6日
    1040
  • vivo手机品控有多强(vivi手机是什么牌子质量怎么样)

    现如今智能手机的尺寸普遍比较大,屏占比也比较高,为用户带来了很好的使用体验。但与此同时,大尺寸的机身和较高的屏占比也增加了手机的使用风险,有时候仅仅是一次手机跌落,就可能造成手机的损坏。正因如此,所以各大手机厂商都在努力提升产品的…

    2022年10月1日 热点
    880
  • 男生看的网络小说(男生看的小说排行榜)

    男生必读的10本书 这本书让人无法不被震撼,倘若你正经历坎坷,那更该读一读《活着》,读完之后,或许会燃起重新踏上征途的勇气。 男人一生必看的十本书 《平凡的世界》作者:路遥 著 出版社:北京十月文艺出版社 这是一部现实主义小说,也…

    2023年7月31日
    450
  • 又一地宣布:无症状、轻症可正常上班!

    · 安徽芜湖:这些无症状和轻症可正常上班 据“芜湖发布”微信公众号消息,12月19日,安徽省芜湖市新冠肺炎疫情防控暨推进“六稳”工作指挥部办公室印发《关于进一步优化疫情防控措施的通知》。 《通知》指出,随着我市新冠感染率不断攀升,…

    2023年2月13日
    570
  • 美国多地出现新冠病毒变异株 疫情防控再遭挑战(转载)

      近期美国单日新增的新冠肺炎确诊人数虽然有所下降,但是多个州都出现了新冠病毒变异株,这也给美国疫情防控提出了新的挑战。   据多家美国媒体报道,美国哥伦比亚大学和加州理工学院研究人员近日分别报告说,一种新的新冠病毒变异株正在纽约…

    2023年2月25日
    620
  • 学习的好方法(学习方法介绍)

    大家好,今天给各位分享学习方法介绍的一些知识,其中也会对学习的好方法进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧! 学习方法有哪些 方法分为以下几种: 1.做好课堂笔记: 是强化记忆…

    2023年4月24日
    540