DIRFA:​只需音频和照片即可创建逼真的说话脸部动画

极客号(Daydx.com)11月17日 消息:新加坡南洋理工大学(NTU Singapore)的一支研究团队开发了一个计算机程序,只需音频和一张照片,即可创建反映说话者面部表情和头部动作的逼真视频。

这个名为 DIverse yet Realistic Facial Animations(DIRFA)的人工智能程序能够根据音频和照片生成3D 视频,显示人物与所说的音频同步的逼真而一致的面部动画。该程序改进了现有方法,解决了姿势变化和情感控制等问题。

DIRFA:​只需音频和照片即可创建逼真的说话脸部动画

为了实现这一目标,研究团队训练 DIRFA 使用了来自一个名为 The VoxCeleb2Dataset 的开源数据库的超过6000人的100多万个音频视频片段,以预测语音中的线索并将其与面部表情和头部动作联系起来。

研究人员表示,DIRFA 可能在各个行业和领域中产生新的应用,包括医疗保健。它可以使虚拟助手和聊天机器人更加复杂和逼真,从而改善用户体验。此外,它还可以作为一种强大的工具,帮助言语或面部受损的人通过表情丰富的化身或数字形象来传达他们的思想和情感,提高他们的沟通能力。

该研究的的研究人员表示:“我们的研究影响可能是深远的,因为它通过结合人工智能和机器学习等技术,彻底改变了多媒体通信的领域。我们的程序在之前的研究基础上进行了改进,只使用音频记录和静态图像,就能生成具有准确的嘴唇动作、生动的面部表情和自然的头部姿势的视频。”

研究人员还介绍称:“语音表现出多种变化。在不同的语境下,个体对相同的词语发音可能会有不同的方式,包括持续时间、幅度、音调等方面的变化。此外,除了语言内容,语音还传达了有关说话者情感状态和性别、年龄、种族甚至个性特征等身份因素的丰富信息。我们的方法在音频表示学习和人工智能机器学习方面进行了开创性的努力。” 研究结果于8月份发表在《Pattern Recognition》科学期刊上。

研究人员表示,通过音频驱动逼真的面部表情呈现是一个复杂的挑战。对于给定的音频信号,可能有许多可能的面部表情是合理的,而在处理随时间变化的一系列音频信号时,这些可能性可能会增加。

由于音频通常与嘴唇动作有很强的联系,但与面部表情和头部位置的联系较弱,研究团队的目标是创建能够展示精确的嘴唇同步、丰富的面部表情和与提供的音频相对应的自然头部动作的说话脸部。

为了解决这个问题,研究团队首先设计了他们的人工智能模型 DIRFA,来捕捉音频信号和面部动画之间复杂的关系。他们使用来自一个公开可用的数据库的超过6000人的100多万个音频和视频片段对模型进行了训练。

研究人员介绍:“具体而言,DIRFA 模型根据输入的音频来建模面部动画(如挑起眉毛或皱鼻子)的可能性。这种建模使得该程序能够将音频输入转换为多样而逼真的面部动画序列,从而指导说话脸部的生成。”

研究人员还补充说:“广泛的实验表明,DIRFA 能够生成具有准确的嘴唇动作、生动的面部表情和自然的头部姿势的说话脸部。然而,我们正在努力改进程序的界面,使得用户能够对某些输出进行控制。例如,DIRFA 目前不允许用户调整某种表情,比如将皱眉改为微笑。”

除了向 DIRFA 的界面添加更多选项和改进外,NTU 的研究人员还将使用更广泛的数据集来微调其面部表情,包括更多种类的面部表情和声音音频片段。

论文地址:

https://www.ntu.edu.sg/docs/default-source/corporate-ntu/hub-news/realistic-talking-faces-created-from-only-an-audio-clip-and-a-person-s-photo-using-ntu-singapore-computer-program.pdf?sfvrsn=41d32b2a_1

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2023年11月17日
下一篇 2023年11月17日

热点推荐

  • 除螨的洗发水哪款好(除螨洗发水排行榜)

    有什么好用的洗发水推荐呢? 第海飞丝。海飞丝是一款国内知名品牌的洗发水,不仅能够强效去屑,还能起到滋润头皮的作用。这款洗发水有一股淡淡的清香味,闻起来特别舒服,而且洗完头发之后会感觉特别清爽舒服。第遇见香芬。 十大公认最好用的洗发…

    2023年11月5日
    360
  • 没钱怎么创业 一个人(如何创业白手起家)

    当今社会上,有太多的创业失败者负债累累者,都在谋求东山再起的途径,但只是愿景,现实很难。回答这个粉丝的问题,创业失败者一无所有,想白手起家,现在有哪些项目可以选择呢?我这里推荐一些,仅供调研参考。 线上自媒体领域 早期我一直鼓励创…

    2022年10月2日 热点
    900
  • 梦中的那片海什么时候可以看

    《梦中的那片海》这部电视剧一共40集,预计在2023年5月21日在央视八套和腾讯视频播出,该剧是由新湃传媒(北京)有限公司出品,是由付宁执导,徐兵、周鹤洋编剧,杨晓培总制片,肖战、李沁领衔主演,刘芮麟、曹斐然、赵昕、崔航、张龄心、…

    2023年5月23日
    560
  • 无所畏惧:第一个光明正大“收拾”老韩的人终于出现了!

    无所畏惧:太飒了夏舒!第一个光明正大“收拾”老韩的人终于出现了! 老韩这家伙也太不地道了!自家律所的案子,做的都是律所同仁,而且自己坐在方律身旁! 眼看着英子被陈硕方,辩驳的漏洞百出,毫无招架之力!老韩竟然咧着嘴巴一直想笑!之前是…

    2023年11月16日
    340
  • 介绍写网站seo诊断方案的6种方式(网站seo诊断方案该怎么写)

    做SEOer你必定会接触很多新站和很多一直做不上排名的网站,接手之后首先要做的是为这个新站做一份SEO诊断方案,这样才会很好的将这个网站给优化好!如果胡乱优化的话,不仅可能达不到别人想要的效果,而且很可能将一个网站就此毁掉。接下来…

    2022年10月18日
    730
  • 春运首日火车票明起发售

    春运首日火车票明起发售 本报记者 李博 2024年春运将从1月26日开始,3月5日结束,共计40天。根据目前铁路客票预售规则(预售15天内火车票),1月12日,2024年春运首日1月26日火车票将正式发售,购票旅客可通过中国铁路1…

    2024年1月11日
    310
  • 沪宁沿江高铁完成热滑试验 即将联调联试

    记者从中国铁路上海局集团有限公司获悉,6月13日,沪宁沿江高铁顺利完成热滑试验,即将开展联调联试,预计9月份具备开通运营条件。 热滑试验是指在铁路接触网带电情况下,通过试验列车受电弓的滑行,精确检测接触网与受电弓的弓网关系,检测受…

    2023年6月13日
    530
  • 推广小程序的策略技巧(推广微信小程序的有效方法)

    推广微信小程序的有效方法?(推广小程序的策略技巧) 越来越多的公司开发使用小程序,如何让更多用户看到我们的微信小程序? 1,主动添加客户 微信客户是我们和公司非常重要的资源,我们已经通过我们的网络实现了单一渠道。也许您可以在有机会…

    2022年10月13日
    860
  • 心软的神是什么梗

    网络上关于一些词语和梗的含义咨询还是非常火爆的,最近一段时间心软的神这个梗热度非常高,不少小伙伴在问心软的神是什么梗?心软的神是什么意思?出自哪里?下面小编为大家带来心软的神梗的含义及出处介绍,感兴趣的小伙伴一起来看一下吧。 心软…

    2023年6月14日
    590
  • 2023年浏阳国际花炮文化节举办时间 浏阳烟花节最新消息

    2023年中国(浏阳)国际花炮文化节时间: 2023年11月中上旬 调整至11月中上旬,第十五届中国(浏阳)国际花炮文化节延期举办 9月13日,浏阳市烟花爆竹总会发布通知,决定将原定于 2023年10月20日至21日的第十五届中国…

    2023年9月18日
    460