比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

ICCV论文收录名单近日「开奖」,其中就包括这个港科大一作的图像分割模型!

它能以更低的训练成本实现更好的效果,哪怕遇到未知物体也能迎刃而解。

此外据作者介绍,它还是第一个拥有基于box prompts的分割能力的AI模型,比meta的SAM还要早实现。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

这篇论文第一版预印本的发布时间是今年的3月14日(北京时间15日),比SAM早了20多天。

那么,这个图像分割模型,究竟效果如何,又是如何做到的呢?

(以下内容由投稿者提供)

下图展示了这个名为OpenSeeD的模型的输出效果:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

它既可以做经典的实例、语义以及全景分割,又可以分割出从未见过的物体类别,还可以基于检测框分割出从未见过的物体并给出正确的类别。

工作原理

OpenSeeD是一个简单而有效的开放词表图像分割的框架,也可以理解为MaskDINO扩展到开放词表的版本。

如下图所示,过去已经有不少工作结合大量的图像文本对实现开词表检测或者分割,而OpenSeeD是第一个把物体检测数据和全景分割数据结合在一起联合训练的工作,并且证明是可行有效的,填补了这一领域的空白。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

除此以外,为了扩展语义的丰富程度,研究团队引入O365(365类)检测数据和COCO分割(133类)一起训练(不同于MaskDINO使用O365预训练)。

由于使用了不同的数据集,研究团队需要解决了二者之间的数据和任务的差异,以便两个任务和词表兼容。

整体上,OpenSeeD的工作原理如下图所示,两种差异也是通过这一方式解决的:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

图中左半部分完成的是通用场景分割。

为了解决基础模型的任务差别(O365只有前景,而COCO有前景和背景),研究团队把前景和背景的预测进行解耦。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

右半部分是条件预测部分,可以通过GT box预测图像遮罩。

在这一部分中,团队通过为O365打标签为了解决数据差异问题。

最终,该团队的方法在多个开放词表任务上取得了与当前最佳方法x-decoder相当甚至更好的效果,相比x-decoder用了4M人工标注的图像描述数据,OpenSeeD只用了0.57M的检测数据。

另外,研究团队还发现,即使只用5k的O365数据,也可以在开放词表任务上达到类似的效果。

这说明OpenSeeD需要的是丰富的视觉概念(种类数),而不一定是很大的数据量(个体数)。

低成本,高效果

OpenSeeD作为一个强大的开集分割方法,可以分割出大量从未见过的物体,在各项开集和闭集指标上都取得了最佳成绩。

而且通过引入O365检测任务来提升开集语义能力,OpenSeeD的训练成本也相对其他开集方法更低。

下表展示了OpenSeeD的测试结果:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

通过较少的检测数据,研究团队发现在多个零训练样本分割任务上达到或超越了现有最佳方法X-Decoder,GLIPv2等,尤其在SeginW任务(大量陌生类别)上取得了远超X-Decoder的效果。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

除此以外,当团队微调到其他数据集时,OpenSeeD都表现出了远超参照标准的性能。

在COCO和ADE20K的全景分割以及ADE20K和Cityscapes的实例分割上,OpenSeeD的性能也与现有最佳模型相当。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

论文地址:

https://arxiv.org/abs/2303.08131

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年7月22日 12:18
下一篇 2023年7月22日 12:23

热点推荐

  • 缅怀,巨星陨落

    据中国科学院长春应用化学研究所消息, 中国科学院院士、中国科学院原副院长、中国科学院长春应用化学研究所原所长王佛松先生因病医治无效,于2022年12月31日14时59分在北京逝世,享年89岁。 王佛松先生是我国著名高分子化学家,长…

    热点 2023年3月4日
    167
  • 催收员沦为信息贩子:地址1个卖3百 那些已经被贩卖信息的受害人怎么办?

    曾经从事催收工作的湖南邵东人朱某霖,在发现利用淘宝客服、物流公司客服的管理漏洞可以套取用户真实姓名下的淘宝收货地址后,开始做起了买卖个人信息的生意。平均每一条淘宝收货地址,他能卖300元,最高时可以卖到380元。短短半年,朱某霖便…

    热点 2023年6月13日
    135
  • 川大女生出格维权,可别稀里糊涂被外部敌对势力所利用

    近日,在广州某辆地铁上,一女子看见一中年男子蹲着玩手机,因此怀疑对方在偷拍自己,要求检查相册。见女孩如此,大概为了避免不必要的麻烦,那名中年男子只得老老实实让女子检查手机相册以自证清白。 当发现是一场误会之后,该女子仍旧警告对方说…

    热点 2023年6月14日
    149
  • 不撞南墙不回头! 德国议员赴台窜访,未来别想过大陆这一关

    正所谓“屋漏偏逢连夜雨,船迟又遇顶头风”。眼下德国朔尔茨政府就面临这样的艰难的处境。 日前,德国与俄罗斯合作的北溪-2号能源管道发生爆炸,加剧了德国的能源危机,并引发民众的大规模抗议游行活动。抗议者要求德国政府采取实际措施,停止对…

    2022年10月6日 热点
    163
  • 中秋假期国内出游7340.9万人次 同比下降16.7%

    北京商报讯(记者 吴其芸)9月12日,据“文旅之声”公众号消息,文旅部发布2022年中秋假期文化和旅游市场情况,经文化和旅游部数据中心测算,2022年中秋节假期,全国国内旅游出游7340.9万人次,同比下降16.7%,按可比口径恢…

    热点 2022年9月13日
    142
  • 上海为快递员、外卖小哥阶段性发放稳岗补贴

    新华社上海12月25日电(记者周蕊)上海12月24日印发关于支持本市相关行业和企业稳岗留工有序运行若干政策措施的通知,通知明确,将阶段性发放稳岗补贴,其中,2022年12月25日起到2023年1月27日期间,对符合条件的电商平台和…

    热点 2023年1月4日
    132
  • 英雄联盟手游天使ad还是ap(具体介绍)

    英雄联盟天使ad还是ap?英雄联盟手游想要了解天使选择ad出装还是ap出装还是不难的,通过数据方面可以看出,天使的法强加成是很高的,由于前期在没有进化的时候,没有远程类型的攻击,这也让她无法在前期时候出ad来渡过。所以英雄联盟天使…

    热点 2022年12月4日
    194
  • 寻大耳朵图图来自主题曲《大耳朵图图》mp3下载

    去百度搜索. 然后。 你好,对于你的问题,我有一个比较好的解决办法,也是一个简便的方法,就是使用百度下吧,可以下载你所想要的任何电影、软件或者资料! 方法: 1、下载百度下吧,并安装; 2、运行百度下吧,在其对话栏中内输入你想看的…

    热点 2023年10月23日
    135
  • 刘恺威携女儿游加拿大!9岁小糯米如翻版杨幂,李晓峰疑怀孕同行

    杨幂和刘恺威这对前任夫妻,曾经有多么轰轰烈烈,现在就有多么意难平。 婚姻期间,刘恺威曾传出和王欧的“夜光剧本”绯闻;自二人离婚之后,杨幂爆出过和魏大勋的姐弟恋,刘恺威和李晓峰的二婚小故事。 好像新闻很少,二人均专注于演艺事业,但一…

    热点 2023年7月17日
    128
  • 地震灾后重建谁出钱

    地震灾后重建的经费由政府、捐赠者、国际组织、个人和非政府组织等共同承担。具体责任分配取决于具体情况和相关法律法规。 一般来说,政府会承担主要责任,通过拨款和补贴等方式提供必要的经济支持。同时,捐赠者、国际组织、个人和非政府组织等也…

    热点 2023年8月10日
    362

发表回复

登录后才能评论