比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

ICCV论文收录名单近日「开奖」,其中就包括这个港科大一作的图像分割模型!

它能以更低的训练成本实现更好的效果,哪怕遇到未知物体也能迎刃而解。

此外据作者介绍,它还是第一个拥有基于box prompts的分割能力的AI模型,比meta的SAM还要早实现。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

这篇论文第一版预印本的发布时间是今年的3月14日(北京时间15日),比SAM早了20多天。

那么,这个图像分割模型,究竟效果如何,又是如何做到的呢?

(以下内容由投稿者提供)

下图展示了这个名为OpenSeeD的模型的输出效果:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

它既可以做经典的实例、语义以及全景分割,又可以分割出从未见过的物体类别,还可以基于检测框分割出从未见过的物体并给出正确的类别。

工作原理

OpenSeeD是一个简单而有效的开放词表图像分割的框架,也可以理解为MaskDINO扩展到开放词表的版本。

如下图所示,过去已经有不少工作结合大量的图像文本对实现开词表检测或者分割,而OpenSeeD是第一个把物体检测数据和全景分割数据结合在一起联合训练的工作,并且证明是可行有效的,填补了这一领域的空白。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

除此以外,为了扩展语义的丰富程度,研究团队引入O365(365类)检测数据和COCO分割(133类)一起训练(不同于MaskDINO使用O365预训练)。

由于使用了不同的数据集,研究团队需要解决了二者之间的数据和任务的差异,以便两个任务和词表兼容。

整体上,OpenSeeD的工作原理如下图所示,两种差异也是通过这一方式解决的:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

图中左半部分完成的是通用场景分割。

为了解决基础模型的任务差别(O365只有前景,而COCO有前景和背景),研究团队把前景和背景的预测进行解耦。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

右半部分是条件预测部分,可以通过GT box预测图像遮罩。

在这一部分中,团队通过为O365打标签为了解决数据差异问题。

最终,该团队的方法在多个开放词表任务上取得了与当前最佳方法x-decoder相当甚至更好的效果,相比x-decoder用了4M人工标注的图像描述数据,OpenSeeD只用了0.57M的检测数据。

另外,研究团队还发现,即使只用5k的O365数据,也可以在开放词表任务上达到类似的效果。

这说明OpenSeeD需要的是丰富的视觉概念(种类数),而不一定是很大的数据量(个体数)。

低成本,高效果

OpenSeeD作为一个强大的开集分割方法,可以分割出大量从未见过的物体,在各项开集和闭集指标上都取得了最佳成绩。

而且通过引入O365检测任务来提升开集语义能力,OpenSeeD的训练成本也相对其他开集方法更低。

下表展示了OpenSeeD的测试结果:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

通过较少的检测数据,研究团队发现在多个零训练样本分割任务上达到或超越了现有最佳方法X-Decoder,GLIPv2等,尤其在SeginW任务(大量陌生类别)上取得了远超X-Decoder的效果。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

除此以外,当团队微调到其他数据集时,OpenSeeD都表现出了远超参照标准的性能。

在COCO和ADE20K的全景分割以及ADE20K和Cityscapes的实例分割上,OpenSeeD的性能也与现有最佳模型相当。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

论文地址:

https://arxiv.org/abs/2303.08131

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2023年7月22日
下一篇 2023年7月22日

热点推荐

  • 男子多次强奸未成年堂妹获刑6年,有违人伦需重判而非宽纵

    文|柳宇霆 近日,一起堂兄强奸未成年堂妹的案件,引发舆论热议。 据河南汝州市法院刑事判决书显示,被告人冯某乐与被害人冯某系堂兄妹关系,且其明知冯某未满14周岁。自2020年下半年至2021年间,冯某乐在村小学附近、村大队部附近,其…

    2023年8月31日
    350
  • 最新最全!各大卫视2024跨年晚会节目单发布,你最想看哪一个?

    2024年的钟声即将敲响,2023年最后的一夜,除了外出游玩过节,在家看跨年晚会也是一种不错的选择。目前,多个卫视的跨年晚会节目单相继发布,引发网友热议。 以演唱会为主要形态,兼具跨年欢乐气氛营造与科技创新,是今年跨年晚会的共同特…

    2024年1月2日
    300
  • 新型生意项目投资(什么项目投资小利润大)

    日前,国家统计局公布了2021年农民工的月均收入水平,较2020年相比增幅为8.8%,达到4432元/月。而按照当前的经济发展水平及物价上涨趋势,月均4432元仅仅能够维持日常生计,在面临天价彩礼、遭遇重大疾病之际,依然显得束手无…

    2022年12月4日 热点
    640
  • 扣非净利同比增8倍!比亚迪前三季成绩单预揭晓,销量已远超特斯拉…

    点蓝字关注,不迷路~ 继新能源车单月销量突破20万大关之后,比亚迪交出了一份亮眼的“成绩单”。 10月17日,比亚迪发布业绩预告称,预计2022年前三季度实现净利润91亿元至95亿元,同比大涨2.7倍以上。表现更出色的是扣非净利润…

    2022年10月18日
    750
  • 腾讯回应收央行罚款通知:对集团经营和财务状况没有不利影响

    快科技7月8日消息,日前相关部门接连公布了多起罚款,除了蚂蚁集团被罚71.23亿元外,腾讯旗下的财付通也被罚约29.9亿元。 腾讯控股在港交所发布公告称,公司相信金融监管部门的工作重点将转入常态化监管,落实促进平台经济健康发展的金…

    2023年7月8日
    450
  • 新手怎么运营小红书(小红书运营)

    小红书运营精华48条(建议收藏): 01.以前博主私下接大量广告,只要笔记写得足够软也没有太大问题,但现在平台严厉打击私下接广的博主,如系统检测到你的笔记有广告嫌疑,将会提示违规或给你限流。是否是广告笔记以系统审核为准,对于博主私…

    2022年10月12日 热点
    920
  • 濮阳网红排行榜前十名(濮阳网红排行榜)

    董艳颖网红原名叫什么 1、二姐董艳颖。根据查询抖音APP信息显示,董艳颖是一个河南濮阳的短视频网红,拥有485万粉丝,刚开始的时候,抖音名叫二姐董艳颖和公婆之间的那种相处方式吸引粉丝。 2、董艳颖是濮城文早村人。根据查询相关公开信…

    2023年10月16日
    1240
  • 拍短剧怎么赚钱(拍短剧的演员工资)

    短视频作为如今最火的一个领域,现在大家都很爱玩,在短视频平台上不仅提供了丰富的娱乐内容,还为创作者提供了赚钱的机会。比如,现在很火的短剧,短剧视频是当下一个十分有潜力的市场,许多人可能还不知道短剧可以赚钱,下面我们来看看拍短剧怎么…

    2023年11月14日
    310
  • 世乒赛男团1/4决赛:中国3-0瑞典

    北京时间2022年10月7日晚,在2022年成都世乒赛男子团体1/4决赛的较量中,中国男团以3-0战胜瑞典男团,顺利挺进4强。此役,樊振东、马龙和王楚钦代表中国男团出战,其中樊振东和马龙均以3-0的比分赢下各自对手,王楚钦则在落后…

    2022年10月8日
    790
  • 男子造谣小学现校园暴力被拘 请大家不信谣不传谣

    有些网民盲目追求吸睛吸金 出名爆红、流量变现 不惜随意虚构事实、散布谣言 造成恶劣影响 10月9日 泾县公安局 依法查处一起散布网络谣言案 违法人员张某被泾县警方行政拘留 案件回顾 2023年10月9日上午,泾县警方在工作中发现,…

    2023年10月12日
    350