富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

投稿号(tougaohao.com)9月26日 消息:富士通于2023年9月26日宣布推出两项新的人工智能(AI)信任技术,旨在提高对话型人工智能模型的可靠性,从而增强其在各种用例中的安全性。这两项新技术包括检测对话型人工智能模型中的幻觉以及检测通过注入虚假信息进行的对抗性攻击所植入的网络钓鱼网址的技术。

第一项技术旨在高度精确地检测对话型人工智能回复中的幻觉。在业务运营中,企业经常使用对话型人工智能来提取与问题相关的信息,并将这些数据作为参考信息添加到向外部对话型人工智能提问时。尽管这种方法提供了准确的回复并减少了幻觉,但完全防止幻觉仍然是一个持续存在的问题。这是因为对话型人工智能在某些情况下无法正确提取与问题相关的信息,从而创建不相关或不正确的回复。

富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

图源备注:图片由AI生成,图片授权服务商Midjourney

为了计算高度精确的幻觉评分,新技术首先将人工智能的回复分为三个部分(主语、谓语、宾语等),然后自动识别回复中的命名实体。接下来,技术将这些命名实体留空,并反复向外部人工智能提问,以更准确地定义这些特定表达方式。根据使用WikiBio GPT-3幻觉数据集等开放数据进行的基准测试显示,相对于其他用于检测AI幻觉的先进方法,如SelfCheckGPT,该技术可以将检测的准确性(AUC-ROC)提高约22%。

第二项技术旨在检测对话型人工智能回复中植入的网络钓鱼网址。由于对话型人工智能基于其训练数据创建回复,恶意实体可以通过在人工智能训练数据中注入恶意信息,欺骗人工智能以创建包含操纵信息的回复,例如导致虚假网站的网络钓鱼网址。

为了解决这个问题,富士通开发了一项技术,用于检测对话型人工智能回复中的操纵网址。一旦技术识别出网络钓鱼网址,它将向用户发出警告消息。这项新技术不仅可以检测网络钓鱼网址,还可以增强人工智能模型对现有攻击的抵抗力,以确保其提供高度可靠的回复。该技术是在富士通与以色列本古里安大学的合作下共同开发的,利用了恶意实体通常攻击单一类型的人工智能模型的倾向,通过使用不同的人工智能模型处理信息并评估判断结果的合理性差异来检测恶意数据。此技术不仅可用于检测网络钓鱼网址,还可用于预防欺骗使用表格数据的人工智能模型的一般攻击,从而避免对其他服务的攻击。

这两项新技术将纳入富士通的对话型人工智能核心引擎中,通过“富士通Kozuchi(代号)-富士通AI平台”提供给用户,使用户可以访问广泛的强大人工智能和机器学习技术。检测对话型人工智能中的幻觉的技术将于2023年9月28日起提供给日本用户,而检测对话型人工智能回复中的网络钓鱼网址的技术将于2023年10月起提供。这两项新技术将通过Kozuchi提供给企业用户作为演示环境,并通过专用门户网站提供给个人用户。富士通计划将这两项新技术未来推广到全球市场。

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年9月26日 12:17
下一篇 2023年9月26日 12:17

热点推荐

  • 今年天猫双11,10月24日晚8点开启,主推“直降、立减和买贵必赔”

    10月14日,春城晚报-开屏新闻记者从淘天集团获悉,今年天猫双11将于10月24日晚8点正式开启。 记者了解到,今年天猫双11核心主打一个“全网最低价”。玩法方面,除了往年的满减,天猫会推出大范围的直降和官方立减活动,更有买贵必赔…

    热点 2023年11月2日
    108
  • 钓箱品牌排名(钓箱品牌排行榜)

    钓箱什么牌子质量最好?选择技巧有哪些呢? 1、天元浪尖钓箱 浪尖这款钓箱的容量是29升,大小非常合适,空间足够大,而且也不会很重。它的箱盖同样是平面的设计,清洁很方便。也配有四脚升降功能,能适应野外复杂的地形。 2、钓鱼箱品牌推荐…

    热点 2024年1月2日
    244
  • 安徽7岁女童被恶犬撕咬致毁容 家属称狗主人至今没赔偿

    11月4日,蚌埠市固镇县连城镇村民强先生的7岁女儿在家门口被一条恶狗咬伤。11月8日上午,强先生告诉记者,目前女儿还在医院治疗,狗主人至今未去医院看望,现在派出所和政府部门在和狗主人协商赔偿。11月8日上午,大皖新闻记者联系上固镇…

    热点 2023年11月8日
    124
  • dj歌曲排名(dj排名前100首)

    中文dj歌曲100首有哪些? 中文dj歌曲排行榜如下:《一定会》-DJ小黑。《如果你爱的不是我》- DJ王志。《万水千山总是情》-DJSunny王绎龙。《好好恋爱》- DJQQ。《你的爱给了谁》- DJ庭锋。《如意》- DJjoe…

    热点 2023年11月6日
    147
  • 女生可以学哪些技术(女生适合学什么职业)

    “我家孩子成绩不好,家里条件也差,没办法支持孩子继续读书,孩子自己也想出来工作,但她现在还这么小,我们还是希望让她去学个手艺,以后好歹找工作没问题,但是不知道什么适合孩子。”虽然小编一直觉得多读点书没有坏事,哪怕读个专科,也比只有…

    2022年10月8日 热点
    179
  • 傅明先任浙江省纪委书记

    傅明先任浙江省纪委书记 据浙江省纪委省监委官方微信公众号,10月1日,省委常委、省纪委书记傅明先赴党的诞生地——嘉兴南湖,瞻仰红船,重温“红船精神”,参观南湖革命纪念馆,看望节日期间坚守一线的干部职工,并调研了解清廉村居建设情况。…

    热点 2022年10月24日
    166
  • 最近快手有一个很火的女装模特(快手女装大佬排名)

    快手赤红的真实信息 1、李贺。赤红女拳是快手具有知名度的网红之一,受到了许多网友的青睐,其真实姓名是李贺。快手是北京快手科技有限公司旗下的产品。快手的前身,叫“GIF快手”,诞生于2011年3月,最初是一款用来制作、分享GIF图片…

    热点 2023年8月20日
    133
  • 云襄传南宫放和福王的关系

    云襄传是悬疑剧吗 《云襄传》是古装武侠剧,中间掺杂着悬疑元素,主人公云襄踏入江湖最重要的事是寻找骆家庄惨案真相。 云襄是个头脑清晰,智勇双全的人,他对付敌人用的都是计谋,而非武力,因为他不会武功。 云襄本名骆文佳,他在家族被灭后,…

    2023年5月25日 热点
    131
  • 敬老月活动总结300字(敬老月活动总结)

    提起敬老月活动总结,大家都知道,有人问敬老月活动总结300字,你知道这是怎么回事?其实敬老月活动总结300字,下面就一起来看看敬老月活动总结,希望能够帮助到大家! 敬老月活动总结 一个精彩的活动已经圆满收官,这段经历可以丰富我们的…

    热点 2023年4月19日
    118
  • 布林肯没来成,耶伦想访华救美国的急,无所谓,中国会果断出手

    舆论炒作“威胁”、推迟访华、下令军机击落、拒还残骸、通报40国施压…最近美国把一起简单的民用飞艇事件玩出了花,成功上升到了中美重大外交事件。美国这样做是在激化紧张局势,并不像他们嘴上总是说的“管控风险”。美国如此大惊小…

    2023年3月20日 热点
    136

发表回复

登录后才能评论