OpenAI 的 ChatGPT 通过新的放射学委员会考试:病患更喜欢 AI 的回答 更具同情心

OpenAI 的 ChatGPT 正在通过医学考试,两项最新研究表明,这一次 ChatGPT 在放射学考试中取得了及格分数。

OpenAI 的 ChatGPT 通过新的放射学委员会考试:病患更喜欢 AI 的回答 更具同情心

研究人员将 ChatGPT 的 GPT-3.5 版本和 GPT-4 版本评估了放射学考试的 150 个问题。他们发现,在两个版本中,AI 的聊天机器人从 69.3% 的接近及格的分数提高到了 80.7%,在高级别思维问题中表现更为出色,特别是在描述影像发现和应用医学概念方面,GPT-4 版本的表现更好。

这些问题是基于文本的选择题,分为两个大类(高级和低级),以评估技术在回答问题方面的具体优势和劣势。这些问题被选中以匹配加拿大皇家学院和美国放射学委员会考试的风格、内容和难度。

ChatGPT 在医学考试中的应用已经成为一种常见现象。自 ChatGPT 在 2022 年 11 月 30 日发布以来,通过医学认证考试一直是 AI 开发人员的长期目标,尤其是谷歌的医学重点大语言模型(LLM)Med-PaLM。

自当月以来,参与 AI 测试使用于医学认证的研究已成为一种常见实践,特别是通过 ChatGPT 的性能来提升在医学领域的应用。医学认证考试成为了 AI 开发的一个长期目标。

在 2022 年 12 月,研究人员展示了 Med-PaLM 在美国医疗许可考试(USMLE)上获得了 67.6% 的准确率,这是及格分数的普遍门槛,这是 AI 在医学上功能的一个重大里程碑,类似于人工智能在多年中与国际象棋大师的竞争。

此外,ChatGPT 最近还接受了评估其回答患者问题的能力。在与真实医生回答的比较中,经过盲评估的评价者在 75% 以上的时间内更喜欢 ChatGPT 的回答。与医生的回答相比,该 AI 聊天机器人的回答也被评为更具有同情心。

总的来说,现在 AI 模型在医学上能做什么和不能做什么的努力是一个设定基准的过程。Bhayana 表示,目前的重点是确定 ChatGPT 和其他 AI 模型可以在医学上如何使用,但他警告说,由于这些技术往往会「幻觉」或说谎(通常非常自信),因此应用是有限制的。然而,他希望技术能够不断改进,以实现在医学上更广泛的应用。

目标是了解医生可以信任这些工具的程度,然后开始着手改进和优化这些模型,以适用于特定的临床用途。目前,生成式 AI 已经表明在某些用途上是高效的,例如听写和转录,但 Bhayana 认为,在医学上医生将能够信任这些工具,需要更多时间和更新。

他表示:「随着这些工具的出现,重点在于了解它们的性能,寻找它们的应用,并确保人们知道它们的优点和限制,以便医生与技术共同发展。」

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

投稿号的头像投稿号注册会员
上一篇 2023年5月18日
下一篇 2023年5月18日

热点推荐

  • 房贷提前还款大幅增加 央行回应 背后的真相让人始料未及

    据中国网,国新办于7月14日上午10时举行新闻发布会,中国人民银行货币政策司司长邹澜表示,个人住房贷款发放和同期商品房销售规模直接相关,还款则是来自于借款人的收入或者其他资产的配置调整。今年上半年,个人住房贷款累计发放3.5万亿元…

    2023年7月14日
    420
  • 考虑清楚这几点,再买新能源,有些人就是不适合新能源车型

    考虑清楚这几点,再买新能源也不迟,不然使用体验差真的不是新能源汽车的问题。个人的新能源纯电动车型已经使用了1年多了,说几点感想。 你真的适合新能源嘛? 纯电动车型现在是越来越多了,能不能作为一般用户的主力车型,以我的经验来看,续航…

    2022年10月24日
    800
  • 二手平台疑有人2800元卖孩子真的吗(闲鱼二手平台)

    随着电商的发展,如今网购在生活中已经十分普及了,7月4日上午,有网友在社交媒体发文称,自己发现某二手交易平台上有一则公开售卖婴幼儿的信息,该事件也引发网友关注。那么,网上卖孩子是真的吗?具体是怎么回事呢?下面我们来详细了解下吧。 …

    2023年7月6日
    480
  • 补壹刀:苏纳克首相,对英国意味着什么?

    本文转自【补壹刀】;执笔/斩魄刀叨叨姐英国第一位非白人领导人、第一位担任最高职位的印度教徒、200多年来最年轻的首相……42岁的苏纳克,接替特拉斯,成为英国新一任首相。如今的英国刚刚经历了一个“最短命内阁”:45天的特拉斯政府留下…

    2022年10月25日 热点
    830
  • 如何评价天津大学城乡规划系

      天津大学, 无疑是国内工科方面较为著名的高校,其工科整体实力在国内前五当无异议。综合声誉方面,该校是39所985、32所副部级高校之一。天津大学的部分工程或工科类专业国内领先,来自其化学工程与技术国内第一,管理科学与工程国36…

    2023年10月8日
    400
  • 热搜!特斯拉狂飙2公里,致2死3伤,鉴定结果已出

    2月28日晚上 话题“特斯拉潮州事故鉴定结果已出” 登上同城热搜 引发广泛关注 据司法鉴定科学研究院消息,特斯拉潮州事故有了新进展—— 事故鉴定报告已经给到潮州警方。 对于鉴定结果,司法鉴定科学研究拒绝接受媒体采访,也不会进行公布…

    2023年3月25日 热点
    580
  • 1一18风力等级对应风速(风速与风级对照表)

    本文主要讲的是风速与风级对照表,以及和1一18风力等级对应风速相关的知识,如果觉得本文对您有所帮助,不要忘了将本文分享给朋友。 风级风速对照是什么? 风级风速对照表: 风速:相邻两地间的气压差愈大,空气流动越快,风速越大,风的力量…

    2023年5月14日
    1030
  • 请问手不释卷的主人公是谁

    简要回答 手不释卷的故事出自《三国志·吴书·吕蒙传》,故事中的主人公是指吕蒙。 一个人认真拿着书勤奋读书的时候,经常会用手不释卷这个词语来形容,那这个词语出自哪里呢?故事中的主人公是指谁呢?下面小编来为大家讲解一下。 详细内容 手…

    2023年5月20日
    480
  • Steg.AI推出基于深度学习的水印方案 可将隐形水印嵌入数字内容中

    极客号(Daydx.com)8月3日 消息:2023年5月,全球震惊于五角大楼冒烟的图片。许多新闻频道根据这些图片报道事件,甚至股市也做出了短暂的反应。然而后来证明,这是一张虚假的由人工智能生成的图片。 这样的事例凸显了在各种情况…

    2023年8月3日
    440
  • 英文rap经典歌曲(英文rap歌曲排行榜)

    求好听的英文嘻哈说唱歌曲 1、《say hey》拉丁曲风的嘻哈。《sweat dream》别忘记Beyonce!《ill be missing you》个人推荐!很舒服的说唱。尤其是高潮。适合在嗨后结尾 《lose yoursel…

    2023年10月17日
    300