洞察市场格局
解锁药品研发情报

客服电话

400-9696-311
医药数据查询

会议

首个医师考试满分AI诞生!超越GPT-5

图片

首个满分选手的出现,标志着AI医疗的又一个里程碑。


近日,美国初创公司OpenEvidence宣布,其开发的全新AI系统美国医师执照考试(USMLE)中获得了100%的满分


这是史上首个获得满分的AI模型,超越了最新的GPT-597%)。


除了OpenEvidence(100%)和 GPT-5(97%),在美国医师执照考试(USMLE)中获得高分的AI,还有 SCAI、Pathway AI、Quadrant Health AI等。

  • SCAI(Semantic Clinical Artificial Intelligence):由纽约州立大学布法罗分校开发的临床 AI 工具,在 USMLE Step 3 中取得 95.2% 的成绩,表现优于 GPT-4 Omni(90.5%)和其他 AI 工具 。

  • Pathway AI:曾在 USMLE 公开评分报告中以 96% 的准确率位列榜首 。

  • Quadrant Health AI:在 USMLE 中获得 93.23% 的成绩 。


图片


美国医师执照考试 (USMLE) 是所有美国医生都必须通过的一系列专业考试,共分为三级,旨在全面评估考生基础知识、应用技能和临床决策的能力,考核极为严格


OpenEvidence的模型不仅能准确回答每个问题,还能提供答案背后的推理过程,并从《新英格兰医学杂志》(NEJM)等权威期刊中找到参考来源。


正是凭借这一能力,它在考试中发现了一个错误答案。随后,经由七位独立的医生审核,他们认同了AI的结论。


成立于2022年的OpenEvidence,已成为美国临床医生最主流的医学搜索引擎,其影响力覆盖全美10000多家医疗机构超过40%的美国医生每天都会使用


今年7月,OpenEvidence获得2.1亿美元的B轮融资估值飙升至35亿美元(约合人民币251亿元)。 本轮由谷歌和凯鹏华盈共同领投,老股东红杉资本继续押注。 

 

2023年,OpenEvidence推出了首个在美国医师执照考试中取得90%以上分数的AI

 

如今,公司的最新AI在考试中获得了满分,再次打破行业天花板。

 

面对全部325道题,OpenEvidence的模型均进行了准确回答,并给出了每个答案的解释,以及参考文献。


而能做到这一点,离不开公司过去半年的技术攻关,模型在推理性能上实现了显著提高。


OpenEvidence表示,其AI已经实现了“超高级医学推理”。


这意味着,模型不仅需要处理事实信息,更要深入分析这些事实背后的潜在因素,理解其深层含义,并在此基础上进行复杂推理。


正因如此,在高度考验推理决策能力、也令众多大模型头痛的Step 3(第三级别)中,OpenEvidence的表现惊艳。


图片


尤其是,在Step 3的第125道题中,一位有长期重度吸烟史的患者计划联合使用尼古丁贴片与丁丙诺啡,需要评估该联合方案可能带来的额外风险。


标准答案是“没有增加的风险”,而OpenEvidenceAI基于FDA和美国心脏病学会的证据,认为联合疗法有增加高血压的风险。


在经过7精神科专业医生的审核后,OpenEvidence的答案最终被证明是正确的。


这一现象揭示了AI的强大能力,尤其是在面对复杂、罕见或非常规病例时,AI可以帮助医生发现盲点,提高诊疗的安全性和准确性。


来源:智药局等


加入读者交流群:


—精彩回顾—

首个药糖尿病干细胞疗法上市在即

中国,走出一个全球First in class

mRNA 肿瘤疫苗,中国力量快速崛起

医药巨头裁员,愈演愈烈

又一巨头栽了,GSK 6.25亿项目折戟

商  务  合  作  :  杨小雨 15210041717


<END>
*版权声明:本网站所转载的文章,均来自互联网,旨在传递更多信息。鉴于互联网的开放性和文章创作的复杂性,我们无法保证所转载的所有文章均已获得原作者的明确授权。如果您是原作者或拥有相关权益,请与我们联系,我们将立即删除未经授权的文章。本网站转载文章仅为方便读者查阅和了解相关信息,并不代表我们认同其观点和内容。读者应自行判断和鉴别转载文章的真实性、合法性和有效性。
AI+生命科学全产业链智能数据平台

收藏

发表评论
评论区(0
  • 暂无评论

    摩熵医药企业版
    50亿+条医药数据随时查
    7天免费试用
    摩熵数科开放平台
    原料药
    十五五战略规划
    专利数据服务
    添加收藏
      新建收藏夹
      取消
      确认