首个满分选手的出现,标志着AI医疗的又一个里程碑。 近日,美国初创公司OpenEvidence宣布,其开发的全新AI系统在美国医师执照考试(USMLE)中获得了100%的满分。 这是史上首个获得满分的AI模型,超越了最新的GPT-5(97%)。 除了OpenEvidence(100%)和 GPT-5(97%),在美国医师执照考试(USMLE)中获得高分的AI,还有 SCAI、Pathway AI、Quadrant Health AI等。 SCAI(Semantic Clinical Artificial Intelligence):由纽约州立大学布法罗分校开发的临床 AI 工具,在 USMLE Step 3 中取得 95.2% 的成绩,表现优于 GPT-4 Omni(90.5%)和其他 AI 工具 。 Pathway AI:曾在 USMLE 公开评分报告中以 96% 的准确率位列榜首 。 Quadrant Health AI:在 USMLE 中获得 93.23% 的成绩 。 美国医师执照考试 (USMLE) 是所有在美国的医生都必须通过的一系列专业考试,共分为三级,旨在全面评估考生基础知识、应用技能和临床决策的能力,考核极为严格。 OpenEvidence的模型不仅能准确回答每个问题,还能提供答案背后的推理过程,并从《新英格兰医学杂志》(NEJM)等权威期刊中找到参考来源。 正是凭借这一能力,它在考试中发现了一个错误答案。随后,经由七位独立的医生审核,他们认同了AI的结论。 成立于2022年的OpenEvidence,已成为美国临床医生最主流的医学搜索引擎,其影响力覆盖全美10000多家医疗机构,超过40%的美国医生每天都会使用。 今年7月,OpenEvidence获得2.1亿美元的B轮融资,估值飙升至35亿美元(约合人民币251亿元)。 本轮由谷歌和凯鹏华盈共同领投,老股东红杉资本继续押注。 

2023年,OpenEvidence推出了首个在美国医师执照考试中取得90%以上分数的AI。
如今,公司的最新AI在考试中获得了满分,再次打破行业天花板。
面对全部325道题,OpenEvidence的模型均进行了准确回答,并给出了每个答案的解释,以及参考文献。
而能做到这一点,离不开公司过去半年的技术攻关,模型在推理性能上实现了显著提高。
OpenEvidence表示,其AI已经实现了“超高级医学推理”。
这意味着,模型不仅需要处理事实信息,更要深入分析这些事实背后的潜在因素,理解其深层含义,并在此基础上进行复杂推理。
正因如此,在高度考验推理决策能力、也令众多大模型头痛的Step 3(第三级别)中,OpenEvidence的表现惊艳。

尤其是,在Step 3的第125道题中,一位有长期重度吸烟史的患者计划联合使用尼古丁贴片与丁丙诺啡,需要评估该联合方案可能带来的额外风险。
标准答案是“没有增加的风险”,而OpenEvidence的AI基于FDA和美国心脏病学会的证据,认为联合疗法有增加高血压的风险。
在经过7名精神科专业医生的审核后,OpenEvidence的答案最终被证明是正确的。
这一现象揭示了AI的强大能力,尤其是在面对复杂、罕见或非常规病例时,AI可以帮助医生发现盲点,提高诊疗的安全性和准确性。
来源:智药局等
加入读者交流群:

—精彩回顾—
首个药糖尿病干细胞疗法上市在即
中国,走出一个全球First in class
mRNA 肿瘤疫苗,中国力量快速崛起
医药巨头裁员,愈演愈烈
又一巨头栽了,GSK 6.25亿项目折戟
商 务 合 作 : 杨小雨 15210041717









川公网安备51019002008863号
本网站未发布麻醉药品、精神药品、医疗用毒性药品、放射性药品、戒毒药品和医疗机构制剂的产品信息
收藏
登录后参与评论
暂无评论