(资料图)
尽管人工智能(AI)在医疗领域的应用日益增多,但其“像医生一样思考”的能力仍存在明显短板。由美国麻省总医院MESH孵化器团队开展的一项最新研究发现,生成式AI在临床推理关键环节仍显不足,尚不具备独立承担临床诊疗任务的能力。相关成果发表在最新一期《JAMA Network Open》上。
团队选取包括ChatGPT、DeepSeek、Claude、Gemini和Grok在内的21种大语言模型,在29个已发表的临床病例中进行测试,并通过逐步提供患者信息(从基本症状到实验室和影像结果)来模拟真实诊疗过程。结果显示,当获得完整信息时,所有模型在超过90%的案例中能给出正确的最终诊断。
然而,在关键的早期诊断阶段,这些模型普遍表现欠佳。研究发现,超过80%的情况下,模型未能提出合理的“鉴别诊断”,即对多种可能疾病进行系统性分析与筛选。这一能力被认为是临床推理的核心,也是医生决策的重要基础。
为更全面评估模型能力,团队提出了一种名为PrIME-LLM的新指标,从提出潜在诊断、选择检查手段、给出最终诊断到制定治疗方案等多个环节对模型进行综合评价。结果显示,各模型整体评分在64%至78%之间,表现存在明显差异。
团队指出,大语言模型更擅长在信息完备的情况下“给出答案”,但在信息不充分、需要开放性推理的情境中表现较弱。随着实验室数据和影像资料的加入,模型表现有所提升,且新一代模型整体优于旧版本,表明相关技术正在持续改进。
团队表示,当前大语言模型尚不适合在缺乏监督的情况下直接用于临床实践,其价值更在于辅助医生决策,而非取而代之。(记者张佳欣)
- 通讯!AI尚不具备独立临床诊疗的能力
- 【报资讯】马斯克旗下X独立通讯应用XChat即将上线
- 新动态:有潜力的仿制药龙头股有哪些(3/25)
- 每日快看:润贝航科:2025年净利润同比增长107.72% 拟10转4派4.36元
- 机构席位买入713万 北交所上市公司赛英电子登龙虎榜-焦点关注
- 天津港保税区海工产业链延伸至深海系泊领域 报资讯
- 节能环境:公司高度重视市值管理
- 生意社:4月13日安徽昊源PA66装置动态
- 贵阳贵安部分公交线路优化调整
- 生意社:4月13日中石化华南公司甲苯挂牌价格
- 内蒙古养老服务消费补贴惠及失能老年人超10万人次
- 基金经理布局创新药对冲组合风险 公募对创新药配置逻辑出现新变化_观速讯
- 新股提示:北交所鸿仕达今日申购
- 毕尔巴鄂竞技vs比利亚雷亚尔:拉波尔特、尼科-威廉斯首发,赫拉德-莫雷诺、雷纳托-韦加出战
- 襄阳建成消费“三新”储备库 首批28个入库项目预计今年6月完工
- 焦点热讯:一杯好茶为春日经济“上分”
- 焦点讯息:圣阳股份:连续2个交易日收盘价涨幅偏离值累超20%
- 当前聚焦:大伟侃球⑥|客场失利见不足,五溪勇士主场迎战岳阳全力冲胜
- 电解水公司名单在这!(2026/3/25)
- 塞维利亚球员对阵马德里竞技的表现
- 外套一脱直接跳,广州75岁阿伯勇救落水女子,“救人只是本能”_新要闻
- AI算力需求激增,美科技巨头联手布局小型模块化核电-每日播报
- 今日热讯:浙江龙盛等公布“一种分散橙红色染料组合物、染料制品及其应用”专利
- 当前热讯:演员吕严吃面加葱花被拒,遇见小面致歉
- 当“SBTI”遇到五大联赛,看看这些官号都玩儿了什么梗?|焦点速递
- 防雷:盘后3股被宣布减持|焦点要闻
- 【聚看点】立讯精密成交额创2025年9月29日以来新高
- 历时160天 第42次南极考察“雪龙”号“凯旋”(组图)
- EDA概念上市公司排行榜:2026年3月25日成交额前10名单
- 武汉市洪山区成雨商贸经营部(个体工商户)成立 注册资本1万人民币|焦点快报




