研究表明21种主流大模型尚不具备独立临床诊疗能力

2026-04-19 10:41:27 产业资讯

美国麻省总医院MESH孵化器团队在《JAMA Network Open》发表最新研究成果，对ChatGPT、DeepSeek、Claude等21种主流大语言模型进行临床测试。结果显示，当获得完整患者信息时，所有模型在90%以上的病例中能给出正确最终诊断，但在早期诊断阶段表现欠佳，80%以上的情况下无法提出合理的“鉴别诊断”——这一临床推理的核心能力。研究团队提出PrIME-LLM新指标，综合评估模型从诊断到治疗方案制定的全流程能力，发现各模型整体评分仅在64%至78%之间。团队强调，当前大模型更擅长“信息完备下的答案输出”，不适合无监督直接用于临床实践，核心价值在于辅助医生决策，而非取代医生。

免责声明：本站所有信息均来源于互联网搜集，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻删除。

从东到西：全国 AI 扶持政策全景扫描

截至 2026 年 4 月，全国各省（市、区）均已围绕 “AI+” 规模化应用出台专项政策，形成技术攻关、算力支持、资金补贴、场景落地、人才引育五大核心抓手，并

产业资讯
2026-04-23
856
国家力推 AI+，千行百业智能升级

2025 年 8 月 26 日，国务院正式印发《关于深入实施 "人工智能 +" 行动的意见》，标志着 "AI+" 从产业

产业资讯
2026-04-23
542
谷歌发布 PaperOrchestra：

面对科研写作周期长、文献梳理繁琐、格式要求复杂等痛点，谷歌云推出全新 PaperOrchestra 多智能体协同框架，通过专业化分工智能体，实现学术内容全自动生

产业资讯
2026-04-16
610
科大讯飞 AstronClaw 4.0

近期，科大讯飞正式推出 AstronClaw 4.0 智能体平台，实现从桌面端、移动端到物理空间的全场景覆盖，标志着智能体正式走出屏幕，进入现实世界执行任务。新

产业资讯
2026-04-16
790
月薪2万养不起一只“龙虾”？OpenCl

最近的朋友圈，彻底被一只“龙虾”霸屏了！有人斥资500块求上门调试，有人晒出“养虾账单”直呼顶不住，甚至有月薪两万的白领，竟被这只“赛博宠物”直接掏空了钱包。这

产业资讯
2026-04-09
952

微信客服