医疗幻觉率低3倍!百川发布循证增强大模型M2 Plus
10月22日,百川智能发布了循证增强医疗大模型 Baichuan-M2 Plus,同步升级配套应用百小应并开放 API。
10月22日,百川智能发布了循证增强医疗大模型 Baichuan-M2 Plus,同步升级配套应用百小应并开放 API。
评测显示,M2 Plus的医疗幻觉率较通用大模型显著降低,相比DeepSeek低约 3 倍,优于美国最火的医疗产品 OpenEvidence,可信度比肩资深临床医生水准。
据介绍,M2 Plus首创六源循证推理(EAR)范式,打造“医生版 ChatGPT”,让大模型技术在辅助临床诊疗场景迈过“敢用、可用”关键门槛。M2 Plus主动屏蔽了互联网的非专业信息来源,只使用权威来源的医学证据,在此基础上构建了从证据、到实践、再到真实世界反馈六层证据类型的知识体系。

其中,原始层回答“事实是否存在”、证据层回答“结论是否一致”、指南层回答“行业如何规范”、实践层回答“医生应如何决策”、公共层回答“患者应如何理解”、真实世界层回答“是否存在新风险”。让模型从“生成答案”走向“据实回答”,实现了从语言可信度到知识可信度的跃升。
在循证检索方面,M2 Plus采用PICO框架(人群Population、干预 Intervention、对照 Comparison、结局 Outcome),将医疗查询转化为结构化问题,并在六源数据库中进行分层匹配,确保检索到的信息精准可靠。该模型的独特设计还允许医生在面对复杂的医疗问题时,获取到高等级、可信的医学证据,大幅提升了医疗信息的使用效率。在回答医疗问题时,引入 “循证增强训练” 机制,让模型改变生成逻辑,学会“引用,而非臆测”,使得M2 Plus的回答几乎杜绝了“无中生有”,在病史分析、诊断思路、治疗方案等真实复杂的核心医疗场景中,达到了与人类资深临床专家同等的可信度。

公开信息显示,M2 Plus在美国执业医师资格考试(USMLE),中国执业医师资格考试(NMLE),中国硕士研究生招生考试临床医学综合能力(西医)考试,以及日本、英国、澳大利亚等国高级医师职称晋升考试中,都取得了可观的成绩,证明M2 Plus在复杂医学知识运用上的能力已超越人类医生水准。

百川智能此次还宣布,接入 M2 Plus 的百小应已在各大手机应用商店更新,成为"医生版 ChatGPT",网页版(ying.ai)也同步上线。Baichuan-M2 Plus还提供了标准化 API 接口,供医院信息化部门、互联网医疗、大健康服务等各类泛医学机构,以及从事医疗 AI 行业的开发者接入使用。
关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯


