微软迈向“医疗超级智能”
微软人工智能部门首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)表示,该公司已在“迈向医疗超级智能的道路上迈出了重要一步”。
微软为此项目从谷歌招募了多名AI研究人员,再次凸显了科技行业对顶尖AI人才的争夺之激烈。微软人工智能部门首席执行官穆斯塔法·苏莱曼本人此前也在谷歌负责AI业务。
微软人工智能部门首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)表示,该公司已在“迈向医疗超级智能的道路上迈出了重要一步”。这家科技巨头宣称,其强大的新型人工智能(AI)工具在诊断疾病方面,准确率是人类医生团队的四倍,且成本显著降低。
实验旨在测试该工具能否正确诊断患者疾病,模拟了通常由人类医生完成的工作流程。
微软团队利用《新英格兰医学杂志》上的304个临床案例,设计了一项名为“序列诊断基准”(Sequential Diagnosis Benchmark)的分步诊断测试。该测试要求语言模型像人类医生那样,将每个病例分解成做出诊断的逐步流程。
随后,研究人员构建了一个名为“MAI 诊断协调器”(MAI-DxO)的系统,该系统整合了包括ChatGPT、Gemini、Claude、Llama、Grok和DeepSeek在内的多种领先AI模型,模拟多位人类专家协作会诊的模式进行诊断。
实验中,MAI-DxO的表现完胜人类医生,准确率高达80%,而人类医生的准确率仅为20%。同时,通过选择更经济的检测和治疗方案,该系统还降低了20%的成本。
苏莱曼表示:“让多个AI智能体以‘辩论链’的方式协同工作,将推动我们更接近医疗超级智能。”
AI已在医疗行业的某些细分领域广泛应用,例如辅助放射科医生解读影像。尽管AI医疗应用也引发了一些特定问题(尤其是训练数据偏向特定人群导致的偏见),但最新的多模态AI模型有望成为更通用的诊断工具。
据悉,微软尚未决定是否将该技术商业化。但一位匿名的高管透露,未来可能将其整合到必应(Bing)搜索引擎中,帮助用户初步判断病情。该公司还可能开发新工具协助医疗专家优化流程,甚至实现患者护理自动化。苏莱曼表示:“未来几年,我们将开展更多工作,以验证这些系统在真实场景中的表现。”
该项目是众多AI疾病诊断研究中的最新成果。过去几年,微软和谷歌均发表过论文,证明大型语言模型在获得医疗记录访问权限后,能够准确诊断疾病。
微软新研究的不同之处在于,它更精准地模拟了医生的诊断方式——通过分析症状、安排检查、深入分析,逐步得出结论。微软在其项目博客中,将这种整合多个前沿AI模型的方法称为“通往医学超级智能之路”。
该项目还表明,AI或有助于降低医疗成本。“我们的模型表现卓越,不仅能准确诊断,还能以极高的性价比达成目标”,项目参与者、微软副总裁多米尼克·金(Dominic King)说。
麻省理工学院科学家、医疗AI初创公司Layer Health联合创始人大卫·桑塔格(David Sontag)指出,该研究意义重大,不仅因其更贴近医生实际工作方式,还在于对基础方法论潜在问题进行了严谨处理。但他也提醒,需审慎看待微软的研究结果:实验中医生被要求不得使用任何辅助工具,这可能无法真实反映临床实践。他补充道,AI系统能否在实际应用中显著降低成本仍有待观察,因为医生可能考虑了AI无法顾及的因素,如患者对手术的耐受度或特定器械的可用性。
斯克里普斯研究所科学家埃里克·托波尔(Eric Topol)认为,这项研究令人印象深刻,因为它处理了高度复杂的诊断案例。他补充说,从理论上证明AI能降低成本具有创新意义。
托波尔和桑塔格均表示,在微软系统全面应用前,下一步需通过临床试验验证其潜力——将AI诊断结果与实际医生治疗真实患者的结果进行对比,才能对成本效益做出严格评估。
论文链接:https://arxiv.org/abs/2506.22405

关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯