北京胸科医院重磅发布肺部CT影像精标注数据集!含2万例精标注数据
2025年12月31日,北京胸科医院与北京医疗健康大模型有限公司联合构建的“肺结核CT影像精标注高质量数据集”(含2万例精标注数据)正式发布。
2025年12月31日,在“北京市健康医疗高质量数据集宣介会”上,北京胸科医院与北京医疗健康大模型有限公司联合构建的“肺结核CT影像精标注高质量数据集”(含2万例精标注数据)正式发布。
据悉,北京胸科医院在北京市卫健委指导下,历时多年打造了该数据集,堪称胸部疾病领域影像数据资源的最高标准。该数据集涵盖2012年1月至2024年6月12年间的20000例确诊肺部疾病患者的完整影像资料,数据体量达6TB,以源自临床PACS系统的标准CT影像DICOM格式,配套NRRD格式像素级分割掩膜文件,通过17个特征性语义标签实现精准标注。
北京胸科医院组建了全国胸科医生联盟,从24省市、120余家医院、2000余名三甲专家遴选出200余名具备标准化标注能力的影像医生,采用“标注+审核+验收”的三级质控标准化体系层层把关,结合基于阈值分割法的精准标注规则,准确标记病变,彻底摒弃传统粗标注的局限性。数据包含不同严重程度、治疗阶段及全年龄组患者的门诊与住院数据,整合病历、影像、检验等多元信息,20000例450万张1.25mm薄层CT影像为临床研究与技术研发提供了海量、全面、深度的数据源。且所有数据均完成严格脱敏与匿名化,在遵循DICOM脱敏标准的同时,确保不含任何隐私信息,为数据安全合规交易奠定基础。
此次发布的数据集已形成完善的交易服务体系,涵盖数据加工与标注服务、标准报告数据服务、临床数据信息分层服务、特殊采集与原始数据服务等多元化产品,针对肺癌、慢阻肺、肺脓肿等其他肺部疾病也提供定制化原始数据服务,并配套专家售后咨询、年度技术顾问、定制化培训等专业支持,满足不同合作方的差异化需求,将在临床诊断、AI研发等领域释放巨大价值。
据介绍,依托“医院+企业”协作模式,北京胸科医院仅用时3个月就高效完成了高质量数据集生产全流程,形成了可复制、可推广的行业范式,为降低行业高质量数据生产门槛提供了实用路径。北京胸科医院正以该数据集为基础,拓展全肺部疾病多模态数据集构建与大模型研发,面向高校、科研院所、算法团队开放科研合作,助力肺结节分级、支气管扩张、间质性肺病等多场景AI模型研发与临床应用。
关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯


