第五届中国慢性病与信息大会|中国科学院大学健康医疗大数据国家研究院副院长靖瑞峰:健康城市战略下多维多源健康医疗大数据平台的建立

汇报一下中国科学院大学健康医疗大数据国家研究院围绕健康城市和健康医疗大数据的挖掘应用方面我们实践的案例和思考跟想法。

作者: 本站编辑 来源: 大健康派 2019-11-10 12:11:17

2019年11月10日举办的“第五届中国慢性病与信息大会”,聚集了国家卫生健康委领导、各级医疗机构及体检机构、社区卫生服务中心、康复机构、疾控系统专业人员、医学院校和科研院所人员、医疗健康服务企业等近五百人的关注,共同探讨了慢性病综合防控、国际慢性病防控经验、慢性病防控信息化、5G智慧健康等主题,解密了健康中国下信息技术对慢性病防控的推动力。中国科学院大学健康医疗大数据国家研究院副院长靖瑞峰发表《健康城市战略下多维多源健康医疗大数据平台的建立》主题演讲。

_M0A2437.JPG

 

靖瑞峰:各位领导,各位专家,非常感谢有这个机会汇报一下中国科学院大学健康医疗大数据国家研究院围绕健康城市和健康医疗大数据的挖掘应用方面我们实践的案例和思考跟想法,有些是我们已经做的,有些是我们在思考和筹划的过程中,今天一并给各位专家进行报告。

    

报告分三个层面,第一是整个背景分析,主题是围绕健康,健康的本质到底是什么,从基础医学角度我们认为是不同程度的基因和环境的相互作用影响的,右边这个图是两个对着的三角,下面是遗传因素,上面是环境因素,包括了自然环境和社会环境,偏左边的是单基因决定的,不管外环境是什么,疾病自然要发生,偏右边可能环境所占比重更大,像传染病等等,中间部分是基因和环境持续性的相互作用,很大一部分是慢性病,在整个健康组成当中占比和危害程度都是非常高的,慢性病发生的特点一个是涉及到环境的多样性,一个是时间跨度往往比较长,还有跟遗传背景的一致性有非常大的关系,三个方面的关系恰恰需要我们运用健康医疗大数据特殊的资源,对它进行相应的研究。

    

健康医疗大数据面临的挑战,我们总结了四个方面,一是采集的问题,数据获取难,现在数据都作为个人的资产,包括行业的资产,单位的资产。二是本身拿到的数据质量太差,源头质量处理成本太高。三是如何应用,多源头的数据统筹治理与多样化的应用相脱节,现在很多大数据的应用基本都是某一个单位或者某一个行业,能不能建立多元的数据汇聚,面向多主体自主性的应用。四是涉及到政策和机制,缺乏合规的数据资源的公共应用环境,现在可能也有很多基于大数据的科研成果,有些科研成果不敢发布,因为它的数据来源存在一些伦理性或者法律行的问题,能不能建立合规的数据资源的公共用的环境,这是我们对这个的理解。

    

具体怎么做这个事情我们提出自己工作的思路,就是打造健康医疗大数据的生态系统,有几个特点,一定是涵盖了跨机构、多场景的数据采集、整合和治理的过程,要能满足多主体数据创新研发需求的公共环境,是工程级的,不是面向单独机构,仅仅是做配合的,这样的公共环境有几个特点,一是基于健康危险因素数据的采集维度,既然要关心健康,健康的数据来源一定要综合涵盖生物的因素和环境的因素,包括社会决定因素等等。二是深度介入并融合业务应用产生的高质量,要保证数据质量一定要介入到业务数据生产环节。三是通过数据融合和多主体的公共应用产生数据,一定能面向政产学研,完整覆盖数据从采集到增值的全过程全周期,这是我们定的一个目标和工作的思路,我用了一张图,我们整个业务生产过程一定要介入,业务采集过程介入到业务生产的过程,换句话说要介入很多的信息化系统当中,在这个系统中进行了第一次数据的采集和治理,建立了人的健康为主体的数据汇集,所以涉及到电子病例、环境、检查检验等等一系列跟健康有关的。

    

这次的数据治理主要是服务于业务应用环境,未来数据增值和创新,我们要把数据的颗粒度进一步的细化,比如未来的血压,血压值可以代表某个人某个时间某个地点某样家族关系某样的遗传环境等等,我们要把数据进一步的颗粒化,进一步的细致化,大数据是要建立相关关联性的,所以我们进一步细化之后再支持科研创新和产业应用等等一系列,前两个阶段主要是赋能业务,同时产生好的数据,后两个阶段是治理数据,更大层级的面向工程级的应用和增值。

    

第一部分是我们要基于健康的危险因素,在一个城市做更多的数据采集,积极的借助健康城市的概念,健康城市当然国家有相应的定义,服务、环境、保障、产业是一个角度,另外一个角度是以居民健康为中心的城市资源配置方式和运行机制,卫生健康服务系统核心要真正解决的问题,一个城市要求配什么要素,要素之间按什么规则运行,应该以居民健康为中心,这应该是健康城市的本源,表现出来可能有产业,有服务,有环境,这个过程中的核心就是供需双方的精准匹配,居民的健康状况是什么样的,需要什么样的服务,卫生健康服务机构有什么样的能力,实现他们之间的精准匹配,这是未来健康城市终极的目标,这个过程中有四个方面要做:

    

一是以居民为中心的疾病健康危险因素的信息整合与量化,包括个人的生活因素,体检等一系列的信息,个人的健康还受到外界环境的影响,基础状况是这样,同时要监测外界环境因素,未来每个人在自己的手机上都有全息的数字,如果量化的话就是今天心脏是黄的,如果今天天气变冷了,呼吸系统疾病可能预警我要干什么,一定是内在因素和外在因素实时动态结合的过程,这个过程我们要评估出健康的风险,对你提供健康的建议,所以受体需方健康信息完整的量化和对外界有可能对我健康造成影响信息的整合,数据的评估和对健康的干预。

    

二是基于大数据的卫生健康服务机构之间的协同,也是分三个层面,第一个层面是整个卫生健康服务机构的资源配置是什么,基于大数据本地人群是什么样的,发生率是什么样的,年龄构成比是什么样的,决定了这个地方应该配备什么样的卫生健康服务机构,当然这是长期化的,如果细化到具体的一次过程来讲,比如遮断时间发生雾霾了,雾霾的时候可能对于我卫生健康服务机构的需求会发生很大的变化,比如呼吸系统疾病等等,基于大数据,智慧城市或者智慧医疗的大脑,能基于数据的采集,我们有每个人全维的健康状况,基于这样的健康状况和卫生资源提出这样的建议。第二个层面是单点的赋能,要对每一个卫生健康服务机构的能力最大化,每次服务过程中需要知道居民全部的健康状况,需要知道整个地区这一类疾病发生发展的规律,需要知道整个行业目前关于卫生疾病或者危险因素本身治疗的行业特点,我们要对它进行单点的赋能。第三个层面是实现他们之间的高度协同,这三点也是经济学上的概念,配置好了,每个机构的能力都发挥好了,他们彼此之间的协同是最有效的,大数据为我们量化每个医疗机构的能力提供了一次非常好的机会,我们通过监测医院的数据可以知道对某种疾病治愈的时间、治愈的周长、花费的时间和费用,我们可以把居民的状况进行量化,这是一种协同。

    

卫生健康服务机构之间的协同提出三个,一是数据的共享,二是知识的共享,三是能力的共享。数据的共享很容易理解,现在所谓的远程会诊,无非就是把健康医疗大数据从一个单位转移到另外一个单位,知识的共享其实类似于现在的辅助决策,我把知识计算化,变成一个模型,再投出去,不同医疗机构之间形成共享,比如影像辅助决策,辅助诊断,最后能力的共享,远程手术也是能力计算化之后通过远程的信息传输的,这样可以实现每一个医疗机构有我擅长的,我不擅长的需要通过数据、知识和能力之间的共享解决,这样的话形成的是一个区域级的,面向居民最优的卫生健康服务资源的整合,实现彼此之间的协同。四是实现供需双方的精准匹配,卫生健康服务机构每一个最强的机构做最强的事,整体形成最优的服务能力和居民最确切的健康需求之间形成匹配,这个匹配因为卫生的特殊性需要考虑奥成本,需要考虑到人文,需要考虑到文化习惯,不是数字世界完全理性的匹配,需要结合这些因素找到他们当中的折中点,折中点线下就是家庭医生,家庭医生之间实现匹配,脱机的就是智能,非脱机的就是辅助决策,基于这样的体系,所以未来的卫生健康城市体系从气象系统、环境系统、财政系统采集数据,中心汇聚之后我们在为每个机构做服务的时候提供数据传输。

    

这样的数据也是现在流行的词儿跨域数据,贵阳写了五本书,从1.0到5.0,跨域数据就是一个行政区域或者业务空间的数据完整的整合,最理想的数据当然是建立主数据系统,比如未来所有数据不是每个部门都自己完全录进去的,而是哪个数据在哪个行业是最关键的,最有权威性的,我们都要引用它的数据,比如收入数据应该引入人社的,医疗数据应该引入卫生和医保的,气象的数据应该引入气象部门的,各个部门用到这些数据不是你去录,而是从别的地方调取过来,我们就让分散的数据建立了纵横相互关联的信息,现在很多数据本身都是冲突的,每条数据彼此之间没有关联性,医疗系统门诊部实名,拿身份证都很难把信息关联起来,未来最理想的都是对健康主数据的体系,但是很难。我们在做健康城市过程中统一了几个主要的数据,时间、空间、法人信息、人口信息,要求每个体系录取这些数据的时候确切下来,这些数据一旦确切下来也可以建立它们之间相互的关联性。

    

我们在做健康城市直接跟地方政府合作,在全国大概有七八个地级市合作,所有数据汇集不是卫生一个部门的数据,涉及到公安、人社等一系列的数据,一定是政府牵头,数据来源、数据质量、数据业务流,有了这些数据我们在第三、第四层次希望进行数据的创新,我们叫做RDMP系统,业务产生的数据颗粒度进行细化的过程我们建立了SafeHaven,保证安全和隐私的情况下如何建立具有相应支撑环境的科研和研发环境。

    

数据中心全国有七八个地方,我们跟每个地方政府在合作的时候都会为它建立数据的治理和开放共享平台,同时又会把所有城市之间的数据进一步整合,我们提出一个观点,任何一个城市的数据接入我的生态享受到的是所有生态的数据,这个过程中我们会解决隐私和安全的问题,国科大建立中心节点,还有其他节点之间的横向交换。其实我们也研发了业务系统,拿到好的数据我们要介入到业务系统,一部分是跟业务系统直接合作,另一部分是我们自建了一些业务系统,确保数据来源的可靠性、完整性。

    

我们构建了疫苗溯源系统,在全国覆盖了几个省,从物流体系和疫苗接种体系数据都是非常完整的,基于这样的数据进行科研的话,数据质量是非常好的。我们构建了整合式医疗服务体系,基于家庭医生和居民健康状况,我们给他提供更精准的一站式的服务,我们有一个观念,每一个居民享受卫生健康服务的过程不是去挂号和排队,而是尽量通过信息化减少卫生健康服务的冗余环节,通过建立整合式医疗服务体系基本上可以做到对居民健康状况,所有的健康档案汇总、评估,包括我们用了CDSS辅助诊断系统,家庭医生不一定要治疗,至少可以诊断,基于健康状况可以一站式的到床边到机器边,到诊桌前,让老百姓通过家庭医生这一站直接享受到卫生健康服务,相应的预约、挂号、付费等等完全可以在信息化系统解决,当然这个过程我们要统筹区域信息化和现在的互联网医疗,包括互联网医院等等资质,统筹使用,这种统筹使用就避免了传统互联网医院是医院对居民的点,我们是所有医院构成一个云,面向家庭医生,由家庭医生面向居民,整个卫生健康服务的云是为家庭医生面向居民全程服务提供支撑的,这个过程我们汇聚到了居民所有的数据,未来医疗服务的社会化服务机构都会在这个云上,居民所有享受服务的过程,哪怕做一次足疗和运动的数据都会在里面,基于这样的数据我们进行研究,它的意义和价值就是非常庞大的。

    

取得的成效,精准医疗,有了数据我们也训练出了脑卒中人工智能智能影像诊断,未来会大量产生,包括基因芯片,适合中国人群特异性的低成本高精度的芯片,现在单基因糖尿病的芯片我们也研发了,精准检验,配合在一些地方建立的精准医学检验中心,检验的数据质量可控,我们数据采集一直都在介入业务生产过程,全国从科学院来讲不像卫健委需要这么多数据的汇总,全国具有代表性,十个八个,每个地方千万级的人群就足以支撑科研和产业,不需要多少亿人的数据去用,所以我们在地方做了布局,包括精准的健康管理,过敏人员疾病防控系统在不停的研发,多种慢病环境基因相互作用的风险模型,现在都有电子手表,我们会基于电子手表,基于大数据,测算出来低血糖的防控可以跟手机APP结合,及时的提醒等等。

    

谢谢大家。

    

    


第五届中国慢性病与信息大会 医疗大数据 健康城市

关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯