弓孟春:我在疫区进行健康医疗大数据治理的经验

所谓治理,就是为了运用数据的力量,必须在疫情爆发的特殊情况下,科学安排数据的采集、整理、分析,并兼顾合规、隐私保护、硬件、软件和人员。

作者: 相海泉 古云霞 来源: new healthcare 2020-03-09 11:15:32

我主要想分享“在爆发性传染病流行期间健康医疗大数据的治理”。所谓治理,就是为了运用数据的力量,必须在疫情爆发的特殊情况下,科学安排数据的采集、整理、分析,并兼顾合规、隐私保护、硬件、软件和人员。南方医科大学南方医院朱宏书记总结洪湖的疫情管控模式为“政府统筹、专家主导、全民参与、数据支撑”。这很好地提炼了疫情期间数据治理的方法精髓,也是我在工作中遵循的主体思路。


医疗信息化专家、广东支援洪湖医疗队信息化工作负责人 弓孟春博士


制度建设与政策支持需加强


疫情期间的数据特别是临床数据,因为可以为后续其他国家和地区的诊治提供经验,所以社会影响相对较大,且研究价值高。这种数据既重要又敏感,因此其治理需要公共卫生部门的主导和支持。如果有一些政策性的文件支持和适用性的法律保障,对于未来可能的传染病爆发期间数据快速汇集会有很大的保障。


现在来看的问题是数据共享困难。疫情条件下技术支持和人员的限制是一方面原因,没有相应的政策和法律指导,数据共享中对于数据安全和患者隐私的考量、审批的流程和机制无可借鉴的经验等,也都是重要的制约因素。如果想要改观现有情况,需要政策和制度的预先设计,我们建议在疫情后开展相关工作。同时,吸取这次疫情中国内外积累的经验,在分析和治理数据方面形成一套行之有效的体系,也许可以引领国际社会的形成相关的共识。


数据治理体系建设


第一,从实际情况看,数据还存在无效流转现象。主要的问题包括了格式不统一(照片、PDF、word等),让后续的数据处理和分析变得很困难;数据汇报机制不统一,也给数据溯源造成了困难。临床机构在数据上传方面没有进行较好的协调,包括上传的频次、时间,本地上传人员、安全、机制等方面,目前仍缺乏可遵循的方案。


广东援洪湖医疗队依靠当地政府的强力主导,制定了一套临时性策略,很多数据均通过手工按照规定格式导出,然后按照规定的安全通道上传至当地政府主导的数据平台,最后按照规定的一致的技术方案对数据进行解析。整个平台处于政府相关部门的的控制下。未来各地可针对类似情况做出预案,这样在一些突发情况下可以更高效应对。


第二,公共卫生机构和临床数据是割裂的。目前,我国的公共卫生监测数据在专属的系统内独立运行,而临床数据大多存在医院的系统中,两个系统的数据很难对接。在某个时刻下,对于某个特定区域的病例数的统计有可能会不一致,是统计口径和消息流通效率不同导致的。诊断信息、核酸检测信息可能先上报到公卫系统,一定时间后才能通知到医生,再加上写入病历也需要一定的时间,就造成了在不同时间节点上统计出来的信息存在区别。


建立公卫系统和医院临床系统的数据协调机制,是一个很重要的课题。


除此之外,还有其他类型数据,比如一些居民健康状况上报系统,这些系统的数据如何与公卫及医院临床数据形成一个集中式数据池,也是一个很重要的研究方向;还有医学隔离人员观察点的数据的采集和汇集问题。具有高危地区或人群密切接触史的人员的数据如何横向比对、匹配,比如,有多少人在住院,有多少人在隔离,这些信息在原来的数据治理体系下统计非常困难,从而很难进行整体决策。关于这些,在洪湖我们进行了有益的尝试。

在国家机构主导下的数据共享共治以及信息的及时发布和沟通,各个机构或体系做好预案和协调,是整体治理体系建设上需要迈出的重要一步。


弓孟春博士在洪湖市某地方医院调研院内信息系统


由于不同数据来源不同,如源自患者、医院、公卫、移动端以及依靠手工填写的纸质表格等,如果不借助云端硬件能力,很难实现数据汇集。各种数据来自不同平台、机构甚至地域,而且时程很长,要随时准备拓展功能及提升性能。因此,我建议在大数据治理体系搭建过程中在保证安全的前提下优先选择基于云服务的硬件方案。


此外,从现实角度考量,在疫情特殊时期采购硬件较为困难。当时整个洪湖地区的服务器购买调配很困难。在爆发疫情的情况下,如果进行了交通管制、隔离,采购、部署实体硬件并不现实。


还有一个重要考量是,数据处理及数据分析人员包括数据产生的服务受众分散较广,在条件受限的地区很难找到高级别的团队,如果能选择远程工作体系和空间支撑,借助全国各地专家的智慧和力量,就能帮助局地解决很多问题。


各地卫生主管部门和公卫部门制定相应的应急预案,一旦出现类似情况,便可紧急启动全区域全人群的疫情监控体系,可以实时掌握发病情况,帮助政府和临床做决策。


数据汇集


首先,根据疫情的发展,采集数据会出现显著的变化。数据采集是否完整往往会影响分析决策。在疫情爆发的早期阶段,由于对疫情的理解有限,可能会有各种不完善的情况,如果没有应急预案,会不得不临时采取各种应急办法。比如,有些医院需要紧急完成返修,仓促返修后医生和患者直接进驻医院,但是连基本的电子病历、HIS等信息系统都没有,数据采集随之会遇到很多的问题。后期随着政府组织协调能力逐步加强,这些医院的信息化设备也会更加完善,特别是一些支援到来后,形势会变得更好。


第二,不同机构来源的数据质量有很大差别。数据质量的差别除了与系统本身有关外,也与临床培训管理的规范严谨程度有关。比如在此次疫情中,因早期对疾病的认识不足或要求不严,某些疫情早期的临床记录中缺乏对某些重要临床指标的描述,无法进行数据追溯,影响了数据的分析。


  第三,重点疫区数据共享压力很大。重点疫区的数据指导性强,临床研究价值高。由于大众对重点疫区的关注度很高,无形中让疫区相关部门的数据共享的压力很大,局地提取和共享数据比较谨慎。此时就需要行政、法律法规的保障,来消除重点疫区的紧张和顾虑,让这些数据及时被提取和共享。


另外,还有患者的身份识别问题。患者中存在很多重名现象,没有身份识别信息,让确诊、集中管控和重点跟踪人群等都会变得很困难。所以,我们在洪湖要求在数据采集时必须保有身份证号。当然,身份证关联个人信息较多,比较敏感,但在特殊时期,要想实现追踪和防控,只有保证识别信息的准确性。我们的经验是,在数据分析时,必须施加各类脱敏技术,严格遵循个人隐私保护的技术规范,同时要求所有参与项目的人员签署数据保护承诺书。


另外需要注意的是,如果收集信息时,重点跟踪事件或者个人如果没有带出社区信息,就很难跟下一步的工作流程对接,无法形成闭环。我们在洪湖的平台,居民如果上报发热或者有症状,平台会尽快把异常人群统计出来,依据其住址信息通知社区网格管理人员,后者收到信息后就上门核对信息并进行处理。另一方面,在信息采集时还会问最近有没有社区管委会人员上门,形成了考核机制,这就在管理上形成了闭环,督促社区管理人员的工作。最终,洪湖的居民健康状况上报系统达到了超过97%的现住人口覆盖率,并保持每日70万以上的填报量,为疫情的联防联控发挥了重要的支撑作用。


很多一线的经验,都是一些很小的细节,但是可以带动整个闭环的完成,带动工作的推动。


在数据格式方面,包括完整性,连续性、患者索引、机构索引和标识、上传规范性和安全性等,都是数据集中过程中会遇到的问题。建议国家在未来制定整体预案,即在紧急状态下数据协调过程中大家需要遵从的规范和标准,规定好医院在特殊时期数据互联互通模型、语义、接口的标准,一旦发生紧急公共卫生事件,可以迅速完成数据汇集。


数据标准化


数据标准化是基础性工作,不是疫情期间短期内能做好的。但是回头反思一下,我国医疗信息化三十年来取得了很多成绩,为什么数据标准化方面还有很多薄弱点?除了诊断编码,语义、检验、用药等编码标准化工作的执行都很不理想,这其实需要在信息化底层建设中早做准备。


我们现在拿到各个机构上报的数据后,需要对症状、体征等关键临床信息进行提取,然后进一步同义词和近义词的匹配和控制,并进行统一的转换,耗时耗力。特别是涉及到机构、跨地域、跨学科、跨平台的数据时,一旦底层标准不一致,汇集起来是非常困难的。


我们建议,未来医疗和公卫系统用到的数据标准化的基础架构要先做,这样才能在未来应对各种紧急公共卫生事件时,快速有效地获得数据的整合结果,通过数据分析更有效地找出最佳解决方案。


数据安全和隐私保护


首先,人为方面,做好数据安全需要管好碰触数据的人员。比如洪湖地区项目的开展,在项目启动前我花了一个下午给所有人员培训数据安全和隐私保护,他们都要签署承诺函。规范好基本原则,明确哪些数据可以公开,哪些是隐私数据,并规定违反协议的惩罚机制,这样就从人为方面卡住了数据违规泄露。在数据处理团队的工作现场有一个独立的安全核查员,每天的工作就是看哪些人做了违反安全规范的操作,发现违规后会立刻纠正,并形成每日安全报告,独立汇报至管理团队。屡次触犯的,将被禁止到现场工作。


其次,在云服务上进行技术操作,要在技术层面保证数据的安全。中文临床数据的脱敏是我们技术上的独特优势,对于数据脱敏后的再识别风险的量化是制定安全管控策略的重要参考指标。在常规的网络安全措施的管控下,严格的审计、敏感数据的隔离等技术的应用为数据安全提供保障。


几个“不可思议”的现实问题


办公条件:在疫情条件下,现场办公条件的配置会面临种种挑战。对信息化来说,首先要保证信息安全和系统运行稳定,而人员的办公条件往往很难保证,只能各种应急。在指挥部的协调下,我们信息组办公室配备了电脑、打印机和展示设备,已经是我能想象的最好条件了。


广东省援洪湖医疗队部分专家在洪湖市某医院现场办公


交通:因为疫区隔离,技术人员到场支持变得非常困难。因为道路是全封闭的,所以跟各个医院的技术沟通主要依赖本地技术人员通过远程进行一对一指导。


电力:临时搭建的医院电力有可能会出现一些状况。我国基建比较好,电力一般不成问题,但是在其他自然灾害的情况下就未必,电力也是需要注意的一个问题。


工作人员健康:疫情期间工作紧张,我们的团队经常连续熬夜奋战。而许多临时的数据统计查询也使得工作人员需要24小时响应,其健康状况也需要格外关注,特别是在疫区前线工作的人员和在密闭办公环境下长时间工作的人员。


结语


整个过程中,我们经历了很多困难。回过头来看,这些问题都不应是“临时抱佛脚”来解决的。疫情相关数据的实时监控、公众关切的及时应对、政府资源的有效调配以及医疗机构的临床决策支持,这些应该有很好的预先准备。除了政策和法律的支持,数据标准化的工作和医院的信息化基础建设也至关重要。医院、卫生主管部门、公卫系统、卫生信息化主管部门要形成公共卫生紧急状态下的联动预案,为更好地应对新发重大传染病做好准备。


本文转载自其他网站,不代表大健康派观点和立场。如有内容和图片的著作权异议,请及时联系我们(邮箱:scarlet.s@djkpai.com)


医疗健康大数据 新冠肺炎 疫情

关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯