第五届中国慢性病与信息大会 | 北医三院临床研究中心李楠博士发表演讲

2019年11月10日举办的“第五届中国慢性病与信息大会”,北医三院临床研究中心李楠博士在大会报告环节做了题为《数据支持下面向需求的快速证据产出》的演讲。

作者: 派派 来源: 大健康派 2019-11-10 12:15:16

2019年11月10日举办的“第五届中国慢性病与信息大会”,聚集了国家卫生健康委领导、各级医疗机构及体检机构、社区卫生服务中心、康复机构、疾控系统专业人员、医学院校和科研院所人员、医疗健康服务企业等近五百人的关注,共同探讨了慢性病综合防控、国际慢性病防控经验、慢性病防控信息化、5G智慧健康等主题,解密了健康中国下信息技术对慢性病防控的推动力。


北医三院临床研究中心李楠博士在大会报告环节做了题为《数据支持下面向需求的快速证据产出》的演讲:

 

李楠.jpg 

 

谢谢各位,非常荣幸能有机会跟大家分享一下我们做的非常微观的课题和经验。前面很多领导和前辈从宏观层面高屋建瓴地说了一下健康大数据的机会在哪,能做什么事,真正在这个领域里做研究实现健康大数据的功能,包括应用大数据产生证据的人是什么人,可能更多的是基层的实践者,他们要把这个东西应用起来。应用起来的时候需求在哪,问题在哪,我们在一线做了一些工作,也有些小的经验,拿出来跟大家分享一下,希望各位前辈们批评指正。

    

我们自己的需求是什么,我们认为现在最核心的需求就是怎么样在数据的支持下,面向实践需求做一些快速证据产出。现在不管是公共卫生问题还是临床对慢病患者的实际干预,我们需要的是证据来指导实践。很多研究者在这个领域里经常会有一个想法,这个领域我们有信息化就够了,有数据就够了,数据拿过来以后一定可以直接指导实践。在数据面前已经有的摸出来的实践经验可能就不那么重要了,甚至觉得大数据分析得到的结论直接代表了真实世界的场景。觉得数据不够大,存在信息孤岛的时候,这对一线工作人员来说是没有什么利用空间的,还会觉得面对海量的数据,一线研究者已经不再有能力领导一个面向需求的证据产出的研究了。

    

这样的认识对吗?背后有问题吗?“需求”推动的证据进步,先从一个小例子开始,如何看待需求推动的证据进步,这个案例是我在实际工作中参与慢病研究的时候碰到的。有一个研究者提出了一套慢病管理的思路,他认为非常有效。缺血后卒中,卒中之后又幸存下来的人进入了慢病管理的范畴,因为卒中的复发、痴呆、肢体残疾以及后续的疾病开销等等都是一系列相当大的问题,其中最关注的是复发事件,非常严重,三年累计能到25%,有的文章报道五年差不多能到50%的复发。对一线慢病管理者来说最重要的问题就是如何有效的开展二级预防以及如何有效的控制复发风险。

    

面对这样的问题难道现在没有证据吗?基于以往的慢病研究来说,证据量非常大。包括哪些方面,急性期启动二级预防是不是有效,康复期规律的监测能不能进一步降低复发风险以及卒中预防的三大基石,降压、降脂、抗板,实际达标情况怎么样,患者复发风险模型的构建,塔顶类药物长期应用的卫生经济学评价,这些问题已经被回答遍了。但这些问题在实际工作当中有用吗,很多一线的工作者会觉得无处安放这些证据,真正实践过程中的痛点在哪,证据和痛点真的相符吗?

    

不妨针对真实对证据的需求本身先做做分析,再看看到底需要的是什么层级的证据。对这个研究者来说,他面临的SWOT是这样的框架。

 

优势是核心机构,下面有一大批医联体的单位支持我,医联体社区平台是它的优势,核心医院的诊疗是他的技术优势,而且已经有成功经验,他在非常优秀的社区做了一个示范,他发现能把三年25%的复发率降到5%。劣势是什么?所有干预过的社区都没有完整的随访信息,想做回顾性研究都做不了,同时机构间的数据是孤立的,虽然有很多医联体的小弟,但是拿不到人家的数据。机会是什么,像这种医联体的模式是不是全国大面积推广,所以大家对这种模式下如何开展二级预防都很关注。高危人群是可识别的,有各种各样的模型,基于高危人群的识别做针对性的早期干预来降低复发风险,这件事对核心医疗机构来说是可接受的,真正的威胁是现在面临的威胁,长期干预是不现实的,人群如果都放到核心医院这件事也不现实。

    

面对这种场景的时候,真正的证据需求还是刚才那些东西吗,似乎就变了,我们的需求是什么?如何在有限的工作量下降低控制疾病复发这件事的难度,我们要让它变得可行,不是没有证据可用,而是这些证据用不了。潜在的证据是什么,识别高复发风险人群并且进行精准的二级预防是不是真正有效的办法,回答这样的问题想必首选方案一定是用现有数据,现有医联体的框架下在一些省市,比如说上海深康系统下已经能非常好的回答这个问题了。

    

也有其他的可选方案,可以做队列,包括在不同的管理模式下看这个模式是不是比别人更好,也可以做干预性的研究,看看在一些社区用新模式,一些社区用传统模式,是不是真的能有效控制复发率,当然研究者最终选择的方案不是最优的。应用大数据的方法评价方案是否有效,而是做了最难的整群RCT,为什么这么做?就是劣势太明显了,随访信息不完整,即便做前瞻性的研究,想调用现有数据库里的随访信息也是不可及的,同时机构间的数据孤立也是最大的问题。虽然基于大数据评价或者构建新的慢病管理模式理论上是可行的,但真的把这个问题和资源都抛给一线工作者的时候,会发现难以实施,即便做了,结论的可靠性仍然是存疑的。

    

现在的困境是什么?现有的证据和实践工作断开了,我们希望通过现有数据产生新的符合实践需求证据的时候就会发现,数据质量和证据的需求也是断开的,这两个脱节是现在一线工作中面临的最大问题。在大数据的情况下如何转化生成新的证据,面临的困难和对策应该是怎么样的,虽然数据在那,但数据和可用数据并不等价。我们看到的情况是,慢病患者保有量巨大,信息系统,包括EHRs的建设越来越完善了,10月份我去日本参加了亚太地区的药物流行病学的年会,看到一个非常惨的现实,大量研究都是日本、韩国、台湾地区的,甚至是印度的,真正拿得出手中国的基于EHRs的资源证据少之又少,这与咱们的体量是不相符的。

    

我们的瓶颈在哪,为了回答瓶颈问题,我们在去亚太年会之前其实就已经完成了这部分工作,这是2019年发表的文章,文章探讨的是什么问题呢,做了定性的研究分析一下阻碍一线工作人员应用现有数据提供证据背后的障碍在哪。文章做的非常小,只纳入了19个研究对象,用最大差异的方法选了19个研究对象,就去问他认为背后的障碍在哪,机会在哪。最后总结出来的障碍是这样的:第一个框架的障碍和最后一个框架的障碍对他们来说,一是没有时间做这个事,二是不会做这个事,你给我资源我也不知道怎么做才好,抛开两个框架,中间所有的问题都围绕在数据的可及性以及数据质量上。信息不足,数据不统一,检索烦琐,非结构化,个体难以识别,这些都是阻碍他们真正用大数据进行证据产出的核心缺陷,就是所谓的数据缺陷。反过来我们又问他们,他们给我们的都是非常负面的回答,缺陷数据就不能提供证据吗,或者说我们所需的证据一定是足够完美的证据才能指导实践吗?似乎又不是这样。

    

第二个问题,缺陷数据真的就等于无效信息吗,有的时候不是,真的需要证据的时候它是可以对付帮助我们回答一些问题的,比如慢病里,常见的慢病都是老病号,EMR不完整,好多患者不来,但慢病的老病号信息通常是完整的,复发、入院这种问题一定会到核心医疗机构做,这些慢病缺少规范的临床资料,数据资料量大,随访不完整,实际上我们仍然能在繁杂的不完美的数据里找到相对可靠的数据,而相对可靠的数据虽然信息量有限,又不是完全没用,比如说也许我们只能找到处方的数据,就不能回答背后潜在的因果关联吗,虽然说回答不了因果,关联总能建立起来。比如说我们可以简单的基于处方数据挖掘出一些证据,这个方法是七八十年代就已经建立起来的非常成熟的方法,拿不到患者结局,患者和结局相关联的处方还拿不到吗,患者的复发卒中拿不到,患者复发卒中导致的再入院诊断总能拿到吧,这种明确的事件其实你有办法仅仅通过处方或者是和支付相关的数据就可以建立起关联。

    

分析的过程也是非常简单的,当然有它的局限性,至少可以回答像抗生素和感染,特定激素和过敏,以及血管内治疗和血栓这种非常明确的关联替代。它有弊端,在于只有在你的处方差异化的时候才能回答慢病干预和结果之间的关联,如果没有差异化,所有人都是一套方案,难道就没有办法评价了吗,也有办法,可以评价类似处方序列对称分析的策略。代表我们干预的A方案和代表我们结局的B药物之间出现的前后有没有在时间上对称性被打破,谁前谁后是随机的,如果看到某一个新的对应的补救措施永远发生在干预措施之后意味着什么,你的干预一定带来了问题。如果总发生在你的干预之前意味着什么,你这套干预可能解决了这个问题,同样可以为干预提供证据支持。

    

有些非常经典的应用,当然也可以探索新的药物适应症,比如说日本的研究者提出一套打数据挖掘的框架里明确指出来,提出新的药物适应症的时候像处方序列对称分析是非常有效,而且非常简洁,对信息需求也很少的方案。这个场景也是我自己研究的,很多慢病领域都在说长效药物的使用能很好的改善患者的依从性,从而带来更好的结局,精神分裂症通常处方没有造假的,这个领域上了一个长效药物真的可以改善患者愈后吗,不知道。所以我们提出问题,找了稳定期精分的患者,一部分换了长效针剂,一部分没有换长效针剂,所有药物患者都在这个时间换了长效针剂,结局是看长效针剂有没有能打破患者再入院的情况,我们做了一系列的分析,发现得不到什么结论。因为就是单臂的研究,能有什么信息,我们也做了处方序列对称分析,也没有得到结论,这和一线慢病管理者的经验不相符,慢病管理者的结论是患者上了长效针剂复发率就是降低了。我们看不到这种现象,数据太粗糙,怎么办,我们做了小的尝试,PSSA处方序列分析彻底改掉变成新的方法,我们自己没有做验证,今年打算专门做这个验证。

    

为什么存在这种分析,因为处方序列对称分析是不是只考虑先后的对称性,先后再入院这种事前面再入院,后面也会再入院,只要让后面的再入院经历的时长比前面更长,干预就成功了,单独的把时间引入进来当成新的维度去做探索,把一个人劈成两半,上了一种新的干预策略时点,之前倒着生存,之后正着生存,给了新策略之后真的患者不再容易碰到再入院事件了。

    

好多临床研究者和慢病管理的研究者说我们用不了大数据,因为数据存在缺陷,这并不是特别好的借口,在新的方法支持下任何有缺陷的数据足以提供指导我们实践的信息,这个问题解决了之后真正的问题在哪,能力吧,能不能提出真实的问题,大家认为核心瓶颈在这儿,我个人认为核心瓶颈不在这儿,而在于技术难度和研究者能力之间的Gap,一旦打破了Gap,现有粗糙数据,存在孤岛的数据仍然能帮助指导我们的实践,这才是我们应该认识到的关键点。核心瓶颈在于快速问题的构建和证据产出,保证让每个基线面临困难的人有这样的机会发现问题,总结规律,并且形成证据,核心瓶颈在能力,而非资源和技术。

    

研究者需要哪方面的能力,三个方面,假说的快速构建,数据的快速提取和清理以及统计分析的快速实现,通过降低难度保证可实现,通过提高效率保证大量的能力需求,我们希望最好的是每个研究者边上都有一个懂方法学的人给他做一对一的指导。但问题又来了,这现实吗,不现实,毕竟现在搞方法学的人还像大熊猫一样非常少,即便是财大气粗的医院养得起我们这样的团队,我们现在十个人的团队就做方法学,像这样财大气粗的医院在全国能有多少,怎么办?我们在尝试另外一个探索,能不能构建一个去人力的,把我们这些人饭碗都砸掉,去人力的方法学支撑平台,真正的孤岛不是数据的孤岛,而是实践需求、数据和将来产出三者之间的孤岛,构建方法学的去人力的支撑平台,辅助孤岛之间建立桥梁。当一个研究者有需求,有想法的时候,可以把想法导到支撑平台里面,支撑平台还能帮助他获取和清洗数据,进一步的转化成指导别人实践的证据,这是我们期望做的。

    

对于医疗机构来说,这种平台有的医疗机构是可获及的,好多医疗机构EMR砸了很多钱,后面有一套数据清洗和挖掘系统,对于非医疗机构的人来说或者EMR建的不好的机构来说,三方平台没有怎么办?为了解决这个问题,国内有第三方的厂商做了一些尝试,零研科技平台非常好,他们要做的事跟我们的需求刚刚好契合到一起,通常要做快速证据产出大家想的都是从数据清洗出手,以证据产出、最后发表论文作为终点,对于一线工作者来说怎么把自己脑子理清楚才是真正的症结所在。这个平台特别好的融合了第一步没有从数据入手,而是从问题入手,拿了我们在临床研究里经常会用到的概念,PICO,研究者要数据,要做分析,先别做,回过头来构建一个假说,假说有各种各样的支持系统,之后再做数据清理和统计分析,这样拿到的东西可能就会实现的更好。

    

我们很好的看到了像我们医院这样的很多研究者开始基于EMR做产出了,包括CDS系统也做的越来越,CDS本身的评价也在做产出,其他医院的研究者也慢慢有第三方平台可用了。这时候我们再回过头来看之前提的观点会不会有些新的想法,新的想法是什么。高质量的证据产出中需求其实是要胜过对数据本身的重要性,实践是发现证据需求、提出创新点的源头,数据质量限制了证据产出的效率,同时也不要忘了低质量的数据也是可用的,当我们看到技术难度限制了应用普及的时候,更核心的出发点是考虑数据质量的同时也应该考虑如何才能打掉技术难度这个瓶颈,降低技术难度,支撑一线研究,从而推动更多来自一线需求的证据产出。

    

谢谢大家。

    

    


第五届中国慢性病与信息大会 北医三院 李楠 真实世界数据

关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯