机房被淹、门诊卡顿、系统宕机怎么办?

我们都不希望发生故障,故障却又在所难免。

作者: HC3i数字医疗网 来源: HC3i数字医疗网 2021-11-26 13:05:44

医院里的信息体系日益庞大,支撑着医院运营的方方面面。一旦系统故障,患者挤满大厅,医生急得跳脚。15分钟内院长打电话过来问:“怎么回事?何时修好?”

这是每个医信人的噩梦。我们都不希望发生故障,故障却又在所难免。


上海交通大学医学院附属瑞金医院

计算机中心主任 赵艳

常态化排雷,护航运行每一天

日常安全巡检的目的在于长期和持续地保持IT系统良好的安全状况。定期的安全巡检有助于及时发现问题、消除隐患。从物理环境、计算环境到信息安全,巡检工作要有专职专人,巡检人员要对信息资产包含的软硬件及设备能够心中有数。

针对不同对象设置合理的巡检策略和频次,例如:弱电机房无法做到温湿度报警,2-3天一次巡检做好监控;UPS定期充放电,保护期过保要及时更换;每日查看态势感知APT事件分析,排除并整改相关安全威胁等。

外购的系统有没有后门?医院信息中心的安全漏洞扫描是必不可少的。新购买的安全设备要做合理配置,厂商的配置策略要留底,记录越清晰,越有利于后续跟踪追溯。

全院每个人都是安全守护神。要组织全院开展安全培训,把近期发生的安全事件推送全院,提升全员的安全意识。

郑州大学第一附属医院

信息处处长 李郁鸿

机房被淹后,核心系统15分钟完成切换

郑州大学第一附属医院号称宇宙最大医院,2020年门诊量657万,出院患者60.5万。为支撑庞大的业务运转,一院四区的核心机房面积为1651平米,仅最大的河医院区就有三个机房,分别是:三号楼网络交换机房、二号楼负一楼灾备机房、门诊楼灾备机房。

今年7月20日,超强暴雨致使我院河医院区位于二号楼负一楼的灾备机房严重受灾。同时,由于供电机房全在地下室全被洪水灌满,造成了河医院区供电系统全部瘫痪。

万幸的是,我院的双活架构容灾机房在我院门诊楼的22层,当天并未受到洪水影响。17:35,我处在UPS供电期间紧急启动应急预案,利用异地容灾“双活”机制,在保障系统和数据安全的前提下,紧急切换HIS、LIS、PACS、电子病历系统、手麻重症、急诊等11个核心业务系统至郑东院区中心机房,用时仅15分钟。

河医院区1万余名住院患者紧急分流,所有重症患者转移至郑东、惠济院区。信息系统只需实施简单的“转科”操作,就保障了所有转院患者住院信息的连续性。

广东省中医院

信息管理办公室主任 傅昊阳

故障排查举例,医信人的底气源自实力

广东省中医院是集医教研一体的研究型医院,我国近代史上最早的中医医院之一,连续7年全年门诊服务患者量超过700万人次、年平均收治病人12万人次。

门诊系统作为我院最核心系统,系统故障定义为一级系统故障。为保障2万日均门诊量,我们制定了高标准的运维目标:数据零丢失、业务零中断、RTO 秒级、RPO 分钟级、系统故障30分钟恢复。

当门诊系统更换服务器及存储设备后,门诊系统报卡、慢,特、某些操作可能要数十秒乃至分钟级才能有反馈,故障电话蜂拥而至!我们进行有序排查后找到问题并及时解决。

医院信息中心发现问题的能力源于对底层核心原理的熟悉,毕竟厂商的知识面也是有限的。每个系统做项目实施的时候,一定要留存项目实施的关键文档。平时还要多积累,处理故障时才能得心应手。

胸中有规划,心中有方法,手上有工具,身边有帮手,加上持续不断的努力,才能把信息系统建设好。

深圳市数存科技有限公司

总经理、创始人 徐胜旺

解决后顾之忧,医院容灾这样做

基于对医院信息系统的理解,结合相关国家政策和医院法规要求,通过对三甲医院重大典型事故案例深入分析,总结了目前市场上8种典型数据安全解决方案的技术原理、用户收益及可能产生的连带问题分享给大家。

对于医院信息部门来说,灾难恢复体系建设是一个系统化的工程。从启动、DRP预案、BIA分析到方案设计、DRP开发、演习及测试、制度管理。灾难恢复体系建设考验的是产品、制度流程及容灾演练,才能真正意义上做到防范于未然。

面对市场上众多不同技术路线的容灾备份产品,医院信息中心如何选出一款适合自己的产品呢?建议如下:

(1)带负载重压模式进行测试;

(2)在实时保护状态下,15秒原生产机插入数据库的条目数量,以此甄别容灾系统对生产的实际影响度;

(3)必须做删除数据找回及历史业务系统的接管,真正意义上确保对勒索病毒的抵御能力;

(4)所有DRP测试过程都要记录每一次事故恢复所需时间,在确保测试结果OK的情况下,此记录时间就是未来上生产业务时的中断时间。

首都医科大学宣武医院

信息中心主任 梁志刚

机房安全制度先行,接地气才能更有效

巡检工作非常琐碎,为保障巡检工作落实到位,配套制度必不可少。包括:数据中心物理安全、数据中心出入控制、设备日常管理工作、机房日常巡检规范、机房设备管理规范、物理安全与设备操作规范、风险分析及规划、应急演练等一系列制度规范,是保障信息中心日常巡检工作落实到位的制度保障。

当然,在制度落实的过程中也要充分考虑部门协同,确保应用过程中制度能够落地。比如:机房归信息中心管理,但配套的配电柜、发电机归后勤保障部门管理。一旦部门沟通不顺畅,就难以形成管理闭环。

巡检不能只关注物理设备,比如晚上的任务是否完成也要定期巡检。近期我院遇到过此类情况:由于数据上报系统故障,3天的数据未能及时上报卫生主管部门,导致我们绩效扣分。

有了制度还要做好应急演练,一旦出现危机才能快速做出更优处置。


关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯