2023年,数据已经成为百行百业最核心的生产要素,在数字化日趋主流的医疗行业更离不开数字化创新的加持。为此,能够为医院提供全域原始数据存储利用能力的“数据湖”应运而生。在这背后,紫光股份旗下新华三集团以前沿的创新技术和坚持不懈的服务精神,实现了数据治理标准化、数据资产化、数据口径统一化方面的重大突破,为“数据湖”赋能医疗创新转型和医院管理升级上提供了重要思路。
近日,紫光股份旗下新华三集团医疗实时全域数据湖首席专家李谨江更与中山大学附属第一医院的专家们一道,融汇数据湖相关技术突破、归纳行业实践经验,在国内权威科技核心期刊《中国数字医学》上刊发了《数据湖技术在智慧医院建设中的应用与发展》一文,详细总结了数据湖技术在智慧医院建设中的探索和实践。
《中国数字医学》2023第18卷第6期上刊文章
挑战一
直面挑战,数据治理迫切需要新思路
在各行各业的数字化转型中,医院在整体规模上可能不是最大的,但架构却极度复杂。
当前,医院信息化正在从IT进入DT时代。关注重点也从业务流程信息化,提高医疗效率转换到数据资源的挖掘利用,辅助医院精准决策分析上。但在现代化医院中,这些价值巨大的数据却往往分散在不同的相互独立的“烟囱式”系统中,无法简单高效地被整理、调取和利用,导致了数据治理和管理的巨大压力,成为了未来智慧医院建设中必须攻克的难题之一。
挑战二
湖仓一体,数据湖如何释放数据价值
作为一种新兴的数据技术,“数据湖”能让多源数据在任何时间以原始、未加工的形式存放在数据湖存储层中,为存储、管理和分析大规模非结构化和结构化数据提供了强力的基石。立足这样的优势,新华三集团的实时全域数据湖能帮助医院解决传统数据仓库对数据的约束和成本问题。通过数据分类、数据标签、元数据管理等方式构建数据湖中的数据模型,从而最大程度避免数据清洗汇总造成的信息损失。并且仅仅在数据利用时进行数据定向预处理,能更快、更灵活地利用各种数据,大大减少数据获取和存储的复杂度、代价和时间。
挑战三
多元应用,在实践场景中印证价值
在今天的智慧医院中,实时全域数据湖的建设显著提升了医院数据治理能力,将零散的数据变得井井有条,最大程度挖掘医院业务链价值,提升医院运营管理效率,支撑智慧医院高质量发展。并在精益医疗、临床科研、管理决策的等多个方面开展了联合探索,通过数据湖为相应的数字化智能辅助工具提供了数据支撑,通过实时化、高性能的数据供给、帮助医院数据利用效率,让数据更易用、更有用,大大提升了数据应用的建设效率与业务成效。
2022年,中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合新华三在内的多个领域内企业共同编制完成了《云原生湖仓一体数据平台技术要求》,旨在帮助大数据产品供应商及用户方评估云原生湖仓一体数据平台的技术能力和研发方向。在中国信通院于2022年下半年开展云原生湖仓一体数据平台产品首批评测,新华三医疗实时全域数据湖核心产品绿洲平台首批通过,达到了国内最高水平的认证。
2023年初,新华三集团携手国内多家顶级医疗机构合力进行了国内首个真正意义上的“实时全域数据湖”建设,为更多医院的数字化转型塑造了值得参照的典范案例。
突破一
取代“数据接口及视图”,打破性能边界
在如今的医院,无论是点对点的数据调用,还是通过集成平台共享数据,都需要借助“数据接口及视图”来传递数据,HIS、EMR等核心业务系统作为数据的最大输出方,更在数据共享中“不堪重负”。
作为一种新兴的数据架构模式,数据湖能够将结构化、非结构化等不同类型的数据归集到一处,并通过按需的数据预处理提升利用数据的效率。同时立足强大的数字基础设施和MPP分布式数据库构建数据湖存储引擎,新华三可以将原始数据打标签构建STG贴源数据层,或者构建起数据仓库。这种统一化的数据湖简化了数据的调度共享,让不同系统之间数据分享的压力减少。而且,湖内建仓数据不出湖,“湖仓协同”的统一分析底座让数据分析效率提升,减少了数据迁移量。
医疗实时全域数据湖湖仓一体平台架构
突破二
实时共享,引领精细化管理
在智慧医院的变革中,门急诊的服务和管理需要实时的数据处理,医院整体的运营精细化水平也与数据实时性呈正相关的关系,但传统ETL离线处理的方式无法解决实时问题。新华三集团的“实时全域数据湖”的核心亮点之一是能够为表单匹配对应的入湖模式,并且能够通过标准化、自动化、实时高可靠的服务做到OLAP(联机分析处理)能力的快速响应。
突破三
从溯源到管理,攻克数据利用难题
作为治病救人的医疗机构,稳定、安全是智慧医院建设不可逾越的红线。在数据的利用上,也必须解决数据“血缘”不清、源头不明、管理复杂等一系列问题。为此,新华三集团提供了“全链路安全”的能力,确保湖内数据全流程不外泄,API数据全鉴权,数据申请流程在线化。在此基础上提供数据标准、数据质量、数据资产、数据开发等各类数据治理功能,并通过数据开放形成治疗质量、运营效率等各类专题库,并以数据服务和数据资产赋能医疗业务的进化革新。
突破四
增效降本,驱动转型引擎创新提速
对于智慧医院的建设而言,“实时全域数据湖”既是技术创新的突破尝试,也是业务场景的变革引擎。在诊疗业务领域,实时全域数据湖能让数据和业务流程充分融合,提升医院综合决策能力;在医疗科研领域,数据湖能帮助挖掘数据价值,为医院医学科研、临床药物以及AI辅助诊疗提供更多维度的数据支撑与分析;在医院管理领域,能为综合绩效改革提供数据支撑;同时,通过院长驾驶舱,数据湖能将医院内的复杂数据以智能化、可视化的方式呈现,让数据真正资产化为医院的高质量发展注入新效能。
新华三集团医疗实时全域数据湖首席专家李谨江回忆到:“当规模大到一定程度后,各种不易发现的微小技术问题都会逐步暴露,并成为影响整个进度的工程难题。比如无人值守下的自动同步问题,在大量数据规模入湖的情况下,需要考虑入湖排序堆积、超大规模下的建库建表自动化、同步映射自动化、DDL结构自动化、断点续传、数据自动标签、特殊字段(如XMLType)解析等问题,均是目前医疗信息化的业界难题。面对困难,公司领导决策需要不惜一切代价完成投入和突破,最终实现了业内首个大规模下数据无人值守实时同步。”
新华三集团医疗实时全域数据湖首席专家 李谨江
面向未来,数据在智慧医疗变革中扮演的价值将愈发关键,推动医疗行业向着高质量发展的目标稳步迈进。而新华三集团也将秉持着“精耕务实,为时代赋智慧”的品牌战略,继续推进医疗领域数据治理能力的全域进化,释放更多数据价值。
09-06 09:05
09-05 17:42
09-05 16:13
09-05 15:42
09-05 15:18
09-05 14:55
09-05 11:56
09-05 10:46
09-05 09:27
09-05 09:26