PingKai Logo
search icon

江苏省人民医院 | 基于平凯数据库的ODS 数据仓库建设实践

平凯数据库(TiDB企业版,以下简称TiDB)成功建设全院 ODS(操作型数据存储)数据仓库,不仅解决了数据管理的燃眉之急,更开辟了一条以数据敏捷性驱动医疗服务质量与效率双提升的新路径。

引言:

作为江苏省的医疗“领头雁”,江苏省人民医院早已构筑起庞大的信息化体系,但一个前所未有的挑战也随之而来:如何让覆盖 18 个核心系统、日夜奔流不息的海量数据,从沉睡的孤岛中苏醒,真正成为驱动医院发展的核心引擎?

江苏省人民医院携手分布式数据库——平凯数据库 (TiDB企业版),成功建设全院 ODS(操作型数据存储)数据仓库,不仅解决了数据管理的燃眉之急,更开辟了一条以数据敏捷性驱动医疗服务质量与效率双提升的新路径。

从数据孤岛到实时需求的破局之需

江苏省人民医院是江苏省综合实力领先的三甲医院,承担着区域医疗核心服务、科研教学及公共卫生应急等多重职能。随着医院信息化建设的深化,其业务系统已覆盖 HIS(医院信息系统)、LIS(检验信息系统)、病案管理、护理系统等 18 套生产系统,日均产生海量医疗数据,涉及患者诊疗、检验报告、药品管理、护理记录等全流程信息。

然而,快速增长的数据规模与复杂的业务需求,使得医院在数据管理上面临三大核心挑战:

数据孤岛严重: 各生产系统数据分散存储,跨系统数据调用需直接访问生产库,导致生产系统压力剧增,数据安全风险上升;

实时性与效率不足: 传统数据库在处理复杂 SQL 查询时性能瓶颈明显,部分跨系统统计需耗时数小时,无法满足科研分析、管理决策的实时需求;

国产化与扩展性压力: 国家医疗卫健行业明确要求加速数字化、智能化转型,传统集中式数据库架构难以灵活扩展,且运维成本高,无法适应医院未来数据量持续增长的需求。

构建统一实时数据平台,激活医疗数据价值

为从根本上解决数据孤岛、效率瓶颈和架构扩展性这三大相互关联的难题,江苏省人民医院认识到,必须构建一个统一的数据平台,作为连接分散的生产系统与上层数据应用的“中枢”。ODS(操作型数据存储)数据仓库正是实现这一构想的理想方案。 它可以将 18 个异构生产系统的数据实时汇聚于一处,形成统一的数据视图,从而彻底打破“数据孤岛” ;同时,通过将分析查询类的请求从生产库剥离,为数据分析、科研和管理决策提供一个高性能、高并发的专用数据服务环境,解决“实时性与效率不足”的问题 。

江苏省人民医院启动全院 ODS(操作型数据存储)数据仓库建设项目,核心目标包括:

通过数据集中管理,实现压力“解绑” : 将分散在 18 套生产系统中的业务数据实时同步至统一平台,实现全院数据读写分离,减轻生产库压力;

通过实时高效供给,实现数据“加速” : 通过高性能数据库支撑数据分析、科研平台、管理平台等应用,确保数据秒级更新与高效查询;

通过国产化改造,实现技术“自主” : 采用符合国家信创要求的分布式数据库,保障技术自主,同时满足医院长期数据扩展需求。

选择一个能与未来同行的伙伴

在技术选型阶段,江苏省人民医院重点考察了数据库的分布式架构能力、实时处理性能、扩展性及国产化适配性。经过多轮评估,平凯数据库 分布式数据库凭借以下核心优势脱颖而出:

(一)原生分布式架构,满足海量数据扩展需求。 平凯数据库采用无共享的分布式架构,支持在线弹性水平扩容,可根据数据量增长灵活添加节点,轻松应对医院 60TB 级业务数据存储需求。其 “存储计算分离” 设计,使计算资源与存储资源可独立扩展,避免传统架构下 “扩容即重构” 的高成本问题。

(二)交易分析一体化,兼顾交易与分析需求。 医疗场景中,数据既需支持高并发的 OLTP(联机事务处理)操作(如患者信息实时写入),又需支撑复杂 OLAP(联机分析处理)查询(如 DRGs 分组统计、单病种指标分析)。平凯数据库 的实时 HTAP(混合事务分析处理)能力,通过一套架构同时满足两类需求,避免传统 “OLTP+OLAP” 双栈带来的架构复杂度与数据同步延迟。

(三)高可用与强一致性,保障医疗数据安全。 医疗数据涉及患者隐私与诊疗决策,对数据一致性与可用性要求极高。平凯数据库 通过 Raft 协议实现多副本强一致性,单点故障可自动恢复,确保核心业务 7×24 小时连续运行。

(四)国产化适配,符合信创战略方向。 平凯数据库 深度适配国内主流信创软硬件生态,支持通用处理器与操作系统,满足国家医疗行业自主可控要求,为医院信息化建设提供长期技术保障。

从数据汇聚到价值释放的全链路实践

江苏省人民医院和平凯数据库的团队通过以下四大步骤,打通了从数据源头到业务赋能的全链路。

(一)数据同步与汇聚:

打通 18 套生产系统的 “数据动脉”项目初期,团队重点解决 “如何将分散的生产数据实时同步至 ODS 仓库” 的问题。通过部署 DSG 数据同步平台,实现 HIS、LIS、病案、护理等 18 套生产库数据的抽取、清洗、转换与加载(ETL)。同步过程中,平台采用 “增量 + 全量” 混合模式:生产库数据变更通过日志捕获(CDC)技术实时同步至 ODS,确保秒级延迟;历史数据通过批量全量导入完成迁移,最终实现 100 多个库、40T 历史数据的完整汇聚。

(二)数据治理:

从 “数据仓库” 到 “数据资产” 的质变数据汇聚后,团队着手解决 “数据质量” 与 “标准化” 问题。通过建立数据质量管理体系,对 ODS 中的患者主索引、诊断编码、药品名称等核心字段进行清洗与标准化,消除多系统间的术语差异;同时,构建数据血缘跟踪与元数据管理平台,实现数据从生产库到 ODS、再到业务应用的全链路追溯,为后续分析提供可信数据源。

(三)主题库建设:

按需定制的 “数据服务中心”为支撑不同业务场景,ODS 仓库进一步划分运营分析、绩效考核、肿瘤指标、DRG(疾病诊断相关分组)、单病种等主题库。例如,运营分析主题库整合门急诊量、床位使用率、平均住院日等指标,为医院管理层提供实时运营视图;DRG 主题库则基于诊疗数据与医保支付规则,辅助临床优化诊疗路径、控制医疗成本。

(四)应用对接:

从 “数据存储” 到 “业务赋能” 的闭环ODS 仓库建成后,团队完成与医院数据分析平台、科研平台、管理平台的无缝对接。例如,科研平台可直接调用 ODS 中的患者诊疗、检验、用药等多维度数据,快速开展疾病流行趋势分析;管理平台通过 ODS 实时获取各科室绩效数据,支撑月度 / 年度考核;数据上报系统则基于 ODS 的标准化数据,将上报周期从 “周级” 缩短至 “天级”

数据驱动的医疗信息化升级

经过多阶段建设,江苏省人民医院 ODS 数据仓库已成为医院数字化转型的核心基础设施,具体成果如下:

(一)数据效率显著提升

查询性能显著提升:利用平凯数据库强大的并行计算能力,复杂 SQL 查询性能得到大幅优化。例如,月度数据质控和机构年收入分析等原先耗时较长(从分钟级到小时级)的复杂报表查询,现在均能快速响应,显著提升了数据分析效率。

生产库压力有效降低:将分析型查询的负载从生产库中剥离,这有效降低了生产核心库的访问压力,从而大幅提升了核心业务系统的运行稳定性和可靠性。

数据供给时效大幅提高:第三方系统的数据抽取和同步周期被极大缩短(例如从原先的按周更新提升至按天更新)。

(二)赋能临床、管理与公卫三大场景

数据价值深度释放ODS 仓库集中存储的 60TB 业务数据,已成为医院科研与管理的 “金矿”。临床团队利用 ODS 数据开展肿瘤患者用药规律研究、DRGs 分组优化等课题;管理部门通过实时运营指标分析,动态调整资源配置(如高峰时段增加门诊窗口),患者平均候诊时间缩短明显;公共卫生部门则基于 ODS 数据实现传染病病例的快速追踪与预警,为区域疫情防控提供有力支撑。

(三)树立行业标杆,提供可复制模板。

国产化示范效应凸显作为国家医疗卫健行业国产化建设的标杆案例,江苏省人民医院 ODS 项目被评选为 “2024 信息技术应用创新优秀解决方案”,其 “生产数据实时同步 + 分布式架构 + 主题库灵活扩展” 的建设模式,为全国医疗机构提供了可复制的 “数据中台” 建设模板。

以数据敏捷驱动医疗未来

江苏省人民医院基于 平凯数据库 的 ODS 数据仓库建设,不仅解决了医院数据管理的 “燃眉之急”,更开辟了医疗数据价值释放的新路径。通过构建统一、实时、高效的数据平台,医院实现了从 “系统驱动” 到 “数据驱动” 的跨越,为临床、科研、管理提供了更智能的决策支撑。

未来,随着医疗大数据应用的深化,江苏省人民医院将进一步探索 平凯数据库 在患者画像、精准医疗等场景的应用,持续以数据敏捷性推动医疗服务质量与效率的双提升。这一实践也再次印证:在医疗数字化浪潮中,分布式数据库正成为连接业务与数据的关键纽带,助力医疗机构在 “数据驱动的转型“中取得成功。