HIS行业年度总结：2026年的变与不变

2026/06/30 Leave a comment

“二零二五年过去了，医院信息系统行业有哪些变化？这是值得每个医院信息科主任思考的问题。”

下午四点，新疆乌鲁木齐某区级医院的年度总结会上，郑院长抛出这个问题。台下坐满了信息科主任和业务骨干，每个人的眼神中都充满期待，有期待，有好奇，也有一些迷茫。

“我看是国产系统崛起了。”第一位主任说。

“我看是智能开始落地了。”第二位主任说。

“我看是订阅模式普及了。”第三位主任说。

郑院长点了点头：“大家说得都对二零二五年医院信息系统行业，有三大变化值得关注。顺应趋势，才能赢得未来。”

变化一：国产系统崛起

“以前医院都用进口系统，现在国产系统起来了。”郑院长在报告中分享道，“国产系统的优势是：界面中文、培训快、成本低、响应及时。”

郑院长举了一个例子：“我们之前用进口系统，一个小问题要等一周才能解决。现在用国产系统，三十分钟就能解决。”

“质量能和进口比吗？”台下有人提出了质疑。

“现在国产系统的功能已经很接近进口了，而且更加适合本土需求。”郑院长补充道，“关键是性价比高，同样的功能模块，价格只有进口的三分之一。”

“而且国产系统的本地化服务更好。”郑院长继续说道，“有什么问题，一个电话就能解决。进口系统还要发邮件，等待客服回复，有时候还要考虑时差。”

数据为证：二零二六年，国产系统市场份额从三成提升到六成，实现了翻倍增长。新疆这家医院的总体 IT 成本：下降了百分之七十。

“省下来的钱可以用于医疗设备采购。”财务科汇报的数据显示，这一年医院更新了三台彩超、两台心电图机，患者检查的效率大幅提升。

变化二：智能开始落地

“以前智能只是概念，现在开始落地了。”郑院长分享道，“智能辅助诊断、用药监测、风险预警，正在成为现实。这不是未来，而是现在。”

郑院长举例说明：“我们医院上线智能用药监测后，药物不良反应下降了百分之六十。这个数字不是概念，是实实在在的成效，是每个患者都能感受到的安全保障。”

“准确率怎么样？”台下有人关心地问。

“辅助诊断准确率超过九成。”郑院长解释，“但最终决策还是医生。智能不能替代医生，是帮助医生做出更准确的判断。”

“智能辅助的核心是提高效率、减少漏诊。”郑院长补充道，“不是替代医生，是让医生更强大。”

郑院长分享了一个真实的案例：有一次，系统提前预警了一位患者的心电图异常。急诊科医生及时进行处理，避免了心肌梗死的发生。患者康复后，专门送来锦旗表示感谢。

“这就是智能的价值。”郑院长说道，“救命的不是系统，是医生的判断。但系统让医生的判断更准确、更及时。”

“智能不是万能的，但没有智能是万万不能的。”郑院长总结道，“二零二五年是智能落地的元年，未来只会越来越普及。”

变化三：订阅模式普及

“以前都是买断制，现在订阅模式普及了。”郑院长分享道，“一年一付，费用可控，持续更新。我们算了一笔账，订阅五年只要一万，买断要三十万。”

“一年一付，压力小很多。”台下有人附议道，“不需要一次性拿出大额资金，医院的预算更好安排。”

“订阅模式的总体成本只有买断制的三分之一。”郑院长补充道，“这是观念的转变：从买断到订阅，从拥有到使用。”

“而且订阅模式每年都能用最新版本。”信息科的同志补充道，“不用担心系统落后，不用额外付费升级。”

订阅模式的好处可以总结为三点：

第一，成本可控：每年费用固定，医院的预算好安排，不会出现突然的大额支出。

第二，持续更新：每年都是最新版本，系统功能越来越强大，不需要额外付费升级。

第三，风险更低：供应商如果出现问题，损失的只是一年的费用，而不是前期投入的全部资金。

越来越多的医院选择订阅模式，这是行业的趋势，也是理性的选择。

“二零二五年医院信息系统行业，有三大变化：国产化、智能落地、订阅模式。”郑院长总结道，“医院选型，要顺应趋势，不要逆势而为。趋势就像水流，逆流而行只会费力不讨好。”

“在趋势面前，个体的力量是微弱的。”郑院长补充道，“选择对的趋势，比努力更重要。选对了趋势，事半功倍；选错了趋势，事倍功半。”

“但还有一点不变：以患者为中心的核心价值，永远不会改变。”郑院长强调道，“系统再智能，服务的还是患者；技术再先进，诊疗的是人心；模式再新，目的是治病救人。”

“无论技术如何变化，无论模式如何更新，我们的使命永远是：为患者提供更好的医疗服务。”郑院长总结道，“这是永远都不会变的。”

“二零二五年，我们一起走过来了。”郑院长举杯道，“让我们一起迎接二零二六年的挑战和机遇。”

核心金句：

“二零二五年医院信息系统行业三大变化：国产化、智能落地、订阅模式。”

“系统再智能，服务的是患者；技术再先进，诊疗的是人心。”

“以患者为中心的核心价值，永远不变。”

互动话题：

1. 您认为二零二五年医院信息系统行业最大的变化是什么？

2. 您的医院在二零二六年有哪些变化？

3. 您对二零二七年有什么期待？

声明：本文基于真实医院场景改编，人物均为化名，数据为试点统计，实际效果因机构规模、流程、人员素质而异。

立即免费试用门诊系统：https://app.kmhis.com/
International Version：https://app.kmhis.com/multi/
了解软佳门诊管理系统详情：https://www.kmhis.com/outpatient-management-system.html

手机扫码试用患者预约。请勿输入个人真实信息（点击图片可查看原图）

支持8种语言：简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语

说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想，要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

患者随访困境：打了电话却找不到人

2026/06/22 Leave a comment

下午3点，四川成都XX社区卫生服务中心的护士站，赵大姐正在给患者打电话。

“您好，请问是张大爷吗？您上周在我们这里看过病，现在恢复怎么样了？”赵大姐的声音带着职业性的温和，但电话那头传来的却是一阵沉默。

“我现在在外地出差，暂时回不去。”电话那头说。

“那您方便的时候再来复查。”赵大姐无奈地记录下来，挂掉电话。这种情况每天都在上演。赵大姐是社区医院的签约护士，负责慢病随访工作——高血压、糖尿病患者的定期回访。但她发现：打电话找不到人、记录不规范、无法跟踪效果。

“张大爷，外地；李阿姨，占线连续三次；王奶奶，直接没接。”赵大姐看着记录本上的标记，眉头紧皱，”一天下来，成功随访的不到30%。很多时候电话打通没人接，或者患者说忙就挂断了。”

上午10点，院长来护士站检查工作。院长姓王，是一位五十多岁的资深医疗管理者，在社区医院工作了十五年。

“赵姐，随访完成率多少？”院长问。

“大概是…30%吧。”赵大姐底气不足，每次汇报这个数字都让她心里发虚。

“这么低？”院长皱眉，”国家基本公共卫生服务要求高血压、糖尿病患者随访率要达到80%以上。完不成是要扣绩效分的，而且影响我们院的考核评级。”

“我每天打很多电话，但患者要么不接、要么接了说忙。”赵大姐解释，”而且现在的记录是手写的本子，查找困难，想统计完成率都要一个个数。”

院长沉思片刻，”这样下去不行。必须上随访系统了。不能总是靠人打电话。电话随访的效率太低，而且患者配合度不高。”

院长办公会上，信息科小陈汇报了调研结果：目前市场上有三种方案可以选择。第一种是纯电话随访，也就是现状的延续，优点是成本低，缺点是效率低、找不到人、记录不规范。第二种是纸质登记本，虽然比电话好一些，但仍然是落后方式，统计困难。第三种是软佳患者随访管理模块，属于智能方案，包含自动提醒随访、批量外呼管理、患者端自主上报、数据分析功能。

“软佳一年1898元，含患者随访管理全功能。”信息科小陈介绍，”包括：自动提醒随访、批量外呼、患者端自主上报、数据分析。系统可以自动给患者发短信提醒随访时间，患者点击链接就能在手机上填报，不用打电话。”

“自动提醒？”赵大姐问，”患者会配合用吗？现在很多老年患者连微信都不会用。”

“先试点，数据说话。”院长拍板，”效果好了再推广。而且老年患者可以让家属帮忙填报，操作很简单。”

软佳患者随访模块上线第一周，赵大姐就感受到了明显变化。

第一是自动提醒功能：系统自动给慢病患者发短信提醒随访时间，患者点击链接即可自主填报。赵大姐说：”原来是我给患者打电话，现在是患者主动上报。省了很多电话费，也不用反复打电话催了。”

第二是批量管理功能：系统自动分类随访患者，高危患者重点关注，普通患者批量管理。高血压三级以上患者每周随访，糖尿病血糖控制不佳患者每周随访，普通患者每月随访一次，系统自动提醒，不用人工记忆。

第三是数据分析功能：系统自动统计随访率、完成率，一目了然。每个患者的随访历史、随访结果、联系方式变化都有记录，随时可查。

一个月后的数据对比显示了明显效果：

指标	传统随访	软佳随访	变化
随访成功率	30%	85%	+183%
随访时间消耗	2小时/天	0.5小时/天	-75%
记录规范性	手写混乱	电子规范	显著提升
数据可追溯性	差	好	提升
院长满意度	60分	95分	+58%

“最大的改变是’主动性’。”赵大姐总结，”以前是我找患者，现在是患者主动上报。系统自动提醒，患者自己填报，我们只要看数据就行。”

“而且系统会自动标记高危患者。”护士长补充，”上周5床的李阿姨，血糖连续两次超标，系统自动标记为高危，我们及时调整了用药，避免了酮症酸中毒的发生。”

“随访不仅是打电话，更是管理。”院长在季度总结会上分享，”软佳的价值是把随访从’任务’变成’系统’，自动提醒、自动追踪、自动统计。以前靠人记，现在靠系统；以前靠电话催，现在靠自动提醒。”

赵大姐补充：”我现在有更多时间做健康教育，而不是打电话催随访。以前一天打几十个电话，大部分都是打不通的。现在系统自动提醒，我只要处理异常情况就行。”

信息科小陈汇报：”成本很低，每年1898元，平均一天不到6元，但带来的价值远不止这些。慢病管理是基本公共卫生的重要内容，随访率不达标会影响我们院的考核评级。现在系统自动管理，达标率从30%提升到85%，考核评级从B升到A。”

核心金句：

“随访不仅是打电话，更是管理。”

“从’我找患者’到’患者主动上报’，这是本质的改变。”

“1898元/年，买的是随访管理的系统性提升。”

互动话题：

1. 贵院目前患者随访是什么方式？最大的痛点是什么？

2. 患者自主上报对随访的价值大吗？

3. 您认为随访管理最难的是什么，时间还是规范？

声明：本文基于真实医院场景改编，人物均为化名，数据为试点统计，实际效果因机构规模、流程、人员素质而异。

手机扫码试用患者预约。请勿输入个人真实信息（点击图片可查看原图）

支持8种语言：简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

移动医生工作站：让诊疗信息跟着医生走

2026/06/10 Leave a comment

早上7点45分，江苏南京XX医院门诊大厅已经排起了长队。清大夫快步走进诊室，放下背包，第一件事就是打开电脑，登录系统。

“每天早上第一件事就是登录系统，然后等它慢吞吞地加载。”清大夫叹气，”有时候患者已经在门口等了，我还在等系统响应。”

清大夫是门诊内科的主治医生，每天接诊80到100个患者。她发现几个问题：

– 想查患者的历史检查结果、要跑到办公室用电脑查询，耗费时间

– 纸质病历容易丢失或者不完整

– 医嘱开出后要靠护士反复转录确认，经常出现信息不对称

“如果有移动工作站就好了，在诊室里就能完成所有操作。”清大夫跟同事抱怨。

上午10点，清大夫正在接诊第23位患者时，检验科打电话过来：”清大夫，您昨天开的李阿姨检查结果出来了。”

“等我一下，我去查。”清大夫挂断电话，起身去办公室。等她回来时，已经过去了12分钟。患者李阿姨有些着急：”清大夫，我还有事，能不能快点？”

“不好意思，让您等了。”清大夫心里有些愧疚，”如果在诊室就能看到检查结果，就不会让您等这么久了。”

下午2点，医院信息化建设专题会上，清大夫正式提出：”我们是不是可以上移动医生工作站？在诊室就能查病史、开医嘱、写病历。”

信息科小张调研了三种方案：

– 方案一：纸质病历加固定电脑，现状的延续，信息分散、不实时

– 方案二：固定平板电脑，需要在固定位置使用，不够灵活

– 方案三：软佳移动工作站，医生用平板或手机查诊，可以调取患者历史数据、开医嘱、写病历

“软佳一年1898元，移动工作站含在套餐里。”小张介绍，”医生用平板查诊，可以调取患者历史诊疗记录、检查报告、用药情况、开具医嘱，不用另外付费。系统数据实时同步到药房和收费窗口。”

“1898元，包含这么多功能？”清大夫不敢相信，”以前那些移动工作站软件便宜的都要好几万，而且每年还要交维护费。”

一个月后，清大夫用上了移动工作站：

“以前查一个患者的历史检查，要跑办公室、等电脑、签字确认。现在用平板一点，患者所有信息都出来了。”清大夫说，”看诊效率明显提升，患者等待时间减少50%。”

数据对比：

指标	使用前	使用后	提升
单患者接诊时间	8分钟	5分钟	-38%
患者平均等待时间	15分钟	7分钟	-53%
病史调取时间	3分钟	10秒	-95%
医嘱开立时间	2分钟	30秒	-75%

“1898元，价值几万块的功能。”清大夫说，”这就是SaaS的力量——小投入，大回报。”

核心金句：

移动工作站，让诊疗信息跟着医生走。

最好的医生工作站，是让医生忘记工作站的存在。

技术服务于诊疗，而不是诊疗迁就技术。

互动话题：

1. 您的门诊有移动医生工作站吗？使用体验如何？

2. 您觉得最有价值的移动端功能是什么？

3. 移动端取代桌面端，您支持吗？

声明：本文基于真实医院场景改编，人物均为化名，数据为试点统计，实际效果因机构规模、设备配置而异。产品功能与价格截至2026年6月，请以官方最新信息为准。

手机扫码试用患者预约。请勿输入个人真实信息（点击图片可查看原图）

支持8种语言：简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

接口开放困境：一个信息科主任的突围

2026/06/04 Leave a comment

江苏徐州XX县人民医院信息科，周主任最近焦头烂额。

“院长要求对接医保平台，三个月内必须完成。”信息科发来紧急通知。

周主任联系现用系统厂商，回复：”接口开放，单独报价8万。”

“8万？这么贵？”周主任震惊，”我们一年的系统费用才2万。”

厂商解释：”接口开发要定制，后期维护要专人，8万是友情价。”

周主任意识到问题严重：系统是封闭的，每次对接外部平台都要额外付费。这不是个案，是行业通病。全国几万家县医院、社区卫生服务中心，几乎都面临同样的困境——系统买了，但数据拿不出来，对接要另外钱。

周主任决定深入调研。他花了两个周末，跑遍了周边五个县医院，发现情况惊人一致：百分之八十的基层医疗机构使用的是封闭系统，接口开放要加钱，医保对接要加钱，公共卫生上报要加钱，甚至打印个报表也要加钱。某县级医院信息科李主任告诉他：”我们每年接口维护费就要花十几万，相当于再买一套系统。”

更让周主任震惊的是某镇卫生院的情况。院长王大夫说：”我们用的是某知名品牌系统，初期只要5万，但每年的接口维护费就要3万。医保对接加钱、公共卫生上报加钱、慢病管理加钱、妇保对接加钱、林林总总加起来，一年要花十多万。”

周主任开始思考：难道没有别的办法？

周主任在网上搜索开放式医疗系统，发现了软佳。抱着试试看的心态，他联系了软佳客服。

“我们提供标准RESTful API，所有功能开放，不需要额外付费。”客服介绍，”年费1898元，全年包干。”

“这么便宜？”周主任不敢相信。

“我们是SaaS模式，薄利多销。”客服解释，”而且我们的API是标准的，对接成本低。”

调研发现，三种方案：

方案	成本	周期	灵活性	适合场景
继续封闭+付费开通	8万/次	1月/次	低	临时需求
换开放系统	1898元/年	即时	高	长期需求
开发中间件	3万	2月	中	过渡方案

“与其每次付8万，不如一次换系统。”周决定换软佳。

为什么选软佳？周主任做了详细的技术评估：

第一，标准RESTful API，文档齐全。软佳的API文档有200多页，涵盖门诊、药房、收费、管理全模块，每个接口都有示例代码，工程师可以直接上手。周主任让信息科新来的小李试试，小李只用了三天就完成了第一个接口对接。

第二，对接案例丰富，医保平台是现成的。软佳已经对接过全国二十多个省份的医保平台，经验成熟，联调时间短。周主任联系了市医保局，得到的答复是软佳已经在医保局的对接厂商名单里。

第三，年费1898元，一次费用全包。不需要额外付接口费，不需要额外付维护费，不限对接数量。周主任算了一笔账：原来系统一年接口费用8万，现在1898元，差别是42倍。

第四，24小时技术支持。有专门的对接工程师团队，远程协助，响应及时。周主任试用期间，晚上十点遇到问题，联系客服，五分钟就得到了响应。

第五，数据自主可控。所有数据存在本地，厂商不能绑定用户，数据导出无限制��周主任最看重这一点：”数据是医院的，不能被厂商绑架。”

周主任向院长汇报：”这个系统不只是工具，是数据基础设施。1898元/年，全年接口费用全包，性价比极高。”

软佳实施过程：

第一周，技术对接会。医保局工程师+软佳工程师，三方确定接口规范。软佳提供的接口文档非常详细，医保局工程师只看了一天就明白了对接方案。

第二周，接口开发。软佳提供的API文档清晰，工程师对接效率高。遇到两个小问题，远程协助当天解决。

第三周，测试上线。联调一次通过，数据实时同步成功。医保局验收时，各项指标全部达标：”数据准确、响应及时、符合规范。”

“原来以为要三个月，结果三周完成。”周主任感叹，”专业系统和专业服务，真是省心。院长脸上也有光。”

三个月后的对比：

指标	封闭系统	开放系统	变化
接口响应时间	48小时	实时	提升100倍
对接成本	8万/次	含在年费	省8万/年
数据同步	手工	自动	省人工
扩展性	差	好	新业务随时加
医保结算通过率	95%	99.5%	+4.5%
月份数据对账时间	8小时	1小时	-87.5%
接口维护人员需求	2人	0.5人	-75%
年度接口总支出	12万	1898元	-98.4%

周主任在年度总结会上分享：

“接口开放不是成本，是投资。8万的封闭费 vs 1898元的开放年费，差别是400倍的长期成本节约。”

“更重要的是，开放系统让医院掌握数据主动权，不再受制于厂商。”

“我们花了三十年的教训才明白一个道理：系统是工具，数据是资产。工具要花钱，资产要掌握在自己手里。”

“软佳让我明白了另一个道理：好的系统不是把用户绑住，而是让用户自由。”

核心金句：

“接口开放不是成本，是投资。”

“掌握数据主动权，不再受制于厂商。”

“1898元 vs 8万，差别是400倍的长期成本。”

互动话题：

1. 贵院系统接口开放能力如何？

2. 接口对接遇到的主要障碍是技术还是成本？

3. 开放vs封闭，您会怎么选？

声明：本文基于真实医院场景改编，人物均为化名，数据为试点统计，实际效果因机构规模、流程、人员素质而异。

手机扫码试用患者预约。请勿输入个人真实信息（点击图片可查看原图）

支持8种语言：简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

真停电了：那次”演练成真”的72小时与灾备系统的终极考验

2026/05/10 Leave a comment

凌晨两点，XX医院。

主数据中心机房，突然停电。

不是演练，是真的——市电故障，加上UPS电池老化（三年没检测），未能及时切换到电池供电。

整个医院HIS系统，在零点17分，瞬间离线。

门诊挂号停摆，住院系统失联，药房发不了药，检验科做不了标本，急诊科只能手工记录。

值班工程师小吴发现异常，两分钟后，给老周打电话。

老周从床上跳起来，一边穿衣服一边想：四个月前的那次灾备演练，终于派上用场了。

那是去年12月的灾备演练，当时切换失败，备用数据中心检测不到，手动切换功能也没有。那次演练，暴露了三个问题。

这四个月，他们一直在整改。

而今天，真停电了。

1. 第一反应：不是”抢修”，是”切换”

老周在电话里问小吴：”主数据中心完全断电了吗？”

“是的，所有设备都断电了。UPS也耗光了。”

“备用数据中心呢？”

“还没检测到，我们在手动查。”

“用应急手动切换U盾！”老周吼道。

他记得四个月前那次教训——不能依赖自动切换。万一自动切换失败，必须有人工手段。

小吴跑向机房，从保险柜里取出那个黑色的U盾，插入备用数据中心的控制台。

手动切换流程，在预案里写得清清楚楚：

1. 登录备用数据中心管理后台

2. 点击”紧急接管”按钮

3. 确认切换（会强制把负载均衡指向备用数据中心）

4. 验证业务状态

小吴的手有点抖。他虽然是工程师，但这是第一次”实战切换”——不是演练，是真停电了。

点击”紧急接管”。

系统提示：”接管成功，预计30秒内生效。”

他盯着负载均衡的实时状态：

– 主数据中心IP：离线

– 备用数据中心IP：生效（绿色）

30秒后，护士站的小张刷新页面，看到系统回来了。

“能用了！”小张喊。

2. 切换后，数据一致吗？——那个0.02%的差异

老周赶到医院时，已经是凌晨三点。

信息科李主任在机房外走来走去，神色焦虑。

“周总，数据有没有丢？我们最怕这个。”

老周没直接回答，而是问：”切换后，有没有医生报错？”

“暂时没听说，但这才切换了不到一小时…”

老周打开备用数据中心的监控面板。

灾备系统的设计，是主数据中心实时同步数据到备用数据中心（异步 replication，延迟1-3秒）。理论上，数据应该是”零丢失”——主数据中心断电前最后的事务，应该已经同步到备用。

但他查数据对比：用脚本比对主库最后一次备份（昨晚00:00）和备用库当前数据，差异率是0.02%。

那0.02%是什么？

是断电前30秒内产生的数据——因为同步延迟，这部分还在主数据中心的内存里，没来得及写磁盘，就断电了。

切换后，这部分数据永久丢失了。

“有多少数据？”

“正在估算。挂号、医嘱、收费…大概几百条。”

李主任脸色变了：”几百条？”

“主要是挂号记录。”老周说，”如果病人在断电前刚挂上号，但还没缴费，数据丢失，他们会以为挂上了，但实际上没挂上。这会引发纠纷。”

李主任：”那怎么办？”

“我们有个预案：断电恢复后，主数据中心重启，会尝试从备用库同步回主库。如果同步成功，数据能补回一部分。但如果是事务中途断电，可能补不回来。”

老周决定：不等了，现在就去主数据中心，尝试恢复。

3. 主数据中心恢复：希望与绝望交织

早上五点半，市电恢复。

主数据中心可以通电了。

老周和李主任，带着运维团队，在主数据中心机房。

设备一台台启动：

– 网络设备

– 存储设备

– 数据库服务器

七点，数据库启动成功。

启动后的第一件事：尝试从备用数据中心，同步回主数据中心的数据。

同步开始。

但同步报错：主库的某些数据，已经被断电前的事务部分修改过，和备用库的版本冲突。

数据库自动冲突解决机制，选择了”以主库为准”——意味着主库的数据会覆盖备用库。

问题是：主库断电前的数据，本身就是不完整的（内存中的数据没持久化）。

这可能导致：备用库里有的数据，主库里因为断电前部分事务已经提交，反而”多”了一些数据；或者反过来，”少”了一些数据。

手动检查发现：

– 有大约200条记录，主库有、备用库没有（备用库没收到）

– 有大约150条记录，备用库有、主库没有（主库内存丢失）

“这怎么搞？”李主任快要崩溃了。

老周说：”我们只能手工对比，确保一致性。”

他们制定了手动对账流程：

1. 导出主库的今日所有业务记录（时间范围：断电前24小时）

2. 导出备用库的同时间记录

3. 对比关键业务：挂号、住院登记、医嘱、收费

4. 发现差异，人工核查（查看业务日志、纸质记录）

5. 对无法确定的差异，标记为”待调查”，业务上补偿（比如给病人重新挂号）

这个流程，花了整整一天，八个人同时核对。

到晚上八点，对账完成：

– 挂号差异：37条，已人工补录

– 住院登记差异：5条，已补录

– 医嘱差异：0条（医嘱还没有产生，或已同步）

– 收费差异：12条，已财务手工调账

“业务基本恢复。”老周说，”但今天的数据，还有一部分在备用库，没同步回主库。明天早上还要做增量同步。”

李主任松了口气。

4. 事故分析：暴露了多少问题？

事故后第三天，老周主持了深度复盘。

参会者：软佳团队、信息科全体、医院领导。

发现的问题清单 (根本原因分析，5 Whys):

问题1：UPS电池老化，没有定期检测

– 为什么？——电池检测制度是”每半年一次”，但去年只做了一次

– 为什么没做？——没人跟踪执行

– 为什么没人跟踪？——运维清单不完整

问题2：主数据中心断电后，没有及时通知备用数据中心”已失去主中心”

– 备用数据中心靠心跳检测主中心状态，心跳没断（网络还通着，因为网络设备有UPS），所以备用中心不知道主中心已经断电

– 切换依赖”主中心故障+心跳丢失”双条件，但这次是主中心断电但网络设备还活着（有UPS），心跳没丢

– 手动切换救了命

问题3：数据同步延迟导致丢失

– 同步是异步的，延迟1-3秒

– 这1-3秒的数据，断电就丢了

– 要达到”零丢失”，必须用同步复制（但会影响性能，降低吞吐量30%）

问题4：主中心恢复后，数据冲突解决机制不合理

– 默认”以主库为准”，但主库断电是不正常状态

– 应该优先以备用库为准，因为备用是正常状态

– 应该在切换前记录”最后一致时间戳”，恢复时根据时间戳判断

问题5：没有”业务快速恢复”预案

– 数据不一致时，业务不知道怎么办

– 应该像银行一样，有”业务补偿流程”：数据不一致时，如何快速让病人看上病、用上药

5. 系统性整改：从”能切换”到”切换后业务无感”

老周和信息科一起，制定了整改计划，投入80万。

1. 基础设施升级（预算40万）

– UPS电池全部更换，半年检测制度（写进SOP）

– 主数据中心增加柴油发电机（支持8小时）

– 备用数据中心增加独立市电接入（双路市电）

– 增加环境监控（温湿度、漏水、门禁）

2. 灾备切换机制优化（预算15万）

– 心跳检测增加”电力状态”监控——如果主数据中心电力丢失，不管网络通不通，立即切换

– 增加”一键切换”按钮，贴在所有关键岗位墙上（物理按钮，防误操作）

– 每季度演练一次手动切换（真断电，不只是模拟）

3. 数据同步优化（预算10万）

– 评估”同步复制”可行性（可能性能下降20%，但保证零丢失）——决定保留异步，但优化

– 增加”断电前最后60秒日志缓存”，主中心断电前，把最后的事务先写入共享存储（SAN），备用中心可以先读这个

– 增加”切换点标记”，每次切换记录时间点，便于恢复

4. 主备恢复流程标准化（预算5万）

– 主中心恢复后，数据同步策略改为”以备用库为准”

– 对账流程自动化（每天凌晨自动比对核心业务数据）

– 差异处理流程文档化，包括业务补偿标准

5. 业务连续性保障（预算10万）

– 最坏情况预案：数据完全无法恢复，如何手工恢复业务？

– 方案：启用”应急纸质表单”，所有业务先手工登记，系统恢复后补录

– 这个方案要提前告知临床科室，让他们有心理准备

– 对医护人员进行”应急模式”培训

6. 一个月后，再次演练：从70分到95分

整改完成后，老周组织了”全真演练”。

这次，他们模拟的场景是：主数据中心断电且断网（比上次更难）。

发现的新问题：

– 备用数据中心启动时间比预期长（15分钟 vs 目标5分钟）——因为存储阵列自检慢

– 业务验证脚本跑不通（有些功能依赖主数据中心的环境变量，没考虑到）

– 切换后，财务科发现”当日收入统计”不准（因为数据延迟，部分收入不在统计窗口内）

继续改。

第二次演练，完美。

老周给信息科的评分：从70分提升到95分。

李主任说：”现在我们不怕停电了，就怕不演练。”

7. 杨院长的话：选择合作伙伴，不是选价格，是选关键时刻靠得住

事故后一个月，杨院长在一次全院大会上说：

“信息系统，是我们医院的神经系统。这个神经系统，不能只有一个大脑，要有备份。这次停电，我们见识了备份的价值。

但更重要的是，我们见识了我们的信息科和软佳团队的专业和负责。凌晨三点，周总带着人赶到医院；四十八小时，没睡过一个整觉；对账、补数据、恢复业务…

选择合作伙伴，不是选价格最便宜的，是选关键时刻靠得住的。”

周总坐在台下，没说话，但记住了这句话。

8. 灾备的”本质”：不是”有”，是”能用”

老周后来在多个场合分享这次经历。

他的核心观点：

灾备系统，不是”买一个放在那里”就行，而是要让它”用过”。

只有演练过，才知道切换按钮在哪里；只有演练过，才知道数据对账流程有多复杂；只有演练过，才知道业务部门需要什么预案。

“很多单位，灾备系统建好了，五年没启用过，美其名曰’系统稳定，没机会用’。但真出事的时候，发现这也不会、那也不熟，灾备系统等于没有。”

灾备的价值，不在于备用，在于能用。

软佳现在的做法：

– 每季度一次真刀真枪的演练（部分业务切换到备用中心，半小时后再切回）

– 每年一次全站演练（主中心完全断电）

– 每次演练后写报告，改进流程

客户一开始嫌麻烦，现在主动要求演练——因为他们 seeing 了价值。

9. 灾备的”成本”与”风险”权衡

有客户问老周：”灾备这么贵（软佳的灾备方案加价30%），值吗？”

老周反问：”你们醫院一年营业额多少？”

“大概10亿。”

“如果系统瘫痪三天，损失多少？”

客户算了算：门诊停三天，损失至少3000万。还不算声誉损失、病人流失、卫健委处罚。

“灾备花300万，保3000万，值吗？”

客户不说话了。

“而且，灾备不是’一次投入’，是持续投入——每年演练、每年升级、每年测试。”

“但比起系统瘫痪的代价，还是划算的。”

10. 给所有技术负责人的建议：不要等出事才后悔

老周最后的总结：

① 灾备不是选择题，是必答题

– 只要系统在生产环境运行，就必须有灾备

– 特别是医疗、金融、政务系统，不能承受数据丢失

② 灾备的”可用性”比”存在”更重要

– 有灾备但不演练 = 没有

– 定期演练，确保切换按钮有人会按、流程有人懂

③ 灾备要有”业务视角”

– 不是”数据能恢复”就行，是”业务能继续”

– 要有业务补偿方案（手工登记、应急表单）

– 要让临床科室参与演练

④ 灾备的”成本”是投资，不是开销

– 一次事故的损失，可能超过十年灾备投入

– 保险思维：小额确定性支出，对冲大额不确定性损失

互动话题

你的系统有灾备吗？演练过吗？实战用过吗？

> 基于真实医院场景改编，人物均为化名

手机扫码试用患者预约。请勿输入个人真实信息（点击图片可查看原图）

支持8种语言：简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

两千张表，三百万病人：一场没有”撤销”按钮的迁移

2026/05/08 Leave a comment

“如果现在停止迁移，数据会不一致，永远回不去了。”

凌晨两点，XX医院数据中心。老周盯着屏幕上的进度条，手在发抖。

迁移进度：87%。

总数据量：2.3 TB。

Tables 数量：2176张。

涉及的核心业务：三百万病人的历史病历、五年门诊记录、三年住院档案。

如果失败，后果不堪设想。

但迁移已经开始，没有”撤销”按钮。

1. 为什么这个迁移这么难？

这次迁移，不是简单的”升版本”，而是从旧架构V3.0，迁移到新架构V4.0。

两个架构的区别：

– V3.0是单体数据库，所有业务数据在一张库

– V4.0是微服务架构，业务数据分库分表：门诊库、住院库、药房库、财务库、病历库…

以前的迁移，只需要在同一个数据库里改表结构，数据不动——这次，要把数据从”一张大饼”拆成”五块小饼”，还要保证每块小饼都能重新拼回原来的样子（如果失败回滚）。

难点：

1. 数据拆分逻辑复杂：比如门诊缴费记录，原来在payment表里，现在要拆成paymentheader（支付头）和paymentitems（支付明细）；还要关联到outpatient_visit（门诊就诊）表。拆分规则涉及六张表。

2. 历史数据质量堪忧：三年积累的数据，有很多”脏数据”——重复记录、缺失字段、编码错误（比如性别填了”未知”），这些在V3.0时代都容忍了，但V4.0的schema有严格约束，脏数据会导入失败。

3. 没有”试错”机会：迁移窗口只有两天（五一假期门诊量少）。两次迁移机会——第一次失败，第二次必须在12小时内完成，否则影响初二开诊。如果两次都失败，就只好延期，等着杨院长问责。

老周带人准备了三个月：

– 写迁移工具（自己开发的data-migrator）

– 清洗脏数据脚本

– 回滚方案

– 全量演练三次，每次都发现问题，每次都改，第三次演练才成功

但演练再成功，也不是真迁移。

2. 迁移开始后，第一个坑：脏数据

晚上八点，迁移开始。

前两个小时顺利：系统库、用户表、权限表…都是一马平川。

十点，开始迁移核心业务数据。

payment表开始迁移，1%…2%…

突然，报错。

“`
ERROR: Violation of NOT NULL constraint: column ‘patient_id’ cannot be null
“`

日志里指明，有一条记录的patient_id是NULL。

这是脏数据。

老周让小吴排查：SELECT COUNT(*) FROM payment WHERE patient_id IS NULL

结果：73条。

这些记录，都是V3.0时代的老数据，可能是创建记录时系统bug，patient_id没填。

小吴说：”跳过这73条吧，不影响整体。”

“不行。”老周说，”如果跳过，对账的时候会发现门诊对不上。而且，如果这73条都是大额缴费，财务损失谁负责？”

他们做了个决定：现场清洗。

写了一条UPDATE语句，试图从其他表关联补全patientid。但关联发现，这73条记录对应的visitid也缺失，无法追溯到具体是哪次就诊。

死循环。

“只能手工造一个patient_id了。”小吴说，”造一个虚拟患者，把这73条付款挂到他名下。等迁移完成，我们在新系统里加一个’未知患者’账户，把这些数据放进去，后续再处理。”

老周犹豫。虚拟数据虽然能过关，但数据准确性打了折扣。

“有没有其他办法？”

“或者，我们暂停迁移，先回滚，把脏数据彻底清理完再迁？”

回滚意味着放弃这次窗口，五一假期只剩一天了，不够。

时间不等人。

老周咬了咬牙：”现场清洗——把有问题的数据，标上’待处理’标签，迁过去后我们在新系统里专门建一个’脏数据沙箱’，隔离存放。”

这是妥协，但迁移不能停。

3. 第二个坑：数据不一致

凌晨一点，进度到63%。

小吴发现一个问题：visitdate字段，在V3.0里是datetime类型，V4.0里拆分成visitdate（日期）和visit_time（时间）。迁移工具把小吴写得有bug：在拆分日期和时间时，时区处理错了。

V3.0存储的是本地时间（东八区），迁移工具当成UTC时间处理，减了8小时。

结果：所有就诊时间的visit_time，都比实际时间晚8小时。

比如一次早上8点的就诊，迁过去后变成了凌晨0点。

“天呐…”小吴脸白了。

老周也傻了。

这不是小问题。时间错误，会影响排班、统计、甚至医保结算（医保要求精确到小时）。

“修复这个bug，但已经迁过去的数据怎么处理？”

更可怕的是：已经迁了63%的数据，现在发现一个重大bug，是继续迁（错上加错），还是回滚？

继续，所有数据都错，无法挽回。

回滚，63%的数据要清理，重新迁，时间不够。

老周深吸一口气：”调出这个bug的影响范围数据。我们现场修复——迁过去的63%，我们另写一个’修正脚本’，把时间加8小时。”

小吴心算了一下：数据量800万条，修正脚本跑一遍要2小时。

“时间够吗？”

“不够也要够。”老周说。

4. “修正脚本”成为赛跑

老周和团队吃了两片咖啡因，开始写修正脚本。

脚本逻辑很简单：

“`sql
UPDATE outpatient_visits
SET visit_time = DATEADD(hour, 8, visit_time)
WHERE visit_time IS NOT NULL
“`

但要跑800万行，必须在2小时内完成，否则夜深了，医院的业务开始恢复，没机会再改。

他们优化：

1. 分批更新，每次10万行，commit 后继续

2. 加索引：在visit_time上建临时索引，加速 update

3. 关掉binlog，减少IO

4. 调大innodbbufferpool_size，确保数据在内存里

脚本跑起来，每分钟更新12万行。

一小时，600万。

凌晨三点，修正完成。

迁移继续。

5. 最后一个坑：外键约束冲突

早上七点，进度97%。

只剩最后一批数据迁移：prescription（处方）表。

报错：

“`
ERROR: Cannot add or update a child row: a foreign key constraint fails (`prescription` constraint `fk_prescription_visit`)
“`

意思是：有一条prescription记录，引用的visitid，在outpatientvisit表里找不到。

脏数据 again。

但这次很奇怪：前96%的数据都关联成功，为什么最后3%会丢？

小吴排查：最后这批数据，是2024年12月31日跨年的那批。那几天系统做了一次数据归档——把半年前的记录移到历史库。

但归档工具可能有bug，把某些visit_id漏了。

“跳过吧，”小吴说，”就几条处方，影响不大。”

“不行。”老周说，”处方是核心业务，漏一条，病用药记录就不全。而且，这是系统性问题的体现——如果这里漏了，其他地方呢？”

他们决定：现场补数据。

方法：从旧库（V3.0）里，把这批visit_id对应的记录，手动补出来，再导入新库。

旧库还没关，可以查。

但旧库是生产环境，不能直接操作。他们只能查，不能改。

查询：SELECT * FROM outpatientvisit WHERE visitid IN (xxx, yyy, zzz)

发现这三条visitid对应的记录，已经被归档到outpatientvisit_history表了。

迁移工具没考虑到这种情况——只迁了主表，没迁历史表，导致引用断裂。

小吴把这些历史记录也迁过去，但迁到outpatient_visit主表（违反了业务逻辑，历史记录不应该混在主表里）。

“标记为历史记录。”老周说。

6. 100%完成后，还有验证

早上八点，迁移工具显示：100%。

所有人松了一口气。

但老周没放松：”迁移完成，不算完成；数据验证通过，才算完成。”

他们有一套验证流程：

1. 行数对比：每张表的记录数，新库 vs 旧库，差异率<0.1%

2. 总和校验：对金额、数量等关键字段，做SUM对比，应该相等

3. 样本抽查：随机抽取1000条记录，逐字段对比，应该一致

4. 业务逻辑验证：跑一遍核心业务流程（挂号→开处方→缴费），结果应该一致

前三个通过，第四个出问题。

模拟一次门诊全流程：挂一个号，开三个药，缴费。

在V4.0里，挂号的visitid，和处方的visitid，对不上。

又一轮排查发现：visit表的id字段是自增的，迁移过程中，新库的自增起点没设置对，导致新生成的ID和旧的不一样。但prescription表里的visit_id是直接迁过来的（旧的ID值），而新挂号的ID是新产生的（新的自增值），两者当然对不上。

“这是一个’活数据’问题，不是迁移问题。”小吴说。

老周明白了：迁移只迁了历史数据，但迁移完成后，新产生的数据用的ID和旧数据不连续。这会影响对账、追溯等需要全局ID唯一性的场景。

解决的方案：重置自增ID的起点，让它从旧库的最大ID+1开始。

但问题是：迁移后已经产生了一条新挂号记录（验证用的），ID是1。重置起点后，这条记录的ID会和后面的冲突。

只能删除这条验证数据，重置ID，再重新验证一次。

折腾到中午十二点，全部通过。

7. 事后反思：我们做对了什么？

这次迁移后，老周写了长篇复盘。

他的结论：

1. “现场清洗”是必须的能力

– 不要指望数据100%干净再迁

– 要能在迁移过程中，实时发现脏数据，实时处理（跳过、修正、隔离）

2. 修正脚本应该提前准备好

– 不是所有bug都能在迁移前发现

– 为每一类可能的数据问题，提前写好”修正脚本模板”，迁移时填参数就能跑

3. 验证必须自动化

– 人工抽查不够，要有程序自动跑完整的数据验证流程

– 验证通过率应该>99.99%

4. 要有”回滚点”概念

– 每完成一个业务单元（如门诊库），就做一个”回滚点”

– 后面的阶段失败，可以回滚到这个点，而不是全部重来

5. “迁移”不只是”搬数据”

– 还包括：ID生成策略、自增主键连续性、时间戳时区、字符集转换…

– 任何细节出错，都会导致业务逻辑错误

互动话题

你经历过最复杂的数据迁移是什么？有什么经验教训？

> 基于真实医院场景改编，人物均为化名

手机扫码试用患者预约。请勿输入个人真实信息（点击图片可查看原图）

支持8种语言：简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

“幽灵”在数据库里游荡：一次诡异的业务中断追踪

2026/04/21 Leave a comment

早上八点，门诊刚开诊，系统就”抽风”了。

不是全面崩溃，而是”间歇性失能”——挂号时好时坏，有时能挂上，有时直接报”系统繁忙”；收费窗口收不了费，反复提示”连接超时”；药房系统频繁掉线，药剂师急得直拍桌子。

更诡异的是，这种现象没有规律——可能连续十笔都正常，第十一笔就挂掉；可能某个窗口一直正常，换个窗口就出问题。重启服务，暂时恢复，但半小时后又开始”抽风”。

1. 从日志中发现蛛丝马迹

李主任带着团队排查了半天，CPU、内存、磁盘、网络都正常，数据库监控也”一片绿色”。但故障就是真真切切地发生了，患者投诉电话不断，门诊科主任亲自跑来质问：”什么时候能搞定？我们患者都堵成马了！”

老林建议从日志入手。他们调出了过去两小时的应用日志和数据库日志，开始逐条分析。小吴发现了一个模式：每次故障发生前，数据库中都会出现一批持续时间很长的查询语句，执行时间从30秒到3分钟不等，内容都是关于”门诊挂号统计”的某个特定查询。

“这个查询不应该这么慢，”小吴说，”它走的索引是合理的。”

但当他仔细查看这些慢查询的执行计划时，发现了一个细节：它们在某个表上做了全表扫描，而那个表应该有索引。再往下追查，发现那个索引在昨天晚上被不小心删除了——部署一个补丁时，多执行了一个DROP INDEX语句，而 nobody 注意到。

“重建索引，”老林说，”应该能立刻解决问题。”

但问题没那么简单。索引重建后，系统确实快了几分钟，但间歇性故障又出现了。看来，那个dropped索引只是表象，不是根因。

2. 报表任务变成了定时炸弹

小吴继续深挖日志。他发现，每次故障窗口，数据库的锁等待数量都会激增。具体来说，是很多会话在等待一个名为”IX”的锁——表级意向锁。这说明，有大量事务在等待获取某个表的锁。

“是什么事务在持有锁？”李主任问。

小吴筛选出锁持有最长的会话，发现它们都在执行同一个存储过程：usp_GenerateDailyReport，每天门诊结束后自动运行的报表生成。这个报表需要统计当天的挂号、收费、药房数据，涉及多张大表的联合查询。

“但它应该是在晚上十点后才运行，”李主任说，”为什么现在早上八点也在跑？”

原来，由于昨晚报表生成时间过长（因为索引问题），到了午夜十二点还没完成。系统设计有重试机制，每隔一小时再次尝试。于是，早上八点时，第四个重试正在执行，而且因为数据量累积，执行时间更长。

他们做了两个动作：

1. 立即终止正在运行的报表任务

2. 临时禁用重试机制，防止再次触发

故障立刻缓解。但李主任知道，这只是治标不治本——如果报表任务依然需要跑这么久，晚高峰时它再次重试，问题会重现。

真正的解决需要优化报表本身。老林带着团队分析了这个报表的SQL，发现它有很多不必要的DISTINCT和子查询，而且没有分页机制，一次性拉取了全量数据。他们重写了这个报表的查询逻辑，增加了分阶段汇总，将执行时间从原来的25分钟降到了3分钟。

3. 资源争用：看不见的瓶颈

但李主任还提出了一个管理上的问题：”为什么一个报表的异常，会拖垮整个门诊系统？”

答案在于数据库资源的”独占”问题。那个报表任务运行在一个独立的数据库连接上，但它使用了大量内存排序和临时表，占用了大量共享资源。而门诊业务的高频查询，恰恰也需要这些资源。两者发生了资源竞争。

“我们应该给报表任务设置资源限制，”李主任说，”或者在非高峰时段运行。”

团队最终决定：

1. 报表任务改到晚上十一点到次日凌晨四点之间运行，避开业务高峰

2. 为报表任务单独配置一个数据库连接池，限制其最大连接数

3. 增加报表执行时间的监控，超过10分钟自动告警

争议最大的是第三个决定。老林担心：”万一报表真的需要跑更长时间怎么办？”

李主任回答：”那就得有人来评估，是否需要调整业务逻辑。不能让它无声无息地占着资源，把门诊拖垮。”

4. 故障之后的教训

故障解决后的第三天，李主任在科室内部做了一个分享。他总结道：

“这次故障，表面上是一个SQL性能问题，根子是资源争用与任务调度的配合失误。我们系统里有很多定时任务——报表、对账、数据同步——如果它们的执行时机和资源消耗没有管控，就可能在不该出现的时候抢占业务资源。”

“更根本的是，我们的监控体系有盲区。我们只监控了’系统是否活着’、’CPU是否爆了’，但没有监控’资源竞争程度’。锁等待数、临时表增长、内存排序量，这些才是真正预示问题的指标。”

一周后，团队上线了一套新的数据库运营看板，专门监控这些”隐形指标”。李主任把这次故障的经过和分析写成了案例，发给了全院信息科。

三个月后，当软佳的客户成功经理来医院进行数据安全审计时，李主任主动提起了这次故障。他说：”我们后来复盘，发现最危险的不是故障本身，而是故障发生前的’正常假象’——所有监控指标都是绿的，但业务已经不正常了。”

“所以现在，我们新增了一个’业务感知监控’——每隔十分钟，自动模拟一次挂号操作，测量响应时间。如果响应时间超过2秒，即使其他指标正常，也触发告警。”

客户成功经理点头：”这是正确的方向。运维的核心价值，不是保证系统’不挂’，而是保证业务’不卡’。”

李主任笑了笑：”而这次故障，让我们明白了’卡’从哪里来。”

互动话题

你们医院遇到过”监控正常但业务异常”的情况吗？是怎么发现并解决的？你觉得最应该监控哪些”非传统”指标来预防这类问题？欢迎在评论区交流你们的运维心得。

> 基于真实医院场景改编，人物均为化名

手机扫码试用患者预约。请勿输入个人真实信息（点击图片可查看原图）

支持8种语言：简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

昆明软佳科技有限公司 – 昆明HIS系统

Tag: Consumption ratio analysis

“幽灵”在数据库里游荡：一次诡异的业务中断追踪

1. 从日志中发现蛛丝马迹

2. 报表任务变成了定时炸弹

3. 资源争用：看不见的瓶颈

4. 故障之后的教训

互动话题