
2.1 基于 BI 工具 DeepSee 对闭环电子病历系统 InterSystem DeepSee 是一个进行数据挖掘 和统计很有用的 BI 工具。使用 DeepSee 的过程是一个数据探索、选择和转化的过程[2]。医 院信息系统数据库的数据量很大,DeepSee 是处理这些数据非常有用的工具。我们还采用 Caché 数据库作为医院信息系统数据库。 Caché 数据库是 InterSystems 公司的高性能对象数 据库[3],将强大的对象数据库与健壮的 SQL 技术融为一体,为复杂应用提供了快速开发环 境以及快速引擎。目前已成为全球临床医疗应用系统的首选数据库[4]。 DeepSee 是一个使数据挖掘人员能够将实时商业智能嵌入到现有的或未来的事务处理 程序中的创新软件[5]。基于它的这个特点,我们利用 DeepSee 对医院信息系统数据进行统 计,并设计了一个闭环的医院信息系统,如图 1。在闭环系统中,数据分析的结果用来实时 控制电子病历中的药名排序,从而实现医嘱药名排序的自动化和个性化。\n\n图 1. 基于 BI 工具 DeepSee 的的闭环医院信息系统 2.2 数据分析过程 基于 DeepSee 的电子病历闭环系统中,医生通过电子病历客户界面输入 医嘱数据,存储于电子病历数据库。利用 BI 系统 DeepSee 将从数据库中取出的数据进行选 择, 然后建立模型进行分析, 最终将分析结果反馈到电子病历客户端, 对电子病历进行控制。 数据流如图 2 所示。\n\n图 2. 基于 DeepSee 的闭环数据分析过程 根据上述数据分析和闭环控制过程, 我们对电子病历系统 HYGEIA 的药名排序进行改造。 在 HYGEIA 的 Caché 数据库中,医生的处方数据记录于医嘱日志表中,表中包含用户 ID,药 名代码,医嘱类型等数据。通过 DeepSee 的 Architect 将医嘱日志表中的数据导入,并设置 相关量值和纬度(主要包括时间、药名代码、医生即用户 ID 三个维度) ,然后利用 Analyzer 对的数据分药名代码、用户 ID(即医生)进行统计,添加过滤条件将处方医嘱挑选出来, 得到不同用户的处方频率。再添加一个过滤条件使用户 ID 为特定值,可以得到特定用户的 处方频率。最后,利用 Analyzer 中的 MDX 语句,通过数据存取接口将结果取出到客户端。 2.3 排序过程 取出 DeepSee 中的统计结果之后,需要根据结果对药名进行排序。首先根据 不同的用户 ID 取出相关用户的药名代码使用频率的统计结果,存储在临时数组 Result[n]\n\n\r\n
当中,取出对应的药名编码存储于字符串数组 ResultDrugCode [n]当中。然后根据冒泡排 序将频率值 Result[n]做降序排列, 同时将对应的药名代码 ResultDrugCode [n]做降序排列。 由于所得到的降序排列的药名代码是所有药名编码的子集, 再从所有的药名编码中先把排列 好的子集挑选出并排列在数组的前列,剩下的排列在数组后列,最后,根据药名编码在药名 字典中取出药名。整个排序流程图 3.\n\n图 3. 排序流程图 3 结果 在完成上述所有的工作之后, 最后一步是将结果应用到电子病历中。 特定用户的实时药 嘱频率排序能够用来实时自动控制该用户电子病历中药嘱界面的药名排序, 可以从图 4 中看 到排序的效果。\n\n图 4. 电子病历闭环控制结果 3.1 同一用户不同时间的药名排序变化 随着医生一天天的使用自己的电子病历,他/她的 电子病历中的药名排序会越来越符合他/她的用药习惯,我们在表 1 中列出了一个医生在两 个星期的三个时间点的部分药嘱频率,其中 0,1,2 分别代表刚开始使用的时点、使用 1 个星期之后、使用 2 个星期之后三个时间点。相关的药名排序结果变化如图 5 所示。 表 1. 同一用户不同时间的用药统计频率表\n\n\r\n
Tw wo week later A w week later Start \n\n图 5. 同一用 用户不同时间 间的药名排序 序结果 3.2 不同用户电 电子病历中的 的药名排序对 对比 由于不同 同的医生都有 有不同的处方 方习惯,我们通过 同用户 ID 得到 到不同用户药 药嘱频率的统 统计结果并对 对电子病历中 中的药名进行 行自动实时排 排序。 不同 表 2 中列出了不 不同用户在使 使用闭环电子病 病历系统相同的时间之后 后各自的用药 药频率, 图 6 是他 们各 各自的电子病 病历药名实时 时排序结果。 表 2. 不同用 用户同一时间 间的用药统计 计频率表\n\nDrug order o of UserID1\n\nDrug order of UserID2\n\n图 6. 不同用 用户同一时间 间的药名排序 序结果 3.3 电子病历药 药名排序的实 实用性验证 考 考虑到一个医 医生在下医嘱 嘱的时候,药 药名控件的空间是 有限的,那么如果医生要用 用到的药品种 种类特别多,即使能够实 实现药名的自 自动排序,医生仍 很有 然需 需要使用滚动 动条查找药名或者使用拼 音搜索, 自动 动排序的意义 义会大打折扣 扣。 于是我们根据 浙江 江某医院的医 医嘱主记录统 统计了 2001 年 年第一个季度 度的几种常见 见科室的门诊 诊药嘱数据,包括 耳鼻 鼻喉科、消化 化内科、普通外科、骨科、 、妇科以及神 神经外科,如 如图 7。我们 们还进一步统 统计出 这几 几个科室在第 第一个季度中使用频率大 于 5 的药名种 种数,得到表 表 3。\n\n图 7. 不 不同科室的用 用药频率排序 序 表 3. 使用 用超过 5 次的 的药名种数统 统计\n\n\r\n
从图 7 我们可以看出,尽管医院拥有成百上千的药品,但在特定科室当中,除了少数药 名出现频率很高,其它处方药名的使用频率都会迅速下降;从图 3 中可以进一步看出,各个 科室最常用的药名种数不会超过 20 种,平均种数只有 11 种。这就是说,如果医生要在成百 上千的药名种查找自己需要的药名,一般需要用到检索功能,这给医生下医嘱带来了不便。 然而, 如果我们在电子病历中应用药名自动排序功能,使常用药排序在前列,我们能够帮 助医生更快更方便的下医嘱。 在医院的药名种数相当多的情况下, 药名自动排序的功能尤其 重要。 4 总结和讨论 本文运用 BI 系统对电子病历进行闭环控制,利用医生药嘱频率的实时统计结果,优化 了电子病历的药名排序。电子病历的药名自动排序,是电子病历的个性化发展,与无规律的 药名排序相比,加快了医生下医嘱的速度,改善了电子病历的交互设计。 也许有人会提出,既然各个科室常用药不多,在从药名字典中取出药名的时候,直接给 不同的科室确定一个固定的排序,也可以解决类似的排序问题。但是,这种方法存在很严重 的问题,就是不具有可移植性,每个医院的科室设置、药的种类都不相同,那样的固定排序 只能满足一个需求。而利用数据挖掘对药名进行实时自动的排序,通过用户 ID 进行识别, 排除了这些不良因素,使电子病历真正实现个性化。 除了上诉提到的优点之外, 我们相信, 我们能够逐渐运用更多的技术比如数据挖掘技术 等来对电子病历进行闭环控制,将电子病历改造成一个方便的、人性化的、个性化的系统。 随着数据挖掘技术在电子病历系统中的逐步应用,终将会实现智能化的电子病历。 参考文献 [1]Yu H, Li J, Han X, et al. Data mining analysis of inpatient fees in hospital information system. Proceedings of the Second IEEE International Symposium on IT in Medicine & Education (ITME 2009), 82-85, 2009. [2]Soukup T, Davidson I.: Visual data mining: Techniques and tools for data visualization and mining. Wiley. Com, 2002. [3]Li J, Zhang X, Chu J, et al. Design and development of EMR supporting medical process management. J. Med. Syst. 36(3), 1193-1203, 2012. [4]Intersystems: Caché Tech Guide, http://www.intersystems.cn/cache/. [5]Embedded technology, http://www.intersystems.com/ [6]Du H, Zhang B, Chen D. Design and actualization of SOA-based data mining system. In: 9th International Conference on Computer-Aided Industrial Design and Conceptual Design, pp. 338-342. IEEE Press, New York, 2001. [7]Xiong W, Xiao X, Shu J, et al. Research on service-oriented architecture-based data mining system. 2012 IEEE International Conference on Computer Science and Information Processing (CSIP), pp. 844-846. IEEE Press, New York, 2001. [8]Fayyad U, Piatetsky-Shapiro G, Smyth P. From data mining to knowledge discovery in databases. J. AI, MAG. 17(3). 37, 1996.\n\n\r\n
