医院信息数据挖掘及数据可视化
概述
近些年来,信息技术快速发展,现代计算机信息应用技术在医疗领域发挥了前所未有的作用,大型医院都已经建立了医院信息系统(Hospital Information System,HIS)随着HIS 的广泛使用,数据库中的医院信息不断累积增加。海量数据急剧增加,往往不能得到有效的应用;若没有办法深入理解数据库里面的信息,则将会失去医院信息的价值。所以,当前在医院信息化的建设过程中需要处理的问题之一就是如何充分地利用HIS 数据库中的宝贵信息资源来为临床科研、医院服务质量、医院领导决策、卫生统计等提供科学的依据。
随着各医院的HIS 大范围使用运行之后,其HIS 数据库中存储的数据不断增加,数据库中历史数据日益增多。在这种背景情况下,把数据挖掘技术和数据可视化技术应用到处理医院医疗数据上是一个大趋势。数据挖掘技术对部分医疗数据进行了处理,但所得结果不便于理解因而无法为专业人员提供更好支持,而针对传统数据挖掘技术所得到的各种模式能够提供集成统一的接口及多种形式、多种角度、多种维度的直观的可视化展现方式,可以为专业人员提供更强有力的支持。
国内外研究现状
国外研究现状
早在2002年IBM 华生研究中心对以色列的耶路撒冷和哈达萨医院的病人病例,开发了Opal 工具包,对大量的骨髓移植数据进行了可视化显示,这是一个在生物信息学领域的信息可视化技术方面的很好的实用性实例。Brant Chee 等人相继于2008年和2009年提出了健康信息药物治疗方案的可视化和医疗卫生信息的社会可视化。进而实现了信息可视化在医疗领域的应用,并从中发现药物和社会团体之间的关联关系和环境对人的健康状况的影响。美国卡内基梅隆大学的Christopher 等人于2009年提出基于初级保健糖尿病风险的分类和评估的可视化方法。本研究与医学证据、统计降维技术和信息可视化相结合建立一个框架,从而开发信息可视化分类器用于糖尿病风险的评估患者群中。日本岛根大学的Shusaku Tsumoto 等人于2011年。他们提出了包括决策树、聚类分析、MDS和三维数据挖掘的时空数据挖掘过程。结果表明,大量存储数据的复用为基于医院临床行为的分类表征时间趋势提供有力的工具。葡萄牙的Pedro Pereira Rodrigues 做了预测基于虚拟病人记录的访问日志的生存分析的医院临床报告的可视化的研究。马来西亚的Muhammad Sheraz Arshad Maik 等人从医生的视角研究了电子病历可视化系统在公立医院的使用,用抽象有效的病人数据直观显示,以获取有效信息进而改善病人的护理。美国NeuroMedical和Vysis 公司利用数据挖掘可视化技术,通过对其趋势分析进行药物筛选,为药品的研发进行蛋白质的分析,对药物副作用进行了探索,发现了药物间的副作用。Marinovm 等人提出通过数据挖掘可视化技术对糖尿病及并发症流行病学进行了研究。
国内研究现状
在国内,对于医院信息数据挖掘及数据可视化的发展相对较晚。北京大学袁晓如教授带领的北大可视化研究小组在图可视化、轨迹可视化,微博可视化等领域开展了相关的研究工作。浙江大学在医院信息系统的数据挖掘技术、可视化领域开展了相关的研究工作。清华大学的唐泽圣教授是国内较早进行可视化研究的学者之一,其研究领域涵盖了医学、地质学和气象学可视化分析。中科院软件所的田捷教授等在医学可视化领域取得了一些研究成果。浙江大学、北京大学也建立了可视化的国家重点实验室,并在可视化方面做了很多的工作。近几年我国对HIS 进行数据挖掘的研究相对国外较少,我们在银行、移动通信、证券、联通、保险、电信等相关行业虽然已经成功的应用数据挖掘技术,可是当前在HIS 中的应用还处于初始阶段。据报道对HIS 所产生的数据进行挖掘研究的机构,目前在国内有北京协和医院信息中心、解放军福州总医院信息中心等。
数据挖掘概述
数据挖掘及其在医疗研究中的应用
数据挖掘是在1989年提出来的,也称为数据库中的知识发现。挖掘的过程一般由确定挖掘的对象、数据准备、模型建立、数据挖掘、结果分析表述、挖掘应用等阶段组成。
当前的医疗机构的数字化增大了医院数据库医疗数据数量。在疾病的诊断、治疗和医疗研究方面都,这些宝贵的医疗信息提现的非常有价值。因此,怎样自动提升和处理医疗数据库,进而提供全局的、精准的保健措施和诊断决策,已经成为提高医院服务质量和促进医院长远发展而必须解决的新问题。医疗数据挖掘就在这种背景下应运而生。