公务员期刊网 论文中心 正文

医院数据挖掘管理运用

前言:想要写出一篇引人入胜的文章?我们特意为您整理了医院数据挖掘管理运用范文,希望能给你带来灵感和参考,敬请阅读。

医院数据挖掘管理运用

1数据挖掘技术综述

1.1数据挖掘的概念

数据挖掘(DataMining[1])是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。数据挖掘可粗略地理解为三部分:数据准备(DataPreparation)、数据挖掘,以及结果的解释评估(InterpretationandEvaluation)。将数据挖掘技术应用到医学信息数据库中,可以发现其中的医学诊断规则和模式,从而辅助医生进行疾病诊断,实现临床决策支持的效果。

1.2数据挖掘的功能[2-6]

1.2.1关联分析

数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律,就称为关联。关联可分为简单关联、时序关联、因果关联。

1.2.2分类

分类就是找出一组能够描述数据集合典型特征的模型(或函数),以便能够分类识别未知数据的归属或类别,即将未知事例映射到某种离散类别之一。

1.2.3聚类

数据库中的记录可被化分为一系列有意义的子集,即聚类。

1.2.4概念描述

对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述,这种描述就称为概念描述。

1.2.5预测

数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。

1.2.6异常检测

一个数据库中的数据一般不可能都符合分类预测或聚类分析所获得的模型,那些不符合大多数数据对象所构成的规律的数据对象就被称为异常数据。

1.3数据挖掘的过程

数据挖掘过程[7-9]是在设计者的主动参与下进行的知识发现过程,是在积累了大量的数据后,从中识别出有效的、新颖的、潜在的、最终可以理解并加以有目的运用的知识。一般分为以下步骤:问题定义:清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。数据准备:①数据理解---将数据转换成一个分析模型。这个分析模型是针对挖掘算法建立的。②数据的选择及简化—是根据用户的需要从原始数据库中抽取的一组数据。③数据的预处理--研究数据的质量,为进一步的分析做准备。数据挖掘:对所得到的经过转换的数据进行挖掘。结果分析:解释并评估结果。知识的优化:将分析所得到的知识集成到业务信息系统的组织结构中去。

2医院信息系统中数据挖掘的研究

2.1医疗数据挖掘主要分类

2.1.1从数据挖掘的处理过程、功能模型、算法研究,可以将医用数据挖掘按功能模型和挖掘对象两个方面进行如下分类[10-14]。

2.1.1.1按照功能模型分类:常用的数据挖掘技术可以分成统计分析类、知识发现类、和其他类型的数据挖掘技术三大类。①统计分析类:统计是数据搜集和描述数学的一个分支。在医疗数据挖掘中的应用如:聚类分析方法可以对DNA分析、医学影像数据自动分析、多生理参数监护数据分析、中医诊断和方剂的研究、疾病危险因素分析等。②知识发现类:知识发现是用一种间接的方式从数据中抽取信息的一种技术,而这些信息是隐含的、未知的,并且具有潜在应用价值。其中可分为:a.关联规则型知识挖掘技术,是医用数据挖掘的一种主要形式。b.神经网络型知识挖掘技术。c.遗传算法型知识挖掘技术。d.粗糙集型知识挖掘技术。如关联分析可以用来分析预测手术术后和药物治疗的效果,可以对某种疾病的相关发病因素进行分析以指导患者如何预防该疾病;可以对带病DNA和健康组织的DNA基因序列进行比较,以识别出两类基因的差别,从而得出致病因素;可以对患者的生理参数进行分析,分析各种生理参数之间的关系进而得出有意义预防与治疗方案等。e.机器学习类,归纳学习方法又可分为决策树、规则归纳等。如决策树用于前庭区与头晕有关的疾病诊断规则的提取。③其他类型:除以上陈述的数据挖掘技术外,近年来,随着各种数据处理工具、先进的数据库技术与因特网技术的迅速发展,还出现了一些其他数据挖掘技术。如文本挖掘技术、Web挖掘技术、分类分析技术、地理信息系统与空间数据挖掘技术以及分布式数据挖掘技术等。

2.1.1.2按照挖掘对象分类:按照不同的数据类型,数据挖掘研究在时间序列数据、空间数据、文本数据、多媒体数据等方面展开。①时间序列数据(TimeSeriesData)是与时间有关的一系列数据。对时间序列数据的挖掘主要是发现序列中事物出现的周期和规律,以及不同时间序列间的同步关系。如应用时间序列预测方法可以对医院药品进、销、存产生的数据进行统计分析。②序列(Sequential)模式序列模式与关联模式相仿,其目的也是为了挖掘数据之间的联系,但是序列模式分析的侧重点在于分析数据之间的前因后果。如:对医院门诊和住院患者量进行预测,可以分析某种疾病发病率的变化趋势,病死率预测等。③文本数据(TextData)就是我们一般的文字,如报刊杂志、设备维护手册、故障描述等的内容。④多媒体数据(MultimediaData)是随着多媒体技术而日益涌现的声音、图形、图像、超文本等数据。应用领域例如针对大量CT、MR图像的存储和查询问题而兴起的基于内容的图像问题。由于与传统的文本数据不同,因此必须采用新的挖掘手段来发现内容和形式间的内在联系。

2.1.2按应用层面可医院数据挖掘可分为诊疗信息挖掘和管理信息挖掘。诊疗应用如:中山大学肿瘤防治中心的研究人员通过肿瘤分子信息和数据挖掘方法可以预测早期非小细胞肺癌5年内是否死亡,这一预测的总正确率达87.2%,该技术一旦成熟,今后每个肺癌患者开刀做完手术后,可借此预测其5年存活情况,而且检测费用远比国外的基因检测便宜;上海同济大学附属医院分析糖尿病患者肌肉组织和脂肪含量与骨密度之间的联系,得出高肌肉和高脂肪含量可以降低患者髋骨骨折的危险性;第四军医大利用数据库和数据挖掘技术建立了恶性血液病数据库分析系统等。管理应用如:北京协和医院开展数据挖掘在临床医疗管理上的研究,为医院业务管理等提供支撑,并辅助领导决策;广州南方医院采用数据挖掘查询系统查询医生有否开大处方,患者是否花了不该花的医药费,且患者有望提前治愈出院。

2.2医疗数据挖掘的应用研究

2.2.1诊疗信息挖掘

诊疗信息挖掘主要目的是通过患者信息分析,提供有参考作用的医疗方案。①建立患者随访信息库。②临床疾病分析、辅助诊断:如:a.判别分析:用于心脏疾病的分类;用于阑尾炎4种不同类型的判别。b.人工神系统网络:用于颅内星形胶质细胞瘤良、恶性的影像诊断;用于肺内孤立结节的影像鉴别诊断。c.决策树:糖尿病分类规则建立;前庭区与头晕有关的疾病诊断规则的提取。

2.2.2管理信息挖掘

2.2.2.1财务管理[15,16]

①患者费用构成分析:患者费用由药品、治疗、检查、手术、化验等组成。利用数据挖掘技术可以分析医院、科室乃至各个病区专科内的患者费用构成,从而能有针对性地控制费用比例,探究医疗费用项目结构的合理性,使医院管理者有针对性的控制医疗费用。②同期费用对比分析:利用数据挖掘技术可以按不同的时间对各个科室或各个病区同期的各种费用进行对比分析,并以各种专业报表、视图的形式反映给医院管理者,分析变化趋势及可能原因。③成本效益分析:利用数据挖掘技术可以把各个不同系统如物资设备系统、财务系统等的数据汇总到数据仓库,然后对医院的成本效益情况进行全面分析,以便能真正把握医院的经营状况,提高医院的经济效益。例如:对医院资金运转情况作财务分析,了解医院财务状况和资金流向,分析医院运营风险,利用数据挖掘中的环基比和定基比技术分析医院财务资金的增长速度,并用曲线拟合来预测未来的资金需求量,为管理者决策和促进资源的有效配置提供依据。④医保费用构成分析:利用医院业务数据结合医保中心返还数据对医保分科的定额结算进行分析,指导医院各科室合理、高效的利用医保资源,在医保定额下提供更好的医疗服务。

2.2.2.2医疗质量管理[17-19]

①单病种分析:以ICDlO疾病分类为标准,利用数据挖掘技术对单病种进行分析,包括住院费用、住院天数、转归、病情、治疗方案等方面,为医疗质量管理提供依据,使医生能够及时总结经验,找出最佳治疗手段,既缩短了患者的就诊住院时间,减轻了患者的负担,同时提高了医疗工作效率,增加了医院经济效益。②手术室感染管理:a.手术室无菌物品及一次性用品智能备库系统;b.总结消毒灭菌工作与消毒效果的规律;c.预测术后切口感染合理安排手术并防止抗生素的滥用;d.利用HIS中知识解决消毒灭菌难点并杜绝差错;e.对参观手术人员和进修生实习生的管理;f.对手术室消毒灭菌和医院感染常规工作动态监测。③药学管理:a.备药量预测:用时间序列预测方法,对HIS中现有的药品用量信息进行计算模拟,得出药品消耗模型。b.制剂最佳批生产量预测:在分析医院制剂历年用量及近期消耗趋势下,得出该制剂效期内用量,并通过计算得出该制剂的最佳批生产量预测模型。c.治疗药物监测:对药物监测(TDM)历史数据分析、提取、加工、整合,更深层次挖掘(或发现)一些新知识,如开展药物群体药动学研究、药物浓度影响因素相关度分析等,为临床提供更多有价值的资料,实现给药个体化、提高药物疗效、降低药物毒副反应等。d.抗生素合理应用自动监控:对HIS中相关信息进行提取、分析、挖掘,对抗生素的用量、耐药性、联合用药、疗程、围手术期用药、预防用药、用药途径及治疗效果等指标实行自动监控,从而实时、有效地监测抗生素使用情况。

2.2.2.3医院经营目标管理[20]

①患者构成分析:运用数据挖掘技术中的秩和比法对医院门诊和住院患者的地区分布、性别分布、身份分布、职业分布、年龄分布等方面进行分析,从而得到不同类型患者的经济状况、需求的主要医疗服务类型等信息,了解患者差异对医院收益的影响,从而能够有针对性的采取措施来提高服务质量,增加门诊量和住院量。②患者流动情况分析:该功能可以分析门诊患者从挂号到取药再到离开医院的时间分布以及住院患者从入院到出院各个就医环节的时间分布。分析出患者的就医瓶颈,掌握影响患者诊疗效率的因素,以便能针对这些因素采取措施来帮助医院管理者进行业务流程的更新和改进,提高患者的就诊效率。

2.2.2.4经营决策管理[21]

①患者就诊时间分析:由于患者的入院季节性较强,可以通过分析每月、每季度的门诊人次、住院人次、床位周转率,通过时间维度分析,建立灰色预测模型,来预测下一时期的门诊和住院人次。根据预测信息,医院管理者可以提出有针对性的措施,确定最优的服务项目时间表,从而作出终止或开拓某种医疗服务项目的决定,实现对人力资源、医疗设施、医疗设备的适当配置。②医疗工作量影响分析:科学合理地评价医疗工作量,找出影响医疗工作量变化的主要因素,是进行医疗工作量影响分析的目的。例如:医院收治患者数是医院工作量的重要指标之一,直接影响医院的经济效益和社会效益。利用数据挖掘技术中的灰色关联分析方法对医院收治患者数的影响因素进行分析:病床周转次数、住院患者手术人次、年收治患者人数、平均开放病床数和年平均医生人数与年收治患者数关联程度等。

2.2.2.5医院资源管理

①科室综合评价分析:利用数据挖掘技术对医院各科室进行综合评价分析,选出代表性强、独立性好,能反映科室工作效率、治疗质量、经济效益、综合管理等的多项指标进行综合评价分析,找到科室的薄弱环节,并采取相应的措施,以提高科室的综合水平。②医疗设备绩效预测分析:从HIS中的患者信息中提取病种、数量、诊疗类别等信息后与医疗设备使用信息相关联,利用数据挖掘技术对所得到的信息进行深层次的数据挖掘,构建数据挖掘模型,利用已建立的数据挖掘模型,在医疗设备购置前对其绩效进行预测,使医院领导的决策更为准确、科学;在医疗设备投入使用后,对其绩效进行准确评价,提高医疗设备的完好率和使用率。通过进一步的数据挖掘,实现对医疗设备从购置前的可行性论证到淘汰报废的全程决策支持,使医疗设备的全寿命期都纳入管理者的统筹管理之中,较好地解决医疗设备效益、代价、风险等互相制约的管理难题,充分发挥医疗设备的社会效益和经济效益。因此本研究具有明确的推广应用前景及重大应用意义。

2.3医疗数据挖掘的热点及前景

当前,数据挖掘的研究方兴未艾,其研究与开发的总体水平相当于数据库技术在20世纪70年代所处的地位,迫切需要类似于关系模式、数据挖掘系统和SQL查询语言等理论和方法的指导,才能使数据挖掘的应用得以普遍推广。其研究可能会集中到几个方面,而生物信息或基因的数据挖掘则是热点之一。数据挖掘在医院管理中的应用将会涉及医疗及管理的各个部分及层面,数据挖掘将形成系统,并通过广泛深入的数据挖掘产生医疗方案数据库,为合理诊断、完善临床路径,提供有效帮助;通过数据挖掘分析达到人力资源合理配置;通过数据挖掘为区域性卫生系统构建提供有效依据等。

3结论

数据挖掘技术是一门发展迅速新兴的学科,它的产生与的发展是数据库技术发展自然演化的结果,数据挖掘技术被专家预测可能是继网络技术之后的下一个技术热点。随着医院信息管理的不断发展,数据挖掘技术的应用必将在医院的管理和决策中起着越来越重要的作用。目前我们正处于一个“信息爆炸、知识贫乏”的时代,如何从纷繁芜杂的数据中找到我们需要的知识?只能是通过数据挖掘,去伪存真,发现现象背后的本质。通过对医院丰富的数据进行数据挖掘,找出有利于治疗、护理等方面的知识,提高我们的医疗水平,是我们医院信息化工作者迫切的任务。