公务员期刊网 论文中心 正文

保险行业关联规则数据挖掘技术的运用

前言:想要写出一篇引人入胜的文章?我们特意为您整理了保险行业关联规则数据挖掘技术的运用范文,希望能给你带来灵感和参考,敬请阅读。

保险行业关联规则数据挖掘技术的运用

随着科学信息时代的发展,大数据方向的计算机应用技术被越来越多的保险行业所熟知。近年保险市场的扩充发展加剧着各个保险公司之间的竞争,而今大数据技术的日趋成熟,正好使积累的数据信息得到有利开发并为未来发展提供数据支持。本文主要针对R保险公司续保产品销售问题,运用SPSSModeler工具以及关联规则算法对其续保的产品结构进行关联性分析,最终依据分析结果给予公司相关产品开发及产品营销意见与建议与意见等。随着新时代生活消费结构及居民消费意识的晋级,财富家当的不断累积,消费者对保险的投保的意识已逐渐增强。保险行业作为国家增长速度最快的行业之一,是国民经济的重要组成部分,而如何在经济快速发展的市场替代中占的一席之位便成为了各个保险公司需作出的重要商业决策。在大数据挖掘当热的分析环境中,保险行业由于历史数据信息爆炸而有效的信息匮乏,未能为公司决策者提供有效的支持,而利用计算机技术对保险公司中的大量客户信息数据进行分析,协助公司作出业务调整、做出企业战略安排等正是数据挖掘技术所体现的作用。本文主要利用数据挖掘技术对R保险公司提供的续保客户数据中的保险产品进行相关分析,使用关联规则算法分析续保客户购买的不同产品险种之间的关联性,依据参数阀值推断其购买A险种的客户是否会购买B险种,达到满足客户的多层次需要;通过分析结论给予特定人群改变推销战略,配合公司做出业务性调整,达到提高销售效率的目的,并对此提出该领域的数据挖掘研究流程。

1保险险种的关联销售分析

1.1保险产品关联销售的概念

关联销售实质是指在通过特定的数据挖掘技术对客户购买信息的筛选后,得到具有关联性的产品组合和客户特征,并借此为企业开展经营活动提供相关信息指导。关联销售是保险公司利润收入的重要来源之一。关联销售形式除了靠以往传统人为销售经验外,主要是通过对历史保险销售数据的挖掘,得到新的产品或产品销售组合,再针对人群进行同进推荐,以此达到提高销售效率降低企业销售成本的目的。

1.2数据挖掘关联规则方法应用

本文主要采用关联规则算法,其主要反应事物之间的相互依赖关系或其各自间关联性,采用的算法为著名的Apriori算法,处理速度快且对规则的数量没有明确限制要求。其次,在算法中会给定两个重要的参考阀值即评价指标,最小支持度和最小置信度。数据发掘目的就是从给定的数据库中发掘出满足两者关联规则。本次研究使用的数据挖掘软件为SPSSModeler,方法关联规则算法。整个数据挖掘流程如图1所示:

1.3保险数据准备

数据准备即为对初始数据进行一定的采集、筛选、预处理功能等,以此在一定程度上提高模型的准确性。整个准备过程包括;数据采集、数据整理、数据清洗、数据集成、数据变换、数据规约。流程图如图2所示:依据数据准备的要求,将R公司续保客户保险数据中的脱敏数据,无关变量数据进行一定的筛选与剔除。①由于原始续保数据集中显示:投保时间、教育程度、家庭人数三个类别数据各自的值都是脱敏数据,所以通过分析得出这三类数据为无效数据,将其剔除。②在续保数据中,由于有职业但过去三年平均年收入低于10RMB的人群无法确定其特殊性,视为脏数据,将其剔除;其次存在着有职业人士但平均年收入为0RMB,为了保证数据的有效和准确性,所以本次分析剔除出有职业但过去三年平均年收入为0的客户保险数据。③通过EXCEL数据处理过程后,R保险公司给予的原始数据约为21万,最终续保数据约为15万条。

1.4关联规则模型建立

本次数据挖掘采用关联规则算法中的Apriori算法分析历史保险数据中客户续保险种与险种之间潜在的关联性。第一步,通过EXCE得到对应整理后的客户续保数据,在SPSSModeler空白界面中创建流,导入选择从EXCEL文件读取输入源;第二步,从字段选项中添加类型节点,读取数据值并为其需要的指标设置所输入字段的角色、类型和格式;第三步,添加设置标志节点,选取创建所有险种为标志字段并以客户号为汇总关键字,为后续建模做好准备;第四步,建模之前可以通过设置添加图形选项中的“网络”节点使用户直观的感受各个险种之间的关联程度;第五步,再次添加类型节点,为分析目标设置“两者”角色,满足建模要求;第六步,建立模型节点,选取关联Apriori算法,其中最低条件支持度与最小规则置信度(%)一般选择默认参数(最低条件支持度为10,最小规则置信度为80%,根据研究需求自行改变设置),建立模型。模型建立还可根据需求选择专家模式,自行设置相关参数,最终输出汇总并依据模型结果进行分析。

1.5模型结果分析

由图4可以了解到(此时调节杆显示范围为900-1900)网络的线条粗细能直接显示不同险种之间的潜在联系,比如可以直观的分析出险种S42与险种S77关联强度最高,但与险种S56程度较低;同时,险种S43与险种S50、险种B01关联程度也较好;其余险种关联性不强。通过分析结果可以看出,输出的规则主要包括五个内容:支持度、置信度、规则前项与后项以及实例记录数。本次关联规则模型总共挖掘出了16条规则,有效的事务数为1万多条,最大置信度可到达98.98%,最大支持度达到53.694%。例如图5中规则ID为16显示,此规则中的实例记录有1373条,由购买前项险种S40、S43、S49的客户可以给他推荐后项险种S42这类保险,该推荐可达到的置信度为98.98%,达到的支持度为12.744%,提升度为1.144,大于1且有意义,表示在此规则信息下的关联程度是较强的,其他阀值参考类似。由此通过该规则信息得出向客户推销此类险种的成功率较高,客户容易接受,其他规则分析同理。因此,根据分析结果可知,续保客户所购买的不同险种之间的确存在关联性,并且可以通过客户历史购买的险种数据推出关联程度较强的险种进行针对性关联销售,以满足客户的多方面需要。因此,通过上述对续保险种之间的关联规则分析结果得知,保险险种的关联交叉销售是有利于效提高企业的销售率,提高保险企业的利润率,并且有利于提升客户的忠诚度,降低企业的销售成本,实现资源的合理分配。

2研究结论与建议

2.1研究结论

综上,保险公司在日常经营活动中,不仅要关注分析客户的购买特征和消费习惯等,做好未来客户预警流失,还需从客户以往购买产品的记录中挖掘出客户新的购买欲望,并针对客户群体推出新型产品或产品组合。总之,数据挖掘的目的是为了更好的为企业经营者提供良好信息支持,做出最好的相关性业务调整和营销战略决定,实现公司的可持续发展和更多的经济利益目标。本文利用数据挖掘技术只探讨了R公司同一客户群体不同险种之间的关联规则,是基于关联规则的关联销售,且是从产品的角度出发发现各类产品之间的关联关系和客户同时购买产品的习惯和特性,同时只运用了著名的Aproti算法,还有Carma、序列算法可以实现等,所以本文具有一定的局限性,但不影响研究方法的应用。

2.2建议

无论是基于哪种模型分析方法,都需要加强自身保险公司高效的数据库信息内部建设,以致未来更好的利用客户信息数据建立模型。其次,大数据挖掘技术带来的可靠性与可实现性可以将大量信息数据从多种、多维角度去提炼和压缩出有效并且有价值的信息为公司所用。并且,利用数据挖掘技术的手段在各行各业都可实现精确定位客户需求特征、客户的预警流失、管控风险预测及评估、分析预测客户未来需求,为其客户制定个性化定制方案等大大的提高了各公司的运行效率,达到“用正确的方法做事”以及“做正确的事”的公司组织目标。所以,积极的借鉴与合理的引用先进科学技术可以是公司创新发展的一大动力源泉。另外,现在正是以“客户为中心”的时代,要从客户端分析为着手点和目标,精准服务于客户群体、提高客户的满意度、可接受程度等,通过与其他分析方法的结合,构建客户分析系统,并通过实验有效的运用到实践当中,为保险营销人员提供一定的指导作用,为自身公司的长久立足逐步打下坚实基础。

3结语

大数据时代的信息泛滥更真实的体现了建立客户端数据库是非常必要的,引用科学技术也是必不可少的,并且合理利用数据挖掘技术最大限度发挥其对信息的筛选作用是目前各保险公司刻不容缓需要做的事情。不仅在保险业务领域,各行各业几乎都已与大数据环境下的各种数据挖掘技术相接触。大数据数据挖掘技术作为企业客户经营的一项重要工具,作为一种有效的手段,是企业更好的了解与掌握客户需求的一个渠道,是企业改善自身发展提高竞争力的快速手段,是企业实现组织目标的必要途径。

作者:袁杨钦 杨杉 单位:四川大学锦城学院