前言:想要写出一篇引人入胜的文章?我们特意为您整理了大数据挖掘下的用电行为分析范文,希望能给你带来灵感和参考,敬请阅读。
摘要:得益于智能电网的发展,电力大数据的价值与作用逐渐被挖掘。通过对电力大数据的深入挖掘与研究,可促进电网企业管理水平的进一步提升,为我国智能电网的发展提供助力。而依托于大数据挖掘的用户用电行为分析,可实现当前企业电网调控与需求侧的充分融合,为电力系统的稳定性运行提供保障。基于此,文章针对大数据挖掘的用电行为分析进行深入探析,以期为智能电网发展提供帮助。
关键词:智能电网;大数据;电力行为
近年来,大数据技术应用逐渐从金融、商业领域扩展至医疗、能源、交通等多个领域。得益于能源互联网技术的不断创新发展,大数据技术被广泛应用于电力行业。随着数据云平台的构建与完善,大数据技术应用更为广泛成熟,实现了在数据采集、存储的同时,具备数据分析与应用的功能。因此,电力大数据的价值依托于大数据挖掘得到进一步的开发,为电力行业以及智能电网的发展提供重要帮助。
1电力大数据技术分析
智能电网的发展,促使了大数据技术在电力系统中的应用,构建完善的技术体系,包括:数据采集、数据分类、数据分析、数据存储以及数据应用。不同数据处理步骤的功能与任务不同:(1)数据采集,为基础环节,主要作用为电力数据的采集与收集,是开展数据分析工作的基础与前提。具体运行中,通过实时数据采集、离线数据抽取、文件数据采集等形式进行数据的全面收集。(2)数据分类处理。主要作用体现为数据筛选,甄选出高价值的数据信息,并按照预选设定标准进行数据识别与分类。经分类整理后,重复、多余数据将被剔除,在保障数据价值前提下,使剩余数据更为清晰、规整。(3)数据存储。预先构建电力数据库,用于存储分类整理后的电力数据,依托于数据库应用来管理、存储数据,可实现对以往电力数据存储困难、调取困难问题的有效解决。(4)数据分析与挖掘。电力数据信息依托于数据统计、神经网络、机器学习、模糊算法等方式进行分析与挖掘,将数据信息存在的隐藏价值、潜在联系充分挖掘并分析,直观呈现出数据信息的关联与规律。数据挖掘过程中涉及关联分析、分类分析、特异群组分析、聚类分析、异常分析等。针对数据分析的开展,则是借助高性能计算技术完成对数据信息的计算与处理,常用计算技术包括Hadoop分布式计算、YonghongZ-Suite等技术。(5)数据应用。现阶段电力数据应用是将挖掘分析结果应用于其他部门,以挖掘分析结果为依据,对行业资源配比做出合理调整,提升资源利用率,并促进电力企业经济效益创造。而要想高效、高质量地完成上述5个阶段的数据处理,需构建完善的数据采集分析平台[1-2]。
2基于大数据挖掘用电行为分析
2.1用户分类
以往电力企业针对用电用户分类凭借的依据为用电模式、电压等级,即按照用户电压等级与模式的不同进行用户划分,具体分为工业、商业、农业、居民用电4种。依据大户数挖掘的用户分类,则是以电力大数据为依据,采取科学数据分析算法来达到用户分类的目的。现阶段常用分类方法为:利用大数据信息制定曲线分析图,结合对模糊算法、逆向分析、最小二乘法、曲线变化因素、聚类算法来科学分类。例如逆向分析法应用,依据用电用户不同类型特点的分析,结合熵权法对用户电力数据进行分析,明确掌握其数据特点和数据权重,最后以数据特点分析结果为基准,找到电力数据中与分析结果相对应的数据信息,实现这部分数据用户的有效分类。相较于传统分类方法,基于大数据挖掘的用户分类更为科学合理,为用户分类提供理论基础的同时也能进一步提升用户分类的精准性。
2.2用电行为影响因子分析
2.2.1自我影响因子自我影响因子是指在具体用电过程中,用户因自身因素使导致用电行为受到影响,此类影响因子具体包括用电事故发生、用电计划改变等。
2.2.2自然环境影响因子自然环境影响因子是指自然环境的变化使得用户用电行为受到影响。自然环境影响因子涉及温度、风力、季节、湿度、天气等,在具体用电过程中,上述变化因子的存在使得用户用电行为受到影响。
2.2.3社会环境影响因子社会环境影响因子是指发生重大国家事件或者是重要节假日,会影响用户用电行为的因素,具体包括春节、等。社会影响因子具有不确定特点,所以在具体影响因子的分析过程中,需通过手动选择的形式进行数据筛选。通过对用电行为影响因子的精准、科学分析,并准确筛选出电力数据中不同种类的影响因子,可进一步提升电力数据的代表性,精准体现出用户用电行为的特点,提高用电行为分析的合理性与可靠性,为电网资源合理配置提供依据。
2.3用户用电行为分析
基于大数据挖掘前提下,用电行为分析主要研究的内容包括:用户用电负荷、用户分类、故障率预测等。依托于数据采集分析平台开展用电行为分析,将数据信息存储于数据库,依据分析目标选取特定类型的数据进行用电行为分析。具体分析过程中,首先,需对某类用户的整体数据信息进行整体性分析,制作用户用电曲线图,曲线图指标囊括功、电流、电量以及电压等。其次,将整体数据中存在影响因子的数据排除,如将涉及春节、周末等节日的数据全部排除,对剩余数据进行分析与研究。在排除影响因子数据后,以月、季、年分段标准进行剩余数据的划分,分析与比较不同阶段用户数据的具体特征。企业要想进一步提升用电行为分析的全面性,可在实际数据分析过程中合理采用负荷分析法、负荷预算法、聚类算法、回归法等方法来探明数据信息存在的隐藏规律与关联,通过用户模型构建的形式来提高行为分析的全面性与有效性。作为主要用电行分析方法之一,聚类分析法的应用在当前电力企业数据分析中较为常见,此方法中K-means算法则是聚类问题解决的常用算法。K-means算法应用具有高效、便捷的特点,应用于电力大数据,可进一步提升数据处理的效率性。但是需注意,K-means算法对初值的敏感度较大,初值的差异使得最终计算结果也会有所不同。模糊C均值算法的应用较为广泛,每个样点通过目标函数的优化来获取所有类中心隶属度,依据对样本点类属的精准、科学判断,实现样本数据自动分类。但是实际分析中,因模糊C均值算法只是进行离散数据点集合的处理计算,所以无法做到直接处理特殊类型数据,并对初始值有着较强的依赖性。另外,部分学者提出聚类问题可采取云计算处理方式,在有效解决聚类问题的同时,进一步提升数据处理的速度与效率。但是在具体数据处理过程中,因云计算方式需频繁地读写Hadoop,再加上电力数据庞大,极易在数据处理分析过程中产生性能问题。而随着电力大数据应用聚类算法研究的愈发深入,提出诸多聚类分析的改进算法,如基于SparkR的K-means算法、基于云计算的K-means算法等。针对电力大数据的挖掘,应用基于云计算的K-mean算法,推动数据处理与开发的大规模开展,起到提升数据处理能力、提高数据处理结果精准性的作用。依托于K-means计算模型的构建,对数据库中特定用户数据进行分析处理,进一步提升用电行为分析的科学性与可靠性。正因此,数据采集分析平台开展数据处理时,基于云计算的K-means算法成为常用的处理方式之一。针对基于SparkR的K-means算法应用,可有效消除以往云计算处理方式存在的频繁访问Hadoop问题。此算法的数据引擎是以Hadoop大数据群作为依据,通过对K-means算法的融合应用,有效利用R语言与内存计算特征来提升数据分析能力。相较于传统用电行为分析,基于大数据挖掘的用电行为分析可以获取更为精准、科学、可靠的结果,明确掌握用电计划与规律。同时,基于大数据挖掘的用电行为分析,有着更为完善且全面的理论依据,可以全面、及时地分析用户用电行为[3-5]。
3结语
基于大数据挖掘的用户行为分析,依托大数据技术的合理应用,为企业开展全面、精准的用电行为分析提供技术支撑,借助多种算法方法提升数据处理的科学性与合理性,促使电力企业在海量电力数据中获取更多高价值信息,充分挖掘电力数据中隐藏的关联、规律信息,为电力企业经营管理水平的提升提供数据支撑。
[参考文献]
[1]郝然,艾芊,肖斐.基于多元大数据平台的用电行为分析构架研究[J].电力自动化设备,2017(8):20-27.
[2]辛苗苗,张延迟,解大.基于电力大数据的用户用电行为分析研究综述[J].电气自动化,2019(1):5-8,31.
[3]谢胜祥,张惠诗.基于大数据技术的电力客户属性挖掘研究与应用[J].电力与能源,2018(6):131-134,142.
[4]董莉丽.基于大数据挖掘的客户用电行为分析[J].黑龙江科技信息,2016(4):106.
[5]张小龙.大数据环境下用户用电行为分析的研究[D].北京:华北电力大学,2017.
作者:董爱迪 潘建宏 杨爽 单位:国网吉林省电力有限公司信息通信公司