公务员期刊网 论文中心 正文

数据挖掘技术在土壤肥力评价中应用

前言:想要写出一篇引人入胜的文章?我们特意为您整理了数据挖掘技术在土壤肥力评价中应用范文,希望能给你带来灵感和参考,敬请阅读。

数据挖掘技术在土壤肥力评价中应用

摘要:土壤肥力状况直接影响农作物的产量,传统的农业生产自动化水平低,化肥和农药的施放无法做到精确把控,同时缺乏对土壤肥力的实时在线监测和评价,不利于农作物的生长,严重时会给农田和生态环境带来较大的污染,影响农作物的生产质量和产量,对人类和牲畜的人身安全构成了较大威胁。为此,深入研究分析了数据挖掘技术,并将其应用在土壤肥力评价系统中,针对具体的研究区域进行土壤图设计和土壤状态分析,建立了土壤肥力采样数据库,并利用数据挖掘技术中的关联规则算法对土壤肥力和农作物产量进行等级分类,计算分析得到土壤肥力与农作物产量之间的关联关系。结果表明:智能数据挖掘技术在土壤肥力评价系统中发挥了重要作用,在对土壤肥力进行准确监控的同时能够准确评价土壤肥力与农作物产量之间的相关程度,对指导农业生产、提高农作物生产质量和产量具有重要意义。

关键词:土壤肥力评价;数据挖掘;数据库;关联规则算法

0引言

我国传统的农药和化肥施放主要依靠作业人员的经验进行,施放效率低,农药利用率低,造成了农药和化肥的浪费,给生态环境带来了一定的影响。农药和化肥的不合理利用会对农作物的生长产生一定的制约,严重时会对消费者的健康造成威胁,因此对农药和化肥的合理利用、对土壤肥力的准确监控越来越引起诸多学者的关注。随着科学技术的发展,很多学者将神经网络算法、模糊理论及专家系统等先进理论应用于土壤肥力监测和评价系统中,对土壤肥力的状态和信息有了一定的掌握。各种智能算法和先进理论解决了土壤肥力评价指标的优化问题,但是对土壤肥力评价系统的数据来源、数据实时性和数据可用性无法精准掌握,导致各类智能算法在土壤肥力评价系统中实时性和准确性不高,对土壤肥力评价的指导性不强。为此,笔者深入研究数据挖掘技术,通过比较其中的关联规则法、聚类分析法和人工神经网络法等不同算法,选用关联规则法完成对所选研究区域土壤肥力状况的分析,绘制了土壤肥力的空间变异图,实现了对土壤肥力监测的可视化,并应用关联规则法得到土壤肥力和农作物产量的关联关系,对指导农业生产作业、提高农业生产效益具有重要的借鉴意义。

1数据挖掘概述

数据挖掘是一个信息探索的过程,是从大量的随机数据中提取有用的潜在信息和数据,并转换为可以理解的数据。此类随机数据多为不完全数据,并伴随有噪音、干扰信号等随机信息。数据挖掘的对象既包括数据库,还可以包含各类文本、视频、图像和Web数据等,解决了传统数据库无法预测未来发展趋势的难题。数据挖掘的分析方法较多,主要包括决策树、聚类分析法、关联规则法、人工神经网络法和时序算法。具体功能如下:1)数据总结。运用统计分析法(求平均值、加权处理、直方图)对数据源信息进行统计分析,便于数据分类。2)数据分类。利用分类函数将待数据挖掘的数据按不同类型、不同标识进行分类。3)聚类。将数据库信息按集群进行划分,利用聚类分析法找出集群中特性相似的集群进行区分。4)关联分析。通过关联规则法计算分析数据库中同一事件的不同项的关联性,根据关联性预测结果。5)预测。根据数据挖掘的结果对研究对象的发展规律进行预测,分析后续变化趋势。

2研究区域概况

选取的研究区域为吉林省农安县开安镇,坐标东经121°10'、北纬44°10',大陆性季风气候,地下水源丰富,年平均降水量535㎜,为国家农业示范基地。

2.1土壤图设计通过查阅资料、查找相关部门网站信息,得到第2次土壤普查图(比例1:5)。以此为基础,完成该研究区域土壤矢量图的绘制,如图1所示。

2.2土壤状态分析

由图1可知,农安县土壤的类型较多。按土壤的类型和状态可将农安县土壤进行分类,如表1所示。

2.3土壤状态采样

将农安县土壤矢量图和土壤状态等数据进行分析处理,构建土壤状态数据库,重点监测土壤养分值和采样点的经纬度。土壤养分值主要包括3个指标,即碱解氮、有效磷和速效钾。农安县土壤状态采样数据如表2所示。

3土壤肥力分布变化

通过对不同采样点的土壤肥力状态的监测,完成了对土壤不同养分碱解氮、有效磷和速效钾的含量分析和研究,得到土壤中碱解氮、有效磷和速效钾的空间分布图,如图2、图3所示。为确保数据的可靠性,对不同年份的土壤养分值进行汇总和分析,最后得到连续2年的碱解氮和速效钾的空间分布变化图。由图2和图3可知:土壤碱解氮含量呈下降趋势。其中,第1年最小值为108mg/kg,最大值为216mg/kg,差值为108mg/kg;第2年最小值为86mg/kg,最大值为173mg/kg,差值为87mg/kg。这表明,经过连续2年的精准施肥后,土壤肥力的差异逐渐变小。

4数据挖掘分析

4.1关联规则算法

应用关联规则算法进行数据挖掘时,主要解决两个问题,即频繁项集和关联规则。关联规则算法的作业步骤为:①挖掘频繁项集;②生成关联规则。关联规则的频繁项集与支持度相关,即数据库中支持度大于规定支持度的项目。关联规则与支持度和可信度相关,即支持度和可信度均大于规定支持度和可信度的关联规则。支持度sup的计算公式为sup(A=>B)=sup(a∪b)={T|T∈Dand(a∪b)}D其中:支持度sup表示事件A和事件B同时出现的概率。可信度conf的计算公式为conf(a=>b)=sup(a∪b)sup(a)其中,可信度conf表示条件概率。提升度lift的计算公式为lift=P(B|A)P(B)其中:提升度lift表示事件A对事件B的提升度。lift=1,说明事件A与事件B没有关联;lift>1,说明事件A与事件B相关联,且关联规则较好,关联性好;lift<1,说明事件A与事件B相排斥,得到的关联规则没有意义,关联性差。

4.2关联规则分析

关联规则算法是基于数据挖掘工具Weka软件完成的。通过对采样数据的分析计算,并将数据导入Weka软件中,建立新的数据源,利用软件自带的算法库,筛选频繁项集,根据专家经验将数据分为6组,进行土壤肥力和农作物产量的关联规则计算,得到土壤肥力和产量数据的等级分类,如表3所示。由表3可知:根据专家经验,土壤养分值划分为6个等级,农作物产量划分为3个等级。根据关联规则,计算分析土壤肥力与农作物产量之间的关联性。

4.3关联结果

运行Weka软件,选取Apriori算法,设定支持度sup范围为10%~100%,提升度lift大于1.0,计算关联规则,得到关联规则结果,如图4所示。由图4可知:当速效磷等级为D时,农作物产量为A的概率为95%;当速效钾为等级D的时候,农作物产量为A的概率为63%;当速效钾等级为E时,农作物产量为B的概率为46%;当农作物产量为A时,速效磷等级为D的概率为38%;当速效磷等级为D时,农作物产量为C的概率为45%。

5结论

为解决传统土壤肥力监测不及时、肥力评价不准确等问题,深入分析了数据挖掘技术,对数据挖掘的主要算法和功能进行分析,完成了研究区域的土壤图绘制和土壤状态分析。同时,对不同采样点的土壤肥力和经纬度进行监测,完成了土壤不同养分碱解氮、有效磷和速效钾的空间分布变化趋势的分析。应用关联规则算法,利用数据挖掘工具Weka,完成土壤肥力与产量的等级分类,得到土壤肥力与农作物产量的关联关系。结果表明:智能数据挖掘技术在土壤肥力评价系统中发挥了重要作用,既可以对土壤肥力的空间分布进行准确监测,又能够对农作物产量进行准确预测,在提高农药和化肥利用率的同时减小对生态环境的危害,对提高农业生产质量具有显著效果。

作者:徐霖 单位:无锡工艺职业技术学院