前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的数学建模常用模型及算法主题范文,仅供参考,欢迎阅读并收藏。
前言:数学建模,就是根据实际问题来建立数学模型,对数学模型来进行求解,然后根据结果去解决实际问题。数学模型是一种模拟,是用数学符号,数学式子,程序,图形等对实际课题本质属性的抽象而又简洁的刻画,它或能解释某些客观现象,或能预测未来的发展规律,或能为控制某一现象的发展提供某种意义下的最优策略或较好策略。应用知识从实际课题中抽象、提炼出数学模型的过程就称为数学建模。在21世纪新时代下,信息技术的快速发展使得数学建模成了解决实际问题的一个重要的有效手段。
正文:自从20世纪以来,随着科学技术的迅速发展和计算机的日益普及,人们对各种问题的要求越来越精确,使得数学的应用越来越广泛和深入,特别是在21世纪这个知识经济时代,数学科学的地位会发生巨大的变化,它正在从国家经济和科技的后备走到了前沿。经济发展的全球化、计算机的迅猛发展、数学理论与方法的不断扩充,使得数学已经成为当代高科技的一个重要组成部分和思想库,数学已经成为一种能够普遍实施的技术。培养学生应用数学的意识和能力已经成为数学教学的一个重要方面。而数学建模作为数学方面的分支,在其中起到了关键性的作用。
谈到数学建模的过程,可以分为以下几个部分:
一.模型准备
了解问题的实际背景,明确其实际意义,掌握对象的各种信息。以数学思想来包容问题的精髓,数学思路贯穿问题的全过程,进而用数学语言来描述问题。要求符合数学理论,符合数学习惯,清晰准确。
二.模型假设
根据实际对象的特征和建模的目的,对问题进行必要的简化,并用精确的语言提出一些恰当的假设。
三.模型建立
在假设的基础上,利用适当的数学工具来刻划各变量常量之间的数学关系,建立相应的数学结构。
四.模型计算
利用获取的数据资料,对模型的所有参数做出计算(或近似计算)。其中需要应用到一些计算工具,如matlab。
五.模型分析
对所要建立模型的思路进行阐述,对所得的结果进行数学上的分析。
六.模型检验
将模型分析结果与实际情形进行比较,以此来验证模型的准确性、合理性和适用性。如果模型与实际较吻合,则要对计算结果给出其实际含义,并进行解释。如果模型与实际吻合较差,则应该修改假设,再次重复建模过程。
数学建模中比较重要的是,我们需要根据实际问题,适当调整,采取正确的数学建模方法,以较为准确地对实际问题发展的方向进行有据地预测,达到我们解决实际问题的目的,
在近些年,数学建模涉及到的实际问题有关于各个领域,包括病毒传播问题、人口增长预测问题、卫星的导航跟踪、环境质量的评价和预测等等,这些就能说明数学建模涉及领域之广泛,针对这些问题我们需要采取对应的数学建模方法,采用不同的数学模型,再综合起来分析,得出结论,这需要我们要有一定的数学基础和掌握一些应用数学方法,以适应各种实际问题类型的研究,也应该在一些数学方法的基础上,进行不断地拓展和延伸,这也是在新时代下对于数学工作者的基本要求,我们对数学建模的所能达到的要求就是实现对实际问题的定性分析达到定量的程度,更能直观地展现其中的内在关系,体现数学建模的巨大作用。
而在对数学建模中的数据处理中,我们往往采用十类算法:
一.蒙特卡罗算法
也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。当所求解问题是某种随机事件出现的概率,或者是某个随机变量的期望值时,通过某种“实验”的方法,以这种事件出现的频率估计这一随机事件的概率,或者得到这个随机变量的某些数字特征,并将其作为问题的解。如粒子输运问题。
二.数据拟合、参数估计、插值等数据处理算法
比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab作为工具,而在其中有一些要用到参数估计的方法,包括矩估计、极大似然法、一致最小方差无偏估计、最小风险估计、同变估计、最小二乘法、贝叶斯估计、极大验后法、最小风险法和极小化极大熵法。最基本的方法是最小二乘法和极大似然法。数据拟合在数学建模中常常有应用,与图形处理有关的问题很多与拟合有关系。
三.线性规划、整数规划、多元规划、二次规划等规划类问题
建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo软件实现。它尤其适用于传统搜索方法难于解决的复杂和非线性问题,在运筹学和模糊数学中也有应用。
四.图论算法
这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备,其中,图论具有广泛的应用价值,图论可将各种复杂的工程系统和管理问题用“图”来描述,然后用数学方法求得最优结果,图论是解决许多工程问题中算法设计的一种有效地数学模型,便于计算分析和计算机存储。
五.动态规划、回溯搜索、分治算法、分支定界等计算机算法
动态规划的应用极其广泛,包括工程技术、经济、工业生产、军事以及自动化控制等领域,并在背包问题、生产经营问题、资金管理问题、资源分配问题、最短路径问题和复杂系统可靠性问题等中取得了显著的效果。回溯算法是深度优先策略的典型应用,回溯算法就是沿着一条路向下走,如果此路不同了,则回溯到上一个分岔路,在选一条路走,一直这样递归下去,直到遍历万所有的路径。八皇后问题是回溯算法的一个经典问题,还有一个经典的应用场景就是迷宫问题。回溯算法是深度优先,那么分支限界法就是广度优先的一个经典的例子。回溯法一般来说是遍历整个解空间,获取问题的所有解,而分支限界法则是获取一个解。分治算法的基本思想是将一个规模为N的问题分解为K个规模较小的子问题,这些子问题相互独立且与原问题性质相同。求出子问题的解,就可得到原问题的解。即一种分目标完成程序算法,简单问题可用二分法完成。
这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中。
六.最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法
模拟退火算法的依据是固体物质退火过程和组合优化问题之间的相似性。物质在加热的时候,粒子间的布朗运动增强,到达一定强度后,固体物质转化为液态,这个时候再-进行退火,粒子热运动减弱,并逐渐趋于有序,最后达到稳定。
“物竞天择,适者生存”,是进化论的基本思想。遗传算法就是模拟自然界想做的事。遗传算法可以很好地用于优化问题,若把它看作对自然过程高度理想化的模拟,更能-显出它本身的优雅——虽然生存竞争是残酷的。 遗传算法以一种群体中的所有个体为对象,并利用随机化技术指导对一个被编码的参数空间进行高效搜索 。
神经网络从名字就知道是对人脑的模拟。它的神经元结构,它的构成与作用方式都是在模仿人脑,但是也仅仅是粗糙的模仿,远没有达到完美的地步。和冯·诺依曼机不同-,神经网络计算非数字,非精确,高度并行,并且有自学习功能。
这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用。
七 .网格算法和穷举法
对于小数据量穷举法就是最优秀的算法,网格算法就是连续问题的枚举。网格算法和穷举法都是暴力搜索最优点的算法,在很多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具。
八.一些连续离散化方法
很多问题都是实际来的,数据可以是连续的,而计算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的。
九.数值分析算法
在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、 函数积分等算法就需要额外编写库函数进行调用。
十.图像处理法
赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用Matlab进行处理。
这十类算法对于数据处理有很大的帮助,甚至从其中可以发现在它们中的很多算法都是数学某些分支的延伸,可能我们不一定能掌握里面的所有算法,但是我们可以尽可能学习,相信这对我们今后的数学学习有很大的帮助,然后,就是数学模型的类别。
常见的数学模型有离散动态模型、连续动态模型、库存模型、线性回归模型、线性规划模型、综合评价模型、传染病模型等数学模型、常微分方程模型、常微分方程的数值稳定性、人口模型、差分方程模型,这些模型都有针对性地从实际问题中抽象出来,得到这些模型的建立,我们在其中加入适当合理的简化,但要保证能反映原型的特征,在数学模型中,我们能进行理性的分析,也能进行计算和演绎推导,我们最终都会通过实践检验数学建模的正确性,加以完善和提升,在对现实对象进行建模时,人们常常对预测未来某个时刻变量的值感兴趣,变量可能是人口、房地产的价值或者有一种传染病的人数。数学模型常常能帮助人们更好的了解一种行为或者规划未来,可以把数学模型看做一种研究特定的实际系统或者人们感兴趣的行为而设计的数学结构。
例如人口增长模型:
中国是世界上人口最多的发展中国家,人口多,底子薄,人均耕地少,人均占有资源相对不足,是我国的基本国情,人口问题一直是制约中国经济发展的首要因素。人口数量、 质量和年龄分布直接影响一个地区的经济发展、资源配置、社会保障、社会稳定和城市活力。 在我国现代化进程中,必须实现人口与经济、社会、资源、环境协调发展和可持续发展, 进一步控制人口数量,提高人口质量,改善人口结构。对此,单纯的人口数量控制(如已实施多年的计划生育)不能体现人口规划的科学性。 政府部门需要更详细、 更系统的人口分析技术,为人口发展策略的制定提供指导和依据。长期以来,对人口年龄结构的研究仅限于粗线条的定性分析, 只能预测年龄结构分布的大致范围,无法用于分析年龄结构的具体形态。 随着对人口规划精准度要求的提高,通过数学方法来定量计算各种人口指数的方法日益受到重视,这就是人口控制和预测。
人口增长模型是由生育、死亡、疾病、灾害、环境、社会、经济等诸多因素影响和制约的共同结果,如此众多的因素不可能通过几个指标就能表达清楚,他们对人口增长的潜在而复杂的影响更是无法精确计算。这反映出人口系统具有明显的灰色性, 适宜采用灰色模型去发掘和认识原始时间序列综合灰色量所包含的内在规律。灰色预测模型属于全因素的非线性拟合外推类法,其特点是单数列预测,在形式上只用被预测对象的自身序列建立模型,根据其自身数列本身的特性进行建模、预测,与其相关的因素并没有直接参与,而是将众多直接的明显的和间接的隐藏着的、已知的、未知的因素包含在其中,看成是灰色信息即灰色量,对灰色量进行预测,不必拼凑数据不准、关系不清、变化不明的参数,而是从自身的序列中寻找信息建立模型,发现和认识内在规律进行预测。
基于以上思想我们建立了灰色预测模型:
灰色建模的思路是:从序列角度剖析微分方程,是了解其构成的主要条件,然后对近似满足这些条件的序列建立近似的微分方程模型。而对序列而言(一般指有限序列)只能获得有限差异信息,因此,用序列建立微分方程模型,实质上是用有限差异信息建立一个无限差异信息模型。
在灰色预测模型中,与起相关的因素并没有直接参与,但如果考虑到直接影响人口增长的因素, 例如出生率、死亡率、 迁入迁出人口数等,根据具体的数据进行计算, 则可以根据年龄移算理论,从某一时点的某年龄组人数推算一年或多年后年龄相应增长一岁或增长多岁的人口数。在这个人口数的基础上减去相应年龄的死亡人数, 就可以得到未来某年龄组的实际人口数。对于0 岁的新生人口, 则需要通过生育率作重新计算。当社会经济条件变化不大时, 各年龄组死亡率比较稳定, 相应活到下一年龄组的比例即存活率也基本上稳定不变。 因而可以根据现有的分性别年龄组存活率推算未来各相应年龄组的人数。
通过这样的实例就能很细致地说明数学建模的方法应用,数学模型方法是把实际问题加以抽象概括,建立相应的数学模型,利用这些模型来研究实际问题的一般数学方法。它是将研究的某种事物系统,采用数学形式化语言把该系统的特征和数量关系,抽象出一种数学结构的方法,这种数学结构就叫数学模型。一般地,一个实际问题系统的数学模型是抽象的数学表达式,如代数方程、微分方程、差分方程、积分方程、逻辑关系式,甚至是一个计算机的程序等等。由这种表达式算得某些变量的变化规律, 与实际问题系统中相应特征的变化规律相符。一个实际系统的数学模型,就是对其中某些特征的变化规律作出最精炼的概括。
数学模型为人们解决现实问题提供了十分有效和足够精确的工具, 在现实生活中, 我们经常用模型的思想来认识和改造世界,模型是针对原型而言的,是人们为了一定的目的对原型进行的一个抽象。
随着科学技术的快速发展,数学在自然科学、社会科学、工程技术与现代化管理等方面获得越来越广泛而深入的应用, 尤其是在经济发展方面, 数学建模也有很重要的作用。 数学模型这个词汇越来越多地出现在现代人的生产、工作和社会活动中,从而使人们逐渐认识到建立数学模型的重要性。数学模型就是要用数学的语言、方法去近似地刻画实际,是由数字、字母或其他数学符号组成的,描述现实对象数量规律的数学公式、 图形或算法。也可以这样描述:对于一个现实对象,为了一个特定目的,根据其内在规律,做出必要的简化假设,运用适当的数学工具,得到的一个数学结构。数学建模的作用在21实际毋庸置疑,我们通过不断学习数学建可以掌握解决实际问题的强大武器。
参考文献:数学建模方法与案例,张万龙,等编著,国防工业出版社(2014).
[关键词]高职学生 数学建模
[作者简介]郑丽(1974- ),女,河北邯郸人,邯郸职业技术学院,副教授,研究方向为数学教育。(河北 邯郸 056001)
[课题项目]本文系2012年河北省教育厅人文社会科学研究项目“基于数学建模的高职学生创新能力的培养”的部分研究成果。(课题编号:SZ123022)
[中图分类号]G647 [文献标识码]A [文章编号]1004-3985(2014)12-0187-02
数学建模是在20世纪六七十年代进入一些西方国家大学的,我国几所大学也在80年代初将数学建模引入课堂。1992年由中国工业与应用数学学会组织举办了我国10城市的大学生数学模型联赛,74所院校参加了本次联赛。教育部及时发现,并扶植、培育了这一新生事物,决定从1994年起由教育部高教司和中国工业与应用数学学会共同主办全国大学生数学建模竞赛,每年一届。现在绝大多数本科院校和许多专科学校都开设了各种形式的数学建模课程和讲座,每年有几万名来自各个专业的大学生参加竞赛,有效激励了学生学习数学的积极性,提高了学生运用数学解决问题的能力,为培养学生利用数学方法分析、解决实际问题开辟了一条有效途径。
从1999年起,全国大学生数学建模竞赛设立了专科组,高职院校作为高等教育的重要组成部分,在开展数学建模活动中投入了极大的热情,数学建模也成为高职院校数学教学改革的一个热点。作为高职院校的数学教师,笔者自2001年以来一直担负着学校的数学建模培训工作,每年学生们都积极参加数学建模竞赛,也取得了国家级、省级的奖励。结合高职院校的学生特点,以及十年间高职数学教学和数学建模活动的实践,笔者对高职院校开展数学建模活动的意义进行了探讨,并总结了高职院校实行数学建模培训的思路与方法。
一、在高职院校开展数学建模活动的意义
(一)数学建模活动能够满足部分学生的学习需求
高职院校的学生大多是基础知识相对薄弱的,但是也有不少学生基础扎实,善于思考。高职院校目的是培养既有理论基础,又有实践能力和创新精神的复合型人才,这就要求我们既要进行大众化的人才培养,又要满足部分学生对知识、能力更高层次的需求。数学建模活动为这些学生带来了新的挑战和机会,为他们展示创新思维与实践能力提供了舞台。
(二)数学建模活动可以培养学生的创新精神,提高学生的综合素质
通过数学建模训练,可以扩充学生的知识面,培养学生利用数学知识解决实际问题的能力,增强学生的知识拓展能力、综合运用能力;还可以丰富学生的想象力,提高抽象思维的简化能力和创新精神,既有洞察能力和联想能力,又有开拓能力和创造能力,以及团结协作的攻关能力。
(三)数学建模活动可以促进数学教师的教学能力和科研能力,推动高职数学教学的改革与创新
通过在高职院校中开展数学建模活动,对数学教师本身也是机会和挑战。教师必须重新组织教学内容,补充自身知识的缺陷与不足,促使教师自身综合素质的不断提高。通过数学建模训练,教师在数学教学中必然会改进教学方法,转变教学观念和教学方式,教学水平和科研能力都会逐步提高。通过数学建模训练,教师也能够学会一定的科学研究方法,增强实践教学意识,对于在数学教学中培养学生的创新能力和抽象思维有了明确的认识。通过数学建模训练,教师更善于在教学过程中激发学生学习的主动性,调动学生学习的积极性,重视教学方法与教学手段的改革,推动教学质量不断提高。
二、在高职院校实行数学建模培训的思想与方法
(一)高职院校实行数学建模培训的必要性
数学教育本质上是一种素质教育。通过数学训练,可以使学生树立明确的数量观念,提高逻辑思维能力,有助于培养认真细致、一丝不苟的作风,形成精益求精的风格,提高运用数学知识处理现实世界中各种复杂问题的意识、信念和能力。高职院校中,作为基础课程的数学课,不仅要为学生学习专业课提供必要的数学知识,同时还要培养学生的数学思维,培养他们勇于创新、团结协作解决问题的能力。而开设数学实验课,进行数学建模活动有助于提高学生在数学学习中的兴趣与主动性,提高学生利用所学知识解决实际问题的能力,为培养高质量、高层次复合型人才提供有力的帮助。
(二)突出高职特色,渗透数学建模教学思想
高职学生的学习基础总体比较薄弱,但实践能力和动手能力又相对较强。这就要求教师在教授数学知识的时候,必须把握“以应用为目的、必需够用”的原则,扬长避短,体现精简数学理论,弱化系统性,突出数学应用,强调实用性。在开展数学建模活动中,要从开设数学实验课入手,普及数学建模思想,强化数学建模在实际当中的应用。
从目前课程设置及课时的统计上,可以看出作为基础课程的数学课总课时整体呈缩减趋势。面对这种现状,我们需要在保证学生够用的前提下,突出数学的应用性,这就需要我们进行教学内容和教学方法上的改革。开设数学实验课,引导学生进行数学建模活动,给数学教学改革带来了新的启示,使数学教学改革在迷茫中找到了突破口。通过组织学生参加全国大学生数学建模竞赛,以及对数学建模和数学实验的进一步研究,我们提出了在高职院校中开设数学实验课的构想,利用现有课时使学生尽可能多地了解数学的思想方法,掌握应用软件解决数学问题的技能。数学实验课建设的指导思想是以实验为基础,以学生为主体,以问题为导向,以培养能力为目标。在数学教学改革中,要坚持贯彻指导思想,努力构建数学实验课程教学的模式。
(三)数学建模培训的方法探索
在高职院校的实际数学教学中,可以采取在大一第二个学期,由各系推荐,学生自愿的方式开设数学实验选修课。这一阶段主要给学生补充一些必要的数学知识及软件应用方法,介绍一些最常用的解决实际问题的数学方法,比如数值计算、最优化方法、数理统计中最基本的原理和算法,同时选择合适的数学软件平台,熟练计算机的操作,掌握工具软件的使用,基本上能够实现所讲内容的主要计算。组织兴趣小组,集体讨论,相互促进,共同提高,培养团队精神。在教授过程中尽量引入实际问题,并落实于解决这些问题,引导学生自己动手操作,通过协作讨论,写出从问题的提出和简化到解决方案和数学模型的实验报告,并尽可能给出算法和计算机的实现,得出计算结果。
在期末选出部分比较出色的学生,为参加全国大学生数学建模竞赛进行培训,时间主要集中在暑假期间。这一阶段安排学生熟悉数学建模所涉及的各种方法,诸如几何理论、微积分、组合概率、统计(回归)分析、优化方法(规划)、图论与网络优化、综合评价、插值与拟合、差分计算、微分方程、排队论等方法。学生也要在尽量岔开专业的前提下,依照教师建议及学生自己选择进行分组,利用历年一些典型的竞赛题目模拟训练,对于每道题目要求各组按比赛要求给出模型论文。教师引导学生及时总结题目中所用的方法,找出各自的长处与不足,为后面的训练与比赛积累知识与经验。
三、如何在高职院校中开展数学建模培训
(一)高职院校数学建模培训的总体规划
确定对于高职学生实行数学建模培训的思想与方法后,重点就是要组织教学内容。目前关于数学建模的书籍及参考资料多种多样,其中大多是面向本科学生的,近几年也有不少针对专科学生的数学建模材料。前期数学实验课的选修过程中,建议高职院校不要局限于某一本教材,而是参考各种资料,选择一些比较典型又易于上手的数学模型,让学生既在学中做,又在做中学。而在针对全国大学生数学建模竞赛的集中训练中,要优化数学建模竞赛队员的组合,强调三人各有专长,有的数学建模能力较强,有的计算机软件应用能力较强,还有的擅长文字表达。这一阶段要扩展学生知识面,打牢基础,强调“广、浅、新”。强化训练历年竞赛真题,使学生多接触实际问题的简化与抽象方法,应用数学知识解决实际问题。同时要对一些比赛常用的基本技能进行强化训练,如数学软件的应用、数学公式编辑器的使用,以及论文格式的编排等。
(二)高职院校数学建模培训的基础内容
初期的数学实验课,应先从初等模型入手,引导学生应用中学所学的数学知识解决一些实际问题。教师有意识引导学生发散思维,让他们沿着问题分析―建立模型―求解模型―模型分析与检验的过程解决问题。由于初等模型不需要补充多少知识,学生用原有的知识能够解决模型问题,使得学生对数学实验与数学建模充满了兴趣与信心。
接着可以引入一元函数及多元函数的微分模型,以求最值问题为主。高职院校各专业学生基本都在第一学期学过了一元函数的导数及应用,对于这类模型也比较容易接受。在此期间应穿插数学软件的学习与练习,重点是Mathematica和Matlab的使用,利用数学软件帮助求解模型。
再来就是微分方程模型,这时由于不同专业学生学习情况不同,所以要先适当补充微分方程的基本知识,才能由易到难,由简单到复杂地带领学生建立微分方程模型,然后借助数学软件求解模型。在第二学期,有些专业的学生会开设线性代数或概率论与数理统计,所以后半学期会在线性代数基础上讲解规划模型,以及概率统计的模型。
这样通过一个学期的数学实验与数学建模课程,多数参加数学建模培训的学生分析问题、解决问题的能力都能显著改善,还可以扩充知识面,学习新理论和新方法,自身的能力、水平和综合素质都有很大的提高。
(三)高职院校数学建模培训的强化内容
暑假期间,筛选部分优秀的学生进入数学建模竞赛培训阶段,学习时间可以比较集中。这一时期应利用典型模型,结合实际问题,穿插讲解数据拟合及综合评价等数学建模中常用到的方法,让学生在具体模型中体会学习机理分析、数据处理、综合评价、微分方程、差分方程、概率统计、插值与拟合及优化等方法。同时深入学习Mathematica和Matlab等数学软件,掌握它的强大功能,还要求部分擅长计算机软件的学生能够熟练使用Lingo软件,这几种软件的应用为求解数学模型提供了方便快捷的手段和方法。最后,在历年的数学建模竞赛题目中选取部分题目,分别涉及不同的建模方法,让学生做赛前的强化练习,模拟比赛环境与要求,各组在规定时间内拿出符合比赛要求的建模论文。
在高职院校开展数学建模活动,有助于促进教师知识结构的更新与扩展,为数学教学的改革与创新提供了切入点和发展方向。同时,高职院校的学生通过参加数学建模竞赛,可以用事实来证明自己的实力和价值,更有利于自身综合能力和素质的提高,增强了未来的就业竞争力。
[参考文献]
[1]陈艳.数学建模对实现高职高专数学素质教育之分析[J].学理论,2011(12).
[2]姜启源,谢金星,叶俊.数学模型[M].3版.北京:高等教育出版社,2003.
数学是研究现实世界中数量关系和空间形式的科学。
数学以抽象的形式,追求高度精确、可靠的知识。抽象并非数学独有的特性,但数学的抽象却是最为典型的。数学的抽象舍弃了事物的其他一切方面而仅仅保留某种关系或结构,同时,数学的概念和方法也是抽象的。
数学是在对宇宙世界和人类社会的探索中追求最大限度的一般性模式,特别是一般性算法的倾向。这种追求使数学具有广泛的适用性。同一组偏微分程,在流体力学中用来描写流体动态,在弹性科学实验中用来描写振动方程,在声学中用来描写声音传播等等。
数学作为一种创造性活动,具有艺术的特征,具有幽美性。英国数学家和哲学家罗素对数学的幽美性有过一段精僻的话:“数学不仅拥有真理,而且拥有至高无尚的美――一种冷峻严肃的美,就像是一种雕塑……这种美没有绘画或音乐那样华丽的装饰,它可以纯洁到崇高的程度,能够达到严格的只有最伟大的艺术才能显示的完美境界。”
最近几十年来,由于计算机技术的高速发展,数学的地位更是发生了巨大的变化。科学的本质是数学,现代科学的一个重要特征就是数学化,高技术从本质上就是数学技术,现代数学已不再仅仅是其他科学的基础,而是直接发挥着第一生产力的作用。
当前工科的高等数学教学的现状
工科数学的教学,尤其是高等数学教学,就其内容而言是比较完备与定型的。高等数学是以讨论函数微积分为主要内容的一门学科,主要内容是函数、极限、连续、导数、微分、积分、向量代数与空间解析几何、微分方程等。这些内容不仅是工科各专业课的理论基础及数学表达语言和工具,也是学生从基础教育思想向高等教育思想过渡,从有限的、形象的思维形式向无限的思维形式过渡的一门承上启下的基础理论课程。但是,过分强调这一点,导致在数学计划中加入越来越多和越来越细的内容。通常是,老的内容不减,新的内容又必须插入,学生的负担越来越重。然而却有不少学生带着数学到底有什么用的困惑,在沉重的学习负担下感到数学难懂又枯燥,学习兴趣日下。一部分学生上课不听,作业抄抄,考试临时抱佛脚。考试抑或没通过,即使挠幸通过,也是学得快忘得更快。虽然有的学生严格按照老师的要求好好学习了,考试也许得个满分,但一旦碰到以数学为工具解决各种实际问题时,也会束手无策,不知从哪儿下手。
数学建模和数学建模竞赛
鉴于以上现状,我校从1998年开始尝试搞数学建摸。其实刚开始时,不是为了参赛,而是想提高学生学习的积极性。1999年开始了数学建模选修课,2000年领导要我们组队参加建模。当时,抱着摸石头过河的心态组织5个队参加,获得1个省一等奖,1个省二等奖,2个省三等奖,1个成功参赛奖。2001年,9个队参加并全部得奖:1个国家一等奖,2个国家二等奖,3个省一等奖,另外均为省二等奖。2002年,我们组织了10个队参加,又一次全部得奖:1个国家一等奖,3个国家二等奖。2003年组织13个队参赛,又是满堂红:4个队获国家大专组二等奖,6个浙江省一等奖,3个省二等奖。通过这几年的组队比赛,我们摸索出了这样一条比较适合高职高专的方法。
(1)讲高等数学时渗透建模思想
我校根据专业特点,采用了两套教材:
理科:《高等数学》(上、下)主编:盛祥耀
高等教育出版社
《概率论与数理统计》第二版常柏林等编
高等教育出版社
《线性代数》彭玉芳等编高等教育出版社
三本书总学时:130课时。
文科:财经类专科试用教材
《微积分》李志照等编高等教育出版社
《线性代数》张政修等编高等教育出版社
《概率论与数理统计》何蕴理等编高等教育出版社
三本书总学时:110课时。
抱着专科学校会用为主的目的,1998年我们在全校的文理科班中,尝试在上课时放弃一些繁琐的证明,见缝插针的插入一些简单的小型建模案例。在讲完函数这一节时,怎样建立函数关系式即俗称的应用题多讲多练;在讲述完连续函数的性质后,向同学们介绍了“椅子能在不平的地面上放稳吗?”等小模型;导数的定义、导数的思想方法在建模时经常用到,插入“如何预报人口的增长” 模型,介绍Malthus模型及Logistic模型;导数的最值讲完后,插入“不允许缺货的存贮模型和允许缺货的存贮模型”“森林救火模型”;定积分的概念,讲完书上的引例后,以我们学生的参赛论文“飞越北极”“横渡长江”为例子,讲解定积分的分割、近似、求和、极限思想在建模中的应用。结合“报童的诀窍”讲授积分上限函数。而微分方程这一章,更是渗透建模思想的好地方:“正规战与游击战”、食饵――捕食者模型等均可以在此处介绍。提高学习兴趣的同时,对学有余力的同学则起到了抛砖引玉的作用。在讲授《线性代数》、《概率论与数理统计》时,我们也作了同等的尝试。让学生从小问题入手去体会,学习应用数学的技巧。一年下来,不管是我们上课的教师还是学生,明显觉得数学有趣了,学习积极性提高了。
关键词:汽轮机控制系统;建模方法;仿真技术
中国分类号:TP273
汽轮机控制系统从直接控制系统到间接调节系统,由模拟式电液控制系统发展到数字式电液控制系统,再到集散控制系统以及现场总线控制系统,技术发展越来越成熟的同时,控制系统也越来越受到人们的重视。仿真技术的飞速发展及计算机控制技术的广泛应用,极大地促进了汽轮机控制系统的仿真研究。本文将对汽轮机控制系统仿真的意义、发展历程、方法等方面进行探讨。
1 汽轮机控制系统仿真的意义
首先,可以确保研究人员和机组运行的安全。研究人员只有在仿真平台上对控制方案进行研究,才能避免危险性,同时也保证了设备的正常运行。其次,为研究更好的控制方案提供了平台。通过建立数学模型,对不同的控制算法的进行仿真研究,找出合适的算法和先进的控制策略,优化控制系统的设计,改善系统控制性能。最后,为控制参数的优化整定提供了条件。通过利用控制系统仿真参数的监测,寻找系统最优控制参数,提高系统的调节品质。
2 汽轮机控制系统仿真发展
汽轮机控制系统是汽轮机重要的组成部分。根据我国汽轮机控制系统的发展历程以及对其系统建模与仿真研究出现的先后,可以分为以下几个阶段:
(1)物理仿真,即采用物理模拟的方法模拟汽轮机发电机组和调节装置。但是采用物理仿真的方法来模拟中间再热汽轮机,模拟部件做得都非常繁复,对于模拟汽轮机发电机组并网运用以及改变参数都比较困难[1]。
(2)模拟计算机仿真。20世纪60年代,随着计算机的问世,利用电子模拟计算机来研究和解决汽轮机自动调节系统中存在的问题,成为一种趋势。文献[1]针对上海汽轮机厂生产的AK-25型汽轮机负荷扰动、哈尔滨汽轮机厂20万瓦汽轮机调节系统参数整定以及动态模拟试验等问题,采用电子模拟计算机基本解决了上述问题,并取得了良好的效果。
(3)数模混合仿真。在计算机技术水平还比较低下时,为了尽量缩短机组的启动调整时间,快速投入运行,世界各国汽轮机制造业都建立了试验基地,对汽轮机调节系统动态模拟试验进行研究。文献[2]概述了试验基地的主要内容,其中通过数模混合仿真计算求得调节系统的动态特性,虽不能完全反映调节系统的实际情况,但也有助于调节系统的现场调整。
(4)数字计算机仿真。20世纪80年代,随着计算机技术不断发展,汽轮机数字电液控制系统成为了电厂使用的主流,而仿真技术的发展也逐渐趋于成熟。我国第一台火电站全仿真机于1982年从美国引进。同年,我国自主研发的大型火电机组仿真系统也成功问世。文献[3]介绍了基于STAR-90仿真系统对300MW数字式电液调节进行仿真研究。结果表明利用STAR-90仿真建模技术,可以很方便地实现系统的建模、仿真、修改及调试工作。数字计算机仿真具有划时代的的意义,它使得汽轮机控制系统的研究呈现多元化、多样化。
3 汽轮机控制系统仿真方法
汽轮机控制系统仿真的基本任务是建立模型,编制仿真程序,进行模型的调试和控制参数的整定。汽轮机控制系统建模与仿真方法主要有:
3.1 机理分析法
汽轮机控制系统最常用的数学建模方法是机理分析方法。采用机理建模必须要对实际系统进行深入地分析,提取本质因素,忽略不确定影响因素,并在一定假设或简化条件下得出的,所以机理分析模型的精度不是很高。但是其定性结论却比较合理,对于太过复杂的系统采用机理建模就很难奏效。因此,机理分析方法应用于中小型的汽轮机控制系统的模型建立。
3.2 系统辨识法
系统辨识法常应用于大型复杂的汽轮机非线性控制系统,用来验证近似得到的控制系统数学模型的参数。机理分析法确定模型的结构形式,系统辨识法确定模型中的参数值,两者结合适用于机理明确而参数未知的系统。近年来,基于智能技术如遗传算法、神经网络等的建模仿真方法发展十分迅速,并在具有不确定性、非线性等特性的系统建模方面,得到了广泛应用。其中遗传算法常应用于汽轮机非线性调节系统参数辨识的研究或汽轮机PID调节器参数的优化整定。文献[4]介绍了遗传算法应用于参数辨识的基本思想,对汽轮机非线性调节系统的进行参数辨识。结果表明采用遗传算法可准确地辨识系统中死区、限幅等非线性发生部位和参数,辨识结果准确可靠。
3.3 图形化建模
对于控制系统仿真使用图形化建模,其实是提供一个自动建模平台。例如MATLAB、LabVIEW、BLINK等仿真支撑软件里都封装有很多的功能模块。在进行系统建模时,只要把封装的模块找出,采用模块搭接的方式实现系统建模,这样使建模人员集中精力于控制回路组态、控制参数优化、仿真系统调试等基本内容,而省去编程的烦恼[5]。文献[6-8]分别是基于MATLAB、LabVIEW、BLINK软件对汽轮机控制系统进行的建模仿真。仿真表明:仿真支撑软件对高效建立控制系统的仿真模型具有良好的效果。
4 展望
随着集散控制系统的普及,基于Web分布交互式仿真成为研究热点。分布交互仿真的分布性和交互性特点可使处在不同地理位置的各个部门利用网络连接起来,实现资源共享,达到节省人力、物力、财力的目的。同时,虚拟仿真技术将成为仿真技术发展的一个趋势。虚拟仿真技术是仿真技术与虚拟现实技术相结合的产物,是一种更高级的仿真技术。在测控领域中,采用先进高等控制策略在汽轮机控制系统中尝试,而这样的尝试在实际的汽轮机上是无法进行的,只有在汽轮机控制系统的虚拟现实仿真环境中进行反复试验,通过对不同控制算法的仿真与比较,选择最优控制,大大节约了时间和经费,避免了危险性。
5 结束语
随着我国电力工业的迅速发展和我国多年来从事的控制系统研究,汽轮机控制系统日益引起电厂的认识和重视。通过对汽轮机控制系统建模与仿真技术及应用情况的了解和认识,提出控制系统仿真技术的发展方向:基于Web分布交互式仿真成为当下的研究热点。在不久的将来,虚拟仿真技术将会成在汽轮机控制系统仿真中发挥重要的作用。
参考文献:
[1]上海汽轮机研究所.电子模拟计算机在汽轮机调节系统中的应用[J].电子技术应用,1976(03):12-21.
[2]杨焕义.模拟技术在汽轮机控制中的应用[J].中国电机工程学报,1988(07):14-15.
[3]段新会.3OOMW机组数字式电液调节(DEH)仿真系统的研究[D].华北电力学院,1995(06):8-11.
[4]戴义平,刘炯,刘朝.基于遗传算法的汽轮机非线性调节系统的参数辨识研究[J].动力工程,2003(02):2215-2218.
[5]吕崇德,任挺进,姜学智.大型火电机组系统仿真与建模[M].北京:清华大学出版社,2002.
[6]孙玉芬,王再英.汽轮机DEH系统建模及仿真研究[J].计算机仿真,2013(09):126-127.
[7]王浩.基于LabVIEW的汽轮机仿真控制系统简介[J].南钢科技与管理,2008(04):30-32.
[8]降爱琴,张学军,赫秀芳.基于BLINK的DEH控制系统仿真[J].微计算机应用,2007(06):640-643.
作者简介:韩芹(1982-),女,湖南永州人,实验教师,助教,硕士,研究方向:计算机智能控制。
关键词:MATLAB AM 调制 仿真 FPGA DSP
中图分类号:TN402 文献标识码:A 文章编号:1672-3791(2014)04(b)-0002-03
AM Modulation Method in Engineering Analysis and MATLAB Simulation
Zhang Ke1 Pu Juan2
(1.Chengdu Aeronautic Polytechnic, Chengdu Sichuan,610100,China; 2.Suining city first middle school, Suining Sichuan,629000,China)
Abstract:Article using the mathematical model for the simulation tool of MATLAB in communication engineering one of the most widely used AM modulation demodulation method, has carried on the simulation analysis on the background of an engineering example, adopted the undersampling method is commonly used in engineering simulation of digital modulation demodulation, for the establishment of simulation model, the simulation of the parameter selection are analyzed, and finally concluded that the simulation results with the simulation, verify the feasibility of digital algorithm in communication engineering, design to lay the foundation for later FPGA or DSP.
Key Words:MATLAB;AM;Modulation;The Simulation;FPGA;DSP
目前通信系统实现方式朝着数字化方向转变,同时也面临多种调制解调方式的整合。作为传统的调制解调方式AM也需要从模拟的方式转换成数字调制解调的方式,有助于实现通信系统不同调制解调方式的整合,同时也便于利用数字技术进行加密,能进一步提高AM调制解调系统的抗干扰性和可靠性。
MATLAB(矩阵实验室)是MATrix LABoratory的缩写,是一款由美国The MathWorks公司出品的商业数学软件。MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数、数据图像等常用功能外,MATLAB还可以用来创建用户界面及与调用其它语言(包括C,C++和FORTRAN)编写的程序。MATLAB主要用于数值运算,但利用为数众多的附加工具箱(Toolbox)它也适合不同领域的应用,例如控制系统设计与分析、图像处理、信号处理与通讯、金融建模和分析等。
文章用数学建模的方法先设计出了数学算法,然后考虑到实际通信系统的应用场合做了相应的数学修正,然后用MATLAB给出了源代码和仿真波形,以此验证数学模型的合理性。
1 数学建模及仿真分析
1.1 AM调制过程的数学建模
AM(调幅)是最常用的调制方式之一,也是短波通信的主要工作模式。下面介绍AM的数字化实现方法,AM调制信号图例如图1所示。
其数学模型如下:
f(t)=(A+m(t)).cos(Wct+θ)
其中A为直流电平,m(t)为调制单音频,Wc为载频,θ为初相。
1.2 AM调制MATLAB仿真程序设计与分析
首先需要确定AM调制所用的场合,文章中所用AM调制主要应用于电台的通信,所以调制频率的范围就是语音频率的范围,所以这里,选择了1 K的中心频率作为仿真的频率是合适的。即:
而调制频率的初相选择为:
・・
信号的采样频率选择为:
×
所以采样时间间隔即为频率的倒数:
那么采样的时间设置为
・
音频调制信号的表达式即为
在matlab中画图命令如下:
由此可以在MALAB中画出调制信号的波形如图2所示。
在matlab中画图命令如图3所示。
・
做出频域波形如下:
上面是音频调制信号的MATLAB时域和频域仿真波形,接下来文章需要仿真加入载波以后的波形。
首先我们需要确定载波信号的频率:
・
请读者注意,文章的载波频率设定为・,依据奈奎斯特定理,选择的采样频率应该大于等于信号频率的2倍,但考虑到工程中高频率信号的电路板设计难度相对较大,调试难度也会相应增加,而且会增加整个工程的成本,所以在这里我们采用了一种在工程中常使用的欠采样方法进行采样,经验证这同样可以在解调的时候还原出原始调制信号。这里作者选取采样频率为32.000・106Hz。载波频率的初相设置为:
・・ (1)
另外在工程设计中还需要考虑通信设备的使用场合,为了考虑设备的通用性,需要考虑高速通信设备与低速通信设备。如果作为航空器的通信,作者在仿真中还需要引入多普勒频移这一参数,才能使仿真更加贴近真实情况,设置多普勒频移参数如下:
作者根据上面设置的参数,可得出载波信号的表达式如下:
・・・
做出载波信号的时域仿真波形如图4所示。
同时信号在频域的情况也很重要,作者在MATLAB中编写作图命令如下:
・
这里为了便于观察,作者采用了归一化的方法,既是上面的公式所示,作出载波信号的频域仿真波形如图5所示。
从频域波形看出,欠采样后的载波信号会在频域中产生两个频点的,这也为后面的解调提供了一个方法,作者另文再述。
在实际的工程中,还需要考虑AM的调制深度,这里作者引入了一个调制度参数:
由此作者可以得到真实工程系统中AM调制后的时域信号:
・・
同时MATLAB中频域波形表达式如下:
下面是调制后AM的时域波形(见图6)
作者还仿真了AM调制信号在频域中的波形如图7所示。
・
读者也看到,作者在这里为了便于观察结果,同样采用了归一化的表达方式。
2 结语
AM调制是短波通信中应用最为广泛的一种调制方法,实际工程实现中也有模拟调制和数字调制等方法,随着现代数字器件的普及,有必要将多种调制方式集成在一块数字芯片上,所以需要以借助于MATLAB将调制算法进行仿真验证,为后期工作打下基础。文章在MATLAB中采用的算法目前已经应用到机载超短波通信电台中。
参考文献
[1] 江涛.医用生物电信号放大器的设计与应用[J].检验医学与临床,2010,7(2).
[2] 张科.一种基于LDO带隙基准电压源的设计与实现[D].成都:西南交通大学,2006.
[3] 梁廷贵,周浩淼.集成运放线性应用电路分析方法的研究[J].唐山学院学报,2009,22(6):86-89.
[4] 张科,冯全源.一种带软启动电路的带隙基准电压源的实现[J].微电子学与计算机,2006,12.
关键词:数据挖掘;供应商画像;信用风险
0引言
在供应商信用风险管理过程中,充分利用好大数据是企业占领市场、获取利润的捷径。将供应商数据化,即构建供应商画像是企业对供应商信用进行有效管理的重要手段,其目的是供应商信用的全数据描述,根据价值细分供应商,了解供应商信用情况,制定精准的供应商管理方案,为供应商信用管理提供支持。本文基于对供应商的评价分析管理,通过对供应商信息风险管理中大数据的挖掘、分析,提出供应商画像的概念,并以此为依据实现不同供应商信用分级管理,同时提出业务和系统的改进策略,以优化供应商之间及供应商与电网企业之间的关系。在保证服务质量的前提下,降低供应链运行成本,帮助电网企业建立竞争优势,获得更多的客户满意度。
1国内外数据挖掘技术的研究现状
数据挖掘技术是一种对电力企业信用管理决策提供支持的技术,它主要是基于机器学习、人工智能、统计学等技术对大量的数据进行处理,从而做出归纳性的推理,挖掘出数据中的潜在模式,并对供应商的信用风险进行预测,从而帮助企业的决策者们及时调整市场策略以减少可能存在的风险,做出尽可能少的错误决策。从商业层面上来说,数据挖掘还可以描述为:按照企业既定的业务目标,对海量的业务数据进行探索和分析,从而揭示隐藏的、未知的或者验证已知的数据的规律性,并进一步将其模型化,用户兴趣模型也就应运而生。根据已有的数据对用户信用风险进行建模,并进行规则抽取与提炼,得到用户的画像。国内将数据挖掘的技术应用在电信领域的成果案例也不少。比如李军利用数据挖掘的算法对电信行业的客户流失模型进行建立与分析,针对不同种类的客户分别进行了不同模型的流失分析;段云峰、吴唯宁、李剑威等在数据仓库及电信领域的应用中,运用数据仓库的方法对电信行业的服务客户进行存储管理;吴爱华在数据挖掘在客户关系管理中的应用研究中,应用了数据挖掘的相关知识来研究数据挖掘算法在用户关系管理中的应用;叶松云在我国电信行业客户流失管理的建模分析及应用研究中,通过对电信行业的流失客户进行模型建构,通过管理这个流失模型来有效控制客户的流失。目前南方电网企业和供应商的信息交换处在一种繁杂的状态,电网企业可以对单个供应商信用情况进行信息的查询,反馈,但很难通过获得的信息对多个供应商信用进行有序、有效的管理。供应商的管理缺乏直观、可视化的手段和方法。通过建立供应商模型可以将纷乱的数据进行清洗和建模,提供进一步的分析决策。
2基于大数据分析的电力企业供应商信用风险管理
根据以上分析,在电力企业供应商信用风险管理过程中,需要对收集到的供应商数据进行处理,进行行为建模,以抽象出供应商的标签,这个阶段注重的是大概率事件,通过数学算法模型来排除供应商的偶然行为,故需要运用机器对供应商的行为、偏好进行猜测,根据供应商的关注点或投标意向、投标历史、中标情况等因素来判断供应商的忠诚度、履约能力、信用等级等,并对供应商行为进行建模。简单来说,供应商画像就是通过算法计算等方式,用统一的标准衡量供应商的表现,并对未来发展进行预测,这是一种把单个分析集成化,把平面分析立体化的过程。可见,在供应商信用风险管理过程中,应结合供应商属性、行为、评价标签体系,充分研究数学算法模型,并应用Python、R等工具建模推演,构建供应商评价模型,全面刻画供应商画像。
2.1画像构建与数据分析
供应商画像模型旨在帮助管理供应商、优化投标决策,因此画像构建的关键过程在于结合实际业务情况定性地选取投标决策关心的供应商评价指标,定量化评价指标,最后选取合适的评价维度给供应商贴上标签,通过不同维度的标签还原供应商的“画像”。因此,数据处理和分析建模的过程应该基于上述关键过程的指标数据特征以及业务分析逻辑。现在针对供应商画像的研究还不算特别多,我们以流行的“用户画像”分析进行对比,从而可以发现供应商画像和用户画像有何异同,从用户画像当中又能寻找到什么可行的分析思路。图1是用户画像的一般流程。可以发现供应商画像与用户画像的建模过程本质上都是数据收集-建模-画像成型的过程,区别只是在于:首先,画像构建的目的不同,用户画像的目的是进行精准营销,而精准营销的建模工作是要对用户分类后对不同类别用户的消费行为进行预测。而供应商画像的目的是为了精准管理、精准招标,建模工作是要对供应商分类后对不同类别的供应商进行评级。其次,画像的标签维度不同,标签维度的构建同样是从画像构建的目的出发,用户画像关心的是用户的购买能力、行为特征、社交网络等,供应商画像关心的是供应商的商务状况、产品质量、信用状况。(1)数据收集。通过访谈和调研搜集数据,确定供应商指标的打分逻辑和统计口径。(2)数据预处理。对收集到的数据进行清洗,目前收集到的数据量非常小,且需要进行整合、预处理,包括缺失值和异常值的处理、数据数量级的统一、后续分析所要进行的标准化处理。在构建供应商画像的现有数据中,资格评审涉及的商务与技术两大维度的数据已经根据权重进行了打分,分数的数量级为10以内,因此部分数据只需要剔除不满足资格评审的数据(表现为所有维度都为0值)以及数值超出权重的分值。履约评价的数据有物资合同签订及时率(0-100%)、一次性试验通过率(0-100%)、到货及时率(0-100%)和不良行为记录(分值范围0.1-12)。对于这部分数据需要根据权值进行标准化,由于权值需要根据评价标准进一步确定,因此目前只需要将不良行为记录的量化数值压缩到与0-100%相同的范围。(3)数据降维。目前的供应商信用风险评级指标过多,不能满足供应商画像的特征提取与分类要求,需要进行降维处理。拟采用关联性分析和主成分分析降低指标维度,同时最大化保留原有数据的信息。在资格评审中,商务基本面信息的数据涉及15个指标,技术能力更是高达10余个,这些指标反映的意义具有较强的关联性(共线性)且在有限的数据量的情况下变量过多将会大大降低模型的自由度从而影响精确度,因此为了满足后续的分类和拟合要求,必须要剔除冗余变量,对指标进行降维处理。(4)特征分类。结合业务理解初步确定分类个数(供应商不同特征维度的级别个数),利用聚类分析算法对供应商不同特征维度进行分类,后续根据分类情况和数据特征适当调整分类个数。在构建标签之前,需要对供应商进行分类,由于目前的数据是不具有分类结果标签(y值),因此这是一个无监督的分类问题,无法采用决策树、神经网络等学习类模型;又因为目前数据集的数据量非常少,需要大量训练数据的无监督深度学习模型也不适用,因此,针对无监督和小样本的特点,选用聚类分析解决分类问题。聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”。通过这样的划分,每个簇可能对应一些潜在的概念(类别),如“财务状况良好”、“技术能力强”等。不过,这些概念对于聚类算法而言事先是未知的,聚类过程仅仅能自动形成簇结构,簇对应的概念语义需要结合业务来把握和命名。常用的聚类算法有K均值算法、层次聚类算法等非常多,而针对现有的数据,K-means算法适用的情景是:簇数确定(同维度标签评级个数确定)且较少、数据量较大;而Hierarchicalclustering适用簇数不确定(可能有一定范围)、数据量相对大的情况。具体采用哪一种分类算法要根据数据情况以及业务分类要求和可视化要求而定。(5)分类结果检验。通过计算该特征维度不同类别的供应商的加权总分对分类后不同簇的供应商的总分进行统计上的显著性检验。(6)构建画像标签。结合对供应商管理评级的业务理解,从数据层面分析该特征维度下不同簇的供应商的区别,并增加语义内容。
2.2设计供应商画像
根据行业经验及领先实践,通过对南网供应商各类行为数据及外部数据进行数据采集、数据挖掘,结合公司战略、未来发展愿景还有指标构建的一般原则,将供应商的综合画像构建为六大一级指标,分别为供应商资质评价、供应商履约运行评价、企业风险信用评价、社会行为与责任、供应商生态与供应商创新。其中最重要的企业风险信用评价指标包括企业基本风险(如企业人员变更频率)、司法风险(开庭公告次数、法律诉讼次数)、经营风险(税务评级等级、股权质押比率、动产抵押比率、司法拍卖事件次数、欠税信息次数、行政处罚次数、抽检检查合格比率)。
关键词 数学建模课程教学 数模竞赛 创新能力培养 改革举措
中图分类号:G642 文献标识码:A DOI:10.16400/ki.kjdkz.2015.05.015
Exploration and Practice of Mathematical Modeling Activities
in the Innovation Educational Background
WANG Wenfa[1], WU Zhongyuan[2], XU Chun[1]
([1] College of Mathematics and Computer Science, Yan'an University, Yan'an, Shaanxi 716000;
[2] Office of Academic Affairs, Yan'an University, Yan'an, Shaanxi 716000)
Abstract Under the innovative education based on university personnel training requirements and problems of traditional mathematics education, the importance of mathematical modeling of students' innovative ability to Yan'an University, for example, according to "sub-level, sub-module" model of teaching and organization contest guidance, teaching and assessment in accordance with academic competitions, math majors and computer majors, two contests with a thesis project and Daiso, boutique website and digital-analog Association and second class "four convergence" approach to student innovation and innovative ability, and made remarkable achievements in personnel training, curriculum development, team building, professional building.
Key words mathematical modeling teaching; mathematical modeling contest; innovative ability training; reform measures
高等学校的大学生是国家科技发展的主力军,大学生的创新能力决定着国家未来的科技创新能力。数学建模课程教学与竞赛的广泛开展对高等学校大学生的创新能力培养具有十分重要的作用。如何在数学建模课程教学与实践中,既能增强大学生的数学应用意识,又能提高大学生运用数学知识和计算机技术分析和解决问题的能力,从而达到提高大学生综合素质和创新能力的目的,这个问题是近年来众多高校关注的问题。延安大学作为一所地方高校,在近几年数学建模课程教学与实践过程中,进行了一系列卓有成效的探索和改革,学生的创新意识和创新能力得到大幅度提升。
1 更新教育理念,充分认识数学建模对学生综合素质和创新能力培养的重要性
数学作为一门基础学科,它涉及的领域相当广泛,如经济、计算机及软件、管理、国防等,虽然数学在高校教育教学中的地位不断提高,人们对其认识也不断加深。但是,人们对数学类课程、数学学科在创新型人才培养中的重要性仍认识不够深入,在教学内容、教学方法、教学手段、评价措施等诸多方面,仍然沿用传统数学类课程的教学模式和思维方式,导致高校人才培养与创新教育背景下的人才培养需求完全脱节。正如著名的数学家王梓坤院士所说“今天的数学科学兼有科学和技术两种品质,数学科学是授人以能力的技术。”面向21世纪,高等教育在高度信息化的时代培养具有创新能力的高科技技术人才,数学作为一门技术,现已成为一门普遍实施的技术,也是未来高素质人才必须具备的一门技术。因此,在数学建模课程教学与实践过程中,必须转变传统数学类课程的教育教学理念,不能将其简单地当作工具和方法,而要将其当作是一门技术,而且是一门普遍适用的高新技术,在保证打牢基础的同时,力求培养学生的应用意识与应用能力、创新意识与创新能力,真正实现培养高素质创新人才的目的。
2 数学建模课程教学的改革与实践
2.1 分层次、分模块实施数学建模课程教学和竞赛指导
一是在数学建模专业课、专业选修课、公共选修课教学中按照知识点及教师研究方向,将课程内容分为两个层次九个模块。第一层次包括数学软件、初等模型、优化模型、数学规划模型、微分方程模型等五个模块;第二层次包括离散模型、概率模型、统计回归模型、数值计算与算法设计等四个模块。第一层次针对公共选修课教学,第一层次+第二层次针对专业课和专业选修课教学。具体措施是:由数学建模课程教学团队集体制定课程教学大纲和实施计划,每位教师按照课程教学大纲和实施计划主讲自己所从事的方向模块,在保证课程教学内容完整性和系统性的同时,根据学生知识层次,充分发挥每位教师专业优势,有效地提升了课程教学质量;二是在大学数学课程教学中,按知识点将数学建模思想融入其中,在激发学生学习数学兴趣的同时,强化学生的数学应用能力培养;三是在校内数学建模竞赛中,按照“建模知识+专题讲座+模拟+竞赛”的模式组织校内建模竞赛,主要以数学建模的基本思路、基本方法、基本技能为内容,使学生对数学建模有更加深入的感知和认识,在激发学生学习数学兴趣和积极性的同时,培养学生的科研意识和创新意识;四是在全国数学建模竞赛中,按照“集训+软件应用+旧题新做+模拟选拔+强化训练”的模式组织全国建模竞赛,主要以培养学生的洞察力、联想力、创新能力、团队协作精神和吃苦精神为内容,使学生的创新意识、团队协作精神得到良好培养。
2.2 建立数学建模精品课程网站,为数学建模爱好者搭建学习交流平台
网站将数学建模课程教学与数模竞赛有机地融合,为学生全方位了解、学习和掌握数学建模的相关知识、相关技能开辟第二条通道。网站包括:课程介绍【课程描述、教学内容、教学大纲、建设规划】、教学团队【整体情况、课程负责人、主讲教师】、教学资源【教学安排、多媒体课件、授课录像、电子教案、课程作业、课程习题、模拟试卷、参考资源】、实验教学【实验任务、实验大纲、实验指导、课程设计、实验作品、实验报告】、教学研究【教学方法、教学改革、教学课题、教学论文、学生评教】、教学成果【教学成果奖、获教学奖项、人才培养成果、教材建设】、在线学习【在线交流、在线自测】、成绩考核【平时成绩、作业成绩、实验成绩】、下载专区【教学软件、常用工具】、数模协会【协会简介、协会章程、通知公告、新闻动态、竞赛获奖、优秀论文、往届赛题、模拟赛题、校内竞赛、新手入门】等,这些内容几乎囊括了数学建模教育教学活动的所有内容,学生可以通过网络资料学习就可以全面了解数学建模的相关知识与技能。
2.3 专业相互融合,取长补短,充分发挥学生各自专业优势
数学与计算机科学学院现有数学与应用数学、信息与计算科学、计算机科学与技术、软件工程四个专业,其中两个为数学类专业、两个为计算机类专业。在课程教学中针对两专业的长处和不足,按照专业结队子、学生结队子的模式组织教学和小组讨论,强化计算机类专业学生的数学应用能力培养,强化数学类专业学生的计算机软件应用能力培养;在竞赛组队中,每队均配备至少1名计算机类专业学生和1名数学类专业学生。充分发挥各自的优势,取长补短,使学生的综合能力得到提升。
2.4 延伸数学建模竞赛效能,不断提高学生的创新能力
每年全国大学生数学建模竞赛和校内数学建模竞赛试题都是从实际生活中提取出的实际问题。因此,指导教师在指导学生毕业论文(设计)和大学生创新训练项目时,从往届赛题或模拟试题中选择一些题目,将其进行适当的延伸作为学生毕业论文(设计)和大学生创新训练项目选题。通过这一方式,进一步培养学生的创新思维和创新意识,为学生今后从事科学研究奠定了坚实的基础。
3 数学建模课程教学改革取得的成效
3.1 我校全国大学生数学建模竞赛成绩居全省同类院校前列
我校参加全国大学生数学建模竞赛共获得国家一等奖4项、国家二等奖6项、陕西省一等奖33项、二等奖71项,4次被评为优秀组织奖,1名指导教师获陕西省数学建模竞赛陕西赛区优秀指导教师,600多名学生参与大创项目,公开发表科研论文30余篇,学生的就业率和就业质量得到明显提高。该赛事因此也成为了延安大学学科竞赛品牌和亮点。
3.2 我校数学建模教育获得多项教学成果奖、质量工程项目及教改项目
教学成果奖:“理工类大学生数学素质与创新能力培养的研究与实践”荣获2009年陕西省教学成果二等奖;“地方性院校开展数学建模教学的实践与探索” 荣获2003年延安大学教学成果一等奖;“计算机专业高素质应用型人才培养模式的改革与实践” 荣获2012年延安大学教学成果一等奖;“厚基础、重实践、强化工程素质和创新的人才培养模式的研究与实践”荣获2011年延安大学教学成果二等奖;“数学建模课程改革及数学建模竞赛的研究与实践”荣获2007年延安大学教学成果二等奖。
质量工程项目:“数学与应用数学专业”为2010年省级特色专业;“数学建模教学团队”为2011年省级教学团队;“数学建模精品课程”为2012年校级精品课程;2014年“数学建模”课程获批为省级精品资源共享课程;2014年“数学与应用数学”专业获批为省级专业综合试点项目。
教改项目:“大学生数学应用能力创新能力培养的改革与实践”为2009年省级重点教改项目;“地方高校青年教师教学能力提升途径的研究与实践”为2013年省级重点;“青年教师教学能力提升的研究与实践”为2011年校级重点;“计算机相关专业校企合作人才培养模式改革的研究与实践”为2013年校级重点。
3.3 依托数学建模教育平台,推动指导教师教学科研能力和综合素质提升
数学建模教育不仅提高了学生的创新能力,同时也为指导教师的教学、科研及综合素质的提升起到了推动作用。数学建模课程是一门面向全校理、工、经、管、教各学科专业大学生开设的理论与实践相结合的基础课程,主要以学生的洞察能力、创新能力、数学语言翻译能力、抽象能力、文字表达能力、综合分析能力、思辨能力、使用当代科技最新成果的能力、计算机编程能力、数学软件应用能力、团队协作精神和组织协调能力等综合素质培养为目标,以数学建模课程教学、数学建模竞赛、第二课堂、毕业论文(设计)、大学生创新训练项目等为手段,通过“分层次、分模块、四融合”的教学模式的有效实施,在提高我校学生解决在理、工、经、管、教等学科专业领域遇到的数学建模问题的能力的同时,为我校高素质、应用型人才培养做出贡献。
基金项目:2013 “地方高校青年教师教学能力提升途径的研究与实践”(项目编号:13BZ37);2014年陕西本科高等学校“精品资源共享课程建设”项目“数学建模”课程建设阶段性成果
参考文献
关键词:BP神经网络;成本估算;武器装备
一、我国常用的军品成本估算方法
针对武器系统的成本估算,国内外常用的一般方法有四种:参数估算法、工程估算法、类推估算法和专家判断估算法。
1.参数估算法,又称经验公式法。这种方法实际上是使武器系统的费用与武器系统的特点或重要参数之间建立起费用估算关系。而这些费用变量都有一个数学值范围,并不只是一个值。它的函数形式就是成本估算关系式。简言之,它是利用类似系统的历史费用数据去推导新型武器系统的费用。
2.工程估算法,又可称之为单价法或直接法。它的主要做法是根据工作分解结构在对各个独立部分和系统零部件的料、工、费进行详细估算的基础上,再将各单项估算值综合为总的成本费用。所以,该方法有时又被称为“自下而上”的成本估算法。
3.类推估算法实际上是将拟议中的产品、装备、系统功能与以前的某个系统的可比部分或类似部分进行直接比较。这种方法既可用于直接与具有同样操作或工作特性的类似系统进行比较,也可将被估系统直接与具有许多相同费用特性的不同系统进行比较。
4.专家判断法类似于专家推测法。它要求估算者拥有关于系统或系统部件的综合知识。在经验数据不足或没有足够统计资料的情况下,往往需要用这种方法。
除以上常用的4种方法之外,目前讨论的比较多的方法还包括以下3种:
1.灰色系统方法。通过对主导因素建立GM(1,1)模型,对关联因素建立GM(1,N)模型,最后得到系统的状态方程模型,按状态模型对系统进行预测。通常采用GM(1,1)和GM(1,N)相结合的方式。大致步骤为:一是确定系统的主导因素和关联因素;二是建立GM模型群,对主导因素建立GM(1,1)模型,其余因素建立GM(1,N)模型,组成线性方程组;三是根据GM模型组得出状态方程矩阵求解状态方程。灰色系统能够适应样本数较少的情况。如孙本海(2002)在他的硕士论文中使用灰色系统理论中的残差模型和改进的G-N迭代法构建了炮兵武器装备费用的参数模型。郭继周等人(2004)用灰色系统理论进行费用预测的方法,建立了GM(1,1)模型及GM(1,1)预测模型。陈尚东等人(2008)针对地空导弹维修费用数据量有限规律性不同的特点,选用灰色理论进行维修保障费用预测:首先,简要分析了GM(1,1)模型,讨论了维修费用数据的处理;然后,以某新型地空导弹武器系统为例,具体探讨了灰色预测模型的应用,并对比分析了老信息灰色预测、新信息灰色预测和新陈代谢预测模型的精度。
2.模糊综合评价方法。模糊综合评价方法(FCE)是一种应用非常广泛和有效的模糊数学方法。它应用模糊数学的有关方法和理论,通过建立隶属度函数,考虑不可量化因素的影响,进行综合分析和评价。如郭建华等人(2004)利用模糊综合评价模型对武器装备项目的研制费用进行了估算。
3.人工神经网络(ArtificialNeuralNetwork,ANN)方法。目前采用较多的是BP(BackPropagation)神经网络预测模型法,具体步骤:一是选取学习样本,对权值进行初始化;二是训练学习样本;三是用测试样本进行数据仿真。可以证明,对于任何一个在闭区间内的连续函数都可以用带一个隐层的3层BP网络来逼近。如刘铭等人(2000)提出了一种基于BP神经网络的防空导弹采购费估算模型,并对典型的防空导弹采购费进行了估算。刘国利等人(2003)根据导弹武器系统研制的特点,分析并确定了影响导弹武器系统研制费用的主要因素,提出了基于人工神经网络的费用预测模型。
军品的费用估算是一项持续性的工作,贯穿于军品研制的全过程,随着研制工作的进展,采用的估算方法应越来越详细、精确。以上介绍的7种方法各有各的特点,在不同的条件下都具有特定的使用价值,具体对比情况见表1。
二、ANN方法和BP网络的优点
神经网络的建模能力也是由参数决定的,但它有别于回归分析方法,它只限制所包含多项式的整体个数,不限制它们的阶数,即在参数一定的情况下,可以通过学习(即各分量的竞争)来合理选择任意阶数的项。这体现了神经网络的非线性特性,因而在总体上其精度由于传统的回归分析方法。
运用神经网络方法建模的另一个原因是,在实践中,我们虽然可能拥有已研制军品的相关费用数据,但这些信息常常是不完整的,而且往往含有伤残结构及错误成分,且具有不确定性,这些问题给以往的处理方式造成很大的困难。而神经网络可以通过不断地学习,从典型型号研制相关费用数据中学会处理这些问题,且能补全不完整的信息,并根据已学会的知识和经验对复杂问题做出合理的判断,以做出有效的预测和估计。
运用神经网络方法建模的一般过程包括确定系统需求描述、选择神经网络模型(包括神经网络结构、训练方法等)、数据预处理、确定神经网络的可执行代码、训练和测试等过程,具体情况见图1。
这里需要特别说明的是神经网络模型的选择问题。目前,在数于种网络结构、上百种训练学习算法中,应用最广泛、技术最成熟的是多层前向式网络结构,应用误差反向传播算法(ErrorBackPropagationLearningAlgorithm),简称为BP网络。这主要归结于基于BP算法的多层感知器具有以下一些重要能力。
1.非线性映射能力。BP网络学习能学习和存储大量输入-输出模式映射关系,而无须事先了解这种映射关系的数学方程。
2.泛化能力。BP网络训练后将所提取的样本对中的非线性映射关系存储在权值矩阵中,在其后的工作阶段,当向网络输入训练时未曾见过的非样本数据时,网络也能完成有输入空间向输出空间的正确映射。
3.容错能力。BP网络允许输入样本中带有较大的误差甚至个别错误。因为对权矩阵的调整过程也是从大量的样本对中提取统计特性的过程,反映正确规律的只是来自全体样本,个别样本中的误差不能左右对权矩阵的调整。
三、某型号无人机成本估算的BP模型
1.确定样本集。为了验证前文所说的BP神经网络在成本估算中的准确性,本文选择了八中型号的无人机来进行模拟运算。具体的数据见下表(表2)。
由表2可知,本文选择了与最后的整机价格有主要关系的6个性能指标,分别是导航定位精度、飞行高度、控制半径、最大平飞速度、续航时间和任务载荷。这六个性能指标是作为BP神经网络模型的输入项(in)存在的,而最后一项整机价格则是作为模型的输出项(out)。需要说明的是,根据前文的思路,本部分使用BP神经网络估算的应该是军品的成本,而不是军品的整机价格。在表5中之所以使用整机价格,主要是因为表中的价格是按照目前的军品定价模式计算出来的,即只要在整机价格的基础上除以(1+5%)就是飞机的成本。根据神经网络和本文研究的特点,此处使用整机价格并不影响最终结论的正确性。另外,为了保证结果的真实性,表中的整机价格在军方审价完成之后,承制方与军方最终的成交价格。还需要说明的是,有两个因素可能会影响本案例研究的精确性:一是为了搞好保密工作,本表格提供的数据是经过了脱密处理的。二是本文样本的数量不大,只有用来供神经网络学习的样本只有6个(前面6个型号),用来测试的只有2个(最后的2个型号),这必然会影响结果的精度。但是只要误差在本文认为的可接受的范围内(≤20%),本文就认为研究结果有效。
2.确定网络结构和算法。本案例的BP神经网络结构如图2。
由上图可知,该BP神经网络的结构由6个性能指标构成输入层,输出层只有一个节点即整机价格。中间的隐层包含7个神经元节点。
本文采用的是MATLAB的BP神经网络工具箱中的Trainlm函数建立的模型,它采用的是L-M算法。
3.数据标准化、训练和测试。本文采用的MATLAB版本是MATLAB7.70(R2008b),该版本的功能比较强大,对数据的要求不像以前的那么严格(以前版本的MATLAB要求节点输入和输出值的大小在[0,1]),所以笔者在并不需要对数据进行标准化。这样不仅能够减少模型的计算量,而且还有利于提高最终结果的精确度。
4.结果。根据前文构建的军品成本估算BP模型,以及上文确定的算法和过程,在经过了5次迭代后得到结果见表3。
由上面的结果可知,对高速无人机1和高速无人机2测试的误差都在20%以内,是在前文限定的范围内,因而笔者认为这个结果是可以接受的。并且,测试结果表明目前的定价还是略高于计算值。
四、存在的问题
在将BP神经网络模型应用于无人机的过程中,笔者认为以下几个方面的问题是比较难把握的。
1.输入层节点个数的控制。就本案例来说,输入层有6个节点,也就是6个性能指标。正如前文所言,选择的这6个性能指标是因为它们与最后的整机价格有主要关系。这个判断主要是根据专家的判断和实际的做法得出来的,所以其中的主观性很大。如果选择的尺度或标准稍微有所变化,那么指标的个数就会发生变化。而且我们如果要判断到底需要几个指标才能达到最好的预测效果。
2.隐层节点数的控制。这里包括两个问题:一是包括几个隐层?二是隐层中包括几个节点。一般来说一个隐层的BP神经网络就能很好的学习和测试,就笔者看到的文献而言,也主要是一个隐层。关于隐层中节点的个数,没有具体的规则,只能根据结果调整,这就对研究者使用MATLAB进行BP神经网络建模的经验和技术提出了挑战。
【摘要】 采集了来自全国20种单植物源和其它多植物源的101份的蜂蜜样品,分别运用傅立叶型近红外光谱仪采用光纤透反射(800~2500 nm,2 mm光程)和透射(800~1370 nm,20 mm光程)采集方式获得近红外光谱,来预测蜂蜜中结构和含量都很相近的果糖和葡萄糖含量。结果发现,两种测量方式下果糖、葡萄糖的预测准确度存在着较大的差异。为了分析这种差异产生的原因,采用支持向量机分析其非线性信息,采用遗传算法分析其特征波长,结果表明: 这种差异主要来自两种糖分特征波长分布不同所导致。通过对两种糖分的检测方案进行优化,得出在利用近红外光谱技术检测蜂蜜中葡萄糖成分含量时应尽量采集短波区、长光程的光谱,或者对全谱区、短光程的光谱,进行特征波长的提取,避开水分的干扰,从而提高其预测精度;而对于果糖,则应尽量采集全谱区、短光程的光谱;采用常用线性定量建模方法PLSR就可以得到很好的预测模型,非线性的支持向量机模型未能明显提升模型性能。
【关键词】 蜂蜜; 近红外; 果糖; 葡萄糖; 特征波长
Abstract A total of 101 honey samples that originated from 20 different unifloral honey and other multifloral honey samples were collected from China.FT-NIR spectrometer were applied to determinate the content of fructose and glucose of honey with two different modes:transflectance (800-2500 nm,2 mm optical path length) and transmittance (800-1370 nm,20 mm optical path length).It was found that the prediction accuracy of fructose and glucose had significant difference with the two modes.In order to analyze the reason of this difference,support vector machine (SVM) was used to analyze the non-linear information,and genetic algorithm (GA) was used to analyze the characteristic wavelengths.The result indicated that the detection difference of fructose and glucose was originated from their different characteristic wavelengths.Through the optimization of detection method,it was found that for the determination of glucose,short wavelength and long optical path length should be used,on the other side,the whole wavelength region and short wavelength,with selecting the characteristic wavelength to avoid the disturb of water can also be used.For the determination of fructose,whole wavelength region and short optical path length should be used.Linear regression methods such as PLSR could obtain good results,and non-linear methods such as SVM did not improve the model performance.
Keywords Honey; Near infrared spectrometry; Fructose; Glucose; Characteristic wavelengths
1 引言
蜂蜜中含有糖类、水分、矿物质、维生素、蛋白质、氨基酸乙酰胆碱、生物类黄酮等180余种不同物质成分。糖类物质是蜂蜜的基本成分,占70%~80%。其中,主要成分是葡萄糖和果糖,约占总糖分的85%~95%;其次是蔗糖,一般不超过5%。除此之外,蜂蜜中还含有少量如麦芽糖、乳糖、棉子糖、松三糖等20余种双糖和多糖。果糖和葡萄糖的含量最高,分别约占蜂蜜质量的38%和31%〖1〗。
近红外光谱技术〖2〗具有快速、简便、无样品预处理、无损伤等特点,并结合化学计量学方法提取光谱有效信息进行样品定性或定量分析被应用到很多领域。文献〖3,4〗研究了近红外透反射法对于蜂蜜中果糖、葡萄糖含量检测的可行性,并取得了较好的效果,可以有效解决现有高效液相色谱法检测中耗时、繁琐的问题。对于果糖、葡萄糖这两种在蜂蜜中含量最高、化学结构相似的单糖类物质,不同学者研究采用了不同光谱区间、光程等采集参数来探索其快速检测的可行性。Qiu等〖3〗利用1 mm光程、400~2500 nm波段近红外光谱建立果糖和葡萄糖PLS模型,预测集决定系数(R2)分别为0.97和0.91。Garcra等〖4〗利用2 mm光程、400~2500 nm波段近红外光谱建立果糖和葡萄糖PLS模型,预测集决定系数(R2)分别为0.98和0.95。上述研究结果表明, 运用近红外光谱技术可以对蜂蜜中的果糖和葡萄糖含量进行快速检测,但仅集中于某种采集方式下线性定量模型的研究,尚未见对其非线性问题的研究。同时对于由于不同采集方式和参数下这两种单糖预测精度的差异性问题及其预测条件的优化问题也缺乏深入研究。本研究通过比较光谱区间、光程等采集参数,采用偏最小二乘回归线性建模支持向量机非线性建模、采用遗传算法分析蜂蜜中果糖和葡萄糖的特征波长等分析近红外光谱法检测蜂蜜中果糖和葡萄糖含量的差异性问题,优化其最佳检测方案,以提高近红外光谱法检测蜂蜜中果糖和葡萄糖含量的预测精度,并为其在不同实际运用条件下提供可行的检测方案。
2 实验部分
2.1 蜂蜜样品的采集
本研究分别采集了四川、江苏、山西、山东、浙江、福建、河南、吉林、河北、安徽、河北、广西、陕西、辽宁、天津、北京等蜂蜜著名产地的蜂蜜样品,不仅充分代表国内样品品种和产地的特性,也代表了我国蜂蜜的主要出口品种的特征。
本研究的蜂蜜品种也具有很好的代表性,共收集洋槐、琵琶、枣花、五味子、益母草、紫云英、荆条、党参、荔枝、椴树、枸杞、、桂花、玫瑰花、山茶、油菜、柑橘、白刺花、罗布麻、丹参20种单植物源蜂蜜(Unifloral honey),以及混合植物源蜂蜜(Multifloral honey)共101个蜂蜜样品。
2.2 光谱采集仪器及方法
本实验采用了常见的傅立叶型近红外光谱仪的两种不同采集方式(样品池透射、光纤透反射)来采集蜂蜜的近红外光谱。
光谱采集在环境温度可控的实验室内(温度控制为26 ℃)进行。每次测试前都必须先预热仪器30 min。同时,由于部分蜂蜜存在结晶现象,在实验前对结晶蜂蜜样品采用40 ℃水浴中加热,直至结晶完全溶化,再降至室温(26 ℃)。
光谱采集均采用BRUKER ISF/28N型傅立叶型近红外光谱仪(BRUKER公司),具体采集方法如下:蜂蜜的傅立叶透射光谱采集,附件:石英透射样品池,光程:20 mm,扫描谱区:3600~12500 cm-1,分辨率:8 cm-1,扫描次数:32次;蜂蜜的傅立叶光纤透反射光谱。附件:石英液体透反射光纤探头;光程:2 mm(间距为1 mm);扫描谱区:3600~12500 cm-1;分辨率: 8 cm-1;扫描次数:32次。均采集空气为背景。
2.3 蜂蜜果糖和葡萄糖含量的测定
果糖的结构简式CH2OH(CHOH)3(CO)CH2OH,其水溶液又称“左旋糖”;葡萄糖的结构简式CH2OH(CHOH)4CHO,其水溶液又称“右旋糖”。葡萄糖与果糖互为同分异构体,葡萄糖是多羟基醛(醛糖),果糖是多羟基酮(酮糖)。国家标准中规定,蜂蜜中果糖和葡萄糖的含量必须≥60%〖5〗*
本实验中蜂蜜的果糖和葡萄糖含量按照国标GB/T 18932.22-2003(蜂蜜中果糖、葡萄糖、蔗糖、麦芽糖含量的测定方法-液相色谱示差折光检测法)测定。
2.4 支持向量机及特征波长选择算法
支持向量机(Support vector machines,SVM)是一种新型的非线性近红外建模方法,SVM是建立在结构风险最小化(Structural risk minimization)原则基础上的,因而从理论上保证了其在小样本拟合时也能具有较好的泛化能力。最小二乘支持向量机(LS-SVM)是一种经典SVM的改进方法,以求解一组线性方程代替经典SVM中较复杂的二次优化问题,降低了计算复杂性,加快了求解速度。构建LS-SVM模型需确定两个重要模型参数:γ和核函数参数(本实验采用径向基核函数,模型参数为σ2),采用二步格点搜索法(Grid searching technique)和留一法交叉验证法(Leave one-out cross validation)相结合,对这两个模型参数进行全局寻优〖6〗匝盗芳徊嫜橹の蟛罹礁RMSECV)为参数选择指标。
针对近红外光谱采样点数较多的特点,为防止发生过拟合现象,本研究采用反复遗传算法(Iterative GA-PLS)〖7~9〗 选择特征波长。对包含2205个波长点的波长段,去除最后5个点,将每11个连续波长点取平均值作为一个新变量,总计200个新变量,经过5次重复遗传算法后,将原始波长点挑选出来再进行遗传算法。其算法的具体参数设定为:初始群体大小为30,最大繁殖代数100,交叉概率0.5,变异概率0.01。
2.5 回归模型评价指标
由于每次测量的蜂蜜光谱总体能量不同,光谱间差异较大。为了消除由于仪器每次测量所带来的能量差异,本研究在数据分析和数学建模前,分别对校正集和预测集光谱进行标准化(Auto-scaling)处理,然后利用偏最小二乘回归法(PLSR)对数据进行多元统计分析。应用非线性迭代偏最小二乘(NIPALS)算法求取偏最小二乘因子。校正模型的最佳因子个数(#LV)由舍一交互验证法(LOOCV)的预测残差平方和(PRESS)来确定。数据预处理和建模过程中的所有计算均由自编的MATLAB 7.0程序完成。校正模型的性能通过相关系数(r)评价其相关性,校正误差均方根(RMSEC)作为校正集的评估标准,预测误差均方根(RMSEP)反映模型对未知样本的预测效果。
相对标准偏差RSD反映模型对某一组分的总体测定效果,即测定精度。它包括校正相对标准偏差RSDc和预测相对标准偏差RSDp,具体表示分别为:
RSDC(%)=100×RMSEC/ymc(1)
RSDP(%)=100×RMSEP/ymp(2)
式中: ymc,ymp分别为样品校正集和预测集真值的平均数。一般来说,r 越接近1,RSD越小,表明校正模型的校正精度和测定精度越高,而小的RSD比大的r 更为重要。
3 结果与讨论
3.1 蜂蜜果糖和葡萄糖的PLS模型差异
本实验采集了近红外谱区谱区3600~12500 cm-1的信息。对于傅立叶2 mm透反射光谱,由于检测器检测范围的原因,在3600~4000 cm-1波段的光谱噪声较大,因此在下面的研究中截取了波段为4000~12500 cm-1(800~2500nm)波段的光谱为研究对象。而傅立叶20 mm透射光谱图谱在1370 nm后光谱严重溢出,因此采用800~1370 nm波段的光谱为使用光谱。图1分别为波段截取后的101个蜂蜜样本采用傅立叶光谱仪采集的光程为2 mm光纤透反射光谱及光程为20 mm透射光谱。
图1 蜂蜜的傅立叶光纤透反射光谱图(a)和傅立叶透射光谱图(b)(略)
Fig.1 Fourier transform(FT) transflectance spectra(a) and FT transmittance spectra(b) of honey samples
首先,对测得的101个样品的果糖、葡萄糖含量进行异常值筛选,先剔除8个果糖异常的样品和1个葡萄糖异常的样品,然后利用外在学生化残差-杠杆值图〖10〗剔除剩余样品中的异常样本。为了更好地体现模型的稳定性,本实验首先根据蜂蜜各成分的分布,按照校验集与预测集之比为2∶1,3∶1,7∶3,4∶1和5∶3的5种比例,采用K-S法〖11〗进行了样品集的选择,然后分别建立模型。研究结果表明,不同比例分组后模型表现了较好的稳定性。〖JP2〗挑选出所建立的果糖和葡萄糖模型中较有代表性的分组方式,作为不同采集方式的模型效果比较时的代表,被挑选出的代表性分组后的样品统计数据见表1。
表1 蜂蜜样品参考值的统计特征(略)
Table 1 Statistic major components of calibration and prediction sets of honey
为检测蜂蜜中果糖和葡萄糖含量,建立了800~2500 nm波段、光程为2 mm透反射光谱和800~1370 nm波段、光程为20 mm透射光谱的PLS模型,模型结果见表2。通过PLS建模结果可以看出,在800~2500 mm这个近红外全谱区建立的线性定量模型,果糖相关系数(r)为0.9311,预测相对误差(RSDp)为5.45%;葡萄糖相关系数(r)为0.8291,预测相对误差(RSDp)为8.81%。同时,在800~1370 nm这个近红外短波区建立的定量PLS模型,果糖相关系数(r)为0.9297,预测相对误差(RSDp)为6.38%;葡萄糖相关系数(r)为0.8907,预测相对误差(RSDp)为7.87%。由此可见,采用全谱区、短光程光谱建模葡萄糖的预测精度低于果糖,而在短波区利用长光程光谱建立的模型相对于全谱区葡萄糖的预测精度有一定提高,而果糖预测精度反而有一定下降。因此,在利用近红外光谱技术检测蜂蜜中葡萄糖成分含量时应尽量采集短波区、长光程的光谱; 而对于果糖,则应尽量采集全谱区、短光程的光谱。
表2 蜂蜜近红外模型结果(略)
Table 2 Results of the NIR spectra of honey
MSEC:root mean square error of calibration; RMSER:root mean square error of prediction.
3.2 基于LS-SVM的果糖和葡萄糖模型优化研究
在比较不采集方式对蜂蜜中果糖和葡萄糖建立近红外线性定量预测模型效果后,采用LS-SVM建立蜂蜜中果糖和葡萄糖的非线性模型。本研究中,果糖γ和σ2的搜索范围分别为1~500和0.1~1000,寻优过程与结果:最优γ和σ2分别为124.7491和237.5784。葡萄糖γ和σ2的搜索范围分别为1~500和0.1~1000,寻优过程与结果:最优γ和σ2分别为320.9671和170.5475。由表2可见,利用LS-SVM建立800~2500 mm谱区建立果糖的非线性定量模型的预测结果为:果糖相关系数(r)为0.9264,预测相对误差(RSDp)为5.5%;葡萄糖相关系数(r)为0.8364,预测相对误差(RSDp)为9.11%。这与用PLS线性定量模的效果基本相同。可见,果糖和葡萄糖在蜂蜜中含量较高,其信息受背景影响较小。因此,采用常用线性定量建模方法PLSR就可以得到其很好的预测模型。
3.3 蜂蜜中果糖和葡萄糖特征波长的提取及近红外检测差异性分析
利用反复的遗传算法(Iterative GA-PLS)在全谱范围内选取了蜂蜜中果糖和葡萄糖的特征波长。经过遗传算法的计算,得到蜂蜜中果糖的特征波长集中在1845~1846 nm,1892~1893 nm,1949~1951 nm,1964~1967 nm和2225~2230 nm这几个波段; 葡萄糖的特征波长集中在832~833 nm,878~879 nm,1209~1211 nm,1234~1236 nm,1245 nm,1634~1639 nm,1790 nm,1854~1858 nm和2184~2190 nm这些波段。经过遗传算法后用PLS建模的模型结果见表2。从表2可以看到,经过特征波长选择后果糖模型的预测精度较原始波长基本没有变化。模型预测相对误差(RSDp)由5.45%上升到5.57%,r由0.9311下降到0.9300。而葡萄糖的的预测精度较原始波长下有较大程度的提高,模型预测相对误差(RSDp)由8.81%下降到6.59%,r由0.8231提高到0.9041。
从图1a所示的蜂蜜光谱图可见,蜂蜜在近红外谱区的光谱图主要吸收峰位于1450, 1940, 2100, 2280和2350 nm,这些吸收峰中1450和1940 nm主要是由于水的吸收所导致。其中1450 nm为OH的伸缩振动的一级倍频〖12〗,而940 nm为OH的伸缩振动的二级倍频〖12〗。这2个波长点是水的吸收峰,由于水的吸收很强(特别是蜂蜜中含水量约为17%),因此蜂蜜光谱图吸收蜂很大。而同样作为水的吸收峰的1190 nm处,由于本研究采用的透反射光程较短(2 mm),因此在短波区吸收不强烈。
葡萄糖和果糖的分子式相同,不同之处在于两者分子结构中羟基的位置不同,这个差异可能导致两者在近红外区的吸收特性不同。从遗传算法挑选出的特征波长可以看出,果糖的特征波长大多分布在1800 nm 以上的波段,而葡萄糖在1100 nm以下也有明显的特征波长。比较表2中透反射模型和透射模型可以发现,在采用傅立叶透反射方式采集全谱(800~2500 nm)建立模型时,由于采用光程较短(2 mm),因此在短波区得到的信息较弱,易被水等背景干扰因素影响,使得模型的预测精度受到影响,但对果糖和葡萄糖模型的影响程度不同。其中果糖的预测效果较好,RSDp为5.45%;而葡萄糖预测误差较大,RSDp为8.81%。当采用傅立叶透射方式采集800~1370 nm范围内较长光程的光谱时,葡萄糖模型的预测精度明显提高(RSDp为7.87%),并且与果糖模型的差异变小(果糖的RSDp为6.38%)。因此,对于蜂蜜中成分、结构都非常相似的两种糖分,在利用近红外光谱技术检测时应采用不同的技术方案。对于蜂蜜中的葡萄糖,应尽量采集短波区、长光程的光谱,或者对全谱区、短光程的光谱,进行特征波长的优化提取,从而改善其预测精度;而对于果糖,则应尽量采集全谱区、短光程的光谱。
对于蜂蜜中成分、结构都非常相似的葡萄糖和果糖,在利用近红外光谱技术检测时应该采用不同的技术方案。对于蜂蜜中的葡萄糖,应尽量采集短波区、长光程的光谱,或者对全谱区、短光程的光谱,进行特征波长的优化提取,从而改善其预测精度;而对于果糖,则应尽量采集全谱区、短光程的光谱。同时,通过对各种检测方案及建模算法的优化,预测结果仍然是果糖优于葡萄糖。除了特征波段分布不同外,可能还存在着更深层次的原因,有待于进一步研究。
参考文献
1 White J W,Riethof M L,Subers M H,Kushnir I.Technical Bulletin 1261,U.S.Department of Agrioulture Washington D C,1962,1261:1~42
2 Dull G,Birth G S,Smittle D A,Leffler R G.Journal of Food Science, 1989,54(2):393~395
3 Qiu P Y,Ding H B,Tang Y K,Xu R J.Journal of Agricultural and Food Chemistry,1999,47(7):2760~2765
4 Garcia-Alvarez J F,Huidobro M H,Rodriguez-Otero J L.Journal of Agricultural and Food Chemistry, 2000,48(11):5154~5158
5 GB 18796-2005, Honey(蜂蜜).National Standards of the People’s Republic of China(中华人民共和国国家标准)
6 YU Ke(虞科), CHENG Yi-Yu(程翼宇).Chinese J.Anal.Chem.(分析化学), 2006, 34(4):561~564
7 Leardi R.Journal of Chemometrics, 1994,8(1):65~79
8 Leardi R,González A L.Chemometrics and Intellingent Laboratory Systems, 1998,41(2):195~207
9 Nrgaard L,Saudland A,Wagner J,Nielsen J P,Munck L,Engelsen S B.Applied Spectroscopy, 2000,54(3):413~419
10 Otto M. Translated by SHAO Xue-Guang(邵学广),CAI Wen-Sheng(蔡文生),XU Xiao-Jie(徐筱杰). Chemometrics:Statistics and Computer Application in Analytical Chemistry(化学计量学:统计学与计算机在分析化学中的应用). Beijing(北京):Scientific Publishing Company(科学出版社),2003:39