前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络经济学主题范文,仅供参考,欢迎阅读并收藏。
【关键词】 BP神经网络;动量梯度下降算法;免疫学数据
作者单位:116044大连医科大学医学影像学系(陈艳霞);
大连医科大学检验医学院(刘挥)
人工神经网络理论以非线性大规模并行分布处理为特点,突破了传统的线性处理模式,以其高度的并行性,良好的容错性和自适应能力成为人们研究其赖以生存的非线性世界、探索和研究某些复杂大系统的有力工具,已应用于很多领域的信息处理工作。
BP算法的多层前馈网络的人工神经网络模型采用典型的有教师学习方式来进行预测和分类问题的处理。采用的传递函数通常是sigmoid型可微函数,可以实现输入和输出间的任意非线性映射。这使其在函数逼近、模式识别、数据压缩领域有着更加广泛的应用。该模型的特点是信号由输入层单向传递到输出层,同一层神经元之间互不传递信息,每个神经元与邻近层所有神经元相连,各神经元的作用函数为Sigmoid函数,用样本集合反复训练网络,并不断修改权值,直到使实际输出向量达到要求,训练过程结束。应用BP网络处理正常状态与处于焦虑状态的学生的血液中免疫学指标数据,取得了很好的效果[1]。
1 基于BP网络的医学数据分析
数据选自在某大学就读的大学生,共计48例。在自愿、正常学习生活的情况下抽取他们的血液标本,然后再在考试前抽取他们的血液标本,分别进行五项免疫学指标检验,共获得两类、五项、480组数据。随机把其中的20例学生的两类、五项数据做为训练集输入矢量输入,目标矢量为处于考前状态的五项数据输出为1,平时正常生活状态的五项数据输出为0。网络训练时调整神经元之间的连接权值,使网络的输出和实际的两类情况尽可能相符。如果对所有的训练样本集网络的输出95%或更高能保证与实际结果一致,则训练过程结束。网络训练好后,剩余的28例学生的5项数据作为神经网络的输入项,神经网络的输出值就是该学生是处于考前状态1还是平时正常生活状态0。主要设计程序如下:
%NEWFF-生成一个新的前向神经网络;%TRAIN-对BP神经网络进行训练;%SIM-对BP神经网络进行仿真;pause %敲任意键开始
clc
a1=[955 182 148222 1240]’;
a2=[1190 1911252421010]’;
a3=[1370291743461460]’;
a4=[1150 1962001511370]’;
a5=[821 109 82195 899]’;
a6=[1290246 112 299 1200]’;
a7=[876 132 139 166 952]’;
a8=[800 200 53.7214 873]’;
a9=[1210187 215 210 1370]’;
a10=[1090 131 68.5285 1380]’;
a11=[1240 433 154 224 1520]’;
a12=[1300 239 61.3289 1150]’;
a13=[1200 284 71.9119 1430]’;
a14=[1270 339 133 197 1210]’;
a15=[1210 248 151 125 1330]’;
a16=[1030 294 132 137 1040]’;
a17=[876151 126 194 1020]’;
a18=[1130 246 129 320 1470]’;
a19=[1020 196 157 225 1200]’;
a20=[1260 243 96.9143 1330]’;
b1=[910 188 127 216 1300]’;
b2=[1160177 136 268 1220]’;
b3=[1370287 101 321 1420]’;
b4=[947 159 170 111 1310]’;
b5=[911 116 66.2216 1140]’;
b6=[1320278 80.1305 1250]’;
b7=[804 147 150 177 987]’;
b8=[930 227 66.4245 962]’;
b9=[903 147 191 217 1380]’;
b10=[729121 59.2285 1330]’;
b11=[1180 436 144 220 1460]’;
b12=[949169 70.3240 972]’;
b13=[1150 273 65124 1520]’;
b14=[1150 172 118 179 1340]’;
b15=[1110 216 144 120 1320]’;
b16=[898260 112 197 1000]’;
b17=[866155 134 181 1050]’;
b18=[1060 235 158 149 1400]’;
b19=[887160 136 168 1450]’;
b20=[1320 286 92154 1410]’;
p=[a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 a11 a12 a13 a14 a15 a16 a17 a18 a19 a20 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20];%为输入特征矢量!
t=[-1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1];%为输出目标矢量?
%创建一个新的前向神经网络
net=newff(minmax(p),[12 1],{’tansig’,’purelin’},’trainlm’);
%==============设置网络参数============================
net.trainParam.show = 50;
net.trainParam.lr = 0.05;
net.trainParam.mc = 0.9;
net.trainParam.epochs = 10000;
net.trainParam.goal = 1e-1;
%=======================================================
[net,tr]=train(net,p,t); %对网络进行训练
echo off;
b=[1590 245 125 286 1330]’;
w=sim(net,b);
if w>0
disp(’0’);
else
disp(’1’);
end
表1
BP神经网络处理免疫学数据结果
神经网络
诊断结果训练数据测试数据
正常状态考前状态正常状态考前状态
0 200243
10 20425
其中对于训练集,正常状态与考前状态的正确检出率为100%。对于测试集,正常状态的正确检出率为85.7%;考前状态的正确检出率为89.3%。平均为87.5%。
3 讨论
3.1 本研究所采用的人工神经网络检验免疫数据的结果较好地符合了已知数据,具有较高的准确性。
3.2 要想进一步提高该方法的准确性,应该注意收集更多更全面的检验数据。如果我们所使用的数据越多越全面,则其中所蕴含的事物本身的规律性就越强,利用人工神经网络从中所抽取的函数关系就越具有普遍性,因而就更准确。
3.3 可能对亚健康的诊断具有指导意义。亚健康问题各国医学界已作了一些研究,并取得了某些实际的成果。但是,由于亚健康的多种类型以及多种相关因素,使得现有的诊断在准确性和实用性方面都存在着相当的局限性,如建模复杂困难。由于对影响罹病与否的各种因子的作用机制了解得不是很清楚,如何建立诊断模型,以及如何确定新建立的模型在何种程度上与实际情况相吻合还是一个问题;容错能力不强,适用范围不广;依赖于某些病例库新建立起来的医学模型往往具有很强的局限性,用于新的病例库时误差有时较大。另外,由于医学方面的原因,我们收集到的数据有时不完整,而现有的研究方法所建立起的医学模型由于容错性差,对这些不完整的数据通常都难以处理。人工神经网络理论突破了传统的线性处理模式,以其高度的并行性,良好的容错性和自适应能力成为人们研究其赖以生存的非线性世界,探索和研究某些复杂大系统的有力工具。对亚健康的诊断关键在于准确找到亚健康的判定函数,可能利用BP网络的函数逼近功能来实现。这需要有更多的医学数据来实践检验。
参 考 文 献
关键词:神经网络 心理障碍 专家系统
中图分类号:G64 文献标识码:A 文章编号:1007-9416(2012)02-0174-02
人工神经网络技术的兴起为知识获取开辟了一条新途径。它通过模拟人脑的神经网络结构形式,建立各种网络模型,进行信息处理达到解决问题的目的。如BP网络模型就能通过大量的训练例子,经过学习获取知识[1]。
目前高校在大学生心理健康教育领域只是通过学校的心理辅导老师或医院的心理学专家给予咨询指导,但是由于经验水平不一,层次不同,达不到预期的效果。而利用神经网络专家系统能够进行复杂的模式识别和完成规则复杂、无法预先确定化的任务。文章试图借助神经网络专家系统全面综合国内外心理学专家的经验,全方面检测大学生心理状况并及时给出诊断方案。
1、人工神经网络的基本思想
人工神经网络(Artificial Neural Networks,简记作ANN),是对人类大脑系统的一阶特性的一种描述[1]。简单地讲,它是一个数学模型,可以用电子线路来实现,也可以用计算机程序来模拟,是人工智能研究的一种方法[1]。人工神经网络的功能特性由其连接的拓扑结构和突触连接强度,即连接权值决定。神经网络全体连接权值的可用一个矩阵W表示,它的整体反映了神经网络对于所解决问题的知识存储。神经网络能够通过对样本的学习训练,不断改变网络的连接权值以及拓扑结构以使网络的输出不断地接近期望的输出。这一过程称为神经网络的学习或训练,其本质是可变权值的动态调整。神经网络的学习方式是决定神经网络信息处理性能的第三大要素,因此有关学习的研究在神经网络研究中具有重要地位。改变权值的规则称为学习规则或学习算法,在单个处理单元集体进行权值调整时,网络就呈现出“智能”特性,其中有意义的信息就分布地存储在调节后的权值矩阵中。
2、BP神经网络模型的原理和结构
BP(Back Propagation)神经网络是由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一[3]。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)(如图1所示)。
Fig1 BP Neural Network Structure
BP网络的原理是把一个输入矢量经过隐层变换成输出矢量,实现从输入空间到输出空间的映射。由权重实现正向映射,利用当前权重作用下网络的输出与希望实现的映射要求的期望输出进行比较来学习的。但要深入了解我们就先要了解一下BP网络学习算法――反传学习算法(即BP算法)。对于输入信号,要先向前传播到隐层节点,经作用函数后,再把隐节点的输出信号传播到输出节点,最后给出输出结果。节点的作用的激励函数通常选取S型函数,如,式中Q为调整激励函数形式的Sigmoid参数。该算法的学习过程由正向传播和反向传播组成。正向传播时,传播方向为输入层隐层输出层,每层神经元的状态只影响下一层神经元。若在输出层得不到期望的输出,则转向误差信号的反向传播流程,将误差信号沿原来的连接通道返回,通过修改各层神经元的权值,使得误差信号最小。通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。BP模型把一组样本的I/O问题变为一个非线性优化问题,它使用的是优化中最普通的梯度下降法。
3、大学生心理障碍诊断专家系统
有关研究和统计结果表明,大学生在心理上的确存在着一系列的不良反应和适应障碍,有的甚至到了极为严重的程度,因心理疾病而休学、退学甚至伤人、自杀的比率近几年呈上升趋势。心理疾病主要是由心理因素造成的。对此,我们设计此诊断专家系统,使大学生可以及时了解自己心理健康状态,为大学生心理健康成长提供有力帮助[4]。
鉴于篇幅原因,以从五个特征识别大学生常见心理疾病为例,说明模型服务的开发过程。输入的五个特征包括:行为举止、情绪状态、饮食睡眠、性格特征、躯体疾病,选择大学生常见的四种心理疾病作为训练,构造心理疾病识别神经网络。在实际中的心理疾病的特征要复杂庞大的多,且各个特征间也多有重叠交互,在此仅提供选取五个鲜明共性,构造神经网络识别训练集,如表1所示。
该样本设计成如图2所示的神经网络。网络输入层的神经元个数为5个,输出层的神经元个数为4个,隐层的神经元个数为5个。
Fig.2 Neural Network of Psychological barrier distinguishing
进行神经元网络计算,需要把文字概念转换为数值。为了便于数据的判别,用六维向量值表示各个特征,其中前三位表示类别,后三位表示特征,则共可以容纳26=64种特征。表1的内容经过文字到数值的转换后的结果见表2。
经过改进的BP网络后加入的动量项初始值为0.6,网络学习速率为0.43。网络训练的循环次数规定为5000,训练误差期望为0.000001。
通过该神经网络模型来完成大学生心理障碍专家诊断系统。对该神经网络进行训练后,输入四组数据见表3:
下表为量化后的实例表4:
表4 量化后的数据表
Table4 After the quantitative data table
运行客户端程序,得到结果报表。所得到报表包含以下内容:
(1)完成文字到数值转换后的输入参数;
(2)神经网络的计算输出值;
(3)根据输出数值得到的结论。得到以下推理结果如图3所示:
Fig.3 Result of college student Psychological barrier Expert System
从计算结果中可以看出神经网络的容错效果很好,对第二例,对焦虑症缺省缺乏自信、孤独内向条件时,输出结果是焦虑症(0.9122);对第三例,输入神经衰弱和焦虑症的共同信息时,神经网络输出既靠近神经衰弱(0.8761),又靠近焦虑症(0.8429),输出结论:该症状是介于神经衰弱症和焦虑症的中间种类,不能被明确识别,神经网络需要进一步训练、学习。
4、结语
神经网络来源于研究者对真实神经元网络运算能力的模拟,在发展过程中,逐渐显示出学习、记忆、联想等强大的功能,因此神经网络被广泛的应用到很多领域。通过对神经网络在大学生心理障碍诊断中的应用研究,实现了简单的模式识别,达到了预期诊断效果。目前该系统只是对生物神经系统的某种特定性能的简单模拟,如果进行足够的训练和学习,理论上该系统能够进行复杂的模式识别和完成规则复杂、无法预先确定化的任务。
参考文献
[1]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006:23-27.
[2]冯定.神经网络专家系统[M].北京:科学出版社,2006:57-61.
[3]高隽.人工神经网络原理及仿真实例(第二版)[M].北京:机械工业出版社,2007:10-11.
[4]陈青萍.现代临床心理学[M].北京:中国社会科学出版社,2004:124-130.
[5]李维,张诗忠.心理病理卷(中文版)[M].上海:上海教育出版社,2004:74-76.
1 BP神经网络
BP神经网络也称为反向传播网络,包括输出层,隐含层,输入层三部分,同时BP的神经网络具有非线性的特点,能够解决没有规则,多约束条件或数据不完全等问题,适合处理复杂的分类及模式识别等问题。BP神经网络具有一个或一个以上的信息隐含层,能够将相邻的两层完全连接起来。
要建立学生数学能力评价的BP神经网络模型,就需要建立具有代表性的数据库,以便于进行评价。就数据库的建立而言,为了提高评价的准确性及标准性,BP神经网络需要建立完善的选取设置体系,在输入层与输出层的设计应多样化,才能够保证测试评价的效果。对于普通学校来说,样本的选取量应该不低于200人。
对于隐含层神经元的点数,计算时应根据样本的选取量进行调整,基本的模型设计流程是从BP神经网络的构建开始到BP网络训练,以及最后的BP网络预测,其中最重要的是BP网络训练,本文采取的是trainlm算法,从而建立其BP神经网络模型。
2 学生数学学习能力评价
对学生进行数学学习能力评价是为了对学生的数学学习能力进行测试,帮助教师掌握学生的学习情况,以便于调整教学方法以及教学进度,让学生能够提高学习能力。评价的内容是学习思路,学习方法,学习过程及学习效果。要对这四点进行评价,首先就要确定各内容的评价标准及方式。以往的评价方式是通过测试及课堂问答,通过学生的测验成绩及回答进行分析,从而判断学生所处的学习状态,教学方法以教学进度安排的合理程度。利用BP神经网络进行评价的化,就要将各个标准程序化,将原先教师的主观评价变为网络的程序化运行,根据运行的结果对学生的数学学习能力进行判断,这就是利用BP网络对学生数学学习能力评价的理论,实际上要进行实践并不简单,BP神经网络评价的构建是难题的关键点。
3 基于BP神经网络的学生数学能力评价模型
BP神经网络评价模型的建立是由三部分组成的,最关键的就是构建BP神经网络。建立评价模型首先要做的就是对各项能力的得分率进行分析,设定个性能力的得分标准,并对其进行深入分析最后进行程序化设置。对于数学学习能力的划分方法有很多,不同的年级所划分的方法尽不相同,每一个方法都有其侧重点,这需要根据输入的相关变量进行改正,与实际情况进行整合得出准确结论。就拿某市中考数学试题来说吧,其主要是测查学生的学习思路,学习方法,学习过程及学习效果这四项能力。对学生的数学学习能力进行测试,就要把学生对这四个能力评价的相关试题得分作为BP神经网络的输入,并且要将输入数值进行数量级差异设定,从而将每种能力试题的得分做归一化处理。利用二进制,使输入数据在[0,1]之间。在这之前要有准确的评分标准,才能够得出相关结论。这就需要专家对试卷上各项能力试题的得分进行排表,便于BP网络数据设置,但在这之前需要专家对学生样本进行判断。一般样本的选择在200人为合适,所以选择的学生人数为200人。专家对这200人的试卷进行阅览从而判断出每个人每项能力的情况,看那一项是最为薄弱的,然后对所有学生的情况进行整合处理。将其中100人的成绩作为判定结果,最为薄弱的能力作为BP神经网络的期望输出参考,再利用二进制的数字进行结果表达。例如输出为0时则表示学生该项能力差,这就能够为BP网络的构成提供最基本的运行数据,为BP网络构建提供基础。此外的100人,将他们的得分情况作为好的检验样本进行输入,然后进行检验,若是期望输出与专家评价结果基本符合,则表示该神经网络可进行有效运用,对学生数学学习能力进行评价,反之则需改进。
此外,BP网络训练的设置也需要额外注意梯度的预设,其算法需要根据实际情况及时进行调整。各地学生数学?W习状态各不相同,不能够固定选择某算法。BP神经网络的验证需全面,不能以一次数据的符合情况作为验证标准,应该多次输入,对相应的输出结果进行判断。
关键词:ANN;经济学应用;发展趋势
中图分类号:F224.0 文献标识码:A 文章编号:1003―5656(2006)05―0005―07
人工神经元网络(Artificial Neural Network,简称ANN,下同)是一门活跃的边缘叉学科,研究它的发展过程和前沿进展趋势问题,对于经济学研究具有十分重要的意义。神经网络理论是用来处理巨量信息和大规模并行计算的基础,既是高度非线性动力学系统,又是自适应组织系统,可以用来描述认知、决策及控制的智能行为,其核心问题是智能认知与模拟。社会经济本身是一个动态随机的非线性系统,各种经济的、政治的、社会的因素相互作用,相互影响,传统的计量统计模型着眼于静态分析,且形式往往过于复杂不易准确掌握,或者包含了很多模糊性和混沌性的因素,不利于经济问题的精确分析。而人工神经元网络则由于其自身具有分布式处理、自组织、自适应、自学习、鲁棒性、容错性等一系列优良特性,其良好的非线性映射能力避开复杂的参数估计过程,同时又可以灵活方便地对多成因的复杂未知系统进行高精度的建模,为非线性经济系统分析研究提供新的方法。
随着对ANN研究的不断深入,其应用领域和范围也越来越广,将ANN模型用于经济领域中的识别、分类和预测等研究具有很高的实用价值。同时神经网络理论的优势及其良好的算法、模拟性能也得到了大家广泛的证实和认同。另外,对于其局限性的克服也已经有越来越多的策略和方法。
一、ANN的技术原理――以自组织特征映射网络为例
人工神经元网络旨在模拟人脑的知识获得和组织运算过程,是大量简单的神经元广泛联结而成用以模拟人脑思维方式的复杂网络系统。下面以ANN模型中较先进的,也是得到广泛应用的自组织特征映射网络为例,简要介绍神经网络模型的基本结构和算法流程。
自组织特征映射模型(Self.Organizing Feather maps,简称SOFM)是芬兰学者科荷伦(Teuvo Koho.nen)于1981年提出的。网络的拓扑结构只有两层,即输入层和竞争层(图1)。SOFM网络的工作原理是:当网络接受外界输入模式时,将会分为不同的区域,各区域对输入模式具有不同的响应特征。也就是说,特征相近的输入模式靠得比较近,差异大的分得比较开。在各神经元联结权值的调整过程中,最邻近的神经元相互刺激,而较远的神经元则相互抑制,更远一些则具有较弱的刺激作用。由此可见,自组织特征映射网络是无监督的分类方法,与传统的分类方法相比,它所形成的分类中心能映射到一个曲面或平面上,并且保持拓扑结构不变。
同其它类型的自组织网络一样,SOFM的激活函数也是二值型函数,即Y=。其算法步骤是:①初始化,从R个输入神经元到输出神经元的权值都进行随机初始化,赋予较小的随机值(0―1);②提供一个新的输入模式Xk=[X1k,X2k,…XRk];③计算输入样本与每个输出神经元之间的欧氏距离,并选取一个最小距离的输出神经元;对于输出神经元j,它和输入模式Xk之间的距离用djk表示,djk=||Xk.Wj||= ;④修改选定的神经元与邻近神经元的连接权值,对于领域外的神经元,其权系数不变Wij(t+1)=Wij(t),对于领域中的神经元,其权系数的修正按下式执行,Wij(t+1)=Wij(t)+y(t)[Xi(t).Wij(t)],其中0
二、人工神经元网络(ANN)在解决经济问题中的优势及特点
有学者已经用人工神经元网络解决诸如会计、审计、金融(破产预测、信誉评估、股票预测、汇率预测、房地产价值评估等)、经济管理(区域经济增长仿真、国家外债管理模型)、决策支持(银行信用风险评估、洪水灾害风险预测模拟等)、市场划分(Segments)和生产预测(粮食生产预测、铁路客运市场分析)等方面的问题。由于人工神经元网络具有一系列独特的优良性质,与传统计量方法相比又具有明显的算法优势,可将其用于经济学研究中的识别、分类、预测、经济系统仿真和模拟等方面。目前它的发展已经与传统的计量模型等统计分析方法并驾齐驱,甚至于在前述领域的应用中比传统研究方法更胜一筹。
1.ANN模型具有分布式存储、自组织、自适应(adaptability)、自学习、鲁棒性(robustness)和精确性(accuracy)等优良性质,能完成对环境的适应和对外界事物的有效学习。神经元之间的连接强度也具有一定的可塑性,网络可以通过学习和训练进行自组织以适应不同的信息处理的要求。在运算中,知识的获取采用“联想”的方式获得最优匹配解,信息的输出能经过对记忆的处理获得正确和完整的信息。正是由于网络的这种容错性和联想记忆的功能,使人工神经元网络呈现出很强的鲁棒性。在经济研究中可以充分利用神经网络的这些特性建立与研究对象相适应的应用模型,经济生活中涉及的预测预报问题、金融决策与信用评价问题以及分类与决策等问题都可以运用神经网络来解决。比如用BP神经网络预测矿区环境污染的经济损失问题[2],股票市场行情分析预测等。[3]
2.从理论上看,人工神经元网络具有逼近任意连续映射的能力,即可以充分逼近任意复杂的非线性关系,且具有很好的泛化能力(generalization)。比如,在解决区域经济问题中与其它传统定量分析方法相比较,它能以一个多层前馈型网络来刻画一个高度复杂、高度非线性的映射系统(比如区域经济系统),进行经济系统仿真,通过其任意逼近能力得到变量之间的复杂关系,能够考虑变量之间的动态相互影响及作用,并将变量的随机性和不确定性等影响降到最低。另外,经济数据变量常常是处于经常变动环境中的,因此,ANN模型能够依靠它的泛化能力,通过不断的再学习,能够基于经验对知识进行累积、存储和模式识别,并能不断反映和适应新环境,学到隐含在样本中的有关环境本身的内在规律性。因此,它与传统的统计分析方法相比较,具有更高的精度(accuracy)、较低的预测风险和较小的误差。在经济研究的实践中,人们建立的汇率预报模型(即前向组合神经网络模型)不仅能准确地拟合汇率的过去值,而且能较精确地预报汇率的未来趋势,预报的结果比统计方法优越。在经济实践中,与计量模型相比,用人工神经元网络模型来预测通货膨胀率、经济周期、电价的边际价格、期货利率以及居民人均收入等准确率更高,效果也更好。因此,人工神经元网络具有很多传统分析方法所不具有的优势。
3.ANN模型是一个复杂的非线性动态系统,有很强的容错性。ANN模型很容易处理环境信息十分复杂、知识背景不清楚的问题或不完整的、模糊不确定或无规律的数据。尤其在信息不完备的情况下,用人工神经元网络能够很容易地解决这些问题。它在模式识别、方案决策、知识处理等方面具有很强的能力,可学习和自适应不知道或不确定的系统。比如Elman神经网络是一种具有部分反馈的神经网络,它可以很好的模拟动态系统,特别适用于模拟季节性和循环变动的对象。像股票市场就是一个典型的循环变动的动态系统,就可以用Elman网络预测股市动向,而失业问题是一个具有季节变动的系统,El.man神经网络同样可以用来预测模拟我国的失业问题。再以技术创新扩散为例,由于技术创新扩散问题非常复杂,涉及众多动态的、不确定性的因素,且系统内各因素之间、扩散系统与扩散环境之间存在着错综复杂的关联、相干、互动、反馈、自组织等效应关系,数据的搜集与整理存在困难,且很多数据信息是模糊不确定和无规律性的,在这种情况下,给人们认识和控制扩散过程带来了巨大困难,而以往所采用的方法存在较大的局限性,不能充分包含、反映扩散中的各种非线性关系,难以满足对技术扩散过程进行预测、控制和优化的应用需要,而建立技术创新扩散的人工神经元网络模型则可以很好地解决该问题,并且经过实践检验效果要优于传统的统计分析方法。
4.由于人工神经元网络在结构上采用大规模并行分布处理方法,信息处理是在大量单元中平行而又有层次地进行,这就使得快速进行大量运算成为可能。神经网络的并行性使得它能够考虑变量之间的相互影响及作用,提高模型拟合的精度。以上文提到的技术创新扩散问题为例,神经网络的这一特性就能够使它准确描述技术创新扩散的内在动因及发展变化规律。另外,由于技术创新扩散涉及众多因素,数据的运算量是非常巨大的,如果采用传统的统计分析方法很费时费力,并且结果不是很理想。而运用人工神经元网络则能够比较容易的解决这一复杂问题,并且能得到令人满意的结果。
综合以上认识,我们认为将人工神经元网络用于研究经济领域中的模拟、识别、分类和预测等是非常具有前景和实际应用价值的。
三、ANN网络模型的主要局限性及其克服策略与方法
1.ANN网络模型的主要局限性
人工神经元网络在解决经济问题中的有效性和实用价值已经被人们广泛接受并越来越受到重视,但它自身也存在一些技术上的缺陷和不足,这主要表现在以下两个方面。
(1)ANN网络模型是“暗箱”操作,也就是说它的理论基础不强,解释能力较弱。[4]
(2)网络结构设计和参数的选择缺少相应的理论支持,通常依赖于经验选择,基于梯度的学习算法常常会导致网络收敛于局部极值点。
2.克服策略与方法:
(1)对于存在的“暗箱”问题,如果希望对某些未知样本正确率反映较高,或者说推广能力更强,则应该在未知样本附近多选一些训练样本。网络输出的可信度与方差有关,如果输入与权值间的方差越小,则可信度越高。
(2)网络结构问题和参数选择问题是一个综合性的问题,它应满足多种不同要求。由于网络结构设计没有固定的可遵循的模式,有许多参数要靠经验选择,并经试验比较,比如隐层数、隐单元数和连接方式等。而在网络训练过程中也有一些参数要选择,如初始权值,学习步长,动量项系数等。要训练出一个实用网络常常需要大量的试验比较,才能从中选择出效果最好的。我们认为一个较好较便捷的方法是先咨询有关专家,同时要考虑所研究问题自身的特殊性,然后再设计网络结构及训练网络,当然,也有人提出,只保留效果最好的并非最佳方案,更好的方法是用各个网络的加权组合。规模大的网络不但学习时收敛较慢,且更易于避免陷入局部极小。通常情况下,训练样本有限,所以把推广能力作为主要要求,强调选择能达到要求的最小网络,当然这不是唯一的标准。以BP神经网络在房地产评估中的应用为例,通常情况下BP神经网络能使待判别样本分类正确率达到90%以上,但仍然存在误判训练样本,特别是当训练样本很多的情况下更是如此。其原因主要在于网络的拓扑结构设计不合理,收敛速度缓慢,预定选取的允许目标误差不够小等。这时应考虑房地产作为较特殊的商品,影响其价格的主要因素有哪些,然后对网络的层数、输入输出节点数、隐层数进行不断的调整和改进。最后,经过有关学者的研究,如果把距离算法与BP算法相结合,在对网络识别系统结构进行改进和调整之后,能够使网络分类的正确率提高到100%,相应的估价误差就从1.7%降低到0.3%。[5]
(3)ANN模型与多种分析方法融合共同解决经济问题会达到较理想的效果。比如可以与统计分析方法、人工智能方法、专家系统以及粗糙集理论(Roughset)相结合,各种技术之间相互取长补短,建立集成模型或混合系统其结果会更有效,且这种有效性不是各单部分之间简单相加能够比拟的。比如Taha等人将判别分析与回归分析方法应用到ANN模型中,结果提高了合同债权结构的预测精度。[6]Lee.Han和Kwon使用了三种混合的ANN模型来预测破产,增强了预测的精度和适应性。[7]以ANN与专家系统结合运用为例,Kuncicky等人就总结出了4种方法:第一种是连接专家系统(connectionist expert system)模型,将全部的或部分的专家系统功能和一种ANN相结合;第二种是符号连接模型,即用符号结构约束神经元网络的构建,然后用到高层认识任务中;第三种是模块化系统模型,将专家系统和神经网络以模块化的形式用于解决较大的问题;第四种是转化模型,将在专家系统中获得的知识传输给神经网络。[8]这些结合不仅允许ANN应用到决策的各种层次,而且大大提高了网络本身的质量。[4]以预测成都市居民用水量为例,这里采用了自组织方法、改进的算法和两种方法融合――基于自组织方法的神经网络模型三种方法分别进行了预测(结果见表1),从表中我们可以明显地看出两种方法组合建立的神经网络模型明显优于其他方法,且预测精度很高。[9]
四、人工神经元网络模型的应用实例分析
人工神经元网络有多种网络模型,就常用的RBF网络与BP网络相比较而言,基于正则化理论的RBF网络学习速度较快,无论网络的函数逼近能力、模式识别能力以及分类能力都优于BP网络,因此这里采用RBF网络来计算区域可持续发展度。要运用RBF神经网络模型预测区域可持续发展能力状况,可以按以下几个步骤进行:①构建反映区域可持续发展的相关指标(由于区域可持续发展能力评估指标的选取是一个非常复杂的过程,限于讨论的主题及篇幅,具体过程略),利用相关分析方法按照一定的标准(95%)剔除相关性强的指标,同时去除难以采集数据的指标。最后,我们把区域可持续发展能力预测指标细分为以下32个(见表2)。②采集相关指标的数据。采集数据的年份要尽可能的多一些,这样训练出来的网络模拟和预测能力会更强一些。③构建RBF区域可持续发展能力预测网络模型(见图2)。④将采集到的相关指标数据按照公式(1)(对于越大越好的指标)和公式(2)(对于越小越好的指标)进行无纲量化处理。
Zij=yij/ymaxj(1)
Zij=yminj/yij (2)
(i=1,2,…,32;j=1,2,…,6。 ymaxj 和yminj 分别为R指标的最大值和最小值)。⑤RBF网络的学习与训练。将选出的指标当期值归一化处理后的数据作为网络的输入,下期值作为其对应的期望输出,送入如图3所示的RBF网络中进行训练。⑥利用MATLAB语言中的人工神经元网络工具箱函数newrbe进行相关的程序编制和计算。
下图是按照上述RBF神经网络模型对西安市做的一个区域可持续发展度预测图(图4)。当然,如果我们要用其他传统的计量方法来解决这个问题,其运算过程则会非常复杂和繁琐,最终结果可能并不理想。
五、人工神经元网络的发展
趋势及其经济学应用前景
人工神经元网络是一个应用范围十分广泛的边缘叉学科,在各个工程领域均得到成功的应用。展望21世纪中叶,人工神经元网络理论研究将可能在智能和机器关系问题、神经计算与进化计算以及神经网络结构和神经元芯片等重大问题的研究方面会有重大突破,而其自身日益强大的外向性、扩展性以及良好的工具性必将进一步带动所有相关学科研究的突飞猛进,甚至产生质的飞跃。目前,大多数用于经济领域的ANN模型多来自科研机构,其产业化的程度并不高,把人工神经元网络应用于经济领域仅始于20世纪90年代,在国内也仅处于起步阶段,特别是比较成熟的模型并不多见。人工神经元网络理论自身的发展必然会给经济学研究插上腾飞的翅膀,并将可能成为继数量经济学、计量经济学之后经济学研究的一个重要领域。同时人工神经元网络理论也将必然为经济学研究提供强有力的分析工具。以上本文通过对神经网络模型的简要分析,概述了其用于经济学领域的优点和不足,并作了应用模型研究的尝试――通过对区域可持续发展能力水平的精确量化度量,能够为区域可持续发展以及制定区域经济政策提供科学的决策依据。运用神经网络模型对经济学问题进行深入的研究具有十分重要的理论和实践意义。
参考文献:
[1]王艳等.基于ANN的山东省可持续发展水平的区域差异[J].资源开发与市场,2004,(2).
[2]郝全明,李桂荣.人工神经网络在矿区环境污染经济损失预测中的应用[J].黄金,2003,(3):47.50.
[3]叶东毅,刘文标.个股走势模式分类的RBF神经网络方法[J].福州大学学报(自然科学版),2000,(4):12.15.
[4]张秀艳,徐立本,王萍,马海英.用人工神经网络解决经济问题的有效性和局限性[J].吉林大学社会科学学报,2001,(6):39.45.
[5]杨黎萌,刘开第.BP神经网络在房地产估价中的应用[J].河北建筑科技学院学报,2004,(2):105.109.
[6]M.A. Taha, S.C. Park, J. S. Russell.Knowledge.Based DSS for construction contractor prescreening[J]. European journal of operational research,1995, (1):35.46.
[7]K. C. Lee, I. Han , Y. Kwon. Hybrid neural network models for bankruptcy predictiond[J].Decision support system, 1996, (18):63.72.
[8]D.C. kuncicky ,S.I. Hruska,R.C. Lacher. Hybid systems: the equivalence of the rule.based expert system and ar.tificial neural network infetence[J]. International journal of expert systems, 1992,(3):281.297.
关键词:
中图分类号: TP183 文献标识码: A 文章编号:2095-2163(2011)03-0085-03
A Semi-supervised Learning Algorithm of Dynamic Samples
based on Self-organizing Process Neural Networks
WANG Dandan, LIU XianDe
Abstract: Aiming at the problems of time-varying signal pattern classification and effective using of unmarked sample information, a semi-supervised learning algorithm of dynamic sample set based on self-organizing process neural networks is proposed in the paper. The self-organizing process neural network model based on competitive learning rule and supervised method are built respectively using acquired marked and unmarked process function sample signals, and it can label respective classes of dynamic samples through making use of the self- organizing characteristics. Information processing mechanism of the algorithm is analyzed and specific implementation steps are given in the paper. Taking identification of water flooded status in oil field development as example, experiment results prove the effectiveness of the method.
Key words:
0 引言
基于机器学习的信息处理技术是目前复杂系统数据分析和利用问题中一种有效的处理方法和工具。机器模型的建立一般需有足够多的满足系统状态变化特征规律描述、高质量的样本数据[1,2]。但在实际问题中,特别是在一些非线性动态系统的情况下,由于采样条件的限制或代价高昂,往往难以得到足够多的、有确定标识的样本;而另一方面,在有些情况中,又可以获得大量未标记的样本数据。因此,如何利用标记及未标记的样本信息、丰富学习样本数量,是建立智能模型和提高模型泛化能力的关键问题之一[3]。
针对非线性动态系统未标记过程函数样本的标记和信息的有效利用问题,本文提出了一种基于自组织过程神经网络[4]的动态样本半监督学习算法。首先,按照基于竞争学习规则和有教师示教方法,分别建立两种信息处理机制的自组织过程神经网络动态信号分类模型,实现对过程函数样本集合的分类;然后,按照基于分类结果的标记策略,实现对未标记过程样本的标识,达到增加样本规模和多样性的目标。以基于测井曲线的水淹层样本分类标记和油层水淹状态判别为例,实际应用结果验证了算法的有效性。
1 自组织过程神经网络
自组织过程神经网络(Self-Organization Process Neural Network, SOPNN)是一种通过竞争学习机制实现对时变信号处理的动态神经网络模型。SOPNN由时变信号输入层和过程神经元组成的竞争层构成,网络自适应提取输入函数所隐含的模式特征,并对其进行自组织,在竞争层将作用结果表现出来。
设SOPNN输入空间为(C[0,T])n,[0,T]为信号输入过程区间;系统输入函数为X(t)=(x1(t),x2(t),...,xn(t)),输出为代表模式类别的数值量,网络拓扑结构如图1所示。
图1中, wij(t) (i=1,2,...,nj=1,2,...,m)为连接权函数, yj(j=1,2,...,m)为网络输出。
1.1 竞争学习规则
设学习样本集为X1(t),X2(t),...,Xk(t),Xk(t)∈(C[0,T])n。定义第k个输入样本向量Xk(t)与竞争层神经元节点的连接权函数向量Wj(t)的相似系数为:
式(1)中,W(t)=(w(t),w(t),...,w(t)),j=1,2,...,m。
设具有最大相似系数的节点j在竞争中获胜,即j满足:
r=r (2)
对于输入样本向量X(t),若节点j在竞争中获胜,则调整w(t),使权函数W(t)通过算法调整向X(t)方向移动,最终使获胜过程神经元j的输出表示X(t)所代表的模式类别。
1.2 有监督的学习算法
当训练集中各样本的模式类别已知时,可采用有监督的学习算法。对样本函数X(t),由式(1)计算r,按式(4)选择获胜的过程神经元j。如果获胜过程神经元j是X(t)的恰当分类,其权值修正公式为:
2 基于SOPNN的动态样本聚类
半监督学习是处理有大量无标记样本和少量有标记样本时的一种学习分类方法,适用于大量数据不断产生、同时对这些数据不容易进行标记或若标记则花费代价很大的情形[5,6]。对于过程采样函数样本情况,基于半监督学习的动态函数样本分类问题可描述如下:
设定动态函数样本集S=L∪U,其中,L=(x1(t),y1),(x2(t),y2),...,(xl(t),yl)?奂X(t)×Y是有标记样本集,U=xl+1(t),xl+2(t),...,xN(t)?奂X(t)是未标记样本集,这里,xi(t)∈C[0,T],[0,T]为信号采样区间,yi∈R。本文半监督学习的问题是基于有标记样本集L,构造基于SOPNN的时变函数模式分类器。当样本模式类别数已知时,样本集经算法分类后,以标记样本的类别代表分组类别,同组中的未标记样本则与标记样本的类别一致;如果所分的一类中包含两个或两个以上的不同类别标记样本,则分类失败。这样,可通过每个分类中已标记的样本信息实现对未标记样本集U中的样本的类别标识。
设在实际问题中获得了系统在运行状态下的N个时变采样信号,其中,l个为有标记样本,N-l个为未标记样本。以下分三种情况讨论:
(1)若已知确定的样本类别数,且每个类别中均包含了已标记的样本,则采用有教师示教的SOPNN算法对未标记样本进行标识;
(2)若已知确定的类别数,但有类别中未包含已标记样本,则采用竞争型SOPNN算法进行未标记样本的标识;
(3)若样本的类别数未知,则可基于样本集S=L∪U,先采用近邻传播算法[7]确定样本的类别数,然后再用有教师示教或竞争学习算法对未标记的样本进行标识。
3 在测井水淹层判别中的应用
油层水淹状况识别是油田开发过程中一项十分重要而又复杂的工作。水淹状况判别依据的是一组反映地层地球物理性质随深度变化的连续测井曲线的形态和幅值特征[8],而测井曲线可看作是随深度变化的一个连续过程信号。传统判别方法是在取心井资料分析基础上,建立油层水淹知识库,再通过人机交互对非取心井进行解释。实际工作中,水淹层判别主要依据SP、Rt、Rmd等三条测井曲线和小层厚度h共4个变量;油层水淹程度分为未水淹、弱水淹、中水淹、强水淹4个等级。
在油田实际开发中,由于钻井过程中获取岩心技术要求高、费用昂贵,故每个油田区块一般只有少量的取心井,但所有钻井都进行了物理测井,即存在大量未标记的小层测井曲线样本。本文研究的油田开发区块有3口取心井,包括4类水淹状况、共35个有标记水淹程度的测井曲线样本,其中,14个为强水淹、9个为中水淹、7个为弱水淹、5个未水淹。在区块中另选4口具有典型地质特征的非取心井,选择出43个有代表性的未标记小层测井曲线样本,并作归一化处理[4]。选用取心井4类35个有标识的小层样本组成训练集。SOPNN的拓扑结构确定为:3个时变信号输入节点,4个过程神经元竞争层节点,输出为水淹程度,对应于0,1,2,3。本实例为有教师示教的情况,4个过程神经元节点的输出分别对应4种水淹状况。SOPNN迭代372次后收敛。用训练完成的SOPNN对未标记的43个样本进行类别标识,结果为17个标记为强水淹、14个为中水淹、9个为弱水淹、3个为未水淹,判对率为80.3%,较大提高了测井水淹层解释精度。
4 结束语
本文针对非线性动态系统未标记时变信号样本的标识问题,建立了基于自组织过程神经网络的半监督分类标记算法。该方法利用已标记样本构建自组织过程神经网络分类模型,可自适应实现未标记样本的分类标记,增加反映系统过程模态变化特征样本的多样性。文中提出的方法对其他机器模型学习算法和训练样本集的构建也具有一定的借鉴意义。
参考文献:
[ 1 ] 冯乃勤,王芳,邱玉辉. 提高神经网络泛化能力的研究[J]. 计算
机工程与应用, 2006, 4: 38-41.
[ 2 ] WAN W S,MABU S,SHIMADA K,et al. Enhancing the gen-
eralization ability of neural networks through controlling the h-
idden layers. Applied Soft Computing, In Press, Avaiable On-
line,2008.
[ 3 ] 江学军,唐焕文. 前馈神经网络泛化性能力的系统分析[J]. 系统
工程理论与实践,2000,8:36-40.
[ 4 ] 许少华,何新贵,李盼池. 自组织过程神经网络及其应用研究[J].
计算机研究与发展,2003,40(11):1612-1615.
[ 5 ] 罗进,周学君. 半监督学习中非标记数据的利用[J]. 湖北大学学
报,2008,30(1): 8-11.
[ 6 ] BELKIN M,NIYOGI P. Semi-supervised learning on riemanni-
an manifolds[J]. Machine Learning , 2004,56:209-239.
[ 7 ] 肖宇, 于剑. 基于近邻传播算法的半监督聚类[J]. 软件学报, 2- 008,19(11):2803-2813.
20世纪70年代末80年代初,EDI在美国使用,标志着电子商务的开始,并由此得以迅速普及。2000年7月美国商务部发表的《2000民工数字经济报告》统计,截止2000年6月底,全球使用因特网人数达到3亿,比1999年增加了80%.而且2003年电子商务占世界贸易总额的比例将达四分之一。在我国,电子商务是20世纪90年代初开始,但发展极为迅速,据国家最新统计,2003年我国网民已达7000万,而且现在还将继续以几何级数方式增加。
网络经济的迅猛发展使社会发生很大的变化,让我们的生活更加丰富多彩,但同时我们也面临着前所未有的问题,随机性和复杂性充满了这个世界:
1.边际收益递增
边际收益递减是经济学边际革命的重要成果之一,但是由于知识信息具有可共享性、外溢性、扩散性,在以知识为基础的经济领域边际收益递增取代边际收益递减成为新经济的第二大规律,正在引发经济学新的革命,经济发展流程正因此而发生转折性的重大变化。
2.免费的午餐
按照传统的供求关系理论,厂商的边际成本就是产品的价格。但在网络经济下,例如互联网、软件开发,硬件制造这些新兴产业生产的是数字产品或数字化产品。这种产品的最大特点就是可以复制,那么它们的边际成本很低,甚至几乎等于零,所以价格也几乎等于零,形成了极高的固定成本和极低的边际成本。因此在网络社会里,我们经常有“免费的午餐”,但这种现象也给供求理论提出了极大的挑战。
3.投入与输出不成正比
俗话说“种瓜得瓜,种豆得豆”,但现在我们看到更多的是投入很多,但得到的却很少,甚至非但得不到,还要再赔钱。网站的建设就说明这一点,虽然电子商务能极大地减少交易费用和交通运输的负担,提高企业的整体经济效益和参与世界市场的竞争能力,但企业建立的网站大多没有起到这样的作用,而且目前企业依然沿用着传统的运营方式,在大多数人眼中,网站是“烧钱”的事情。
4.非线性增长
与传统经济和传统产业相比,新经济和高科技产业更多地呈现非线性增长的态势,如IT产业、电子商务和网络经济都不同程度上表现出非线性爆炸式增长的特点,电子商务更以年均翻一番的超常规速度成长。
由上可以看到,电子商务作为信息技术发展的产物,不但给人类社会生产方式、工作方式和生活方式带来影响,同时也对传统的社会科学理论产生巨大的冲击。也就是说,网络使我们的生活更加丰富多彩的同时,也使我们的生活更加复杂化,产生的很多现象已不能被传统的理论完全解释。
以经济学为代表的社会科学理论在解释电子商务中的现象方面显得力不从心,原因是现代网络社会中,市场已不是那个市场,厂商也不是那个厂商,而消费者更不是那个消费者了——在信息时代,由于没有时空的界限,地理优势对于企业已失去了作用,在网络中所有的企业处于同一起跑线上,而且真正可以做到“酒香不怕巷子深”:由于信息的爆炸性增长,我们的生活每天都有很多意想不到的事情发生等等。所有的一切都说明:如果还按照过去传统的思维(线性思维),那么根本无法解释当代网络社会出现的许多现象,只有用一种新的思维方式才能获得广阔的天空!——这就是非线性理论存在的现实意义。非线性理论的研究为我们开辟了很好的电子商务理论研究路径。
二、非线性理论
非线性问题是在20世纪下半叶出现的,并不是一个新的科学概念。由于在确定论的系统中发现了混沌现象,极大地激发了人们探索自然界和人类社会中存在的各种复杂性问题的热情,同时也逐渐改变了人们观察周围世界的思维方式。所以非线性科学已成为当今世界科学的前沿与热点,它涉及自然科学和人文社会科学的众多领域,是人类认识自然的一次飞跃,具有重大的科学价值和深刻的哲学方法论意义。它标志着人类认识自然由线性现象进入非线性现象。
那么究竟什么是非线性系统呢?非线性系统是相对于线性系统而言的,是对线性的否定,线性是非线性的特例。简单来说,“线性系统”就是那种“一分耕耘,一份收获”,“种瓜得瓜,种豆得豆’的系统,而“非线性系统” 往往会有“白吃的午餐”,或是“赔了夫人又折兵”的状况。线性系统结构具有高度规律性,被人类研究与应用的较早,而非线性系统却复杂得多,研究的困难度较高,这就是 “非线性系统’丰富的地方。我们常常听到的“混沌”、“蝴蝶效应”,“碎形”、“复杂”、“湍流”甚至是“类神经网络”等都是非线性系统的重要领域与课题。
在线性系统中,表现出两种性质:一是叠加原理成立,即部分之和等于整体,线性系统的方程遵从叠加原理,即方程的不同解加起来仍然是该方程的解。叠加原理成立说明该系统的子系统间没有非线性相互作用。二是指系统内物理变量间函数关系是直线,变量间的变化率是恒量,这意味着函数的斜率在其定义域内处处存在且相等,变量间的比例关系在变量的整个定义域内是对称的,即成正比关系。
在非线性系统中,叠加原理失效,非线性方程的两个解之和不再是方程的解,而且变量之间的函数关系不是直线。例如直线是曲线的特例,在非线性程度较强的情况下,即子系统间的相互作用较强,它对各子系统的性质及系统整体的性质有不可忽略的贡献时,线性叠加原理就不适用了,整体的性质就不是各部分性质的线性叠加之和了(如强子相互作用的结合能与强子自身的能量可比的情况,国际贸易与国内生产总值可比的情况,这时部分间的相互作用是不可忽略的),从而就会产生整体大于部分之和或整体小于部分之和的结果。
非线性具有多值性。例如,100家成功的企业有100种甚至更多的管理方法,这仅仅是针对传统企业而言,若对于网络企业来讲,一个企业可能会有多种管理方法。
非线性具有有限性,抽象地说,有限的事物相对于无限的事物而言丧失了许多对称性,因而作用于其上的操作及结果都可能对应着由有限性直接导致的非对称性。信息的不对称性说明网络中的个体是有限的,而信息是无限的,所以才存在信息的不对称性。
对于处理线性问题,已经有一套行之有效的方法,例如傅里叶变换、拉普拉斯变换等等。
而对于非线性问题,长期以来科学家往往束手无策,因为非线性具有复杂性,目前还没有有效的方法,只能具体问题具体分析。但也应看到,在这些极为复杂的现象背后实际上也存在着某种规律性。非线性科学的任务就是要透过这些无序的复杂现象去揭示隐藏在现象背后的规律性的东西。
三、非线性理论在电子商务中的应用
随着现代社会的发展,兴起了许多交叉学科,电子商务即是其中一例。电子商务是一门关于管理、经济、计算机和法律等的新兴交叉学科。交叉学科的特点是随机性和复杂性,而非线性理论对于交叉学科的研究提供了广阔的思路,所以将非线性理论应用于电子商务是有现实意义的。
1.电子商务具有非线性特征
电子商务是网络经济下的产物,而网络世界本质上是非线性的。首先,最直观的来说,网络永远都是曲线而非直线,其次,在电子商务的链条中,企业、市场、消费者行为等也都表现出非线性:
(1)在网络经济条件下,个性消费的回归,消费需求的交叉性等使消费者行为表现出非线性特征。
(2)在电子商务市场中存在两个基本法则:一是摩尔定律(More’s law):计算机硅芯片的功能每18个月翻一番,而价格以减半数下降;以传统的理论,产品的功能增加,其价格应该增加,但该定理刚好相反,说明在网络社会中,电子商务市场表现出非线性特征。二是梅特卡夫法则(Metcalf law):网络价值等于网络节点数的平方。或者,网络价值随着网络数量的增加而呈指数增加。这也说明在网络社会中,叠加原理不成立,节点之间不存在线性相互作用。
(3)由于市场和消费者是非线性的,所以企业也同样是非线性的。
2.非线性科学的普适类适用于电子商务
非线性科学研究对象不是这些非线性问题本身,而是它们的共性,即所谓的非线性普适类,并且在此基础上建立了非线性科学的三大理论。
(1)混沌(chaos)。什么是混沌运动呢?在确定性系统中存在着对初值极为敏感的复杂运动形式就叫做混沌运动。混沌揭示的有序与无序的统一、确定性与随机性的统一。
在某些牛顿力学方程所描述的运动中,如果精确地从同一点出发,得到的仍是同一条确定的轨道,然而,只要初始条件有无论多微小的改变,其后运动就会失之毫厘、差之千里,变得面目全非。用一个模型来描述:在一个T型架上,挂着三个圆,无论你怎样转动T型架,三个圆永远没有相同的轨迹,因为你不可能保证每次转动都精确地从相同点出发,这些运动的结果可能同掷骰子所得的结果一样,是随机和不可预测的。
随着网络技术的发展,经济全球一体化推动了电子商务的迅速普及,微观市场的微小变动,就能引起整个宏观经济体系中一场“龙卷风”似的经济波动。
(2)自组织现象。是指自然界中自发形成的宏观有序现象。如自然界中大量存在的同时也是理论研究较多的典型实例如:贝纳德(Beinard)流体的对流花纹,贝洛索夫—扎鲍廷斯基(Belousov-Zhabotinsky)化学振荡花纹与化学波,激光器中的自激振荡等。
耗散结构是自组织现象中的重要部分,自组织耗散结构理论可概括为:一个远离平衡态的非线性的开放系统 (不管是物理的、化学的、生物的乃至社会的、经济的系统)通过不断地与外界交换物质和能量,在系统内部某个参量的变化达到一定的阈值时,通过涨落,系统可能发生突变即非平衡相变,由原来的混沌无序状态转变为一种在时间上,空间上或功能上的有序状态。这种在远离平衡的非线性区形成的新的稳定的宏观有序结构,由于需要不断与外界交换物质或能量才能维持,因此称之为“耗散结构’ (dissipative structure)。
同样地,企业和个体都是一个开放系统,它们的发展就是一个通过与外界不断地交换物质和能量,从量变到质变,从无序到有序,从非平衡态到平衡态的演变过程。
(3)孤立子(soliton)。非线性系统的相互作用产生的稳定而持久的动态过程是自然界广泛存在的一类极为重要的现象即拟序结构,一直受到科学家的重视。孤立子是拟序结构的最纯粹的形式。
孤立子理论无论是对于非线性科学来说,还是对于整个科学体系来说,都具有重要意义。孤立子是自然界中普遍存在的现象。如木星的红斑旋涡、用隧道电子显微镜成像方法发现的晶体中的电荷密度波、在小尺度湍流环境中长期存在的有序大尺度组织、神经元轴突上传递的冲动电信号、大气中的台风、激光在介质中的自聚焦、晶体中的位错、超导体中的磁通量等。社会经济系统中也广泛地存在着非线性相互作用,由非线性机制产生的孤立子,无论其现象还是本质,都可能启发我们更好地理解某些社会经济现象,如社会财富、社会权利等的稳定集中,某些社会意识等的长时间稳定传播。
孤立子深刻地反映了非线性系统相干结构中惊人的有序。它为我们提供了一种从稳定性角度考察事物的新方法。
电子商务发展为什么有很大的阻碍?在当今社会中,传统的经营方式仍占主导地位。比如,经营者宁愿靠传统的人情关系来发展企业,而不实现电子商务,人们更喜欢传统购物方式,而不愿意通过网上购物,这种观念意识就象孤立子一样还将持续稳定地传播一段时间。孤立子理论可以为我们研究如何改变这种或类似这种的社会问题提供解决的途径。
(4)元胞自动机理论(cellular automata)。生物体的发育过程本质上是单细胞的自我复制过程,50年代初,计算机创始人著名数学家冯·诺依曼(Von Neumann)曾希望通过特定的程序在计算机上实现类似于生物体发育中细胞的自我复制,为了避免当时电子管计算机技术的限制,他提出了一个简单的模式。把一个长方形平面分成若干个网格,每一个格点表示一个细胞或系统的基元,它们的状态赋值为0或1,在网格中用空格或实格表示,在事先设定的规则下,细胞或基元的演化就用网格中的空格与实格的变动来描述。这样的模型就是元胞自动机。
80年代,物理学家、计算机科学家对元胞自动机模型的兴趣大增,原因是这类简单的模型能十分方便地复制出复杂的现象或动态演化过程中的吸引子、自组织和混沌现象。一般来说,复杂系统由许多基本单元组成,当这些子系统或基元相互作用时,主要是邻近基元之间的相互作用,一个基元的状态演化受周围少数几个基元状态的影响。在相应的空间尺度上,基元间的相互作用往往是比较简单的确定性过程。
根据元胞自动机理论,在一维模型中,是把直线分成相等的许多等分,分别代表元胞或基元;二维模型是把平面分成许多正方形或六边形网格;三维是把空间划分出许多立体网格。那么,在研究电子商务中,我们可以把复杂的商务链条分解成许多简单的直线链。就像当初科学家将两台计算机连接在一起,后来将几台甚至更多的计算机连接在一起,一直到现在的无数台连在一块,构成了现在的互联网世界,计算机之间的相互作用造成了现在网络世界的复杂性,如果我们将电子商务链条看作是由最简单的商务链条形成的,而简单的直线商务链具有确定性,那么这种方法对于研究电子商务规律性很有帮助。
(5)神经网络(neural network)。神经网络就是通过对人脑的基本单元—神经元的建模和联结来探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。
神经网络的主要特征是:大规模的并行处理和分布式的信息存储,良好的自适应、自组织性,以及很强的学习功能、联想功能和容错功能。与当今的冯·诺依曼式计算机相比,更加接近人脑的信息处理模式。
在未来,应建立一种具有神经网络功能的社会经济网络,使信息处理象人脑一样迅速、及时,并且能够通过学习进行自我调整、具有自适应能力,只有这样才能使电子商务发展起来。
企业也是如此,因为企业本身处于社会经济大网络之中,所以在企业内外部建立神经网络商务链才能生存。现在类似的有企业内部ERP管理、企业的内外部供应链等等。
3.非线性问题可以转化成线性问题
在理论上,一些非线性问题,可以通过数学变换而转化为线性方程来研究。如非线性的KdV方程通过散射反演方法化为线性的可积方程,从而求出了精确的解析解,一些非线性不强的问题,可用线性逼近方法将其转化为若干线性问题来求近似解,这是已在各门学科中广泛采用并相当有效的方法。事实上,寻求电子商务规律的过程就是由非线性向线性过渡的过程。
四、总结
1.电子商务本身是一门涉及到管理、经济、技术和法律等方面的交叉学科,而当今研究热点—非线性科学的突出特点就是交叉性和复杂性,所以用非线性理论来解释电子商务是科学的。
2.非线性问题可以转化成线性问题,使我们看到复杂的非线性问题能够有确定性结果,所以用非线性模型来研究电子商务也是可能的。
3.随着全球经济一体化,网络技术的发展使电子商务飞速前进,但同时也使我们这个社会更具复杂而不可捉摸。在社会和我们生活当中常常发生很多“意想不到”的事情,但当我们用非线性的观点来思考这些问题时,就会感到豁然开朗!
参考文献:
1.Jackson,E.Atlee,Perspectures of nonlinear dynamics,Cambridge University Press,1989.
2.P.G.Drazin and R.S.Johnson, “Solitons: an Introduction”,Cambridge University Press,1989.
3.伊·普里戈金:《从存在到演化:自然科学中的时间及复杂性》,上海科学技术出版社,1986年版,
4.张本祥:《社会科学非线性方法论》,哈尔滨出版社,1997年版。
5.魏一鸣;“复杂性科学”,《中国科普》,2002年第11期。
6.张本祥孙博文马克明:“非线性的概念、性质及其哲学意义”,《自然辩证法研究》,1996年第2期。
作为一种新经济的网络经济,与以往的传统经济相比,有着受信息网络种种特点的影响而形成的诸多特点:
1.网络经济是全天候运作的经济。由于信息网络每天24小时都在运转中,基于网络的经济活动很少受时间因素的制约,可以全天候地连续进行。
2.网络经济是全球化经济,由于信息网络把整个世界变成了“地球村”,使地理距离变得无关紧要,基于网络的经济活动把空间因素的制约降低到最小限度,使整个经济的全球化进程大大加快,世界各国经济的相互依存性空前加强了。
3.网络经济是中间层次作用减弱的“直接”经济。由于网络的发展,经济组织结构趋向薄平化,处于网络端点的生产者与消费者可直接联系,因“产销见面”而使中间层次失去了存在的必要性。当然,这并不排除因网络市场交易的复杂性而需要有各种专业经纪人与信息服务中介企业。
4.网络经济是虚拟经济。这里所说的虚拟经济不是由证券、期货、期权等虚拟资本的交易活动所形成的虚拟经济,而是指在信息网络构筑的虚拟空间中进行的经济活动。经济的虚拟性源于网络的虚拟性。转移到网上去经营的经济都是虚拟经济,它是与网外物理空间中的现实经济相并存、相促进的。培育和促进虚拟经济的成长,已成为现代经济发展的新动向。
5.网络经济是竞争与合作并存的经济。信息网络使企业之间的竞争与合作的范围扩大了,也使竞争与合作之间的转化速度加快了。世界已进入大竞争时代,在竞争中有合作,合作也是为了竞争。在竞争合作或合作竞争中,企业的活力增强了,企业的应变能力提高了,否则就会被迅速淘汰出局。企业可持续的竞争优势,主要不再依靠天赋的自然资源或可供利用的资金,而更多地仰仗于信息与知识。
6.网络经济是速度型经济。现代信息网络可用光速传输信息。反映技术变化的“网络年”概念流行起来,而网络年只相当于正常的日历年的1/4。网络经济以接近于实时的速度收集、处理和应用大量的信息,需按快速流动的信息来进行。经济节奏大大加快,一步落后就会步步落后。产品老化在加快,创新周期在缩短,竞争越来越成为一种时间的竞争。21世纪头10年的经济将是在注重质量的基础上注重速度的经济。
7.网络经济是创新型经济。它源于高技术和互联网,但又超越高技术和互联网。网络技术的发展日新月异,以此为基础的网络经济需强调研究开发和教育培训,若非不断创新,其新经济的“新”也就难以为继了。在技术创新的同时还需有制度创新、组织创新、管理创新、观念创新的配合。创新来自创造性,创造性的存在,要有从无序中寻求有序的环境,而创造性的发挥,则要求从有序中冲刺出来,产生适度的无序。
二、网络经济的由来
网络经济在世纪之交的蓬勃发展,是与1993年以来国际互联网商务性应用的急剧高涨分不开的。
但就网络经济这一概念而言,则早已有之,而且由于不同学者对“网络”和“经济”的不同理解,它有着不尽一致的内涵。例如,早在80年代,有些日本学者鉴于第三产业中的商业、运输业、金融业等均因有相应的网络而发展起来,就把服务经济称为网络经济,提出要研究这类网络经济学问题;1992年我率中国信息经济学代表团,访问贝尔实验室时,有两位美国学者送给我几篇研究网络经济问题的论文,其内容是讨论电子计算机局域网、广域网的成本核算、收费标准等有关问题的,人们也把这类研究称为网络经济学(EconomicsofNetworks)。
现在成为时尚而流行的网络经济或网络经济学,就其内容而言,实际上是互联网经济(InternetEconomy)或互联网经济学(InternetEconomics)。当然,这也是一种特定的信息网络经济或信息网络经济学,它与信息经济或信息经济学有密切关系,这种关系是特殊与一般、局部与整体的关系。
人们利用网络,既可以传递信息,又可以从事各种社会和经济活动。网络经济就是通过网络进行的经济活动,这种网络经济是经济网络化的必然结果。网络化极大地加快了经济的市场化和全球化进程,它有利于发展中国家通过逐步开放和适度监管来利用世界上成熟的技术成果、有用的信息和知识资源以促进经济增长。
对网络经济可从不同的层面去认识它。从经济形态这一最高层面看,网络经济就是有别于游牧经济、农业经济、工业经济的信息经济或知识经济,由于所说的网络是数字网络,所以它又是数字经济。在这种经济形态中,信息网络尤其是智能化信息网络将成为极其重要的生产工具,是一种全新的生产力。
从产业发展的中观层面看,网络经济就是与电子商务紧密相连的网络产业,既包括网络贸易、网络银行、网络企业以及其他商务性网络活动,又包括网络基础设施、网络设备和产品以及各种网络服务的建设、生产和提供等经济活动。这就是目前信息产业界人士所宣扬的互联网经济,它可细分为互联网的基础层、应用层、服务层、商务层。电子商务是互联网经济的一个重要内容。据美国思科系统(中国)网络技术有限公司提供的资料,美国互联网经济1998年总收入为3014亿美元,(注:1995年还只有50亿美元,3年就增加到600倍,在1998年网络经济的3014亿美元收入中,电子商务就占了1020亿美元。)超过了能源(2230亿美元)和邮电(2700亿美元)的收入,仅次于汽车工业的收入(3500亿美元),但其按人平均的生产率(25万美元)已高于汽车工业(16万美元),此外还创造了就业岗位120多万个;从1995—1998年美国互联网经济增长了174.5%;1998年美国电子商务比过去所有的估计都高,达1000亿美元。(注:以上资料见该公司副总裁林正刚在’99国家信息化发展论坛的报告:《Internet经济带来的机遇与挑战)。)
从企业营销、居民消费或投资的微观层面看,网络经济则是一个网络大市场或大型的虚拟市场,其交易额几乎每百天增加一倍。由于网络用户普遍看好这一市场,随着网络的扩大,网络企业的股票市值不断飚升。例如,美国的德尔公司自1990年上市以来其股票增值了3万倍。又如美国的雅虎以400万美元创业,经过4年半时间,其股票市值达到400亿美元,增长1万倍,拿其网络股收益与其财务收益相比,超过40多倍。这说明网络企业与传统企业不同,其收益更多地来源于信息资产即无形资产的价值和增殖。网络经济的上述三个层面是相互联系的。网络市场扩大了,网络产业发展了,表现为全新经济形态的网络经济也就必然水到渠成了。
三、网络经济起作用的因素
传统经济是物质、能量型经济,其交易通行“物以稀为贵”的原则,商品价格对供求变化的刚性较大,甚至具有缺乏效率的僵硬凝固性,因资源匮乏使供应受阻往往成为经济的通病。网络经济是信息、知识型经济,其交易则通行应用越广价值越大的原则,商品价格最大限度地接近于严格反映供求变化的市场价格,对买卖双方具有互动协商、互利双赢的优越性,因收入与财富的悬殊加剧使需求不旺很可能影响经济发展。
网络经济与传统经济相比,不仅劳动生产率高,(注:例如,美国90年代的生产率年增速度是60年代的2倍,是70年代和80年代的4倍。)而且创造财富快。(注:网络经济的财富创造主要不看短期利润,而着眼于信息资产或知识资产在长期的增值。据香港《大周刊》1999年3月6日的报道,美国比尔·盖茨的财富在1998年每小时增加210万美元。)近3年(1995—1998年)来,美国经济增长有35%依赖于网络经济的发展。(注:见人民日报1999年6月24日《美国经济三年增长三成有赖网络经济》。)网络经济会促进经济的高增长、高就业、低通胀和经济周期波动的平缓。美国90年代经济近五六年来的实绩提供了一个例证。网络经济的这种作用是由多种因素决定的。
从网络经济的基础设施或主要工具信息网络的作用看,信息网络有强大的支撑效应、渗透效应、带动效应。特别要指出的是信息网络发展过程中有些规律对网络经济起着支配作用,这就是以下的三大规律:
1.信息技术功能价格比的莫尔定律(Moore’sLaw)。按此定律,计算机硅芯片的功能每18个月翻一番,而价格以减半数下降。该定律的作用从60年代以来已持续30多年,预计还会持续20年。它揭示了信息技术产业快速增长的发动机和持续变革的根源。
2.信息网络扩张效应的梅特卡夫法则(MetcalfeLaw)。按此法则,网络的价值等于网络节点数的平方。这说明网络效益随着网络用户的增加而呈指数增长。互联网的用户大概每半年翻一番,互联网的通信量大概每百天翻一番,这种爆炸性增长必然会带来网络效益的飞快高涨。互联网企业概念股市值连续上扬的原因就与人们的这类预期有关。
3.信息活动中优劣势强烈反差的马太效应(MatthewsEffect)(注:源出《新约全书·马太福音》第25章中的话:“因为有的,还要加给他,叫他有余;没有的,连他所有的,也要夺过来。”)律。在信息活动中由于人们的心理反应和行为惯性,在一定条件下,优势或者劣势一旦出现,就会不断加剧而自行强化,出现滚动的累积效果。因此,某个时期内往往会出现强者越强、弱者越弱的局面,而且由于名牌效应,还可能发生强者统赢、胜者统吃的现象。(注:令人担忧的是,网络经济的发展会加剧发达国家与发展中国家的“南北”差距。据联合国技经贸信息网新闻的报道,至1998年,在国际互联网1.3亿用户中,发展中国家只有1000多万,占7.8%,而发达国家有1.2亿,占92.2%;在发展中国家每440人有一个国际互联网用户,而在发达国家每6.8人中就有一个国际互联网用户。信息社会中“信息富裕”与“信息贫困”的差异,在信息经济中将表现为“信息经济发达”与“信息经济落后”的差异。)
从网络经济的本身看,首先它使经济活动的扩展具有全球性,可达互联网连结的所有国家和地区,进入全球市场,扩大营销范围,并充分利用全世界的生产要素。其次,它使经济活动的低成本和高效率具有十分广泛的普遍性,上网的企业、家庭和其他单位,都会因交易费用降低、商机选择增多而获益。再次,它还使经济活动的主体行为有多项选择性,促进生产与消费的个性化。
尽管有这么多的因素使网络经济崭露头角,给传统经济带来了巨大的冲击。但应当看到,传统经济始终是哺育网络经济的母体。迄今为止,网络经济的发展仍存在一系列制约因素,其中有技术因素,更有制度因素,这在发展中国家尤为明显。即使在发达国家,由于把网络技术用于各种目的,推动了软硬件的生产,因把万维网推广到全世界掀起了一阵阵热潮,结果使投资激增,新企业不断涌现,整个经济迅猛扩张,但在发展进程中同样存在一些不确定因素和一定的风险。前景诱人的网络经济,其真正的优越性在于持续的变革:以变应变。
四、网络经济对经济理论的影响
由于网络经济是信息经济的一个特称或别称,它对经济理论的影响,主要是通过两个途径实现的。一个途径是以新的视野或用新的方法来解释原有的理论,使其有新发展。例如,引入信息的不完全性、有成本性、非对称性,使经济学中传统的市场理论、均衡理论、企业理论等等发生了质的变化。另一个途径是从新的经济现象出发,研究和确立新的经济理论。例如,信息产业的发展推动经济学在研究边际效益递增理论、无形资产及其评估理论的作用等等。
网络经济对经济理论有广泛而深刻的影响,这里选择几个重要的经济理论因受网络经济发展的影响而产生的变化,进行必要的剖析。
1.对生产力要素理论的影响
生产力是生产关系的物质基础。生产力究竟是由哪些要素组成的,历来有不同的观点。例如,“两要素说”把生产力理解为人类作用于自然界的生产能力,它“由用来生产物质资料的生产工具,以及有一定的生产经验和劳动技能来使用生产工具、实现物质资料生产的人”(注:《斯大林文选》(1934—1952年),人民出版社1962年版,第195页。)共同组成。“三要素说”认为生产力指的是生产总量,决定该量的生产过程的要素即生产要素也就是生产力要素。因此,它除劳动工具和劳动力之外,还包括劳动对象。劳动对象的发掘与变革对生产力的增长起着越来越大的明显作用。“多要素说”视生产力为生产率或劳动生产率,而它的高低除受上述三要素的影响外,还取决于“科学的发展水平和它在工艺上应用的程度,生产过程的社会结合,……自然条件”,(注:《马克思恩格斯全集》第23卷,人民出版社1975年版,第53页。)以及其他要素。
“多要素说”随着社会生产的发展而发展。这种发展,一方面表现在决定生产力的主导因素的变化上,如从生产工具主导论到“科技是第一生产力”的科技进步主导论的变化。另一方面表现为决定生产力的要素在不断增加中,除科技、管理外,又有教育、信息与知识(注:世界银行1998/1999年报告《知识与发展》认为,“信息是每一个经济的生命线”,“知识是发展的关键”,“知识就是发展”。中国财政经济出版社1999年版,第72、130页。)等。
1991年我曾提出,“信息是最重要的生产力软要素”,并对此观点作过全面的论述。(注:乌家培:《信息与经济》,清华大学出版社1993年版,第27—30页。)网络经济的发展,对生产力要素理论产生了全面的影响,这表现在:(1)使生产力的首要因素劳动力对其信息能力即获取、传递、处理和运用信息的能力的依赖空前增强,并促进新型劳动者即信息劳动者的出现与快速增加。(2)使生产力中起积极作用的活跃因素劳动工具网络化、智能化以及隐含在其内的信息与知识的份量急剧增大,信息网络本身也成了公用的或专用的重要劳动工具。(3)使不可缺少的生产要素劳动对象能得到更好的利用,并扩大其涵盖的范围,数据、信息、知识等都成了新的劳动对象。(4)使生产力发展中起革命性作用的科学技术如虎添翼,由于科技情报交流的加强和科技合作研究的发展,科技进步日新月异,信息科技成了高科技的主要代表,它对社会和经济的渗透作用和带动作用不断强化。(5)使对生产力发展有长期的潜在的重要作用的教育发生了根本性变革,远程教育、终身教育日趋重要,本来就是与信息相互交融的教育更加信息化、社会化和全球化了。(6)使组合、协调生产力有关要素以提高它们综合效益的管理对生产力发展的决定性作用更加强化,导致管理科技甚至也成了高科技。管理信息化已发展到内联网、外联网、互联的网际网新阶段,并与各种业务流程信息化相融合。信息不仅是管理的基础,而且与知识一道也成了管理的对象。信息管理、知识管理日益成为管理的重要组成部分和新型的增长点。(7)使作为生产力特殊软要素的信息与知识通过对生产力其他要素所起的重大影响和通过对这些要素的有序化组织、总体性协调,发挥其物质变精神、精神变物质两个过程相互结合的特殊作用。
2.对边际效益递减理论作用范围的影响
在农业经济和工业经济中,由于物质、能量资源的有限性或稀缺性、技术进步的相对稳定性、市场容量的饱和性,当需求依靠供给来满足时,任一投入产出系统中,随着投入的增加边际产出(即边际效益)呈递减趋势。这一规律性现象广泛存在,有普遍性。
到了信息经济尤其是其网络经济阶段,信息资源成了主要资源,该资源可再生和重复利用,对其生产者无竞争性而对其使用者无排他性,它的成本不随使用量的增加而成比例增加;同时信息技术发展快、变化大、生命周期短;而且需求往往是由供给创造的,产品受市场容量饱和的影响较小。因此在投入与产出的关系中出现了边际效益递增的规律性现象,这种现象还会因网络效应的作用而强化。
边际效益递减是与负反馈相联系的,而边际效益递增是与正反馈相联系的。负反馈反映原有的差异逐渐缩小以至消失的倾向,正反馈则反映初始的微小差异不断扩大导致全然不同结果的趋势。当然,这种变化都是有条件的。
认为在传统的工农业经济中只有边际效益递减的规律性而在信息经济或网络经济中只有边际效益递增的规律性的那种观点,是与现实相背的。人们会发现,在物质产品生产达到一定的经济规模之前也有边际效益递增的现象,而在信息产品生产中当技术方向有问题时也会出现边际效益递减甚至为零或负的现象。网络经济所改变的仅仅是缩小了边际效益递减规律的作用范围,使它在经济活动中不再成为起主导作用的规律。
3.对规模经济理论相对重要性的影响
在工业经济中,由于社会分工、专业化协作的发展,由于机械化、自动化以及由此而来的生产流水线的发展,当钢铁、汽车、石化等固定成本占总成本很大比例的产业在经济中起主导作用时,规模经济即产品单位成本随着产品数量增加而降低所带来的经济性,是提高经济效益、优化资源配置的主要途径。
在信息经济或网络经济中,尽管规模经济仍然是提高经济效益、优化资源配置的重要途径,但由于生产技术和管理技术的集成化、柔性化发展,数字化神经网络系统的建立与应用,由于外部市场内部化同外包业务模式的并行发展,还由于相关业务甚至不同业务的融合,当软件、多媒体、信息咨询服务、研究与开发、教育与培训、网络设备与产品等变动成本占总成本较高比例的信息产业、网络产业、知识产业在经济中起主导作用时,增加经济性效应的途径越来越多样化了。范围经济(通过产品品种或种类的增加来降低单位成本)变得更加重要了,差异经济(通过产品或服务差异性的增加来降低成本和增加利润)、成长经济(通过拓展企业内外部的成长空间来获取利润)、时效经济(通过抢先利用机遇扩大市场份额来赢得竞争优势)等各种提高经济效益的新途径出现了,这些途径不仅大企业在利用,而且更有利于大量中小企业加以利用。
无可否认,规模经济作为人类经济活动提高效益的基本途径,这个事实没有变,但它的相对重要性由于网络经济的发展确实变化了,它不再是最重要的更不是唯一的经济性效应。
4.对通货膨胀率与失业率此消彼长“理论”的影响
英国经济学家A·W·菲利普斯于1958年提出失业率与通货膨胀率(或物价上涨率)之间存在着此消彼长的变动关系,低失业率与高通胀率相陪伴,而高失业率则与低通胀率同时并存,若用纵坐标表示通胀率、横坐标表示失业率,那么两者之间的这种关系就表现为从左上方向右下方倾斜的曲线,这就是所谓菲利普斯曲线。
上述“理论”已为资本主义经济发展的实践所否定。70—80年代两次石油危机时期,出现了高失业率与高通胀率相并存的“滞胀”,了失业率与通胀率反方向变动和可相互替换的“理论”。到了90年代,信息产业和经济全球化的发展,使美国出现了在经济高增长中低失业率与低通胀率并存的新经济现象,又一次从另一个方面证明了不存在什么菲利普斯曲线。据美国商务部分析,1996年和1997年,美国信息技术产业的价格下降使国民经济的价格指数下降了1个百分点,导致通胀率成为30年来最低点,同时信息技术产业还在以往5年内提供了1500万个工作岗位,使失业率降到24年来最低点。
有些文章为了强调知识经济对传统经济理论的冲击,把新经济实践对菲利普斯曲线的科学性与有效性的否定说成是“第一次”,是不准确的。
5.对经济周期波动理论的影响
正像工业与工业化熨平传统农业生产的季节性波动一样,信息业与信息化熨平了传统工业(汽车业、建筑业等)经济的周期性波动。按照美国经济学家熊彼特的“创新理论”,由于创新的产生不是连续的、平稳的,而是时高时低的,因此会出现经济的周期性波动,每个周期包括危机、萧条、复苏、高涨四个阶段。第一次世界大战前,主要资本主义国家大约平均间隔8—10年爆发一次危机。第二次世界大战后,由于发达国家采取了反危机措施,使经济周期变形,危机持续时间缩短,萧条和复苏之间的界限因经济上升加快而不明显,高涨时经济发展劲头不强。于是,出现了经济衰退与经济高涨交替更迭的简化经济周期说。以美国经济为例,自1991年4月走出二战后第9次衰退期以来,经济高涨已持续8年半了。
怎样解释美国经济周期这种新变化呢?当然,这是多种原因共同作用的结果。但是,最主要的一个原因是:90年代以来美国以信息技术及其产业为代表的高技术及其产业的迅猛发展,导致经济周期进一步变形。正如美国联邦储备委员会主席格林斯潘所说的,“信息技术无疑巩固了企业经营的稳定性”。(注:参见《与高技术产业息息相关的新经济周期》,参考消息1997年5月13日。)在美国信息技术等高技术的产业已经取代了传统的周期性产业,而成为推动经济增长的主要动力。当美国1995年和1996年汽车产业和房地产业陷入萧条时,适逢信息技术产业异军突起,结果促进了经济再高涨。随着网络经济尤其是电子商务的兴起,则会更有利于延缓衰退期的到来,而使经济继续趋向高涨。但是,经济周期波动决不会因此而消失。在一定条件下,高技术及其产业也有衰退的可能。何况经济周期波动不仅仅是由技术与产业的状态所决定的。在经济波动与金融波动相互影响加剧、彼此依存更加紧密的环境下,发生经济波动是很难避免的。
关键字:大数据;图书馆;用户满意度
1 引言
随着计算机的极速发展、存储器性能的提升,还有物联网、移动互联网、传感器等新科技的发展,数据增长的数度已经逐渐超出人们可以接受的范围,而且这一速度还在不断增长。这些大量的半结构化和非结构化的数据是人类活动的最真实记录。最早提出“大数据”概念的是全球著名咨询公司麦肯锡,其的《大数据:创新、竞争和生产力的下一个前沿领域》,首次提出了“大数据”,并指出“数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于大数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。”[1]毫无疑问,通过合理的技术去挖掘、识别、分析大数据,可以找到很多通过常规数据技术难以发现的财富。大数据分析已经在很多商业领域得到应用,本文站在图书馆用户的视角上分析如何利用大数据分析提升图书馆用户满意度。
图书馆用户满意度是指用户对图书馆提供服务的满意程度,是用户在接受图书馆一次或者多次服务后的内心评价和主观感受,是其预期效果和实际所接受服务效果的比较[2]。当前对提升图书馆用户满意度的方法大多是通过发放问卷调查,建立相关模型,运用统计学和计量学的知识进行分析,最后通过定性和定量的方法来采取相应的措施提高满意度。但由于收集数据方法的局限性和理论模型本身就存在的缺陷,分析得出的结论和采取的措施未必都有效。图书馆历来都是信息收集和管理的重要场所,长时间运营以来积累了大量的结构化数据、半结构化数据以及非结构化数据。通过对这些数据的管理和运用,图书馆可以建立其智能分析、辅助决策系统,准确、及时获取用户的数据,为图书馆更好的了解用户、分析用户提高用户满意度提供支持,提高图书馆的核心竞争力。
图书馆日益增长的数据,这本身就是一种资源,若不对其进行开采,那就是一种浪费。随着大数据处理技术的逐渐成熟,图书馆也具备了运用大数据来提高用户满意度的可行性。因此本文研究的目标,就是利用大数据带来的机遇,借助数据仓库、数据挖掘、商务智能、专家系统、人工智能等现代信息技术手段,提出一个能够改善图书馆用户服务、提升图书用户满意度的解决方案。
2 文献综述
2.1 大数据
“大数据”(big data)是IT领域在“云计算”、“Web 2.0”、“移动互联网”等之后,近两年最流行的词汇。根据著名咨询公司IDC统计[3],2013年全球被创建和复制到数据总量为1.8ZB(10的21次方),Facebook每天有约1000万张的照片更新和30亿次的点击率;Twitter每天有超过4亿条Tweet发送;Google通过大规模集群和MapReduce,每月要处理超过400PB的数据;淘宝会员超过3.7亿,在线商品超过8.8亿,每天交易数千万笔,产生月20TB的数据。同时,随着传感器和物联网的蓬勃发展,数据正在亿前所未有的数度不断的累积和增长。近几年,《Nature》和《Science》等国际顶级学术期刊相继出版专刊来专门探讨对大数据的研究。2008年《Nature》推出了专刊“Big Data”,从互联网技术、网络经济学、超级计算、环境科学、生物医学等多个方面介绍了海量数据带来的挑战。《Science》与2011年推出了专刊“Dealing with Data”,主要围绕着科学研究中大数据的问题展开讨论,说明大数据对于科学研究的重要性。更加值得关注的是,2012年3月,奥巴马政府了“大数据研究和发展倡议”[4],计划在科学研究、环境、生物医学等领域利用大数据技术进行突破。奥巴马政府的这一计划被认为美国政府继“信息高速公路(Information Highway)”计划之后在信息科学领域的又一重大举措。与此同时,包括IBM、Oracle、HP、Microsoft等IT行业巨头都纷纷加入到大数据行列中,通过收购与大数据相关的软硬件技术公司,来实现大数据软硬件一体化技术整合,力求在新的信息竞争环境中处于更加主动的地位,获取更有利的竞争优势。
面对各行各业海量的数据,首先要面对的问题就是如何对这些结构化、半结构化甚至被结构化的数据进行有效的组织和管理。长时间以来,人们研究的对象都是结构化数据,如目前占据绝对主流的关系数据库,因而人们总希望在数据生成是就按照特有的结构和模式对数据进行整理。而对于非结构化甚至半结构化的处理,则是在慢慢发展。海量的电子政务数据、移动终端数据、网站日志、社交网络数据、来自物联网传感器的数据、企业和公共部门长期积累的数据等都是大数据的主要来源,将这些数据互惠共享、融会分析将会产生巨大的经济和社会效益。而目前大数据最显著最直接的应用就是市场营销和信息公共服务,如对企业或公共服务部门积累的数据进行利用、挖掘则可以从更多的角度了解用户,从而针对存在的问题制定出相应的解决方案,提升用户对企业或服务部门的满意度。
2.2 图书馆用户满意度
图书馆因用户存在,服务是图书馆永恒的工作主题。虽然随着信息技术的发展,信息环境和信息用户的需求都在迅速改变,使得图书馆在职能定位、服务范围、服务手段和服务内容等方面都发生了很大的变化,但图书馆的使命从来没有发生过改变,无论是最基本的文献提供服务还是迅速发展的参考咨询等新服务,都是为了更好的满足图书馆用户的需求,是用户能够最大限度的利用图书馆资源,发挥图书馆应有的价值。因此,探索提高服务质量、提升服务效果的措施便是图书馆工作的重点。根据之前对一般用户满意度的定义“用户对用户接受产品或服务的实际感受值与其期望值的比较程度”,图书馆用户满意度也可认为是:图书馆用户在接受图书馆服务和使用图书馆设施的过程总的感受值与其期望值的比较程度,定量测量图书馆用户满意度的水平。
从文献中,我们可以发现大多数对图书馆用户满意度的研究,其收集数据的方式仍然是以发放调查问卷为主,辅助以其他的调查方法,如电子邮件调查、受理投诉、电话访问等方法。虽然问卷调查的科学性毋庸置疑,但其局限性也很明显:被访问者会受到很多外界的影响,而这些影响是几乎不可能避免的。并且由于受到成本和时间的限制,其发放问卷的数量和抽样选择被访者会受到制约。同时,采用问卷调查收集数据的方法已经存在学术界多年,笔者认为应该尝试新的方法。另外,用户满意度,即用户要求被满足的程度,这种高低大小不取决于企业,而是取决于用户的心理。用户满意度是一种主观感知、自我体验和情感判断,这种“似是而非”的模糊情况,广泛存在。同时,可能由于用户的个人因素,如社会因素、消费因素、外部环境因素等,导致用户对图书馆服务的感觉随时都会发生变化。最后,用户满意度仅仅是用户过去心理状态的反应,而非当前,这意味着,用户满意度存在着滞后的特点。这意味着最后得出的结论可能不能正确的为决策提供帮助。
综上所述,在当前的大数据时代,图书馆应该利用好这个机遇,充分利用图书馆本身就是一个信息收集和利用的场所的天然优势,通过先进的数据分析技术从图书馆的大数据中提取有益的知识。大数据技术可以帮助图书馆获得准确、及时的用户数据,有助于管理者及时了解图书馆最新知识服务的趋势并作出决策、调整服务方向,提高用户的满意度,提高图书馆的核心竞争力。同时,借鉴大数据在其他行业如互联网行业、金融行业等已经成功或者正在进行中的案例,结合合理的大数据处理技术,开辟出一条针对图书馆用户满意度提升研究的新道路。
3 理论方案
从整体上看,当前对于图书馆用户满意度的应用研究主要还是将用户满意度作为中间变量,分析其与其他变量之间的关系,从而得出相应的结论来支持决策。而随着大数据概念的日益深入人心以及相关技术的迅猛发展,使得对图书馆用户满意度的提升有了新的方法。建立图书馆用户满意度的因素分析模型和对用户满意度进行大数据挖掘分析相比,前者是利用统计计量工具对用户满意度进行因素分析,是相对静态的分析,分析模式是固定的;而后者则是通过分析来发现与用户满意度相关的、图书馆关心的模式,多进行的分析也是动态的、不规则的。因此也可以将利用大数据提升图书馆用户满意度看成是图书馆用户满意度模型分析的更深一层次的研究。
利用大数据提升图书馆用户满意度,其数据收集方式自然和以前靠发放问卷来收集数据不同,其来源主要有[5]:用户借阅流通数据、馆藏数目数据和电子数据、RFID(无线射频识别)数据、社交网络交互数据、移动互联数据以及各种传感器数据等。当然,传统提升图书馆用户满意度的数据,如受理投诉、问卷调查等同样可以加以利用。
随着Hadoop开源框架及其相关技术的兴起和完善,使得从技术的角度上来看,图书馆利用大数据进行用户满意度的提升研究成为了可能。一般来说,利用大数据提升图书馆用户满意度主要从以下几个方面入手[5]:
(1)进行用户流失分析,应对图书馆用户减少的尴尬局面。图书馆借助大数据数据对用户需求的数据进行分析,不仅可以了解用户的信息行为、需求意愿以及知识运用能力,还可以深度挖掘用户在交互型知识服务中潜在的需求,从而针对性的展开服务吸引用户。
(2)建立智能、灵活的社会网络知识服务。图书馆通过分析各种数据,从中发现有用的知识和关系,完善新的知识服务方式。
(3)建立知识服务导航机制。考虑用户知识需求预测、多维数据资源的组织和分析、用户行为智能分析、学术资源搜索以及推荐服务等。
3.1 方案和框架
随着信息技术的发展,图书馆累积的数据越来越多。这些数据背后隐藏着虚度重要的信息,图书馆自然希望利用这些进行更高层次的分析。关系数据库系统可以高效的数显数据的录入、修改、统计、查询等,但在以非结构化为主的大数据面前,无法发现数据中存在的关系和规则,导致了“数据丰富而知识匮乏”的现象。而我们提出的利用大数据提升图书馆用户满意度的方案,则可以很好的解决这一问题。
3.1.1 拟定方案
随着数据量的飞速增长,大数据管理全生命周期过程包括大数据的获取、存储、组织、分析和决策五个阶段[6]。传统的数据分析计算策略是将数据移动到数据分析工具中进行计算,但这对于大数据而言,显然成本太高,于是便需要一种新的大数据解决方案。随着Hadoop开源框架及其相关技术的兴起和完善,为解决传统大数据处理方式所面临的难题打开了局面。Hadoop的两项关键服务[6]:采用Hadoop文不是文件系统的可靠大数据存储服务以及基于MapReduce变成模型的高性能并行大数据处理服务能够提供对结构化、非结构化数据快速、可靠的分析,并且可以整合传统的数据,从而是图书馆可以根据已有的信息和问题制定知识服务组合方式。在新的技术工具的支持下,运用数据挖掘的方法,对图书馆的大数据进行处理。数据挖掘使用的是基于发现的方法,运用模式匹配和其他算法决定数据之间的联系,从数据中发现模式,致力于知识的自动发现。其一般有四种方法[7]:
(1)概念描述。是数据挖掘最基本的形式,是产生数据的特征化和比较描述。
(2)关联分析[8]。从大量数据中个项集之间的引入重视的相互关联和相互联系。通过关联分析来分析图书馆用户满意度,可以发现用户满意度和未知主题之间的关系,这种关系很多时候都具有很高的价值,可用于辅助决策。
(3)分类预测。分类预测技术通常包括神经网络、贝叶斯分类、判定树归纳等。运用在用户满意度上可以对用户进行分类,如高用户满意度的用户、低满意度的用户等;也可以在一定条件下进行用户满意度的预测,由于数据的及时处理,其对于决策能够提供很大的支持。
(4)聚类分析。聚类和分类不同,聚类要划分的类型是未知的,也就是说更容易发现新的知识,在同一个类中的个体具有很高的相似度。对于图书馆用户满意度的分析,聚类分析可以在对用户针对用户满意度进行分类的模式未知的情况下,对用户进行聚类分析。
3.1.2 实施框架
从大数据管理生命周期角度来看,大数据综合运用分为五个阶段:获取阶段、存储阶段、组织阶段、分析阶段和决策阶段[6]。据此,在运用大数据提升图书馆用户满意度时,我们制定的框架如下:
4 总结
大数据继“云计算”、“物联网”、“Web 2.0”、“移动互联网”等之后,成为科技界、金融界甚至政府部门的热门话题。虽然其定义尚不清晰,但由于其独具的前瞻性和实用性已经被运用在一些领域,尤其是IT界和市场营销界。大数据带来的全新的知识体系和服务模式,对图书馆不可避免的造成了冲击。对以用户为中心的图书馆来说,若仍然保持过去的服务和工作方式,无论对用户而言还是对图书馆自身的发展而言,都没有好处。抓住大数据带来的机遇,从大量复杂的数据中分析、挖掘潜在的价值,从全新的角度研究用户满意度提升的新方法,从而有针对性的开展知识服务,制定图书馆发展战略将会是未来图书馆发展的方向。
参考文献
[1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169
[2]武海东.基于结构方程模型的图书馆读者满意度实证研究[D].重庆:重庆大学,2009:7-9
[3]栗蔚,魏凯.大数据的技术、应用和价值变革[J].电信网技术,2013,7(7):6-10
[4]徐子沛. 大数据―正在到来的数据革命[M].桂林:广西师范大学出版社,2012:128-132
[5]容春琳.公共图书馆应用大数据的策略研究[J].图书馆建设,2013,7:91-95
[6]郭自宽,张兴旺,麦范金.大数据生态系统在图书馆中的应用[J].情报资料工作,2013,2:23-28