前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的数学建模数据可视化主题范文,仅供参考,欢迎阅读并收藏。
【关键词】数字矿山;关键技术;三维地学建模
0 引言
1998年1月31日,前美国总统戈尔提出“数字地球”(Digital Earth,简称DE)概念,引起了全世界学术界的热烈关注。许多学者在这基础上根据自己国家的实际情况开展了多方面的研究工作。1998年10月,在接见两院院士时,提出了构建数字中国(Digital China,简称DC)的战略构想,并与各位院士研讨实施DC的行动计划。
根据国家“十五”计划对企业信息化的要求,利用信息化带动矿山等传统企业。合理地开发矿业资源,维护矿区经济、社会和环境保护的协调,必须有赖于信息系统技术。现在,各行各业要发展“数字化”技术已成为必然,矿业也不例外,“数字矿山”(Digital Mine)必将成为“数字中国(Digital China)”的主要部分之一。
1 数字矿山关键技术
1.1 我国构建数字矿山存在的问题
近年来,中国矿山行业的信息化建设虽然取得了较大发展,但总体状况仍然很不乐观。中国矿山在矿山勘察、规划、设计、生产、管理、全过程监控等信息化“软”领域,与发达采矿国家的差距越来越大。遥控采矿、无人工作面甚至无人矿井等已在加拿大、美国、德国、澳大利亚等国成为现实。加拿大从20世纪90年代初就开始研究遥控采矿技术,目标是实现整个采矿过程的遥控操作,现已研制出样机系统,并在INCO公司的几个地下镍矿试用。目前我国矿山行业信息化程度差、信息基础设施落后、信息化管理决策水平低,是矿山企业安全形势得不到有效改善的根本原因。构建数字矿山,以信息化、自动化和智能化带动采矿业的改造与发展,开创安全、高效、高产、绿色和可持续的矿业发展新模式,是中国矿业生存与发展的必由之路。
1.2 三维地学建模
在整个“数字矿山”的庞大信息系统中,三维地学建模是系统的核心组成部分,技术最为复杂。中国矿业大学的吴立新教授曾做出如下的定义:三维地学建模是由勘探地质学、数学地质、地球物理、矿山测量、矿井地质、GIS、图形图像学、科学可视化等学科交叉而形成的一门新型学科。由此可见,三维地学建模不但有着很强的地学专业背景,而且也是多学科交叉的边缘学科问题。
1.2.1 三维地学建模的特征
从计算机图形学的角度来说,三维地学建模既不属于原始设计模式的建模,也不是严格的逆向工程建模,这主要是由三维地学建模的建模数据来源所造成的。本文总结了地学建模的数据来源有三个特征。
(1)稀疏性。地学建模的数据来源目前主要是靠钻孔数据、勘测数据以及矿山开拓工程数据。在前期的地质勘探过程中,地学的建模基本是完全依靠钻孔获得建模原始数据,成本非常高,不可能大量的采集数据。所以,实际工程中只能采集非常稀疏的、离散的且分布不规则采样数据,而矿山地质空间数据往往又是连续、复杂多变的,这给建模工作带来了很大的困难。
(2)不确定性。由于数据的稀疏性的因素,为了获得满足三维建模需要的数据量,必须依据现有的勘测数据进行空间插值。目前常用的这些方法仅仅是对矿体形貌的一个“较为可靠”的估计,在这个“较为可靠”的估计下面有很大的不确定性。
(3)地质构造的复杂性。由于断层、褶皱、岩石夹层等复杂地质构造的存在,这些复杂的和无规律的因素使得地学建模的复杂度大大增加,也使得地学的建模复杂性远远大于其他的类似的建模应用。像基于CT扫描数据的建模等领域,现实生活中是可以找到参考模型作为引导,有一定的规律可循,而矿体模型几乎没有任何规律可循。
1.2.2 地学建模的主要方法
在过去的十几年中,国内外众多学者对于三维地学建模这个难题从理论上进行了较深入的研究,提出了多种三维地学空间模型或建模方法。其中不少方法已经在商品化的数字矿山软件中得到实现和应用。从三维建模方法的基本元素来看,可以分为基于面表示的模型、基于体元的模型和混合数据模型。由于三维地学建模需要对矿体的属性的品位等信息进行详细的描述,所以三维地学建模须采用体元模型法建模,也可以由表面模型栅格化为体元模型。
地学(空间)数据模型的研究能为地质科学数据的共同理解提供基础。在己有数据模型或建模中,由于侧重于项目需求的建模,加上受于个人数据库技术的限制,使领域内的数据建模在数据(实体)、数据(实体)之间的联系以及有关语义约束规则的形式化描述,数据模型规定数据的内容、结构、行为和语义方面缺乏一致性描述,这在一定程度上影响了为地质科学数据的共同理解基础,而且使基础数据模型可以被设计成能够适合各种数据结构数据的结构能力也相当有限。因此根据目前数据模型技术发展趋势,需要建立地质调查领域的领域数据模型来满足需求。
三维地质建模要求对大量地球空间信息进行三维描述,主要任务是用一定的三维数据结构来有效地描述和表达地质体本身以及地质体间复杂的关系,提供丰富的地层、断层、构造等三维建模方法,可自定义模型,扩展多种模型,提供模型库管理。3DGIS数据结构可以很好地满足这些要求。利用三维GIS可以将一维、二维地质体置于三维立体空间中考虑,区分出一维、二维对象在垂直方向上的变化。3DGIS的首要特色是能对2.5维、三维对象进行可视化表现,存储的是它们真实的几何位置与空间拓扑关系, 3DGIS结合可视化技术、虚拟现实技术、网络技术和高分辨率卫星影象等技术,专家们提出了第四代GIS的新概念,即以三维数据为研究和应用对象,在网络环境下实现GIS系统数据的调用和交流。新一代的地理信息系统(GIS)不仅具备极强的海量地质空间数据管理功能,还具有较强的数据优化建模、数据自动获取和修改、数据查询和分析、图形图像可视化(GIS)等功能,是地质空间信息可视化的最佳环境。3DGIS的开发应用充分考虑未来三维地学数据获取能力的提高,以便受益于现代地质数据获取方法的进步。3DGIS研究计算机技术与空间地理分布数据的结合,通过一系列空间操作和分析方法,为地球科学提供有用信息。
2 结束语
三维地学建模技术是数字矿山的核心技术之一。随着数字矿山技术的日趋成熟,数字矿山的建设已经从概念走到了现实世界中。并且,伴随着非可再生资源的日益紧张,资源价格日益上涨,我国的矿山开采企业的经济效益也得到了很大的改善,对数字矿山的建设提供了很好的经济基础。同时,矿山开采企业在朝着集约化、规模化的道路发展,对信息化管理的手段需求日益迫切。国家也在一直提倡用信息化改造传统工业,提升传统工业的发展水平和信息化水平。数字化信息化的进程将使得矿山开采企业从中获益,能够显著提高企业生产效率和降低人力成本。可以用“五有”来概括上面的话――有技术、有财力、有需求、有政策、有效益。总之,数字矿山的建设可谓是正逢其时,改善我国的数字矿山建设的落后局面显得异常迫切。
【参考文献】
[1]徐豁,等.矿业地理信息系统及数字矿山若干问题探讨[J].煤炭科学技术,2003,8.
[2]李梅,董平,毛善君,等.地质矿山三维建模技术研究[J].煤炭科学技术,2005.
[3]胡金星,吴立新,杨可明,等.三维地学模拟体视化技术应用研究[J].煤炭学报, 1999, 24 (4):345-348.
关键词:管理统计学;教学模式;大数据;案例教学
中图分类号:G4 文献标识码:A doi:10.19311/ki.1672-3198.2016.33.147
1 引言
管理统计学是一门应用统计学方法和理论研究经济管理问题的应用性学科,它通过收集、分析、表述、解释数据来探索经济管理问题的规律,并辅助企业进行管理决策和提高管理效率。传统的统计学关注小规模数据下的数据描述、推断和科学分析用。与之相应,管理统计学的课堂教学主要关注统计学原理的讲述、小数据的推断分析和经济管理问题的简单应用。
然而,自2008年Nature杂志发表“Big data:science in the peta byte era”以恚大数据的发展方兴未艾,备受学术界,企业界等关注。大数据的理念和技术不仅在互联网、金融、机器人、人工智能等领域取得突破性进展,也将对企业的生产、经营和决策等活动带来深刻的影响,通过对企业大数据的深度挖掘,有助于实现企业的商业价值,规避企业的决策风险,提高企业的竞争力。
大数据时代的到来,对管理统计学来说既是机遇又是挑战,机遇在于:大数据的分析主要建立在统计学的基础上对数据进行处理、分析,从而使得大数据可视化;而挑战在于:当下管理统计学的教学方法和教学手段难以匹配大数据时代对数据分析从业者的要求,这就要求对管理统计学的课堂教学模式进行进一步的发展与创新,以期适应大数据背景下的新要求。
如何结合大数据时代的新要求设计合适的课堂教学模式,如何结合丰富的大数据应用案例开展课堂教学活动,如何增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才,这些都是大数据背景下传统的管理统计学课堂教学模式所面临的问题和挑战,这也促使管理统计学教学工作者不得不去探究、优化甚至改革现有的管理统计学课堂教育模式。
2 传统管理统计学教学模式的概述
笔者所在的教学团队来自于武汉科技大学管理学院,承担全院《管理统计学》课程教学任务,在教学方法、实践教学等有较为丰富的教学经验。然而,在多年的教学过程实践和与学生的教学互动当中发现:现有的管理统计学教学模式尽管相对较为成熟,在培养学生的数据分析意识方面起到的重要作用,但是仍存在以下不足,而这些不足恰恰难以适应大数据背景下对管理统计学教学带来的挑战。
2.1 注重理论讲授,忽视应用教学
受技术发展和数据规模等因素的制约,传统的管理统计学教学大都采用理论驱动的教学模式,教师依托教材,注重统计学基本原理和方法的传授,学生掌握基本原理,对统计学的实际应用等关注较少。
尽管管理统计学课堂教学会涉及到一定的应用案例,但是这些案例大都简单,陈旧,数据来源单一,难以接触实际原始数据,统计建模思路也相对固定,这些教学案例既不能反映管理统计学的最新发展和应用思想,也无法将其带入企业经营的情景,对企业决策过程缺乏了解,这些因素都使得学生对该课程的学习兴趣不高,不利于培养学生应用统计学解决实际问题的能力,进而影响课堂教学效果。
2.2 注重数学推导,忽视工具应用
管理统计学要求学生掌握一定的数学基础,教材也都有较多的数学公式和理论推导,忽视了培养学生应用SPSSvSASvR等统计软件工具解决统计问题的操作能力。
根据经管类专业的培养定位,对于经管类专业的学生而言,相比于统计的数学公式,真正实用的如何借用SPSSvSASvR等统计软件工具来解决企业经营决策面临的实际问题,尤其是在大数据背景下,需要处理海量、复杂、多源、异质的高维数据。这些是单凭数学推导和简单的手动计算无法完成的。
近年来,大数据、互联网等技术的快速发展催生了一类新型且前景广阔的职业方向-数据分析师。综合数据分析师的职业要求,可以发现,这些职位大都要求从业者了解基本的统计学原理和方法,熟练掌握SPSSvSASvR等统计软件工具,并应用这些工具解决企业经营管理面临的实际问题。
2.3 注重知识考核,忽视项目训练
受限于教学管理制度和考核手段等因素,目前管理统计学课堂教学考核方式大都以闭卷为主,主要考察学生对统计学基本知识点的掌握情况,以及学生应用统计学知识解决简单案例的综合能力。
然而,在大数据时代背景下,除了要求掌握统计学基本原理,更应培养学生应用统计学知识解决实际问题的综合能力,而这种综合能力往往涉及数据获取、数据预处理、数据探索、统计建模、模型检验、模型评价、模型解释、模型部署和模型修正等数据分析的全过程,这种综合能力的掌握是无法通过现有的知识考核来达到的,这些必然要求学生通过参与实际项目或模拟情景来实现。
3 大数据背景下管理统计学教学模式探讨
如何结合大数据时代的新要求设计合适的课堂教学模式,如何结合丰富的大数据应用案例开展课堂教学活动,如何增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才,这些都是大数据背景下传统的管理统计学课堂教学模式所面临的问题和挑战。而现有的管理统计学课堂教学模式难以匹配大数据时代对其提出的要求,这就要求对管理统计学的课堂教学模式进行进一步的发展与创新,以期适应大数据背景下的新要求。
摘 要:本文通过全面论述计算机图形学的知识结构体系与它在计算机科学教育中的作用与地位,提出把计算机图形学列入计算机专业的核心课程,以弥补“高等学校计算机科学与技术专业发展战略研究报告暨专业规范(试行)”与“高等学校计算机科学与技术专业公共核心知识体系与课程”中对计算理论“能行性”教育的缺失与应用软件编程系统训练的不足。
关键词:计算机图形学;计算机教育;核心课程;软件系统;应用开发
中图分类号:G642 文献标识码:B
1 引言
2006年,国家教育部高等学校计算机科学与技术教学指导委员会编制出版了“高等学校计算机科学与技术专业发展战略研究报告暨专业规范(试行)“(以下简称”新专业规范“)[1],该“新专业规范”指出:由于计算机专业是全国在校人数最多、高校开设专业最多的专业,这导致计算机类专业毕业生目前出现就业困难,其主要原因还是计算机人才的培养满足社会需要的针对性不够明确,导致了人才结构上的不合理。解决方法是分类培养、使计算机专业的学生能有相对优势的知识结构,高校教育应该为计算机专业现在的毕业生增加专业特色、增强就业竞争优势,等等。并由此提出了“高等学校计算机科学与技术专业公共核心知识体系与课程”(以下简称“核心课程”)[2]。无疑,这对全面规范并提高国内计算机教育的整体水平具有非常大的指导作用。通过认真学习研究这些内容之后发现,究竟应选择哪些课程作为计算机的公共核心课程供全国各行业人员作为学习计算机的基础知识,以及一些课程的教学内容应该如何安排,才能做到既拓展计算机专业学生的知识领域、又能增加学生毕业后的就业渠道等,这些都是大家不断思考的问题。而计算机“核心课程”的选择似乎对上述已有问题的解决帮助不够,而增加计算机图形学的教育对解决这些问题是一个值得借鉴的好方法,理由如下(不妥之处,请批评指正)。
2 计算机图形学课程列入核心课程,弥补本科教学计算能行性教育的缺失
作为具有全国指导意义的“新专业规范”,应该为计算机教育在多个行业方向的发展奠定基础,而抽出它们所共有的基础课作为计算机本科教育的核心课程,但现有的“新专业规范”的公共“核心课程”[2]只有
程序设计
离散数学
数据结构
计算机组成
计算机网络
操作系统
数据库系统
等7门课程内容,而把“计算机图形学”课程排斥在核心课程之外,这显然不利于计算机应用的全面发展,不利于计算机动画、游戏、图形标准、计算机仿真、计算机辅助设计与制造等计算机应用软件行业的全面发展,会缩小计算机本科生毕业之后的就业面,也与制定“新专业规范”的初衷相悖。
什么能被自动计算一直是计算机界探讨的主题之一[8],那些确切能用计算方法解决的问题如何设计才能被计算机自动计算简称计算的能行性(可计算性的实现前提),而程序设计与数据结构这两门课程是计算机编程的基础,它们作为计算机的公共核心课程是必须的。但这两门课程(该“程序设计”课程实为计算机程序设计语言+语句的简单应用,“数据结构”讲授程序加工的数据如何配合算法进行有效管理安排、以实现算法的功能)并没有从理论上解决计算机程序根据什么原则才能进行有效设计、以及程序如何构成系统后才能最后自动解决用户提交的计算问题,这是国内“程序设计”课程多年来悬而未决的老大难题。其原因在于:讲授程序设计语言时,学生还没有数据结构方面的知识,而数据结构本身既不讲模型方法、又不讲解软件系统等概念,同时这两门课程也缺少具有复杂计算模型的大规模实用软件编程的整体训练内容与方法,若把这些缺失的内容都加入到教学中,则一无足够的课时、二是改变了授课的性质。所以,从算法语言的角度介绍程序的设计方法是不完备的。
对于这个问题,计算理论早已从计算的机理与实现上予以解决。但计算理论的内容一般只在研究生阶段讲授,且计算理论是研究生的一个专业方向、即使该理论在研究生阶段讲授、学生理解也有一定难度,而把这套理论方法直接用于实践以解决实际应用问题难度更大[9]。即现有成熟的程序设计理论与方法没有通过适当的载体引进本科课堂教学中是现行教育政策最大的不足,而计算机图形学是直接从应用软件开发的角度阐述计算的“能行性”问题(见下述),当其列入计算机的核心课程后,既能弥补上述计算理论教育中缺失的一环,也能有效弥补上述7门核心课程中计算机应用软件编程系统训练不足的尴尬。事实上,GPU(图形处理芯片)与CPU在PC机上的发展并驾齐驱,证明计算机图形学是计算机科学中不可缺少的重要研究领域,可这些没有在“核心课程”[2]中得到有效的体现令人不解。
3 计算机图形学的知识结构体系
3.1 计算机图形学的研究对象、研究方法与基本教学内容
计算机图形学的最终目的就是用计算机程序的方法在计算机显示器屏幕上生成图像效果,特别是生成类似照相机拍摄的三维图像。而照相机拍摄三维图像是一个具体的物理过程,它的基本原理是光线在空间物体之间相互传播,当光线被物体表面反射并被照相机接收后形成的显示效果。由于人们能从二维照片上光点的亮度与大小判断出物体表面该点距照相机的相对远近,故人们常称这种图像为三维图像。用计算机程序的方法生成具有高度真实感的图形就是对上述物理过程的一种近似仿真模拟得到的效果。为了达到这一目的,人们根据仿真方法的要求,建立了仿真过程需要的各种模型(包括照相机模型,灯光模型,颜色模型,照明模型,物体的几何模型,物体表面的材质与纹理模型),通过①模型数据的输入(交互输入、编程输入、文件输入等)、②数据的存储与管理(系统参数文件、图形模型数据文件、规格化图形数据文件、物理显示设备的图形显示文件)、③数据的运算处理(物体的几何变换、全剖切运算、集合运算、三维重建算法、物体的各种变形运算等)、④数据的输出(各种线段图形的生成与实面积多边形的填充算法、着色算法、消隐算法、纹理映射算法、阴影算法,光线跟踪算法与辐射度算法)等4个处理过程,用系统编程设计的方法实现其图形显示[7]。
这里照相机模型描述了三维空间中的点、线、面等图形投影转换成二维空间中点、线、面等图形,并调用二维图形的生成算法生成二维图像,同时裁剪超出显示范围的三维图形、便于图形的正确显示。灯光模型与颜色模型描述了光线产生的根源、点光源的空间几何分布、光线在空间中的传播方向与衰减规律,光线的色彩属性、亮度计算方法与合成色的变化规律等内容。照明模型描述了物体表面反光或透光能力的计算方法。物体的几何模型描述了一个物体的点线面等几何尺寸与大小。材质特性描述了各物体表面对各种性质光线的反光与透光能力的大小。纹理模型直接描述了物体表面各点的显示细节与像素值。着色算法确定了用何种插值算法填充多边形网格表面、使其显示效果是多边形网格效果或是一张光滑的曲面效果。消隐算法确定显示物体表面的各个可见表面与边线,不显示其被遮挡的不可见的表面与边线。纹理映射算法就是把一张照片映射至物体的表面上(又称贴图),而这个照片既可以是实际照相机拍摄的三维照片,也可以是用数学模型描述并动态产生的结果。在场景中,由于某些遮挡物的存在,光线不能直接照射到某些物体的表面,使得这些表面反光(透光)的亮度暗于被光线直接照射物体表面的亮度;观察的角度不同,所见这种阴影效果的形状与大小不一样;阴影算法即在场景图中统一绘制这种阴影显示效果与非阴影显示效果。光线跟踪算法、辐射度算法就是仿真光线的传播过程以达到最后生成所需的图像效果。
事实上,在计算机图形学的应用领域中仅研究这些模型还不够,还要用程序设计语言与数据结构的知识把它们都转换成一个个可执行的算法,并用系统编程的方法把这些算法构成一个软件系统整体,才能方便各种图形的生成。而在这个软件系统中生成图形的第一步是构造多种物体的几何模型与形状(物体的几何变换、全剖切运算、集合运算是用简单物体构造复杂物体的有效工具之一,三维重建算法是用点、线、面等元素恢复物体外壳的几何形状),在统一的世界坐标系中确定它们的位置与朝向,再逐一确定物体表面的材质特性与纹理效果等,使这种多物体造型(称场景造型)满足实际应用的需要。第二步是设置灯光与灯光的特性,设置照相机模型等。第三步是在上述二步的基础上,统一用光线跟踪算法或辐射度算法生成上述场景造型所对应的三维图像效果(又称渲染)。
应注意:
① 试图精确的构造现实世界中所有物体、特别是具有复杂结构或微小结构或细微动态变化物体的几何模型既不现实、其代价也太大,人们总是想用其它的方法来代替,这就是所谓分形描述、粒子描述建模等多种其它建模方法的来源;
② 完全按照物理学上光线的传播方法来生成图像太费时间,光线跟踪算法、辐射度算法事实上是对物理光线传播方法的一种近似。这个近似程度一般由图像显示的真实感与计算的复杂度来确定。
③ 在上述场景造型的构造过程中,若物体运动或变形,灯光改变照射的范围、朝向、亮度、色彩,照相机改变拍摄的方向或跟踪拍摄,此时若连续拍摄(即渲染)三维空间场景效果,就形成了多帧图像,连续播放这些多帧图像就是计算机动画。
④ 所谓图形标准就是把上述的照相机模型、点光源的灯光模型、颜色模型、简单的照明模型、着色算法,以及点线面、多边形网格模型等模型与算法用硬件实现,并由图形标准提供软件接口方法调用这些硬件功能;当用户向该图形标准提供上述模型的描述数据与材质、纹理描述数据之后,计算机就能用硬件加速的方法实现在显示器中高速生成点线面、多边形网格,以及光照效果的表面、纹理效果等图形。目前的图形标准本身并不负责物体几何模型的构造,也不负责管理各种模型数据等。现图形标准主要以纹理映射算法为主,暂时还没有用光线跟踪或辐射度算法以实现三维图形的实时显示。可见图形标准仅是计算机图形学部分研究成果的具体实现。
⑤ 若能在上述场景造型中,让各种物体实时运动(照相机与灯光是具有其它功能的物体,它们也有几何形状,也能与人、动物等角色(多关节物体)一样进行各种运动),并能接收用户的交互操作、且这种运动过程具有故事情节性,同时这种多物体运动的效果能在计算机显示器屏幕中实时生成显示,这种计算机动画就是3D游戏(人类社会活动的仿真)。3D游戏另一个难点在于复杂游戏引擎的构造――即如何构造并管理游戏场景的模型数据(包括声音与人工交互操作等),使整个游戏画面达到实时显示的目的。事实上,3D游戏可以看成是计算机多媒体技术与虚拟现实技术在商业上的降级简单应用。
⑥ 物体的几何造型、变形与运动是计算机动画的一个难点,比体这个概念更复杂的是流体与场的模型构造、显示,它们能描述更广泛一类的物理现象,如台风的变化过程、风洞的实验效果、物体表面的应力变化现象、环境中热传递效果的变化、地质勘探结果的可视化显示等,一般人们把这些问题归纳在“科学计算的可视化”课程中讲授,因为这些流体与场的模型构造等需要比较深的数学知识。但是,一旦这些流体与场的几何数据模型确定之后,人们就能用图形标准显示它们。
⑦ 计算机辅助设计CAD与计算机动画的区别:在CAD中,也需要构造物体的几何模型并显示这些物体的构造效果,更重要的是还需要用数控机床把这些设计出的物体零件加工制造出来,故它对物体的几何模型要求特别高、特别是其误差控制,因为多个零部件组成的精密加工机床等最后影响加工的精度都与各个物体模型的误差精度相互关联。显然,在CAD领域中,也有零部件之间的联动等多种运动需要精密控制(机械运动与仿真)。与物体几何模型要求相比,CAD领域中物体的显示要求可以放低些。而在计算机动画中,相对而言,对物体几何模型的要求低,例如物体的外表面可以不封闭,只要这个不封闭的外壳表面破绽不被照相机拍摄到就可以了;但计算机动画对最后渲染的图像显示质量的真实感效果要求很高。
⑧ 二维图形与三维图形的区别:这两者的区别除了其数学模型一个是二维的、一个是三维的之外,更大的区别还在于二维图形学只能从数学上研究图形的基本规律(点、直线、曲线、平面与形状,位置,运动与变形,色彩等)、以及图形的模型构造与显示方法;利用二维图形的简单性,可剖析计算机二维图形系统的组成,即软件系统是一个能自动运行的程序,它能从输入、存储、运算处理、
输出等方面全面处理用户在某个领域中提出的诸多数学模型并完成其模型描述数据的加工任务,使用户很容易明确这种软件的组成、功能与使用范围。三维图形学却可以用数学模型的方法研究自然界中的多种物理现象,由此探讨大自然中多种物理现象的变化规律,并能用图形显示的方法来表现这种变化过程,这种方法正是人们探索自然并进行科学研究所倡导的基本方法之一。因此,从三维图形学的基本教学研究内容可知,用图形方式(可见的点线面、色彩、纹理)显示各种物理现象的变化过程只是一个表面现象,关键的是要掌握这种变化过程的物理机理并能用数学模型的方法全面正确的描述这种变化(即用图形的方法表达计算机信息数据的含义非常适合人们观察自然、了解自然现象与变化规律,而计算机的信息描述数据是由具体的各种物理变化过程确定的),即掌握计算机仿真与科学研究方法才是学习计算机图形学的真谛,也即用计算物理学的基本思想能统一传统意义上计算机图形学与计算机辅助设计学科中的基本研究内容。计算机专业的学生有了这种方法后,再深入其它各应用学科领域,努力掌握其物理原理、科学实验与数学模型方法等知识,并与行业专家相互配合,计算机与计算工具就在各专业领域的科学研究与系统设计上大有用武之地了。
综上所述,可以给出计算机图形学如下定义:
计算机图形学属于计算机应用软件的研究范畴,它主要通过物理原理与数学方法,建立描述自然景观(虚幻世界)的几何数据模型与显示图形的物理数学模型,以达到用程序的方法把这些模型的描述数据通过算法转换成在计算机显示器中显示自然景观图像的目的。本质上,用计算机生成三维真实感图形就是用数学模型的方法仿真光线在物体之间相互传播而产生的显示效果或把光线传递的效果即照片映射至物体表面上所产生的显示效果。
国内计算机图形学教育工作者已认识到计算机图形学在计算机学科教育与科学研究中的重要性,并于2001年公开出版计算机图形学教材支持上述观点[10]。但由于这些观点没有引起国内计算机界制定政策的主流阶层人士的关注,相反,从2000年开始,计算机图形学的内容却从全国范围内的计算机专业等级考试中消失,这不能不说是国内计算机教育的一大损失。
而计算机图形学的授课关系见4.1节。
3.2 “新专业规范”中,计算机图形学的教学内容有待改进
“新专业规范”中计算机图形学的教学内容主要放在计算机图形标准的使用上,核心内容只有图形标准、照相机模型,图形显示设备与输入设备,前期课程要求计算机程序设计语言与离散数学,并只安排8个课时来讲授这些内容,其它的内容作为选修内容(这包括各种图形的生成算法、物体几何模型的描述方法,计算机动画,可视化,虚拟现实,计算机视觉,人们对色彩的主观感受、如何用色彩方式表达设计作品的主题思想,等等)。这种教学安排能使学生掌握图形标准的使用、以及照相机模型的应用,很容易导致学生误认计算机图形学就是在显示器上绘制各种图形这种认识偏差。
这种教学安排不当之处如下:
首先,计算机图形学的前期课程应该是程序设计语言与数据结构。实际上,不学离散数学并不影响学生编写图形学的各种应用程序;但不学数据结构,则编程困难;而且授课学时数太少。
其次,图形标准自成体系,但它不能构成一个完全自动运行并具有图形数据输入、存储、运算处理、输出等处理全流程功能的软件系统,它往往需要用户在应用软件中向图形标准输入模型数据并调用其各函数才能出现所需要的图形显示效果。初学者原指望学了计算机图形学,就知道象3DS MAX与OpenGL等软件中是如何编写程序并实现各种动画图形的显示,但授课结果却令人失望。
第三,由于初学者一般缺少对计算机图形学的全面了解,缺少对计算机图形学的研究对象与研究方法的认识,也没有图形系统的概念,该“新专业规范”授课大纲中虽有物体几何模型的描述方法但缺少在图形系统中具体建造物体几何模型等实例;另大纲中授课内容的逻辑关系非常不顺畅(例如把计算机视觉作为计算机图形学的一部分对待并讲授值得商榷,虽然人们期待从计算机视觉图像中获得图像的模型描述数据并一直朝这个方向努力,但计算机图形学与计算机视觉的研究方向与研究方法毕竟有很大的区别),也没有总结出计算机图形学的核心概念,且对计算机图形学的认识仍停留在图形学由各种算法的集合所组成的认识层面上,很难正确体现计算机图形学在科学研究中的重要作用。若授课内容掌握不当易使教学与学习迷失方向,或再次导致计算机图形学课程被计算机专业边缘化,这也是多年来国内同行反映计算机图形学难教难学的原因之一,这显然与当今计算机图形学在计算机科学中的发展潮流相悖。
第四,图形标准只是计算机图形学部分研究成果的具体实现,当初国外为什么会选择图形标准而不是选择计算机动画为案例作为讲授计算机图形学课程的主要内容,作者认为可能有以下原因:
① 历史的原因:因为图形标准是计算机图形学最早、最成熟的研究领域,后才有CAD、游戏与动画等;且图形标准在各个行业都有广泛的应用,而CAD、游戏与动画是一个具体的专业方向,教学难度大。
② 商业发展的需要:图形标准用硬件实现后,已经成为个人计算机的标准配置,这就促使人们更加专注图形标准的发展。
③ 国外的教学体系不一样:美国的计算机工业、图形学产业与计算机教育均位于世界领先水平,但全美国并没有强制性的计算机教育指导大纲,可是美国各校的计算机教育各有特色,他们对计算机的各个方面都有涉及、且各种层次的计算机课程都有,这种宽松的教育体制有利于科技成果与教育的创新培养。以图形学课程为例,若你需要继续深造,它还有许多图形学的选修课、提高课程(如计算机辅助几何设计、数字几何处理、曲面造型与设计、CAD、计算机动画、游戏、计算机程序设计方法等等)以及最新的学术论文等待着你、直至让你从这种授课体系中走向学科的最前沿与商业开发――即虽然他们的某一门基础课不一定很完美,但他们可以从完整的授课体系中,让你掌握计算机图形学等计算机应用学科的全部内容;但这也同时留下了因为课程划分过细,使人不容易一下掌握学科内容的全貌而留下遗憾。可是国内的计算机教育与国外不一样,首先,国内的高校没有条件开设那么多的计算机选修课;其次,若是全国性的计算机教学指导大纲不全面、不权威的话,就会在计算机学科的发展道路上留下无可挽回的遗憾。
④ 出于知识产权的保护,美国没有一本书的教学内容是一样的(包括CC2005中关于计算机图形学的知识结构体系的论述),这固然便于知识创新,但却不利于优秀知识的继承与传授,结果使得每本新书的内容与体系都不一样且庞杂,这对初学者是一个极大的负担,需要教师认真抽取众多书籍的有效内容,成系统后传授给学生,才能有效的提高学生的学习效率,2000年以前国内外计算机图形学的教材内容与体系的不够成熟,也是造成国内计算机图形学授课不能得到有效重视的原因之一。
⑤ 由于以上原因,美国人并没有把计算机图形学作为计算机学科的核心课程,这使得美国人的计算机图形学课程的教育落后于其计算机图形学等商业软件开发等应用,这是一个不争的事实(在美国,教材与授课基本上是老师的个人作为,商业软件的开发是团队作为并有经济利益作为支撑,它能不断发展并自我完善)。也有很多国际人士认识到计算机图形学的教育出现了问题[4],显然,仍把计算机图形学定义为在显示器上显示各种图形是过于简单,这是没有正确地把计算机图形学学科的发展规律引入教育部门、忽视计算机图形学在各行业领域中的具体应用与需求的一种表现。因此,全面认真研究美国人在计算机教育与计算机工业的发展规律、商业软件开发等多种优缺点,再针对国内计算机教育中存在的不足,提出解决问题的方法应该是国内计算机教育界值得深思的问题;显然,仅用跟踪所谓国外先进的教学方法与理念也有不全面的地方。
4 计算机图形学课程在计算机科学教育中的作用与地位
4.1 计算机图形学是计算机应用软件编程思想系统训练的重要基础课程
数据计算、数据存储与检索、数据联网通信是现代计算机的三个最基本的应用。在这三者中,对于数据存储,一般有数据结构课程与数据库系统软件分别介绍其基本原理与大规模数据的系统管理等软件应用;对于数据联网通信,一般有通信技术、计算机互联网等课程、WinSocket技术等介绍其基本原理与实现方法;对于数据计算,一般有算法语言、编译原理、自动机理论等课程介绍其原理,计算机科学与技术专业追求的目标是:用形式语言与自动机理论,通过形式化和模型的建立,构建系统,进行模型计算。但这些内容抽象、内容难以理解、难以直接应用解决实际应用问题[9],计算机专业的本科生学习这一方法尚有一定难度,非计算机专业的学生更不会接触编译原理与自动机理论等,这就造成一般学生在学习计算机进行编程计算的问题上存在知识缺陷,而计算机图形学课程的授课正好可以有效的解决这个问题。
国内新一版的计算机图形学的授课方法[7]:首先,以二维图形为例,从理论上全面解决了图形系统软件的构建方法以及图形数据处理流程的全过程,使初学者牢固的树立起软件系统的概念;其次,为了用计算机仿真的方法在显示器中生成三维真实感图形效果,建立了描述各种物理现象的多种数学模型(见上述),这些数学模型的描述数据都能通过图形模型数据文件的方式保存在计算机图形系统中供系统内部程序调用,以仿真方法生成三维图像。也就是说,①系统与模型的数学与形式化的描述方法;②按系统数据处理流程,用算法语言与数据结构等知识把模型数据的处理方法全转换成一个个程序,以实现其数据处理的全过程等任务;③编程实现时,需根据计算机的配置与用户的经济要求,合理考虑所选算法的复杂度(或选择优化算法实现图形功能);这三者是计算机编程计算的基本步骤与要求,是实现可计算性的三个条件――即计算机图形学既成功探索了一般典型的计算机应用软件系统开发的基本规律,又用可视化的方式表达了其程序数据运算处理的最后结果,这为该课程成为初学者学习计算机程序设计方法的首选课程之一奠定了基础。
若没有计算机图形学等编程课程的系统训练,计算机初学者一般只能通过实际大型软件项目的学习与训练(或继续深造),通过自我总结与提高,才能全面地掌握这种编程与数据计算等知识,而这种机会不是人人都具有的,其付出的代价也将是巨大的。例如现在一般计算机本科专业的学生虽然能熟练的掌握3ds max软件的操作使用,但不清3ds max软件是如何编制而成,就是现阶段本科教育存在缺陷的具体表现。
通过数据结构的学习,使学生明白:算法+数据结构决定程序设计;但计算机图形学的授课能使学生进一步明白:算法不是从天上掉下来的,它们是由用户解决实际问题建立的物理数学模型、并抽象出模型描述数据之后,提出处理其数据模型的基本方法与步骤;而数据结构是记录该模型的描述数据、以及根据算法的需要构造而成、以配合保存各种中间加工数据或最后加工结果;编程者只有把这些解决问题对象的多种模型编写成软件系统之后,才能完满的完成程序设计的任务――即计算模型及对模型的变换与运算处理方法决定了程序设计的算法与数据结构。
4.2 计算机图形学的教育体现了计算机学科的科学性
计算学科是指通过在计算机上建立模型并模拟物理过程来进行科学调查和研究。该学科是对信息描述和变换算法的系统研究,主要包括它们的理论、分析、效率、实现和应用[6]。在目前所见的计算机教材中,只有计算机图形学是按照这种理论体系组织教学内容的。这些教学内容是人们耳熟能详的物理原理与相对简单的数学知识在计算机中的综合运用,是计算机学科科学性的具体表现之一――只有把计算工具直接应用于科学研究中,这种计算工具与方法具有科学性才有说服力,而计算机仿真是科学研究中常用的一种有效方法,复杂的数学计算又是仿真建模的基础,从这个意义上讲,仿真与复杂的数学计算等都是科学研究中重要的研究方法之一。这样,该课程就很好的解决了“新专业规范”中人们对“数字科学计算”的认识不统一而导致该课程的教学内容与要求不详等问题,很好地使计算机的应用回归其本来面目;
4.3 用图形方式表示计算机信息数据的含义,比用数字符号方式表示其含义更高级、更自然,也是计算机科学研究的对象之一
用文字符号方式描述客观世界是对客观世界的一种抽象,是对客观世界的一种不完整的描述;而人们感受客观世界最自然、相对全面的是用眼睛观察客观世界,它可以较准确的确定客观世界中物理现象的存在与变化规律,这个方法运用于计算机中,就是用图形方式表示计算机信息数据的含义,这种表示方法比符号方式表示信息数据的含义复杂,表示的信息量大,对计算机的硬件要求高。在计算机的多媒体信息表达方式中,图形方式是处理过程最复杂的、也更符合人们的观察习惯。故用图形方式表达信息数据是一种表达信息数据含义的高级表达方式。
现代计算机的应用,不仅是数值计算与数据管理、还表现在工程设计中,人们用图形方式来表达设计人员的设计思想、设计方法,以及设计作品的体系结构与功能等,它能充分表达设计人员的形象思维方式,这种表达方式不仅要求能用计算机表达出来,而且要求计算机能接受人们用这种方式向计算机输入数学模型,这些都是计算机科学面临的新课题。例如古代三国时期,诸葛亮造木牛流马搬运粮草,史书虽然有文字记载其构造方法,但后人却无法复原这种运输工具。在没有实物的情况下,只有用图形方式表示该运输工具的基本构造方法才能使后人复原这种古代的运输工具。对于这类复合结构的复杂物体与运动形式即使用几何数据对它详细描述,若不借助图形方式来表示其几何形状与结构等信息,人们对它的理解也会发生困难,这就是现实中用符号方式描述与图形方式描述(抽象描述与形象描述)信息含义之间的差别。经验告诉我们:在计算机中,信息数据的描述方法不同,往往导致编程的方法与效果也不同,若我们不进行这种方式的培训,就会落后于计算机时代的发展。
4.4 掌握计算机配置的常用工具,是计算机应用的必要条件
传统计算机学科的授课内容,并不直接讲解如何进行科学计算等问题,而是为解决复杂的科学计算等问题提供软件服务工具、方法与手段等。例如,从大量应用中(包括软件编程),找准、预测用户的需求;然后,从中抽象其具有共性的方法与难题,并把它们上升为理论,最后把这种理论开发成工具与系统方法,供用户使用;操作系统软件、汇编语言与编译系统、高级语言与编译系统、软件工程的概念与方法、面向对象的软件开发语言等都是这样逐渐发展起来的;同样的思路,为了计算机的应用,人们开发了办公自动化软件、数据库系统软件、网络浏览器、三维图形标准等各种工具,等等,用户用这些工具能更高效率的开发应用程序。但是,这种授课方式却把用计算机解决科学计算等应用问题留给具体的应用部门与用户对应用软件的具体开发,而课堂教学一般缺少这方面的系统实例,这也是导致目前计算机本科生应用软件系统开发能力弱的原因之一。
但当计算机学科发展到用可视化软件开发应用程序,而计算机的基础教育却忽视这种发展潮流与技术进步(现有的计算机公共核心课程没有计算机图形学的内容),这只能使我们的应用软件的开发水平仍停留在上世纪70年代的字符表现水平上。因此,计算机本科教育中,使学生掌握计算机配置的常用工具是计算机应用的必要条件,这当然包括让学生掌握计算机三维图形标准这个有用工具。
4.5 计算机图形学是嫁接多学科的桥梁,是科学研究思维能力训练的延续与有效方法之一
大学的教育,除了要求学生掌握一门专业的系统基础理论知识与应用外,关键是要掌握“根据任务与需要,学会从中发现问题、分析问题、提出解决问题的方法,建立解决问题的数学模型,直至用物理实验或软件编程的方法解决发现的问题”这种工作能力以及继续学习深造的能力。只有这样,计算机专业的学生才具备自我获取知识和探索解决问题的能力,并使自己在新的工作岗位上做到既是计算机方面的专家,也是行业领域的专家助手,计算机专业的学生才能更好的服务于社会,造福于自己。
什么样的课程能做到使他们具备自我获取知识和探索解决问题的思维能力?传统上大学物理与数学课程的教育是培养这一方法的有效途径。因为物理学是蕴藏科学方法论的宝库,物理不仅包含了物质世界的运动规律,同时蕴涵了丰富的哲理和研究、思维方法,对于培养创新思维有着独特的优势。这种独特的优势地位决定了大学物理在培养全面发展型人才中的特殊作用。显然,知识的内容是有限的,而思维的创造力是无限的。物理学若干世纪以来的辉煌成就,使之创造了一整套行之有效的思想方法和研究方法,据专家统计,在300种通用的科学方法中,物理学包含170种,占56.7%。在大学物理课程中,学生可以接触到实验的方法、观察的方法、科学抽象的方法、理想模型的方法、科学归纳的方法、类比的方法、演绎的方法、统计的方法、证明和反驳的方法、数学模型的方法;还可以学习到科学假设的方法、对称性分析的方法以及定性和半定量的方法等等。同时,物理课程中还包含了无数著名科学大师许多深刻的物理思想和精妙的哲学思辩,尤其随处可见前辈科学破除权威,敢于怀疑,大胆创新的许多生动鲜活的事例。这些闪耀人类智慧光芒的科学方法和科学精神,对提高学生的科学素养,培养他们的探索精神和创新意识,都会产生积极而深远的影响,起到其他课程无法替代的作用[3]。
但传统上计算机课程内容的安排中断了高等数学与大学物理的学习与后续计算机课程学习的相互关系,一些搞计算机工作的人员会片面地认为不学物理与高等数学也一样能学好计算机课程、一样能从事计算机工作。而计算机图形学课程的教学是嫁接大学一年级的高等数学、大学物理与三年级计算机专业教育的有效桥梁,是物理、数学知识在计算机应用领域中的具体应用。而计算机图形学编程思想的训练,特别是探索解决物理问题的数学模型的各种研制方法与思维能力,对各种行业面临实际问题的解决与计算机应用软件的编程具有典型的示范作用――即不同的应用领域、待解决的物理问题与性质不同,其建模解决问题的方法也不同。这种思维方式能告诉各专业学习计算机的学生:通过建立软件系统、并用模型与仿真的方法指导工程实现(例如实现计算机图形显示)是工程应用中的典型方法之一(自动控制、通信、雷达系统工程中都是先用系统的数学模型与仿真方法确定系统工作参数后,再考虑其具体系统的物理实现),这种思维方式是目前计算机公共核心课程与“软件工程”课程所缺少的。具备这种知识与能力,无疑为计算机专业的学生拓展新的发展方向、为计算机专业的学生向其他应用行业的转行做好了思想准备。
4.6 计算机学科的发展是为了应用,而计算机图形学是计算机科学计算等应用的典型代表
计算机科学与技术主要以计算机产业的形式出现在人们的日常生活中,是人们生活、学习与工作的有效计算、存储查询、娱乐等辅助工具之一。计算机科学除了要探讨计算理论自身的发展之外,还要探讨产业的发展,探讨用户的应用与需求;再强大的计算机、功能更全面的开发工具,也需要更复杂的计算机应用课题做支撑,这是计算机学科发展的两条主线。计算机学科的核心教育仅局限于计算理论自身的发展是不完善的,而计算机图形学在计算机动画、3D游戏、图形标准、计算机仿真(如天气预报、大规模地质勘探数据处理、模拟原子弹爆炸与理论设计、模拟汽车碰撞、电磁辐射设计、计算流体力学等应用都需要用图形方式表达其结果)、计算机辅助设计与制造等领域的大量应用,代表了当今计算机科学应用的发展水平,是推动计算科学向前发展的源动力之一,不能再被计算机教育界所忽视。
基于以上理由,相信计算机图形学成为计算机公共核心课程是可行的!
未经授权,谢绝在公开的商业出版物中复制、引用本文之观点与内容。
参考文献
[1] 教育部高等学校计算机科学与技术教学指导委员会.“高等学校计算机科学与技术专业发展战略研究报告暨专业规范(试行)”[M].北京:高等教育出版社,2006.
[2] 教育部高等学校计算机科学与技术教学指导委员会.“高等学校计算机科学与技术专业公共核心知识体系与课程”[M].北京:清华大学出版社,2007.
[3] 陈菊梅.论大学物理教学对学生创新思维的培养[J].高等教育研究学报,2006,(9).
[4] 石教英.需重视工程科学的可视化学习[J].国际学术动态,2005,(3).
[5] 蒋彦等.关于数学建模思想融入课程教学的研究[J].高等教育研究学报,2005,(3).
[6] 蒋宗礼.认识计算学科分类培养优秀人才[J].计算机教育,2006,(5).
[7] 魏海涛.计算机图形学(第2版)[M].北京:电子工业出版社,2007.
[8] 赵致琢.计算科学导论(第三版)[M].北京:科学出版社,2004.
在余额宝令天弘基金一举成为国内规模最大的基金公司后,公募基金再也不能无视互联网技术对本行业的冲击,开始积极谋变。
迄今,互联网对各传统产业的颠覆性影响已得到广泛认知。与一些业态被完全改写的行业相比,互联网对金融领域的冲击才刚刚开始――公募基金首当其冲;而在整个证券投资领域,互联网在资讯、研究、产品、销售等各方面,都在推动市场转型;甚至连银行这样的金融领域“巨无霸”都险些被余额宝撼动。
随着互联网金融方面的创新不断涌现,金融机构与互联网公司合作的深度、广度将极大拓展,创新能力将决定金融机构在未来行业中的竞争地位。
量化“投资者情绪”成创新热点
按照宣传,“新浪-南方”指数是“在南方基金量化投资研究平台的基础上,通过对新浪财经频道和微博财经大数据予以分析,找出股票热度预期、成长预期、估值提升预期的关系,构建策略因子,精选出具有超额收益预期的股票,编织成最终指数”;而“百度-广发”指数,是“以百度网页搜索和百度新闻搜索为基础的数据分析应用指标,可以反映不同关键词在过去一段时间的用户关注度和媒体关注度,也是利用互联网大数据挖掘投资者金融行为的工具。”两者皆指向互联网上投资者情绪的量化应用。
投资者情绪受到重视有内外两方面的因素:一方面,传统、教科书式的投资理论没有纳入对投资者非理的分析,因此,对股价的解释力差强人意。这在过去数年A股市场表现得特别明显。股价很大程度上是被“事件――情绪”所驱动,A股投资者越来越意识到了非基本面的市场情绪因素的重要性,迫切需要对其进行分析。另一方面,互联网进入大数据时代,为投资者情绪的挖掘和量化准备了技术条件。
股市中有一个说法,叫做“唯一确定的事情就是不确定”。而股市之变幻莫测,外部事件冲击固然纷至沓来,但投资者对事件的理解和反应,其复杂性往往更胜一筹。面对类似事件,投资者反应甚至截然相反。其中一些财经政策和数据的,市场反应还可以用预期来说明;而更多事件的反应脱离了当时市场心理状态则完全无从解释。
例如,“上海自贸区”概念股走出了一波大幅上涨的行情,同为区域经济政策题材的“京津冀一体化”概念股却表现一般。再比如,近一年多来驱动军工股、信息安全概念股的热点事件不断,两类股票总体上也表现强势,但若试图将事件强度与股价表现做一一对应,则难免失望。从某种程度来说,投资者的反应比事件的发生更难预料。
简而言之,在事件和股价之间,并不必然存在按图索骥的对应关系,必须考虑到投资者情绪所带来市场反应的复杂性。按事件分类,少数事件重要到足以成为股价变化的充分条件,投资者情绪无法不被引爆,这就像是一个物理反应;而多数事件对股价的影响可看做一个化学反应,投资者情绪就是催化剂――情绪爆发就发生反应;没有情绪就悄无声息。
风险偏好频谱
从理性角度看,A股市场上存在着太多无厘头的“因果关系”。例如,文章出事,网民支持马伊,伊利股份(600887.SH)上涨;奥巴马两次当选美国总统,澳柯玛(600336.SH)均涨停;局势紧张,名字中带“日”的股票下跌;李某某出事,ST天一(000908.SZ)跌停……上述现象用一种极端方式凸显了投资者情绪对股价的影响力,而与基本面完全无关。
市场情绪其来有自,所谓“投机如山岳般古老”,揭示的是人性不变。市场情绪来自于人性,很多投资者不完全由意识层面的理性做主,来进行分析判断和选择,而是屈从于潜意识的驱使,潜意识起作用的表现是激素水平激增,导致放纵情绪、任性而为。
很多投资者在买卖股票时,自认为有着合乎理性的诉求,例如,财务需要;以及恰当的操作理由,例如,基本面、政策、消息等。但真正的推动力来自潜意识层面,是激素水平的作用。其行为于是背离了财务需要的初衷,表现出赌徒心理或娱乐心理(寻找刺激)。这种非理性情绪时刻在寻找宣泄突破口,借助某个事件,再凭借意识层面的借口(比如以往经验),走向非理性操作。绝大多数投资者没有意识到上述情况,或者意识到了却无法自控,在股市中成为自身情绪的俘虏,即使建立了交易系统也难以执行。
A股基本盈利模式主要是做多,个股做空实现难度大,所以投资者情绪的宣泄在买股票方面体现得更加淋漓尽致,各种炒作类型应有尽有。在真实的A股市场中,恪守基本分析原则的理性投资者固然是极少数;看见奥巴马当选就去买澳柯玛的也并不多。如果建立一个A股投资者风格的频谱,那么按照“炒名字”、“炒代码”、“炒题材”、“炒概念”、“炒地图”、“炒行业”、“炒业绩”的次序,风格由完全的非理性而渐入理性。
而在总体上,市场风格也在理性和情绪之间摇摆。价值投资占主流的2002年-2007年,投机炒作依然不断;而在投机气氛甚嚣尘上的近两年,事件和股价的因果关系上也非全无逻辑。
只不过由于近两年极端投机行为屡屡得逞,市场情绪愈发肆无忌惮、不顾逻辑。相对应的是,投资者对于情绪的重要性也愈发重视。
尤其是市场短期内大幅波动、而基本面并没有巨变时,情绪影响显然是更好的解释。诺贝尔经济学奖得主罗伯特・希勒对1987年10月19日美股大暴跌的问卷调查中问到“哪一个理论更能描述你对股市的看法:关于投资者心理的理论,还是关于基本面的理论(例如企业利润和利率影响股价)?”调查样本中67.5%的机构投资者和64%的个人投资者选择了投资者心理理论。
不过,以时间为轴,假如A股出现风格转变迹象,则风格频谱也将发生相应改变。
把时间拉得更长,不同时资者身上也可以看到巨大的风险偏好差异。
1949年后,中国第二次人口高峰出现在1962年-1976年,2007年大牛市出现之际,这批人是购买股票和基金的主力军。大致上说他们的成长期,无论中国经济还是个人际遇,总体上处于上升。这难免助长个人盲目自信和过分乐观,这也是2007年A股达到惊人估值的因素之一。
其中很多投资者其实是抱着娱乐态度在炒股,表面上是为了财务原因,但实际上是在寻求刺激。他们所生活的时代娱乐还远没有产业化和专业化,股市涨跌带来的刺激还相当有吸引力。
80后、90后就完全不同了,他们拥有丰富、较高质量的娱乐服务,根本没必要在股市中“找乐子”,因此,对股票投资的诉求更多基于财务上的需求。当股票不能提供年化的稳定收益时,干脆去买余额宝。
虽然80后、90后的绝对生活水平肯定高于前一代人,但由于连续遭遇了升学、就业、买方等方面的激烈竞争,因为对世界的相对感受不如前一代人乐观,所以对待投资将会更理性一些。
也就是说,若对未来A股投资者风险偏好变化做预测,较大可能是情绪化和风险偏好的降低。这也被很多成熟市场已走过的历程所验证。
情绪化炒作
投资者情绪不但在“马伊”、“奥巴马”这样的人名炒作中发挥着作用,也从根本上影响着市场结构。
首先,从现象来看,股市中或多或少存在着索罗斯所称的“主流偏向”,即有别于事实的投资者带有倾向性的认知。假如投资者整体上表现理性,就可以自行纠偏,使得股价不至于过分偏离基本面。可事实上,由于情绪(比如贪婪和恐惧)的作用,投资者不但未能纠偏,反而任由“主流偏向”越走越远,严重地偏离了基本面,形成股价泡沫。可以说,在各类资产泡沫中,市场情绪有着比基本面更强的影响。而且不乏推波助澜的“主动投机者”,即看到了市场情绪可以利用,于是制造舆论、影响情绪、操纵股价,从中牟利。
其次,在上述现象中,投资者之所以无法冷静面对市场波动,能力不足是根本。主观上懒惰是能力没有得到提高的重要因素,而懒惰也是一种任性而为的情绪化表现。对于多数投资者来说,由于驱动买股票的是激素水平,根本没耐心、没能力做出基本面的研究和判断,只能随着情绪妄动,追逐短线强势股。能力需要培养,“低能力”之下的冒险操作,与缺乏培养能力的主动意识和意志力,二者都是懒惰的任性之举,并有可能形成恶性循环――越缺乏能力就越情绪化,以及越情绪化就越无法提高能力。
最后,造成上述现象的,除了懒惰的主观因素外,信息爆炸的冲击也不可小视。面临各种观念和海量资讯冲击时,如果认知体系没办法将所有这些信息包容消化,就必须采取一些自我保护措施,将绝大部分信息屏蔽在外,以免认知系统陷入矛盾和混乱。这是一般人的正常反应。但这样一来,就不可能保留较高的开放性,而错失了学习知识、整合信息、提高综合判断能力的机会。
可以说,人的记忆力、注意力,乃至心智模式的有限性,是提高能力的根本性客观约束,如果再与主观上的懒惰叠加,走向情绪化操作不可避免。在此情况下,当投资者产生买股票的需求时,就只能在有限认知和无意识选择性接受的信息中寻找目标。此时起作用的信息,一定简单、易得、易懂,股票名字的炒作就是一个例子。
综上,情绪驱动下的操作必然与简化粗陋的认知判断相伴,导致投机盛行。炒人名是情绪化炒作的极致。
投资者情绪研究
传统投资理论精确化的数学模型是建立在“理性人假设”基础上;而在真实的投资行为中,潜意识层面难以自控的情绪驱动,是很多买卖操作的深层原因,是根深蒂固内在人性的外在表现。由是,如何将“非理性主导”的“行为金融学”作为起点,对投资者情绪进行量化分析、建立模型、挖掘商业价值,成为迫切任务。
以往投资者对市场情绪影响的重要性也有定性认识,并且发展出一些草根调研式的调查方法,例如,在营业部数人头等。此外,也发掘出了一些相对专业的投资者情绪研究方法,却各有缺陷。一是对特定对象的问卷调查,调查对象包括媒体、机构投资者、个人投资者(以及上述的综合),样本多在几百个上下。存在的问题除了样本太小,还有受调查者是否诚实作答,以及知行是否一致等。
二是通过“交易类型指数”和“衍生品交易指数”来分析,例如,保证金借款变化(Change in Margin Borrowing)、未补抛空差额变化(Change in Short Interest)、认沽认购比率( PU T/ CALL)、期望与当前波动率比(VOL)等。从逻辑关系上看,这是一个“结果指数”,是用交易后的数据来预测未来,与大数据技术可能实现的前瞻性研究不同。此外,这也取决于金融市场衍生品发达的程度,这样才能从“做空”、“加杠杆”等操作行为中提炼数据。
三是市场价格所反映的“隐形投资者情绪”,例如,封闭式基金折价率、IPO上市首日收益率等。这受到特定因素的影响较大,比如封闭式基金折价率可能与封闭式基金的投资者结构有关,中国的新股不败神话让IPO上市首日收益率也没有那么大的差异。
总之,固有的分析方法受到技术条件限制,无法对投资者情绪进行高质量的研究。而大数据时代这个局面有望打破,近年来国外一系列相关应用多取得了很好的预测效果,例如,2012年美国总统大选、Facebook上市首日表现等。
构建前瞻指标
与既往的投资者情绪研究方法相比,大数据预测在表征上有着采样数据庞大、样本多维等差别。更根本的,是大数据预测在逻辑上确实有可能找到前瞻指标。
2012年5月18日,Facebook(NASDQ:FB)上市,社交媒体监测平台DataSift监测了当天Twitter上的情绪倾向与Facebook股价波动的关联:在Facebook开盘前,Twitter上的情绪逐渐转向负面,25分钟之后,Facebook股价便开始下跌;而当Twitter上的情绪转向正面,Facebook股价在8分钟之后也开始了回弹;接近收盘时Twitter上的情绪再度转向负面,10分钟后Facebook的股价又开始下跌。该机构得出结论:Twitter上每一次情绪的转向都会影响Facebook股价的波动。
过去的投资者情绪研究和一些股市技术分析(例如波浪理论)事后解释有一定作用,却很难在逻辑上被证明是前瞻指标。而大数据技术,通过采集投资者在互联网上留下的痕迹,按照“情绪表达――买卖操作――股价变化”的逻辑顺序,将投资者情绪量化,从而完成对股价的预测。
如前文所述,激素驱动、难以自知和自制的情绪,深深埋藏于基因中,是根深蒂固的人性表现。因此,投资者情绪逻辑上有成为股价的前瞻指标。
不但投资者情绪的量化有一定内在逻辑性,在大数据应用的其他领域,同样有着较直接的因果关系。
例如,淘宝上的不同类别商品的询价行为,按照一定转化率,准确地导向购买行为。询盘数在逻辑上和事实上是购买数的前瞻指标。
马云曾表示其提前8-9个月预测到了金融危机。海关要实际出货后才能获得数据,而阿里提前半年从询盘数急剧下滑推断出世界贸易情况将变盘。这才有了2008年7月马云给阿里员工的公开信,预言“冬天来了”。
最近一年备受关注的打击基金老鼠仓,同样是证监会、交易所通过数据挖掘来发现的异常操作。在缺乏其他手段和证据的情况下,仅凭借大数据和基本的逻辑推断,就挖出了不少老鼠仓。
看到市场的“底牌”
当然,上述前瞻指标特征是从总体来说的。对个人而言,不但理性投资者(能够控制情绪)不属于这个研究范畴,就是不用互联网发言的人(有情绪但不在网上表达)也没法研究。好在大数据之“大”,就在于挖掘能力不一般,例如Datasift每秒可实时挖掘12万条Twitter内容,足以找到所需的样本数量。
还有,以往的量化投资方法在因果关系上也缺乏明显的逻辑性,特别是仅以交易数据进行的挖掘,当市场结构发生转变,参数只能是后知后觉地跟随调整。
运用大数据进行的投资者情绪量化挖掘,因果关系清楚,一旦模型成熟,就等于看到了市场的“底牌”。
如果说以往的量化投资是金融学和数学的结合,那么通过大数据,新的量化投资可以实现金融、数学、心理学的跨学科应用。
大数据甚至可能对社会学研究构成颠覆。哲学家卡尔.波普尔曾经指出,与自然科学不同,社会学不能称之为一门科学,自然科学的研究方法也不能用于社会学。原因之一,是人的行为会影响社会演进的结果,当人的行为不可预测时,社会演进的结果也不可预测。
但是,就像一些科幻电影所表现的那样,当机器足够强大时,通过人群生活痕迹的高度互联网化,机器预测人群的整体行为特征和影响就成为可能。这甚至会颠覆社会学研究的某些既有观念。
如何量化投资者情绪
大数据有各种定义,研究机构Gartner Group给出的定义是:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
要具备发现规律和预测未来的核心能力,大数据要具备四个典型的特征:1.数据量巨大;2.数据类型多样;3.数据中富含价值;4.在尽可能短的时间内发掘出价值。
大量、多维、价值、高速同样是对投资者情绪挖掘和量化所需数据的要求。所以投资者情绪量化的第一步是拥有满足上述要求的数据资源。
第二步,通过对互联网上文本、图片、色彩等非结构化数据进行赋值定义,来完成数据结构化。目前相关技术模块日趋成熟,与其他行业相结合的应用已有若干案例。对于投资者情绪研究来说,只需要将与金融投资有关的特定语义与其他行业的语义加以区分,对互联网上的有效文本信息按照“悲观――乐观”的维度给予“1-10”的赋值,变为可计算数据。同样,也可以从别的情绪维度来研究。
第三步是用传统量化方法建模,先达到对过去股价能够事后解释的效果,再看未来实践中是否具有真实的预测能力。这个过程中需要不断调整模型。
两个指数的异同
以上述数据标准和研究过程来看“百度-广发”和“新浪-南方”两个指数,两者有较多的相似性。
首先,从数据质量来看,大量、高速毫无疑问;国内最大搜索引擎的网页搜索和新闻搜索,以及微博数据也肯定能保证数据价值;唯一的缺憾是数据维度单薄,“百度-广发”指数的数据仅来自百度,“新浪-南方”指数的数据仅来自新浪。这可以理解――两家都希望实现闭环应用,而无需借助自身之外的数据资源。但缺乏多维数据计算结果的互相印证,无论如何是一个遗憾,这将对研究结果的有效性造成损害。
其次,在建模方面,两个指数抛弃了过去单纯用市值、成交量、财务指标等基本面和交易数据做因子进行选股的思路。
据媒体报道,中证指数研究公司开发部总监宋红雨透露,“百度-广发”指数在选取样本的时候综合考虑了多种指标,基本上可以分为财务因子(基本面因子)、动量因子(交易数据因子)和金融大数据因子。在因子分析框架下,将金融大数据信息与股票信息进行综合测度,采用量化算法构造基于百度互联网金融大数据的综合情绪模型(BF Sentiment Model)进行指数选样。其中的金融大数据因子来自百度,即“分别计算每一只股票最近一个月内在百度金融大数据里所体现出来的搜索增量或者搜索的总量。”
“新浪-南方”指数主要是将基金公司股票研究优势与互联网“大数据”结合,在南方基金量化投资研究平台的基础上,通过对新浪财经频道和微博“财经大数据”予以分析,找出股票热度预期(大数据因子)、成长预期(基本面因子)、估值提升预期的关系,构建策略因子,精选出具有超额收益预期的股票,编织成最终指数。其中的股票热度因子来自新浪,成长因子和估值提升因子来自南方基金。
由此可见,两个指数都是将大数据因子纳入金融机构原有的量化模型中,作为新的重要因子加以考虑。其逻辑是投资者情绪只是影响股价的部分因素。
作为专业投资机构,基金当然不会完全抛弃传统因子,不过大数据因子与基本面因子和交易数据因子也不乏重叠之处,例如投资者情绪很可能也反映了一部分对基本面的预期。随着互联网公司在金融领域专业化程度的加深,未来不排除大数据因子和传统因子地位互换的可能,甚至出现纯粹大数据因子的量化模型。
最后,两个指数的既往业绩都不错,具有较好的事后解释能力。模拟数据显示,“百度-广发”指数自2009年以来年化收益为40.9%,远高于同期沪深300以及中证全指;据媒体报道,南方基金内部人士称,“做了相关数据的回溯测算,收益率和广发的不相上下。”
两个指数的差别在于,合作中互联网公司和公募基金的地位不同。在“新浪-南方”项目中,互联网公司方面参与进来的只是一个财经频道,因此在模型构建上是以南方基金为主导,宣传中也一再突出了南方量化平台的重要性。相比之下,百度作为“BAT”巨头之一,在合作中明显强势。至于上述差别对两者收益率方面的影响,目前还无从判断。
量化“投资者情绪”产业链
大数据技术投入实际运用的时间还不长,在国内的相关行业应用更少。尽管有各种尝试,但该项技术与传统行业融合仍需要一定过程。
以投资者情绪的量化为例,如前文所述,一旦模型构建成功,等于是看到了市场的底牌。如此巨大的利益必将驱使众多互联网公司和金融机构进行相关项目的开发;同样是巨大利益,决定了这项研究的艰巨,没那么容易翻开市场的底牌。
投资者情绪量化需要实现金融学、心理学、数学的跨学科研究应用,而且产业链很长,这就决定了其收入模式的多元化和阶段化,阶段化是指在不同研究阶段和市场阶段,取得收入的侧重点不一样。
如果把组建对冲基金作为投资者情绪量化的终极目标,那么在整个产业链上,也有着若干阶段性目标。
首先,大数据是在互联网时代应运而生。中国80后-90后的新一代股民同时也是网民,他们的行为习惯都互联网化。对于老股民(60后-70后)来说,当他们情绪化时,买股票的根本原因是激素驱动,但仍有着意识层面的“借口”,比如看K线、技术指标、听消息、跟随股神等等。新一代股民在情绪化上没有根本不同,但他们意识层面的买股票理由一定会更新。从认知来看,互联网技术以及互联网塑造的神话,才更能契合他们的思维模式。因此,大数据技术所产生的投资预测,即使不够准确,也很能吸引新一代股民的眼球。从而使得投资者情绪量化的初级产品可以提供互联网平台上大众化的免费服务,例如点击个股,可以看到简单化的“个股情绪指数”为平台贡献流量。
其次,金融机构看到新一代股民的明显特质后,必然促使其服务和技术更加互联网化,以适应客户的习惯,快速开户、极速交易等固然可以提升用户体验,但咨询、投资建议等相对专业化领域更有必要互联网化。而这些领域很难进行形式上的触网,以互联网技术重新搭建研究咨询和经纪业务体系才是出路。所以,当投资者情绪的量化模型达到一定水平后,就将成为经纪业务和投资咨询的重要卖点。
第三,接下来顺理成章的,更好的研究成果,包含预测结果和基本分析框架,可以成为独立的卖方研究报告、或者作为策略报告的重要组成部分。
第四,金融机构可以根据研究模型发行产品,比如“百度-广发”和“新浪-南方”两个指数可以发行公募产品,至于收益率是否能验证其对投资者情绪的量化研究已经达到了很高水平,目前还不得而知。
第五,作为单独或者附加的价值,从大数据中发现不同偏好的投资人群,可以提供数据给第三方机构,供后者进行针对性极强的个性化营销之用。
第六,通过建立投资者应用平台,实现数据闭环,构建应用模型的独特和不可替代性。
最后,成立对冲基金。一旦技术成熟到这一步,机器通杀机构和散户的时代将会到来。
概念先行??效果难料
基于产业链长、研究型开发耗时旷日持久等理由,进行投资者情绪量化的机构不必要求技术完美后再进行商业应用,而应该边研究边应用。
众多机构显然看到了这项研究的颠覆性和巨大商业价值,纷纷投身其中。
2014年4月1日,雪球“情绪宝”,称“当某只股票首次进入雪球热股榜后,它的股价在短期内会出现剧烈震荡。统计数据显示,买入2013年81只首次进入雪球热股榜的A股股票,统一两周后卖出,最后平均收益率达到惊人的7%”。将由此构建“情绪宝”股票组合。
事后得知,“情绪宝”是一个愚人节玩笑。但在当时,很多投资者都信以为真,因为这在逻辑上是成立的。直至三个月后,还有人跟帖要“预约购买”。而雪球受到的最主要质疑,也是认为其百万级的数据不足以完成高质量的量化研究。
借助“情绪宝”这个“探空气球”,雪球赚到了眼球,探明了投资者对此类产品的兴趣高低。两个月后,招商证券就推出了研究报告《基于雪球情绪指标的择时模型》。三个多月后,“百度-广发”和“新浪-南方”两个指数。
以互联网思维来看,虽然关于投资者情绪的研究还远未成熟,但先占据这一概念,边研究边应用,是“磨刀不误砍柴工”的有效策略。至于实现最终的完美模型确实困难不小。
首先,尽管有金融人才、大数据人才的鼎力合作,但要在纷繁复杂的互联网文本中发掘出有效信息,将是一项艰巨的工作。而且需要理论研究的相应推进,才能避免重复挖掘。
其次,即使找到了效果较好的模型,使用者仍处于“知其然不知其所以然”的状态,要把握模型的原理,还需要整合心理学资源,从行为金融学的视角,对投资者情绪与相应行为之间的联系进行解码,这其中又有天量的工作要完成。
第三,投资者情绪的量化模型反映了人性的因素,其参数稳定性要好于基本面数据和交易数据构建的模型。但时代变迁、市场结构转化依然会影响到模型的效果,所以要将对市场结构的变化也纳入到大数据量化的研究中,以做出预判。
最后,投资者情绪再重要,也不能完全解释股价走势,大数据因子与基本面因子、交易因子在不同市场结构下的比重如何调整也是一个课题。
机构各取所需
不同类型的机构,在投资者情绪量化的研究和实践中,其侧重点与所得不同。
互联网公司的长项是占有数据和流量资源、对用户体验的敏感和对创新的渴望,短板是金融业务方面专业性不足。用大数据实现对“投资者情绪”的量化,可以让互联网公司强势切入金融市场中高端的投资和研究领域,全面颠覆原有的投资研究模式。并且最大限度地贴近其用户(新一代股民也是网民),反映他们与上一代截然不同的思维模式和选择标准。技术驱动的产品和服务手段对互联网公司来说没有接受上的障碍,其创新冲动和占有“大数据”、“投资者情绪”两项心智资源的前景,比较容易促成互联网公司对研究的投入。
国内券商目前的品牌只是规模品牌,缺乏差异化的定位。从低端的经纪业务到高端的卖方研究,区别度都不大。一旦有券商能够转型为“大数据驱动的创新型投资、研究和服务”机构,将成就其独特定位和杀手锏,在全方位的业务(特别是经纪业务和卖方研究)竞争中占据主动。
股票型基金的投资能力是公募基金立足的核心能力。2007年以来,公募基金的整体股票投资能力并不出色,难以支持基金的持续销售。通过与互联网公司的合作,将“投资者情绪”量化的研究成果投入实践,有可能找到股票型基金销售的突破口。一直以来,相比择股,公募基金的择时能力较差。而且从基本面出发,也难以为择时行为找到理论依据。而“投资者情绪”量化的成果,将为公募基金提供择时的理论依据和现实帮助。
对于软件公司、第三方机构等服务商来说,可以将大数据转化为优势服务产品,在行业中脱颖而出。
从所需资源来看,数据是进行“投资者情绪”研究的首要、决定性的资源。因此,目前的相关研究应用都离不开互联网公司的参与,例如雪球、新浪、百度。金融、技术、数学、心理学人才是不同研究阶段所需的次要配置资源。
颠覆近在眼前
据媒体报道,在北京召开的“大数据背景下的计算机和经济发展高层论坛”上,中国工程院院士李国杰表示:“生物信息学、脑科学、空间科学等基础研究早就采用以PB级计的大数据,却没能引发大数据浪潮。大数据如今引起各方重视,主要还是因为它蕴藏着巨大的经济价值。”
目前看来,大数据技术应用极有可能在金融投资领域引爆,金融很有可能成为继电商之后又一个互联网应用的热点领域。原因一是金融业商业价值体量巨大,互联网公司虎视眈眈;二是金融行业的互联网化程度还远远不够,可以挖掘的潜在应用领域众多。微博客 @陈如是说 写道:“互联网这一教门,正从自然、多神崇拜的初级阶段向一神崇拜的高级阶段演化。从目前的斗争情况看,金融神成为主神的机会最大。”
对于互联网公司来说,此前的“余额宝阶段”只是互联网金融试水,是简单将金融业务进行物理嫁接,互联网仅仅作为渠道,并没有对金融机构的专业地位造成冲击。“宝宝”们的生存有赖于中国金融体系漏洞的存在,一旦金融监管篱笆扎紧、金融机构积极应变,“美国版余额宝”Paypal的前车之鉴未必不会重演。
互联网公司要想在金融领域具备核心竞争力,就要从渠道迈向更高端的专业化部门。以大数据技术直接切入金融机构垄断的投资研究业务,是互联网公司迅速提升专业化能力以及在金融领域扩张的捷径。
另一方面,在互联网金融新一波浪潮中,金融机构若不能立足于自身专业化的强项,而只是跟随互联网公司的布局而动,则只能充当配角,渐渐失去主动,甚至被互联网公司吞噬。私募基金经理、微博客@神农陈宇写道:“我们必须把神农投资搬到海淀区去。我们要到创业者中间去,并且离金融街那些炒股票的远点。我们要和更多将改变中国的年轻人站在一起。”
如果说金融中的银行业因为重要性和所有制因素还难以在短期内被互联网根本改变,那么,互联网对于投资领域的颠覆已经近在眼前。中国股市的一个特点,是用20年时间走过了美国股市百年所走的道路,当A股投资者还在津津乐道于巴菲特(代表个人资产管理最高水平)、彼得・林奇(代表公募基金最高水平)时,索罗斯(代表对冲基金最高水平)、西蒙斯(代表量化投资最高水平)的模仿者也将在A股出现。
互联网颠覆投资,投资互联网化。
一场投资领域的革命开始了。
新闻对
股价的影响
按照一般思维方式,不但认为重大新闻对股价有着决定性影响,而且也认为股价的短期巨大波动一定与重大新闻有直接关联。
事实并非如此。
对于前者,并非每一个重大新闻都能够引发股价剧烈波动。最近的一个例子是,8月13日中国7月份的信贷融资数据公布,存款和新增贷款大跌,M1和M2走低。货币政策和信贷数据所反映的流动性状况一向对A股影响巨大,然而数据公布后,A股并没有出现大幅波动。
对于后者,罗伯特・希勒通过研究1929年和1987年美股崩盘时的新闻,发现并没有被公认影响了市场的重大新闻。1989年戴维・卡特勒等人列出了二战后美股50次最大短期波动,结果发现基本没有重大新闻可以作为合理借口,甚至得出一个极端结论:“重大价格变化日无新闻”。
这当然可以用“有效市场”来解释,即后者是重大新闻已经在公布前被先知先觉的投资者知晓,或者被市场“聪明地”预期到了。而前者是还没有公开的重大消息让股市产生了反应。
与上述学究气十足的理论解释不同,真实情况是,无论消息(未公开的新闻)还是新闻(已经公开的消息),其内容的重要性与传播力相对来说是两个独立变量――重要的新闻不一定有很强传播力;产生“病毒式”传播效果的未必都是传统意义上的重要新闻。
所以,一个真正重要的新闻,无论它是否提前泄露或被预期到,如果未能形成有效传播,就不能引发投资者“正常”的情绪反应,当然就无法扰动股价。所谓有效传播,并不是说了就算,甚至不完全取决于被多少人看见,而是真的引起关注。殊不知有多少新闻,读者只瞄了一眼标题就不再关注,时间、精力、心智资源的有限,决定了读者对大多数新闻视若无睹,其中不乏一些传统意义上的重要新闻。
反过来,一个看似很无聊的娱乐新闻,按照“正常”逻辑,跟投资八竿子打不着的事情,却凭借其传播威力,挑动市场神经,造成了股价波动。马伊与伊利股份的因果关系即在于此。
任何人都不可能掐死自己,这句话常被用来形容某一行业的从业者无法舍弃自身积累多年的认知和资源,转而认同和遵守更合理的行业逻辑。这同样适用于部分传统媒体人。
一些传统媒体人之所以抱住“内容为王”不松口,原因之一是他们的认知、能力、特质……都只适合做内容。当然,从纯粹新闻学学科的角度说,内容确实最重要。一旦涉及新闻的商业价值(例如对股价的影响力),传播才是真正的“王者”。如果说此前媒体人还可以掩目自欺,互联网时代则完全不可能了。
虽然为了适应网络传播,内容也做了一些适应性改变,但并没有真正颠覆新闻内容的一般生产规律;传播技术则翻天覆地变化了。两者相比较,就是内容更新方式的改变远不及传播技术的改变。于是,从新闻的现实效果来看,传播的作用远大于内容。
例如,从互联网的去中心化来考虑,任何被专业编辑选择提供的新闻,都不符合互联网上的新闻传播特质。即使是门户网站编辑充分考虑网民阅读偏好之后做出的选择,也难以避免编辑(新闻信息中心)的主观性。于是,适应互联网的计算传播学应运而生。
对此,豆瓣“计算传播学”小组的解释是:“传播学必须走出传统的研究套路,获得在网络上保存、抓取、分析、可视化大规模电子化数据的能力,也需要支持这些工作的工具。毫无疑问,传播学因此将和计算机科学开始交汇,至少需要程序员投入到这种大规模数据的挖掘工作中来。”(Cheng-jun Wang,2012)
“今日头条”App使用的就是计算式传播技术,对其新闻推荐技术的描述是“更快更全更懂你”,即通过用户反复使用留下的信息,让后续推荐越来越接近于用户个人的阅读偏好,从而达到私人定制资讯的效果。尽管其推荐技术仍显粗糙,却被投资者认可为未来传播技术的发展方向,获得了5亿美元的估值(2014年6月3日消息)。
而从传统餐饮业转型互联网的湘鄂情(002306.SZ)进军视频搜索业务,使用的也是计算式传播技术。消息公布后,股价八个交易日大涨60%。
反观传统媒体,在与“今日头条”的口水战中,仍然斤斤计较于内容的版权问题,而没有重视传播技术的颠覆性转变。殊不知,此时传统媒体最应该考虑的,是如何将自身内容与计算式传播技术相结合,以原创内容和全新传播技术将门户网站踢出局。所以说,“今日头条”杀伤力最大的是门户网站,而非传统媒体。在一定条件下,两者甚至可能成为同盟。