公务员期刊网 精选范文 数据可视化范文

数据可视化精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的数据可视化主题范文,仅供参考,欢迎阅读并收藏。

数据可视化

第1篇:数据可视化范文

关键词:大数据;数据可视化;Radviz;弹簧模型

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)17-0231-03

随着大数据时代的到来,数据产生的速度呈直线上升,数据海量化已成为不可避免的发展趋势。数据急剧增加对数据处理、数据挖掘以及数据可视化等都是一个极大的挑战。目前,数据可视化面临高维数据越来越多,数据量越来越大,数据种类越来越多等多种挑战。针对这些问题,提出了一种Radviz数据可视化方法,将高维数据样本非线性的投影到二维目标空间,能够快速找到容易被领域专家认可的可视化模型。但是传统的Radviz可视化方法将属性值均匀分布在圆周上造成属性间的值相互抵消,从而导致数据遮盖度较大及可视化图形有内缩趋势等问题。本文提出了一种新的改进的Radviz可视化方法,改进的方法增强属性了间的合力,降低了数据遮盖度,使得原始数据集的特征能够更好地保持。

1 数据可视化

数据可视化技术诞生于二十世纪八十年代,是运用计算机图形学和图像处理等技术,以图表、地图、动画或其他使内容更容易理解的图形方式来表示数据,使数据所表达的内容更加容易被处理。数据可视化技术与虚拟现实技术、数据挖掘、人工智能,甚至与人类基因组计划等前沿学科领域都有着密切的联系[1]。目前数据可视化技术大体可以分为5类:基于几何投影可视化技术、面向像素可视化技术、基于图标可视化技术、基于层次可视化技术以及基于图形可视化技术[2]。

数据可视化的简易工作图如图1所示:

2 传统的Radviz可视化方法分析

Radviz(Radial Coordinate Visualization)是一种基于弹簧模型的可视化方法,Radviz是将一系列多维空间的点通过非线性方法映射到二维空间,实现在平面中对多维数据可视化的一种数据分析方法。自从Ankerst于1996年提出Radviz技术以来,Radviz技术取得了很大的发展,被广泛应用于可视化分析和数据挖掘等领域。近年来更是把Radviz技术运用到基因表达数据的分类上,且取得了良好的分类效果[3]。

2.1 传统Radviz模型

经典的Radviz方法通常运用在平行坐标系上,将一系列具有多维度属性的点通过非线性方法映射到二维空间,使人们得以用肉眼观察。如图2所示,设n个特征变量随机均匀地分布在单位圆周上(如n= 6),记为~,现在假设n个弹性系数不同的弹簧一端全部固定在一个小球上,另一端分别固定在~。假定第j根弹簧对于观测点i的弹性系数为,如果观测点固定在圆内的一个平衡位置,那么(,)就是n维空间(,…,)在二维空间的投影,便实现了一个n维数据转化到二维坐标的Radviz可视化[3]。

其中,表示随机均匀分布在单位圆周上的特征向量;单位圆周表示一个二维空间;O表示特征向量映射在二维空间上的平衡点。

根据胡克定律,对一个弹簧而言,小球所受到的弹力取决于弹簧拉伸的长度(矢量)和弹簧的弹性系数(标量) ,当小球静止不动时,则表明其受到所有弹簧的合力为零。对此可得到如下公式:

其中xj表示第j个变量在二维空间的圆周上的坐标,pi表示第i个观测点在圆内二维空间平衡位置的坐标。公式(2-2)表示第i个观测的平衡位置,式(2-3)表示观测平衡位置向量pi为各变量的坐标位置的加权平均。为了避免负值的出现,常常采用归一化的方法,即将最大值和最小值归为1和0,归一化后的所有得数值都位于[0,1]之间[4]。归一化公式为:

从上述公式分析,我们可以得出如下结论:

(1)维度值越大,那么该投影位置将更靠近该维度在圆周上的位置;

(2)改变圆周上的属性,将影响投影的位置;

传统的Radviz可视化方法计算复杂度低;可显示维度大;相似多维对象的投影点十分接近,容易发现聚类信息;直观便于理解。但是传统的Radviz方法也存在一些不足,该方法受数据本身及数据集的类型影响,当相似的数据集或成比例的数据集较多时,数据遮盖度会很大,将会影响对原始数据集的特征保持[5.6]。

3 改进的Radviz可视化方法分析

传统的Radviz可视化方法受数据本身和数据集类型的影响,一旦相似数据集或成比例的数据集较多,数据遮盖度就会很大,那么原始数据集的特征将会被影响,造成这种现象的原因是传统Radviz模型属性间的相互作用增加了数据密集度,使数据覆盖和重复概率增大,从而影响原始数据集的特征。对此,本文提出了一种改进的Radviz模型,新的模型减少了属性间的相互作用,从而使可视化结果更加接近数据集的原有特征。

3.1 改进的Radviz模型

改进模型采取1/4圆来对应n维空间,对于一个n维数据集,那么就将1/4圆n等分,即每一个点表示一个维度,然后通过弹簧模型来将数据集投影到二维平面的1/4圆中。但是每个点都在1/4圆弧上,则有可能最后的平衡点不在1/4圆内,那么就需要一个固定点来使得平衡点一定落在1/4内,这里把原点设为固定点。如四维数据集,原理图如下:

在图3中,X、Y轴分别表示投影点的横、纵坐标;原点表示用来使平衡点一定落在1/4圆内的固定点;Mi表示数据集的每一个维度;O表示数据集在1/4圆周上的平衡点;h(x,y)表示平衡点O的坐标函数。

3.2 改进Radviz可视化方法的实现

3.2.1 数据预处理

首先要对数据集进行预处理,把非数字转化为数字,然后对数据集进行归一化处理,使得数据集中的所有数据都在[0,1]之间。本文采用的归一化公式为:

3.2.2 固定点弹性系数

传统的Radviz模型没有固定点,当然也就不用设定固定点弹性系数。但是,在改进的Radviz模型中所有的属性都在1/4圆上,他们所受到的弹力都在一侧,无法使得平衡点落在1/4圆内,所以需要提供一个固定点,来提供一个弹力来使得平衡点落在1/4圆内。本文提出了一种全局均值的固定点弹性系数算法,全距均值就是所有属性中最大值和最小值的均值之和,它可以使数据可视化投影点处于居中的位置,方便进一步的数据处理。全距均值的计算公式:

3.2.3 新的平衡点坐标计算

其中,圆的半径为1,p表示弹簧弹性系数,k表示第i个数据中第t个属性的值,两个三角函数表示第t个属性沿坐标轴的分量[7.8]。再由合力为零,得到投影坐标的公式为:

3.3 改进Radviz模型与传统Radviz模型比较

传统的Radviz模型是把所有属性随机均匀分布在一个圆周上,那么属性之间的夹角都是钝角,那就使得属性的投影值小于它的初始值,这就导致属性值的落点更靠近圆点,增加了数据遮盖度,最终导致得到的数据可视化效果较差。而改进的Radviz模型是把所有的属性均匀分布在1/4圆周上,属性间的夹角就是一个锐角,也就是说属性的投影值不小于初始值,这就使得属性值的落点比初始值更远离原点,这就降低了数据遮盖度,最终得到的数据可视化效果就更好。

综上所述,改进的Radviz数据可视化方法更好,即更好地保持了数据集的原始特征,又能得到更好的可视化效果;为数据可视化的研究提出了一种更好的方法,使得数据可视化更加容易,得到的结果更加可靠。

4 总结

本文在研究传统的Radviz数据可视化方法的基础上,结合传统方法的优点,给出了一种改进的Radviz数据可视化方法,并对改进可视化方法进行了分析与比较。解决了传统方法不能很好保持原始数据集特征和数据遮盖度高的问题,使得数据可视化的效果更好,为数据可视化提出了一种新的参考方法。

参考文献:

[1] 任磊,杜一,马帅,张小龙,戴国忠.大数据可视分析综述[J],软件学报,2014(9):1909-1936.

[2] 陈建军,于志强,朱昀.数据可视化技术及其应用[J].红外激光工程,2001,30(5):339-343.

[3] 张涛,赵发林,武振宇,李康.Radviz可视化方法在基因表达数据分析中的应用[J].中国卫生统计,2011(1):2-4+8.

[4] 徐永红,洪文学,陈铭明.基于Radviz及其优化的可视化故障诊断方[J].计算机应用研究,2009(3):840-842.

[5] 陈琰.基于Radviz算法的金融数据可视化分析技术研究[D].浙江大学,2014.

[6] 曾晶.Radviz可视化技术度量模型的研究[D].北京交通大学,2011.

第2篇:数据可视化范文

关键词:可视化数据挖掘技术;可视化技术;数据挖掘;方法

中图分类号:TP311.13

在数字信息时代下,网络信息技术和现代化的电子通信设备使得数据量逐步增长,数据结构不断复杂化,需要科学的技术展示这些数据。可视化数据挖掘技术是数据挖掘技术和数据可视化的结合,能利用计算机图形学和图像处理技术将数据挖掘源的数据、数据挖掘过程和数据挖掘的结果直观的表现出来,并进行交互处理。设计科学的可视化数据挖掘技术可以从数据源的可视化、数据挖掘过程和数据挖掘结果的可视化入手。

1 数据挖掘过程中的可视化技术

1.1 数据源的可视化技术

数据源的可视化应该在数据挖掘过程算法之前进行,主要作用是展示数据源是如何分布的[1]。如可以用三维立方体或者曲线来表现其中数据分布的情况,用可视化技术来描述数据仓库数据和数据库中不同的抽象级别和粒度。

1.2 数据挖掘预处理阶段的可视化技术

预处理阶段是数据挖掘工作的一个重要阶段,对选定的数据集进行抽取、集成、清洗、转换和规约。在整个数据预处理阶段,用户需要先了解所需要处理数据格式、数据列的属性、数据分布的信息等,结合数据挖掘的目标对可能对使用的数据挖掘算法精准度有影响的数据进行估算,并进行一定的处理。值得注意的是,在数据的预处理过程中会涉及大量复杂的数据操作,这就需要可视化技术进行处理,总的来看,在数据预处理阶段的可视化技术设计可以采用结合传统的可视化图表形式和界面菜单操作的形式进行,具体设计如下。

(1)数据的选择。数据的选择对象主要是文本文件形式的数据和关系数据库文件形式的数据,数据选择的过程是根据数据质量的要求和数据挖掘的目标,连接并访问数据源,进而选择出合适的数据,主要方式为选择数据表、选择属性、记录选择。在数据选择的过程中,用户可以通过界面连接自己需要的关系型数据库,也可以直接从文本文件导入数据。而对那些已经选定完毕的数据集,用户可以采取制定数据列、样本采集等方式选择数据;(2)数据集成。数据集成是在选择好的数据源和数据库中将数据搜集并整合到统一的存储中,在数据集成的过程中,会出现一些冗余数据。为了帮助用户清楚的识别冗余数据,要将数据表中冗余数据的记录进行高亮显示[2];(3)数据清洗。数据清洗主要是针对在数据预处理过程中出现的识别或删除孤立点、空缺值和数据不一致等问题。通过对各个列值的数据属性条形图显示,用户能有效查看各个列值的分布情况和属性,进而针对不同的数据类型,给予相应的处理操作。通过可编辑数据的表格方式来帮助用户观察和分析数据集中的连续字段,进一步查找出空缺值,然后再通过界面提供的人工填写空缺值处理和补全空缺值;(4)数据转换。数据的转换包含对数据格式的转换、数据拼接的转换、数据汇总计算的转换和数据类型的转换;(5)数据规约。数据规约是在数据挖掘结果有所保障的基础上,通过采用压缩数据集的方法来提高数据挖掘过程的速度。在数据规约过程中,可以采用的技术有数据压缩、数值规约、维规约、数据立方体聚集、概念和离散会分层等[3]。数据规约的可视化是通过采用层次树和直方图的形式进行的。

1.3 数据挖掘算法的可视化技术

数据挖掘过程中的交互式可视化是用可视化的形式来描述挖掘的过程,在整个挖掘过程中,设计合适的数据挖掘算法是极为关键的步骤,也是数据挖掘的难点。算法可视化是利用计算机图形学的方法,将算法程序执行和数据演变中动动态图形的方式表示出来。当前算法可视化主要应用于教学演示、算法的分析与设计、科研、计算集合、程序调试等领域中,主要包括了三个功能部件,见图1。

1.3.1 算法初始化及相关参数设定部件。数据挖掘算法的初始条件包括了使用参数的默认值、经过预处理后的数据集等,在这个过程,用户可以根据界面设定的数据集来挖掘,其中参数值的变化也会影响挖掘结果的变化。为了保障挖掘结果的精准度,用户可以通过多次实践来挖掘出科考的参数值和数据。

1.3.2 中间结果的显示部件。不同的数据挖掘算法,要有相应的数据类型来存储数据挖掘算法中的中间结果,然后利用一个通用的数据接口提供给计算机界面做可视化处理。整个过程是动态的,把数据挖掘算法生产的步骤在计算机界面上呈现出不同的描述。

1.3.3 算法与界面的映射层。不同的数据挖掘算法舌部不同的数据类型,该步骤的数据算法设计时要利用数据挖掘扩展语言DMX来完成不同数据挖掘算法,不同数据挖掘算法能够提供不同类型的参数选项,以插件的形式让DMX调用。

2 数据挖掘结果模型的可视化技术分析

本文采用的是通用预测建模标准语言PMML4.0来表示各种数据挖掘结果模型,见图2。

此数据挖掘结果模型的可视化结果主要是为了帮助用户能更好的理解所挖掘出来的数据结果,并且需要进行有效的评估和反馈。数据挖掘的结果模型各有各的特色,也较为繁杂,不同的数据挖掘模型,要通过不同的可视化方法来展示出来。(1)可视化图库表。因不同的数据挖掘结果模型需要不同要求和标准的可视化图形,需要提供不同的可视化图表库接口,以PMML标准格式储存的数据挖掘结果模型展示可视化图形;(2)图像的缩放部件。数据挖掘结果模型进行可视化之后,可能会因为内容过多,无法在界面上显示,这就需要设计科学的图像缩放部件,图像的缩放功能是可视化技术的一个重要功能。用户能通过对数据挖掘结果模型的图形进行缩放,切合整体视图与细节视图;(3)多视图显示部件。同一个数据挖掘结果模型,能提供包括统计信息视图、可视化图表视图等在内的多个视图。而不同的视图可以采用不断的选项卡进行展示,以便用户能通过单击不同选项卡来观察不同的视图;(4)过滤部件。数据挖掘结果模型的信息量大,用户为了能快速找出所感兴趣的知识点,可以设计过滤部件,将设计好的过滤部件与之相符的信息从可视化图表中隐藏。数据挖掘结果模型的过滤部件只能在界面上隐藏当前可视化图表中符合过滤条件的显示部分,而不能改变模型的具体内容。

3 结束语

总之,可视化挖掘是一种新型的大数据集挖掘方法,在数据和信息量不断增加和复杂化的背景下,用户对所挖掘出来的数据结果更难以捉摸。而将挖掘出来的数据结果在数据挖掘的过程和数据结果模型的展示上,利用可视化的图形、图像和图表等直观的方式表现出来,就能有效提高用户对数据挖掘结果的理解和利用。

参考文献:

[1]陈霞,陈桂芬.基于可视化的时空数据挖掘研究与应用[J].安徽农业科学,2012(17):11-12.

[2]路燕梅.基于平行坐标的可视化多维数据挖掘的研究[J].现代计算机(专业版),2011(25):04-05.

[3]张敏辉,赖麟.可视化数据挖掘技术的应用研究[J].数字技术与应用,2012(11):19-20.

第3篇:数据可视化范文

关键词 气象信息数据;可视化;气象服务

中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2017)189-0058-02

在这个信息和数据日益膨胀的世界,人们越来越倾向于用最简便的方式获取信息,于是,对数据信息的可视化处理也就成为信息传播者最有效的传播手段。

所谓数据信息可视化,是通过计算机及各类相关软件、技术,将想要传达的数据信息转换成图像,用一目了然的方式表现出来。比如借助图表、地图、视频、动画等各类表现手法,都可以将海量难读取的、晦涩难理解的数据信息用更直观的方式表达。数据信息可视化能够让受众快速读取并且深入理解数据信息原本复杂的内在含义和隐晦的结构关系。目前,数据信息可视化理念和技术已经在越来越多的领域得到广泛应用,比如金融、通信、医学、生物分子、自然科学、地质勘探等,并且表现出了对抽象数据信息的分析、表达、传达等方面独有的优越性。

1 气象数据可视化发展

早在17世纪80年代,人类就进行了在气象大数据可视化方面的尝试,这次尝试来源于英国科学家埃德蒙・哈雷,凭借整理和计算大量数据的才能,哈雷绘制了世界上第一张载有海洋盛行风分布的气象图,以地图为依托,对信风的分布状况做了全球性的统计分析,并将分布状态生动的展现在世人面前,这也是有史可依的最早的气象数据可视化案例。

如今,气象数据可视化已经发展到了全新的时代。在美国National Weather Service网站上,气象数据信息已经实现了以地图为载体的全面可视化展示,文字描述变成了辅助信息,图形可以一目了然的传达不同地理区划内各类气候历史资料和实时的天气实况、预报数据。

随着气象数据的监测和预报的高度发展、以及自动化水平的不断提升,气象数据信息也正呈现爆发式增长的趋势。而同时,伴随着媒体技术的发展,受众对于气象服务信息的需求也逐步从传统媒体的单向传达向全媒体的交互式体验转变,单一的讲述方式已经不再是让受众接收气象信息的有力途径。而在这个变化的过程当中,人们对于气象信息本身的需求也不再是单一的“明天下雨吗”,而是需要对天气原理、气候统计等方面越来越专业化、深入化的系统解答。这种受众需求的引领,也推动了气象服务向数据信息可视化方向全面发展。

2 气象数据可视化对于气象服务的意义

数据信息可视化理念和技术的发展,已经在很多领域体现出先进性。比如在电视新闻、影视作品等领域,数据信息动态可视化元素的应用在提升新闻报道传播效果、加强影视作品科技感等方面起到了举足轻重的作用。

而在气象服务领域,从海量的数据信息中做减法,整理、提取相关信息,并用直观的方式对数据信息进行可视化表达,对于满足受众对气象信息需求越来越专业化、对信息读取方式越来越高效化等方面来说,都是最有效手段之一。再加上在气象服务领域涉及到的专业性用语、科学原理等科普性内容日益增多,受到这类受众需求的引领,也推进了气象数据信息可视化在气象服务领域的发展,并成了提升气象服务传播效果的有力途径。

借助可视化的力量,将复杂抽象的数据信息变得更有可读性和观赏性、将生涩的专业词汇转换成通俗的语言并配合易懂的图形动画、将难理解的天气学原理利用气象数据做出让人容易理解的图形表达,以达到受众对传播内容充分理解的目的。通过可视化技术,增强受众对气象信息和科普知识的理解,使传播内容切实为受众服务。

笔者在对2016年1月至7月的《新闻联播》之后的《天气预报》节目进行整体收视和节目效果分析后发现,在收视率超过当月平均值的节目中,除了常规的图形表达之外,利用一定可视化手段对气象数据信息、气象科普等内容进行深入解读的节目占到53%。可见气象数据可视化在实际气象服务操作中已经展现出它的优越性。

3 气象大数据可视化在实际应用中的不足

总体来说在气象服务中,对气象数据可视化的应用还仅仅还停留在表层,现阶段对庞大数据的挖掘、整理、传达只是蜻蜓点水,在现有的气象数据信息可视化表达中存在很多问题和进步

空间。

3.1 可视化方式相对单一

调查发现,目前气象服务提供者在对气象数据信息进行可视化表达时,饼状图、柱状图、表格图等最原始的统计类图形图表的使用率是最高的。不可否认此类图形是对数据进行可视化表达的鼻祖,这样最基础的可视化表达方式,在很多时候也是最清晰有效的。但在可视化技术飞速发展的当下,图形图表类的表达一方面已经跟不上受众多样化的信息获取脚步;另一方面,相对单一的可视化表达方式也无法满足气象信息挖掘过程中越来越深入化、专业化的解读需要。

3.2 信息挖掘不够深入

对气象数据信息的可视化,如果在数据信息挖掘层面就不够深入、思路不够清晰,那么可视化手段也就显得苍白无力,气象服务效果必然会大打折扣。在目前气象服务可视化表达中,很多分析类、科普类内容很难做到清晰明确的传播、或者可视化处理后并没有得到应有的关注,究其根源,就是在气象信息选取环节没有考虑到受众的实际需求。面对全媒体时代受众越来越专业化的气象信息需求,信息传播者自身需要对传播内容有一定的把控意识,要以受众的需求为出发点寻找有价值的信息源,并且以点连线、以线带面,进行多维空间的信息补充和挖掘,才能在此基础上谈及可视化表达。

3.3 信息交互不够充分

随着全媒体时代的到恚与用户之间在全媒体平台的信息交互,也是提升气象数据信息可视化效果、进而提升气象服务力度的途径。受众借助各类媒体获取气象信息,并通过新媒体对接收的信息进行反馈,让气象信息的传播者切实了解受众需求,进而提升气象服务的贴近性和实用性;与此同时,对气象数据信息的深入探索和表达,也能促进受众需求水平的提升。而现阶段,这样的良互循环还没有建立完善,很多时候由于各平台信息交互不够充分,气象服务产品出现专业性太强、可视化表达繁琐等问题难以得到及时反馈,双向互动受阻,影响气象服务效果。

4 气象大数据可视化应用前景展望

当前,在气象服务过程中,气象数据信息的可视化已经成为提升气象信息传播效果、保持和提高受众对媒体平台粘合度的主要手段。而未来随着全媒体概念的发展和气象服务产品的不断扩充,受众对于气象信息的需求也会更加深入化和个性化,所以要提升服务效果,就更要借助气象数据信息可视化的力量,不断提升数据信息可视化水平,进而提升气象服务效果。提升气象数据信息可视化效果可以从以下3个方面考虑。

4.1 多元的可视化表达手段

随着可视化技术的不断发展,目前普遍使用的饼状、柱状、表格等最基本的可视化表达方式已远远不够,增强数据呈现的艺术美感是大势所趋。应充分考虑各种新技术和创新效果的应用,敢于尝试可视化新技术带来的画面效果提升。比如虚拟技术、虚拟植入技术、现实增强技术等,尽管节目时长较短的天气预报节目中,在气象信息挖掘和可视化表达方面的空间都比较有限,但新的尝试必然会带来更显著的视觉冲击效果,让呈现出的可视化效果能够充分服务于内容信息。

4.2 深层次的气象信息挖掘

气象数据信息可视化技术与数据挖掘紧密关联。从受众需求本身出发,挖掘恰当的信息切入点和多样化的数据支持,让信息源本身更有新意,也是提升整体可视化效果的途径之一。对具有创新思维的气象数据信息进行可视化表达,要表达的内容本身对可视化方式的要求就会提高,从而带动可视化效果的提升。这样的思路已经在节目制作过程中小试牛刀,比如,针对制作周期短的电视天气预报节目,提前根据季节或节气策划相应的气象数据解读和科普选题,而这类选题在实现可视化的过程中,使用最基本的图表类图形已然无法满足服务于内容的需求,而是需要更生动、精美的可视化手段来实现。而通过气象信息的创新挖掘来提升可视化手段和效果的思路,在未来还会更深入的应用于集科技性、服务型于一身的气象服务领域。

4.3 多交互的信息传达方式

随着全媒体平台的深入发展,在信息传递过程中,单向的讲述方式已经不再是受众获取气象信息的有力途径,取而代之的是受众与气象信息传播者在全媒体环境中的信息交互。而气象信息传播者还应致力于对全媒体平台中互动机制的不断完善,让交互和反馈的良性循环得以持续发展,而这对气象信息可视化的发展也将起到促进和提升的作用。

5 结论

面对全媒体时代受众越来越专业化和个性化的气象信息获取需求,对于气象数据信息可视化技术的应用是提升气象服务效果的有效途径。目前在气象服务领域,气象数据信息的可视化尝试对于气象信息的传播已经起到了弥足轻重的促进作用。然而,目前可视化技术在气象服务中的应用还处在初级发展阶段,同时气象信息传播者对信息的挖掘、可视化效果的评估等方面均存在很多不足和提升空间。未来在全媒体环境深入发展的大背景下,受众需求的引领和内容创造者可视化能力水平将形成相互影响和促进关系,气象数据信息的多元化表达手段的发展、深入化信息挖掘能力的提升以及更深层次的互动性信息交互传达,都将成为提升气象服务信息可视化技术发展的有效方式。

参考文献

[1]周宁,程红莉,吴佳鑫.信息可视化的发展趋势研究[J].图书情报工作,2008,52(8):35-38.

[2]谭章禄,方毅芳,吕明,等.信息可视化的理论发展与框架体系构建[J].情报理论与实践,2013,36(1):16-32.

第4篇:数据可视化范文

关键词:数据可视化;比例敏感型;数据特征

中图分类号:TP301 文献标识码:A 文章编号文章编号:16727800(2014)001003702

作者简介作者简介:徐飞(1982-),男,硕士,国防信息学院一系讲师,研究方向为数据工程、计算机网络、大数据。

0 引言

数据可视化作为一个专门学科,其目的是为了将数据更好地呈现给最终用户。数据可视化方法千差万别,但是它们的根本目的是一致的,即更好地满足用户需求。本文对比例敏感型数据的可视化方法进行了研究,主要是提出对此类数据具有指导意义的可视化手段,在实际应用中,应当紧密结合用户需求,寻找最适合的可视化手段。

1 数据特征

不同种类的数据,往往具有不同的特征:气象部门在研究一年中每个月的气温变化情况时,会将12个月的平均气温绘制在一张图表中,研究人员往往还会将表示气温的点用曲线相连,以显示其变化情况。这种数据往往和时间关系密切,可以将它称为时间敏感型数据。参加达喀尔拉力赛的车手,往往需要一位拿着地图的导航员,导航员会结合车辆所在位置和地图进行比对,提醒车手离下一个弯道还有多远,以及方向和角度是怎样的。地图数据和空间地理位置是无法分割的,可以将它看作空间敏感型数据。美国大选开始时,选民会紧盯电视画面,那里通常有几条不断上升的柱形,表示每位候选人获得的票数。投票统计结束后,电视台往往会给出一个画面,用一个饼图或者其它图形显示出每位候选人所得票数占总票数的比例,这种数据可以称为比例敏感型数据,饼图是它的一种很好的表现形式。在很多社交类网站和应用中,用户可以查找两个指定人之间的关联(通常是具有较多社会关系的名人,如姚明和赵本山),系统会根据在网络中搜集到的信息,给出这两个人之间的关系链,如参加过同一个活动、效力于同一个球队、有相同的好友等。这种数据可称为关系敏感型数据,对此类数据的可视化也有很多典型的例子。

可以对数据按照特征进行划分,但数据的特征又并非固定不变。如对于沃尔玛超市的员工来说,负责货物搬运的人员可能更加关心货物的堆放地点,负责进出货的人员可能更加关心进销货物的数量,负责售后服务的人员则可能重点关注货物的返修率等,而对于一间具体超市的经理来说,他可能需要关注上述所有数据。数据最终要展现给用户,因此如何更好地满足用户的需求,是数据可视化研究的中心和根本,对于比例敏感型数据来说,它的可视化手段也不应当只专注于数据本身而脱离实际应用场合。

2 比例敏感型数据可视化

比例敏感型数据的主要特征是数据可以分组,即整体中的不同个体,根据某些特征可以划分为不同的类别,如网站上某个问题的抽样调查的答案选择情况、某个国家的人口男女比例情况、参加竞选的几位参选者的支持率等。

2.1 方法原理

比例敏感型数据有一个共同的特点,即几个不同的类别相加,总和可以看做是“1”,或者“100%”。因此,要对这类数据进行可视化处理,既要表达出数据可以分为不同类别,又要展现出它们的总和是一个整体,即要兼顾整体和局部。

2.2 主要技术

比例敏感型数据可视化技术,常用的有饼图、堆叠柱形图和树图。

2.2.1 饼图

饼图是最常见的图表之一,如很多网站会在页面上给出一个调查问卷,向访问该网站的用户征求网站的改进意见,图1展示了用户的选择情况。

图1 网站问卷调查

从图1可以看出,问卷调查的问题是“您认为网站需要改进的地方”,备选答案有6种,这和饼图划分成的6个扇形部分相对应,并用不同的颜色表现出来。从代表不同答案的扇形所占比例可以看出,用户对该网站最不满意的是它的“意见反馈”部分。网站的管理者如果看到这种结果,就应该考虑是否需要建立一个用户交流的论坛,倾听用户的意见和建议。并且,只有8%的用户选择的是“页面设计”,这说明绝大部分用户对网站的页面设计效果比较满意,那么网站在升级换代的时候,就可以重点考虑是否延续这种比较受用户欢迎的设计风格,而不是冒险地推倒重来。

饼图以整圆来代表“1”,以不同的扇形来代表“1”的不同部分,即突出了整体,又兼顾了个体,形象直观,是对比例敏感型数据进行可视化的一种常用方法。虽然由于用户在视觉上对扇形的“角度”不如对柱形图的高度那样感觉敏锐,在做个体间比较的时候可能不如柱形图直观(如15%和18%在饼图中所表示的角度不同,可能难以被用户察觉),但是由于饼图自身的特点,在很多时候依然受到图表设计者和用户的青睐。

2.2.2 堆叠柱形图

柱形图是最常见的图表类型,如图2表示的是我国2001-2010年的国民和国内生产总值。

图2 2001-2010年国内和国民生产总值

堆叠柱形图是柱形图的一种变形,如果想要表示的数据存在不同的分类,并且各个分类有具体的意义,为了在展现数据的同时,突出其不同的分类,可以用堆叠柱形图。如用户还想了解三种产业的产值在国内生产总值中所占比例,可以在图2的基础上进行进一步加工,得到图3。

用堆叠柱形图来展现比例敏感型数据,除了每种分类都用一个柱形来表示,还要重点突出整体为“1”的概念。以美国民众对总统奥巴马在一系列政策的支持率为例,用堆叠柱形图将民众的支持率展现出来,得到图4。在图4中,表示每种政策的柱形高度是相同的,它表示民众对该政策的支持、反对和弃权比率之和都为1,并且每种政策的具体支持率情况可以通过不同颜色的小柱形来表示,一目了然。

图3 2001年至2010年国内生产总值及各产业总值(单位:亿元)

图4 民众支持率

比较饼图和堆叠柱形图,可以很容易地看出堆叠柱形图的优势:可以同时展现多个分类的比例情况,如果用户特别倾向于用饼图来展现不同的分类,也可以为每个分类绘制一个饼图,这样就会得到一个由13个饼图(对应于13个不同的政策)组成的系列。因此,选择哪种图表来展现比例敏感型数据并不是绝对的,这取决于数据的特点和用户的选择。

2.2.3 树图

树图的应用非常广泛,常用来展现具有类似树的层次结构的数据,依然以图4中的数据为例,来探讨如何通过树图展现它们。将奥巴马相关政策(policy)作为树的父节点,“种族关系”、“教育”等13个具体政策作为第一层的子节点,将“支持”、“反对”和“弃权”作为第一层子节点的子节点,这样就得到一个三层树结构,将它以树图的形式表现出来,得到图5。

整张图被13个矩形分割成13个部分,这些矩形对应13个具体的政策,虽然形状有差别,但面积相同。同时,在每个矩形的内部,又分成3个部分,分别对应民众对每个政策的3种态度——支持(approval)、反对(against)和中立(neutral),各部分的面积对应了不同的支持率大小。因此,树图从本质上和饼图、堆叠柱形图一样,也是通过面积的大小来表示数值之间的比例关系,图5中表示的数据层级关系比较简单,当层级数较多时,树图的优势会更加明显。

图5 民众支持率的树图表示

3 结语

通过对比例敏感型数据的特征分析,提出了具有普

遍指导意义的3种可视化方法,在一定程度上能够帮助用户加强对数据的分析和使用,并挖掘数据背后隐含的可用信息。

数据可视化是一个热点问题,在实际应用中,可能很难界定某种数据到底属于什么类型,也很难给出一个标准的可视化方法。在数据的实际可视化过程中,应当牢记一点,即数据是为用户服务的,任何可视化方法都应当以最大程度地满足用户需求作为最终效果的判断标准和努力目标。

参考文献参考文献:

[1] NATHAN YAU.鲜活的数据——数据可视化指南[M].向怡宁,译.北京: 人民邮电出版社,2012.

第5篇:数据可视化范文

关键词:汽车;信息展示;可视化;WebGL

中国分类号:TP393.0;TP391.41

随着计算机和互联网的快速发展,不仅改变了人们的生产模式,更是改变了人们的生活方式。互联网以其便利、快捷等现代特性,正成为人们获取信息最重要的途径[1],因此提高人们的上网体验就是提高人们的生活品质。而浏览器是打开信息的大门,以前的2D网页不再满足人们的需求,3D页面已然成为未来的趋势,再加上信息量爆炸式的增长,信息的可视化成为了研究的重点。

实际上,在日益增长的数据背后,隐藏着许多重要的信息,通过对数据信息更高层次的分析,挖据数据背后潜在的应用价值[2],借助WebGL三维可视化技术,以形象直观的3D动态图像来检索信息,提高用户的体验。

1 关键技术

1.1 WebGL

传统的Web3D解决方案主要依赖Flash,Java3D以及微软的Silverlight等技术[3]。然而上述技术都存在一个共同的缺陷,难以支持Web端GPU加速,因而难以胜任大规模复杂3D场景的渲染。WebGL的出现解决了这一难题,WebGL是一种3D绘图标准,通过结合JavaScript和OpenGL ES2.0来提供一种类似于OpenGL的API[4],并在Web端提供3D加速渲染功能,它完美地解决了现在Web交互式三维动画对插件的依赖和不支持GPU加速两个问题[3]。

1.2 Three.js库

three.js是JavaScript编写的WebGL第三方库,提供了非常多的3D显示功能。Three.js是一款运行在浏览器中的3D引擎,可以用它创建各种三维场景,包括摄影机、光影、渲染器、材质等各种对象,可以很轻松地创建3D动态画面。

1.3 SSH框架

SSH为Struts、Spring、Hibernate的一个集成框架,是目前较流行的一种Web应用程序开源框架。SSH框架分为四层:表示层、业务逻辑层、数据持久层和域模块层,通过此框架能在短时间内搭建出结构清晰、维护方便的Web应用程序。Struts作为系统的整体基础架构,负责MVC分离,Hibernate架构实现数据库的访问,Spring对Struts和Hibernate进行管理。

2 系统的总体框架设计

本系统采用MyEclipse8.5的JavaEE集成开发环境作为开发平台,系统架构为B/S,采用SSH作为Web框架,选用Apache Tomcat 6.0为Web服务器,后台数据库为Oracle,在以上环境中完成整个系统开发,系统的框架设计如图1所示:

3 物理建模

建模是本系统的核心部分,在确定要显示的内容后,借助Three.js第三库建立模型。模型是以JavaScript脚本为载体,通过建立模型矩阵、视图矩阵、投影矩阵来模拟事物,从数据库中加载数据到模型中,再通过支持HTML5的浏览器渲染出来,得到动态的三维画面。例如我们要模拟一个汽车和汽车周围的景色,要编写JavaScript脚本代码创建Three.js提供的摄影机、光影、渲染器、材质等对象,建立汽车和周边的景色模型。

3.1 汽车信息可视化模型

要把汽车信息通过可视化的界面展示给用户,建模是相当关键的一步,将汽车元素和数据信息结合在一起是本论文可视化的标准。

3.1.1 零部件结构模型设计

汽车零部件是汽车的组成部分,零部件的性能最终影响到整个汽车的性能,所以零部件在汽车中占很重要的地位。把零部件结构以三维动态画面展示出来,不仅让用户能对零部件有详细的了解,而且为汽车专业人员提供方便快捷的学习条件,不用现场操作零部件就能轻松地了解零部件内部的结构。所以零部件的建模要以三维动态图为主,小零件能支持拆解和安装,把整个安装和拆解的过程展示出来,给用户全新的体验。

3.1.2 汽车模型设计

模型的建立与可视化展示数据的需求相关,当要展示汽车表面和内部结构时,将对整个汽车进行建模,把汽车虚拟化成网页图像,并且能实现开车门、旋转、开车启动等功能,当点击汽车零部件时可以展示零部件参数,把整个汽车以三维的可交互页面展示给用户,用户想了解该品牌的汽车时,只要打开该品牌汽车的页面,就能查看到汽车所有的参数,从各个视角欣赏汽车的外形和内部结构,为用户提供有效信息,模型主要功能如图2所示:

4 数据库设计

模型矩阵是用数据来填充的,这些数据从数据库中获取,模型对象对获取的数据进行分析和处理。数据库的E-R图如图3所示,用户权限表规定用户只能根据权限访问汽车信息表,汽车信息表中记录了汽车模型的外形和位置坐标,零部件表记录汽车零件的位置坐标信息,图表展示信息表是点击某零件弹出对应参数图表的数据源。

5 可视化信息展示

可视化是采用计算机图形学和图形处理技术将数据转换成图形或者图像显示出来的技术,本文是基于WebGL可视化技术开发的。可视化数据信息的展示要通过客户端和服务器,客户端发出请求时先通过模型框架,模型框架判断用户点击事件,通过HTTP协议向服务器发出请求。服务端接收到请求信息交由SSH框架进行处理,由框架向数据库访问数据,再把数据返回给客户端,客户端把数据填充到模型中,得到数据填充的模型要通过支持HTML5的浏览器渲染,整个可视化过程如图4所示。

6 结束语

本论文借助WebGL三维可视化技术和Three.js框架,建立了汽车信息可视化系统,通过3D动态汽车模型对汽车数据信息进行了可视化展示,使汽车信息数据的展示融入了汽车元素,形成了汽车行业独树一帜的汽车数据展示平台,不仅提高了用户的视觉体验,而且把有效的信息直观的传达给了用户,即利于用户理解,又能挖掘出数据背后潜在的应用价值。

参考文献:

[1]韩义.Web3D及Web三维可视化新发展――以WebGL和O3D为例[J].科技广场,2010,12(05):81.

[2]金玮,孙艳,张克君.Web信息检索技术中关联规则挖掘算法应用研究[J].情报杂志,2007,26(1):39.

[3]殷周平,吴勇.基于WebGL和AJAX的WEB3D应用研究――以在线3D协作交互式设计为例[J].安庆师范学院学报(自然科学版),2013,19(1):58.

[4]刘爱华,韩勇,张小垒.基于WebGL技术的网络三维可视化研究与实现[J].地理空间信息,2012,10(5):79.

作者简介:朱向雷(1981-),男,河北人,高级工程师,研究方向:汽车行业数据应用与研究。

第6篇:数据可视化范文

关键词:大数据 可视化 数据新闻

人脑几乎是在瞬间完成对图形信息的处理,处理文字却按照线性顺序,因此速度慢很多。正是基于这样的科学研究成果,国外很多优秀报纸一直将视觉化传播手段视为新闻创新、提升报纸影响力的重要手段,甚至是开辟市场的利器。

随着电脑技术和网络发展,获取数据的便捷性提高,基于数据挖掘基础上的数据新闻可视化,成为视觉化新闻叙事一个新的发展分支和重要组成部分。被视觉化的新闻不仅承载很多信息和数据,而且具有欣赏价值。这一方式在很大程度上受内容驱动,是一种新的新闻叙事方式。

《泰晤士报》的新视觉新闻团队是怎样的?

从某种意义上说,新闻可视化的过程实际上整合了从传统的调查新闻到统计、从设计到编程的若干个专业领域。它对新闻从业人员提出了更高要求。

《泰晤士报》视觉总监马特·柯蒂斯向笔者介绍,英国《泰晤士报》新视觉新闻团队核心成员中的数据记者,一般是由新闻记者转型而来,需要具备写作、调查、根据数据形成观点、制图、缩小数据搜索范围等能力。数据记者平时的工作职责是挑选题、挖掘数据和编辑数据。团队中的数据挖掘员一般不需要有新闻从业背景,但需要具备数据深度研究、数据运算、从多种渠道快速调出数据等能力。信息编辑(图表编辑)的日常工作是制图、信息沟通,需要具备的技能是图表设计,信息设计,初级HTML编程技能,后期制作,Adobe edge、Indesign等软件应用,插图绘画等。内容设计编辑(视觉总监)是项目的主要决策人,他的日常工作职责是确定选题、编辑数据、制图、成品出稿等,需要具备图表设计、信息设计,简单HTML编程技术,后期制作,Adobe edge、Indesign软件应用,插图绘画等能力。

综合欧美报纸对视觉设计人员的要求,除了基本的美术功底之外,还需要有良好的新闻素养和较强的电脑技术。从事图表设计工作,要有较高的新闻提炼和信息数据整合能力。欧美报纸的很多优秀视觉设计人员是从新闻记者转型而来。视觉化新闻叙事手法在计算机技术基础上发展起来,因此对操作人员的软件熟练能力和应用能力提出较高要求。对新闻选题和要素的把握提炼,更决定着最终视觉表达的优劣。拥有新闻、软件和艺术技能的高素质复合型视觉人才,正是多数报纸视觉团队所紧缺的。

《卫报》:成立数字新闻部并将数据可视化

2009年3月,英国《卫报》成为全球第一个成立数字新闻部的报纸。《卫报》的数字新闻部针对新闻选题搜集分析海量数据,在收集、过滤、分析数据后,通过图表、地图或互动效果图等形式进行数据可视化转化,从而完成视觉化新闻叙事过程。(图1-图3)《卫报》专业记者利用政府公开数据,做出“2012伦敦奥运会数据图表”“你快乐吗?”“BBC是如何开支的”“英国人死亡的原因”“中国人每年有多长时间度假”等大量高质量的视觉图表新闻。这些可视化的图示以简洁明了的方式,让读者快捷、轻松地了解信息。自2010年下半年以来,这种视觉化新闻叙事形式受到欧美媒体广泛关注。

《卫报》《泰晤士报》数据团队的视觉人员构建

报纸在将信息转换成可视化的新闻图表时,需要有新闻素养、技术素养与艺术素养的人员协力合作。欧美知名报纸通常拥有一个得力的视觉团队,一个相对完整的视觉团队大致包括选题策划、文字摄影摄像记者、数据编辑、美术设计、电脑制图、版面编辑和网页设计等层面的人员。

英国《卫报》的视觉设计人员分散在采编的各个部门。数据新闻团队则由5人组成,其中Simon Rogers是数据新闻项目的创立者,编辑“数据博客”和“数据商店”等栏目;John Burn-Murdoch本人既是记者也是数据研究者。其他成员并非全职的数据新闻记者,同时还隶属于《卫报》的不同部门,从事其他新闻采编工作。

此外,新闻部的美编共有5人,其中3人负责当天的新闻版面设计,还有一人负责为之后的版面做设计,也就是提前设计。其他部门也有设计师,其中体育部2人,专题部3人,还有一些不固定的设计师会做一些副刊和其他的一些设计。《卫报》还有一个由6人组成的图表设计部,其中4个人是做报纸和网站的图表设计,另外两人做互动图表。

英国《泰晤士报》的采编人员一共约420人,其中新视觉新闻团队34人。这个团队的工作重心是运用视觉元素对时事新闻进行分析阐释,一般不直接表现新闻事件本身。团队中的核心成员有3人,分别是数据记者、信息编辑和内容设计编辑,另有效果展现程序员1人、数据挖掘员1人和设计人员29人。

相比而言,国内报纸视觉团队的视觉产品生产与内部团队设置不匹配,视觉团队的分工不精,人员配备不齐,尤其缺少数据编辑和电脑制图编辑这样的岗位设置。有的报社甚至缩减专业的视觉工作人员,让非专业人员来做视觉专业的工作。

可视化数据新闻的团队合作模式

新闻叙事的可视化操作,一般都是通过团队合作完成。以比较常规的“图表新闻”为例,备报纸在作为图表基础的数据采集模式上各有不同。在欧美知名报纸中,有的视觉部门在制作“图表新闻”时,数据基本依靠新闻部门的一线记者采集,也有的视觉部门依靠自身力量独立完成“图表新闻”的全流程工作。

《泰晤士报》新视觉新闻团的三位核心成员的工作互相交叉,在讨论与合作中完成工作。工作流程是“定选题——挖掘数据——编辑数据——制图——成稿”。这三位核心成员会视内容不同而邀请文字记者合作参与,由团队中的图表设计人员与合作记者共同完成最后的视觉产品。

《纽约时报》的图表中心则是自行收集数据,并不仰赖文字记者。大约20%的《纽约时报》图表中心人员具备统计软件与数据库工具的操作能力,有能力独立收集数据并分析加工成图表新闻(图4)。如果数据很复杂,则有数据中心协助。

第7篇:数据可视化范文

关键词:新媒体;数据可视化;叙事;艺术设计

检索:.cn

中国分类号:JO 文献标志码:A 文章编号:1008-2832(2016)04-0085-03

数据新闻、科学可视化、可视艺术――越来越多的领域随着大数据时代的到来与数据分析与设计密切相关,基于数据驱动的设计产生出大量的数据可视化艺术设计作品,以数据为中心的设计模式无处不在。新媒体技术的产生与发展势必推进对新的艺术设计形态与视觉语言的探索,也必然会形成新的美学观。数据可视化艺术设计是将采集或模拟的数据经过有效编辑转换为可识别的图形符号、图像、视频或者动画,通过视觉化的形式呈现并以此实现对受众最有价值的信息传达。其中“有效编辑”主要表现为可视化设计的两种应用类别――解释型与发掘型:前者运用可视化艺术设计进行叙事帮助用户辨别信息及其关系,运用视觉表现形式创建相应的数据解释或信息传达以及情感交流,后者则通过将可视化作为设计工具进行实现受众自身决策后的数据分析与挖掘。数据可视化艺术设计不仅渐渐成为数据新闻、信息可视化和科学可视化等领域的热门研究方向,其传播内容、设计形式和技术实现的特征与流程规范也日趋明显。本文旨在从基于数据驱动的叙事传播、数据可视化艺术设计以及数据可视化美学三方面,着重研究当代数据可视化设计的意义、影响以及可视化艺术设计所面临的新挑战。

一、可视化的数据叙事

随着新媒体技术的提高与发展,不同领域、区域、文化之间对数据应用的设计越发普及,可视化设计研究作为可以跨越语言界限的形式在传播中的作用也日益突出。尽管现在可视化设计普遍关注如何运用数据去发现与分析潜在的有效信息,但从早期的设计事例中可以看出,这种形式的设计其目的表现出来更多的是展示与说明而并非用于分析。1858年南丁格尔(FLorence Nightingale)用数据图表(图1)的方式为英国政府绘制了用于展示克里米亚半岛战争中那些可预防的疾病所导致的惊人死亡数字。其目的并非用于分析战争导致疾病爆发致死的原因,而是用于向政府直观的展现出战时医疗问题的重要性。另一个著名的可视化设计案例是1850年约翰斯诺(John Snow)著名的“伦敦霍乱地图”。这张地图并非用于发现导致霍乱传播的水泵,而是提出关于水源致病的证据。故事化的叙事方式可以使用于揭示信息的数据可视化更加有效与直观,就如同观众观看电影一般。斯坦福大学教授珍妮弗阿科尔(JenniferAaker)指出,有意义的故事是令人难忘的,有影响力及与个体有关的。她同时指出当数据与故事一起运用时,它会从智力与情感两个层面与观众产生共鸣。运用数据可视化叙事的方式可以看成是一种新的语言叙事形式,它超越了传统的线性叙事结构并实现了对于信息数量上的突破。

美国科学家瓦伦韦弗(Warren Weaver)将现代科学史划分为三个阶段,其中第三个阶段从20世界中期延续至今为“有序复杂问题”阶段。韦弗认为现代世界存在着拥有丰富变量的复杂系统,而这些变量之间高度相关,相互依赖,这都需要我们运用一套新的思维、分析方法以及全新的探索工具。现代网络可视化通过图像的呈现以及互动式的分析,揭示人类无法感知的复杂结构,网络可视化描绘的是“不可视事物”,描绘人眼看不到或无法感知到的无形结构。数据化使现实世界“分散、重组与合成”成为可能。加州大学圣地牙哥分校视觉艺术教授列夫曼诺维奇(LevManovich)指出:数据库是计算机时代的一种新的象征性形式,并提供了一种新的组织结构来构建人们自身对自我与世界的体验。新媒体艺术通过数据结构的“基因重组”产生出可交互的“媒介艺术”,并借助媒体数据呈现形式的多样性、丰富性和智能终端的可扩展性,从而实现了一种观众与作品间的沟通和审美。近年来,随着宽带网络、无线网络、云计算和微软Kinect体感交互技术的发展,不断涌现出的新媒体互动艺术作品已经证明了上述的论断。以数据库为支撑的新媒体交互作品正在呈现出越来越丰富的艺术表现形式。列夫曼诺维奇在其可视化项目《自拍之城:社会媒体中摄影与自我塑造的探索》(图2)中,通过对来自全球五大城市的3200幅Instagram中自拍照进行搜集,运用可视化与交互的应用程序实现了社交网络跨媒体数据的可视化分析设计。对新兴的自拍摄影流派,社交网络中的群体行为模式以及数字视觉文化进行了深入的研究。可视化艺术设计正作为新的叙事语言以及视觉沟通方式开辟着全新的基于数据驱动的叙事与分析途径。

二、数据驱动下的艺术设计

在研究、教学和开发领域,可视化艺术设计是一个极为活跃而又关键的学科方向,可视化艺术设计是对于数据的重新编码,运用不同的视觉设计形式的信息呈现与诠释,并“帮助我们完成某些智力任务,这使其有别于精细艺术。艺术家将图作为表达内心世界的方式,信息图表或可视化则更专注于客观、准确、实用和美观,简而言之:功能限制形式”。从艺术的视角来看优秀的可视化设计作品其特征主要体现为:首先,作品通过视觉表现的形式有效的传递了实用的信息并将可视化作为表达有趣范式的方法:其次,作品所有视觉元素经过精心的设计排版,充满设计感:第三,体现了主客观得统一,真实与美的充分结合。罗德岛设计学院校长前田约翰(John Maeda)教授认为设计是有意识的发明或者改善的过程,并且是以主观(直觉)和日益增进的客观(数据)为基础的。大卫麦克德里斯(David McCandless)认为好的信息可视化设计包含必要的四个元素:信息、功能、视觉形式以及故事(图3)。可视化设计作品也应该是交叉的平衡,如果作品只包含其中的两个要素,得到的就是原型图或者是草图,其效果会令人觉得缺乏趣味。数据是可视化设计的核心和基本元素,既能通过有创造性的视觉形式表现又包含相应的数据信息,即运用恰当的叙事又兼具功能的作品才能称为优秀的可视化设计。

(一)复杂性描述的视觉表现

大数据时代由于信息数据已经无处不在,如同人脑神经网络对复杂性的描述一样,无论是对基于数据的社交网络或万维网的视觉信息呈现还是科学可视化中海量数据的视觉表述,可视化设计都是对复杂数据视觉参考的创建。现代认知学的研究认为,视觉感知不仅是人类感知的主要方式,同时,视觉分析的速度也远远高于其他感官系统。英国的科林威尔教授认为有效的数据表达设计是通过对视觉认知与接收的研究而来。耶鲁大学大统计学教授、信息设计先驱爱德华塔夫特(EdwardTufte)认为设计就是选择,运用设计对信息的展现需要的是对复杂的描述,并非对简单的问题复杂化,而是设计师对于细小及困难问题的视觉处理方法,从而最终实现对复杂内容的揭示⑨。他还指出数据是复杂、优美与繁重的集合,而设计则等同于简单、直接与多类的方法。

(二)动画、交互与开放

数据可视化越来越成为一种不同寻常的大众娱乐形式,动画、交互与开放是可视化设计实践发展的三个关键方向。公共健康教授汉斯罗斯林(Hans Rosling)第一次在TED2006演讲中展示其著名“各国人口与经济发展状态趋势图”的动态可视化案例,通过每个泡状数据点代表国家所在年份的数据,随着时间变化可视化的方式呈现了具有类似运动的趋势的点类聚,运用最为直观的、生动的方式展示了全球不同国家和地区个人收入与生活期望值之间的关系。然而,是否采取动画可视化的方式应根据是运用数据进行展现或探索的目的区别对待,探索类型的动态可视化设计对于信息的传递效率与准确率都很低,反而增大了复杂性。

交互式的可视化设计通过精心的设计吸引和激励人们可视化,帮助人们自行揭示数据背后隐藏的规律、含义并自我向导与分析,这样就在观众和数据之间创建了极密切的关联,从而产生更深层次的参与,鼓励信息共享,和令人信服的行为。以信息交互为代表,大数据技术对于设计领域的影响主要体现在两个方面:一方面,以大范围、低成本、增量累积的方式获取设计驱动与约束的相关数据成为可能,如市场需求、消费者行为、使用情境信息等;另Yz~,以开源(open source)、众筹(kick-start)、社会化(social)的组织形式实现设计构想成为可能。开放是可视化设计发展的一个显著特征,创建基于大数据的不同用户数据不同的设计模式,根据源数据的调整与用户的偏好将可视化设计进行调整,创建用户中心的个性化视觉系统,从而展现出可视化设计作品以用户为主导的设计本质。

(三)批判性

可视化设计原本是数据图表与计算机图形学结合的产物,面对爆炸式增长的数据本身,复杂的可视化设计尽管从艺术设计的角度带给人以美感,如果缺乏合适的参照系与解释却可能会迷惑或误导读者。我们可以在很多设计作品中看到这些基于数据驱动的抽象化设计将人类日常的沟通与生活以精致的表格或交互式系统的形式予以呈现,然而与其它设计门类不同的是,可视化设计的基础是数据,对于数据获取来源的真实性,数据的公开使用和处理权限,对可视化设计中时间维度的处理等都是值得探讨的内容。著名设计评论学家彼得霍恩(Peter Hall)认为:“总的来说,艺术可视化设计的批判功能就是对可视化中嵌入在笛卡儿语言类型中数据的透明度、确定性和客观性等方面要求的质疑”。

三、数据可视化情境下蕴含的“隐喻美”

可视化艺术设计其创作最终目的不仅仅为了揭示信息和数据本身的规律或结构,还包括利用可视化技术创造出具有审美趣味的艺术作品。美丽的可视化可以反映出所描述数据的品质,显式的揭示源数据中内在和隐式的属性和关系,视觉暗示是可视化艺术设计的核心美学特征之一。

关于可视化美学的研究在艺术家与理论界展开了广泛的研究。对这个新的领域的研究从一开始就重点关注数据的象征主义,即对可视化数据整体意义的视觉表达。韩国中央大学的研究人员通过将可视化美学与艺术史美学进行类比,提出从“视点”“解释”与“另类感”三方面进行分析,“视点”与文艺复兴运动有关,是关于艺术家个人独特风格的自我信赖与诠释。“解释”是与现代艺术革命有关,公众接收艺术作品且图像学开始盛行。“另类感”则与当代艺术有关,特别是媒介艺术,以媒介作为艺术创作元素及灵感的来源。在数据可视化语境中讨论美,应该采取一个区别于传统美学的方法,即将讨论重点从关注数据转向意义,从美的形式转向审美理解,从内容与形式之间的协调关系转向研究面向数据的实用分析与设计,从而最终实现对美与意义的揭示。

第8篇:数据可视化范文

关键词:流场数据可视化线卷积积分双线性插值

中图分类号:TN957.52 文献标识码:A 文章编号:1007-9416(2016)06-0000-00

1引言

科学可视化是融合了图形学、计算机视觉、数据管理、图像处理和人机交互等多学科的一门新兴的综合学科。科学可视化的方法在发展到一定程度后可以与相关的领域结合应用,这可将科学实验结果以及大规模的计算数据直观地呈现出来,为用户挖掘数据中的深层信息提供极大的便利。由于自然界没有直接可用的表现矢量数据的可视化的表达模型,目前针对这类数据还没有找到一种可以通用的技术。然而海洋水体中采集的数据大部分为矢量场数据,矢量场的可视化对理解复杂的流体制意义重大,所以寻求有效的解决方案是十分必要的。

矢量场中的特征各有不同,通常特征对流场数据描述的精确度与特征的维数正相关,因此常选取维数相对较高的特征来描述流场。对于这类特征,其可视化方法大致分为四种方法。直接法:直接将相应特征的数据表现出来,不进行分析操作,此方法直观、易懂、运算量相对小。几何法:在流线上指定一系列点,记录这些点的运动轨迹;基于这些轨迹来绘制几何对象。基于特征的方法:提取数据中被用户视为有意义的部分,对这一部分信息进行可视化操作。基于纹理的方法:将向量场的局部性质呈现给可视化向量场,这类方法可以在一些复杂的流场中,绘制出一个具备很多细节的密集连贯的可视化结果。基于纹理的可视化可以依赖的技术可归纳为点噪声技术、线积分卷积(LIC)、纹理平流和运用GPU的技术等。本文选用基于纹理的线卷积积分(即LIC方法)实现海洋流场数据的可视化,为海洋领域的研究提供新的方法。

2 关键技术

2.1双线性插值

由于采集的海洋流场数据点是离散且无特殊规律可循的一个离散的点集,而计算机在处理无规则的数据时有很大难度,因此为了流场数据可视化的顺利进行,对海洋流场数据进行预处理是必不可少的。本文的数据预处理工作采用双线性插值法进行。双线性插值,又称为双线性内插,是含有两个变量的插值函数的线性插值扩展,其核心思想是在两个方向分别进行一次线性插值。

如图1所示,设要得到未知函数 在点 的值,假设函数 在 四个点的函数值是已知的。第一步,沿着 轴的方向采用线性插值的方法进行插值操作,经过这一步操作可以得到 的坐标值。第二步,沿着 轴的方向进行线性插值,得到 的坐标。这样就得到所要的结果 。

2.2龙格库塔法

在求解微分方程的众多方法中,龙格库塔法是一种较为常用,精度也较高的方法。因此,龙格库塔方法在工程领域的应用也较为广泛。泰勒公式和用斜率作为近似表达微分,是龙格库塔算法的两大特征。其主要思路是将积分区间上计算出几个点的斜率进行加权平均,得到的结果作为下一组计算参考。根据预先计算的点的个数不同,龙格库塔算法可以分为二阶龙格库塔法、四阶龙格库塔法等。

2.3 线卷积积分

LIC(Line Integral Convolution,线卷积积分)是流场纹理方法中最主要的一种技术,其主要思路是以矢量场数据的噪声纹理为根据进行低通滤波,生成具有矢量方向相关性的纹理图像。输出图像中每一点的像素值如下:

其中, 是输出图像中像素 的灰度值; 是噪声图像中像素 的灰度值; 和 分别是沿流线正向、反向第 步的像素位置; 和 分别是正向和反向流线的积分步数; 表示反向流线的权值。

LIC方法基于运动模糊的图像处理,在流场数据的方向上进行卷积滤波,使得结果可以表现出流线的空间相关性。LIC算法可以提高处理数据的效率,每一个像素点的速度矢量也能较为快速的得到。

LIC通常选择白噪声作为输入纹理,本文也是这么操作的。采用卷积积分的方法得出每一个像素点的输出纹理值。第一步,针对成像区域中的每一个像素点,沿着其流场的正、反两个方向进行积分操作,这的积分操作是对称的。通过这过程可得到该点的流线。第二步,每个像素点对应的输入噪声值根据选取的卷积核参与卷积,得到的结果作为输出纹理的像素值。

3海洋流场数据可视化设计与实现

本文设计了基于LIC的海洋流场数据可视化的流程如下:

首先,从数据文件中读取出海洋二维流场可视化数据。将读取处的数据存入预先定义好的的数据结构中;建立均匀网格的结构化数据模型,然后对数据运用线性插值法进行预处理,使流场数据均匀的分布在二维网格上。本文定义一个新的数据结构,其数据组成包括经度位置、纬度位置,在经度方向的速度大小和在纬度方向的速度大小。

第二,输入噪声确定为白噪声,同时设置好流线的控制参数。其中,步数设置的在进行卷积运算的次数,即通过几步可以生成所需的整条流线;步长设置的是每一次运算所选取的数据点移动的距离大小;流线总长度设置的是卷积运算次数的最大值,即何时强制终止此次运算。

第三,经过上述处理的各个像素点,根据LIC算法原理分别沿着正向、反向进行流线计算。这里采用龙格库塔算法对各像素点进行流线计算。完成流线计算后进行卷积操作,得到对应像素的纹理值。最后输出的像素值是纹理值与颜色值融合的结果。

第四,将运算的结果以图像的形式显示出来。本文采用的是OpenGL的方法。

为验证该方案的有效性,本文选取某海域的一组海洋流线数据,对该数据集运用双线性插值进行预处理,将该海域划分分为361 x 723的网格数据,每个数据点记录13个时刻的流线数据,构成数据集大小为361x 723 x 13的数据集用以本文功能的检验。在Visual Studio 2008的控制台程序运行后,得到如图2所示的绘制结果。

4 讨论

本文运用线卷积积分的方法,实现了海洋流场数据的可视化。由于本文的设计是在基于单机实现的,但在实际工程应用中,面对的数据通常是规模庞大的,因此计算能力不足时需要解决的问题之一。目前的研究尚不能妥善地解决这个问题。在接下来的工作中,进一步提升计算效率,采用分布式的方法是需要努力的方向。

参考文献

[1]Brian Cabral, LeithLeedom. Imaging Vector Fields Using Line Integral Convolution[J]. Lawrence Livermore National Laboratory. 1997.

第9篇:数据可视化范文

关键词:陆地声纳;三分量;WebGL

中文分类号:TP311 文献标识码:A DoI: 10.3969/j.issn.1003-6970.2012.03.028

The Research of Three-component Data Visualization Applied to Landsonar

CAO Shu-Bin, LI Jing, HAN Liang-Liang, ZHOU Wen-Jun

(China Univ. of Mining and Techn. ,Beijing 100083)

【Abstract】At present,The display technology of Land sonar field is the single component display technology. The image displayed through the single component display technology can not be visually reveal the data collected. In order to constitute a complete data image, staff must be graphical analysis, integration in the brain. So brought a lot of trouble to the staff. The three-component technology can complete show into a picture, which visually displays the data. The goal of this article is to achieve three-dimensional display based on threecomponent data,which requires the displayed image has the angle of rotation, scaling and graphics colors depicting functions.

【Key words】Landsonar, three-component, webGL

0 引 言

陆地声纳法是一种适应于浅层地震勘探的新方法,是“陆上极小偏移距高保真弹性波反射连续剖面法”的简称。地震勘探方法种类很多,有反射法、折射法和地震测井法等。而陆地声纳法由地震反射法变化而来,是地震勘探、水声法、声波法、探地雷达的结合体。陆地声纳三分量是指垂直地面的垂直分量,平行地面又与炮检线平行的水平分量,及平行地面又与炮检线垂直的水平分量。

陆地声纳显示技术由最初的波形显示、波形加变面积显示逐渐发展到波形加变密度和彩色显示,以及正在开展的三维显示和三分量显示技术,三维显示技术相对于二维显示有以下优势:

(1) 三维显示有更高的地层构造成像精度

(2) 三维显示可以准确地确定反射界面的空间位置

(3) 三维显示可以将分散二维图象,综合起来进行联想,直观地观察地下地质形态,而且可以从三维的角度去分析和判断地质体的空间形态。

1 可视化软件WebGL

WebGL是一项在网页浏览器呈现3D画面的技术,有别于过往需加装浏览器插件,透过WebGL的技术,只需要编写网页代码即可实现3D图像的展示。WebGL基于OpenGL ES 2.0,提供了3D图像的程序接口。它使用HTML5 Canvas并允许利用文档对象模型接口。可利用部分Javascript实现自动内存管理。目前,WebGL被大多数处于测试阶段的浏览器所支持。目前,支持此技术的有Mozill Firefox、Google Chrome、Opera 12(目前的正式版11.52不支持)、Safari。另外,它也受Nokia N900 PR1.2支持。

WebGL是通过Web页面调用OpenGL,WebGL直接以OpenGL接口实现HTML5的canvas标签调用,以统一的OpenGL标准,从Web脚本生成利用硬件加速功能的Web交互式3D动画的图形渲染。WebGL完美地解决了现有的Web交互式三维动画的两个问题:第一:它通过HTML脚本本身实现Web交互式三维动画的制作,无需任何浏览器插件支持;第二:它利用底层的图形硬件加速功能进行的图形渲染,是通过统一的、标准的、跨平台的OpenGL接口实现的。这就意味着,仅仅用HTML和Javascript,就可以制作出性能丝毫不亚于现在用Flash、Silverlight等做出来的Web交互式三维动画,而且在任何平台上都能以同样的方式运作。WegGL这种方式是直接在页面本身显示图片,比使用插件显示方式性能和效率上

陆地声纳法三分量三维显示要求是实现三维的十字剖面图形,实现过程如下:

(1)首先从地震数据文件中读取N道的采集数据。每道数据的数据信息是坐标值和时间值。

(2)然后每三道数据为一组,进行组合,提取出每道数据的坐标值和时间值,这样就构成了(x,y,z,t)四维坐标的采集点。

(3)构造直角坐标系(图3)。首先建立垂直向下的时间轴,然后以每个采集时间点为基点构造直角坐标系。为了实现坐标系的旋转功能,需构造两种直角坐标系,①Z轴与时间轴平行。②Y轴与时间轴平行。即实现了坐标轴的旋转功能,防止因采集点与时间轴重合而观察不到数据。根据坐标系,画出每个采集点的坐标位置,然后使用WebGL将采集点用平滑的曲线进行连接,形成一条三维的平滑曲线图。

(4)利用WebGL将三维曲线图和时间轴之间的空间进行曲面填充,并将填充部分进行上色,形成三维的旋转曲面。由

4 总结

本文提出了一种实现陆地声纳三分量数据显示的方法,该方法通过对陆地声纳数据进行整合,形成三分量采集点,然后建立三维坐标系,利用绘图工具WebGL对三分量数据进行渲染,实现三分量数据的十字剖面图显示,由于剖面图显示的三分量的三维数据,所以要求剖面图具有旋转功能。本文还实现了剖面图的缩放功能,从而有利于工作人员对数据的进一步解释和分析,提高了工作效率。

参考文献

[1] 王有新.应用地震数据处理方法.石油工业出版社,2009

[2] 李振春,张军华.地震数据处理方法.中国石油大学出版社,2006

[3] 凌云.地震数据采集.处理.解释一体化.石油工业出版社,2007

[4] 孙宏志,刘长亮.陆地声纳数据预处理技术研究.中国地球物理会第24届年会论文集,2008,214

[5] 刘长亮.陆地声纳数据预处理及显示系统研究[硕士论文].中国矿业大学(北京),2009

[6] 钟世航,孙宏志,王荣.陆地声纳法在遂道施工时预报断层,溶洞的效果.隧道建设,2007,(8)

[7] Ritzwoller M.H.,Levshin A.L.,Estimating shallow shear velocities with marine multicomponent seismic data[J].Geophysics,2002

[8] 孙年芳.光线投射算法刍议.科技创新论,2010

[9] Aki K L,Richards P G.Quantitative seismology,W.H. Freeman Publishing