数据可视

2024-10-01

数据可视(精选12篇)

数据可视 篇1

引言

“可视化”正在强有力的影响着人们的思考方式和阅读习惯, “可视化”使读者在短时间内更好的理解接受想要传达的信息。随着越来越多的可视化图表的出现, 各类有设计成分的信息图标统称为“信息可视化”如果细分开来不难发现, 我们一般称之为的信息可视化, 实则是由数据可视化, 与信息可视化组成的。数据可视, 则是未来设计师与工程师们发展研究的重头戏。

1 数据可视化与信息可视化的含义

数据可视化和信息可视化是两个相近的专业领域名词。狭义上的数字可视化指的是讲数据用统计图表方式呈现, 而信息图形 (信息可视化) 则是将非数字的信息进行可视化。前者用于传递信息, 后者用于表现抽象或复杂的概念、技术和信息。而广义上的数据可视化则是数据可视化、信息可视化以及科学可视化等等多个领域的统称。

我们熟悉的那些饼图、直方图、散点图、柱状图等, 是最原始的统计图表, 它们是数据可视化的最基础和常见应用。作为一种统计学工具, 用于创建一条快速认识数据集的捷径, 并成为一种令人信服的沟通手段。传达存在于数据中的基本信息。所以我们可以在大量PPT、报表、方案以及新闻见到统计图形。

信息可视化的主要目的是通过图形化手段进行清晰、有效的信息传递。信息可视化是为了有效的传达信息, 美学形式和功能需要齐头并进, 通过对海量的复杂信息进行分析, 并以非常直观的视觉手段进行表达。

数据可视化的开发和大部分项目开发一样, 也是根据需求来根据数据维度或属性进行筛选, 根据目的和用户群选用表现方式。同一份数据可以可视化成多种看起来截然不同的形式。有的可视化目标是为了观测、跟踪数据, 所以就要强调实时性、变化、运算能力, 可能就会生成一份不停变化、可读性强的图表。

2 信息可视化与数据可视化的视觉表现

信息的可视化表达已经远远比简单的饼状图或者条形图更加的吸引人的眼球。今天, 信息的可视化表达已经有各异和数量众多的极具视觉吸引力的表达形式。它们包含着设计的趋势, 思想的再创新。互联网以各种扣人心弦的方式让信息的传播充满着趣味性。使老旧的表现形式成为过去式。

设计潮流变幻多端, 朝秦晚楚。但是, 信息的可视化表达的潮流却难以阻挡的不断前进。像是很多的知名网站, 例如Facebook, USA Today, New York Times还有Google, baidu甚至是奥巴马的总统竞选网站, 信息可视化图表已经成为传播大量信息的有力武器。大大小小的公司都通过信息的可视化表达来打造他们的品牌、引导他们的受众以及优化他们的搜索引擎以提高排名。

常见的的表现形式有:地图、时间轴、网络图、树状图、矩阵图、热力图、标签云、散点图、气泡图、流程图、折线图、平行坐标轴、数据表、雷达图、插画、解刨、说明图等等。众多的表现形式需要通过各种各样的手段来呈现, 或纯手工的组织设计, 或通过程序算法来实现。然而两方面的研究在目前市场行情来看都十分炙手。个信息研究所都马力全开, 不断探究新型的表现形式, 希望在信息图形研究领域取得新的突破, 有属于自己的一席之地,

进行数据可视化的时候, 一定要让读者的视线顺畅的在页面上移动, 错误的配色方式是一个阻碍。选择正确的配色能吸引注意力。在设计前考虑这些因素, 合理的安排你的不同的元素。如果一个页面的选色很困难的话, 遵循三色法则是最适合不过的了。不论怎样取色, 一定要保持整体色调的凝聚力和平静感, 让画面显得和谐。

修饰简单图形表格的方式字体排版, 可以创造也可以破坏一个设计, 但是它不应该成为信息可视化设计的一个瓶颈。一个可视化设计师经常性的充满能量并且异常兴奋, 但是也许很快他们便迷失在页面中去了。这常常导致决策的混乱。比如一些设计师利用大号的字体去炫耀数据量的庞大, 而不是通过信息的可视化表达来表现这些数据。如图1, 是针对华中科技大学校园面积分布来设计的图表。

从信息图形中可以看出, 图表所想要表现是一个数据分析信息。以圆、异色来区分校园面积的使用情况。与已往地图泡形式有明显区分。直观的传达出信息, 展现出华科不同领域使用面积的情况, 从而看出学校对校园建设的侧重点, 更快的分析出哪方面有不足需要改进, 有助于领导者们调整华科未来的发展规划。

3 信息可视化的宏观过程

根据乔治A米勒 (George A.Miller) 的研究, 人类短期记忆一般一次只能记住5-9个事物.这一事实经常被用来作为限制导航菜单选项到7个的论据;然而关于神奇的“7, 加2或者减2”还是引起了激烈的讨论.

所以, 在信息爆炸时代, 怎么在同类的海量信息中, 让受众, 更加容易认同自个儿的, 就得尽量不违反“7±2原则”。7+2原则, 是认知科学中最基础的定理之一。

制作一个可视化图表, 至少包含以下环节:

收集—整理—设计—输出

然而数据的收集和整理则是重中之重。每次可视化都是为了解决特定问题的, 所以, 面对海量以标准形式收集的数据, 要事先思考怎么针对领域问题合理抽取对应的数据。罗列出要解决的问题, 什么数据对于可视化的需求有用?这需要数据分析者有一个强有力的准确方向。重要的是, 所有问题, 都要归结为一个单一形式来表现。

信息图形化设计, 在明确想要展现的内容后, 脑子里面有个基本的框架和第一时间想到的展示形式, 还要运用视觉元素的造型, 色彩的选取, 动态等赋予图表更好的视觉体验。如果用代码形式在网页上面做出相应的布局, 信息图形就不仅仅是一个简单的静态页面了, 而是一个可以活动的大型数据流的输出展示。在确定表现形式, 非人工实现设计, 而是要通过数字工具统计分析后输出图形时。就需要设计者设计合理的输出合成的形式。

面对日益丰富的可视化数据分析工具。一些相关工作人员则设计出不同的展现形式, 来帮助用户更好的进行视觉风格的选择。例如datavlab公司开发的插件可以根据你提供的数据帮你选择适合的展现形式, 例如:treemap, tree, stream, scatterplot Matrix, force, matrix, bubble, chord设计师在选择表现形式的同时一定要考虑到受众是否能够很好的去接受和吸收信息, 设计师需要了解视觉心理对用户浏览时的影响。伴随着互联网的发展, 对于优良设计的要求也越来越高了。

4 结语

信息 (数据) 可视化是一个较为复杂的领域, 最终目的不是可视, 而是从可视化中进行数据挖掘, 信息传播, 帮助分析问题。带领人们思考。设计在这里不仅作为表现形式那么简单。要更深刻的理解才能找到最合适的手法去分析制作。也许几年后我们会发现, 现在的探讨根本就是低级的。我们要迎着时间一同进步, 不断探索未知, 任重而道远。

参考文献

[1]Julie Steele, Noah Iliinsky.数据可视化之美机械工业出版社2011-06出版.

[2]周宁.张玉峰, 张李义.信息可视化与知识检索, 2005.

[3]Zhang Jiao Jie.Johnson K A.Malin J Human-centered information visualization 2007.

[4]Chen Chao Mei Information visualization:Beyond the horizon 2004.

数据可视 篇2

高密度电法的三维数据场可视化

高密度电法是重要物探方法之一,由于它具有施工快捷、分辨率高、可靠性好、图像直观等优点,已被广泛应用于寻找金属非金属矿、地下水及各类工程地质勘察等众多领域.目前,该方法在数据资料处理方面还局限在二维图像.本文结合在山西阳泉复杂采空区利用高密度电法和高精度GPS测量联合勘察的工程实例,基于WinDisp软件平台,实现了高密度电法的三维数据场可视化,构建了视电阻率参数下的`三维地质体结构模型,并且可以任意移动、旋转、切片、分层显示、实时显示真实地理坐标等.该模型客观、真实、形象地反映了电性异常的三维地质结构,为高分辨率预测复杂采空区的空间分布特征提供了直观、可靠的资料.

作 者:祁民 张宝林 梁光河 QI Min ZHANG Bao-lin LIANG Guang-he 作者单位:中国科学院地质与地球物理研究所矿产资源重点实验室,北京,100029刊 名:地球物理学进展 ISTIC PKU英文刊名:PROGRESS IN GEOPHYSICS年,卷(期):21(3)分类号:P631关键词:可视化 三维数据场 高密度电法 复杂采空区 空间分布特征 物探

可视化复杂的Excel数据 篇3

迷你图是一种单元格中的微型图表,占用的空间非常小。它能够以清晰简洁的图形化表现形式,显示相邻数据的变化趋势。通过在数据旁边插入迷你图,可以让数据的变化趋势马上变得一目了然。虽然将迷你图直接置于其数据旁的单元格并非强制性要求,但这是一种好的做法,可以让我们更容易地掌握迷你图及其与基础数据之间的关系,当数据发生变化时,我们可以立即在迷你图中看到变化。此外,除了为一行或一列数据创建迷你图之外,我们还可以通过选择多个与基础数据对应的单元格来创建多数据的迷你图。

迷你图是Excel 2010的新功能,在Excel 2007和其他更老版本的Excel中,Excel 2010工作表中的迷你图将无法被显示出来。不过,所有迷你图在工作表中仍然会被正常保存,并且当再次使用Excel 2010打开工作表时迷你图不会损坏。

Excel 2007和其他更老版本的Excel用户,如果希望使用迷你图功能来展示数据和数值变化的趋势,则可以用Sparklines for Microsoft Excel(sourceforge.net/projects/sparklinesforxl/)或者条件格式来代替。在下面的介绍中,我们也会简单介绍条件格式如何表现数据的变化趋势以及传统图表的相关知识。

步骤

传统图表 选择数据区域并单击功能区中“插入”选项卡的图表选项,即可生成各种图表。

图表类型 单击“插入”选项卡“图表”中的“其他图表”可以选择一个更吸引眼球的图表类型。

使用迷你图 选中准备插入迷你图的单元格,单击功能区“插入”选项卡“迷你图”中的“折线图”,“创建迷你图”对话框出现后使用鼠标拖动选择生成迷你图的数据区域,选择后单击“确认”按钮,迷你图将出现在我们选择的单元格中。

创建迷你图组 选择一个迷你图以及其他准备创建迷你图的相邻单元格,单击功能区“开始”选项卡“编辑”中的“填充”按钮,并选择填充方向。这样就可以让其他的单元格参照已创建的迷你图自动创建迷你图。

调整分组选项 通过功能区的“设计”选项卡可以对选中的迷你图组类型、样式以及坐标轴的数据生成方式进行统一的修改。

添加颜色效果 右击单元格,选择“设置单元格格式”,在“数字”选项卡中可以设置单元格如何显示负数,让正负的数值更容易区分开来,这也是一种有利于表现数据变化趋势的方法。

添加条件格式 选择单元格并单击功能区“开始”选项卡“样式”中的“条件格式”,选择“管理规则”,在打开的对话框中可以设定不同条件下单元格内容的显示样式,我们可以根据所处理数据的特点,设定更有利于表现数据变化趋势的条件。

数据可视 篇4

2012年,莫言获得诺贝尔文学奖,他是有史以来首位获得诺贝尔文学奖的中国籍作家。2013年12月诺贝尔颁奖典礼前后,财新数据可视化实验室推出数据新闻,向一百年来的七百多位获奖者致敬。

如今,越来越多的中国媒体和中国人关注诺贝尔,而要了解诺贝尔的历史,财新网的这张《百年诺奖》数据可视化动态图一目了然。而且在此专题出品一年后,细心地加上了2014诺贝尔奖的信息。可视化设计师任远说,这个专题会常年更新下去。

这个项目 从数据分 析——视觉 通道——视觉结构——视觉设计,经过多次迭代的方式,最终得到较满意的设计。跟着可视化设计师任远的思路,图解设计过程:

一、数据分析

在分析了诺贝尔的原始数据以后,决定以时间线为导向,分别展示各年份的数据:

(1)该年各奖项获奖比例;

(2)该年各国各奖项获奖比例;

(3)该年各国按获奖年龄分布的获奖人,获奖人的数据包含:照片,名字,英文名,性别,获奖年龄,国家,奖项类别。

为获奖人的属性分配可视化的“视觉通道”:

(1)获奖年龄:位置;

(2)国家:位置;

(3)奖项类别:颜色;

(4)其他的数据信息:边栏。

二、视觉结构设计

由获奖年龄、国家、奖项类别的视觉通道:位置、颜色,可以确定用散点图的结构会比较直观。由于国家的列表项有40多个,用横向和纵向的散点图会超出界面边界,所以把散点图折成了圆形来表现。半径表示获奖年龄,对应圆心的角度表示国家,颜色表示奖项类别。再加一层时间轴就构成了基本的数据图(见图1)。

可以看到用圆形表示散点图,越靠近圆心等分的面积越小,比较受限制,可读性和视觉效果也不佳。所以将圆形变成了环形的散点图(见图2)。

三、权衡视觉设计、交互设计、用户体验

这样一来,数据图不论是在视觉和可读性上,都有了提高。可是问题又出现了,时间轴放在最里面,用户操作起来很不方便。因为还需要一个可以精确点选到从1900-2013年的某一年的功能。于是在接下来的几天尝试了另外几种解决方案。

根据之前的数据图,拓扑出来了6个方案(见图3),但都有各自的优缺点,始终不能达到权衡视觉设计、交互设计、用户体验的最完美状态。最后选择了两个比较接近的设计,第一个和第五个。然后,加入“各国各奖项获奖比例”继续往下设计。

最终选择了“图4”中的第二个方案。

四、环形文字的可读性处理

前面的图中文字在环形排列时会有反转的情况,可读性不高。在尝试左右反转的方式后,最终又改为另一种方式:将环形用“X”分为上下左右4个部分,上下用竖排文字,左右用横排文字,文字的排列遵循从左到右和从上到下。这种方式很适合中文字体,因为中文字体基本上都是显方形的,在元素细节构图上会比较好看。如果是英文字体的话可能不太美观,英文字体大多为长方形,所以竖排的文字会显的扁一些(见图5)。

五、真实的数据往往会有“缺陷”

诺贝尔的数据在“1900”和“1940-1942”两个年份段有空缺,时间在变化的时候,数据图右侧会出现两次人物列表空白。而两个年代,第一次是在开始时间1900年,第二次是在二战期间19401942年。

为了画面元素平衡,开始时,使用诺贝尔头像和文字标题替代右侧的空白处;二战期间,用坦克和文字标题替代右侧的空白处;都用插画风格来表现,和左侧的环形数据图相应和。插画用少面积的蓝色填充,达到画面色彩平衡。

六、整体和局部展示

整个诺贝尔可视化的过程都是展示单个年份,没有一个整体呈现的过程。所以在一开始的时候加了一个整体概况分布。

地震叠前数据三维可视化技术探讨 篇5

随着地震处理技术和解释技术的发展,三维可视化技术在地震勘探中的应用领域不断扩大,在地震处理和叠前分析环节,也可以利用三维可视化技术进行质量监控和叠前道集的分析,以提高地震处理的质量,增加利用叠前资料进行各向异性分析的技术手段.根据地震叠前海量数据的特点,采用层次细节模型进行数据分块处理与组织管理,以满足地震叠前数据三维可视化实时显示的`要求;采用三维场景对象管理机制,完成海量地震叠前数据的三维显示.就层次细节模型的数据组织和三维场景对象管理的相关技术进行了讨论,并就地震叠前数据与虚拟三维空间的关系进行了阐述;给出了地震道集数据的三维显示实例,三维可视化在速度分析、共偏移距和共方位角数据分析中的应用实例.

作 者:魏嘉 唐杰 武港山 岳承祺 张扬 Wei Jia Tang Jie Wu Gangshan Yue Chengqi Zhang Yang 作者单位:魏嘉,岳承祺,张扬,Wei Jia,Yue Chengqi,Zhang Yang(中国石油化工股份有限公司石油勘探开发研究院南京石油物探研究所,江苏南京,210014)

唐杰,武港山,Tang Jie,Wu Gangshan(南京大学计算机科学系,江苏南京,210093)

多媒体交互数据可视化研究 篇6

关键词:多媒体可视化 艺术元素 课件 濒危珍迹

当前,在研究、教学等领域数据可视化是一个极为活跃而又关键的部分,数据可视化也彰显出了其独特的魅力,它打破了原始的单一数据表现形式上,继而以一种创新、直接、大众的形式在各行各业发挥着巨大作用。就教育方面而言,随着科学技术的发展,多媒体技术慢慢的渗透到教学领域,对传统的教学方式形成了很大的冲击,人们开始思考能不能找到一种更为方便、高效、而又容易接受的媒介来传递知识,从而实现更有效的教学目的。在这种情况下,多媒体技术与信息数据的有机结合慢慢进入人们的视野。

一、前期调研和制定选题

现在市面上也出现了类似的多媒体课件,通过对多媒体技术的具体运用,把教学知识和多媒体技术有了很好的结合来传递信息,其中我们也看到了一些优秀的作品,有的展示非物质文化遗产的魅力,有的貼近实际生活,他们都能以独特视角来展示信息,传递信息。但是也不乏有一些多媒体作品,在借助软件技术的基础上,简单的把一些信息随意的堆积,整体来说缺乏多媒体的特色,不具备很好的知识传播价值,没有真正达到多媒体课件应该具备的一些条件。那么一件怎么样的多媒体课件才能让人爱不释手呢?我们通过大量的调研,在总结大众的观点上的基础上得出了一些有效的答案。首先他们觉得要有一个系统而全面的内容脚本,其次还必须要有一套符合主体且充满创意的界面设计,然后根据脚本内容设计出符合操作习惯的导航系统,最后要有耐人寻味的交互方式。当然一件多媒体作品需要涉及到的内容远远不止这些,我们也通过一件多媒体作品《濒危珍迹》的制作对这个问题进行了一些探索。

多媒体课件《濒危珍迹》也正是在这种时代的需求出现的。首先,在确定选题的时候,我们将目光投向了公益方向,保护环境?还是保护动物?我们经过一番讨论,环境和人类息息相关,人们每天都能接触到并且意识到要保护环境,而濒危动物不是每个人每天都能碰到的,所以现在正需要这样一个多媒体作品来传递动物的濒危信息,让人类意识到、关注到濒危动物,从而加入到保护它们的行列中来。

二、作品信息构架

我们认为多媒体课件首先必须有一个清晰的内容结构脚本,让人能在短时间内迅速了解课件在讲什么,这样就会让人觉得作品很好上手,从而提高了用户操作的信心。在这个前提下,课件主要以《中国濒危动物红皮书》系列为创作蓝本,对其中五大物种中的濒危级别较高的动物的相关数据进行可视化展示、分析。整个课件分为五大部分,分别为鸟类、鱼类、兽类、爬行类、两栖类,同时为了突出重点,我们有在50濒危动物中选择了濒危等级前十的物种进行深入分析,对每个物种的现状、分布、现存数量、生活习性等方面做了较为详细的介绍。主界面效果如下图所示:

三、界面信息可视化

主界面的设计为了突出情感,我们选用五类动物中最具代表性的五只,将视野聚焦到动物眼睛,因为眼睛是动物身体中最能传递信息的部分,让动物的眼睛“说话”。

其次我们也探讨了怎么展现复杂的信息数据,这些数据展现的目的是什么,信息往往让我们觉得枯燥无味,信息传递的目的主要是让人了解数据的内容。怎么才能让大家就收那些单一的数据信息呢?在作品《濒危珍迹》中,进入二级界面(此处以兽类为例进行说明),将会看到一张中国地图,上面分布着柠檬黄跟橙色两种颜色的闪点,每个闪点代表一种动物,闪点的位置分布是由动物所分布的地点决定,当鼠标靠近闪点的时候将会出现改闪点所代表的动物的信息,在闪点周围又出现了很多小的光点,这些都是动物活动密集区域,这样灵活的展示方式,让用户对信息一目了然,更节约时间。界面左边显示动物的相关数据信息,现存数量、体长、重量以及分布,这些数字以滚动变化的方式能够聚焦用户视觉,在文字跳跃率的处理上更加强化了用户对这组数据的集中力。这些信息通过我们的筛选,然后根据这些信息的重要程度,构建合理的层次、结构,字体与背景颜色明度的对比更加强了视觉效果,让用户能在短时间找到需要的信息。

当然最终的目的并不是为了让人了解这些数据这么简单,我们想通过这些数据的可视化的呈现让人洞察出单纯数据本身所不能反映出来的新内容。首先直观的展现这些动物的真实现状,目的是为了呼吁大家能行动起来着手保护他们。如作品《濒危珍迹》中二级界面中通过运用物种具体的数据来反应其生活的现状,然而又能通过数据折射出物种所面临的威胁,这才是我们想为用户展现的关键信息。如下图二级界面:(注:图为兽类中金丝猴的界面效果)

当然,在可视化过程中艺术形式表现在数据可视化过程中发挥分举足轻重的作用,好的艺术表现形式能赋予数据情感,能让数据充满生命力,能让用户对数据产生新的理解。在作品《濒危珍迹》中重点突出数据的表现力,以及数据之间的情感化表达。

对于濒危级别前十的动物,点击闪点可以进入其深入分析的界面,对于这个层级,我们最终的目的是想使用者在使用作品的过程中产生一种共鸣,激起他们对保护动物的积极性。

对于视觉元素的形态特征,不同的元素能表现出不一样的内涵,例如点线面几中最基本的构成元素,三者所表现出来的视觉效果完全不同,同时他们也有各自特定的适用场合,在《濒危珍迹》中,通过动态统计图的形式把数据信息展现出来,让使用者能在短时间内获取相应的信息,如右图:

在数据可视化中,根据整个主题的需要,把握色彩的设计原理、色彩之间的调和及其对受众情感上的融合。这点对于设计者来说尤其重要,颜色的选择会让作品的基调、情感、风格等产生很大的影响。如右图,濒危珍迹中整体颜色的是富有科技感的蓝色调,对于具体的动物,我们以每个物种的肤色作为背景色,整个风格相对统一。

四、作品总结

数据可视化设计是各种学科相互融合的一种设计,它让复杂的信息变得通俗易懂,在生活中大大提高了工作效率,在人们追求高效的时代需求下,数据可视化的优越性以显得越来越明显,可视化也迅速受到人们的重视,当然,数据可视化具有很大的可挖掘性,也还有很大的发展空间,正等着人类去探索。

大数据背景下数据可视化方法研究 篇7

1 数据可视化

数据可视化技术诞生于二十世纪八十年代,是运用计算机图形学和图像处理等技术,以图表、地图、动画或其他使内容更容易理解的图形方式来表示数据,使数据所表达的内容更加容易被处理。数据可视化技术与虚拟现实技术、数据挖掘、人工智能,甚至与人类基因组计划等前沿学科领域都有着密切的联系[1]。目前数据可视化技术大体可以分为5类:基于几何投影可视化技术、面向像素可视化技术、基于图标可视化技术、基于层次可视化技术以及基于图形可视化技术[2]。

数据可视化的简易工作图如图1所示:

2 传统的Radviz可视化方法分析

Radviz(Radial Coordinate Visualization)是一种基于弹簧模型的可视化方法,Radviz是将一系列多维空间的点通过非线性方法映射到二维空间,实现在平面中对多维数据可视化的一种数据分析方法。自从Ankerst于1996年提出Radviz技术以来,Radviz技术取得了很大的发展,被广泛应用于可视化分析和数据挖掘等领域。近年来更是把Radviz技术运用到基因表达数据的分类上,且取得了良好的分类效果[3]。

2.1 传统Radviz模型

经典的Radviz方法通常运用在平行坐标系上,将一系列具有多维度属性的点通过非线性方法映射到二维空间,使人们得以用肉眼观察。如图2所示,设n个特征变量随机均匀地分布在单位圆周上(如n=6),记为现在假设n个弹性系数不同的弹簧一端全部固定在一个小球上,另一端分别固定在。假定第j根弹簧对于观测点i的弹性系数为aij,如果观测点固定在圆内的一个平衡位置,那么就是n维空间在二维空间的投影,便实现了一个n维数据转化到二维坐标的Radviz可视化[3]。

其中,Xi表示随机均匀分布在单位圆周上的特征向量;单位圆周表示一个二维空间;O表示特征向量映射在二维空间上的平衡点。

根据胡克定律,对一个弹簧而言,小球所受到的弹力取决于弹簧拉伸的长度(矢量)和弹簧的弹性系数(标量),当小球静止不动时,则表明其受到所有弹簧的合力为零。对此可得到如下公式:

其中xj表示第j个变量在二维空间的圆周上的坐标,pi表示第i个观测点在圆内二维空间平衡位置的坐标。公式(2-2)表示第i个观测的平衡位置,式(2-3)表示观测平衡位置向量pi为各变量的坐标位置的加权平均。为了避免负值的出现,常常采用归一化的方法,即将最大值和最小值归为1和0,归一化后的所有得数值都位于[0,1]之间[4]。归一化公式为:

从上述公式分析,我们可以得出如下结论:

(1)维度值越大,那么该投影位置将更靠近该维度在圆周上的位置;

(2)改变圆周上的属性,将影响投影的位置;

传统的Radviz可视化方法计算复杂度低;可显示维度大;相似多维对象的投影点十分接近,容易发现聚类信息;直观便于理解。但是传统的Radviz方法也存在一些不足,该方法受数据本身及数据集的类型影响,当相似的数据集或成比例的数据集较多时,数据遮盖度会很大,将会影响对原始数据集的特征保持[5.6]。

3 改进的Radviz可视化方法分析

传统的Radviz可视化方法受数据本身和数据集类型的影响,一旦相似数据集或成比例的数据集较多,数据遮盖度就会很大,那么原始数据集的特征将会被影响,造成这种现象的原因是传统Radviz模型属性间的相互作用增加了数据密集度,使数据覆盖和重复概率增大,从而影响原始数据集的特征。对此,本文提出了一种改进的Radviz模型,新的模型减少了属性间的相互作用,从而使可视化结果更加接近数据集的原有特征。

3.1 改进的Radviz模型

改进模型采取1/4圆来对应n维空间,对于一个n维数据集,那么就将1/4圆n等分,即每一个点表示一个维度,然后通过弹簧模型来将数据集投影到二维平面的1/4圆中。但是每个点都在1/4圆弧上,则有可能最后的平衡点不在1/4圆内,那么就需要一个固定点来使得平衡点一定落在1/4内,这里把原点设为固定点。如四维数据集,原理图如下:

在图3中,X、Y轴分别表示投影点的横、纵坐标;原点表示用来使平衡点一定落在1/4圆内的固定点;Mi表示数据集的每一个维度;O表示数据集在1/4圆周上的平衡点;h(x,y)表示平衡点O的坐标函数。

3.2 改进Radviz可视化方法的实现

3.2.1 数据预处理

首先要对数据集进行预处理,把非数字转化为数字,然后对数据集进行归一化处理,使得数据集中的所有数据都在[0,1]之间。本文采用的归一化公式为:

3.2.2 固定点弹性系数

传统的Radviz模型没有固定点,当然也就不用设定固定点弹性系数。但是,在改进的Radviz模型中所有的属性都在1/4圆上,他们所受到的弹力都在一侧,无法使得平衡点落在1/4圆内,所以需要提供一个固定点,来提供一个弹力来使得平衡点落在1/4圆内。本文提出了一种全局均值的固定点弹性系数算法,全距均值就是所有属性中最大值和最小值的均值之和,它可以使数据可视化投影点处于居中的位置,方便进一步的数据处理。全距均值的计算公式:

3.2.3 新的平衡点坐标计算

设平衡点坐标为pi(x,y),根据胡克定律,可以得到如下公式:

其中,圆的半径为1,p表示弹簧弹性系数,k表示第i个数据中第t个属性的值,两个三角函数表示第t个属性沿坐标轴的分量[7.8]。再由合力为零,得到投影坐标的公式为:

3.3 改进Radviz模型与传统Radviz模型比较

传统的Radviz模型是把所有属性随机均匀分布在一个圆周上,那么属性之间的夹角都是钝角,那就使得属性的投影值小于它的初始值,这就导致属性值的落点更靠近圆点,增加了数据遮盖度,最终导致得到的数据可视化效果较差。而改进的Radviz模型是把所有的属性均匀分布在1/4圆周上,属性间的夹角就是一个锐角,也就是说属性的投影值不小于初始值,这就使得属性值的落点比初始值更远离原点,这就降低了数据遮盖度,最终得到的数据可视化效果就更好。

综上所述,改进的Radviz数据可视化方法更好,即更好地保持了数据集的原始特征,又能得到更好的可视化效果;为数据可视化的研究提出了一种更好的方法,使得数据可视化更加容易,得到的结果更加可靠。

4 总结

本文在研究传统的Radviz数据可视化方法的基础上,结合传统方法的优点,给出了一种改进的Radviz数据可视化方法,并对改进可视化方法进行了分析与比较。解决了传统方法不能很好保持原始数据集特征和数据遮盖度高的问题,使得数据可视化的效果更好,为数据可视化提出了一种新的参考方法。

摘要:大数据时代数据飞速增长,高维数据越来越多迫切需要新的数据可视化方法对高维数据进行处理。本文在传统的Radviz数据可视化方法基础上,结合弹簧模型,给出了一种改进的Radviz数据可视化方法,并通过两种模型之间的比较,证明了改进的Radviz可视化方法增强了属性间的合力,降低了数据遮盖度,更好地保持了原有数据集的特征。

关键词:大数据,数据可视化,Radviz,弹簧模型

参考文献

[1]任磊,杜一,马帅,张小龙,戴国忠.大数据可视分析综述[J],软件学报,2014(9):1909-1936.

[2]陈建军,于志强,朱昀.数据可视化技术及其应用[J].红外激光工程,2001,30(5):339-343.

[3]张涛,赵发林,武振宇,李康.Radviz可视化方法在基因表达数据分析中的应用[J].中国卫生统计,2011(1):2-4+8.

[4]徐永红,洪文学,陈铭明.基于Radviz及其优化的可视化故障诊断方[J].计算机应用研究,2009(3):840-842.

[5]陈琰.基于Radviz算法的金融数据可视化分析技术研究[D].浙江大学,2014.

[6]曾晶.Radviz可视化技术度量模型的研究[D].北京交通大学,2011.

[7]胡健,李济龙,曹丹阳.一种改进的Radviz数据可视化方法[J].北方工业大学学报,2015(3):30-35.

数据可视 篇8

关键词:大数据,数据新闻,数据可视化,数据挖掘

当很多人还沉浸在信息时代时, 一个大规模生产、分享和应用数据的时代已然到来。大数据时代不仅意味着信息或数据量的巨大, 还意味着对于数据的处理、分析、分享、挖掘等能力将得到前所未有的提升, 不同行业、不同领域之间数据的交换与相互利用也变得十分频繁。[1]大数据时代显著的特征之一即数据规模的爆炸性增长, 这些海量的信息数据来源多样, 包括政府机构、社会组织、企业等采集并公布的数据, 用户使用各类媒体平台产生的数据, 移动终端上的地理位置信息以及物联网上的各种状态数据等。这些随时随地都在生成的海量信息汇聚成可观的数据洪流。

最初, 对于“大数据”的关注与运用主要集中在IT行业、 市场营销、公共健康等领域。大数据的真正价值不在于它的大, 而在于它的全——空间维度上的多角度、多层次信息的交叉复现, 时间维度上的与人或社会有机体的活动相关联的信息的持续呈现。[2]因此, 对大数据进行分析, 其真正的价值与意义就在于透过多层次、多维度的数据以及历时态的关联数据, 找到问题症结, 直抵事实真相。

一、数据新闻的兴起

如今, 大数据的影响已经波及了传媒业。“数据新闻”也被称为“数据驱动新闻”, 但是关于“数据新闻”的概念, 业界并没有一致的界定。与传统以文字叙述为主的新闻报道不同, 数据新闻以数据为核心, 同时应用数据挖掘、数据抓取、数据分析、云计算等相关数据技术来组织新闻报道。具体而言, 数据新闻在形式上不需要连篇累牍的文字, 而是以数据、图表为主, 辅之以简要的文字进行说明;在实际操作中, 记者主要通过相关数据技术手段挖掘海量数据背后的意义维度, 最后依靠数据可视化技术将经过筛选后的数据进行融合, 以生动形象的方式加以可视化呈现。与精确新闻和计算机辅助报道比较而言, 数据新闻在报道的系统性、时效性、交互性以及阅读体验等方面都有了进一步的发展和提升。此外, 互联网将海量数据向用户自由开放, 用户通过相应的工具能够便捷地使用这些数据来自制新闻, 充分体现了数字化时代的开放、共享精神。

数据新闻作为大数据时代一种跨学科、跨领域的新闻报道方式, 逐渐为业界所重视。从兴起至今, 多家国际知名媒体都展开了相关业务并陆续发布了许多优秀的数据新闻作品。 近年来, 中国新闻界也开始了对数据新闻的摸索, 并获得了相当不错的成绩。以财新数据可视化实验室的数据作品为例, 其2013年发布的青岛中石化管道爆炸事故系列报道荣获亚洲出版业协会 (SOPA) 颁发的“2014卓越突发新闻奖”。2015年底, 财新数据可视化实验室的作品——现场直播新闻应用 “Hawkeye”在国际数字媒体创新大赛香港站比赛中获胜。财新团队提出, 随着移动端的普及, 新闻报道可以通过移动应用来完成, 现场前线记者实时上传新闻消息进行新闻直播的同时, 用户可以通过追查记者报道路径回顾新闻事件。

二、财新数据可视化实验室的数据新闻报道特点

(一) 及时跟进, 时效性强

2013年11月22日, 青岛中石化管道爆炸事故发生后, 财新记者在第一时间赶赴现场, 与后方30余名工作人员组成联合报道组, 24小时关注事件进展, 同时运用新技术手段协同工作, 通过引导及交互两个界面, 将前线记者获取的采访信息充分以数据新闻的方式大幅度、多角度地呈现了事态整体进展, 深入挖掘了事件根源。该新闻报道图集利用卫星定位技术, 将事故现场记者拍摄的照片标注于地图上, 使读者更易理解各爆炸点的地理位置与爆炸时间, 同时快速帮助用户建立起对事件始末的整体直观感受。事故发生24小时左右, 财新数据可视化实验室上线了完整的数据新闻作品, 充分体现了新闻报道的时效性以及财新团队利用移动互联网技术和新媒体手段报道重大突发事件的突出能力。

(二) 多元呈现

数据新闻的可视化利用图表讲故事, 在财新数据可视化实验室的《青岛中石化管道爆炸》报道中, 其核心是将记者拍摄的爆炸现场的照片按现场位置逐一还原到谷歌地图上, 让用户在互动过程中得到身临其境的感受。在该数据新闻作品中, 财新团队依次通过数个画面, 对谷歌地图进行逐步缩小, 让用户逐步了解爆炸事故发生现场具体的地理位置, 同时辅之以简要的文字描述, 对事件发生的时间、地点、起因等背景做完整交代。随着地图不断被放大, 用户会看到红色小标记标示的该事件的众多小现场, 点击其中每一个红色小标记, 用户即可浏览记者在所标记地点上拍摄的新闻图片。除此之外, 用户还能通过新闻图集充分了解到输油管道与损坏管道的分布、爆炸地点的分布、死亡地点等多方面信息。其不同的新闻呈现方式——网页版和手机版, 也满足了不同受众通过不同方式获取新闻信息的需求。

(三) 技术应用与信息传播并重

数据新闻中, 互动图表的发展以互联网的普及和编程语言的发展为技术基础。财新数据可视化实验室开发互动图表作品的主要工具为HTML5、CSS3和Java Script。HTML5用于绘制图形和动画, CSS3实现排版, 而Java Script用来处理交互和动画, 可视化技术能够为新闻传播带来很多可能。由于手机上的浏览器相对统一, HTML5技术使解决网页兼容性难度大大降低, 同时用HTML5发布的作品可以轻易地通过社交平台进行分享, 这在当下移动端普及的情况下, 对新闻传播有很大的帮助。财新数据可视化实验室手机平台数据新闻作品——《从调控到刺激楼市十年轮回》包括楼市十年、房价地图、环比分布、 房奴计算器与结语部分。在房价地图页面显示中, 手机用户可以下拉右上角的城市列表进行自主选择, 其可视化设计动态向读者全面显示了2005年~2015年这十年间全国平均房价及各城市平均房价的变动情况。

财新数据可视化实验室的数据新闻作品充分利用了数据挖掘技术与可视化分析之间的密切关系, 将数据信息图形化, 充分挖掘了海量数据背后容易被忽略的关系与特征。这样的数据新闻就像是一个数据库, 但它不是简单的、枯燥的数据展现, 它不给出绝对的结论, 不同的用户在获取信息的同时可以根据自身的兴趣点以及需求获得不同的内容。正是这样开放式的报道结构让受众在获取有用信息的同时, 也获得了完美、人性化的阅读体验。

数据新闻报道是一个综合、系统的过程, 它需要新的思维方式与多种能力的支撑。[3]数据新闻的出现与发展对新闻从业者也提出了较之以往更高的要求。由于数据新闻本身是跨学科、跨领域的, 未来的新闻从业者除了要具备传统新闻从业者所需的新闻敏感和文字能力外, 还需具备一定的数据搜索、 数据挖掘和统计分析能力, 以及设计或制作完成具有良好阅读体验的信息图表的能力。

参考文献

[1]彭兰.社会化媒体、移动终端、大数据:影响新闻生产的新技术因素[J].新闻界, 2012 (16) :3-8.

[2]喻国明.大数据方法与新闻传播创新:从理论定义到操作路线[J].江淮论坛, 2014 (4) :5-8.

[3]文卫华, 李冰.大数据时代的数据新闻报道——以英国《卫报》为例[J].现代传播, 2013 (5) :139-142.

[4]方洁, 颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界, 2013 (06) :73-83.

[5]杨雅.大数据分析与可视化技术:新闻传播的新范式——“大数据与新闻传播创新”研讨会综述[J].国际新闻界, 2014 (3) :161-168.

[6]黄志敏.程序员获新闻奖, 你怎么看?——解读财新网可视化数据新闻[J].中国记者, 2015 (1) :89-90.

[7]财新数据可视化实验室.青岛中石化管道爆炸[DB/OL].http://datanews.caixin.com/2013-11-24/100608929.html, 2013-11-24.

[8]从调控到刺激楼市十年轮回:房价地图[DB/OL].财新数据可视化实验室微信公众号:财新数据新闻作品集 (手机平台) , http://datanews.caixin.com/mobile/home/, 2015-12-31/2016-02-02.

数据可视 篇9

关键词:海洋数据,数据可视化,地图交互式查询,组件技术,数据库设计

1 概述

长期的海洋环境调查研究积累了大量的海洋环境数据信息,随着科学技术的飞速发展,这些数据更是以几何级数速度增长。海洋数据具有时空关联性强、时序长、种类繁多且格式多样的特点,因而对于海洋数据存储及展示的要求越来越高[1,2]。计算机和信息技术的快速发展也使海洋资料信息服务从单一方式向可视化、网络化方向发展,海洋信息共享也是海洋信息研究的一个主要趋势,而传统的文件存储格式存储容量有限,且不能满足信息共享与交换需求。数据库不仅能实现数据的统一管理,而且可以通过网络实现数据访问共享,因而也成为海洋数据重要的存储方式[3,4]。

我国海洋管理部门近年来开展了包括908“数字海洋”基础调查、渤海立体监测、渤海海洋环境质量状况与趋势监测、渤海海洋断面调查等多个专项调查,还开展了海洋站、浮标与海床基等多项常规性调查,建设了许多分散的、具备专项功能的数据库,但是缺乏能够集成各类海洋数据库和集成可视化展示和分析模型的综合平台,对数据库数据的管理应用有待进一步研究[5,6]。

国外许多机构基于海洋数据库已建立了许多功能完善的数据平台,目前的美国国家海洋数据中心、英国国家海洋数据中心(BODC)已经能够较好地实现对海洋数据的网络管理,能够实现多个领域的海洋数据的检索查询等操作[7]。亚太数据中心(APDRC)利用基于网格的LAS和DCHART服务器,为文件格式海洋数据提供了快速便捷的可视化。斯坦福大学提出Ozone集成模型对数据库ODMG进行扩展[8,9]。但上述系统有些仅对特定格式的海洋数据文件进行可视化,对于数据库格式的海洋数据直观展示数据工作相对较为薄弱,并且此类系统仅针对特定数据源,而不适用于所有的数据源格式,系统自身结构复杂,可扩展性较差。

本文设计研究海洋数据可视化信息数据库和可视化组件,实现海洋数据库统一管理及系统的可复用性;利用地图组件进行交互式查询,实现海洋数据的可视化查询与展示。

2 系统结构

2.1 体系结构

海洋数据可视化查询与展示系统(以下简称“数据可视化系统”)由数据层、业务逻辑层和应用层3层构成。

数据层是海洋要素可视化的数据来源,负责海洋基础数据的存储和读写。主要包括元数据库、基础数据库以及信息数据库。元数据数据库实现数据与属性信息的分别存储,通过元数据检索查询海洋数据,实现海洋数据的有效管理,提高利用效率。基础数据库包含海洋水文、海洋气象、海洋物理、海洋化学、海洋生物生态、海洋底质、悬浮体、海洋地球物理和海洋地形地貌基础9类数据库。而每类数据库中又包含了不同类别的数据。各数据库结构设计不同,所包含的数据类别也多种多样,数据量大,针对这一特点,可视化信息数据库存储数据可视化相关信息,为数据可视化展示提供统一接口,提高系统可复用性。

逻辑业务层通过对数据层访问,实现所有的业务逻辑。包括数据处理组件、数据格式转换组件、数据查询组件及数据可视化组件。

表示层通过将从逻辑层获取的数据利用可视化组件展示在页面中,曲线图为主要展示方式。

2.2 功能结构

数据可视化系统由3个功能模块组成,具体功能模块如图2所示。

可视化查询与展示系统分为数据格式转换、数据查询和数据可视化三个功能模块。

(1)数据格式转换

海洋数据多样性特点需要以不同的数据形式展现,因为存储格式也多种多样。数据转换功能将数据库数据无差异的转换为海洋数据常用的存储格式,如Net CDF、HDF、ASCII及目前通用的XML规范格式,满足用户多样性需求。

(2)数据查询

数据查询模块包括基于元数据的查询和目录查询两种方式。元数据查询是指首先查询符合条件的元数据,在此基础上查询数据库数据。目录查询方式是指对数据库数据按照学科目录进行分类,通过目录检索数据。

(3)数据可视化

数据可视化是指用户以地图交互方式查询数据,将抽取的数据以曲线视图展示,数据可视化实际也是数据查询的一种方式。

曲线类型包括时间序列图、剖面图及数据对比图。时间曲线展示的是选中要素在时间维度的连续变化。剖面图则是某一固定时间点以水深为基准的数据变化曲线。数据对比图是多个站点同一要素的变化比对图。

3 设计与实现

3.1 信息数据库设计

海洋基础数据包括海洋水文、海洋气象等数据库,这些数据在属性及结构方面存在较大的差异,若分别对每一类数据进行可视化研究则会耗费大量的精力,并产生许多不必要的重复工作,而且在此基础上开发的系统难以在其他数据库数据中应用,可拓展性及移植性较差。因此数据库设计必须具备通用性,综合考虑各类海洋数据的特点及共性,实现对数据源的统一访问。

经过对各类的数据库数据的对比分析发现,虽然各类数据库在数据结构等方面存在差异,但是各类数据库均包含可视化所需的时空信息、属性信息及特征要素信息。将这些信息单独提取出来,重新构建成一个新的数据库,即可视化信息数据库,记录每个基础数据库数据中所包含的数据类别、可视化要素集合、时间范围、经纬度范围、数据来源以及曲线类型信息,通过这些可视化信息检索基础数据库数据。

可视化信息数据库对基础数据库数据结构进行统一规范,为业务逻辑层提供数据层的通用接口,从而减轻业务层的工作量。可视化信息数据库E-R图如图3所示。

3.2 基于组件的功能开发

在面向对象如火如荼的发展进程中,组件的出现更具有非凡的意义。组件是一个组装单元,具有相对独立的功能、接口,并且顾名思义,组件可以独立部属并可以由第三方进行组装。利用组件技术可以优化软件结构并可以实现软件复用。用户可以依据功能需求通过对各类组件的重新组装构建一个新系统,避免重新开发软件。

目前通用的组件技术包括四类:Microsoft的DCOM/COM+、基于Java的Sun Soft J2EE、W3C的Web Service及OMG的CORBA标准实现。DCOM/COM+提供了良好的组件开发环境,并具有较好的容错机制,因此本文主要以DCOM/COM+实现开发。

根据对系统功能需求分析,该系统主要包括数据处理组件、地图组件、数据格式转换组件、数据查询组件及数据可视化组件。

数据处理组件主要是对数据层数据进行配置及访问,屏蔽底层数据库的异构性,能够直接访问大多数数据库中的数据,是其他组件功能实现的基础。数据处理组件以Web Service的形式开发,向外提供统一访问接口,实现平台独立的数据访问操作。

地图组件实现地理信息数据与航次信息基于GIS平台的统一可视化表达,地图组件同时融合时空维度筛选及多种视图形式,提供按照时间及经纬度范围筛选地理信息,以及地图、地形、卫星三种视图方式。地图组件通过数据处理组件提供的接口获取地理信息数据,处理后显示在地图上,用户可以通过拖拽及缩放调整地图的展示效果,点击地图中的标记可以显示选中位置的信息或编辑。组件提供对外接口,允许其他组件获取用户选中位置的详细信息。

格式转换、数据查询及数据可视化组件分别实现数据库数据多格式转换、数据查询列表展示及数据可视化展示的功能,此类组件各自独立,因此可以应用于其他的海洋数据可视化开发中,具有良好的可移植性。

4 系统应用

“渤海海洋数据可视化查询与展示系统”是上述系统的开发应用,该系统实现对渤海海洋数据库的数据查询、数据可视化及多格式的数据下载。系统界面如图5所示。

(1)数据可视化

左侧展示海洋基础数据库的目录结构,选定一个节点后,在页面主界面中显示该数据类别中的相关信息。

航次信息列表显示该数据类别中所有航次信息,根据所选择航次的不同,在左侧的地图中动态加载相应的站点信息,在地图中以红色点标记。地图左上方导航栏允许用户对地图上下左右移动、放大缩小等操作,用户可以按住鼠标左键对地图进行拖拽移动。

选定可视化的航次、站位及可视化要素后,点击“绘制曲线”按钮,“绘制曲线”按钮包含“时间序列曲线”、“剖面曲线”及“数据比对”曲线三种形式,分别对应不同的曲线类别。图4所展示的是指定站位下的海水温度曲线。其中该图的标题包括所选中的航次、站位及要素信息。曲线的纵坐标是水深,横坐标是海水温度,用户可以从曲线中直观分析出海水温度随海水深度的变化趋势。将鼠标放在曲线上的数据点上可以查看该点的实际水深及温度数值。

(2)数据查询

数据查询模块以列表形式展示渤海数据库数据。

(3)数据下载

下载查询的数据库数据,包括可视化形式展示或列表形式展示的数据下载。提供多格式的文件下载,包括通用海洋数据文件Net CDF、HDF、TXT及XML格式。

5 结语

本文对渤海海洋基础调查数据9类数据库中数十种类别数据结构进行分析,研究设计可视化信息数据库,屏蔽底层数据库异构,规范数据层数据,业务逻辑层仅通过一个接口即可访问各数据库中的数据,为统一处理数据奠定基础。

开发实现了各数据库通用的数据处理组件、地图组件、海洋数据格式转换组件、数据查询组件及数据可视化组件,不仅在本系统中应用优化系统结构,也可以在今后的类似系统开发中应用以实现二次开发,组件的独立部属及可移植性实现的软件的复用性,简化工作流程,节约资源。

设计实现了一个有效的渤海海区数据可视化查询与展示系统,用户通过该系统可以以可视化方式查询数据库数据并进行可视化操作。该系统对于渤海海区数据的管理共享具有一定的应用价值。

目前本系统只对渤海海区调查数据库数据进行可视化应用,下一步将对监测数据及产品数据可视化进行研究,以完善海洋多种数据库数据的可视化应用领域。系统对于海洋数据文件的可视化涉及较少,现在许多专业处理软件针对特定的海洋数据文件格式可以进行可视化等操作,为扩展系统功能,系统将进一步研究文件数据可视化的集成,在系统中调用海洋数据文件处理软件的接口,实现文件数据的可视化。

参考文献

[1]王卷乐,游松财,孙九林.地学元数据结构分析及其管理系统设计[J].计算机工程与应用,2005(5):5-7

[2]黄冬梅,张弛,杜继鹏,等.数字海洋中海量多源异构空间数据集成研究[J].海洋环境科学,2012(1):111-113

[3]邵宝民,李勃,田丰林,等.面向网络的海洋研究通用信息平台中的设计模式[J].中国海洋大学学报(自然科学版),2012(5):120-124

[4]覃如府,叶娜,许惠平,等.GIS系统中多维海洋数据可视化研究[J].同济大学学报(自然科学版),2009(2):272-276

[5]张峰,刘金,李四海,等.数字海洋可视化系统研究与实现[J].计算机工程与应用,2011(35):177-179

[6]黄冬梅,方的苟,张明华,等.面向海洋应用的Web服务管理监控平台构建[J].计算机工程,2011(2):272-274

[7]Serra-Sogas N,O Hara P D,Canessa R,et al.Visualization of spatial patterns and temporaltrends for aerial surveillance of illegal oil discharges inwestern Canadian marine waters[J].Marine PollutionBulletin,2008,56(5):825-833

[8]Kulawiak M,Prospathopoulos A,Perivoliotis L,et al.Interactive visualization of marine pollutionmonitoring and forecasting data via a Web-basedGIS[J].Computers&Geosciences,2010,36(8):1069-1080

三维地震数据的可视化 篇10

在地球物理领域,地震勘探是地球物理勘探中重要的方法之一。人们需要对勘探得到的数据进行解释来获取信息,但这些数据通常是海量的,缺乏直观性和可读性。20世纪80年代后期提出了科学计算可视化[1],并将其应用于地震数据的解释中。在三维数据可视化技术应用到地震解释中以前,地震解释人员通常对三维资料仅做二维垂直剖面解释。通过对每一条地震剖面上的每个层位、每条断层拾取后,再通过三维空间的组合来完成的。三维体可视化解释是通过对来自于地下界面的地震反射率数据体采用各种不同的透明度参数在三维空间内直接解释地层的构造、岩沉积特点。这种三维立体扫描和追踪技术可使解释人员快速选定目标,结合精细的钻井标定,可帮助解释人员准确快速的描述各种复杂的地质现象[2]。而直接体绘制技术有多种,本文采用的是光线投射算法。光线投射算法的一般流程是:数据分类—颜色赋值—光线追踪与数据重采样—图象合成。

2 地震数据分类

地震数据进行分类合理与否,将直接影响三维图像的效果。地质学家在长期的解释实践中总结出了一套有效的该方法,其中应用最广泛的就是地震相分析,它根据地震波在特征上的差异将地震剖面分为不同的地震相单元,比较常用的地震波特征有振幅、频率、连续性、速度等,其中最直观、最突出的特征就是振幅。已有许多实例表明,仅仅根据振幅的差异就能识别出不同的地质体。我们知道彩色图像的RGB三原色都是256级,将地震数据按振幅为256级,即转化为BYTE型数据,每一级代表一类数据,然后对每一级赋予相应的颜色和不透明度。

3 颜色与不透明度赋值

为了提高三维可视化图像的对比度,根据地震数据的振幅值赋予不同的颜色,每一种颜色又有强度的变化。除了颜色赋值外,还需要为每类数据赋予一个不透明度值,从函数关系上,不透明度和颜色都是振幅数据的映射函数,因此,根据传递性可将不透明度值转化为颜色的函数,即不透明度与颜色的关系可表示为一条曲线。

4 光线投射算法

光线投射算法的基本思想:假想数据场位于屏幕后的某位置,先按观察方向将数据场转换至视坐标下,通过屏幕上的一个像素点(设为Q),沿垂直于屏幕的方向(即观察方向)向数据场发出一条射线。该射线从P点进入数据场,从P点离开数据场,则屏幕上Q点处的视觉效果由PP段累积而成。在PP上按事先设好的步长值进行等间距采样,每个采样点的特征值和梯度值可由其所在的立方体网格的八个顶点的特征值和梯度值作三线性插值求得,然后根据事先定义好的特征值与伪彩色的对应关系,并应用适当的光照模型(通常采用Phong模型),计算出每个采样点的颜色值,然后由前至后或由后至前按相应的不透明度逐点累计颜色值,最后形成屏幕上Q点的累积视觉效果。屏幕上所有象素点按如上方法计算后,到了整个数据场在屏幕上投射的具有透明效果的图像。

光线投射算法与Z缓冲器算法相比,它们仅仅是内外循环颠倒了一下顺序,所以它们的算法复杂度类似。区别在于光线投射算法不需要Z缓冲器。为了提高本算法的效率可以使用包围盒技术,空间分割技术以及物体的层次表示方法等来加速。

5 图像合成

将每条射线上各个重采样点的颜色和不透明度值可按从后向前的顺序或从前向后的顺序进行累加。

5.1 从后向前的顺序进行合成

该合成算法是沿光线由后往前将各个重采样点的颜色值和不透明度值进行累加[3],以得到发出该光线的像素点的颜色值。

定义一个以某一数据点为中心的小正方体为体素,即一个体素内只包含一个数据。任何一个体素可发射光线和吸收光线,其中该体素内的数据的颜色和不透明度值即为该体素的颜色值和不透明度值。设第i个体素的颜色值为C_now,不透明度值为a_now,进入第i个体素从后向前的光线的颜色值和不透明度度分别为C_in和a_in,经过第i个体素后合成的光线颜色值和不透明度值为C_out和a_out,则有式(1):

当光线上有n个体素时,将各体素的颜色值进行累加后得式:

其中C0为初始颜色,最C为最终颜色,第i个体素的颜色值为Ci,不透明度为ai,该体素的透明度为

5.2 从前向后的顺序进行合成

从前向后的顺序进行合成与从后向前的顺序进行合成相反,它是逆着光线传播方向进行光线的合成。

设第i个体素的颜色值为C_now,不透明度值为a_now,进入第i个体素从后向前的光线的颜色值和不透明度度分别为C_in和a_in,经过第i个体素后合成的光线颜色值和不透明度值为C_out和a_out,则有式:

现在需要计算光线上各采样点的不透明度值。光射线上任意一点的不透明度=1-透明度。以逆光线传播方向进行不透明度的合成,设有一束单位强度的光线从左射入第i个体素,则射入前的光线秀明度值为1-a_in,不透明部分被吸收掉了,经过该体素后剩余的透明度值为1-a_out可计算出相应的不透明度损失,然后再根据不透明度值的损失与输入光能之比,可求得式:

然后根据式(3)和式(4)可计算出C_out。

由于从前向后的合成算法可以省去许多无效的计算,计算速度很快,因而一般都采用由前向后的算法进行光线合成。

6 结果与展望

我们利用上述光线投射算法应用于实际的地震数据可视化中,并得到了预期的效果。由于可视化能将原始数据投影到一幅完整的图像中,使得原来分散的信息能相互联系起来,便于综合分析和判断,因而比传统的二维图像要直观、可靠得多。

三维可视化的效果取决于对数据的正确分类以及不透明度曲线的合理调节对地震数据的分类的结果直接影响着可视化图像的效果,数据的分类是三维数据可视化的关键问题之一。

摘要:传统的地震数据解释方法是利用地震剖面与水平切片的二维图象显示三维数据,它具有很大的局限性。科学可视化技术的出现使得三维数据三维解释成为可能。将科学可视化技术应用于三维地震数据场,则产生了三维地震数据可视化技术,它主要包括面可视化与直接体绘制两种技术。本文主要研究三维地震数据场的直接体绘制方法——光线投射算法。

关键词:三维,地震数据,可视化

参考文献

[1]McCormick B H,DeFanti T A,Brown M D.Visualization in scientific computing.Computer Graphics,21(6)

[2]温庆庆.可视化地震资料解释系统的研究与开发.西安:西安科技大学.2008

数据可视 篇11

数据可视化可以使数据变得更有意义,而且可视化也可以使数据变得更容易理解。数据可视化软件正帮助越来越多的企业从浩如烟海的复杂数据中理出头绪,化繁为简,变成看得见的财富,从而实现更有效的决策过程。很多企业在上了ERP之后,面对海量数据,难以分析,难以清晰的呈现,难以从中发现问题,企业管理者也很难从中找到决策之道。 数据可视化工具能够以一种简便易用的方式将复杂的数据呈现出来,用户更容易理解这些数据,也就更容易做出决策。Tableau、Qlik、Microsoft、SAS、IBM等IT厂商纷纷加入数据可视化的阵营,在降低数据分析门槛的同时,为分析结果提供更炫的展现方式。

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员;我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于.NET、Java、Flash、HTML5、Flex等平台的,也不乏有适用于常规图表报表、甘特图、流程图、金融图表、工控图表、数据透视表、OLAP多维分析等图表报表开发的。为了进一步让大家了解如何选择适合的数据可视化产品,本文将围绕这一话题展开,希望能对正在选型中的企业有所帮助。下面就来看看全球备受欢迎的的可视化工具都有哪些吧!

传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数据时代,数据可视化工具必须具有以下特性:

(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;

(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;

(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;

(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。

数据可视化技术在现今是一个新兴领域,有越来越多的发展、研究等数据可视化分析,在诸如美国这些国家不断被需求。企业获取数据可视化功能主要通过编程和非编程两类工具实现。主流编程工具包括以下三种类型:从艺术的角度创作的数据可视化,比较典型的工具是 Processing.js,它是为艺术家提供的编程语言;从统计和数据处理的角度,R语言是一款典型的工具,它本身既可以做数据分析,又可以做图形处理;介于两者之间的工具,既要兼顾数据处理,又要兼顾展现效果,D3.js是一个不错的选择,像D3.js这种基于Javascript的数据可视化工具更适合在互联网上互动的展示数据。

大数据时代的可视化新闻 篇12

一、何谓可视化新闻

对于可视化的数据技术渊源在20世纪80年代, 其具体的内涵可以定义为通过计算机图形和科学的图像处理技术, 以直观的图表、地图或者动画的形式呈现数据信息, 使得数据表达内容更容易被受众理解和接受的一种形式。[1]有相关的研究数据显示, 人类对于外在信息的获取百分之八十来源于视觉信号, 所以可视化信息数据处理在目前这种大数据时代具有极其重要的促进作用。这种处理数据的技术与其他的学科诸如虚拟技术、计算机动画、数字地球甚至全球的经济趋势都有着非常密切的联系。这种可视化技术的充分应用是对大数据处理的一种挑战, 同时这也是一种发展的美好前景。可视化新闻就是将新闻以一种可视化的技术展现给受众。

二、可视化新闻的呈现形式

可视化新闻还没有一个非常明确的定义, 只是针对可视化数据技术来引申出的新闻可视化大概的定义。现如今的可视化新闻涵盖范围比较广, 不仅有传统的媒体还有网络媒体和新兴媒体。对于图表呈现的新闻只是可视化新闻的一个部分, 应该还包括在不同的数据平台上的呈现。

(1) 针对纸媒来说的二维可视化新闻呈现形式。这个主要说的就是那种以图表形式呈现新闻内容的形式, 这是现在平面媒体中应用最多的一种形式, 很多国内的主流报刊都加大了可视化新闻的呈现力度。例如, 南方都市报的数读板块。图表新闻作为可视化新闻的一种呈现形式是一种非常重要的手段, 也就是所说的二维可视化新闻。平面媒体大部分都是以文本信息为主的, 二维化的可视化新闻可以很好地将文本信息转化为直观的呈现方式。这种方式是可视化新闻发展中最基础也是最为简单的一种表现形式。

(2) 针对除了纸媒以外的可以利用三维或者多维可视化新闻呈现形式。这种方式是二维可视化新闻的发展和进步。三维可视化新闻是在二维可视化新闻的基础上再引入体积的概念, 主要呈现的电视媒体、网络媒体和新兴媒体中, 这种呈现形式的内容涉及范围很广, 政治经济文化军事几乎均有涉猎。多维可视化新闻是将一条新闻以多种属性来描述呈现。在我国这种可视化新闻模式还没有发展得很兴盛, 主要是由于专业的团队和技术还没有跟上国外的步伐, 同时这将是可视化发展的重要方向。

(3) 一种比较特殊的呈现形式是网络可视化新闻, 它很有可能是与上面介绍的两种存在于统一媒介当中, 但是网络可视化新闻是没有固定层次的, 可以有多个选择进行两个节点的串联, 并且两者之间的关系属性是时时变化的。这种可视化新闻的呈现方式是一种开放的方式, 伴随着科学技术的迅速发展和数据的逐步公开性, 网络可视化将会更加智能有效。[2]

三、可视化新闻对于新闻报道的革新

首先, 在新闻的信息发布模式上可视化新闻重新树立了一种新的模式。在现如今多媒体迅速发展的时代, 信息传播者和受众的界限已经很难断定, 任何一个普通的受众都有可能是意见新闻的传播者, 不改变的是这个传递的过程。可视化新闻的模式中, 发布新闻不是一个新闻的终结, 在现如今很多的网络媒体中, 可视化新闻的发布往往是一个新闻热点讨论的开始, 任何一个受众都可以再将新闻完善, 这意味着可视化新闻的发布成为新闻报道的一个枢纽, 承接这个新闻热点的实时动态。[2]而同时新闻是否具有价值, 根据参与的受众就可知晓。参与新闻制作的过程同时也是深入了解新闻事实的过程, 通过对新闻报道的参与和互动可以达到各种不同思想的碰撞和交流, 这会超出新闻本身的价值。

其次, 受众对于新闻报道的反馈加之可以通过可视化新闻很好的展现。例如, 众所周知的美国大选, 纽约时报就会宣布制作的大选时间表, 这样就可以很好地提升受众信息反馈的价值。可视化新闻可以扩大受众的选择力度, 也可以很好地提供受众所需的信息, 对于受众获取新闻信息, 可视化新闻可以起到一个很重要的指导作用并且极具针对性。因此, 受众的反馈价值可以得到很好的提升。在了解可视化新闻的时候要知道它的背后是有很强大的数据支持的。

再次, 在新闻报道上可视化新闻可以拓宽新闻的报道思路。采访作为新闻信息的来源, 是非常重要的, 但是在我国很多商业新闻网站还没有采访的权力, 这会给这部分企业获取新闻资源造成严重的障碍和困境。可视化新闻的出现可以解决这个难题, 因为他们可以通过数据的整理以制作信息图表的方式向网站用户展示新闻事件, 可以不再单纯的转载和转发。[1]

现如今, 人们对于信息资源的需求越来越强烈, 对于数据分析的需求也在飞速地增长, 这就需要可视化新闻越来越多的呈现, 在这个过程中, 普通用户也不断地被要求或主动参与到设计和创建可视化项目的过程中。这样就会使得新闻报道更易于受众的理解, 从而帮助用户很好地做出决策, 并体验和参与有趣的可视化新闻制作。

摘要:在信息飞速发展的现如今, 数据处理技术也得到了突飞猛进的发展, 不管是在采集上还是存储上都有了一个更加方便、成本更低的方式, 塑造了一个大数据时代。在数据处理和分析上由原来的只有专业数据分析师能做的事情, 变为很多跨专业的人士也能处理海量的数据。面对大数据的处理, 人们需要更加清晰的传递决策和计划, 这就需要一种更加有效的途径使得大数据更加易于接受和理解, 在新闻的呈现形式上需要一种可视化的途径。可视化新闻就是以数据信息为新闻的核心, 用一种可视化的形式呈现, 使得受众更加方便和容易接受。

关键词:大数据时代,新闻,可视化

参考文献

[1]涂聪.大数据时代背景下的数据可视化应用研究[J].电子制作.

上一篇:热轧轧机下一篇:激光光凝