数据分发系统

2024-10-25

数据分发系统（共8篇）

数据分发系统篇1

1 引言

Windows操作系统以其良好的用户界面设计、功能强大易用、应用软件丰富占据了广大的市场, 在诸多领域都有应用,但不可否认的是Windows系统长期以来受到病毒侵袭的困扰,系统的稳定性和可靠性下降, 直接降低了使用的效率, 使数据安全面临着巨大威胁。在应用稳定性要求苛刻的条件下,有必要对计算机进行相关的防护, 达到对特定的联网计算机进行保护的目的。为此建立中间防护层, 构建相对独立的网络环境, 与外围网络上的计算机进行隔离, 隔离成为两个相对独立的Windows网络应用环境, 仅允许特定数据越过隔离层传输, 避免信息直接在Windows系统之间相互传输。

为此选用Linux操作系统作为中间隔离层使用。Linux系统是一个开源的操作系统, 经过多年的发展, 得到了开源组织的广泛技术支持, 内核十分稳定。运行于Windows上的病毒感染Linux系统的可能性不大, 目前应用中尚未发现该类病毒, 因此从病毒隔离的要求来看, 采用Linux系统作为中间隔离层是可行的。同时基于Linux内核的操作系统版本可选择性较多, 驱动程序丰富, 支持主流配置计算机, Linux具有强大的网络功能, 是一个多用户多任务的操作系统, 能够满足网络实时通信的要求。基于以上原因采用Linux系统作为系统应用的中间隔离层支撑。

2 开发及应用环境

Linux具有高性能、高可靠性、易扩展性和稳定性极好的特点, 其网络功能强大, 已发展成为相当完善的操作系统。本开发应用是选用的是Red Hat (红帽子) Linux操作系统,该操作系统支持主流计算机平台, 安装过程采用用户向导模式, 易于安装使用。

本应用在Linux系统下开发完成, 并最终应用于该系统。详细开发和应用环境如下所示:

系统环境: RHEL Enterprise Edition Server 5

系统内核: 2.6.18

开发工具: KDevelop 3.4; Qt3 Lib

硬件平台: Intel x86

3 应用设计分析

3.1硬件平台构建

根据使用的要求, 运行Linux操作系统的中间隔离层设备处于内部网络和外部网络联系的中间环节, 原先内、外网络的直接数据交互, 衍变为通过中间隔离层完成, 内、外网络数据没有直接的交互, 硬件上完全隔离, 各自成为独立的网络体系。硬件平台构建示意图如图1所示。

在中间隔离层计算机安装双网卡或多网卡设置, 采用单独的一块网卡联接内部网络, 其他网卡根据实际需要联接外部网络, 在硬件上构建独立的信息交互通道; 在软件上搭建数据传输服务支持平台。

3.2 软件应用服务搭建

中间隔离层的加入以最小影响原有系统功能为目标, 提供原有应用环境所有的网络数据服务需求。中间隔离层的设计要完成以下3方面的工作: 开启系统防火墙, 隔断一切非预期网络数据的传输; 提供约定数据通信的服务, 沟通内外网络, 建立数据通信通道; 提供常规文件传输服务, 实现资源共享。

3.2.1 系统防火墙

Windows和Linux都采用了TCP/IP通信协议, 在无任何特殊防护设置的情况下, Linux系统中被默认开启了部分通信协议, 可能导致用户不希望信息的相互传输, 尽管病毒不会感染Linux系统, 但仍不能避免染毒文件的传播。为此, 开启Linux系统防火墙 , 不对外提供一切非预期的数据传输服务。防火墙的设置界面如图2所示。

在设置选项中开启防火墙, 关闭一切信任的服务。在其他端口的选项中, 添加用户已知的数据通信端口, 设定通信协议, 仅允许该类数据能够被系统响应, 专用数据处理程序也仅对该类数据进行处理, 提供数据通信的服务。

3.2.2 建立数据通信服务

数据通信服务是沟通内、外网络数据的传输通道, 仅允许约定传输规范的数据能够通过。应用中, 通信服务程序负责对特定内外网络的数据传输接口进行监控, 当特定数据到来时, 按约定, 完成内外网络数据的交互, 使原有系统功能不因中间隔离层的参与而导致数据传输异常。

3.2.3 文件传输服务

病毒传播很大一部分来源于文件的相互拷贝, 病毒隐藏在正常文件中被拷贝, 感染到其他系统。Windows系统中易受病毒感染的文件是有规律可循的, 如可执行文件、办公文档Office文件等, 普通的文本文件、数据文件等一般是不会感染病毒的, 因此应当选择适当的文件进行传输。

为了实现资源能够相互到达, 建立文件传输服务。文件的传输服务基于对所有类型文件均认为是二进制文件, 在文件的传输端将文件分解, 在接收端将文件重新合成。

4 软件设计开发

4.1 数据通信服务

应用中数据通信的协议为TCP/IP协议, 采用面向无链接的UDP数据报或有链接的TCP数据流。通过网络套接字接口进行通信服务程序的开发, 以数据报通信为例进行说明。

4.1.1 创建与绑定套接字

套接字的创建和绑定是实现数据通信的基本环节, 以实现通过本地端口进行数据的接收。创建方法同Windows网络通信类似, 不再重述。

4.1.2 远端通信配置

指定数据通信的远端通信端口和通信地址, 通信地址需通过转换函数将IpV4地址格式转换为整型数据格式。数据的发送的地址和端口号不需要与特定套接字绑定, 可通过本地套接字直接进行发送。

4.1.3 套接字选项设置

根据不同的网络数据通信需求, 要求对套接字进行相应的配置, 使之实现不同的通信要求, 如广播、组播等, 点对点数据通信中不需要进行该项设置。可采用setsockopt () 函数进行设置。

4.1.4 数据的接收与发送

数据接收与发送采用recvfrom () 和sendto () 函数完成,若数据收发正常, 函数返回数据收发的字节数, 否则返回异常值, 可通过监测返回值确定数据收发的正确性。

4.1.5 套接字的关闭

数据收发完成后, 应当关闭套接字接口, 释放资源。虽然程序在完全退出时能够自动释放所占用的资源, 但从程序实现的规范和软件稳定性上而言, 应当主动关闭套接字。

4.1.6 阻塞与非阻塞

网络数据的接收函数recvfrom () 是阻塞式调用, 所谓阻塞是指当程序运行到该函数时, 程序要等到该函数完成才能返回, 用户可再次获得控制权。函数的阻塞式调用会导致两方面的问题, 首先, 网络数据是连续的, 若接收函数处于主程中, 在连续接收数据的情况下, 用户基本上没有再次获得控制权的机会; 其次, 若有多路数据的收发, 任何一路网络数据的阻塞, 都会导致其他网络数据的丢失, 可采用如下两种方法解决。

(1) 多线程调用

多线程是解决上述问题通常采用的方法, 即在主线程中开辟多个线程, 每个线程负责一个模块功能的实现, 单个线程的阻塞不会影响到其他线程的正常运行。Linux的编译器gcc在默认编译设置中, 没有对多线程的支持, 需设置编译参数pthread, 加载多线程库。在实际的应用中发现, gcc对网络广播的功能支持有限, 但可良好支持点对点数据网络收发。

(2) 网络数据查询

将所有需要控制的句柄 (网络数据的套接字也是句柄)纳入查询集fd_set中, 设置查询等待时间间隔, 使阻塞函数最大只能等待约定时间, 将控制权交回, 用于其他网络数据的收发。如果时间间隔为0, 则阻塞调用会立即返回, 不需等待。

单纯的多线程或网络数据查询, 仅解决了线程受控和多路数据收发一个方面的问题, 只有将两者结合起来, 才能实现线程受控的多路数据收发。

4.2 文件传输

文件传输的设计用于解决数据资源信息共享的问题。主要涉及内外网数据与中间隔离层之间资源共享、内外网之间数据资源共享两方面问题。在数据资源的共享传输上, 采用共享方将数据资源分解为二进制数据, 按照约定传输通道接口、格式规范等发送到接收端, 在接收端将数据重新组装成数据文件; 在内外网数据资源共享上, 由中间数据隔离层提供数据传输的通道, 对信息进行交叉传输。数据传输可按照如表1, 表2约定进行。

表1文件传输格式约定

程序在上述状态的控制下, 进行文件的传输。首先传输文件名, 然后传输文件数据, 当文件传输结束时, 通过状态控制最终形成数据文件。完成以上功能需要在内、外网建立文件发送和接收程序; 在中间隔离层建立文件接收、文件发送、文件信息交叉传输程序。

文件的交叉传输并不能保证病毒会被中间隔离层隔离,病毒会夹杂在文件数据中一起被传输, 因此在内外网传输的数据中, 不应当包含易被病毒感染的文件, 一般情况下只应传输普通文本文件或特定数据文件。

5 结语

通过应用设计开发, 该系统可正常运行, 起到了系统隔离的目的, 极大地提高了内网系统的稳定性和可靠性。尽管目前也出现了一些对Linux系统攻击的程序, 但在上述内外网大都为Windows系统应用环境中, 通过开启网络安全防火墙,仅允许特定数据通过和本应用环境相对特殊的情况下, 保证了系统的可靠运行和对系统的防护。该应用设计对其他类似系统的设计或Linux下的网络通信应用开发有一定的指导借鉴意义。

数据分发系统篇2

关键词:量子密钥分发单光子探测远程同步

中图分类号:TN918文献标识码:A文章编号:1674-098X(2011)05(c)-0008-01

1 引言

量子保密通信经过20多年的发展,已经取得了很大的突破。目前的量子信号都是采用同步探测的方法来测量的,都必须有同步时钟来保证有效信息的生成。因此,要构建量子保密通信网络,系统的精确时钟同步是一个重要的关键技术问题。

2 量子密钥分发系统远程同步问题研究

目前实验室常用的同步方法是利用短电缆进行同步信号的传输,这种同步方式只可以在实验室环境下可以很好的工作。在实际应用和测试实验中,另外两种同步方式被深入研究:一种是利用一对光纤分别传输时钟光信号和量子光信号[1],另一种方式是利用復用的方法通过将不同波长的时钟光信号复用到量子光信号的传输光纤中进行传输[2-6]。

目前被认为最有前景的研究方向是利用复用方法通过将不同波长的时钟光信号复用到量子信道中进行传输。该方法可以很好地补偿时间抖动,对应用环境的硬件要求也没有增加。但是,这种方案中的时钟光脉冲和量子信号同时在一根光纤内传播,它们之间必然会存在串扰,这种串扰对于经典通信来说可以忽略,但是由于量子信号的能量比时钟光信号小很多个数量级,时钟光信号会对量子信号会产生很大的影响。虽然通过滤波技术可以将这一背景噪声降到可忽略的水平,但是,因为光纤的非线性效应,时钟光信号和量子信号在传播过程中相互作用产生和量子光信号同频的光子,它会使量子终端用户的误码率急剧增大,甚至可能会使通信无效。2005年,Runser等人从实验上证明1310nm量子信号在传统网络中传输时,由于拉曼散射的影响,这两种信号的最小波长间隔为大约170nm左右最佳[2］;2006年Nweke等人提出用高隔离度的滤波技术来抑制拉曼噪声光子和串扰［3］;2007年,Rohdet等人提出当量子信通信融入到商用光纤时,非线性效应会对量子通信产生很大的影响,并指出主要的影响是受激拉曼散射和四波混频［4］;2008年,Tanaka等人提出通过降低传输时的时钟信号功率来减小非线性效应产生的影响［5］;2009年,Peters等人研究了拉曼散射和四波混频对量子信道的影响,并提出了两种方法来减小四波混频的影响［6］。而对于时钟信号的其它可能的影响,在这些同步方案的报道中虽有涉及,但是还没有详细的理论和实验分析,缺乏对强时钟光信号和极微弱量子信号在传输光纤中相互作用产生误码光子的物理模型的研究,必须找到方法来避免时钟同步信号对量子信号的影响,这是一个关键性问题,它也是决定该同步传输技术实用化的一个重要因素。

3结论

目前常见的三种量子密钥分发系统同步时钟的传输方式主要有三种:电缆、一对光纤以及同一条光纤。利用波分复用和时分复用技术将量子信号光和时钟信号光耦合到一条光纤中传输可以很好地补偿长程传输的时间抖动,但是量子信号光会一定程度上受到时钟信号光的影响而使得系统误码率增加,如果该影响可以通过深入的研究被规避,则可使得复用同步技术更具实用价值。

参考文献

[1]Xiao-Fan Mo, Bing Zhu, Zheng-Fu Han, You-Zhen Gui, and Guang-Can Guo, "Faraday-Michelson system for quantum cryptography," Opt. Lett. 30, 2632-2634 (2005).

[2]Runser R. J., Chapuran T. E., Toliver P., et al, Demonstration of 1.3μm Quantum Key Distribution (QKD) Compatibility with 1.5μm Metropolitan Wavelength Division Multiplexed (WDM) Systems, Optical Fiber Communication Conference and Exposition and The National Fiber Optic Engineers Conference, Technical Digest, Anaheim, California OWI2(2005).

[3]N.I. Nweke, R.J. Runser, S.R. McNown1, et al, EDFA Bypass and Filtering Architecture Enabling QKD+WDM Coexistence on Mid-Span Amplified Links, Conference on Lasers and Electro-Optics (CLEO), Long Beach, California CWQ7 (2006).

[4]Harald Rohde, Sylvia Smolorz, Andreas Poppe, et al, Quantum Key Distribution Integrated into Commercial WDM Systems, Optical Fiber Communication Conference and Exposition and The National Fiber Optic Engineers Conference, OSA Technical Digest (CD), OTuP1(2008).

[5]Akihiro Tanaka, Mikio Fujiwara, Sae Woo Nam, et al. Ultra fast quantum key distribution over a 97 km installed telecom fiber with wavelength division multiplexing clock synchronization Optics Express 16,11354 (2008).

数据分发系统篇3

随着信息技术的不断提升,信息化程度的不断提高,人们对计算、存储资源的需求也呈现出高速增长的趋势。然而摩尔定律的制约使得人们不得不去探索其他的方式来满足对更高计算能力、更大存储空间的追求。从上世纪80 年代开始,分布式计算以其突破传统的思维方式得到人们的认同,人们试图以此突破单机计算的CPU、内存等瓶颈问题。到本世纪初,基于物联网的分布式计算、网格计算、效用计算、透明计算等应运而生。图1为2008年至2011年在基于物联网的云计算和网格计算受关注度的变化趋势。可见云计算自2007 年兴起以来,正以高速增长的态势吸引了众人的目光。

另一方面,随着当前互联网应用的集成化,大规模数据一体化管理、数据安全性、分布式环境下的多用户共享应用、数据动态更新等方面的需求日益强烈,采用大型数据库系统管理大规模的空间数据成为发展的重要方向,但传统的两层客户端/数据库服务器的网络应用模式,随着数据规模的不断增大,多用户并发数的增加,数据库服务器既是网络存储服务器,又担当网络通信服务器。这造成了数据库服务器负载压力过大,且在多用户并发访问时导致数据库服务器严重的I/O瓶颈和性能瓶颈,使多用户并发的数据管理模式在满足流畅可视化、高性能分析等实时应用方面遇到了难以克服的障碍。

而云平台由于采用分布式存储与高性能计算,在处理海量空间数据分发与管理的问题上具有极大的优势。针对多源、多类型、大规模空间数据具有的海量性、数据结构复杂性、数据量差异性等特点以及目前互联网应用对实时应用的高性能数据调度的要求,亟需研究一种基于云平台的适用于空间数据分发与管理特点的高效系统,在理论与实际应用中都具有非常重要的意义。

1 相关研究工作

1.1 空间数据研究

当前互联网应用的共同数据基础为空间数据。所谓空间数据指地球上任何一种地物都有其空间属性,如它的大小、位置、形状和分布信息等。广义上的空间还要包括其时空特性。因此,空间数据即用来描述与表达物体的以上信息,对物体定性、定位,表达其时间、空间、拓扑信息,实现对现实世界的概念模型的表述。其本质上是一种用几何上的点、线、面以及拓扑关系、时空信息等数据结构构建的概念模型。空间数据是搭建空间数据管理系统、空间数据建模、空间分析与可视化的基础。

空间数据通过GPS、Lidars等手段获取数据的空间定位信息,使其在空间参考系统中具有唯一的空间位置属性。时间属性是指物体的时间信息与变化特性,既可以作为一般属性与空间属性结合,也可以作为四维尺度控制整个信息系统。拓扑信息用于表示物体的相互关系,是空间数据的第三层属性。武汉大学李德仁院士提出的“智慧地球”(2009)以及当前各个城市的信息部门积极研究的智慧城市应用中,空间数据是其基础信息与功能基础。目前随着LBS服务、移动通讯技术的发展,空间数据已经广泛应用于社会各个领域和各个行业,如国土资源信息与规划部门、公安消防、景观设计、房地产行业、航空探月等。例如2010年开始流行的Check-In服务,从美国的FourSquare到中国的街旁、切客等,无处不在应用着空间数据,用户也逐渐认识到空间数据的概念与其重大作用,是与生活息息相关的。这也反过来推动了广大用户对采集、获取、处理和应用空间数据的发展。

1.2 宽带网络与智慧城市

我国正处于以信息化带动工业化发展战略实施重要时期,而宽带通信已经是重要的领域。宽带化战略将为感知中国理念下的网络与云计算的发展提供泛在支持,从而为构建无缝、可移动、最大众化的物联网奠定工程技术基础。个人通信、物联网、三网融合、家庭信息化等服务发展急切需求为导向,抓好宽带化、IP化的发展方向,才能实现感知中国、智慧地球作为重要的支撑。

对于高速宽带网络以及云计算的需求,一是LBS,利用无线网把地图服务器、空间数据库的引进和甲骨文(微博)的数据库接到Web服务器上,可以送到用户端上的位置服务。将实时交通路况采集、导航电子地图,通过导航服务中心送到每个车载用户上,只有电子地图不能反映路况,将路况和地图,地图还要每年更新才能构成智能服务的导航服务。目前研究较成功的应用如影象城市和我秀中国,其系统已采集电子地图和街景影象共2TB,并创建30个兴趣点,访问量需要宽带。

智慧城市则是一种以全面感知为主的概念,并有包含云计算、物联网,面向应用和服务,与物理世界融为一体,能实现自主组网,自己维护等特征。我国著名计算机学家龚健雅院士用一句很经典的话来概括了城市数字化与智慧化的区别,即数字城市能做到:“秀才不出门,能知天下事”,而智慧城市却能够做到“秀才不出门,能做天下事”。

2 空间数据数据管理与分发

2.1 基于云平台的分布式存储管理方案设计

基于云平台的空间数据的存储管理需要考虑海量数据模型的建库以及分发。本文采用空间实体集成表示的统一数据模型作为支撑数据库的概念模型,针对各种专题的空间模型数据以及DOM数据、属性数据等,提出兼顾空间关系与语义关系的云平台空间数据库模型及其数据结构,并针对文件系统、关系型数据库管理系统及其集群并行管理系统等三种不同的存储环境,分别设计高效的管理海量数据的数据库组织与存储结构,如图2所示。

具体方案设计如下:

(1) 在云计算平台下,需要特别考虑传输速度与带宽需要,地形数据采用瓦片金字塔模型进行分层与分块组织;针对整个数据范围的空间模型数据具有范围广、数据量大,对象数量多等特点,三维模型数据采用基于数据内容的分区方法进行组织,并按地上地下与室外室内建筑模型、道路网络模型、管线模型、环境模型等专题进行分类组织;针对地理典型应用,系统可提供专题数据的组织方式和地形、属性及各类三维模型数据的组合模型,将耦合度高的数据内容紧密结合,以提高应用的效率。数据管理和调度提供参数操控和调整界面。

(2) 针对传统单机版数据库管理模式在TB级海量三维空间数据访问存在的严重I/O瓶颈和服务器性能瓶颈,本文设计了基于网络数据库集群的并行三维空间数据库组织管理技术。针对三维空间数据的大规模海量性、非结构化变长和非均匀分布等特点建立了三维空间数据并行划分方法,通过三维空间数据并行划分和组织,基于多层次并行空间索引结构,并利用数据库集群服务器实现对网络大规模三维空间数据的高性能并行管理。

(3) 针对适用于云平台上Internet上的文件系统、关系型数据库管理系统及其集群并行管理系统等三种存储环境对于数据管理的不同特性,在统一的空间数据库模型的基础上,分别设计适于每种存储环境的三维空间数据库逻辑结构及物理存储的方案。

2.2 云平台下的数据无线压缩与分发设计

考虑到云计算平台中采用无线通信对空间数据进行分发的需求以及互联网空间数据基于XML结构的特点,本文设计了一种适用于空间数据的整体同构压缩与分发算法。该算法整体上可以划分为四个关键步骤:空间数据文档的读取与解析、基于语义同构的压缩算法功能设计、压缩文件的直接读取。下面进行详细论述。算法流程图如图3所示。

压缩模型的输入包括空间数据原始数据文件和所采用的分组个数。空间本原数据首先经过读取和解析的操作,获得文档树结构。然后对文档树进行整体同构压缩,该过程包括两个主要的子流程,语义结构压缩与数据内容压缩,其中语义结构压缩对空间数据文档中的标签项按照“高频低码”的思路予以置换,数据内容压缩采用K-Means等聚簇算法对空间数据进行分类并重新定义坐标系。然后输出压缩后的空间数据数据文档以及两个辅助文件。最后,在移动终端,模型所设计的直接读取算法利用两个辅助文件,对压缩生成的空间数据数据文档进行直接读取,并进行空间查询等操作。

互联网应用中的空间数据文件不仅具有XML结构嵌套、文本表达的特点,作为矢量数据格式,它同样具有矢量数据的优点,并具有面向对象表达的特性。因此,在空间数据整体同构压缩模型中,提出了采用聚类方法对各要素进行分类并进行坐标系的转换,从而减少数据量。通过对多种聚类算法的比较,最终采用的是简单而高效的K-Means聚类算法。

压缩算法的设计如下:

算法描述:空间数据_DataContentCompress(int ClusterNumber);

输入参数:对原始数据进行分组的个数ClusterNumber ;

输出结果:数据内容同构压缩后的空间数据文档和坐标系转换辅助文件;

方法:将所有数据标签下的内容读出并进行字符串切割,即每个要素的所有点坐标对。为简化算法,可以将线要素均看作短线,面要素看作小圆,即将各要素取其中心点,然后采用K-Means算法进行聚簇划分。最后,将各要素按照所属聚类的局部坐标系进行坐标变换并置换文档数据节点内容,同时生成坐标系辅助文件。

步骤1 数据内容读取

//获取数据标签与命名空间

XPath xpath = XPath.newInstance(″//空间数据:LineString/空间数据:coordinates″);

xpath.addNamespace(″空间数据″,″http://www.opengis.net/空间数据″);

List list= xpath.selectNodes(root);

for (Each element in the List)

{

//对每个数据标签下的内容进行数据切割并求出要素中心点

String NodeContent=element.getText();

String Coordinates[]=NodeContent.split(″ ″);

for(int i=0;i<Coordinates.Length;i++)

String co[]=Coordinates[i].split(″,″);

Float c_x=Sum(Co[0])/Coordinates.Length; //求出中心点坐标

Float c_y= Sum(Co[1])/ Coordinates.Length;

}

步骤2 采用K-Means算法对各要素中心点自动分为ClusterNumber组

Cluster mProtoClusters[] = new Cluster[ClusterNumber];/

//对各聚类进行初始化,聚类中心的初始值为随机点

for(j=0;j<ClusterNumber;j++)

mProtoClusters[j].m_PointTag.Add(Rand)

//对各点求出离其最近的聚类的中心点并将其归到对应的类中,并

//更新聚类中心点

updateCenter(PointArray,mProtoClusters);

//不断循环上述过程至各聚类的中心不再发生变动

while(mProtoClusters[i].center!= mProtoClusters[i].oldcenter)

go2Cluster(PointArray,mProtoClusters);

步骤3 对各要素进行坐标变换并写入结果文档

Float x=tmpx-mProtoClusters[PointArray[loop].ClusterTag].m_X;

Float y=tmpy-mProtoClusters[PointArray[loop].ClusterTag].m_Y;

e.setText(x+” ,”+y);

3 实验分析

3.1 线状数据压缩与分发效率

本次实验采取大小为1200KB的空间线状数据Road.gml,该数据包括634个线状要素。数据GML模式文档及原始图形如图4(a)和图4(b)所示,图4(a)的深色填充部分为整体同构压缩的过程。

在实验中,为研究不同聚簇个数对压缩效果的影响首先只对线状原始数据进行了数据内容的压缩。程序将聚簇个数从2到599进行了统一的自动压缩文件生成。然后对原始文档同时进行了语义同构压缩与数据内容压缩。部分分组的压缩后图形如图5所示。

从上面几个压缩后数据的可视化结果可以发现,随着分组个数的增加,图形的聚集程度显著增大。这是因为分组越多,新生成的坐标系的个数越多,从而对每个要素的新的坐标值而言,其相似程度越大,也就越来越聚集。

表1为原始数据与按5组、50组、300组、597组一次聚类压缩后(三次实验求平均值)的结果中部分对应坐标串的转换前后对照。

可以看出,除了原始数据中的坐标外,按不同分组进行压缩时坐标的数值都已经显著减少。并且随着分组的增加,坐标的范围越来越小,从而导致图形越来越密集。

实验中分组个数与两次不同压缩后数据的大小的对比如表2所示。

3.2 面状数据压缩与分发效率

为进一步验证本文方法对不同数据文件的压缩效果,本文又采取大小为30.5M的某城市中心广场的面状数据,该数据包括460个面状要素(呈圆形)。实验中对聚簇个数从2到460进行了统一的自动压缩文件生成。原始数据的GML模式文档和可视化图形分别如图6和图7所示。

部分分组的压缩后数据可视化图形如图8,可以看出,如同线状数据,随着分组个数的增加,图形的密集程度增加。

表3为原始数据Platz_polygon.gml与按5组、50组、200组、457组一次聚类压缩后(三次实验取平均值)的结果中部分数据点坐标的转换前后对照。

实验中同样先对原始数据只进行数据内容的压缩,观察不同分组个数对压缩率的影响。然后同时进行语义结构和数据内容的压缩。压缩后的文件大小和计算所得压缩率如表4所示。

3.3 压缩效率分析

通过对比线状数据与面状数据的压缩结果可以发现,压缩率基本上随着分组个数的增加而减少,即表示压缩效果变好。在分组个数较少时,压缩率随分组个数降低的速度较快,随着分组个数的增加,压缩率的变化率也在减少。具体分析如图9所示,其中η1为线状数据压缩率随分组个数变化的曲线,η2为面状数据压缩率随分组个数变化的曲线。

4 结语

互联网的发展带来数据与通信网络容量遭遇到瓶颈,云计算是解决此问题的有效途径,基于云计算机实现空间数据分发与管理是当前研究的热点与难点。

本文主要研究在云计算平台下的空间数据的管理与压缩分发工作。首先设计了一种适合海量空间数据存储与发布的数据库体系架构并分析了其方案,然后设计了一种适于云计算分布存储的空间数据压缩算法。实验证明,本文设计的方案取得了较好的效率,适合云计算平台使用,并满足空间数据的应用需求。

摘要：随着当前互联网应用的高度集成,大规模数据一体化管理、数据安全性、分布式环境下的多用户共享应用、数据动态更新等方面的需求日益强烈,而互联网的发展带来数据与通信网络容量遭遇到瓶颈。云计算是解决此问题的有效途径,通过云计算下的空间数据分发与管理可解决海量空间数据应用的一系列问题。主要研究在云计算平台下的空间数据的管理与压缩分发工作,设计了相关算法。实验证明,所设计的方案取得了较好的效率,适合云计算平台使用,并满足空间数据的应用需求。

科学数据打包与分发技术篇4

非常著名的安装程序制作工具, 它提供脚本编辑方式及众多应有尽有的安装选项, 堪比专业级的安装程序制作软件。Wise支持创建一个独立的可执行文件以便于在线发布程序, 也能够支持多磁盘, 并且支持网上 (HTTP和FTP方式) 分发, 支持调用外部DLL、EXE等, 灵活的脚本控制, 根据多年数据打包的经验, 较之其他类型的软件, 它具有体积小, 安装使用方便, 打包分发安全可靠。以下简称Wise902。

2 数据和软件准备

2.1 数据准备

生态数据 (ecological data) 以反映生态信息的属性为测量指标而测得的数据。生态数据是以植被数量分析为基础的各类信息, 一般包括两大类型:

一类是反映群落组成、结构关系的植物区系组成数据, 这些数据是反映群落成员特征的一些定量和定性的属性数据, 即数量数据和二元数据。

另一类是群落的环境组成数据, 包括各种环境因子的测量指标。

所以, 生态数据涉及不少类型的数据, 在本例中有遥感数据、空间地理数据、视频文件、录音文件, 调查表格和其他研究资料等。逐一将它们准备好放置在相应的计算机磁盘中备用。

2.2 工具软件

安装后的Wise902提供了Installation Expert和Script Editor两种控制打包程序的方式。推荐读者使用Installation Expert模式, 它是一种向导的模式, 以这种模式为主, 在向导模式的引领下能够更快更好完成一个复杂的数据打包任务。Script Editor模式是基于脚本, 脚本语法有点像Basic语言。可以在某些特殊的数据使用时再应用它 (例子中分发安装后执行外部程序部分有介绍) , 它左边有一个列表专门提供可以供调用的脚本语句, 需要时选择调用。

3 数据打包

数据打包即数据和应用装配过程, 这个过程在Wise902中变得相当容易。下面就来实现这类数据的打包实践。

3.1 建立工程文件和设置

启动Wise902后, 新建一个工程文件, 命名为:“科学数据.WSE.”, 并在“安装标题中”填入:“生态环境数据的打包与分发”, “默认目录”一栏填入:“生态数据”, 将“默认目录放置在‘Programming Files’的目录下”勾选。如图1所示。

3.2 添加组件和命名

Wise902提供数据打包的分组打包功能, 利用该组件功能在使用时可以将数据分不同类型进行分装, 方便将不同类型的数据源进行打包和管理。在本例中, 所有生态数据按照实际所需, 分为基础数据、专题数据、气象数据、地理空间、遥感、群落样地、群落样方、社会经济、生态计算 (外部计算程序) 以及相关的环境录像和音频数据等, 共11种数据类型。它们将通过Wise Installation的组件装配功能创建对应的数据类型名称。具体步骤如下:在方案定义部分点击“组件”按钮, 之后, 在弹出的组件对话框中再点击“添加”按钮, 在弹出的组件详情对话框中, 填入相应组件名称, 并勾选“默认安装组件 (I) ”选项即可, 如图2所示。重复此步骤, 逐一将上述11个数据类型组件添加完毕, 形成了数据包所有数据栏目, 以便稍后所有生态数据分装进来。

3.3 数据源文件加入

Wise902提供将现有磁盘中的数据文件加入到当前工程应用中来。步骤如下:在安装程序详细资料页面中选择点击“文件”, 弹出文件选择, 并加入对话框, 通过它可以按照所创建的数据分装组件一一地将已经准备好数据添加到包中来, 本例中将1号样地所涉及到11类数据文件全部按要求加到了工程里面, 如图3所示。

(需要注意的在添加目录区操作时, 新建目录和添加文件最好添加一个目录就将所要文件添加进来, 否则Wise902系统会出错, 其他版本有无问题暂不知道)

3.4 添加快捷方式

由于本例中有计算程序, 可以使用专家模式的快捷方式页来向目标电脑上的桌面和开始菜单上添加快捷方式。要在安装过程中添加快捷方式:

(1) 点击“快捷方式”, 弹出快捷方式, 填入相应的内容, 然后单击“添加”按钮, 如图4所示。

(2) 从安装对话框中选择文件, 在左边选择包含你想要与之关联的文件类型的程序文件的目录, 在右边选择要关联的快捷方式的文件。

(3) 点击“确定”, 然后在快捷方式的详细资料对话框中编辑快捷方式的详细信息。

3.5 添加注册表键和键值

作为一个专业安装包有时候需要想Windows注册表添加相应的包特征信息, 可以使用专家模式的注册表页来制定要在目标计算机上添加或编辑的注册表项。上面的两个列表框显示了本地计算机上的注册表键和键值。下面的两个列表框显示将要在目标计算机上添加的键和键值, 如图5所示。

“添加键”按钮可以复制一个完整的注册表键, “添加值”按钮可以复制键值, “新建”按钮可以通过导入一个注册表文件来创建一个新的注册表项。

要添加一个注册表项:

(1) 在下面左侧的列表框中单击选择想要添加的键值。

(2) 单击“新建”按钮然后从下拉列表中选择相应的键。

(3) 在这册表项设置对话框中配置注册表值。按F1启动帮助。

3.6 添加关联文件

生态数据中有的要用某一类程序才能打开, 在专家模式下使用关联文件页可以配置关联一个文件的应用程序用来打开这个类型的文件。要为一个文件类型配置一个关联程序:

(1) 在关联文件页, 单击“添加”按钮, 弹出文件选择对话框, 如图6所示。

(2) 从安装对话话框中选择文件, 在左侧选择包含要关联的文件类型的可执行文件的目录, 右侧为要关联的文件。

(3) 在对话框的底部, 数据3个字符的扩展名来标识关联的文件类型。

(4) 单击“确定”。

要编辑一个文件关联的设置, 双击文件关联页中的项目即可。

3.7 指定系统配置需求

通过专家模式中的“系统配置需求”页, 可以指定安装程序运行的最低软硬件需求, 同时可以设置如果目标电脑的不满足最低需求时出现的警告信息。

这里有一个例子用来制定在Windows XP下安装程序最低的操作系统需求。

(1) 在目标系统需求页, 双击“Windows NT版本”, 弹出配置对话框, 如图7所示。

(2) 在最低系统需求对话框中找到Windows版本下拉列表, 选择Windows XP。

(3) 从“类型”下拉列表中选择“建议”或者“必需”。如果选择的是“必需”, 而目标系统不满足系统, 则安装程序将终止安装。

(4) 为消息对话框输入标题和内容, 如果目标电脑低于Windows XP或更高的操作系统, 那么会弹出这个消息对话框。

(5) 单击“确定”。

3.8 选择安装对话框

通过点击在专家模式用户界面页面的“对话框”项, 选择合适的安装时出现的对话框界面, 可以指定在安装期间出现的对话框样式。要查看选择的对话框样式, 可以勾选某个对话框然后双击样式名字, 并即将打开自定义对话框编辑器。

下面是如何添加一个“自述”对话框的例子:

(1) 在对话框页, 标记“自述文件”选择框并双击。如图8所示。

(2) 在路径名称区, 输入要使用的自述文本文件的路径名称。

(3) 需要修改对话框样式可点击“编辑”按钮进行。

3.9 BDE配置

本实例中生态计算程序设计部分数据库文件的使用, 所以需要针对它们完成数据库引擎BDE的设置, 通过点击在专家模式中“BDE Runtime”页, 弹出数据库引擎配置对话框, 如图9所示。要实现BDE配置:

(1) 在BDE安装类型 (P) 处, 选择部分BDE 32安装选项。

(2) 在BDE 32子集页处, 勾选SQL, Paradox和DBASE选项。

(3) 如需要添加本机中的BDE别名, 点击“添加”按钮。

3.1 0 安装密码

从数据安全的角度, 有必要给所形成的安装包设置权限。Wise 902提供了这一功能, 在安装选项页面, 选择并点击密码弹出密码设计对话框, 如图10所示。要实现安装密码的设置:

(1) 选择在“所有安装程序使用单一密码”, 并设置所需要的密码内容。

(2) 如果需要类似专业软件安装系列号, 选择“使用个别的序列号作为密码”设置。

3.1 1 分发安装后执行外部程序

有时候当数据包安装在目标计算机后, 需要执行某个外部应用程序, 本实例中就是设计当安装包安装解压后自动执行包中的生态计算程序 (calc.exe) 。

(1) 在用户界面页面的安装对话框中, 勾选“安装选项”对话框, 使这一界面在安装过程中出现以便选择“安装完成后开始执行程序”, 一旦选择了此项, 系统将自动执行设置好的外部可执行文件, 如图11所示。

(2) 通过双击在脚本编辑器页面的“执行程序”项, 在弹出的执行程序设置的对话框界中进行程序文件浏览和选定, 可以选择任何打入包中程序文件, 同时脚本部分内容也将自行加入或更新, 即增加了新的脚本内容:

Rem在这里设定退出安装要运行的程序:

如图12所示。

至此, 数据的打包和设置已经结束, 需要将该数据包工程文件 (科学数据打包与分发.wse) 保存。

4 数据分发

数据分发与数据打包过程基本相反, 是将所装配的数据和应用程序分装到不同的介质上, 并通过安装程序将包中所有数据和程序按打包时的要求部署到目标计算机中。

4.1 分发介质

介质指存放数据包的物理设备, 在Wise 902中介质可以是多种类型的, 分发前可以进行选择。要实现安装包分发介质的选择, 通过点击在专家模式编译选项页面的“介质”项实现, 如图13所示。

(1) 单一文件安装程序:创建一个独立的磁盘文件, 该文件与工程文件同名。

(2) 基于介质的安装程序:该选项将数据包的内容分割为适合的介质类型文件, 有多个文件组成 (*.W0x, x>2) , 保证数据能够存放到相应介质中。

4.2 编译安装程序

一旦完成了创建或修改一个安装程序, 可以通过位于主窗口右下方的编译, 测试和运行按钮来进行调试。

(1) 点击“编译”, 编译所创建的安装程序, 在工程文件位置生成可执行安装包程序, 如本例的科学数据打包与分发.exe。

(2) 点击“测试”, 模拟安装过程, 但是不对系统做任何修改。

(3) 点击“运行”, 编译和实际运行所生成的安装程序。

图14是该安装包程序执行过程的两个数据分发的交互界面, 通过操作该程序文件分装过程, 可以看出Wise 902无论是数据装配, 还是分发与安装在功能和操作上都是非常专业和方便的。

5 结语

利用Wise 902和生态数据进行打包和分发全部过程已介绍完成, 读者可以体会到该工具的专业性和简便性。尤其是在应用程序数据库数据库文件, 利用它进行打包和分发, 安装部署均显得心应手, 不像其他的安装制作工具使用过程过于繁杂。经常做数据打包和分发的人会发现, 实际上有不少都是用Wise Installation System完成的, 而且数据的安全性也是有保证的。

摘要：生态的调查研究和实验过程常常会涉及到诸多数据, 这些数据往往类型多样, 数据量极大, 数据获取相当不易, 对数据管理和使用提出了更高的要求。利用Wise Install System9.02作为这类数据管理和分发的工具, 面对纷扰繁杂的各种各样数据, 能够对科学数据进行组织和管理, 打包与分发, 实现更为有效管理和安全使用。

基于BT协议的数据分发机制篇5

1 BT介绍

基于BT协议的文件分发系统由以下几个实体构成:1, web服务器, 用于存放和分发种子文件。2, 种子文件, 记载一系列相关信息。3, Tracker服务器, 保存整个BT网络信息的中心服务器。4, 原始文件提供者, 也叫种子, 保存整个文件的完整备份。5, 诸多BT客户端下载者。种子文件包含这个BT协议网络构成的一系列信息.信息都是经过B编。格式是.BT客户端软件通过解析种子文件获得这些信息, 然后通过种子文件中的Tracker服务器地址以HTTP协议去连接Tracker服务器, 过程是:客户端向Tracker发送一个HTTP的GET请求, 该请求包括客户端的Ip地址, 连接端口, 要下载的文件名, 用户当Tracker服务器接收到这个GET请求之后, 就会返回一串信息给客户端, 包括网络中已下载完成的peer数, 正在下载的peer数, 每个peer的IP地址和端口号等。在Tracker返回这些信息给客户端之后, 客户端就可以按照BT协议与各个peer交换数据了。

当客户端与一个Peer建立TCP连接之后, 他们之间的通信过程如下:首先向peer发送握手消息, 其中pstrlen的值固定为19, pstr的值为“Bit Torrent”, info_hash的值和与Tracker通信时GET请求中的info_hash相同, peer_id则是握手信息发起方的peer_id标识。当客户端发送这个握手消息给peer之后, 他们之间的链接状态为半握手:halfshaked, peer返回相同格式的握手信息回来之后, 两个peer之间的状态称为完全握手:handshaked。于是就可以相互通讯了。从此我们可以看出BT的工作细节, 客户端维护一张所有与自己连接的peer的链表。

其中四个状态参数am_choking, am_interested, peer_choking, peer_interested决定是否可以从peer出获得数据以及peer是否可以从自己这儿获得数据, 当am_choking为1时, 自己将peer阻塞, 不允许peer从自己这儿获得数据, peer_choking为1时, peer将自己阻塞, 不允许自己从peer那儿获得数据, am_interested为1时, 表示自己有peer没有的数据, peer对自己感兴趣, 希望能从自己这儿得到数据, peer_interested为1, 表示peer有自己没有的数据, 自己希望能从peer那儿得到数据, 这样当自己和peer在执行阻塞算法的时候, 可以将阻塞位清0, 然后能够进行数据传输。

2 问题描述

从上面的描述知道, 一个peer要想下载数据, 也就是要上传数据, 当peer拥有其他peer没有的数据, 并将其上传给其他peer, 这样才能从其他peer那儿下载到数据, 这个机制使得每个peer都成为服务器角色, 当下载人数越多时, 下载速度就越快。但这个机制存在的一点缺陷在于, 当一个新的, 没有任何待下载文件数据的全新peer加入这个BT网络的时候, 因为他没有任何数据, 当然也不会有其他peer感兴趣的数据, 也难以从其他peer处下载数据。

3 解决方案

在所有的peer之中, 有两种peer很特殊, 一是新加入的peer, 自身不拥有任何数据, 另一种是种子peer, 即已经完成了待下载文件的全部下载, 为了解决上述的问题, 我们可以将BT的协议作局部的调整, 充分利用这些种子文件, 使新的peer快速融入到整个BT网络。对于新加入的peer, 在与tracker联系的时候, tracker依据其传输过来的数据中依据downloaded=0表示一个数据字节都没有下, 通过这个判断出这是个全新的peer, 于是tracker返回BT网络之中所有的种子信息给peer:

Peer收到这个信息之后, 依据这个信息建立种子链表, 通过计算与所有种子peer之间的路由跳数, 选择经过跳数最少的4个种子peer作为与自己靠得最近的4个种子peer, 然后与四个种子peer连接, 从这4个种子处获得数据, 因为种子peer不需要下载数据, 则可以一直向外上传数据, 在一定的时间之内, 新加的peer可以持续从种子peer处下载数据, 然后当peer积累了一定量的数据之后, 便不再从种子处下载数据, 当再次与tracker交换信息的时候, tracker不再返回种子链表, 而是如普通BT协议那样返回所有peer的信息, 此时peer就可以通过交换Bit Map位图, 依据am_choking, am_inerested, peer_choking, peer_interested执行阻塞算法, 以后的过程就如同普通BT协议那样继续进行下去。流程如下:

通过这样的方案, 避免了新加入的peer因没有数据而缺乏竞争力而导致的无法快速融入网络分享数据的情况。

4 存在的问题

数据分发系统篇6

为了了解市场营销人员目前关于标签管理系统的观点, Forrester, 一家提供独立和客观的研究咨询服务的机构, 对142位熟悉标签管理并负责数字营销预算、策略和供应商选择的数字营销决策者进行了在线调查。研究表明, 大部分受访者已经不再把标签管理系统 (TMS) 单纯地看作是管理标签的工具, 而是一种对线上数据进行提炼和分发的新方式, 这些数据是在客户与大量数字营销供应商的互动节点中捕获的。为了通过各种渠道实现对客户更好的可视化, 营销人员需要与IT部门密切联系。目前, 营销人员已成为了客户数据整合的主要的利益相关者。

主要研究结果

在Forrester的研究报告中主要有4个观点:

(1) 标签管理远远不只是客户端标签的管理。营销人员发现了其另一个重要价值——是将游客数据进行收集、提炼, 并分发到数字营销供应商的有效接口和重要技术。因此这也代表了一种线上数据分发平台的诞生。

(2) 约96%的企业都面临着线上数据整合的挑战, 他们相信解决好这些挑战将会更好地帮助他们了解客户行为, 改善客户体验, 最终提高获取和保留客户的能力。因此, 营销人员将引导他们的IT团队应对客户数据整合的挑战。

(3) 营销人员开始利用标签管理系统帮助他们进行数据整合, 通过多种渠道更清晰地了解客户行为。标签管理系统已被视为是一种新型的源于各在线客户接触点的数据资源, 帮助营销人员克服了以往数据源抑制数据整合的问题。

(4) 营销人员将增加对标签管理的投资。2013年, 平均有9.2%的市场预算投入到标签管理中, 年增长率达35%, 原因在于TMS系统的线上数据分配的高投资回报率。

标签管理系统

自本世纪之初, 营销人员已致力于收集分析网站的线上数据。Java Script标签的标准化应用对数据收集起着关键的推动作用。然而, 随着标签技术的涌现, 标签成为了标签技术成功背后的牺牲品。大量的关于网页分析, 广告推销, 在线测试, 目标市场及许多其他类型的标签泛滥于整个网站。管理如此繁多的标签成为营销人员“永恒的噩梦”, 要求营销人员必须持续不断地调整计划和采用更多的技术。而且人工标签管理通常成本高, 容易出错, 效率低下。标签管理系统的出现解决了以上不足, 总体而言, 它成功地通过多种功能实现标签的增添、编辑和删除等管理。使得如今大多数的营销人员能够轻松实现更高质量的数据分析, 改善的市场敏捷度和更优的网页性能 (如图1) 。调查表明, 营销人员主要从易用性、规模和性能等方面来判断标签管理的价值 (如图2) 。简而言之, 标签管理系统解决了在数字营销标签管理过程中许多棘手的问题。

从标签管理系统演化到线上数据分发

基于TMS的标签管理的有效性已获得了业界的高度认可。但标签管理已演化到超越了人们对其的这一基本认知。几乎三分之二的受访者把TMS视为在客户与数字营销商之间数据交换的更有效的途径 (如图3) 。很巧秒的是, TMS的核心标签管理功能恰恰能够实现对数字客户端 (如Web浏览器) 的数据进行收集, 并进一步进行提炼再分发到相关的数字营销系统中去。营销人员希望把这一功能优势应用到他们的数据整合项目中。据调查, 那些把标签管理视为分发线上数据的有效方法的受访者中有72%都有各自的数据整合项目 (如图4) 。更重要的是, 不管营销人员对TMS的价值理解有多深 (事实上, 调查表明, 如图5所示, 94%的受访者认为TMS的数据整合功能将是其下一步的演进方向) , 其在线上数据整合中的重要性都会不断增加。展望未来, 标签管理将会成为线上数据整合策略的核心部分, 为数据的收集和分类提供管理服务, 并成为线上可执行数据的数据来源。

营销人员主导客户数据与数字技术

约96%的受访企业都面临着整合在线数据的难题。缺乏IT资源是最主要的原因 (如图7) 。这是一个不可避免的困境。在这个客户至上的时代, 企业最注重的是客户体验, 因而营销人员不仅要获得客户还需要留住客户。对客户行为有更好的了解, 并通过多种渠道改善用户体验对这种“客户至上”的策略至关紧要, 也关系到他们从客户数据中所获得的利益。因此, 毫无疑问营销人员已成为了客户数据整合的主要利益相关者, 并起着主导作用。首先, 他们掌握了标签管理系统。目前, TMS系统具有友善的用户界面和易操作的业务流程, 使得营销人员能够轻松地进行日常的标签管理。据调查, 如今有56%的企业中, 其TMS的管理是由营销团队负责的 (如图8) 。这不仅大大减轻了本已匮乏的IT资源的负担, 而且能更快速地直接响应他们的线上营销需求。第二, 他们也掌握了客户数据的主动性。TMS作为线上数据分发平台, 且其数据整合能力不断增强, 使得营销人员在掌握客户数据主动性方面相比IT人员占绝对优势。

数字渠道整合推动TMS投资

2013年数字营销的重点是提供新的社交和移动渠道, 整合多渠道在线营销手段 (如图9) 。这些渠道将整合成为一个强大的渠道网络, 这也是为什么TMS的线上数据分发和整合能力如此吸引眼球的原因。因此, 市场对TMS的投资在不断增加并已逐渐追赶在线营销手段整合方面的投资。今年, 预计标签管理所占营销预算的份额将从6.8%增加到9.2%, 增长率达35%。

主要建议

在标签管理线上数据分发功能不断演进的新时代, 营销队伍的建设必须迎合新的要求。这里为营销人员提出了以下几点建议:

要认清TMS系统的多种功能。线上数据分发平台的功能不仅仅是分发线上数据。把线上数据分发到合适的营销系统只是最后 (下转第12页) 一个环节。在此之前, 线上数据需要被系统发掘, 再由目标系统进行定义, 然后进行分发。因此, 线上数据分发平台具有三大流程, 即发掘, 定义和分发。

让标签管理成为数据整合策略的其中一个关键部分。不要被“标签管理”这个字面意思所蒙骗, 要认识到其数字分发功能对客户的数据整合策略起着关键作用。

要记住传统标签管理的作用。确实, 标签管理系统不仅仅是进行标签管理, 但其对于跨网页和网域的标签部署的管理作用是非常明确的。标签管理系统对营销标签和线上营销活动进行管理, 从而让营销人员快速响应业务需求和客户需求。单单这些作用已足以为TMS的投资提供充分的理由。

数据分发系统篇7

最近,一种叫做流行内容分发的应用受到了研究者的广泛关注[1]。在该应用中,行驶中的车辆通过车载单元与路边单元( the Roadside Units ,RSUs)的通信来下载流行多媒体内容[2]。由于文件大、车速快,OBUs在通过RSUs覆盖区域时不能完成整个文件的下载。

受互联网点对点通信协议[3,4]的启发,一些研究者利用汽车对汽车( Vehicle-to-Vehicle ,V2V) 通信组成点对点网络来完成OBU间的内容分发。文献[5]介绍了一种基于网络编码的移动P2P文件共享系统,文献[6]首先将合作博弈应用到了V2V通信中。在文献[7]中,作者提出了一种名为SPAWN的P2P文件下载协议,然而SPAWN的节点和内容选择机制并不适用于文件较大的场景。

本文将已经在通信场景中得到应用[8]的合作图博弈引入到车载自组织网络中,解决了车载网中的流行内容分发问题。在博弈中,OBUs通过分布式的动态博弈形成一个成对稳定的网络,并按照网络进行数据传输。与传统的非合作方法相比,该方案同时考虑了网络中的内容需求和信道容量,提升了网络的性能。

1 系统模型

在考虑的场景中,共有M个OBU( SU用户) ,它们通过K个PU信道完成流行内容的分发。将这个问题规划为一个联合图博弈,在该博弈中,OBUs试图建立一个有方向的成对稳定图。一旦完成网络的构建,OBUs将会采取合作的方法按照图进行数据分发。假设OBU之间的单跳通信限制在直视范围内( 称作“邻居节点”) 。整个流行内容被分为N个大小相等的片段,每个OBU都需要全部片段。用M、N、Mi和K分别表示OBUs组成的集合、数据片段集合、OBUi的“邻居节点”的集合以及PU信道的集合。由于OBUs处于高速移动状态,经过RSU覆盖区域的时间较短,因而只能接收到片段集合N的一部分,剩余的数据片段需要通过V2V通信获得。在V2V通信中,一个OBU每次只能接收一个OBU的数据,但是可以同时向多个OBU传输数据。用Ni表示OBUi已经拥有数据片段集合,假设Ni中的初始元素均匀分布于集合N中。

在本系统中,假设每个PU信道上数据包的到达服从泊松分布,每个时隙中数据包的到达率为λ。对于K中的某一个信道,没有主用户占用信道的概率为P0= e- λ,所有的OBU都使用全向天线。由于车辆行驰在高速公路上,因而建模时可以不考虑信道的小尺度衰落。在第k个PU信道上,OBUi和OBU j之间的V2V信道容量为:

式中,Wk为第k个信道的带宽,n为路径损耗指数,di,j为OBU i和OBU j之间的距离,βi为发射端的信噪比。为了不失一般性,假设

对于车辆的移动模型,参考文献[9]中提出的高速公路车辆移动模型( FMM) 。一个简化的双车道单向高速公路模型如图1所示。车辆在初始时刻随机布在2个车道上。为了更真实地反应车辆的移动,在该模型中,允许车辆进行变道超车。OBU的初始速度为vi( 0) ,且vi( 0) 随机分布在[vmin,vmax]之间。其中,vmin是OBU的最低速度,vmax是OBU的最大速度。同一个车道上2个相邻车辆之间的安全距离为dmin。对于任意一个OBUi,只有在与同车道前向相邻车辆之间的距离小于dmin,且与相邻车道上距离最近的前后两辆车的距离大于dmin时,才允许进行变道。如果同一个车道上2个车辆之间的距离大于最大距离dmax,则后车允许加速到最大速度。针对OBU不需要改变车速的情况,OBU的速度满足:

在传统的非合作方法中,集合M中的OBU在进行V2V通信时,不需要进行合作。OBUs节点将需求通过广播告知其“邻居节点”,并随机响应其他“邻居节点”的数据请求。每一个OBU节点,在响应其他节点的数据请求之前,需要独立地感知K个PU信道,然后通过载波监听多路访问 / 冲突检测( CSMA/CA) 协议接入空闲信道。

2 联盟图博弈

在传统的非合作数据传输方法中,V2V链路是随机建立的,这可能会使得OBU之间的通信效率较低,甚至有些OBUs可能没有与“邻居节点”建立连接。这就导致整个网络的数据吞吐量较低。下面利用合作图博弈来对车载自组织网络中的流行内容分发问题进行建模。通过分布式的动态博弈,建立一个有向的图G( V,E) 。其中,V表示OBUs集,E表示V2V链路集。对任意的i,j∈V,j∈E表示节点i和j之间存在一条有向链路。用dini和douti分别表示图G中OBU节点i的入度和出度,其中,0≤dini≤1。

2. 1 效用函数

对于某一个PU信道k,只有在该信道空闲,且其他邻居节点也没有在该信道上传输数据时,2个OBU节点之间才能够成功传输数据。用Pi,j表示OBUi和OBU j之间数据包成功传输的概率。

假设信道k∈K被主用户占用,用H1表示,反之用H0表示。同理,用H'1表示OBU i的检测结果表示信道k被主用户占用这一假设,反之用H'0表示。漏检概率和虚警概率分别用Pm和Pf表示,则每个OBU节点正确的做出信道空闲判别的概率为[10]:

总的来说,一共有KP0个PU信道处于空闲状态,可以被OBUs利用。每一个OBU都可以接入这些空闲信道中的任何一个信道。OBUj的邻居节点子集{ Mj i} 中的OBUs没有与OBUi占用同一个信道的概率为:

假设OBUs发送和接收数据片段都能给整个网络带来相应的收益。OBUi的效用函数用πi( G) 表示。考虑到周边节点的需求,OBUi在广播数据之前需要通过计算确定待广播的数据片段的集合与顺序,以获得更高的效用。采用一种贪心算法来选择每个OBU节点广播的数据片段。集合Ni ,j= ( N Nj) M∩Ni表示OBUi可以提供给OBU j的数据片段的集合。用Ωi= { j | ij∈E} 表示与OBUi相连接的OBU节点集合。节点OBU i可以提供给Ωi的数据片段集合可以由给出。假设Ni,b中的数据片段按权重因子从大到小排序。每个数据片段的权重因子即为集合Ωi中缺少该数据片段的OBU节点的数目。OBU节点在每个时隙按照顺序一次广播集合Ni,b中的数据片段。假设每个时隙的数据传输时间为T,则OBU j在一个时隙内从OBU i接收到的数据片段集为:

用γout和γin分别表示发送和接收数据的价格因子,则相应的发送和接收效益分别为:

考虑到在进行数据传输时占用了相应的信道,增加了信道中数据冲突的概率,提高了信道的负担,这需要通过费用函数中体现出来。对于任何一条从OBU i发出的链路,潜在的冲突限制在集合μi Ωi内。对于任意一条从OBUj指向OBUi的链路,潜在的干扰限制在集合μi Ωi内。用γcost> 0作为价格因子,则费用函数为:

将式( 6) 、式( 7) 和式( 8) 相结合可以得到节点OBUi( i∈Μ) 的效用函数:

2. 2 动态网络的形成

下面给出了一个包含3个阶段的分布式短视动态博弈网络形成算法。短视动态方法是指在每一轮博弈过程中,每个节点在选择策略时只考虑本轮的效益,而不考虑长远效益,这与考虑长远效益的策略刚好相反[11]。通过分布式的本地策略选择,节点在博弈过程中可以选出一个最优策略,逐步迭代直至形成一个稳定的有向图。

假设当前的数据传输网络为G( V,E) ,则任意节点OBUi可能的行为包括:

1当ijE时,建立一条新的链路ij;

2当diin= 0时,接收OBU j建立连接的请求;

3当ij∈E时,断开当前的连接ij;

4当ji∈E时,断开当前的连接ji;

5以上4种情况的组合。

在合作图博弈过程中,每轮博弈都会随机选出一个OBU选择出其想要建立连接的其他OBU节点。通常,在每一轮博弈过程中,OBUi需要选出节点fi∈Μ去接受连接,并选出一个节点集合Ti∈Μ建立指向他们的连接。用( fi,Ti) 表示节点OBUi的策略,则OBUi的策略空间可以表示为: Si= { ( fi,Ti) | fi∈Μ,Ti∈Μ} 。如果j∈Ti且i∈fj,则节点OBUi和OBUj之间将会建立一条链路,所有的链路都是以这种形式建立的。

假设,当节点OBUi变化到新的策略,且周边节点进行了相应的处理时,网络结构相应的会由G( V,E) 变为了G'si( V,E') 。对于任何一个处于状态( fi,Ti) 的OBUi∈Μ,满足以下条件的策略si= ( f'i,T'i)∈Si将会被称作一个可行性策略:

其中,G为当前的网络结构,G'si为受到策略si影响之后的网络结构。

随机选择一个节点OBUi∈Μ参加动态博弈,集合Pi∈Si表示节点OBUi的可行策略集,动态博弈网络形成算法的具体步骤如下:

步骤1: 从Μi中的“邻居节点”获取必要的信息,并计算出可行性策略集。

步骤2: 随机选择并执行一个可行性策略

1如果断开连接ik,k∈Ti可以提高自身效用,节点OBUi单边地选择断开连接。

2节点OBUi向OBUj∈T'i,jTi请求建立连接ij。如果建立新的连接ij可以提高OBUj的效用,则OBUj接受OBUi的请求。

步骤3: 更新网络结构G( V,E) 和OBUs节点的策略集。

进行多轮博弈直到最后形成一个双边稳定网络G*( V,E*) 。

由于每2个节点之间通信链路的建立需要经过双方的同意( 内在的双边性) ,因而在考虑网络的稳定性时本文考虑双边稳定性[12]。通常情况下,在双边稳定状态下,整个网络中的任何一个节点都不能通过改变自己的策略找到一个可行性策略,并且任何2个节点也不能通过改变策略而同时提升它们的效用。在本文的合作图博弈中,由于博弈规则的限制,没有OBU节点可以通过单方面地改变,或者双方改变而提升自身的效用,因为最终的网络结构G*( V,E*) 是双边稳定的,仿真结果也验证了这一结论。

3 仿真结果

在不同条件下,对本文所提出的合作图博弈方法与传统的非合作方法在高速公路车载自组织网络中的流行内容分发性能进行对比与评估。仿真参数的设置如下:

网络中所有OBU节点随着时间的推移获得总的数据片段的数量如图2所示。仿真条件为: M =6,N = 80,在V2V通信开始时,OBUs已经拥有的数据包的比例为ρ0= 0. 6。图2中纵轴是除以NM归一化之后的结果,可以看出,非合作的传统方法和本文提出的合作图博弈方法获得的数据片段总数量都随着时间的推移提高,但是本文提出的方法的性能更好。在非合作的数据分发方法中,OBUs节点向所有的邻居节点广播其数据需求,且随机地相应其他邻居节点的数据需求,这就对网络造成了负担,容易造成网络的拥塞。对于本文提出的合作图博弈方法,OBU节点根据数据广播和接收双方的需求选择性地向邻居节点传输数据,每一个时隙形成的网络结构在传输数据时都比较有效,因而提升了整个网络的性能。

2种方法下随着时间的推移,网络中广播节点的数量的变化如图3所示。仿真条件为: M = 6,N =80。由图3可以看出,本文提出的合作图博弈方法下的广播节点的数量衰减速度要快于非合作方法,且最终合作博弈方法下的广播节点数量处于一个明显较低的水平。这主要是因为在非合作方法中,由于信道中数据的碰撞,数据片段传输成功率较低,造成潜在的有数据片段需求的节点的数量变化较慢。而在合作图博弈方法中,每个节点传输的数据片段都是网络中需求较高的,且只有效用较高的节点才会传输数据,降低了信道碰撞的概率,使得数据传输速率较高,可以快速降低网络中的需求节点的数量,从而使得广播节点的数量也降低。

4 结束语

数据分发系统篇8

为此, 本文提出一种基于停泊车辆的数据分发方案, 利用城区路边停泊车辆进行数据分发。本文首先将车辆编入不同簇, 并提出一种高效路由方案, 将各数据报文分发至合适路边停泊车辆, 然后采用发布/订阅方案执行数据分发。此外, 还通过理论分析和仿真比较, 对方案性能进行评估。评估结果表明本文的数据发布方案实现了较低网络负载、合理交付延迟及较高交付率。

1文献综述

由于VANET的特有性质, 致使数据分发极具挑战性。许多研究者一直致力于解决VANET数据分发问题。文献[1]提出一种不依赖任何基础设施的机会主义分发 (OD) 方案, 利用数据中心接收并存储过往车辆数据并进行周期性广播。但该方案由于MAC层冲突, 高车辆密度OD方案性能很差, 极易导致严重交通拥塞和显著降低数据交付率。为缓轻交通拥塞, 文献[2]提出一种面向发布/订阅系统且基于车辆移动分布感知的事件分发策略 (MDA) , 以较低网络负载和传输延迟获得较高数据传输成功率。尽管上述方案一定程度上降低了网络开销, 但由于VANET的间歇连通性, 数据分发还是很难保持在目标区域内。文献[3]提出一种实现VANET持久性数据可用性的基本方法, 其服务器采用地域性群播路由协议周期性将信息交付至目标区域, 其缺点是服务器频繁广播将耗费大量带宽。文献[3] 同时也给出另一种变换方法—选举法, 利用当选移动节点存储地域性群播目标区域信息。但由于车辆节点的高移动性, 需要频繁信息切换。为减少注入服务器数据量, 文献[4]提出交叉路口缓冲思想, 利用中继站和广播站缓冲交叉路口的数据备份, 使服务器不必频繁广播信息。文献[5]研究了3个典型车辆移动模型和真实车辆行驶轨迹对车载自组织网络连通特性的影响, 评价了车辆移动模型的合理性。文献[6]提出利用固定路边单元提高数据分发性能。文献[7]讨论了路边单元 (RSU) 安放位置。虽然部署RSU可显著提高数据分发性能, 但广泛部署需巨大投入。

2系统模型

2.1相关假设

首先假设车辆已配有各类传感器、GPS和电子地图。其次假设车辆驾驶者愿意分享设备［８，９］。最后假设各数据报文都具有两个属性:1目标区域;2生存时间。

2.2实际应用场景

城市街道广泛分布大量路边停泊车辆, 如图1所示。突发交通事故极易引发局部交通拥塞, 为降低事故对交通状况的影响, 配有事故检测传感器的车辆检测到此次事故后, 可将紧急通知信息转发至驶向事故区域车辆, 以便车辆驾驶者及时修正行驶路线, 从而有效缓解道路拥塞、节约能耗和行车时间、减低大气污染。因此城市VANET高效数据分发方案具有十分重大意义。

本文的停车方案主要涉及四部分内容。

(1) 数据源:配备无线接口的计算机或无线接入点。

(2) 数据转发器:数据转发所需车辆。

(3) 路边停车簇:沿同一路段停放且属于相同稀疏连接网络的车辆集。

(4) 终端用户:具有停车需求的车辆用户。

3停车方案

一般来说, 停车方案的数据分发包括两个阶段: 数据源至合适目标区域停车簇的数据转发和停车簇到路过车辆的数据分发。

3.1停车簇

本方案首先介绍如何从现有簇中选取数据缓冲单元, 然后给出对应的簇管理方案。

某些路段构成一个停车簇, 其他路段由于停泊车辆彼此隔离, 构成不同簇, 如图2所示。为了判断如何选择数据缓冲单元, 现假设沿同一路段的各停车簇周期性向其他簇报告其分布。各簇根据如下规则确定数据缓冲单元:如果沿该路段只有一个簇, 则该停车簇被选为数据缓冲单元;如果沿路段有两个或两个以上簇, 则位于路段两端的两个簇被选为数据缓冲单元。选定数据缓冲单元后, 该簇需要对本簇进行管理, 包括簇头选举和成员管理。

停车方案制定如下簇头选择机制:位于单簇两端的两辆车被选为簇头, 两个簇头分别服务于最近交叉路口车辆;位于多簇末端的车辆被选为各自簇的簇头, 以便驶入路段车辆短时间内遇上簇头。确定簇头后, 簇成员周期性地向簇头报告其位置。因此簇头可管理所有停泊车辆, 并充当本地服务接入点, 执行数据分发。考虑到簇头车辆随时可能离开, 因此还须指定相应规则:当簇头离开时, 触发新一轮簇头选举, 数据分发和簇状态都应从旧簇头迁移至新簇头。

3.2数据源到路边停车的数据转发

停车簇缓冲目标区域数据报文, 并为路过车辆提供数据分发服务。为实现单跳数据分发, 数据源首先应向所选停车簇分发数据。按照所使用策略不同, 分发过程可进一步分为两个阶段:数据源路由至停车簇和停车簇路由至其他停车簇, 如图3所示。

3.2.1数据源路由至停车簇

首先应考虑数据源位于数据报文目标区域外这种最常见情况。本方案不仅利用到移动车辆, 还利用停泊车辆进行数据转发, 即直通模式中利用地理贪婪转发算法转发数据报文给前方交叉路口, 停泊车辆可视为速度为零的移动车辆参与地理贪婪转发过程;交叉模式中车辆按照可用路段效用函数找出下一路段进行数据报文转发。

路段效用函数定义为

式 (1) 中ρｍ为移动车辆密度, ρｐ为停泊车辆的密度, d是下一路口至目标区域的最短距离。设Nｍ为路段移动车辆数, Nｐ为停泊车辆数, L为路段长度, rｐｖａ为愿意提供PVA的停泊车辆比率, 则有:

式中Nｐ很容易得到, 而Nｍ按如下规则估算:簇头首先根据平均速度T =L/v估计路段行车时间, 然后计算时段T内路过车辆数。

采用上述数据转发策略可高效路由报文至目标区域。到达目标区域后数据沿路段传送。遇到首个停车簇时, 则向其转发数据。然后该停车簇负责向同一目标区域内的其他停车簇分发数据。为了标注首个获取目标区域数据的停车簇, 需在信息头部增加一个附加位以便判断是否遍历过停车簇。如果数据源位于目标区域, 其路由过程相对简单。数据被分发给驶入车辆, 该车辆则充当移动协助者, 沿路段转发数据, 直至遇到停车簇。

3.2.2停车簇间路由

为了高效路由数据至目标区域的所有停车簇, 本文给出一种基于树的数据转发方案, 树中各数据报文从一个停车簇转发至同一目标区域的另一停车簇。假设每个停车簇都知道同一目标区域内的所有其他停车簇位置。由于一些车辆可能离开而其他车辆可能驶入, 这将导致同一簇不同时段所报告的位置可能略有不同。此时可将停车簇和目标区域路段抽象为一个加权连通图G (V, E) , 其中V为停车簇集, E为相邻停车簇间路段集。权值dｉｊ为相邻停车簇间的传输延迟估计。假设相邻停车场簇彼此周期性发送延迟探测报文, 并按历史记录估算传输延迟。由于停车簇间的传输延迟受彼此距离、交通密度和其他因素缓慢变化的影响, 这种近似具有一定合理性。

每对停车簇间传输延迟构成周期性更新延迟矩阵。利用延迟矩阵, 再通过经典Kruskal算法或Prim算法就可获得各停泊车辆的最小生成树。车辆沿最小生成树路由时, 总传输延迟估计值最小。如果最小生成树不唯一, 则选择含有最短路径长度的最小生成树作为数据转发树。只有出现新分支时才需复制数据报文, 这样就可大大降低传输开销, 而且可保证不同停车簇缓冲数据报文的一致性。

3.3需求驱动的数据分发

为了充分利用VANET有限带宽, 应尽量避免盲目数据分发。为此, 本文采用一种基于需求驱动的数据分发方案。车辆驾驶者表达所关注的数据报文类型, 停车簇为其提供匹配信息。从这层意义上来说, 本系统是一个发布/订阅系统。数据源为发布者, 移动车辆为订阅者, 停车簇则为代理, 从而确保数据源数据可被正确交付给订阅者。停车簇数据分发包括三个阶段。

(1) 订阅:最终用户自定义订阅, 并周期性广播订阅。

(2) 匹配:一旦接受订阅, 停车簇就比较其所存储的数据报文。

(3) 数据分发:如存在任一匹配订阅数据报文, 停车簇则进行广播, 然后订阅者进行接收。

为了避免车辆可能收到多个相同报文副本, 可让订阅者广播订阅时捎带所接收的最后报文ID。

4理论分析

本文考虑长度为L的路段S。假设Kｍ为路段移动车辆数, Kｃ为携带信息的车辆数。R为车辆通信范围, Kｐ为沿该路段一侧停放的车辆数。设0时刻车辆驶入路段S。接下来研究两种方案下获取所需路段信息概率。

4.1基于停车方案

车辆沿路段S停放, R范围内距离交叉路口的停泊车辆数:

忽略路段宽度, Nｅ车辆中至少存在一辆愿意提供PVA概率:

将式 (4) 中的Nｅ代入式 (5) , 车辆获取交叉路口停车簇数据报文概率:

设L=1 000 m, R=200 m, pvaｒａｔｉｏ= 30%, 概率p随停泊车辆数的变化结果如图4所示。

可以看出:40辆车沿1km路段停放, 车辆获取交叉路口停车簇数据报文的概率高于94%。而事实上沿1km城区路段一侧停泊车辆平均数远高于40辆。因此, 虽然利用了停车簇, 但车辆获取所需交叉路口数据报文的概率仍高于94%。

4.2车间方案

假设N (t) ;t≥0表示时段 (0, t]相遇移动车辆数, N (t) ;t≥0满足泊松过程。定义Wｎ为随机变量, 且序列Wｎ= 0, …; Wｉ= tｉ, …。其中tｉ为起始时间, 直到遇到第i移动车辆为止。根据泊松过程性质, 可推导出Wｎ;n= 1, 2, … 遵循Erlang分布, 其概率密度函数:

时段 (0, t]相遇n移动车辆概率:

由于移动车辆携带所需数据概率P为Kｃ/Kｍ, 获取相遇n车辆所需数据概率:

考虑到移动车辆可能从1, 2, …, N (t) 相遇车辆中获取所需数据, 则有:

进一步表示:

现设L=1 000m, 令λ=2, Km=100, t=20, N (t) = 60。根据式 (11) , 若Kｃ=2, 则p为69%。即如果只存在2个同一报文副本, 则车辆20s内获取所需报文概率仅为69%。显然, 基于停车数据分发方案优于基于车辆间数据分发方案。

5性能评估

接下来利用NS-2.33软件评估三种数据分发方案性能。

5.1实地勘测

为了收集实际停车和流量剖析数据, 本文选取当地具有典型停车分布的普通城区作为勘测目标区域。勘测期间分别统计每周一、三、五中8∶00、18∶ 00和20∶00时的交通量和路边停车。计算出各路段5米内的停泊车辆数, 并考虑三种类型街道:1允许路边免费停车, 这类街道车辆密度非常高;2无公共停车位, 只有一些预留停车位和非法停车位, 这类街道车辆密度非常低;3其余街道, 这类街道车辆密度适中, 停泊车辆数相对固定。

5.2仿真性能比较

移动车辆节点的准确建模对仿真而言非常重要, 本文采用VanetMobiSim软件生成车辆移动轨迹, 所生成的流量文件可被NS-2.33直接利用。为了生成稀疏交通和流量变化, 部署了不同车辆数 (50、100、150、200、250和300) , 无线电射程设为250m, MAC协议选用2 Mb/s的802.11。仿真停泊车辆节点随机分布于各街道, 平均停车时间为40 min, 标准差为27［１０］。默认车辆设备分享率为30%。设仿真伊始即建立好停车簇, 周期为60s。为了便于数据分发, 数据源部署于仿真区域中心位置。目标区域是由四个交叉路口及其路段所构成的矩形区域。假设20%移动车辆对目标区域感兴趣。缺省参数设置如表1所示。

仿真主要讨论三种数据分发机制:基于停车数据分发、基于车间数据分发和OD［１］。车间数据分发方案采用GPSR路由协议路由分发数据报文至目标区域, 并由各路段内移动车辆进行维护。车辆载体即将离开路段时, 传输维护数据给同一路段上的最远车辆, 这点类似基于停车数据分发方案, 并令报文载体以一跳方式响应订阅。

三种分发方案都由三个性能指标进行衡量:数据传送率:成功接收报文的订阅者比例;数据传输延迟:订阅者获取报文花费时间;网络开销:仿真期间生成的数据总量。

首先测试默认参数下的三种方案性能, 结果如表1所示。可以看出:车间方案比OD方案具有更好的性能, 车间方案以较低开销实现较低传输延迟的更高传送率;基于停车方案的多个停车簇都维持相同报文副本。一旦车辆到达停车簇路段时, 可在短时间内获得所需报文。因此基于停车方案的平均传送率较高而平均传输延迟较低。此外, 由于停车簇报文仅以一跳方式广播, 因而开销非常低。车间方案数据分发是由移动车辆维护, 但由于车辆的高移动性, 需要频繁切换以便维护路段数据报文, 因而网络开销很高。OD方案的开销远高于其他两种方案。然而, 事实上, 数据传送率并没有想象的那么高, 因为每当车辆进入彼此传输范围, 彼此交换数据将导致严重拥堵, 大大降低了数据传送率。

5.2.1车辆密度影响

此组实验用于比较车辆密度对三种数据分发方案的性能影响。实验结果表明:基于停车方案在不同道路条件下都运行良好;而车间方案在稀疏交通条件下则表现很糟。基于停车方案依赖路边停泊车辆, 只要存在一定数量停泊车辆, 就可保证信息可用性;而车间方案依赖移动车辆, 很难保证稀疏交通下的信息可用性, 从而导致低传送率;OD方案的车辆密度增加时, MAC层碰撞概率增加。因此OD方案传送率将随传输延迟减小而降低。

5.2.2数据发布率影响

数据发布率决定VANET的信息分发量, 较高数据发布率意味着较大网络负载。此组实验用于比较数据发布率对三种数据分发方案的性能影响。实验结果表明:当数据发布率从低到高变化时, 基于停车方案的传送率缓慢降低, 而车间方案的传送率明显降低, 这是因为基于停车方案是利用路边停车以一跳方式缓冲数据并执行数据分发, 从而大大降低传输碰撞概率;而车间方案利用移动车辆维护数据, 当发布率很高时, 将导致频繁切换和过度传输。三种方案开销都随发布率增大而增加, 尤其OD方案更明显, 基于停车方案总体上优于其他两种方案。

5.2.3数据包大小影响

此组实验用于比较数据包大小对三种数据分发方案的性能影响。实验结果表明:数据包大小相同时, 基于停车方案数据传送率和传输延迟都优于其他两种方案;基于停车方案数据报文由路边停泊车辆维护, 因此可为路过车辆提供稳定的数据分发服务;而车间方案数据报文需频繁移交给行驶车辆, 随着数据包大小增大, 频繁切换将遭受更多损耗, 因而数据传送率降低而数据传输延迟增加;OD方案的较大数据报文意味着更严重碰撞。因此性能更糟。

6结论

本文提出一种基于停车数据分发方案, 采用路边停泊车辆缓冲分发数据并执行数据分发。首先将停泊车辆组织成簇, 并提出一种路由方案以便分配数据报文至适当路边停泊车辆;为了分发最后阶段数据又引入发布/订阅方案;接着利用停泊车辆的共享资源和高效操作, 实现基于停车数据分发方案的较低开销。理论分析表明方案的优越性。最后的仿真结果也表明本方案能以较低网络开销和合理延迟实现更高数据传送率。

参考文献

[1] Xu Bo, Ouksel A, Wolfson O.Opportunistic resource exchange in inter-vehicle Ad Hoc networks.Proceedings of the IEEE International Conference onMobile DataManagement (MDM) , 2004:4—12

[2] 吴磊, 刘明, 王晓敏, 等.移动分布感知的车载自组网络数据分发.软件学报, 2011;22 (7) :1580—1596

[3] Maihofer C, Leinmuller T, Schoch E.Abiding geocast:timestable geocast for Ad Hoc networks.Proceedings of the 2nd ACM International Workshop on Vehicular Ad Hoc Networks (VANET’05) , 2005:20—29

[4] Zhao Jing, Zhang Yang, Cao Guohong.Data pouring and buffering on the road:a new data dissemination paradigm for vehicular Ad Hoc networks.IEEE Transactions on Vehicular Technology, 2007;56 (61) :3266—3277

[5] 杨卫东, 冯琳琳, 刘伎昭, 等.车载自组织网络中网络连通特性研究.通信学报, 2012;33 (Z1) :48—52

[6] Ding Yong, Wang Chen, Xiao Li.Astatic-node assisted adaptive routing protocol in vehicular networks.Proceedings of the 4th ACM International Workshop on Vehicular Ad Hoc Networks (VANET’07) , 2007:59—68

[7] Lochert C, Scheuermann B, Wewetzer C, et al.Data aggregation and roadside unit placement for a vanet traffic information system.Proceedings of the 5th ACM International Workshop on VehiculAr Inter-NETworking (VANET’08) , 2008:58—65

[8] Eltoweissy M, Olariu S, Younis M.Towards autonomous vehicular clouds.in Ad Hoc Networks, vol.49of Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering, 2010;49:1—16

[9] Olariu S, Khalil I, Abuelela M.Taking VANET to the clouds.International Journal of Pervasive Computing and Communications, 2011;7 (1) :7—21

【数据分发系统】推荐阅读：

地理数据分发系统07-13

数据分发服务08-24

数据分发管理12-15

内容分发系统06-24

分发管理系统11-27

信息分发07-18

分发算法01-16

策略分发08-20

自动分发09-16

内容分发网络10-21