质量特性数据

2024-07-30

质量特性数据(精选7篇)

质量特性数据 篇1

伴随着地理信息技术与计算机信息技术的进步, 信息共享覆盖外延的不断拓展, 以及地理空间数据应用领域的扩展, 地理信息领域数据质量评价与控制已引起越来越广泛的关注[1~2]。国内, 随着各大油田地面工程地理信息数据建设的逐步深入, 形成了基于“数字油田”的地理信息系统, 能够满足对地面工程建设历史数据和新建产能建设数据的查询、分析与调用等基本功能。同时, 该系统将为“智能油田”打下数据基础。而该系统入库数据的质量特性和质量控制等方面, 还存在标准制定、日常维护等方面不够完善的问题。随着国家标准《地理信息质量原则》GB/T21337—2008和《地理信息质量评价过程》GB/T 21336—2008的出台实施, 解决了部分数据质量特性方面的现实需求, 能够指导数据质量的简单评价。本文结合信息化社会建设和“数字油田”建设的实际, 根据有关油田地面工程数据系统对于数据建设的质量要求, 综合考虑其内容和过程情况, 介绍其涉及到的质量元素和质量子元素等质量特性, 提出质量控制措施。

1 油田地面工程数据建设的总体情况

目前, 国内各大油田对于地面工程的历史数据建设工作基本完成, 新建产能所涉及到的地面工程数据基本能够及时入库。而历史数据的维护与变更, 标准的更新与维护, 数据建设正常化工作, 还在不断继续完善当中。随着“数字油田”建设的不断深入, 应用范围的逐步扩展, 各油田正在向“智能油田”迈进, 对油田地面工程数据建设的进度和质量提出了更高的要求。通过大量历史数据和新建产能实时数据的建设, 在进度方面基本能够满足“数字油田”和“智能油田”的建设要求, 而在质量方面由于标准制定的滞后、应用层面不清晰、用户需求不明确等原因, 导致质量特性一直没有完善的指标体系, 质量控制方面也没有统一且行之有效的措施。

作为油田地理信息系统的核心组成部分, 油田地面工程数据建设是为油田地理信息系统提供地面工程涉及到的系统、专业、流程及实体的空间数据和属性数据, 集计算机技术、地理信息系统技术、数据库技术、网络技术、现代测绘技术和工程设计文件数据处理技术为一体[3]。其主要任务是将油田地面工程涉及到的原油集输、天然气集输、注入、给排水、消防、污水处理、电力、通讯、采输设备、道路、自动化、长输和辅助等系统及其流程相关的井、管线、建 (构) 筑物、站 (场、库、所) 、线路及其附件、设备、设施、容器、泵类、炉类、仪表、阀类、管件等实体的空间数据和属性数据, 按照油田地理信息系统建设标准进行收集、整理、采集、转换、验证等工作, 并将其录入地面工程数据库中[4]。

2 油田地面工程数据质量特性

国际标准化组织地理信息技术委员会 (ISO/TC 211) 先后发布了ISO19113:2002《地理信息质量基本元素》Geographic Information-Quality principles和ISO 19114:2003《地理信息质量评价程序》Geographic Information-Quality evaluation procedures两项有关地理信息质量的国际标准[1~2]。而我国在修改和采用这两项国际标准的基础上, 制定了国家标准《地理信息质量原则》GBT 21337-2008和《地理信息质量评价过程》GB/T 21336-2008。参考两项标准所确定的核心内容, 对油田地面工程数据质量特性和控制方法进行论述, 以利于对油田地面工程数据质量进行有效控制, 提高数据的可用性与可靠性[5]。

2.1 可量测的质量元素和质量子元素

文献[6]将数据质量量化元素是数据集质量的定量组成部分, 说明数据集对产品规范规定的符合程度, 并能提供定量的质量信息。质量量化元素主要包括: (1) 完整性:描述要素、要素属性和要素关系的存在状况, 判别是否有多余或缺失现象; (2) 逻辑一致性:描述数据对规定的数据结构、属性及关系的逻辑规则的符合程度; (3) 位置准确度:描述数据中要素位置与其真值的偏离程度; (4) 时间准确度:描述数据中要素的时间属性和时间关系的准确程度; (5) 专题准确度:描述数据中要素分类及其关系的正确性, 要素属性的正确性。

文献[6]将数据质量元素细分为以下数量不等的质量子元素, 用来对数据质量元素的某一个特定特征进行量化描述。 (1) 完整性分别用多余和遗漏来衡量; (2) 逻辑一致性分别用概念一致性、域一致性、格式一致性和拓扑一致性来衡量; (3) 位置准确度分别用绝对或外部准确度、相对或内部准确度以及格网数据位置准确度来衡量; (4) 时间准确度分别以时间度量准确度、时间一致性和时间有效性来衡量; (5) 专题准确度分别以分类正确性、非量化属性正确性、量化属性正确性来衡量。对于上述质量子元素还用以下7个描述符来进行记录:数据质量范围、数据质量度量、数据质量评价过程、数据质量结果、数据质量值类型、数据质量值单位和数据质量日期[1~2]。

文献[5、6]将油田地面工程数据质量元素与子元素分为以下五个方面:

完整性:地面工程数据建设范围、要素集、属性集、元数据、技术文件和主要图件等是否存在多余和遗漏;如一个计量站空间数据的完整性和属性数据的完整性是否满足相关规范的规定。

逻辑一致性:要素或实体对于规定的逻辑结构在空间关系、属性域的逻辑规则、几何特征、图元归类等方面是否满足概念、格式和拓扑关系的一致性要求;如管道的命名是否符合规定, 其空间连接的逻辑上的对应关系等。

位置准确度:要素或实体的位置、精度、分辨率、与历史数据的融合等地理信息数据是否能满足规定的位置、精度、分辨率以及与历史数据的融合要求;包括位置外部附合或者绝对位置精度, 内部附合或相对位置精度, 地理格网划分、投影方式的选择等。如实体之间的距离、绝对数值等空间位置的实际数据准确度。时间准确度:要素或实体空间数据与属性数据值对于时间维的符合情况是否满足时间度量、时间时效和一致性的要求;如实体的投用日期、报废日期、检维修时间点等时间序列要求。专题准确度:要素或实体的分类、图元编号规则、入库记录数、属性取值等专题信息能否按照相关数据建设规范进行, 包括图元分类、字段名称、单位、几何特征、取值、非量化取值、专业划分、系统划分、流程、时间要素、填报规则等。如图元归类的准确度、系统归类的完整度等。

2.2 不可量测的质量元素

不可量测的质量元素即数据质量非量化元素, 用于描述数据集的定性质量, 主要包括[6]:

目的:说明数据集建立的基本理由, 并包含有关其预期用途的基本信息;如数据源单位的一些特殊要求的满足度, 部分历史数据的可用性指标等。使用情况:说明数据集已经进行的实际应用, 数据生产者或其他不同的数据用户对数据集的应用;各类数据能够被各类用户所使用的可用性指标等。数据志:尽可能详细地描述数据的历史, 叙述数据集从采集、获取、编辑和处理, 直到其当前状况的生命周期。各类地面工程数据的建设、维护、运行和使用的寿命, 以及如何在使用时间序列的一些记录的完整性、可靠性等。

其中, 数据志可以包含两个独立的组成部分:一是数据源, 说明数据采集所依据的来源信息;二是处理步骤或历史信息, 说明数据集建立过程中发生的事件或转换记录, 包括是否持续地或周期性地对数据集进行更新维护处理, 以及起止时间。油田地面工程数据建设的不可量测质量元素一般反映在数据集本身对于建设目的、预期用途、适用范围、数据维护、数据源单位的使用、技术文件对于数据生产、质量控制与评价、工作量统计的情况等方面, 通过技术设计书的审核、验证内外业数据、技术总结的评审、基础图件的会审等方式进行评价, 提出质量非量测元素的评价报告, 用于指导数据建设和应用。

3 油田地面工程数据的质量控制

文献[7]对于GIS工程和GIS数据质量评价过程、评价方法、抽样方法、确定检验单元、抽样处理的步骤等方面进行了规定。在面向GIS的空间数据标准性检查与研究方面, 提出了基于数据标准模板的空间数据检查方法, 将空间数据的标准存放到一个二维表结构中, 作为一个数据标准模板。模板以表的形式存放到数据标准性检查系统的配置库 (如mdb数据库等) 中。进行数据标准性检查时, 根据数据模板中定义的规则执行检查, 保证数字地图中数据的标准性、合理性。建立图形类型统一的图形数据检查与扩展检查的策略。进行油田地面工程数据质量控制, 在于减少数据生产过程中的错误和误差。油田地面工程数据质量控制的一般策略就是全面做好过程控制和结果控制, 在数据生产的所有环节设置质量检查点和质量控制点, 进行合乎实际和规范要求的质量评价, 保持完整的校对、审核、审定程序, 形成完整的“两级检查、一级验收”机制, 提供精度良好、内容齐全、合规性强的油田地面工程数据。

结束语

本文根据油田地面工程数据建设的总体情况, 参考了《地理信息质量原则》GB/T 21337-2008和《地理信息质量评价过程》GB/T21336-2008等规范, 简要分析了油田地面工程数据建设的质量元素与子元素等质量特性。其中, 关于数据质量的量测元素与非量测元素的定量分析与定性分析, 质量评价程序、方法、模型等没有完全涉及, 对于利用竣工资料进行地面工程数据建设的质量控制措施也没有论述。

基于上述两部规范的规定, 结合油田地面工程数据建设的过程, 针对数据的可用性与可靠性, 进行简单分析, 认为只要通过技术手段使数据规范化、格式化, 按照规定要求组织和生产, 数据就能达到可用性与可靠性并举。

摘要:结合油田地面工程数据建设的总体情况, 参考数据建设的过程实际, 依据国家标准《地理信息质量原则》和《地理信息质量评价过程》所确定地理信息数据质量元素、子元素及其描述, 介绍油田地面工程数据涉及到的质量元素和子元素, 明确油田地面工程数据的质量特性, 提出一般性质量控制方法。

关键词:地面工程,数据,质量特性

参考文献

[1]蒋景, 刘若梅, 贾云鹏等.地理信息数据质量的概念、评价和表述[J].地理信息世界, 2008, 6 (2) :5-10.

[2]邓国庆, 肖学年, 马晓萍等.数字测绘成果质量评定模型及方法的研究[J].测绘标准化, 2008, 24 (1) :1-7.

[3]何生厚, 毛锋.数字油田的理论、设计与实践[M].北京:科学出版社2001.

[4]刘尊良.论油田地面工程数字化正常化机制的建立[J].测绘标准化, 2008, 24 (3) :42-46

[5]李志林.空间数据的关注问题:从质量到可用性[J].地理信息世界, 2006, 4 (3) :14-17.

[6]GB/T 21337-2008/ISO 19113:2002地理信息质量原则.北京2008

[7]GB/T 21336-2008/ISO 19114:2003地理信息质量评价过程.北京, 2008.

电力调度数据网传输特性分析 篇2

目前,随着我国信息技术发展脚步的不断加快,电力调度数据网的安全性和可靠性也得到了相关部门高度关注。究其原因,主要是因为电力调度数据网承载了大量关键信息的传输,一旦电力数据网出现问题,那么后果不堪设想。因此,加大对电力数据网安全性的研究不容忽视,相关部门人员必须对其给予高度重视。

1 电力调度数据网的数据传输模型

1.1 数据传输模型概述

构成电力调度数据网主要有两部分,即节点和链路。每一个构成部分都有其各自的功能,以节点为例,其主要指的是构成数据传输模型中的主计算机或通信控制处理机,其主要功能主要包括两个方面,即发包功能和存储转发功能。而链路主要指的是承载各个节点之间信息流的线路或信道[1]。一般来说,调度数据网数据传输主要指的是在单位时间内,数据网中的各个节点在产生新数据包的基础上,对其他节点传来的数据包进行接受存储和转发,当这些数据包达到传输目的的时候,就会自动从网络中移除,如果数据仍处于传输阶段,那么便会暂停传输,待到下一个单位时间开始的时候,才能够继续进行传输。通过以上内容分析,我们总结出了关于节点i的缓存区在时刻t存储数据包的数量关系等式为:

通常情况下,在电力调度数据网的数据传输过程中,按照数据处理能力的强弱从高到低排序,其排列顺序为处于核心层的路由器一处于骨干层的路由器—处于接入层的路由器。根据以上内容的分析,我们将这三个层次的节点比例假设为10:5:1。

1.2 数据包拥塞率

在通信网络中,数据包拥塞是一种十分常见的现象,造成这种现象的根本原因就主要是由于数据流量超过了网络处理能力而导致的。而一旦出现了数据包拥塞的现象,势必会给电力调度数据网所承载的业务运行造成严重的影响,这种拥塞现象最明显的表现就是在信息数据传输过程中,在单位时间内没有到达指定目的地的信息数据[2]。为了有效将数据包拥塞的问题解决,本文主要对数据网中相关的传输行为进行全面系统的模拟,通过模拟过程来将各个节点产生的数据包总数统计出来,将其与整个网络数据包的滞留数量形成一个数值比例,以此来作为评估数据包拥塞程度的指标,其具体关系式为:

1.3 信息流向模拟

随着我国电力行业发展脚步的不断加快,电力调度数据网在该行业的应用也得到了国家电力部门的高度重视。如今,电力调度数据网中涉及到的信息类型多种多样,比如说生产管理信息、办公信息以及与企业发展相关的决策信息等,都要通过电力调度数据网进行传输,正因为如此,电力调度数据网所承载的传输信息量越来越大,且信息流向存在很大的随机性。因此,为了能够将信息流向进行有效的模拟,工作人员采用了限定数据包的起始节点与目的节点的方法。该方法将数据网中各个层次的节点集合分别用H、G、J来表示,那么在随机信息流模式下,网络中任意数据包i的起始节点和目的节点的关系式可以表达为:

1.4 数据传输的仿真流程

从图1中我们能够看出,在仿真的最初阶段,节点缓存区的数据包数量都是随机进行分配的。仿真开始之后,在单位时间内,节点会以概率λ产生新的数据包,并根据其实际处理能力将数据包转发到相邻的节点上。当仿真时间达到预设值后,则意味着仿真结束。

2 电力调度数据网的传输特性分析

根据电力企业系统的实际情况,我们建立了两种不同结构的电力调度数据网,即星型结构调度数据网和网状结构调度数据网。其中,星型结构调度数据网的核心层、骨干层以及接入层主要由省调和备调节点、10个地调节点和15个枢纽变电站、78个变电站和15个发电厂构成。网状结构数据网各个层的构成与其相同,唯一的区别在于连接形式上,该结构数据网的连接形式是以环形或网状相连后,再与核心层节点以网状方式连接。两种不同结构的电力调度数据网如图2和图3所示:

由于电力行业的数据信息传输量大,并且存在很大的不确定性,因此,本文着重对电力调度数据网的随机信息流模式进行研究。在图4中,我们给出了在随机信息流模式下数据包拥塞率与节点产数据包的概率二者之间的关系,从图4中我们能够看出,网状结构与星型结构的λ、c分别为0.13和0.19,这就表明在随机信息流模式下,星型结构相对于网状结构来说,能够更好的对数据的拥塞进行缓解,从而提升数据网的信息处理能力的[3]。

结合对网络的结构特性分析我们发现,在随机信息流模式下,无论是网状结构的调度数据网还是星型结构的调度数据网,其节点介数的分布情况都近乎一条直线,符合幂律分布,如图5所示。在这种情况下,这两种结构节点介数的基尼系数的数值都接近10,分别为0.862 3和0.857 8,这说明这两种数据网结构在信息流模式下,介数的分布是非常相似的。

为了能够进一步对2种数据网结构在随机信息流模式下的节点介数进行分析,根据各个结构节点介数的实际情况,我们将各个结构的节点介数进行了降序排列,具体数据如表1所示,通过对表1的分析我们能够看出,星型结构与网状结构各个层的节点介数相比,前者最大的节点介数处在核心层,而后者核心层的节点介数却并不是最高的。基于前文的假设“假设这三层节点的比例为10:5:1”我们可以得出结论,在整个电力调度数据网中,核心层节点相对于其他节点来说,具有最高的数据处理能力,正是由于这个原因,所以,在相同的信息负荷水平之下,星型结构可以更好的完成对信息数据的有效处理,主要是因为核心层的节点能够帮助数据网对信息拥塞的情况进行缓解,这是网状结构数据网核心层节点所不具有的功能[4]。这一结论可以通过图6中的信息拥塞分布来进行验证。当λ=01.5的时候,星型结构没有出现信息拥塞的现象,而网状结构的拥塞现象就比较严重。

3结语

本文主要在建立电力调度数据网的数据传输模型的基础上,对两种调度数据网的结构特性进行分析,从分析的结果我们能够看出,如果数据网的总体信息量超过网络处理能力的时候,网络信息传输的安全性就会大大降低。其次,电力调度数据网的传输特性与拓扑结构有着密切的关系,无论是哪一种类型的拓扑结构,都能够在一定程度上缓解网络中的信息拥塞,相对于网状结构来说,具有较好的传输性能。

摘要:文章主要对电力调度数据网络的数据传输模型进行简要介绍,并在此基础上分析其传输特性,为今后电力调度工作的有效开展提供一定的参考依据。

关键词:电力调度,数据网,传输特性

参考文献

[1]李高望,鞠文云,段献忠,等.电力调度数据网传输特性分析[J].中国电机工程学报,2012(22):24-26.

[2]胡娟,李智欢,段献忠.电力调度数据网结构特性分析[J].中国电机工程学报,2009(4):38-39.

[3]熊佩华,占震滨.调度自动化系统数据传输通道性能比较及发展方向[J].浙江电力,2011(9):45-47.

质量特性数据 篇3

光电跟踪系统是集光、机、电于一体, 由多个分系统组成的光电设备.跟踪精度和响应速度是光电跟踪系统的2个关键指标, 也是系统方案选择的决定因素[1].速度稳定回路是跟踪系统的关键环节, 其性能对系统的跟踪精度有较大的影响, 因此建立被控对象的精确数学模型, 对控制系统的设计有重要意义.针对跟踪环架速度稳定回路的各个环节进行建模, 并对跟踪环架进行了频率特性测试, 运用了最小二乘法拟合测试数据, 取得了被控对象较为精确的数学模型.

1 系统组成及控制原理

系统为安装于移动载体上的光电跟踪系统, 为克服载体运动及空气扰动力矩[2], 系统采用整体稳定的双轴陀螺稳定平台结构.系统由光电探测器、转塔、图像处理计算机、中心控制计算机和信号解调与功放电路5部分组成.光电探测器和陀螺安装在转塔的俯仰环架上, 图像处理计算机主要负责图像采集、目标识别和目标提取, 并将目标的偏差信息发送给中心控制计算机, 经中心控制计算机解算后, 完成对转塔的伺服跟踪控制.系统结构原理示意图如图1所示.

系统可工作在扫描、随动、半自动跟踪、自动跟踪等多种模式下, 不同的工作模式, 控制系统回路结构也不完全相同.在跟踪模式下, 控制回路原理框图如图2所示. 由速度稳定回路组成系统控制内环, 由跟踪回路构成系统控制外环, 组成双闭环控制系统.

2 速度稳定回路模型的建立

根据系统原理框图, 虚线框部分为系统的速度稳定回路, 由校正环节、PWM功放环节、电机及负载、陀螺4个部分组成.在跟踪状态下, 速度稳定环和跟踪环对载体角运动均具有隔离作用, 但跟踪环的采样频率较低, 且跟踪传感器存在延迟环节, 因此, 跟踪回路带宽较窄, 对载体角运动的隔离作用较弱, 系统中主要起隔离作用的是速率稳定环[3].速度稳定回路各环节的模型如下:

(1) 速度稳定回路校正放大环节GTVC (s) , 其结构和参数在速度稳定回路设计时确定.

(2) PWM功放环节GPWM (s) 由两部分组成, 一部分是比例环节, 另一部分是延迟环节

GH (s) =Ke-TPWMs (1)

(3) 被控对象是由电机及负载组成的跟踪环架, 其传递函数为

GΟBJ (s) =1/Κe (Τms+1) (ΤeS+1) (2)

(4) 速率陀螺的输出为与速度信号成正比的电压信号, 比例因子为

Klf=146.02 (mv/°/s)

传递函数为

Ggyro (s) =Klf (3)

3 跟踪环架频率特性的工程测试

频率特性法是控制系统设计常用的方法, 在分析跟踪环架频率特性的基础上, 建立跟踪环架的数学模型, 依据控制系统性能指标, 绘制期望的频率特性, 设计出校正环节, 使系统达到良好的动态特性和稳态性能. 光电跟踪架的开环频率特性测试原理框图如图3所示.

(1) 由信号发生器产生频率可调、幅值相位固定的正弦信号, 一路经AD转换后送给伺服控制器, 另一路送给示波器;

(2) 伺服控制器根据所采集的正弦信号的符号和数值分别产生控制转轴转动的控制信号, 使转塔框架作正弦摆动, 所摆频率与正弦激励信号相同, 转塔框架摆动的速度由陀螺测量得到, 即将陀螺的输出信号送与示波器显示;

(3) 记录在不同频率下 (ω1、ω2…) 测得输入电压幅值和输出电压幅值, 经计算可得被测系统的对数幅频特性曲线;记录在不同频率下 (ω1、ω2…) 测得输入电压和输出电压的相位差, 经计算可得被测系统的对数相频特性曲线.

按照以上步骤, 对方位跟踪环架进行了测试, 绘出相应的频率特性曲线如图4所示.

4 数据分析与结果仿真

利用MATLAB中的多项式拟合命令[a, s]=polyfit (x, y, n) , 对测试数据进行拟合, 由于多项式的拟合目标是形如y (s) =f (a, x) =a1xn+a2xn-1+…+anx+an+1的n阶多项式模型, 不能

直接用于对频率特性的幅频特性进行拟合, 通过函数变化, 变为可以简单有效处理的线性最小二乘问题[4].被控对象的传递函数为

G (s) =ke-ΤΡWΜs (1Τ1s+1) (1Τ2s+1) (4)

两边取幅值, 则有

|G (jω) |=|ke-iΤΡWΜω|| (j1Τ1ω+1) (j1Τ2ω+1) |=|Κ| ( (1Τ1ω) 2+1 ( (1Τ2ω) 2+1) (5)

变换后为

1|G (jω) |2=1+ (1Τ12+1Τ22) ω2+1Τ121Τ22 (ω2) 2Κ=1Κ+1Κ (1Τ12+1Τ22) ω2+1Κ1Τ121Τ22 (ω2) 2 (6)

x=ω2y=1|G (jω) |2, 则式 (6) 变为

y=1k1Τ121Τ22x2+1Κ (1Τ12+1Τ22) x+1Κ (7)

这样就可直接用二阶多项式进行拟合, 经拟合并计算得

{Κ18Τ15.6Τ2280

得到被测对象对应的最小相角系统为

G1 (s) =18 (15.6s+1) (1280s+1) (8)

延迟环节参数TPWM的确定, ∠G (s) 和∠G1 (s) 的相位差为∠G1 (s) -∠G (s) =TPWMω, 根据相位差的对应关系, 可以求出TPWM=0.005s.

则求得速度稳定回路控制对象的传递函数为

G (s) =18e-0.0055s (15.6s+1) (1280s+1) (9)

比较试验曲线和拟合传递函数的曲线如图5所 示. 拟合曲线和试验曲线误差分布图如图6所示. 从中可以看出, 经最小二乘法拟合的理论曲线, 在较宽的频率范围内与试验真值保持了良好的一致性.

5 结 束 语

光电跟踪系统是集光、机、电于一体, 由多个分系统组成的光电设备.跟踪精度和响应速度是光电跟踪系统的2个关键指标, 也是系统方案选择的决定因素.建立被控对象的精确数学模型, 对控制系统的设计有重要意义.针对跟踪环架速度稳定回路的各个环节进行建模, 并对跟踪环架进行了频率特性测试, 运用了最小二乘法拟合测试数据, 得到被控对象较为精确的数学模型, 通过仿真可看出试验曲线和拟合曲线在较宽的频率范围内一致.通过建立的控制对象数学模型, 可以更好地根据方位轴系的稳定性能和动态性能要求, 精确的设计校正环节, 从而提高系统的跟踪控制精度.运用该方法也可以对俯仰跟踪环架进行建模, 设计校正环节.此方法还可以对各个闭环跟踪控制回路进行分析, 测试闭环跟踪控制系统的性能指标, 在工程上具有较好的实用性.

参考文献

[1]马佳光.捕获跟踪与瞄准系统的基本技术问题[J].光学工程, 1989, 16 (3) :1-42.

[2]张景旭, 王洋.动载体光学图像视轴稳定技术[J].光电技术应用, 2007, 22 (1) :4-7.

[3]王连明.机载光电平台的稳定与跟踪伺服控制技术研究[D].长春:中国科学院长春光学精密机械与物理研究所, 2002:29-42.

质量特性数据 篇4

与以往常见的行式关系型数据库不同,Vertica是一种基于列存储(Column-Oriented)的数据库体系结构,这种存储机构更适合在数据仓库存储和商业智能方面发挥特长。

常见的RDBMS都是面向行(Row-Oriented Database)存储的,在对某一列汇总计算的时候几乎不可避免的要进行额外的I/O寻址扫描,而面向列存储的数据库能够连续进行I/O操作,减少了I/O开销,从而达到数量级上的性能提升。同时,Vertica支持海量并行存储(MPP)架构,实现了完全无共享,因此扩展容易,可以利用廉价的硬件来获取高的性能,具有很高的性价比。

2. Vertica数据库的体系结构

如图1,展示的是单节点上的Vertica的基本体系结构。

作为关系型数据库,Vertica的查询SQL也是在前端被解析和优化的。但与传统的关系型数据库有所不同,Vertica内部是混合存储的,包括两种不同的存储结构:写优化器(WOS)和读优化器(ROS)。

(1)写优化器WOS(Write-Optimized Store)

是位于主存储器上的一个数据结构,用于有效的支持数据插入和更新操作;数据的存放是无序的,非压缩的。

(2)读优化器ROS(Read-Optimized Store)

是磁盘物理存储,存放的是排序和压缩后的数据库大块数据,因此这里的查询相比于WOS性能更好。

(3)Tuple Mover进程

是Vertica内部的一个进程,定期的以大数据块的形式把数据从WOS移到ROS,由于是对整个WOS操作,Tuple Mover一次能非常有效的排序很多记录,最后批量把它们写入磁盘。

在Vertica内部,不论是WOS还是ROS都是按列存储的。

举个例子:

表Sales包含字段(order-id、product-id、sales-date、customerid、sales-price),Vertica会存储至少五个不同的列(逻辑上展示给用户的是一张表)。通过分开存储这些列,Vertica能够只返回用户特定查询的列。

在Vertica中,每一列可以存在于不同的Projections中,如可以给Sales表建立两个Projection:其中sales-prices包含order-id、product-id、sales-date、sale-price四列,另一个salescustomers包含了order-id、product-id、customer-id三列。每个projection都可以指定单独的排序,例如:命名为salescustomers的projection可能会按custmoer_id排序存储,这对于“统计某个客户订购了哪些产品”这类查询就非常有效。借助于这种存储方式,对每个查询Sql,Vertica的Database Designer工具会自动使用最优的projections,从而能很快地响应用户的请求。

当然,这种多个projections冗余存储的方式会占用更多的磁盘空间,对此,Vertica也给出了很好的解决方案。高效的列压缩模式能够最多把数据压缩掉90%,不但大大减少了磁盘的使用,同时由于Vertica能够直接处理压缩数据,这样查询性能和查询时的CPU负载都大大降低了。

3. Vertica的关键特性分析

在数据仓库领域,人们会更多的关注数据库的查询性能。Vertica的查询响应受到多个因素的影响。

举个简单的例子,如上提到的Sales表,如果要计算出商品的平均销售价格,可以用:

SELECT date,AVG(sales-price)FROM sales GROUP BYsales-date这样的语句来实现。对于这样的典型查询语句,系统的主要开销在磁盘访问(disk I/O)和CPU处理两个方面(分布式的情况下还需考虑网络I/O),通常情况下disk I/O和CPU计算是同时进行的,这样我们不难得出结论:如果disk I/O用了D秒,CPU处理用了C秒,则整个查询的响应时间是D和C两者中的最大值。

理解了以上一般SQL语句的处理过程,我们就可以进一步的分析一下Vertica数据库在查询方面的优势在哪里。

3.1 列定向(Column-orientation)

由于大多数的查询都是要从磁盘读取数据,因此可以说disk I/O在很大程度上决定了一个查询的最终响应时间。从上面的示例可以看出,Vertica只需要读取sales-date,sales-price两列,而行式存储的数据库则要读取全部的5列,列式数据库的优势不言而喻。

3.2 压缩机制(Aggressive Compression)

在数据存储方面,Vertica利用内部的特定算法对数据进行压缩处理。这样的机制会大大减少disk I/O的时间(D),同时由于Vertica对扫描和聚合等操作也在内部进行了优化,可以直接处理压缩后的数据,这样CPU的工作负载(C)也减少了。如上例中的AVG聚合函数,Vertica是不需要将压缩数据先做类似解压这种处理的,因此查询性能得到优化。

3.3 读优化存储(Read-Optimized Storage)

Vertica的数据库存储容器ROS Container专门为读操作进行了优化设计,且其中的数据是经过了排序和压缩处理的,即每个磁盘页上不会有空白空间,而传统的数据库一般会在每页上预留空间以便日后的insert操作来使用。

3.4 多种排序方式的冗余存储

为了高可用性和备份恢复的需要,Vertica会按照不同的排序方式对数据做冗余存储,这不但避免了大量的日志操作,也为查询带来了便利。Vertica的查询优化器会自动选择最优的排序方式来完成特定的查询。

3.5 并行无共享设计

Vertica支持完全无共享海量并行存储(MPP)架构,随着硬件Server的增加,多个CPU并行处理,性能也可以得到线性的扩展,这样用户使用廉价的硬件就可以获得较高的性能改善。

3.6 其他管理特征

除了有优越的性能以外,Vertica在数据库管理方面也进行了非常人性化的设计。

Vertica Database Designer是一个界面化的日常管理工具,并且能为用户作出详尽的DB层物理设计方案,大大减少了日后的性能调优方面的开销。

Vertica通过K-Safety值的设置,完成了数据库的备份恢复机制,并保证了高可用性。

对于数据库中的每个表每个列,Vertica都会在至少K+1个节点上存储,如果有K个节点宕机,依然能够保证Vertica DB是完整可用的;当损坏的节点恢复时,Vertica自动完成节点间的热交换,把其他节点上的正确数据恢复过来。通过这种机制也保证了Vertcia库的节点数目可以自由伸缩而不会影响到数据库的操作。

Vertica通过两种技术来实现在线的持续数据装载而不会影响到数据库的访问。

首先,Vertica通常运行在快照隔离(Snapshot Isolation)模式下,该模式下查询读取的是最近的一致的数据库快照,这个快照是不能被并发的update或delete操作更改的,因此查询操作也不需要占用锁,这种方式保证了数据装载(insert)和其他查询能互不干扰。另外,Vertica可以把数据直接装载到WOS结构中,WOS中的数据是不排序或索引的,所以装载速度会很快,然后再由Tuple Mover进程在后台把数据移入ROS中,由于TupleMover的操作是大块读取(bulk-load)的,所以性能也很好。

4. 结语

综上所述,Vertica在设计上充分考虑和利用了列式存储的优越性,使数据库的整体性能、易用性及可靠性方面都达到了较高的水平,同时Vertica提供了大量的管理监控工具及APIs接口等,给使用者带来了方便,因此这几年的发展速度也很快,值得我们关注。

参考文献

[1]程莹.云计算时代的数据库研究[J],电信技术,2011,(01).

[2]尹东方.列式存储在知识发现系统中的应用与实现[D].中国优秀硕士学位论文全文数据库,2010,(07).

[3]石菲.列式数据库持续突破[J].中国计算机用户,2009,(09).

[4]Pedro Furtado.Model and procedure for performance and availability-wise parallel warehouses,Distributed and Parallel Databases,2009,(02).

[5]Zack Jourdan;R.Kelly Rainer;Thomas E.Marshall.Business Intelligence:An Analysis of the Literature,Information Systems Management,2008,(03).

质量特性数据 篇5

交通事件自动检测主要通过各种检测手段,获取道路交通的各种参数,并通过分析交通事件情况下各种道路交通参数的变化特性来判断交通事件的发生。目前交通事件检测方法主要利用线圈、微波等固定式交通检测器采集交通流量、车速和占有率等交通参数来进行,但固定式检测器的安装使用成本较高、覆盖面有限[1,2,3,4]。

目前国内许多大中城市已在出租车上安装了GPS定位终端,这些终端可实时采集出租车的位置、速度、方向等信息,成为能够采集交通数据的浮动车,且具有覆盖面广、成本相对较低等优点[5,6]。但由于浮动车与固定检测设备所采集的交通参数不同,基于固定检测数据的事件检测算法难以直接应用于浮动车数据。因此研究基于浮动车的事件交通参数特性,并使之服务于事件检测具有重要的意义。目前关于这方面的研究还比较少见。本文在分析交通参数特性及其在事件检测中作用的基础上,研究了基于浮动车的事件交通参数特性,通过交通仿真进行论证,并以此为基础对基于浮动车数据的交通事件检测方法进行了探讨。

1 交通事件及交通参数特性

交通事件一般是指可以在短时间内引起道路有效通行能力下降或交通需求非正常增加的偶然发生事件。

目前的交通事件自动检测方法主要是根据道路中交通参数的变化来自动检测事件。由于高速公路和城市快速道路中,各道路交通参数受交叉口、混合交通等因素的影响较少,交通事件检测系统主要应用于高速公路、城市快速道路,也可应用于其他受周边环境及交叉口影响较小的公路和城市道路。

交通事件检测算法有很多,但其基本原理都是利用检测事件状态下检测的各种交通参数非正常变化来检测的。主要利用的交通参数包括:速度、占有率、流量3类,且主要基于固定检测器,而浮动车数据中由于自身采集的特点,与固定检测器检测的交通参数具有明显的不同,因此有必要对浮动车数据中的交通参数特性进行针对性的研究。

2 基于浮动车数据的事件交通参数特性分析

2.1 浮动车交通参数

浮动车主要是指装备有GPS终端,并行驶于路网的车辆。浮动车能够采集的交通参数主要包括位置、行驶方向、瞬时速度(简称车速)、行程时间和行程速度等。由于移动检测的特点,其交通事件检测,必须在具体分析交通事件条件下移动检测数据的变化特性的基础上进行。

2.2 仿真分析

由于道路中交通事件发生的不可预测性,难以获得交通事件条件下的实测数据。此处利用德国PTV公司开发的Vissim微观交通仿真系统,对道路交通事件进行仿真以获得相应的数据。

在Vissim建立一段1.6 km的3车道路段作为研究对象,车道宽为3.50 m。在实际中该路段可以对应封闭的高速公路、城市快速干道和受交叉口及周边环境影响较小的公路和城市主干道路段。路段上的交通流由Vissim仿真产生,其中大型车占15%,小型车占80%,浮动车占5%。

定义浮动车(probe vehicle)类型,采用与Vissim中的小型车(car)相同的参数,并在交通组成中定义其所占比率为5%。采集间隔为5 s。一条车道发生堵塞和2条车道发生堵塞的交通事件仿真情况如图1和图2所示。

2.3 速度变化特性分析

在交通流3参数中,速度是对交通事件很敏感的参数。而且,GPS设备可以获得比较准确的速度信息,目前比较成熟的GPS产品中,速度测量精度一般小于0.2 m/s,有的高性能设备可以使精度达到0.05 m/s以下。因此速度指标是利用移动检测技术进行事件判别的最重要的指标。

2.3.1 事件和正常状态的浮动车速度分析

在发生交通事件时,浮动车行驶到堵塞或排队位置附近时,其速度将显著下降,甚至出现停车现象。但是当浮动车行驶过事件发生位置时,速度将显著提高。在路段交通量为3 000 veh/h(正常情况下随机取5个样本,其在行驶速度变化曲线如图3。在同样条件下,当路段850 m处发生交通事件导致2个车道阻塞时,取5个车样本,其速度变化曲线图见图4。有关数据分别进行n=2的中值滤波。由图可知,在事件发生状态下,浮动车的速度呈先降后升的特征。而且速度的波动浮动也比正常状态下要大。

2.3.2 不同流量及事件严重程度的浮动车速度变化分析

速度的变化受交通流量和阻塞程度的不同而有所区别。为了便于比较,需对多个浮动车数据进行统计,而各个浮动车通过路段的时间不相同,不便于统计比较。本仿真路段中,可将浮动车经过路段时的所有记录等分成10组,分别求平均值。

在发生2车道堵塞的交通事件时,交通需求量为2 000,3 000和4 000 veh/h 3种情况下,分别取20个浮动车的数据进行分组统计,浮动车速度的变化曲线见图5。在交通需求量为3 000 veh/h的情况下,发生2车道堵塞和3车道堵塞时,浮动车速度的变化曲线见图6。

由图6可见,随着交通需求量的增长,堵塞程度的加重,浮动车的整体速度下降,速度统计值的最低点下降,但恢复后的速度基本相同。从最低速度到恢复后的速度变化幅度增大。起始速度到最低速度的变化幅度不一定增大,这主要是由于交通需求量大和堵塞程度严重时,刚进入路段的浮动车受到排队的影响,速度较低。

2.3.3 事件状态和正常状态路段上所有浮动车平均速度比较

图7描述了从正常状态到事件发生及事件结束期间,路段上浮动车平均速度变化趋势。这里事件发生时间为600~1 500 s,分别在4 000 veh/h交通量1条和2条车道堵塞,及2 000 veh/h交通流量2车道堵塞的3种情况下进行比较。

由图7可见,交通事件产生后,路段上所有浮动车的平均速度降低。而且,交通需求量越大,堵塞程度越严重,浮动车的速度越低。此外,在交通量较小时,由于浮动车数量较少,所计算的平均值往往由较少的浮动车得出,因此数据波动比较大。

2.3.4 事件状态下浮动车速度特性小结

1) 浮动车车速呈先降后升的趋势,但如果排队超过路段起点,则浮动车速的变化具有由先在低值范围波动后迅速增长并趋于稳定的规律。浮动车的平均速度降低。

2) 在堵塞程度相同的交通事件条件下,在交通需求量越大时,浮动车的车速的变化越明显。浮动车行驶过路段的平均速度越低。

3) 在同样的交通需求情况下,交通事件所造成的道路堵塞程度越大,浮动车的车速变化越明显,浮动车行驶过路段的平均速度越低。

4) 发生事件时,同一时刻路段上所有浮动车的平均速度将降低,而且交通需求量越大,堵塞程度越严重,平均速度值越低。

此外,在低交通量情况下,浮动车速度变化与正常状态下趋同。因此,在低交通流量状态下,事件情况下的浮动车车速特性不明显。

2.4 行程时间变化特性

行程时间是描述道路交通运行状态的重要参数。由上节的分析,在事件状态下,浮动车平均车速下降,且随着交通需求量的增加和事故程度的加重,速度有下降的趋势。图8分析对比了正常状态和事件状态下不同堵塞程度及不同交通需求量的浮动车通过路段时留下的记录数。由于记录时间间隔是固定的,记录数越多则行程时间相应越长。

由图8可见,对于同一路段行程时间的变化有以下特性:

1) 事件状态下的浮动车行程时间大于正常状态的行程时间。

2) 同样的事故程度下,交通需求量越大,则行程时间越长。

3) 同样的交通需求情况下,堵塞程度越重,则行程时间越长。

2.5 位置变化特性

GPS设备可以实时采集浮动车当前运行的位置。由于交通事件的影响,对浮动车的位置变化也会造成影响。图9是正常交通状态下,交通需求为3 000 veh/h时,5个浮动车样本的位置变化曲线;图10是交通量为3 000 veh/h时,发生2车道堵塞时,浮动车位置变化曲线。

由图8可见,在正常状态下,浮动车位置变化曲线是一条近似的直线。而在事件状态下,浮动车位置变化曲线的斜率出现了突然变小,又突然变大的情况,形成了一条分为3段的折线。

实际上,浮动车位置曲线的斜率对应着浮动车的速度,因此斜率的变化规律与前面速度变化的规律基本一致。由于GPS设备速度的采集精度较高,而对位置采集的精度有限(通常为15 m)。因此在事件检测时,宜主要采用速度为主要的检测指标。

3 交通事件检测算法研究

根据对浮动车数据检测交通参数的特性分析,结合常用的基于固定检测器的交通事件检测算法,可探讨基于移动检测的交通事件检测算法。

3.1 模式识别法

通过一个或多个交通参数的变化来区分异常状态和非异常状态[7]。由于浮动车数据中没有占有率信息,可用速度值作为判断依据。可在被检测路段上、下游端部分别选择适当检测路段,以该检测路段上所有浮动车的平均速度为检测参数。利用模式识别中的加利福尼亚算法,采用时刻t从检测段i =1,2,...,n得到的平均速度占有率v(i,t) 按下面3个条件来判断交通事件是否发生:VDF=v(i,t)-v(i+1,t)≥K1 (1)

VRDF=v(i,t)-v(i+1,t)v(i,t)Κ2(2)DVΤD=v(i+1,t-2)-v(i+1,t)v(i+1,t-2)Κ3(3)

式中:VDF为拥挤路段上下游检测段浮动车速度的差值;VRDF为拥挤路段上下游速度的相对差值;DVTD为拥挤下游速度时间上的相对差值;K1、K2、K3为分别为相应条件的阈值。

如果上面3个条件都满足,则可判断拥挤事件发生。

3.2 统计预测法

可选用其中标准偏差法来进行移动事件检测。利用时刻t之前n个采样周期的交通参数数据(可采用浮动车平均行程时间或平均速度作为参数),的算术平均值作为交通参数在时刻t的预测值,再用标准正态偏差来度量交通参数数据相对于其以前平均值的改变程度,当它超过预先设定的阈值时认为发生了交通事件。判别公式为:SΝD(t)=x(t)-x^(t)SΚ(4)式中:

x^(t)=1ni1nx(t-i)(5)S=

1ni1n(x(t-i)-x^(t))212(6)Κ为决策阈值;SND为正态偏差;x为被检参数(可用浮动车凭据速度或行程时间)

3.3 时间序列法

可利用求和自回归滑动平均时间序列模型(ARIMA)描述,通过平均前3个时间段的浮动车交通参数(速度或平均行程时间)观测值和预测值之间的误差,来预测当前时间段和前一时间段交通变量的差值。当预测数据与观测数据存在大的偏差时,启动事件报警。

3.4 智能算法

可采用神经网络来计算,其中基于误差反向传播算法的多层前向神经网络(BP网络)是目前应用最为广泛的神经网络[8]。可采用2.3.2中方法,对浮动车数据分组,作为神经网络的输入参数,以是否发生时间作为输出,采用BP神经网络,来判断事件是否发生。该算法从真实的有代表意义的浮动车数据出发,让神经元网络自动学习,直接归纳出交通流的规律。

4 结束语

基于浮动车的移动检测技术已逐渐成为交通流检测的重要方式之一,浮动车移动检测所得到的速度、行程时间和车辆位置等参数在交通事件的情况下,都具有明显特征的变化特性,成为检测交通事件的基础。本文利用Vissim搭建交通事件的仿真环境,对交通事件情况下浮动车移动检测交通参数的变化特性进行了细致的分析,并提出了4种基于浮动车数据的交通事件自动检测算法,具有覆盖面广、成本低的优点。本文的研究具有良好的应用价值。

摘要:利用微观交通仿真软件Vissim搭建交通事件环境,对在不同堵塞程度和不同交通流量的交通事件情况下,浮动车采集的浮动车速、行程时间、浮动车位置等移动检测交通参数变化特性进行了分析比较,总结出交通事件情况下的浮动车移动检测各交通参数变化规律,并以此为基础对模式识别法、统计预测法、时间序列和智能算法等4种基于浮动车数据的交通事件检测算法进行了探讨,具有覆盖面广、成本低等特点。

关键词:智能交通系统,事件检测,模式识别,浮动车,移动检测

参考文献

[1]刘智勇,赵晓芳.基于改进的RBF神经网络的高速公路交通事件检测[J].公路交通科技,2008,25(11):119-122.

[2]孙熙,李夏苗.基于boosting算法的交通事件检测[J].交通运输系统工程与信息,2007,7(5):36-41.

[3]陈小鸿,李兵.基于小波变换的城市道路交通事件检测[J].交通信息与安全,2009,27(6):84-88.

[4]Karim A,Adeli H.Fast automatic incident detec-tion on urban and rural freeways using wavelet ener-gy algorithm[J].Journal of Transportation Engi-neering,2003,2:57-68.

[5]Ferman M A,Blumenfeld D E,Dai Xiaowen.Asimple analytical model of a probe-based traffic in-formation system[C]∥Shanghai:The IEEE 6thIn-ter-uational lonferenceon Intelligent TransportationSystems(ITSc2003),Oct.13-15,Shanghai,China.2003.Proceedings.2003:263-268.

[6]余柳,于雷,戚懿,等.基于浮动车数据的城市快速路交通事件检测算法研究[J].交通运输系统工程与信息.2008,8(4):36-41.

[7]张秀媛,达庆东,张国伍.公路自动事件检测技术[J].系统工程理论与实践,2001(6):118-124.

质量特性数据 篇6

皮革主要感官特性参数的检验,一直采用传统的评价方法,如感观检验、语言描述等。 检验人员的主观感觉成分在很大程度上掺杂到 了检验结果中,不能客观、准确地反映出皮革的质量。因此,评价皮革成品的感官特性参数需要有更客观的方法[1]。最新的研究表明,皮革的感官参数与皮革的顶伸、 压缩、弯曲、拉伸4项指标有密切的关系[2]。同时,对相关实验数据该如何处理才能使结果更加准确也 是需要进一步研 究的。本文使用新型皮革感官特性参数测试仪器进行顶伸与压缩实验,用SPSS分析软件对实验数据进行了数据处理,验证了压缩实验数 据采用线性拟 合、顶伸实验数据采用指数拟合更为准确,也验证了柔软度与丰满度呈正相关的结论。

1实验

1.1实验试样与主观评定

随机选取5张已经裁剪好的圆形牛皮革试样,试样尺寸大小、厚度一致。请多位皮革专家分别对其进行主观评定。根据主观判断进行综合评分、排序,5张皮革试样从优到劣编号为1,2,3,4,5。

1.2仪器实验方法

将5种等级的皮革试样经空气调节(温度为(20±2)℃、 相对湿度为(65±2)%)48 h后进行实验[3]。实验用仪器为陕西科技大学与浙江温州轻工业研究院共同研发的新型皮革感官特性参数测试仪器[4]。

顶伸性能和压缩性能与皮革感官特性参数数学模型关系[5]为:若将测得的位移和载荷的数据采用线性拟合,可以得到顶伸和压缩性能加载曲线为s = f (x)=ax+b,卸载曲线为s= f (x)=a'x+b';若将测得的位移和载荷的数据采用指数拟合,可以得到顶伸和压缩性能加载曲线为s=f(x)=a.exp(x)+b,卸载曲线为s=f(x)=a'.exp(x)+b'。系数a、a' 分别代表柔软度和丰满度。加载斜率a越大表明皮革的横向和纵向的综合拉伸变形越大,皮革的柔软度越大;卸载斜率a' 越大表明皮革越容易恢复原形,皮革的丰满度越大。

顶伸性能测定方法:皮革试样用圆环固定在留有圆孔的夹持装置上,从位移零位开始, 横梁按照给定的速度向下运动带动顶杆逐步施加顶伸力,测定皮革顶伸阶段的载荷、位移等参数[6]。

压缩性能测定方法:皮革试样放置在压缩平台上,从位移零位开始,横梁向下运动压缩皮革试样,测定皮革压缩阶段的载荷、位移等参数[7]。

2实验结果

依次对5种等级皮革试样进行顶伸性能和 压缩性能实 验。实验得到的位移载荷数据 (节选)如表1和表2所示。

3实验结果SPSS分析

曲线回归分析的基本任务是通过两个相关变量的实际观察数据建立曲线回归方程,以揭示两变量之间的曲线联系形式。首要的工作是确定两变量之间的曲线关系类型。其中便可以通过观察实测点的分布趋势与哪一类已知的函数曲线最接近,则选用该函数关系式来拟合其曲线关系[8]。

3.1选定模型进行曲线估计

观察位移载荷曲线图,两个变量之间的曲线关系不太明显,要判定这两个变量适用于哪种模型,需要进一步计算。在主菜单中单击“分析”,从下拉菜单中选择“回归:曲线估计”, 弹出曲线估计主对话框,如图1所示。从左侧的变量对话框中选择V1(位移)作为因变量,再选择V2(载荷)作为自变量。本例选择线性模型、指数模型进行拟合。对话框中其他项目选择“在等式中包含常量”、“根据模型绘图”、“显示ANOVA表格”,单击“确定”,执行统计分析。

3.2顶伸实验结果拟合

以1号皮革试样位移 - 载荷曲线为例分析,利用SPSS软件对其进行加载曲线和卸载曲线拟合,拟合结果如图2和图3所示。

同理,对其他试样进行同样的曲线回归分析,可以得到相似的拟合曲线图。从图2和图3中可以看出,实测点的分布趋势与指数函数曲线 最接近,因此选用指数函数来拟合曲线。

3.2.1加载过程指数拟合

由软件得试样1指数拟合标准化系数(k1)为0.949。同理可以得到其他试样的 拟合结果。结果见表3。

由表3知,加载过程斜率大小为k2>k1>k3>k5>k4。 即皮革试样柔软度大小为2>1>3>5>4。

3.2.2卸载过程指数拟合

由软件得试样1指数拟合标准化 系数 ( 斜率k'1)为0.994。同理可以得到其他试样的拟合结果。结果见表4。

由表4知,卸载过程斜率大小为k'1 >k'2 >k'3 >k'5 > k'4。即皮革试样丰满度大小为1>2>3>5>4。

3.3压缩实验结果拟合

以1号皮革试样位移 - 载荷曲线为例分析,利用SPSS软件对其进行加载曲线和卸载曲线拟合,拟合结果如图4和图5所示。

同理,对其他试样进行相同的曲线回归分析,可以得到相似的拟合曲线图。从图4和图5中可以看出,实测点的分布趋势与线性 模型曲线更接近,因此选用线性模型来拟合曲线。

3.3.1加载过程线性拟合

由软件得试样1线性拟合标准化系数(k1)为0.963。同理可以得到其他试样的 拟合结果。结果见表5。

由表5知,加载过程斜率大小为k2>k1>k3>k4>k5。 即皮革试样柔软度大小为2> 1>3>4>5。

3.3.2卸载过程线性拟合

由软件得试样1线性拟合标准化系数(k’1)为0.954。同理可以得到其他试样的拟合结果。结果见表6。

由表6知,卸载过程斜率大小为k’2>k’1>k’3>k’4> k’5。即皮革试样丰满度大小为2>1>3>4>5。

4结论

质量特性数据 篇7

从20世纪90年代以来,混沌保密通信一直受到广泛关注。确定性混沌系统所产生的混沌信号具有高度不可预测性和貌似随机的特性,对于保密通信工程应用,极具吸引力。为此,国内外已经提出了利用混沌加密进行数字通信方法和装置,并取得了许多有价值的重要进展[1,2,3,4]。本文介绍的PSTN链路数据密码机是我们获得的国家发明专利产品,它是基于混沌保密通信原理研制的异步数据终端密码设备,特别适用于利用电话网组网的计算机数据通信网络。它能够对计算机终端间数据信息进行实时加密传输。利用电话线路组建计算机通信网络是一种简单易行的方式,由于电话网络覆盖面较大,扩充新用户容易,目前各大部委,证券、保险等部门均采用这种组网方式。但是由于电话网是一种公共设施,在传输过程中信息的安全得不到保障。数据密码机能对线路上传输的数据信息进行实时加密,确保普密级或商密用户信息在电话网上的安全传输。线路密码机为国家信息的安全传输提供保障,是数据终端用户理想的密码设备。体积小,标准线路接口,安装简单方便适用于公用或专用电话网数据传输环境,支持数据、图象等modem所能传输的所有业务,应用于政府部门、金融机构及大型企业,异步数据密码机用来对点对点异步拨号通信的微机或者其他设备进行通信加解密,用在公网中需要进行保密拨号通信的场合。还可用于国防领域诸如核实验基地、重要数据现场的加密传送,具有广阔的市场前景。

1 混沌密码机实验系统框图

异步数据密码机是对计算机终端传输数据进行加解密的数据密码机,应用在公用或专用电话网数据传输环境。密码机接在终端设备 (如计算机、服务器、DTE) 和线路设备 (如调制解调器、DCE) 之间,为用户提供加密服务。该实验系统由计算机、混沌数据密码机、调制解调器,公共电话网(PSTN)组成,如图1所示。

计算机与密码机之间使用RS-232C 25芯标准电缆连接,密码机与调制解调器之间也使用RS-232C电缆连接。由调制解调器将加密后的数据送入公共电话网。

2 混沌数据密码机的工作原理

混沌数据密码机的工作原理框图如图2和图3所示。来自计算机(或带RS-232C接口的现场测控设备)的控制信息经RS-232C电平转换器1,送给主CPU,主CPU通过RS-232C电平转换器2控制调制解调器完成拨号和建链。同时主CPU将来自混沌随机数发生器的模拟信号转换成数字信号,形成工作密钥,送给混沌密码算法CPU,并将此工作密钥加密通过调制解调器发送给对方。然后,主CPU通知本方计算机(或带RS-232C接口的现场测控设备)可以发送数据。来自计算机(或带RS-232C接口的现场测控设备)的数据经RS-232C接口,送给主CPU,主CPU将数据送给混沌密码算法CPU,算法CPU将此数据加密,回送给主CPU,主CPU将此加密后数据通过RS-232C接口2送给调制解调器,由调制解调器发送到PSTN。接收方与此过程相反。与普通链路密码机不同的另一个特点是该密码机可直接连接最多15路模拟信号,由发送方的CPU转换成数据信号,然后加密发送。

3 混沌的密码“一次一算法”

在分析了混沌映射和密码编码算法之间的异同基础上,我们解决了混沌理论在密码机中如何使用的问题。

混沌用于密码主要二种模式:一种是利用混沌本身来构造密码;另一种是将混沌理论与已有密码构造方法相结合来构造密码。前者的复杂性、安全性分析工具目前尚有待研究和获得公认;后者是我们研究和设计的一种实用的密码算法。与传统密码思想结合的好处在于将密码分析工具的研究工作量降到一个可以被接受的程度,从而使其可行性得到保证。研究表明:利用混沌的随机性理论可创新性地实现密码学界一直力求达到的“一次一算法”的设计思想。同时,我们将密码算法的混沌运算置于每次通信的密钥传递后,密文通信前的链路建立时间间歇,此时CPU处于空闲时间,既减少了密文通信中的运算时间,提高了密文通信速度;又实现了一次一算法(指一次通信)的思想,从保密的角度讲,增强了安全性。同时也符合所有秘密归于密钥这一现代密码设计思想。虽然在目前的各种通信场合,基本上都能实现“一次一密钥”的思想,而我们这里的“一次一密钥”非传统意义上的每个字节或每小段信息一个密钥,而是一次通信过程一个密钥,这为保证“一次一算法”的设计提供了保证,而混沌理论为设计这样的算法提供了理论基础。这也是密码学界多年欲解决的一个问题。我们设计的“一次一算法”具体结构如图2所示。该密码算法设计的优点体现在既可保证安全性,又可保证高速性。而且与现代密码学的保密思想“一切秘密隐藏于密钥之中”相合。

我们提出的混沌算法密码具有以下优点:

安全性:其一,混沌运算是基于实数域上的算术运算,比逻辑运算有更为复杂的时间运算复杂度,由于基本密码模块的S盒或替换表是由混沌运算产生的,攻击者在穷举攻击中必然要通过混沌运算,才能真正找到实际的运算算法。如采用128位密钥,这在时间上是不可行的,耗时比传统的逻辑运算密码耗时更长。其二,如果直接攻击基本算法模块,穷举S盒时,将需要海量子密钥,这些子密钥来源于混沌运算。传统的基本密码模块S盒是公开的或是固定的,子密钥通过逻辑运算获得,因此“一次一算法”结构更难受到攻击。其三、如果直接穷举攻击替换表,如果替换表足够大,其组合模式是海量的,本文算法有255!个,

其攻击难度甚至比直接攻击密钥更不可行。如果采用已知明文攻击替换表,也面临攻击基本算法模块的难度。

高速性:其一、由于混沌运算是在每次通信之前,密钥传送以后完成的,因此不占用正常通信时时间,提高了算法的复杂度,而又不增加正常通信密码产生时间,这也是混沌应用的一大优势。其二、由于引入混沌运算大大增加了算法复杂度,从而可降低基本运算模块的开销,与传统的密码算法相比,同样的算法复杂度下,基本运算模块可作得极其简单,为设计超高速密码算法提供了可能。

4 混沌密钥源

根据现代密码学的理论思想,一切秘密源于密钥,那么密钥源的选取就显得很重要,噪声源作为密钥源是密码设备的一个重要组成部分,通常用物理噪声源生成随机的密钥。但是物理噪声源产生的随机序列特性较难以保证,导致密码体系潜在的危险性,而且随机序列的速率难以保证,难以适合高速的场合。

我们利用著名的Chua电路来产生混沌信号,通过A/D转换器转换成数字信号,在理论上确定了保证安全性和速度的采样频率。为了和现有噪声源实现兼容性,作了并/串转换,为保证随机性和高速性,进一步用m序列扰动,组成了一个基于混沌的随机数信号发生器,来提供每次通信时的会话密钥。采用混沌噪声源是对现有噪声源的一种有效补充,具有高速和可信的安全性理论保障,今后可以作成集成电路芯片。

5 混沌密码机的主要特点

我们设计和研制的数据链路密码机是异步数据终端密码设备,如图4所示。我们解决了混沌密码机的三个技术关键:基于混沌的密码算法设计,达到高安全性、高速性;“一次一算法”密码设计;高速、高安全性的混沌密钥源设计。

混沌密码机有以下主要特点:

迄今国内外混沌保密通信的关键技术处于保密状态。我们研制的密码机与国内外比较,主要不同点表现在:

首次提出基于混沌复杂性的“一次一算法”的混沌分组密码新算法和设计思想,并在实际密码机中得以实现,从而极大地增强了穷举攻击的难度。

首次研制了数据链路混沌密码机,采用异步数据混沌通信方式,而不是采用国内外通常所用的混沌同步方法与技术,后者近年来已经被证明易被攻击破译。

采用软件与硬件相结合方法,而不是国内外目前大部分分别采用单独的软件加密或硬件加密法,单独加密技术上虽然易于实现,但已经被证明不够安全。

将混沌密码和传统密码相结合,应用上述分组混沌密码新算法和混沌LOGISTIC映射生成动态的混沌映射生成密码替换表,大大强化了AES算法中的S盒的作用,并能用现代密码安全理论来分析混沌密码新算法的安全性。目前国内外大多数采用单独的混沌算法,则无法进行安全性分析。

首次在国内研制了可以作为密钥发生器的混沌噪声源,可以适合于速率较高的通信场合。

提出了实施计算机终端间数据信息进行加密传输的完整方案,这样容易实现国防系统等领域中重要现场保密数据的实时安全双向传输方式,而目前现代卫星通信还因为安全性不得不采用单向双向传输方式。

另外与国内外比较,我们研制的混沌密码试验样机,体积小, 连接方便,可嵌套式使用,不改变原来通信装备,灵活性大, 整个设备成本低, 适用于专用及公共电话网的计算机数据通信网络,保密或公开通信方式还可以容易相互转换,凡是地球上有线电话网的地方均可应用.比较美国三所大(UCLA、UCSD和Stanford)组成的MURI联合体建立的激光混沌脉冲定位调制数字通讯演示系统, 在空中就架起高达215 fit激光反射塔, 整个体积庞大, 耗资巨大, 又不能嵌套使用, 与现代通信系统不能有机接轨, 目前虽然完成2.5公里的通信试验。虽然项目已经结实,但是至今美国没有关于这方面的实用报道。估计远距离的保密通信仍存在没有完全解决的技术难关;而欧盟试制的扩频混沌收发机还处于初步试验阶段;加拿大UWO的混沌通信虽曾经报道过,但是据悉没有真正实现,仍然以软件加密为主。我国该领域有很好的研究工作,与国际上处于同步进展。香港城市大学在国际上发表了不少有关混沌保密通信的论文,目前他们主要建立了混沌语音演示系统、光纤混沌通信初步试验和在Internet上试验了混沌保密谈话系统,都有待进一步实验和进入实用技术研究。由于保密关系,仅据我们所知,国内外迄今还没有公开有实用价值的混沌保密通信设备。

6 应用前景

从国防现场或工业现场等适时采集的情报,应用上述研制的数字链路混沌密码机进行加解密,再经过适配器与计算机连接通信,在公共电话网或专网上实现保密通信,这种软硬兼施的保密手段具有比通常更高的保密和抗破译能力。

由于该混沌密码机体积小,标准线路接口,安装简单方便适用于公用或专用电话网数据传输环境,可以支持网数据、图象等modem所能传输的所有业务,全球凡是有电话任何地方都可以实现保密通信。因此,它不仅能可应用于国民经济领域众多部门, 而且能够适合于我国国防领域实验现场的数据加密传送。这是数据终端用户比较理想的密码设备。还可以扩广到在互联网上的保密通讯。

总之,这一混沌信息技术,可能为进一步设计和实施电子信息对抗的方案提供一种新手段,而数字链路混沌密码机可能在未来信息对抗中发挥应有的作用。因此,本专利成果具有军民两用的潜力和市场开发前景。

摘要:在研究混沌复杂性的基础上, 探索了一种混沌密码新算法, 并成功地用于研制文件传输数字链路混沌密码样机, 本文简要介绍了我们获得的国家发明专利:PSTN链路数据密码机, 它是基于混沌保密通信原理研制的异步数据终端密码设备, 特别适用于利用电话网组网的计算机数据通信网络, 该机在专用和公共电话网具有较大的应用潜力和发展前景。还可以扩广到在互联网上的保密通讯。

关键词:PSTN链路数据密码机,原理,特性

参考文献

[1]方锦清, 驾驭混沌与发展高新技术, 北京:原子能出版社, 2002。

[2]赵耿, 混沌密码在计算机网络通信中的应用研究, 中国原子能科学研究院博士后出站研究报告, 2004年5月。

[3]方锦清, 混沌数字链路密码机总结报告, 部级鉴定会, 2004年12月, 北京。

[4]赵耿, 方锦清, 现代信息安全与混沌保密通信应用研究的进展, 物理学进展, 2003, 23 (2) :212-255。

上一篇:STCW下一篇:微信品牌营销利与弊