模型检测技术

2024-08-12

模型检测技术(精选12篇)

模型检测技术 篇1

随着计算机技术的发展, 硬件和软件系统规模日益庞大, 复杂程度越来越高, 系统的可靠性和安全性要求更加严格。在计算机系统设计开发中, 任何微小错误都可能引发灾难性的后果, 尤其是在航空航天、高速铁路以及核电站等关键领域。例如, 1996年6月4日, 阿丽亚娜-5型运载火箭在法属圭亚那库鲁航天中心发射, 升空30秒解体并爆炸。事故原因是该火箭错误地重用了阿丽亚娜-4型火箭的软件代码, 出现数据缓冲区溢出错误, 导致程序异常处理而自毁。

据统计, 计算机系统中, 由于软件错误引起的故障占所有故障的65%。美国贝尔实验室曾对AT&T公司支持的系统故障做统计, 发现80%的故障与软件有关。

在我国, 计算机系统的安全问题得到高度重视。《国民经济和社会发展第十二个五年规划纲要》明确提出“提高信息化水平需要, 加快建设宽带、融合、安全、泛在的下一代国家信息基础设施, 推进信息化和工业化的融合。”计算机技术已经成为国家现代化、信息化实施的基石, 而安全的计算机系统是信息化实现的重要保障。

为了能检测出计算机系统的缺陷, 特别是软件系统存在的潜在错误, Edmund M.Clarke和E.Allen Emerson[1], J.P.Quielle和Joseph Sifakis[2]在1982年分别提出了模型检测技术。该技术是一种检测有限状态系统是否满足系统要求规范的自动验证技术, 常用于对有限状态并发系统的自动化验证。它使用状态空间穷举搜索技术判定某一规范是否成立, 如果成立则回答yes, 否则回答no, 并返回违反系统规范的一条执行路径 (即反例) , 便于用户改进系统。

模型检测技术近年来得到了迅猛发展, 已从学术界快速辐射到了产业界, 被广泛地应用于计算机软件和硬件系统的验证, 并在工业检测方面有很多成功的应用, 如芯片安全性检测、时序电路设计安全验证、通信协议安全验证、外部设备主控软件安全检测、嵌入式系统检测、安全认证协议验证等, 许多知名公司, 如Intel、Microsoft、Fujitsu、Philips等在其产品设计和开发过程中都应用模型检测技术检测产品的安全性与可靠性。

本文初步探究了模型检测技术, 介绍了模型检测技术的发展概况, 分析模型检测技术原理、算法和实现工具, 并介绍了该领域的最新发展趋势。

1 模型检测技术发展概况

模型检测技术的研究始于20世纪80年代初, 为了有效地验证并发程序的安全性, Edmund M.Clarke、E.Allen Emerson和Joseph Sifakis提出了用于描述并发系统性质的分支时序逻辑, 设计了检测有限状态并发系统是否满足给定分支时序逻辑公式的算法, 由此揭开了模型检测技术研究的序幕。

1986年, M.Y.Verdi和P.Wolper[3]提出了线性时序逻辑描述系统模型, 开启了线性时序逻辑模型检测技术的研究。

1993年, K.L.Mc Millan[4]提出了符号化模型检测方法。该方法基于有序二元决策图 (OBDD) 模型, 并用有序二元决策图来描述系统状态空间, 提出了命题μ-演算的计算理论。μ-演算公式由原子命题、命题变量、逻辑连接符、模态算子和不动点算子组成。利用不动点算子能提高计算的速度, 从而增大了被检测系统的规模, 可检测的系统状态空间规模提高到1020。随着各种优化技术的应用, 当前模型检测技术能够处理的状态空间规模已达到10120。符号化模型检测方法的提出, 使得模型检测技术由理论研究向实际应用推进了一大步。

1994年, T.A.Henzinger[5]提出了实时系统模型检测技术, 使用时间自动机[6]描述实时系统的行为和性质, 验证系统模型能够在指定的时间内完成系统功能, 并对外部和内部事件在同步或异步的时间内能否及时响应进行验证。实时系统模型检测技术在现实工业生产中具有很高的应用价值。

随后, 模型检测技术获得了长足的发展, 出现了许多新技术, 如:对称模型检测技术、概率模型检测技术、偏序规约模型检测技术、按需即时的模型检测技术等。当前模型检测技术已经得到了广泛应用, 在集成电路设计、计算机硬件系统、网络协议验证、控制系统检测、安全认证协议等方面的分析与验证中, 取得了令人瞩目的成功。

2 模型检测技术原理

系统模拟、现场测试、定理证明和模型检测技术常用于检测计算机软硬件系统的安全性。系统模拟和现场测试主要通过观察在某些输入下系统是否具备相应的输出来发现系统中存在的问题, 是一种不完备的方法, 不可能使用系统模拟和现场测试技术检查系统的所有交互和缺陷, 而且要消耗大量的人力物力。定理证明通常指的是应用公理和证明规则证明系统的正确性, 它对软件开发领域产生了重要的影响, 可用于推理无穷状态系统。然而, 定理证明是一个耗时的过程, 只能由具有丰富逻辑推理经验的专家完成, 而且程序的正确终止通常是不能自动地验证的, 因此大多数证明系统不能完全自动化。

模型检测是一种自动验证技术, 通过显式状态空间搜索或隐式不动点计算来验证有限状态并发系统的模态与命题性质。为了实现验证自动化, 要对被检测的系统模型和需要满足的属性进行形式化描述, 通常前者使用Kripke结构描述, 后者使用时序逻辑公式描述。E.M.Clarke将模型检测问题表述为:假设模型M是Kripke结构 (状态迁移图) , 属性f是时序逻辑公式, 找到M中所有的状态s, 使得__D_Dd______满足, 则M是f的一个模型, 即M所表示的系统满足属性f。

作为模型检测技术的一个主要分支, 显式模型检测技术被证实具有工业价值, 在产业界得到了广泛的应用。显式模型检测是基于Büchi自动机和线性时序逻辑的模型检测技术, 该方法使用线性时序逻辑公式表达系统需要满足的属性, 将其转换为属性Büchi自动机, 同时将系统模型转换为系统Büchi自动机, 通过笛卡尔积运算进行自动化验证。显式模型检测原理如图1所示。

显式模型检测的过程如图2所示, 一般可分为三个步骤。

1) 将需要验证的系统模型转换为系统Büchi自动机, 通常是模型检测工具建模语言描述的待验证系统。

2) 使用时序逻辑公式描述系统需要被验证的属性, 主要包括安全性、活性和公平性等, 将时序逻辑公式转换为属性Büchi自动机。

3) 将系统Büchi自动机和属性Büchi自动机做笛卡儿积运算, 并检测乘积结果。若不满足则给出反例。

由于模型检测算法的复杂度与系统自动机的状态数量呈线性关系, 而与线性时序逻辑公式的长度 (公式中算子的数量) 呈指数级关系, 将线性时序逻辑公式转换为尽量小的Büchi自动机成为了研究者最为关注的问题。

3 模型检测算法

模型检测是一种基于算法的系统属性验证技术, 算法是基于模型检测的基本理论基础, 模型检测技术常用的算法包括显式模型检测算法和符号化模型检测算法。

显式模型检测算法[8]使用图搜索算法来判断系统是否满足相应的规范, Labelling算法和Tableau算法以及CTL模型检测中公平性约束的处理方式都属于显示模型检测算法。在显示模型检测算法中使用带有标记的有向图来表示Kripke结构M, 有向图中的节点表示M中的状态, 用节点之间的有向边来表示M中的状态转换关系, 每个状态在标识函数L:S→2AP中对应的原子命题集合表示为相应节点的标记。尽管显式模型检测算法非常有效, 但是状态空间爆炸问题使得模型检测难以用于检测复杂的系统。

K.L.Mc Millan提出的符号化模型检测方法使用布尔函数来表示系统的状态集合和状态转换关系, 使用有序二元决策图 (OBDD) 统一描述布尔函数, 大大缓解了状态空间爆炸问题, 最后通过μ-演算中的不动点理论来计算满足系统规范的状态集合, 实现了对复杂系统进行模型检测。分支时序逻辑的符号化的模型检测算法如图3所示。

4 模型检测工具

模型检测技术实现了对验证的系统自动验证, 已有很多模型检测工具实现自动验证。常用的模型检测工具有SMV、Nu SMV、Spin、UPPAAL、Spot、LTL3BA等

SMV是美国卡耐基梅隆大学开发的基于符号模型检测技术开发的模型检测系统, 主要思想就是采用符号模型检测技术检验系统是否满足用分支时序逻辑描述的规范, 用于检测有限状态系统是否满足分支时序逻辑公式。建模方式是以模块为单位, 模块可以同步或异步组合。模块描述的基本要素包括非确定性选择, 状态转换和并行赋值语句。其模型检测的基本方法是以二元决策图表示状态转换关系, 以计算不动点的方法检测状态的可达性和其所满足的性质。SMV适用于硬件模拟分析, 系统说明用软件规定的SMV语言编程, 系统属性用分支时序逻辑描述。

Nu SMV是美国卡内基梅隆大学和意大利科学技术研究中心在SMV的基础上联合开发, 重新设计和开发的新一代模型检测工具, 它从系统功能架构和实现方式上对SMV进行了扩展和升级, 引入了有界模型检测算法。Nu SMV提供了三种运行模式, 批处理模式, 命令行交互模式和图形用户界面, 可以描述同步和异步的有限状态系统, 使用基于二元决策图和有界模型检测算法, 来分析用分支时序逻辑和线性时序逻辑表达的系统规范。

Spin是美国贝尔实验室的研究员霍尔茨曼开发的模型检测工具, 获得2001年ACM软件系统奖, 用以检测有限状态系统是否满足线性时序逻辑公式及其他一些性质, 包括可达性和循环。建模方式是以进程为单位, 进程异步组合, 进程描述用Promela语言, 基本包括赋语句, 条件语句, 通讯语句, 非确定性选择和循环语句。

UPPAAL是丹麦的奥尔堡大学和瑞士的乌普萨拉大学计算系联合开发的实时系统的模型检测工具。以时间自动机为系统的实现模型, 以μ-算子的时间扩展为属性说明语言, 采用约束求解技术处理系统无穷状态空间问题, 引入on-the-fly技术解决状态爆炸问题。自1995年问世以来, 己经成功应用于实时控制器和通信协议的验证。UPPAAL用户界面包括系统编辑器, 模拟器和验证器。系统编辑器对验证模型创建分析的系统, 通过建模或设计语言来描述系统行为。模拟器对验证的模型进行检测, 提供错误列表。验证器搜索状态空间来检测时钟约束, 显示验证结果。

SPOT是由法国计算机与先进技术学院的研究开发实验室和巴黎六大计算机实验室联合开发的面向对象的模型检测库。SPOT是基于自动机理论的线性时序逻辑的模型检测技术, 使用的更精确的基于变迁的扩展的Büchi自动机描述线性时序逻辑, 生成的自动机更小, 并提供了模型检测技术的开发实验环境。

LTL3BA是捷克马萨里克大学信息学院Tomas Babiak在LTL2BA的基础上改进的线性时序逻辑到Büchi自动机转换工具。首先将线性时序逻辑转换成交替自动机, 再将交替自动机转换成基于变迁的扩展的Büchi自动机, 最后去扩展化得到Büchi自动机。

此外, 许多大型公司和研究机构也开发了很多模型检测工具。如用于对C语言开发的程序进行模型检测的工具:Microsoft公司开发的SLAM、伯克利大学开发的BLAST、卡耐基梅隆大学开发的CBMC、贝尔实验室开发的Verisoft等。用于对JAVA语言开发的程序进行模型检测的工具:美国国家航空航天局NASA开发的Java Path Find等。对并发系统进行模型检测的工具:Microsoft公司开发的m CRL2、英国帝国学院开发的LTSA等。

5 模型检测技术发展趋势

当前, 模型检测技术已经在工业界得到了广泛的应用, 成为一种广泛应用的自动验证技术。Intel研究中心副总裁Andrew Chien在对模型检测技术评价“Intel和整个计算机工业都从他们的贡献中直接获益”。Google搜索技术开发负责人阿兰·尤斯塔斯在介绍模型检测技术时提到“Google像其他同时代的技术公司一样, 很大一部分成功都来自于模型检测技术先驱们的研究贡献。”模型检测技术将在以下几个方面得到进一步发展。

(1) 硬件设计模型检测技术。系统模拟或现场测试是保证软硬件产品可靠性和正确性的传统方法。模拟和测试是对选定的输入数据集运行系统, 通过比较所产生的输出与预期值来判断系统是否会有错误。测试的主要局限性在于对给定数据集通过了测试并不能保证在实际运行中对其它输入不发生错误。模型检测不是针对某一组输入进行测试, 而是面向某类性质检查系统是否合乎规约。在系统不满足所要求的性质时, 模型检测算法会产生一个反例。模型检测技术适用于硬件方面的安全检测。

第一个在硬件方面进行模型检测的是美国卡内基梅隆大学在1985年的技术报告和理论计算机科学中提到运用时序逻辑自动层次化验证异步电路, 并发现了其中缺陷。1995年, Wing和Farahani验证了Andrew文件系统高速缓存的一致性协议。当前, Inter、SUN、Apple、IBM和SAMSUNG等大公司都使用模型检测的方法对硬件产品设计进行正确性验证。下一步, 硬件设计模型检测技术会得到更广泛的发展。

(2) 软件模型检测技术。软件系统的描述比硬件系统复杂, 软件由于涉及无穷数据域上的运算通常软件系统描述所包含的状态空间是无限的, 所以对软件的描述往往呈现出无穷状态。这是软件模型检测的主要难点, 直接验证比较困难[9]。但是许多软件系统并不涉及复杂的数值计算, 往往只用到线性实数约束等一些较简单的运算, 因此可以采用诸如线性约束求解等技术实现模型检测, 另外也可以利用偏序归约技术, 结合静态分析技术进行模型检测。针对软件领域中的程序的模型检测也是下一步重要的研究方向。

(3) 概率模型检测技术。由于模型检测的状态空间巨大, 对状态空间完全搜索需要消耗大量的时间, 甚至在有限的时间内无法完成搜索, 这限制了模型检的技术的应用。模型检测的定量分析技术, 即概率模型检测技术, 是在一个概率模型的基础上, 通过分析、模拟、数值计算得到期望的结果, 是基于概率的模型检测技术。利用离散马尔科夫链或连续马尔科夫链构造系统行为变化的概率空间, 在这个概率空间上搜索可能的执行路径, 以判断定量性质是否满足。概率模型检测技术既能遍历状态空间, 又能定量分析系统的性质, 在描述系统模型以及性质逻辑上与传统方法不同。

6 结束语

模型检测技术作为一种重要的形式化验证技术, 对其基本理论与实际应用的研究一直是形式化方法领域中研究热点之一。本文浅析了模型检测技术, 对模型检测发展概况、基本原理、算法以及模型检测工具等重要的理论成果进行分析, 简要介绍模型检测技术的最新发展技术。模型检测技术作为应对软硬件系统设计过程中的缺陷的最新技术, 必将在实际生产中得到更广泛的应用。

摘要:模型检测是一种能够自动验证有限状态并发系统技术。通过显式状态搜索来验证有限状态并发系统的模态与命题性质, 当前已被广泛应用于计算机软硬件系统安全性能的检测。本文浅析了模型检测技术, 分析了模型检测技术的发展概况、基本原理、算法、模型检测工具等, 并介绍了模型检测领域的最新进展。

关键词:形式化方法,模型检测,时序逻辑,安全检测

参考文献

[1]Clarke E M, Emerson E A.Design and synthesis of synchronization skeletons using branching time temporal logic.Springer Berlin Heidelberg, 1982.

[2]Queille J P, Sifakis J.Specification and verification of concurrent systems in CESAR.International Symposium on Programming.Springer Berlin Heidelberg, 1982:337-351.

[3]Vardi M Y, Wolper P.An automata-theoretic approach to automatic program verification.Proceedings of the First Symposium on Logic in Computer Science.IEEE Computer Society, 1986.

[4]Mc Millan K L.Symbolic model checking.Springer US, 1993.

[5]HENZINGER T A, NICOLLIN X, SIFAKIS J, et al.Symbolic model checking for real-time systems.Information and Computation, 1994, 111 (2) :193-244.

[6]ALUR R, DILL D L.A theory of timed automata.Journal of Theoretical Computer Science, 1994, 126 (2) :183-235.

[7]Clarke E.The Birth of Model Checking.In:Grumberg O, Veith H, (eds.) . (2008) .Proceedings of 25 Years of Model Checking.Springer Berlin/Heidelberg, 2008:1–26.

[8]Courcoubetis C, Vardi M, Wolper P, et al. (1992) .Memory-efficient algorithms for the verification of temporal properties.Formal Methods in System Design, 1992, 1:275–288.10.1007/BF00121128

[9]林惠民, 张文辉.模型检测:理论、方法与应用.电子学报, 2002, 30 (12) :1907-1912.

模型检测技术 篇2

建筑声学缩尺模型测试技术

摘要:建筑声学缩尺模型实验是国际上目前广泛应用的.厅堂音质设计的预测手段,也是建筑声学领域的一个重要研究方向.简要介绍了建筑声学缩尺模型的实验原理和发展历史,并结合实例详细介绍了现代建筑声学缩尺模型测试技术.作 者:孙海涛  作者单位:华南理工大学,亚热带建筑科学国家重点实验室,广东,广州,510640 期 刊:电声技术  ISTIC  Journal:AUDIO ENGINEERING 年,卷(期):, 34(8) 分类号:X827 TU112 关键词:缩尺模型    脉冲响应    音质设计    计算机仿真   

 

浅议三维模型技术的实践应用 篇3

关键词:贴图;模型;3D

1.引言

为适应社会发展和经济建设的需要,永嘉县于2013年便积极着力开展永嘉县基础地理空间框架建设,改项目的其中一项重要的工作就是数字永嘉三维建模及场景建设项目,具体是建立三维数据模型以便对规划审批进行辅助,而三维场景数据作为项目的重要组成部分,拟开展永嘉县主城区10平方公里的精细三维场景数据制作和20平方公里体块模型建设。

根据现有项目需求、生产工艺以及软件成果来设计,本次项目的成果主要包括三维模型数据[1]。三维模型数据包括几何数据、纹理数据和元数据。几何数据存储模型的三维结构,以Max格式存储。纹理数据是指模型表面纹理信息,根据不同的贴图类型使用不同的存储格式,不带Alpha通道的纹理以JPG格式(*.jpg)存储,带Alpha通道的纹理以PNG格式(*.png)或TGA格式(*.tga)存储,动画格式以GIF格式(*.gif)存储。元数据是对三维数据格式的描述,以XML格式(*.meta)存储。三维模型数据存储了三维模型的基本信息,每个地物存储在单独文件中。

2.已有资料情况及分析

项目实施的范围目前有较好现有测绘成果数据资料,主要有瓯北东2007年1:500数字地形图、瓯北西2012年1:500数字地形图、上塘2009年1:500数字地形图和影像数据等。1:500数字地形图数据是数字永嘉地理空间框架基础数据之一,该区域1:500数字地形图数据比较完整,精度高,其提取得到框架数据拟作为三维建模主要参照数据。

三维模型系统是利用GeoDatabase来对三维模型的空间输数据、属性数据、运行数据进行统一管理。GeoDatabase是Arc/Info8基础上引进的一种全新的空间数据模型,也就是建立在DBMS之上的统一、智能化的空间数据库。GeoDatabase主要是利用面向对象的方法,使得每个数据要素都具有独自的行为和属性,提高三维模型的真实性。

3.贴图的制作

3.1无缝底图的制作

通常情况下三维模型的平面底图为dwg或者shp,Viritualcampus系统采用永嘉县基础地理空间框架建设1:500的CAD平面图为底图,但是原始的二维平面图存在一些问题,需要对原始的二维平面图进行优化处理,才能为后期三维模型创建提供便利条件。基于C#程序语言的基础上,开发出用于读取AutodeskCAD软件中的构件信息,将读取的信息输出到指定信息表中,采用XML,xml属于一种标记语言,主要的作用承载数据,然后通过CSS进行显示。

底图是建筑的主体贴图,项目区域内所有的建筑阳台、门等特征都基于底图制作。所以,为了模型更加真实,底图的无缝性显得尤为重要。无缝底图的制作,要以实地采集的照片为基础,分析贴图纹理的循环性,及贴图的公用性,使用Photoshop等软件进行制作。

3.2同底纹贴图的制作

从采集的照片中裁切下阳台等结构,并移动至底纹图层上,进行底纹去除处理。将制作的所有贴图都放在同一画布上,分好图层,方便素材使用,确保贴图无缝对齐。

4.模型制作

4.1整理白模

以现有地形图为底图,直接依据封闭的底图线建立模型,同时将模型顶部、底部、和所有重叠的面删除,并焊接顶点,按轮廓检查,只有顶部和底部两个轮廓线。如图1。

4.2分析照片

對应白模分析照片,分析贴图纹理的循环性及贴图的共用性。

4.3模型分线

根据照片,对模型进行布线,保证裁切线裁切到所有的面。

4.4法线对齐

软件默认为是正北的世界坐标系,为方便建模操作,特使用法线对齐工具,对模型进行法线效正,暂时将单独模型临时修改为模型自己的独立坐标系。

4.5模型整体贴图

在三维建模的时候,为避免漏贴面,在对模型单独面进行贴图之前,先将整个模型贴一个常用的纯色贴图。

4.6分层建模

针对建筑楼层比较高的,建议分层制作,即如下图,贴图为2层一循环,故2层一制作,也不致于贴图的重复性太高。

每个面因实际情况不同,所以面的比例位置结构方向也会相应的有所区别,故要调整每个面的UV,如下图建筑的一个单独面进行调整。

按照CAD数据及照片数据,根据建筑规范,进行结构贴图表现,和结构实体建模,并按照上面的贴图方法,将每个面贴上贴图,如下图所示,蓝框中为结构实体建模,红框为结构贴图表现。

在轮廓的级别下,保持UV(保证线可循环的前提下),将Z轴坐标输入之前的11层的高度值,即可得到如下效果。

最后细化模型,将剩余屋顶结构制作完成。

5.问题及解决

5.1地形图的导入

5.1.1地形图导入出现的问题

地形图是根据各地情况,在现场所勘察采集的地面矢量地图,具有各自的空间地理信息,因此,各地的坐标各异,且离原坐标较远,坐标数值较大[2]。但是3DMax作为专业空间建模软件,并非专业的地理信息软件,因此,当地形图导入Max软件中,因误差原因容易产生图形变形的问题。

5.1.2地形图导入误差解决

从上面5.1.1地形图导入出现的问题中,已分析了地形图产生误差的原因是地形图的坐标数值太大,故此,为了避免底图变形产生误差,可以先将地形图在专业的地理空间软件中(如CAD)将整体地形图往原坐标进行偏移,统一设置一个偏移值,让地形图的坐标数值尽可能的小,最后再将底图导入3DMax软件中。如图5.1,在地形图上设置一个点,以此点位基准,将整个底图根据此点偏移到原点上。

结束语:地理空间框架是空间信息基础设施的重要组成部分,是经济社会信息化发展的基础平台。三维场景的建设适应社会经济发展的需要,也顺应了社会空间服务的需要。三维场景建设包含内容十分丰富,在某些方面专业性极强,是一项系统的工程,如果能够得到充分的应用,将带来良好的经济效益及社会效益。

参考文献

[1]李振,杨建鸣.机械三维建模教程[M].机械工业出版社,2011

[2]程鹏根.三维空间数据建模及算法. [M] .国防工业出版社,2012

模型检测技术 篇4

手球比赛技术表现的研究远远落后于足球、排球、篮球、棒球和冰球。随着科技的进步, 国外手球研究开始运用高科技设备对比赛录像进行分析, 但大部分研究仍停留在初级阶段, 只能探究相对表面的问题。在国内更是缺乏这方面的研究, 目前国内手球的研究只有单项技术统计、身体特征、负荷特征三大类, 还没对比赛进行综合性评价的研究, 影响对手球比赛制胜规律地的把握。本文从国外手球比赛表现的研究出发, 结合我国目前的研究现状, 运用模型分析探讨高水平手球比赛技术之间的联系, 客观地反映手球比赛技术表现的规律。

2 研究对象与方法

2.1 研究对象

本文的研究对象为2013年第十二届全运会男子手球比赛第二阶段的12场比赛的运动员, 对比赛中每个运动员 (不包含守门员) 的技术动作进行分类统计。研究对象具体情况如表1所示。

2.2 研究方法

2.2.1 录像分析法

用两个视频播放器同时播放一场比赛, 左右两个视频分别是比赛场地的左右半场, 对场上每个队员 (不包含守门员) 的每个技术动作进行分类采集。

2.2.2 数理统计法

运用EXCEL2007对比赛录像进行技术分类采集;运用SPSS16.0、LISREL8.0对假设模型进行信效度检验、探索性因子分析;运用和AMOS17.0对结构模型进行修正, 最终建立独立的技术路径模型。

3 手球比赛结构模型与分析

3.1 假设模型

图1是按手球比赛的行为顺序提出的假设模型。根据因子分析, 模型中部分指标系数低于0.5, 理应删除该部分指标。由于一旦删除该部分指标, 会造成技术缺失, 不能涵盖场上所有的技术动作。因此, 不对指标进行删除, 只对模型进行修正。

3.2 修正模型

经过修正的模型拟合度指标如下:X2/d=4.37、RMSEA=0.27、AGFI=0.92、NFI=0.91、CFI=0.92、AIC=240.0。各项拟合度显示, 修正后的结构模型具有良好的拟合优度, 模型可以用于手球比赛的研究。

3.3 模型分析

运用AMOS中CR值和CR的统计检验相伴概率p对模型进行路径系数/载荷系数的统计显著性检验。结果如表2所示。

当标准化系数越接近1时, 变量之间互为影响的关系越明显。当标准化系数大于1时, 变量之间不存在互为影响关系。

如表2所示, 有7项系数高于0.7, 表明这7项均具有明显的互为影响关系。有1项系数低于0.5, 表明该项的互为影响关系偏低。有2项系数大于1, 表明这两项均不存在互为影响关系。

表3反映了模型中变量之间的直接影响, 获得球仅与处理球有直接影响关系。比赛中, 获得球与处理球是相邻阶段, 理应存在直接的互为影响关系。进攻完成与获得球、处理球存在显著的直接影响, 与防守不存在直接影响, 原因是模型中的防守数据是源自本方, 因此, 本方的防守与本方的进攻不存在影响关系。此外, 表中其他变量之间的系数均反映了彼此的从属关系。换言之, 潜变量只与从属的观察变量存在直接影响关系, 与非从属的观察变量不存在直接影响关系。

表4反映了模型中变量之间的间接影响, 防守仅与获得球存在间接影响关系, 体现了比赛中防守可以促进球权的获得。进攻完成与获得球的间接影响关系较高, 说明比赛中有效地控制球权, 有助于进攻的完成。

助攻性传球仅与获得球有间接影响关系, 说明比赛中获得球技术能间接影响助攻性传球的质量。协防与封堵均与处理球具有较高的间接影响关系, 说明比赛中处理球技术的质量能减轻本方防守的压力。运球仅与获得球具有间接影响关系, 说明比赛中大量的控球会间接影响运球的技术的运用。得分和射门失误均与处理球具有较高的间接影响关系, 但在技术成功没得分一项中, 却与获得球间接影响关系较高, 本文认为, 导致这种情况的原因是得分与射门失误大部分出现在行进间, 而技术成功没得分大部分出现在原地。

4 技术路径模型与分析

比赛中各项技术并不是分离的, 是在同一场上不同环境中不断变化的串联。不同的技术串联产生的变化与影响也不一致。因此, 本文在结构模型的基础上, 建立独立的技术路径分析模型, 对比赛中各项技术进行更深入的分析。

4.1 手球比赛进攻路径分析

结构模型分析反映了手球比赛技术表现的总体情况, 路径模型分析反映了局部, 可以更深入了解技术之间的相互关系。图3仅对进攻技术建立的路劲模型, 对模型进行重新计算。结果表明, 在不考虑防守时, 获得球、处理球与进攻完成转化效率非常高, 最终转化成更多的得分。

如图4所示, 由于比赛中存在获得球以后直接产生进攻的情况, 因此本研究建立获得球与进攻完成的路径模型。获得球与进攻完成互为影响的关系高达0.92。结果表明, 快攻中获得球直接转化为进攻的效率很高, 原因是快攻环境中防守强度偏弱, 进攻效率提高。图中技术成功没得分与得分之间的影响关系很高也验证了这个结论, 反映了快攻中的射门是以多打少、以快打慢, 因此进攻成功率高达90%。

4.2 手球比赛快攻路径分析

4.3 手球比赛组织路径分析

图5所示, 影响系数为0.87。表明处理球与进攻完成之间存在显著的互为影响关系。由于比赛中大部分进攻是由处理球转化而来, 进攻的顺利完成提高了处理球的组织效率。

此外, 仅考虑处理球与进攻完成的互为影响关系时, 进攻完成主要表现为射门失误和得分。由于处理球转化为进攻大部分产生在阵地进攻中, 阵地进攻的防守强度较高, 体现了在这种环境中进攻的两个极端, 要么通过具有危险性的助攻性传球制造射门得分, 要么进攻受阻, 射门失败。

4.4 手球比赛防守路径分析

如图6所示, 影响系数大于1, 表明模型中防守与进攻完成不存在互为影响关系。由于模型中的防守数据是源自本方, 对手的防守在技术评价时作为背景融入到研究中, 因此模型中的防守不可能对本方的进攻产生影响关系。

4.5 手球比赛防守与获得球的路径分析

如图7所示, 影响系数达0.84。表明模型中防守与获得球存在显著的互为影响关系。表明在独立评价时, 同样存在互为影响的关系。比赛中加强防守的强度, 不断给对手施加压力, 造成对手失误增多, 使得本方更多地获得球权。反之, 当球队牢牢掌控球权时, 能较好地控制比赛节奏, 让对手陷入被动的比赛状态。

4.6 手球比赛防守与组织的路径分析

图8表明模型中防守与处理球不存在互为影响关系。路径系数大于1, 说明该模型在独立评价时不存在互为影响的关系, 由于比赛中处理球与本方的防守不存直接相关的关系, 因此该模型不存在互为影响关系。

5 结论

1.建立以进攻为核心的结构模型, 模型结果反映了获得球、处理器、防守三个阶段在比赛中与进攻完成存在显著性影响, 得出一切技术应围绕进攻展开的原则。

2.通过对比结构模型与进攻路径模型得出, 手球比赛的进攻效率偏低。

3.快速进攻是手球比赛中最有效的得分策略。

4.尽管处理球与进攻完成存在显著性影响, 但由于处理球普遍运用于阵地战中, 防守相对密集, 一般的处理球难以打破防守阵形, 导致大部分进攻都无功而返, 进攻成功率偏低。

5. 多人协防是手球比赛中最有效的防守策略。提高防守强度可以迫使攻方的失误率增加, 本方获得更多的控球机会, 达到控制比赛节奏的目的。

参考文献

[1]Thomas Kurz.SCIENCE OF SPORTS TRAINING—HOW TO PLAN AND CONTROL TRAINING FOR PEAK PERFORMANCE[M].Stadion Publishing Company, Inc.2011.

[2]Paul S.Bradley, William Sheldon, Blake Wooster.High-intensity running in English FA Premier League soccer matches[J].Journal of Sports Sciences.January 15 2009.

[3]KEN BRAY.HOW TO SCORE—SCIENCE AND THE BEAUTIFUL GAME[M].Granta Books London.2006.

[4]Christopher Carling, A.Mark Williams and Thomas P.Reilly.Handbook of Soccer Match Analysis[M].Routledge.2005.

模型检测技术 篇5

随着高等教育的发展,大学重组合并,组建综合性大学,推动着高等教育的发展。由于这些大学是多个学校合并而成,因此拥有多个校区,再加上校区的范围大,沟通联系非常不便。基于此,校园网络作为沟通传播、教育教学的手段被广泛应用于各大高校。但由于校园网的技术水平不高、设备落后,然而入侵技术不断升级,骇客入侵防不胜防,校园网络的安全问题日益严重。构建能够抵御入侵技术的校园网安全防御模型有着重要的现实意义。

1校园网络安全模型建设背景

1.1校园网络安全问题日益突出

当前校园网络的安全问题日益突出,主要有以下几方面:网络安全投入不足。许多学校将建设资金投入到教学设备的购置和其他方面,对网络安全方面的投入比较少,尤其是没有配置高端的安全设备,仅仅靠安装防御软件是不够的。网络管理混乱。学校的校区多,在学校各个校区均是各个自己进行网络管理,没有进行全校的统一管理和监控,上网用户能使用不同的身份进入校园网,使网络安全隐患极大。电子邮件管理不善。骇客入侵的重要手段就是通过电子邮件进行肉鸡、病毒的传播,用户通过下载、浏览电子邮件就会将携带的病毒、肉鸡植入电脑,骇客就能够进行远程网络入侵。但现在校园网邮件系统并没有进行系统的防护,对电子信件的过滤、防护手段非常落后,使得校园网安全受到威胁。网络病毒泛滥。当前随着网络犯罪技术的发展,各种垃圾信息和病毒充斥着网络,再加上网络本身的传播速度极快,使得病毒的传播更加泛滥,造成用户数据和资料的窃取、损失,但校园网络并没有对病毒进行有效的监控和防御。网络安全意识缺乏。由于网络技术兴起的时间较短,大多数学校领导和学生的网络安全意识薄弱,利用校园网访问各种网站,下载各种资源,使得无意中携带病毒带入网络,造成校园网被骇客入侵,造成大量损失。

1.2入侵技术不断升级

随着网络技术的不断进步,骇客入侵技术也得到升级。当前网络攻击和入侵的手段多种多样,从网络探测到病毒攻击、从电子欺骗和解码攻击等,骇客技术得到不断升级。通常骇客入侵的流程如图1:

1.3入侵检测技术落后

模型检测技术 篇6

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

关键词:邮件过滤;朴素贝叶斯;机器学习

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

关键词:邮件过滤;朴素贝叶斯;机器学习

摘要:针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能,采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法,为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法,在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围,从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.

技术扩散模型研究综述 篇7

当今社会科技进步是推动经济和社会发展的决定性力量, 在许多发达国家技术进步对GDP 的贡献举足轻重。然而, 高新技术对生产率的影响, 依赖于它在潜在采用者中扩散的速度和范围。因此只有新技术大规模地进行扩散, 在社会上得到广泛的应用, 整个国家和地区才能取得更大的经济效益。

从直接将技术扩散描述为技术在不同地点或使用者之间的转移, 到逐渐开始注重技术给新采纳者带来的经济效益和能力的提高, 对技术扩散的定义也处于逐步完善之中。本文根据我国技术创新理论专家傅家骥 (1998) 的观点, 认为技术扩散是一项技术从首次商业化应用, 经过大力推广、普遍采用阶段, 直至最后因落后而被淘汰的过程。

1 技术扩散模型

技术扩散理论和大量关于技术采用和扩散的实证研究都表明新技术的扩散过程可以用S型曲线来描述[1], 如图1中的曲线B。即已经采纳新技术的使用者占所有使用者的比例随时间的变化会呈现出S型曲线变化。许多技术扩散模型都用数理方法对新技术的这一扩散过程进行了定量描述, 下面将要介绍的传染病模型和概率模型就是典型的该类模型, 而另外几个模型则着重于对技术扩散的产生原理进行分析。

1.1 传染病模型

传染病模型假设限制扩散的主要因素是信息, 通过研究技术信息的传播来研究技术扩散的时间路径。Mansfield (1961) [2] 在他的“传染”学说中最早提出技术扩散是一种传染过程, 该学说认为技术创新在企业中的扩散过程是一个模仿过程, 采用技术创新的企业越多, 企业受到的影响就越大, 因而采用技术的可能性就越大。

传染病模型又可以分为外部影响模型、内部影响模型、混合信息源模型和两群体模型, 下面将逐一介绍。

(1) 外部影响模型。

假设一项新技术有n个潜在采纳者, 在某个时间点t有对应的y (t) 个公司采纳。从外部信息源开始传播的信息在某一个时点到达群体时, 可得到一个关于t的修正指数函数y (t) 。该结果源于假设仅存在系统外部信息源时, Lekvall和Wahlbin (1972) 提出的修正指数函数。图一刻画出了它的时间路径 (标记为A的曲线) , 从图中可以看出这一信息传播过程没有产生S型曲线。该模型将技术扩散完全归于系统的外部因素, 没有考虑系统中已经采纳新技术的用户对未采纳者的影响, 因此该模型被称为外部影响模型。该模型也是Mahajan (1985) 以及 Meade和Islam (1998) 对技术扩散理论进行综述研究的基本技术扩散模型之一。

为了进一步考察系统外部因素对扩散速度的影响, 张国方等人 (2002) 提出了基于网络环境的技术扩散机制, 指出网络环境下信息传递可以使扩散源与潜在使用者相互获取信息的途径增加, 速度加快, 成本降低, 从而有利于技术扩散的过程。邝国良等 (2006) [3]对外部因素对于技术扩散的影响做了更具体化的研究。他利用技术扩散过程与hotelling价格竞争模型原理的相似性, 将产业集群环境下的技术扩散简化到一维空间, 即将两企业间技术差距抽象成线段上二者的距离。其结论认为新技术潜在用户对技术的需求取决于物化技术的引进成本, 而他们对该成本的敏感度又决定于缩小单位内涵技术差距的支出。由于该模型仅考虑了新技术本身对于潜在用户的影响, 忽略了技术扩散过程中潜在用户之间的信息交流, 因此仍是典型的外部影响模型。

(2) 内部影响模型。

假设在技术传播过程中, 主要的信息来源是过去的使用者。现在每个使用者和一个非使用者独立联系的概率为β, 如果现在的使用者数量为y (t) , 那么与目前的非使用者之一发生联系的概率为βy (t) , 最终可得到一个y (t) 关于t的逻辑斯蒂函数 (logistic function) , 图一也描述了它的时间路径 (标记为B的曲线) 。其中, β值越小, 传播越慢。与上面讨论的外部影响模型不同, 内部影响模型的图形随时间呈S型曲线逐渐增长, 直到到达一个可计算出的峰值, 随后下降。由于该模型假定技术的扩散完全是由用户群内部的信息传播而推动, 系统外部因素对于技术扩散过程没有影响, 该模型因此被称为内部影响模型。

项建云等 (2007) [4] 将逻辑斯蒂函数进行线性变换, 以RP技术设备的历年售出台数为历史数据, 对该技术的扩散过程进行拟合, 得到一条S型技术扩散曲线。由于当前时段位于S型曲线的“起飞点”之前, 他认为该技术目前仍处在孕育期, 还有快速发展的空间。但他没有提供设定设备饱和数量为10万台的任何依据, 因此该推导过程有失严密。除了系统内企业之间的信息传播以外, 还有各种关于内部影响的扩展模型, 赵绪福 (1996) 结合考虑企业内部竞争性因素, 认为技术扩散速度除了与采用者占潜在采用总数的比例有关以外, 还与新技术的所需投资大小、采用新技术的盈利性有关, 并由此提出一个单技术模型, 同样得到逻辑斯蒂模型的形式。

(3) 混合信息源模型。

混合信息源模型即著名的Bass模型。在该模型中, 非使用者受到两种信息来源的影响, 即内部影响与外部影响。用σ表示外部信息源的相对强度:当σ=1时, 不会发生内部信息扩散;而当σ=0时, 外部信息源不会传播。在一般情况下, 当σ值较小时, 其时间路径将类似逻辑斯蒂曲线, 而当σ逐渐增长时, 传染点下降, 逐渐退化成修正指数函数, 则时间路径不再呈S型特征。

许多学者将Bass模型的基本假设加以扩展并进行理论与实证研究。苏津津 (1999) 认为影响技术扩散速度的主要因素是新技术的调整费用、新技术采用的盈利水平以及新技术的采用比例。其实证结果对应的图型为S型曲线, 其中用户接受外部信息而自发采用新技术的可能性决定了扩散曲线开始上升的位置, 消费者受已采用者影响而采用新技术的可能性决定了上升的幅度。李敏等 (2007) [5]以义乌无缝技术的扩散实例为依据, 证明了该技术是在内外影响的两种作用下得到扩散的。其中外部影响主要有供应商的推动作用和广告的影响, 而内部影响则指的是该产业集群内部社会人际网络间的联系和沟通。他对于实际观测曲线与模型的拟合结果之间存在差异的解释是:依据的模型是基于传播网络为完全图的情况, 但现实世界中的技术扩散传播网络十分复杂, 与其有较大差异。但是, 他对于无缝设备饱和数量的设定同样没有经过严格的证明, 且对于如何应用复杂网络来修正该混合信息源模型也没有提出具体思路。

(4) 两群体模型。

前述模型所基于的假设是信息在个体之间无障碍的流动, 这只有在应用于同质人群时才是合理的。当人群为异质时, 个体之间的差异能阻碍联系的过程。两群体模型则是这方面的一个延伸。首先假设有两个相互不发生作用的群体, 它们各自以一定速度开始内部扩散过程, 再将该假设扩展到两群体相互作用的情况, 即其中一个群体的使用者可以将技术信息以某速率传递到另一群体的非使用者, 从而得出新的使用者增量结果, 累计传播路径是这两群体的S曲线的垂直叠加, 扩散的总速度将取决于群体内扩散速率和群体间扩散速率的加权平均。

对于两群体模型, 也有许多学者运用不同的扩展模型进行了分析。罗荣桂等 (2006) [6]研究了不同企业群之间的技术扩散速率不相同时的技术扩散的情况。如果非常好的替代技术已经出现, 则替代技术接受率将大于系统内部技术扩散的成功率, 当其它企业群对其扩散的成功率大于企业破产率, 原技术扩散的现象将仍然存在。另外, 韩瑞珠等 (2002) 从技术扩散的稳定性的角度, 来考察传染病模型下异质群体的技术扩散机制, 认为在技术传播中两类群体在互动中的扩散现象的变化规律取决于内增长率。在前者的基础上, 曾志刚等人 (2003) 进行了一定的扩充, 考虑技术扩散在两类群体中, 既存在同一群体之中的传播又存在不同群体之间的传播这一扩散现象。建立了与上文同类的模型, 通过考察模型的指数稳定性, 来考察技术扩散的稳定状态。

上述传染病模型致力于解释在某个时点已经采纳新技术的企业的比例, 演绎了同一群体内的企业通过信息的扩散相互影响的过程。该过程既强调了企业之间的信息传递, 也考虑了技术本身对企业收益预期的影响。

1.2 概率模型

该模型是分析个体所做出的技术采纳决策的一种方法, 它所依据的基本假设是公司在生产规模等方面的差异会影响技术采纳的预期收益, 公司会出于自身利润最大化的考虑, 作出采纳还是不采纳的决策。Jensen (1982) 和McCardle (1985) [7]认为如果企业预期的收益水平高于采用新技术的成本, 那么企业就会引进新技术。由此可见对于概率模型的运用是以企业对于自身收益的角度进行考虑, 以理性假设来预测企业的技术决策。

康凯 (2002) 提出企业综合质量的概念, 即指环境属性和企业属性的综合, 以测度企业吸纳新技术的综合支撑能力。由此得到的技术扩散率曲线随时间变化呈S形, 与一般结论一致。另外, 潜在用户与扩散源的质量“距离”越大, 其采用的概率越小, 而时间一定时, 同一综合质量差水平上各企业的采用概率相同。

概率模型目前尚不能揭示出个体之间发生技术扩散的过程, 但它可以根据企业自身相关变量的差异揭示出哪些是早期的新技术采纳者而哪些是落后者。

1.3 信息阶梯模型

前面有关技术扩散的文献实际上都是在研究技术扩散过程呈S型曲线发展规律的原理, 而信息阶梯模型则有助于解释某些新技术没有成功得到扩散的原因。假设新技术的两种形式A和B同时出现在市场上并对现有技术产生威胁。并且没有人确切知道A与B谁更优, 或是否优于现有技术。Soete等 (1984) 认为只要企业间技术进步的速率存在差异, 那么其中一项技术的优势就会得到持续的强化, 并不断扩大市场份额。也就是说后来的采纳者只是做了与早期采纳者同样的选择, 因为一个企业的技术引进行为将提高其他企业对新技术收益率的预期 (Vettas, 1998) [8], 这个过程被称为“信息阶梯”。网络的外部性的存在能加强这些影响。不管A内在价值如何, 仅仅由于有较大的基数, 在一段时间后, 就可能比B更具有吸引力。

对于新技术的竞争取决于哪些因素, 研究者们观点不一, 但大部分集中于对网络的外部性的讨论上。刘建宁 (2005) [9]考察了广告对于一项技术占领市场的作用。利用双技术扩散模型, 研究者认为在企业的广告宣传力度不大、扩散和传播渠道不多时, 技术先进性达到一定程度就会对其最终占领市场起到决定性的作用, 谁先掌握了先进技术就掌握了市场的主动权。也就是某项技术比其竞争技术具有明显优势, 使技术选择在早期就消除了不确定性。

信息阶梯模型将影响扩散过程的信息归于网络外部性, 这些信息基本上都是外生于模型的。两项相互竞争的技术除非有明显优劣差异, 否则谁将在开始时点被选择将归结于外部因素, 这样就忽略了新技术本身的特征及其与扩散过程的联系。

1.4 技术扩散场模型

如同前面的传染病模型, 还有一些研究者也引进了一些机制相似的其他学科思想来考察技术扩散过程。段利忠等人 (2003) [10]借用场的概念, 提出技术扩散场的思想。当场源的技术水平较高时, 只要技术水平落后于场源的技术来源体处于这个扩散场中, 就会通过技术扩散受到场源技术的作用。技术扩散源对技术吸收体产生作用的方向由扩散源指向吸收体。将技术扩散场的社会环境和资源环境和技术扩散场的技术转移率都抽象成技术的“空间距离”, 进而证明了该扩散场是一个有势场, 由此产生技术扩散场的强度和扩散动力, 即相当于电场概念中的“电场强度”和“电场力”。用这种方法将技术扩散解释为技术有从较高“技术势”向低“技术势”传递的趋势, 并且将扩散范围内的企业的内在资源因素和外在环境因素都考虑在内, 在结构和内容上都比较全面。

另外, 王金营 (2000) 运用技术扩散场的思想, 充分肯定了人力资本在技术扩散中的作用。由于创新源的技术势高于潜在采用者, 因此在它们之间存在着技术势差。新技术潜在采用者的技术原始积累水平越高, 人力资本存量越大, 那么他就越容易学习、消化和吸收创新技术, 率先得到技术势的提高, 逐步缩小它与创新源之间的势差。

可以看出, 技术扩散场模型与传染病模型一样, 着眼于用企业之间的内在联系和信息传递来解释技术扩散, 只是前者是基于“场”的理论, 而后者是基于传染蔓延的机制。

1.5 元胞自动机演化模型

随着信息技术的发展, 计算机仿真模型也逐渐应用于技术扩散理论的研究。该方法的基本思想是通过模拟个体的行为和互动, 通过计算机模拟最终得到演化结果。其中元胞自动机 (Cellular Automata, CA) 的应用最为广泛。该模型基本结构包括:代表基本个体单位的元胞, 元胞邻域内一维或多维方向上的邻居, 包含该元胞各种可能状态的状态向量, 以及规定元胞在几种状态之间变化规律的局部规则等。其演化过程即模拟元胞在t+1时刻的状态, 该状态由局部规则、元胞自身及其邻居在t时刻的状态来决定。Bhargava (1993) 模型是技术扩散领域最早出现的CA模型, 此外较早的还有Boccara和Fuks (1998) 的一维CA模型, 模拟出的结果为S型扩散曲线, 且左右邻居个数越多采纳者比例上升越快。Goldenberg 和Efroni (2001) 建立了一个二维的CA模型, 可以比一维网格更为形象地表示现实个体之间形成的关系网。

国内学者祝数金等 (2006) [11]采用元胞自动机演化模型来模拟技术扩散过程, 结果表明, 企业的吸收能力为0时, 长期的技术扩散不会发生, 均衡状态的技术创新率趋近于0, 从而说明企业内部的吸收能力对于企业创新乃至整个经济系统的技术扩散有不可忽视的作用, 这与实证研究的结果是一致的。该研究表明技术扩散对于创新的非线性作用, 而且体现了吸收能力的提高对于经济系统的创新同样具有复杂的非线性效应。

2 问题及展望

在扩散源与接收方的技术水平差异方面, 上述模型的提出者都从微观角度证明了技术扩散的双方技术差异过大将抑制技术的成功扩散, 因为此时接收方不具备吸收该项技术的能力。但技术要得到扩散, 双方必须还是要存在一定差异, 即“技术势差”。还有学者 (夏万军, 2007;王再文, 2008) [12]根据计量经济学和新古典模型从区域部门之间技术扩散的宏观角度同样证明了这一结论。如此一来, 双方的技术水平差距在多大范围内将最有利于技术扩散?对于新技术潜在用户来说, 与技术源的技术水平差异多大时才最适于引进该技术?对于这些问题还需要有更完善的分析模型来进行探讨。

另外, 以往的技术扩散理论研究往往忽视了技术信息的获取成本, 因此, 技术信息的提供和获取方面的研究将会成为未来研究的一个重点。随着不完全信息和风险等概念的引入, 将来的研究会倾向于对不完全信息条件下技术扩散的市场结构、企业行为和相应的社会效率进行研究。

对于技术扩散的模型研究, 过去的实证研究总是倾向于利用不同数据集来对同一个模型进行评估, 将来可能更侧重于对各种各样的技术扩散模型进行效果比较研究, 即将不同的模型应用于同一个给定的数据集。同时, 应用博弈论对技术扩散中的企业是否利用新技术的决策行为进行分析, 将会成为未来技术扩散理论模型研究的一个重要方面。总之, 随着经济理论的发展, 新的数学方法的应用, 新的挑战和机会的出现, 在理论和实践方面都需要对技术扩散进行更加深入细致的研究。

参考文献

[1]MAHAJAN V, WIND Y.Innovation diffusion models of new productacceptance:A reexamination[M]//In Mahajanand V.Wind Y. (eds.) :Innovation Diffusion Models of New Product Acceptance, Ballinger Cambridge, Massachusetts, 1986:3-25.

[2]MANSFIELD E.Technology change and the rate of imitation[J].E-conometrics, 1961 (29) :741-765.

[3]邝国良, 林晓湧, 万莉.基于Hotelling价格竞争模型的产业集群技术扩散研究[J].科技管理研究, 2006 (11) :203-206.

[4]项建云, 葛茂忠, 徐人平.基于创新扩散理论的RP技术扩散模型分析[J].机械设计与制造, 2007 (2) :149-151.

[5]李敏, 杨建梅, 欧瑞秋.Bass模型在无缝技术扩散中的应用及新发现[J].科技管理研究, 2007 (7) :33-36.

[6]罗荣桂, 江涛.基于SIR传染病模型的技术扩散模型的研究[J].管理工程学报, 2006 (1) :32-35.

[7]McCARDLE K.Information Acquisition and the Adoption of NewTechnology[J].Management Science, 1985 (21) :1372-1389.

[8]VETTAS K.Demand and Supply in NewMarkets:Diffusion with Bi-lateral Learning[J].Rand Journal of Economics, 1998 (29) :215-233.

[9]刘建宁, 邹礼瑞.基于盈利和相互影响的技术扩散模型研究[J].科技进步与对策, 2005 (11) :105-107.

[10]段利忠, 刘思峰.技术扩散场技术扩散状态模型的理论研究[J].北京工业大学学报, 2003, 6 (29) :251-256.

[11]祝数金, 赖明勇, 聂普炎.基于元胞自动机的技术扩散和吸收能力问题研究[J].系统工程理论与实践, 2006 (8) :63-69.

技术分析价值模型研究 篇8

技术分析是一门古老而又崭新的学问。查尔斯·道 (Charles Dow) 于20世纪初在华尔街日报上撰写的一系列社论标志着技术分析的诞生, 至今已有超过百年的历史。虽然技术分析在金融实业界得到了广泛的关注和应用, 但是金融学术界却较少关注它, 原因在于技术分析的基本理念——价格的可预测性——与现代金融理论的两大基石之一的有效市场假说是背道而驰的。然而随着越来越多的学者通过实证研究发现支持技术分析有效的证据, 以及为技术分析提供理论支持的各种理论模型的出现, 技术分析更多地进入了金融学者的视野。

在技术分析理论基础模型中, 有一类模型通过建立由基本面分析者和技术分析者构成的市场, 进而研究各类市场参与者对市场价格动态行为的影响。这些文献以Beja和Goldman (1980) 、Schmidt (1999, 2000, 2002) 以及Caginalp和Balenovich (2003) 为代表。

本文在上述文献建模思想的基础上, 建立了一个包含基本面分析者、技术分析者与噪音交易者的市场, 设定了各个市场参与者的需求函数以及价格动态规则, 并在模型框架内推导出价格动态行为的解析形式以及对应的参数约束条件。此外, 本文在模型框架内以解析推导的方式 (非数值解) 研究了基本面分析者与技术分析者各自的投资收益率变化的规律, 发现在一定条件下, 基本面分析者收益率严格为正, 而技术分析者收益率可正可负, 并且基本面分析者规模与基本面分析者收益率正相关, 与技术分析者收益率负相关, 从而从一个角度揭示了技术分析具有价值的内在原因。虽然建模思想一致, 但是本文所建立的模型与已有文献中的模型结构有所不同, 模型具有良好的数学形式和丰富的经济含义, 以严格的数学推导替代已有模型中的数值分析, 并分析了已有模型中未曾讨论的但具有重要意义的问题。

1 模型

1.1 市场参与者

假设市场中有一种股票和三类交易者:基本面分析者、技术分析者和噪音交易者。

基本面分析者通过研究股票的基本面信息确定其内含价值, 并根据市场价格与内含价值的相对关系决定自己的买卖策略。当基本面分析者发现股票的市场价格低于 (高于) 其内含价值时, 他就决定买进 (卖出) 股票。基本面分析者的存在使得股票价格在偏离其基本面价值时, 有向基本面价值回归的趋势。

技术分析者采用趋势跟随策略。也就是说, 当前期股票价格上涨 (下跌) 时, 技术分析者就会买进 (卖出) 。本模型关于技术分析者特点的设定既符合技术分析手册的假设, 也与已有技术分析理论基础模型研究的文献相一致。

噪音交易者没有特定的买入或卖出需求, 他们充当市场的流动性提供者, 消化基本面分析者和技术分析者形成的超额需求或超额供给。噪音交易者是供求均衡所必需的市场参与者。

1.2 需求函数

假设基本面分析者具有一致的信念, 他们认定的基于基本面信息的股票内含价值为P* (t) 。同时假设市场价格为P (t) 。基本面分析者根据上期市场价格P (t-1) 与本期内含价值P* (t) 的相对关系确定本期的买卖策略, 而技术分析者根据上期价格与上上期价格的变化趋势来确定本期的买卖策略。

假设基本面分析者和技术分析者在t期的净需求分别为

DF (t) =NF* (P* (t) -P (t-1) ) (1)

DT (t) =NT* (P (t-1) -P (t-2) ) (2)

其中, NF≥0, NT≥0,

NF和NT表示基本面分析者和技术分析者的相对数量关系, NF越大, 表示市场中基本面分析者越占主导地位;反之NT越大, 表示市场中技术分析者越占主导地位。

基本面分析者需求函数DF (t) 的定义的含义是, 基本面分析者是市场价格的稳定剂。市场价格向下 (向上) 偏离股票内含价值的幅度越大, 基本面分析者形成的净需求 (供给) 就越大, 从而使价格回复到内含价值水平的推动力也就越大。

技术分析者需求函数DT (t) 的定义的含义是, 技术分析者完全是趋势跟随者。前期市场价格上涨 (下跌) 幅度越大, 技术分析者形成的净需求 (供给) 就越大。因此技术分析者的行为会使价格按照已有趋势进一步发展下去, 如果价格处于上升 (下降) 趋势中, 技术分析者的交易将使得价格进一步上升 (下降) 。

基本面分析者与技术分析者的共同作用将会使得价格运动呈现振荡走势, 这一点将在后文中给予详细分析。

最后我们定义总的净需求

Dex (t) =DF (t) +DT (t) (3)

1.3 价格动态方程

参照已有文献, 假设价格的变化与净需求呈线性关系, 即

P (t) =P (t-1) +Dex (t) (4)

在通常的模型设定中, Dex (t) 前会有一个系数, 在我们的模型中, 这个系数已经消化在NF和NT中, 因此无需再引入一个额外的参数。

至此, 我们构建了一个价格动态系统, 其中P* (t) , NF, NF为外生参数。

2 模型性质推导和经济含义分析

2.1 价格动态分析

为简化起见, 本文只讨论内含价值为常数的情形, 令P* (t) =P*。

令f (t) =P (t) -P*, 则

f (t) = (1-NF+NT) f (t-1) -NFf (t-2) (5)

利用特征方程求解通项可得, 当NT>1时, f (t) 是发散的;当0

NT代表技术分析者的相对数量。由前面的模型推导我们可以看出, 当技术分析者相对数量较大时 (NT>1) , 他们的行为会加剧股价原有的趋势。尽管基本面分析者的存在使得价格还有向内含价值靠拢的动力, 但是技术分析者强劲的推动力使得股价不断发散。当技术分析者相对数量较小时 (NT<1) , 尽管他们的行为会给股价带来振荡, 但是在基本面分析者的努力之下, 价格将不断向内含价值靠拢, 直至收敛。当技术分析者相对数量处于中间位置时 (NT=1) , 技术分析者加剧股价原有趋势的力量与基本面分析者使价格向内含价值靠拢的力量旗鼓相当, 此时股价依然围绕内含价值振荡运动, 但是既不发散也不收敛, 而是永远振荡下去。

2.2 投资收益率比较

在本小节中, 我们考察基本面分析者和技术分析者各自的投资收益率, 比较两种交易者谁的收益率更高, 谁的投资策略更有效。为简化起见, 我们只考虑NT=1, 即永续振荡型股价运动的情况。

定义r (t) = (P (t) -P (t-1) ) /P (t-1) 。

投资者从t-1时刻到 时刻的收益率取决于其在t-1时刻建仓的方向, 也就是说, 如果投资者在t-1时刻买入的话, 那么他从t-1时刻到t时刻的收益率就等于r (t) ;相反如果投资者在t-1时刻卖出的话, 那么他从t-1时刻到t时刻的收益率就等于-r (t) , 因此我们定义:

rF (t) =r (t) *sign (P*-P (t-2) ) (6)

rT (t) =r (t) *sign (P (t-2) -P (t-3) ) (7)

其中, sign是符号函数。

定义基本面分析者和技术分析者的加权平均收益率分别为:

undefined

下面我们首先分别讨论基本面分析者和技术分析者各自的收益率情况, 然后将二者进行比较。

(1) 基本面分析者收益率分析

可以证明undefinedF关于NF是单调不减的。

当NF→0时, undefinedF→0,

当NF=1时, undefined

由此我们得到结论:

基本面分析者的加权平均收益率与基本面分析者的规模呈正相关关系。基本面分析者规模越大, 他们就越可以主导市场, 其投资收益率也就越高;反之, 基本面分析者规模越小, 他们就越受制于市场中的其他交易者 (技术分析者) , 其投资收益率也就越低。另一个重要的结论是, 由于基本面分析者是掌握信息的群体, 因此他们的加权平均收益率总是大于零的。

(2) 技术分析者收益率分析

undefined

从上式我们马上可以发现, 当undefined时, undefined;当undefined时, undefined;当undefined时, undefined。

由此我们得到结论:

技术分析者是盈利还是亏损取决于基本面分析者的实力。当基本面分析者实力不够强大时undefined, 技术分析者的加权平均收益率大于零, 技术分析者可以获得盈利;当基本面分析者的实力处于中等水平时undefined, 技术分析者的加权平均收益率等于零, 技术分析者不赔不赚;当基本面分析者实力足够强大时undefined, 技术分析者的加权平均收益率小于零, 技术分析者是亏损的。

之所以出现技术分析者既可能盈利也可能亏损的情况, 内在原因在于技术分析者与基本面分析者不同, 他们只是根据历史价格信息作出投资决策, 而没有像基本面分析者那样研究股票的内含价值。因此技术分析者是否能够获得盈利要取决于他们能否主导市场。当基本面分析者规模较小时, 技术分析者就可以相对地主导市场, 而获得正的收益;相反, 当基本面分析者规模很大时, 技术分析者就将面临亏损的境地。

我们继而考察undefinedT关于NF的单调性。

经过推导, 我们可以得到结论:

当f (1) /f (2) ∈ (3/5, 5/3) 时, undefinedT在在 (0, 1]单调减;当f (1) /f (2) ∈ (3/5, 5/3) 时, undefinedT在 (0.1864, 1]单调减, 在 (0, 0.1864]单调性不定。因此在大多数情况下, 技术分析者的加权平均收益率与基本面分析者的规模呈负相关关系。

(3) 基本面分析者与技术分析者收益率比较

可以证明, 当NF∈ (0, 1]时, undefined为单调减函数, 当NF=0.449时, undefined。

由此我们得到结论:

当基本面分析者规模在某一水平之下时 (NF<0.449) , 技术分析者的收益率大于基本面分析者, 当基本面分析者规模在某一水平之上时 (NF>0.449) , 技术分析者的收益率小于基本面分析者。

3 总结

在本文的模型中, 我们可以得到以下几点主要结论:

第一, 技术分析者对于市场的作用是加剧股价波动, 而基本面分析者对于市场的作用是使价格回归到其应该处于的位置。

第二, 在永续振荡型股价运动模型中, 基本面分析者的加权平均收益率与基本面分析者的规模呈正相关关系, 技术分析者的加权平均收益率与技术分析者的规模呈负相关关系。基本面分析者的加权平均收益率总是大于零的, 技术分析者是盈利还是亏损取决于基本面分析者的实力。

第三, 在永续振荡型股价运动模型中, 当基本面分析者规模在某一水平之下时, 技术分析者的收益率大于基本面分析者, 当基本面分析者规模在某一水平之上时, 技术分析者的收益率小于基本面分析者。

总之, 本文的模型在已有文献建模思想的基础上, 建立了一个描述技术分析价值的确定性模型。模型所有结论均可以由公式推导得出, 并且具有直观的经济含义, 模型解析性质良好并且富于经济含义。模型关于基本面分析者与技术分析者投资收益率的分析是以前模型都没有探讨过的, 具有一定的创新性。

参考文献

[1] Beja, A and Goldman, M B. On the Dynamic Behavior of Prices in Disequilibrium [J], The Journal of Finance, 1980, Vol. 35, No. 2, 235-248.

[2] Schmidt, A B. Modeling the Demand-price Relations in a High-frequency Foreign Exchange Market [J], Physica A, 1999, Vol. 271, No. 3-4, 507-514.

[3]Schmidt, AB.Modelingthe Birth of a Liquid Market[J], Physi-ca A, 2000, Vol.283, No.3-4, 479-485.

压铸模型芯加工技术研究 篇9

压铸模型芯模具生产的制品所表现出来的高效率、低耗能、高一致性、高精度和高复杂程度, 是其它任何加工制造方法所不及的。压铸模型芯模具作为特殊终形与近似终形最有效的、最好的成形方法, 它有较好的经济指标和制造效益, 因此这也使许多的压铸件在工业制造行业得了非常广泛的应用, 从而促使了它的快速发展。

一、当前我国压铸模型芯的发展现状

随着现代制造技术的快速发展和现代建设的需求, 工程设备、家用轿车、电子仪器、家用电器等许多产品都涉及到压铸件, 因此压铸模型芯制造质量的高低直接决定着我国工业发展的快慢程度, 目前世界各国都在不断地开发压铸模型芯模具的新型材料。通常压铸模型芯金属材料主要有:锌合金、镁合金、铜合金和钢铁等四大类, 除此之外如DIEVARADC3H13等高性能材料也正在被广泛地使用。而加工压铸模型芯的机床主要有KURA-KI、OKUMA、FIDIA, 还包括五轴立卧高速五轴钻铣等其它高级数控机床, 从而使其变得更加符合当代生产要求, 造福于人类。随着制造技术的不断发展, 材料的表面处理技术也被重视起来, 通过改进其强硬化热处理新工艺和表面强化处理新技术来改善材料的使用性能, 另外在压铸模型芯加工的机床选择和改善方面也有较明显的进步。

二、压铸模型芯加工技术要求及其影响因素

1. 压铸模型芯加工技术要求

通常所有模具的型芯以及型腔结构往往都是由各种自由的曲面和不规则的形面所组成的, 因此对于具有型芯的产品加工, 适合用数控机床上来进行各种加工。压铸模型芯作为现阶段的比较常见且有极为重要的加工产品, 自然对其加工技术有着较高的要求: (1) 型芯的尺寸精度要高; (2) 要具有较好的互换性能; (3) 要具有比较好的脱模性能; (4) 型芯的材料要耐热疲劳和导热性及其它性能。

2. 影响压铸模型芯加工质量的因素

由于压铸模型芯自身结构的独特和使用环境的特殊, 因此对其加工质量的影响因素主要有: (1) 加工材料的性能没有达到设计要求, 加工时出现问题; (2) 加工方法选择的不够合理, 最终达不到理论设计要求; (3) 加工环境对其质量有非常大方的影响, 高温时会使压铸模型芯材料的性能发生巨大的变化, 使其失去了原有的性能要求; (4) 在加工时机床的设备精度也会对其尺寸精度有着较大的影响。

三、现阶段国内压铸模型芯加工技术存在的问题

压铸模型芯模具工作时与高温的液态金属接触, 这易使压铸模型芯腔长时间受热, 同时也会承受着很高的压力, 而且还会受到压铸模型芯腔内部反复受到加热和冷却以及金属液流的高速冲刷, 进而产生磨损和腐蚀。然而在现阶段许多生产者却轻视了铸模型芯加工技术事项, 其主要表现在: (1) 压铸模型芯材料选择不够合理, 很多的压铸模设计制造研究人员未能针对各种不同的型芯进行不同的分析, 致使在选择加工材料时不能很好的满足使用性能的要求。 (2) 型芯热处理和表面处理不够恰当, 通常压铸模型芯表面的热处理和强硬化处理对其使用性能有较好的强化作用, 但是目前许多厂家为了追求个人利益却忽视了它的加工处理, 缩减了它的使用寿命。 (3) 型芯加工技术方法的选取和分析不够准确, 许多加工设计者对其加工技术总是一概而论, 缺少系统合理的总结分析, 胡乱的进行型芯加工。 (4) 型芯压铸过程所受冲击力计算不够准确, 当前许多的设计计算都只是基于理论条件下的计算, 缺少实际生产经验的参数计算, 最终达不到相应的要求。

四、改善影响加工质量的有效措施

针对这些问题必须要有合理的解决方法才可以使其变得满足加工质量要求, 目前解决这些问题的主要措施有:

(1) 在压铸模型芯加工材料方面进行准确的控制, 要合理的选择合理的、优质的、高性能的工具钢。要做到对于不同的型腔加工必须要用不同的材料。另外在选择材料时要根据型芯使用功能和材料的基本性能两方面来进行分析、比较选取。

(2) 型芯热处理和表面处理是一项非常重要的工序, 因此在进行型芯热处理的时候要准确无误地将硬度控制在46HRC左右, 不可太硬, 太硬容易脆断, 但也不可以太软, 太软难以达到使用要求。

(3) 对于型芯加工技术选取和分析要准确无误。通常在压铸模型芯的加工过程中, 前端角不能太利, 通常倒角为R0.25左右, 型芯的根部也不能有利角。另外在其比较容易折断或是应力集中易断裂的地方要有合理的改善, 可先通过绘图软件模拟后在进行加工处理。 (4) 在进行型芯压铸过程受冲击力计算时, 要充分的将理论和实践经验结合起来考虑, 以保证所得结果是符合实际生产要求的, 这样才可以保证设计的型芯能够得到高质量的型芯, 延长其使用寿命。

结束语

近些年来我国压铸模具行业结构调整取得了很大的成绩, 正在向着合理化的发展方向发展。另外由于压铸型芯特殊性能的要求, 新型压铸材料也得到了广泛的研究与发展, 也取得了显著的进步, 同时也在提高压铸型芯质量和缩压铸型芯设计加工制造周期等方面做出了贡献。更重要的是对它的完善不仅具有理论扩展意义, 逐步促使我国工业技术快速向国际化和标准化方向发展。

参考文献

[1]汪晶;压铸模型芯加工技术[J];模具制造, 2012年11期.

[2]张明;压力铸造过程数值仿真分析及应用研究[D];天津大学, 2012年.

CAD模型检索技术研究 篇10

在三维CAD模型检索过程中, 主要是寻找与目标模型最为相似的源模型。因为使用了不同的检索方法, 所以寻找目标模型所花费的时间也就不同。最终的检索效率也就不一样。目前, 寻找高效与快速的检索方法仍然是一个技术难点。关于CAD模型检索, 学术界已经提出了许多不同的方法。三维CAD模型检索方法可以分为两种:全局检索方法和局部检索方法。图1给出了三维CAD模型的检索过程。在输入目标模型的几何信息与结构信息后, 选取不同的检索方法, 可以从CAD模型库中找到所需要的模型。

1全局检索方法

在全局检索方法中, 检索的是整体模型。在检索过程中, 主要利用了CAD模型的整体特征。通常, 使用特征邻接图来描述CAD模型, 并提取模型的特征。属性化特征邻接图能够反映出每一个CAD模型的几何特征和拓扑特征。全局检索方法的性能主要依赖于CAD模型库的规模。从大规模CAD模型库中, 可以有更多的机会来选取与已知CAD模型相似的目标模型。在CAD模型的整体搜索过程中, 通过模型整体形状特征的比较, 可以计算出形状特征之间的相似程度。这种方法会导致搜索过程的计算复杂度较高, 同时, 也将引发搜索效率下降[2]。CAD模型的全局检索方法的特点是:准确度和精度都比较高。在全局搜索过程中, 需要保存大量的CAD模型的集合特征和结构特征。因此, 信息量较大, 搜索效率也比较低, 很难在短时间内找到所需要的目标模型。

2局部检索方法

与三维CAD模型的全局检索不同, 局部检索的对象不再是整个模型, 而是其中的某一部分。目前, 局部检索方法是三维CAD模型检索领域中的一个重点研究问题。先使用边界表示B-rep (Boundary representation) 方法来构建CAD模型。B-rep表示能够反映出CAD模型的拓扑信息和几何信息。从三维CAD模型的B-rep表示中, 提取模型的局部几何特征或局部结构特征。利用CAD模型的局部信息进行检索, 无需考虑实现细节。因此, 能够准确地找到较为相似的目标模型。对于那些还不明确设计细节的用户而言, 他们希望能够以更为简洁的方法来查找完整的模型, 从而可以启发其设计过程。高效灵活的三维CAD模型局部检索方法, 能够满足CAD领域的检索需求[3]。三维CAD模型局部匹配的过程如图2所示。

CAD模型局部检索方法的优点是:能够利用模型的局部特征, 快速地从CAD模型库中寻找所需要的目标模型。减少提取CAD模型全局特征的工作量, 同时提高了CAD模型检索效率, 加速了设计进程。

摘要:简要介绍了CAD (Computer Aided Design) 模型检索的发展状况, 研究了CAD模型检索的具体分类, 探索了全局检索方法和局部检索方法。

关键词:CAD模型,全局检索方法,局部检索方法

参考文献

[1]张开兴, 张树生, 刘贤喜.三维CAD模型检索技术研究现状与发展分析[J].农业机械学报, 2013, 44 (7) :256-263.

[2]陶松桥.面向设计的三维CAD模型搜索技术研究[D].武汉:华中科技大学, 2012 (博士学位论文) .

模型检测技术 篇11

摘要:针对当前城市道路行程时间的预测多限于单源数据且预测精度不高的问题,构建了基于浮动车GPS数据、微波检测器交通数据的行程时间预测融合模型.利用遗传算法优化小波神经网络,解决了小波神经网络初始参数选取时盲目与随机性问题,大大提高了网络搜索效率与训练速度.预测行程时间与视频观测数据吻合良好,表明该模型是有效的和可靠的.

关键词:数据融合;行程时间;预测模型;小波神经网络;遗传算法

中图分类号:U121 文献标识码:A

在交通运营与管理中,高效的出行信息与路径诱导系统将发挥越来越重要的作用[1].行程时间作为其中的关键参数,能够为交通状态估计和城市路网拥堵情况的发布提供数据参考[2].同时,行程时间是衡量路段通行效率和延误的重要依据,是反映路段交通状态的直接指标,在智能交通系统中有着广泛应用[3].目前,行程时间的预测研究大都局限于单一交通数据源,由于单源交通数据受采集仪器的精度、采集方法、样本量、人为误差等影响,因而预测精度不稳定.而多源交通数据的融合,可以弥补单源数据的诸多不足,提高预测精度.本文提出利用GPS浮动车数据与微波检测器交通数据进行融合,建立行程时间数据融合模型.

目前,数据融合方法主要有以下几种[4]:加权平均法、卡尔曼滤波、Bayes方法、统计决策理论、选举决策法、模糊集理论、神经网络等.其中,神经网络具有较强的学习能力,其内部结构本质上是并行的,与数据融合的结构一致,因此具有较大的优势.

本文拟采用小波神经网络建立数据融合预测模型,同BP神经网络相比,小波神经网络具有更强的信息提取、非线性逼近和容错能力[5],但它存在初始参数随机选取的盲目性、易形成局部极小值而得不到整体最优值等问题[6].遗传算法可以用来优化小波神经网络的初始网络参数,弥补小波神经网络自身的不足.遗传算法与神经网络的有机结合[7],将其用于数据融合可以提高模型的收敛速度与泛化能力.

3)视频数据

视频数据调查时,将两台摄像机分别置于实验路段起迄点,同时开始拍摄.调查后同时在计算机上播放两测点的录像,从起点视频中记下车型、车牌、外廓、颜色等特征及车辆通过起点断面的时间,然后在终点视频中寻找该车,并同时记录车辆通过终点断面的播放时间,前后时间差即为该车通过调查路段的行程时间.

1.2数据的时空匹配及方法

1)时间匹配

本文采集的出租车GPS数据、微波数据及视频数据虽是同一天的交通流数据,但微波检测与视频数据采集的是早晚高峰时间段内的数据,而出租车GPS数据都是全天候的交通流数据,所以有必要依据微波与视频数据的调查时间挑选出对应时段的出租车GPS数据,这样多源数据反映的就是同一时间段的交通流信息.由于每条GPS数据记录都有接收的时间,通过excel筛选可以很方便进行时间匹配.

2)空间匹配

空间匹配是指多源交通流数据必须反映的是同一地点的交通流信息,这样进行融合才有意义.空间匹配原则是以视频与微波数据的采集现场来筛选相应道路的出租车GPS数据.首先确定视频与微波数据的采集路段的经纬度范围,如图1所示,然后用excel筛选出与采集路段相匹配的出租车GPS数据.

从图5中可以看出,GPS出租车得到的行程时间与视频观测值相比偏低,误差超过了目标阈值15%的范围.原因在于出租车频繁超车,车速高于路段车流.而微波检测器得到的行程时间大于视频观测值,误差超过15%的范围.究其原因在于实验路段大客车、大货车较多,遮挡了车流中部分小汽车,造成小汽车数据漏检.而融合后的行程时间与视频观测数据吻合性良好,误差在8%以内,满足目标阈值15%的要求.相比GPS出租车数据或微波检测器数据,融合后的行程时间在准确度和稳定性方面都有了很大提高.

4结语

本文提出了基于交通数据融合技术的行程时间预测模型,弥补了单源交通数据预测行程时间精度不高的缺陷.利用遗传算法优化小波神经网络的权值、平移因子、伸缩因子,解决了小波神经网络初始参数选取时盲目与随机性问题,大大提高了小波神经网络搜索效率与训练速度.融合后的行程时间与视频观测数据吻合性良好,表明行程时间预测的数据融合模型是有效可靠的.

参考文献

[1]邹亮,徐建闽,朱玲湘,等.基于浮动车移动检测与感应线圈融合技术的行程时间估计模型[J].公路交通科技,2007,24(6):114-117.

[2]聂庆慧,夏井新,张韦华.基于多源ITS数据的行程时间预测体系框架及核心技术[J].东南大学学报:自然科学版,2011,41(1):199-204.

[3]徐天东,孙立军,郝媛.城市快速路实时交通状态估计和行程时间预测[J].同济大学学报:自然科学版,2008,36(10):253-260.

[4]石章松.目标跟踪与数据融合理论及方法[M].北京:国防工业出版社,2010.

[5]张冬至,胡国清.基于遗传优化小波神经网络逆模型的油水测量[J].光学精密仪器,2011,19(7):183-189.

[6]宋清昆,王建双,王慕坤.基于遗传算法的小波神经网络控制器设计[J].电机与控制学报,2010,14(4):102-108.

[7]周昌能,余雪丽.基于BP网络的权值更新快速收敛算法[J].计算机应用,2006,26(8):1940-1942.

[8]王楠,李成文,李岩.基于神经网络的数据融合方法[J].光机电信息,2010,27(3):36-39.

[9]宗刚,刘文芝,张超,等.基于家庭决策的出行方式选择非集计模型[J].湖南大学学报:自然科学版,2013,40(4):100-103.

[10]巩敦卫.交互式遗传算法原理及其应用[M]. 北京:国防工业出版社,2007.

[11]SRINIVAS M,PATNAIK L M. Adaptive probabilities of crossover and mutation in genetic algorithms[J]. IEEE,1994,24(4):656-657.

[12]HOLM P, TOMICH D, SLOBODEN J, et al. Traffic analysis toolbox volum IV: guidelines for applying CORSIM, microsimulation modeling software[M]. Washington D C: Federal Highway Administration, 2007:117-216.

摘要:针对当前城市道路行程时间的预测多限于单源数据且预测精度不高的问题,构建了基于浮动车GPS数据、微波检测器交通数据的行程时间预测融合模型.利用遗传算法优化小波神经网络,解决了小波神经网络初始参数选取时盲目与随机性问题,大大提高了网络搜索效率与训练速度.预测行程时间与视频观测数据吻合良好,表明该模型是有效的和可靠的.

关键词:数据融合;行程时间;预测模型;小波神经网络;遗传算法

中图分类号:U121 文献标识码:A

在交通运营与管理中,高效的出行信息与路径诱导系统将发挥越来越重要的作用[1].行程时间作为其中的关键参数,能够为交通状态估计和城市路网拥堵情况的发布提供数据参考[2].同时,行程时间是衡量路段通行效率和延误的重要依据,是反映路段交通状态的直接指标,在智能交通系统中有着广泛应用[3].目前,行程时间的预测研究大都局限于单一交通数据源,由于单源交通数据受采集仪器的精度、采集方法、样本量、人为误差等影响,因而预测精度不稳定.而多源交通数据的融合,可以弥补单源数据的诸多不足,提高预测精度.本文提出利用GPS浮动车数据与微波检测器交通数据进行融合,建立行程时间数据融合模型.

目前,数据融合方法主要有以下几种[4]:加权平均法、卡尔曼滤波、Bayes方法、统计决策理论、选举决策法、模糊集理论、神经网络等.其中,神经网络具有较强的学习能力,其内部结构本质上是并行的,与数据融合的结构一致,因此具有较大的优势.

本文拟采用小波神经网络建立数据融合预测模型,同BP神经网络相比,小波神经网络具有更强的信息提取、非线性逼近和容错能力[5],但它存在初始参数随机选取的盲目性、易形成局部极小值而得不到整体最优值等问题[6].遗传算法可以用来优化小波神经网络的初始网络参数,弥补小波神经网络自身的不足.遗传算法与神经网络的有机结合[7],将其用于数据融合可以提高模型的收敛速度与泛化能力.

3)视频数据

视频数据调查时,将两台摄像机分别置于实验路段起迄点,同时开始拍摄.调查后同时在计算机上播放两测点的录像,从起点视频中记下车型、车牌、外廓、颜色等特征及车辆通过起点断面的时间,然后在终点视频中寻找该车,并同时记录车辆通过终点断面的播放时间,前后时间差即为该车通过调查路段的行程时间.

1.2数据的时空匹配及方法

1)时间匹配

本文采集的出租车GPS数据、微波数据及视频数据虽是同一天的交通流数据,但微波检测与视频数据采集的是早晚高峰时间段内的数据,而出租车GPS数据都是全天候的交通流数据,所以有必要依据微波与视频数据的调查时间挑选出对应时段的出租车GPS数据,这样多源数据反映的就是同一时间段的交通流信息.由于每条GPS数据记录都有接收的时间,通过excel筛选可以很方便进行时间匹配.

2)空间匹配

空间匹配是指多源交通流数据必须反映的是同一地点的交通流信息,这样进行融合才有意义.空间匹配原则是以视频与微波数据的采集现场来筛选相应道路的出租车GPS数据.首先确定视频与微波数据的采集路段的经纬度范围,如图1所示,然后用excel筛选出与采集路段相匹配的出租车GPS数据.

从图5中可以看出,GPS出租车得到的行程时间与视频观测值相比偏低,误差超过了目标阈值15%的范围.原因在于出租车频繁超车,车速高于路段车流.而微波检测器得到的行程时间大于视频观测值,误差超过15%的范围.究其原因在于实验路段大客车、大货车较多,遮挡了车流中部分小汽车,造成小汽车数据漏检.而融合后的行程时间与视频观测数据吻合性良好,误差在8%以内,满足目标阈值15%的要求.相比GPS出租车数据或微波检测器数据,融合后的行程时间在准确度和稳定性方面都有了很大提高.

4结语

本文提出了基于交通数据融合技术的行程时间预测模型,弥补了单源交通数据预测行程时间精度不高的缺陷.利用遗传算法优化小波神经网络的权值、平移因子、伸缩因子,解决了小波神经网络初始参数选取时盲目与随机性问题,大大提高了小波神经网络搜索效率与训练速度.融合后的行程时间与视频观测数据吻合性良好,表明行程时间预测的数据融合模型是有效可靠的.

参考文献

[1]邹亮,徐建闽,朱玲湘,等.基于浮动车移动检测与感应线圈融合技术的行程时间估计模型[J].公路交通科技,2007,24(6):114-117.

[2]聂庆慧,夏井新,张韦华.基于多源ITS数据的行程时间预测体系框架及核心技术[J].东南大学学报:自然科学版,2011,41(1):199-204.

[3]徐天东,孙立军,郝媛.城市快速路实时交通状态估计和行程时间预测[J].同济大学学报:自然科学版,2008,36(10):253-260.

[4]石章松.目标跟踪与数据融合理论及方法[M].北京:国防工业出版社,2010.

[5]张冬至,胡国清.基于遗传优化小波神经网络逆模型的油水测量[J].光学精密仪器,2011,19(7):183-189.

[6]宋清昆,王建双,王慕坤.基于遗传算法的小波神经网络控制器设计[J].电机与控制学报,2010,14(4):102-108.

[7]周昌能,余雪丽.基于BP网络的权值更新快速收敛算法[J].计算机应用,2006,26(8):1940-1942.

[8]王楠,李成文,李岩.基于神经网络的数据融合方法[J].光机电信息,2010,27(3):36-39.

[9]宗刚,刘文芝,张超,等.基于家庭决策的出行方式选择非集计模型[J].湖南大学学报:自然科学版,2013,40(4):100-103.

[10]巩敦卫.交互式遗传算法原理及其应用[M]. 北京:国防工业出版社,2007.

[11]SRINIVAS M,PATNAIK L M. Adaptive probabilities of crossover and mutation in genetic algorithms[J]. IEEE,1994,24(4):656-657.

[12]HOLM P, TOMICH D, SLOBODEN J, et al. Traffic analysis toolbox volum IV: guidelines for applying CORSIM, microsimulation modeling software[M]. Washington D C: Federal Highway Administration, 2007:117-216.

摘要:针对当前城市道路行程时间的预测多限于单源数据且预测精度不高的问题,构建了基于浮动车GPS数据、微波检测器交通数据的行程时间预测融合模型.利用遗传算法优化小波神经网络,解决了小波神经网络初始参数选取时盲目与随机性问题,大大提高了网络搜索效率与训练速度.预测行程时间与视频观测数据吻合良好,表明该模型是有效的和可靠的.

关键词:数据融合;行程时间;预测模型;小波神经网络;遗传算法

中图分类号:U121 文献标识码:A

在交通运营与管理中,高效的出行信息与路径诱导系统将发挥越来越重要的作用[1].行程时间作为其中的关键参数,能够为交通状态估计和城市路网拥堵情况的发布提供数据参考[2].同时,行程时间是衡量路段通行效率和延误的重要依据,是反映路段交通状态的直接指标,在智能交通系统中有着广泛应用[3].目前,行程时间的预测研究大都局限于单一交通数据源,由于单源交通数据受采集仪器的精度、采集方法、样本量、人为误差等影响,因而预测精度不稳定.而多源交通数据的融合,可以弥补单源数据的诸多不足,提高预测精度.本文提出利用GPS浮动车数据与微波检测器交通数据进行融合,建立行程时间数据融合模型.

目前,数据融合方法主要有以下几种[4]:加权平均法、卡尔曼滤波、Bayes方法、统计决策理论、选举决策法、模糊集理论、神经网络等.其中,神经网络具有较强的学习能力,其内部结构本质上是并行的,与数据融合的结构一致,因此具有较大的优势.

本文拟采用小波神经网络建立数据融合预测模型,同BP神经网络相比,小波神经网络具有更强的信息提取、非线性逼近和容错能力[5],但它存在初始参数随机选取的盲目性、易形成局部极小值而得不到整体最优值等问题[6].遗传算法可以用来优化小波神经网络的初始网络参数,弥补小波神经网络自身的不足.遗传算法与神经网络的有机结合[7],将其用于数据融合可以提高模型的收敛速度与泛化能力.

3)视频数据

视频数据调查时,将两台摄像机分别置于实验路段起迄点,同时开始拍摄.调查后同时在计算机上播放两测点的录像,从起点视频中记下车型、车牌、外廓、颜色等特征及车辆通过起点断面的时间,然后在终点视频中寻找该车,并同时记录车辆通过终点断面的播放时间,前后时间差即为该车通过调查路段的行程时间.

1.2数据的时空匹配及方法

1)时间匹配

本文采集的出租车GPS数据、微波数据及视频数据虽是同一天的交通流数据,但微波检测与视频数据采集的是早晚高峰时间段内的数据,而出租车GPS数据都是全天候的交通流数据,所以有必要依据微波与视频数据的调查时间挑选出对应时段的出租车GPS数据,这样多源数据反映的就是同一时间段的交通流信息.由于每条GPS数据记录都有接收的时间,通过excel筛选可以很方便进行时间匹配.

2)空间匹配

空间匹配是指多源交通流数据必须反映的是同一地点的交通流信息,这样进行融合才有意义.空间匹配原则是以视频与微波数据的采集现场来筛选相应道路的出租车GPS数据.首先确定视频与微波数据的采集路段的经纬度范围,如图1所示,然后用excel筛选出与采集路段相匹配的出租车GPS数据.

从图5中可以看出,GPS出租车得到的行程时间与视频观测值相比偏低,误差超过了目标阈值15%的范围.原因在于出租车频繁超车,车速高于路段车流.而微波检测器得到的行程时间大于视频观测值,误差超过15%的范围.究其原因在于实验路段大客车、大货车较多,遮挡了车流中部分小汽车,造成小汽车数据漏检.而融合后的行程时间与视频观测数据吻合性良好,误差在8%以内,满足目标阈值15%的要求.相比GPS出租车数据或微波检测器数据,融合后的行程时间在准确度和稳定性方面都有了很大提高.

4结语

本文提出了基于交通数据融合技术的行程时间预测模型,弥补了单源交通数据预测行程时间精度不高的缺陷.利用遗传算法优化小波神经网络的权值、平移因子、伸缩因子,解决了小波神经网络初始参数选取时盲目与随机性问题,大大提高了小波神经网络搜索效率与训练速度.融合后的行程时间与视频观测数据吻合性良好,表明行程时间预测的数据融合模型是有效可靠的.

参考文献

[1]邹亮,徐建闽,朱玲湘,等.基于浮动车移动检测与感应线圈融合技术的行程时间估计模型[J].公路交通科技,2007,24(6):114-117.

[2]聂庆慧,夏井新,张韦华.基于多源ITS数据的行程时间预测体系框架及核心技术[J].东南大学学报:自然科学版,2011,41(1):199-204.

[3]徐天东,孙立军,郝媛.城市快速路实时交通状态估计和行程时间预测[J].同济大学学报:自然科学版,2008,36(10):253-260.

[4]石章松.目标跟踪与数据融合理论及方法[M].北京:国防工业出版社,2010.

[5]张冬至,胡国清.基于遗传优化小波神经网络逆模型的油水测量[J].光学精密仪器,2011,19(7):183-189.

[6]宋清昆,王建双,王慕坤.基于遗传算法的小波神经网络控制器设计[J].电机与控制学报,2010,14(4):102-108.

[7]周昌能,余雪丽.基于BP网络的权值更新快速收敛算法[J].计算机应用,2006,26(8):1940-1942.

[8]王楠,李成文,李岩.基于神经网络的数据融合方法[J].光机电信息,2010,27(3):36-39.

[9]宗刚,刘文芝,张超,等.基于家庭决策的出行方式选择非集计模型[J].湖南大学学报:自然科学版,2013,40(4):100-103.

[10]巩敦卫.交互式遗传算法原理及其应用[M]. 北京:国防工业出版社,2007.

[11]SRINIVAS M,PATNAIK L M. Adaptive probabilities of crossover and mutation in genetic algorithms[J]. IEEE,1994,24(4):656-657.

模型检测技术 篇12

关键词检测(Keyword Spotting,KWS)技术是语音识别领域中一个重要的研究方向,也是多年一直备受关注的研究热点问题。一般来说,在说话人的自然语言中除了包含一些关键性词汇外,还可能包括一些非话语的咳嗽声、呼吸声、关门声、音乐声和背景噪声等。在说话人的连续语音中检测出关键性的词汇,这就是关键词检测技术[1]。相对于孤立词识别系统和大词汇量的识别系统,关键词检测系统既精确,计算量又小,而且对于实际的语音数据有较大的弹性,因此在监听、命令控制、语音拨号、通信、对话系统等方面都有着很好应用前景,尤其是实现人机交互[2]。例如,当一个残疾人想要开关电视或者关门,他只需要对着系统说出关键词“开电视”、“关门”即可,这样的系统会使他们的生活变得更加轻松、自如。

关键词检测重点之一就是代表非关键词语音的模型,无论采用任何方法检测关键词,都要建立相应的填料模型。本文就这点提出了一种新的有效的基于词表树结构的填料模型。实验结果显示,与传统的基于音节格和音节聚类的填料模型相比,在降低虚报率的同时,系统的检测率有了很大的提高。

1填料模型

关键词检测是在非受限语音信号中,检测出词表中所包含的“关键词”,拒绝词表外的“非关键词”,对语音内容加以理解,这里的关键词词汇表可以根据系统所应用的领域来确定。设已知一个观察值序列O=o1,o2,…,oT,判断其中是否存在一个关键词M,其HMM模型所包含的状态为{q1,…,qN},KWS即为把O用一条含有M的路径来描述所得的匹配问题,这里定义如下方法计算在语音中存在关键词M的评分S(M|O),即

式(1)中,b*为关键词在语音中的最佳起始点;e*为最佳结束点;Q*为与之相对应的关键词M的最佳状态序列,即在判断是否存在关键词M时,首先在语音中找到与该关键词最匹配的语音段,然后用该关键词在该语音段上经长度归正后的后验概率值作为评分来判断关键词的存在与否。b*、e*和Q*可按式(2)求得

若起始点b*和结束点e*已知,可用Viterbi算法求出最佳状态链Q*={qb,…,qe}。因此若穷举所有可能的起始点b和结束点e,并根据上述式子必然可求出S(M|O),根据S(M|O))的值来判断是否存在关键词M。

当然,用穷举的方法来求取起始点b和结束点e计算量非常大,在实际使用中是根本无法实现的。因此往往采用在一次搜索过程的同时确定b*、e*和Q*,即在观察序列O上通过引入填料状态qG定义关键词的扩充模型^M。它所包含的状态为{qG,qb,…,qe,qG},用填料状态qG表示非关键词语音。使用扩充模型在整个观察序列上用Viterbi算法进行搜索,可以得到对应O的最佳状态序列:

根据这一状态序列可以同时确定b*、e*和Q*。这里的填料状态就是由建立填料模型得到的。可见填料模型的建立对于区分关键词和非关键词语音是不可缺少的。

2置信度与联合得分

对于连续HMM模型来说,一般采用高斯混合密度来表示状态输出函数。假设有一段输入语音O,对其进行关键词检测。在搜索过程中,第t帧特征ot在状态i时的得分γi(ot)为输出概率密度li(ot),即:

式(3)中ξik是状态i的第k个混合高斯分布Pik[ot]的权重系数,Pik[ot]由下式计算得到

Mik,∑ik分别为该高斯分布的均值向量和协方差矩阵[3]。

为了更有效地对非关键词语音进行拒识,在计算关键词得分时引入了基于特征矢量信息的声学置信度得分,那么搜索得到的最佳路径将是输出概率和置信度分数联合得分最高的检测结果序列[4]。

式(5)中CMi(ot)为第t帧特征ot在第i个状态的置信度分数,w1,w2分别为输出概率和置信度分数的权重。

该置信度的计算方法是结合算术平均值、几何平均值与泛声平均值的综合平均算法得到的一个平滑的门限技术。通过设定适当的权重,计算出似然得分和置信度得分的综合得分,即可在关键词c的正确检出率和非关键词的正确拒识率之间得到满足系统性能要求的平衡。

3基于词表树结构的填料模型

对于任何关键词检测系统而言,检测的基础都是基于词的,检测的结果也都是一个词的序列,当然这个词可能是单音节的,也可能是多音节的。所有关键词和非关键词可以集合形成一个关键词汇表和非关键词汇表,在检测过程中,对语音的检测解码即是对词的反复搜索。所以,对于词的组织方式对检测时间和效果有着至关重要的作用。把常见的非关键词按照其相应的汉语音节声母的结构组织建立一个词表树,并通过训练分别对其建模,形成基于词表树结构的填料模型。

一般来说,在说话人的连续语音中除了一些关键性的词汇外还包括许多词表外词,例如:“请找一下王宇?”,“张晓刚在吗?”,那么,对于一个基于人名查询的关键词检测系统来讲,“王宇”和“张晓刚”是关键词,“请、找、一、下、在、吗”这六个词都属于词表外词,即非关键词语音,而对于这六个词所对应的拼音依次为qing,zhao,yi,xia,zai,ma,可以对其建模形成词表树。若假设对其中三个词“在、找、请”建立一个树型结构,形成的词表树结构如图1所示。其中,V1代表词zai,V2代表词zhao,V3代表词qing。汉语由21个声母和38个韵母组成约400个左右的无调音节,而针对关键词检测系统所应用领域的不同,在说话者的自然连续输入语音中所常见的非关键词是有限的,也是可以预测的,所以可以对这些常见的词表外词建立相应的填料模型。本文所涉及的基于人名的关键词检测系统是应用在查询控制方面的,常见的非关键词语音有qing,zhao,yi,xia,zai,ma,ni,hao,wo,xiang,wen,等等,对这些非关键词表建立相应的填料模型,在搜索查询时会按照树状结构先找出其所在的分支,找到相应结点后,再依次找出下一个结点,以此类推,直到叶子结点结束。

4实验和讨论

4.1实验平台

该关键词检测系统应用方向是面向人机交互的人名查询系统,检测对象6个不同人名,包括:“王宇”、“李丽”、“张晓刚”、“杨旸”、“赵建伟”、“宋艳娇”。检测基元对于关键词采用基于关键词本身的建模,对于非关键词则采用基于词表树结构的填料模型。本文所采用的语音数据库是自行训练采集的,该数据库是专门录制的,包含6个不同人名的数据库。

实验采用开发工具Matlab7.0软件作为编程和测试平台。参与训练的共有10人,其中男性5人,女性5人,年龄分布在20岁到30岁之间,由这10人分别说6个不同的人名,来训练6个关键词的HMM模型,其中,每个关键词都录制10个训练样本。“请、找、在、吗、我、想”等非关键词语音共录制20个样本,作为填料模型的训练语料。选取6人针对每个关键词录制一句包含关键词的句子作为测试数据。数据库录制的是采样率为11 025 Hz,16位量化和单声道的语音信号。

对于训练样本要加汉明窗,帧长为15 ms,帧移为10 ms,在进行特征提取时,每帧语音信号提取12维LPCC和MFCC参数和它们的二阶差分系数12维,分别组成24维的特征参数。检测系统的识别基元使用无跨越从左向右的连续CHMM模型,每个CHMM有5个输出状态,每个状态有128个高斯分量,经过迭代得出关键词模型、填料模型和静音模型。对于关键词模型采用以关键词为识别基元,形成的语法网络图由关键词模型、20个填料模型和一个静音模型构成,其结构如图2所示。图中的Keyword1~KeywordP代表P(P值为6)个关键词模型,Filler1~FillerL代表L(L值为20)个填料模型。

对输入的测试语音信号先通过一个带通滤波器进行三层小波变换,再求其Teager能量,经过取模、平滑,转换到时域,从而将连续语音中的浊音段提取出,进而将浊音段与清音划分为一个音节,实现音节的切分。

在进行关键词检测时,对输入语音按填料模型、关键词模型的顺序进行匹配,计算匹配得分。与填料模型匹配时,要按照词表树结构搜索,有效减少匹配时间。在与填料模型匹配时计算每个匹配的得分,直到得分低于某个阈值,说明当前的语音是非填料语音,此时就应与每个关键词模型逐个进行匹配,并结合联合多种声学置信度信息得到第t帧特征在每个状态的置信度,从而对非关键词语音进行有效拒识,得出最终的检测结果。

4.2测试结果

以数据库中6个人录制的数据作为测试数据,每个测试语音为(3~5) s。对于基于音节聚类的填料模型有9个(见表1),包括代表声母的两个模型H1和H2和代表韵母的7个模型(Ha、Hou、He、Hiv、Han、Houe、Hin)。

对于基于音节格的填料模型有20个,本文中基于词表树结构的填料模型也有20个,测试对于不同类型和数量的填料模型在不同的虚报率下系统的检测率和检测时间如表2所示。表中的PD代表检测率,FAR代表虚报率(平均每个关键词在一小时内被虚报的次数),Av.comp.Time代表平均检测每个输入语音所需的时间。

从表1中可以看到,就时间来看差值在(1~2) s,这是正常的,毕竟音节聚类只有9个填料模型,而音节格和词表树结构有20个填料模型,这个时间差也是可以接受的;最重要的是检测率,基于音节格的填料模型在虚报率数量为7时检测率为0.80,而基于词表树结构的填料模型在虚报率数量为5检测率为0.89,综合来看,基于词表树结构的填料模型在整体性能上占有较大的优势。

5结论

本文针对关键词检测系统中填料模型的结构和类型进行了研究,实现了基于词表树结构填料模型的创建方法。在检测过程中采用新的算法计算置信度得分与似然得分的联合值得出平均得分,对关键词与非关键词进行了有效的确认。与传统的基于音节聚类和音节格的填料模型相比,对于不同的虚报率关键词的检测率有了很大的提高。从实验结果中也可以看到,虽然检测率相对来讲有了提高,但是只达到了0.89,所以对于填料模型的结构还有待更深入细致的研究。

参考文献

[1]韩纪庆,张磊,郑铁然.语音信号处理.北京:清华大学出版社,2006

[2]李星星.基于HMM的汉语语音关键词检测研究与实现.[硕士学位论文].武汉:武汉理工大学信号与信息处理专业,2009

[3]刘聪,胡郁,戴礼荣,等.一种针对区分性训练的受限线性搜索优化算法.模式识别与人工只能,2010;23(4):167—171

上一篇:事业单位的内部审计下一篇:听觉艺术