先验信息

2024-09-18

先验信息（精选9篇）

先验信息篇1

摘要：基于静息态功能磁共振图像 (fMRI) 的脑功能区分割广泛采用K均值聚类和谱聚类等无监督聚类算法。但这些算法对图像噪声较为敏感, 可能会产生不可靠的脑区分割结果。文中提出了一种融合先验信息的半监督聚类算法, 可以可靠地确定各子区间的边界, 从而得到稳定的分割结果。提出的方法对人类右侧大脑的Broca区 (BA44/45区) 进行分割验证, 实验结果表明, 文中的方法不仅得到了可靠的功能子区边界, 而且获得了较高的个体间一致性。

关键词：半监督聚类,脑区分割,功能磁共振图像,功能连接

目前, 关于脑功能图像分割的研究主要存在以下几个问题: (1) 功能磁共振图像 (f MRI) 信号信噪比较低, 需寻求一种更鲁棒的算法可以最大程度上消除噪声对分割结果的影响; (2) 被广泛用于脑区分割的标准割算法[1,2]对于构建功能相似度矩阵较为敏感, 需选择一种更合适的相似性度量得到更可靠的分割结果; (3) 由于脑功能子区的定义并没有“金标准”, 所以对于采用算法得到的脑区分割结果如何去验证其合理性还有待研究。

由于f MRI信号的信噪比较差, 目前基于静息态f MRI的脑区分割算法都存在一些问题, 特别是广泛用于脑区分割的谱聚类算法, 非常依赖于相似度矩阵的定义, 直接根据功能连接或功能连接模式进行聚类, 会使得噪声对其影响更为明显, 分割结果会存在离散点。为得到连续的分割结果, 研究者采用了加空间约束的相似性矩阵[3], 而基于空间约束的相似性矩阵进行脑区分割是存在问题的。这是由于f MRI的信噪比较低, 从而降低了原始数据的可分性, 而加入过强的空间限制后便会破坏其内在的连接模式。

考虑到这些算法的不稳定性以及对噪声的敏感性, 文中提出了一种融合先验信息的半监督聚类算法, 利用脑区已经存在的细胞构筑、结构或功能等信息来确定部分可靠的分类初始点, 然后采用半监督聚类算法对脑区进行功能子区划分, 这样在先验信息的指导下抑制噪声对分割结果的影响, 从而得到更可靠的功能子区边界, 获得更稳定的分割结果。

1 基于图论的半监督聚类算法

半监督学习是近年来模式识别和机器学习领域研究的重点课题, 是介于监督学习与无监督学习之间的一种学习技术, 它主要考虑如何利用少量的标记样本和大量的未标记样本进行学习和分类的问题[4,5,6]。半监督学习中有两个常用的基本假设, 即聚类假设和流形假设。聚类假设是指处于同类中的样本有较大的可能拥有相同的标号。流形假设是指处于一个很小的局部邻域内的样本通常具有相似的性质, 因而其标号也应该相似。

在基于图论的图像分割方法中, 功能磁共振图像被视作带权的无向图G= (V, E, W) , 其中V代表节点的集合;在功能磁共振图像中则表示为体素集X;E代表连接两两节点的边集;而wij代表了两个体素xi和xj之间的权重值, 在功能磁共振图像中权重可根据体素之间时间序列的相关性来计算。假设n是脑图像中体素的数目, 那么节点xi的度di=∑jn=1wij, 以所由节点的度值为对角线元素构成的对角矩阵即为度矩阵, 用D表示。Laplacian矩阵分为非规范Laplacian矩阵和规范Laplacian矩阵, 非规范Laplacian矩阵表示为Δ=D-W, 规范Laplacian矩阵表示为L=D-1/2ΔD-1/2=I-D-1/2WD-1/2。

设数据样本集合为X= (X1, Xu) , 它包含两部分, 一部分是有标记的数据集X1={x1, …, xl}, 其中的样本点xi的类别标记为yi;另一部分是未标记的数据集Xu={xl+1, …, xn}, 其中样本点的类别未被标记。令标号矩阵Y∈Bn×c, 当xi的类别标记为yi=j时Yij=1, 否则Yij=0, 此时满足∑jYij=1。目前已有很多基于图论的半监督学习算法, 本文主要是基于文献[7]中介绍的GTAM (Graph Transduction via Alternating Minimization) 算法进行聚类。

根据半监督学习假设, 聚类问题可以通过GTAM算法转化为最小化以下代价函数

该代价函数的矩阵形式可写为

其中, F是连续分类函数, V是标号正则项矩阵, 系数μ是全局平滑项和与局部拟合惩罚项的平衡因子。定义矩阵V=diag (v)

其中, ⊙表示Hadamard乘积, 列向量1=[1, …, 1]T。这种直推式的方法在连续化的F空间和二值化的Y空间中对代价函数进行优化, 设, 可得到最优的分类函数F, 然后通过贪心优化对标号矩阵Y进行迭代更新。

代价函数Q (F, Y) 的第一项是全局平滑项, 它保证相似度高的体素具有相似的标号;第二项是局部拟合惩罚项, 它保证已标记体素在分割后得到的结果与初始标号信息一致。另外, 由于f MRI图像的低信噪比特征, 对其进行聚类时分割结果中往往会有离散点的存在, 为获得连续的分割结果, 加入了空间连续项, 它可以保证空间相邻的体素具有相似的标号[8]。

2 半监督聚类算法用于脑功能图像分割

2.1 静息态f MRI图像预处理

本文采用脑功能数据处理脚本对20个被试者的f MRI数据进行了预处理。由于被试者在扫描过程中头部的运动会使不同时相扫描之间同一体素的空间位置对应关系遭到破坏, 因此需要进行头动校正, 使同一被试者在不同采样时间点上的图像对齐。由于被试者的大脑存在明显差异, 为便于比较, 需要将每个被试的脑图像放入统一的MNI标准空间进行统计分析。为提高图像的信噪比, 并使其更符合高斯分布, 采用6 mm×6 mm×6 mm半高全宽的高斯核对其进行空间平滑。对经过空间平滑后的图像进行去线性漂移, 采用0.005~0.1 Hz频段对图像进行低频滤波, 去除呼吸、心跳等高频信号的干扰, 最后去除协变量对低频同步振荡信号的影响。

2.2 相似性度量

基于Broca区模板, 从f MRI图像中提取感兴趣区域 (ROI) 中各体素的时间序列, 该时间序列表征了静息态条件下信号强度随时间点的变化过程, 可以看作是各体素的特征向量, 然后对该区域中各体素的时间序列和ROI内其余体素的时间序列作相关分析, 得到两两体素的功能相似性度量:

其中, I (i, t) 和I (j, t) 分别是体素xi和体素xj的f MRI信号时间序列;为均值;SI (i) 和SI (j) 为方差;T是时间序列中的时间点数。该相似性矩阵W内每一元素的值代表两两体素之间的相关强度, 其值越大, 表明这两个体素的功能越相似。

2.3 脑功能图像分割

将文中算法用于脑功能区的划分时, 首先计算各体素之间的相似性度量, 根据这种度量将所有体素映射为一加权无向图, 其中图上的节点表示为有标记和无标记的体素, 边上的权值反映了体素间的相似程度。然后, 根据已有的细胞构筑模板选定各子区内较为可靠的一些体素作为初始标记点。最后, 采用文中的算法实现脑功能子区的划分, 这样不但利用少量包含类别监督信息的已标记体素进行学习, 还可以利用大量拥有功能连接信息的无标记体素进行学习, 最终确定出无标记体素的类别号。为验证算法的可靠性和有效性, 不仅将分割结果与现有细胞构筑模板进行比较, 而且通过与标准割算法的定量比较, 体现出文中算法在个体一致性上的优势。

由此, 基于功能连接相似性的脑图像分割算法流程框图, 如图1所示。

3 实验结果及分析

结合前人对Broca区的研究[9], 为每一个子区标记至少一个体素, 基于功能连接相似性, 采用文中算法对20个被试者f MRI图像中右侧大脑的BA44/45区进行功能子区的划分, 为验证该算法用于脑区分割的可靠性和有效性, 通过Dice系数去比较文中算法分割结果与公认的细胞构筑模板的重叠率。另外, 为验证文中算法在脑区分割中比一般无监督的聚类算法更具有优势性, 对文中算法得到的结果与采用标准割算法得到的结果进行了比较。

图2显示了采用文中方法得到的分割结果, 其中图2 (a) 显示了随机选择的一个被试在Broca区上的分割结果, 图2 (b) 显示了所有人的分割结果的最大概率图, 从结果可以看出, 采用文中算法Broca区被成功地分割为前后两部分, 与现有细胞构筑模板和前人的研究一致, 并且分割结果也是连续的, 不存在离散点。图3显示了文中算法和标准割算法在个体一致性上的比较效果, 参考图例中越向图例下方代表越多个体的该区域被分为BA45, 越向图例上方代表越多个体的该区域被分为BA44。结果可以看出文中算法比标准割算法得到的结果在个体间的一致性更好。

图4定量地显示了文中算法和标准割算法得到的分割结果与已有的细胞构筑结果的重叠率, 文中算法得到结果的Dice系数平均值明显高于标准割算法得到的结果, 且波动较小, 经过配对T检验得到显著性差异指标p<0.003, 由此可知文中算法显著优于标准割算法。图5定量显示了两种算法得到的分割结果的个体一致性的比较, 并且经检验显著性差异指标p<3.43×10-9, 所以文中算法在个体间的一致性上也明显优于标准割算法。

4 结束语

本文提出了一种融合先验信息的半监督聚类算法, 该算法与其他广泛使用于医学图像分割中的无监督聚类算法相比, 具有较强的鲁棒性。首先利用现有公认的细胞构筑、结构或功能信息对一些脑区确定部分可靠的初始标记点, 然后采用该算法对脑区进行功能子区的划分, 这样在先验信息的指导下抑制噪声对分割结果的影响, 从而得到更可靠的功能子区边界, 获得更稳定的分割结果。实验表明, 该算法有效地抑制了噪声对分割结果的影响, 并能够获得更高的个体间一致性。

参考文献

[1]SHEN X, PAPADEMETRIS X, CONSTABLE R.Graph-theory based parcellation of functional subunits in the brain from resting-state fMRI data[J].Neuroimage, 2010, 50 (3) :1027-35.

[2]SHI J, MALIK J.Normalized cuts and image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22 (8) :888-905.

[3]CRADDOCK RC, JAMES G A, HOLTZHEIMER P E, et al.A whole brain fMRI atlas generated via spatially constrained spectral clustering[J].Human Brain Mapping, 2011, 32 (1) :531-537.

[4]Zhu Xiaojin.Semi-supervised learning literature survey[D].USA WS:University of Wisconsin Madison, 2008.

[5]CHAPELLE O, SCHLKOPF B, ZIEN A.Semi-supervised learning[M].MA:MIT Press Cambridge, 2006.

[6]ZHOU D, BOUSQUET O, LAL T N, et al.Learning with local and global consistency[C].Advances in Neural Information Processing Systems 16:Proceedings of the 2003 Conference.Cambridge:MIT Press, 2004 (16) :321-328.

[7]WANG J, JEBARA T, CHANG S F.Graph transduction via alternating minimiza-tion[C].In:ICML 2008:Proceedings of the 25th international conference on Machine, 2008.

[8]SONG D, CHENG H, FAN Y.Prior information guided brain parcellation based on resting state fMRI data[C].Beijing China:18th Annual Meeting of the Organization for Human Brain Mapping, 2012.

[9]AMUNTS K, SCHLEICHER A, BRGEL U, et al.Broca's region revisited:cytoarchitecture and intersubject variability[J].The Journal of Comparative Neurology, 1999, 412 (2) :319-41.

先验信息篇2

先验论证的逻辑分析

本文是对赵汀阳在《论先验论证》(《世界哲学》,3)中为先验论证所提供的逻辑模式的一个讨论和修正.通过对康德的`先验演绎以及笛卡儿的我思论证进行逻辑分析,我们提出了一个以“归入条件”为基本特征的先验论证模式,并以这个模式为基础,对先验哲学的“演化历史”做了初步的总结,同时在最后也对先验哲学与“古代哲学”之间的差别得出了一个初步的结论.

作者：陆丁 Lu Ding 作者单位：刊名：世界哲学 PKU CSSCI英文刊名：WORLD PHILOSOPHY 年，卷(期)：2005 “”(4) 分类号：B81 关键词：先验论证先验演绎康德笛卡儿归入条件逻辑分析

先验信息篇3

1996年, 经合组织 (OECD) 发表《以知识为基础的经济》的报告, 标志着知识经济时代的来临得到公认。知识经济是建立在知识的创新、传播和使用基础上的经济, 关于知识的转移、获取和创新的研究自20世纪90年代后期起逐渐成为学术界的热点问题。

知识作为一种概念、理论、技巧、经验和真理的化身, 可以像信息一样流动和传播。在一个群体中, 个体知识的增长依赖于个体的自我努力与近邻个体所带来的知识溢出效应。知识的学习是一个交互的过程, 既有知识传递者的知识溢出, 又有知识获取者的知识吸收, 同时还有教学相长, 也就是学习过程中产生的知识创新。知识的传递并非无缘无故而产生的, 在学习的过程中, 知识获取者需要给予知识传递者物质、知识或情感方面的补偿。

知识系统是智能型复杂自适应系统[1], 对于知识系统的研究必须站在系统科学的高度, 综合运用多学科的知识才能取得较理想的结果。以往有关知识学习和转移的研究, 要么从管理科学的角度出发, 进行一些概念的界定和定性的分析;或者立足计算机科学, 进行一些具体信息技术的探讨;还有从宏观层面上关于区域和企业间知识转移的一些结论。从微观出发, 将个体的整个学习过程作为研究对象, 综合运用多学科知识, 以数学为工具进行具有普适性意义的系统刻画的成果还不多见[2]。本文即以此为着眼点进行相关的理论探索。

1 知识金字塔

有关文献[3]对知识存量的涵义和特征进行了界定。关于知识存量的具体表示方法, 以往的研究对象多是企业, 而对于个体的研究, 基本是按照知识的领域和类别来表征, 对于知识水平的刻画不够。本文中, 笔者从教育的规律出发, 提出了一种新的知识存量的表示方法——知识金字塔。

知识的学习过程总是由易到难、由简单到复杂, 在拥有了一定的知识基础后, 个体会产生对于所学知识的深入思考, 这往往导致知识创新的发生。基于这样的特点, 本文构建了如图1所示的知识金字塔。金字塔的底层是初级知识, 这类知识往往流动性较好, 能够接触并掌握的人群数量较大;第二层是中级知识, 其流动性居于中等, 有一定的人群可以接触和掌握;第三层是高级知识, 流动性较差, 能掌握的人也较少;金字塔的顶层是流动性很差的创新性知识, 往往只有该层的知识主体单独拥有。对知识水平尚处初级阶段的个体来说, 其知识金字塔可能只由下面的一到两层组成, 基本由显性知识构成;而高级层和创新层则由显性、隐性知识共同构成。

知识金字塔可以较好地描述个体的知识水平和所处阶段, 其搭建采取由底向上的顺序, 而个体在向外传递知识时也是倾向于先从金字塔的下层传递起, 这符合知识学习的一般规律。

知识金字塔是一个动态模型, 会产生横向、纵向两种形态改变。由于知识的非磨损性, 知识金字塔降低或变窄的主要原因是遗忘;对于知识传递者, 知识金字塔增高或变宽的原因主要是知识创新;而对于知识获取者来说, 知识获取和知识创新都可能造成知识金字塔的升高或增宽。

2 先验信息下的知识学习模型

2.1 先验信息和知识学习模型

有关文献[4]对知识传播和知识转移的概念进行了深入的剖析, 认为知识转移是在受控环境中进行的结果导向的知识传播活动, 是一种包含反馈的双向交流;知识传播则是单向的不含反馈的过程。知识转移的最终目的在于缩小人类个体或组织之间的知识差距, 促进人类的共同发展。Nonaka[5]认为, 知识的转移是在个体、团体、组织与组织间四个层次间发生的, 其中个体与个体之间的转移是最基本、最具有研究价值的。

本文计划构建的模型正是描述个体间知识转移所定义的过程, 不同之处是增加了创新环节。笔者将其命名为知识学习模型, 是因为学习的概念本身就包括了传递和创新的内涵。文中的先验信息, 指的是知识传递者在传递知识前已经了解知识获取者的知识金字塔信息, 因而将努力传递对获取者有用的知识, 即传递者的传递行为是有效的。模型研究的重点放在知识流动的过程和知识获取的过程。图2就是利用经典控制理论构建的知识学习模型。

模型中有两个个体, 即知识传递者和知识获取者。模型的左半部分是传递环节, 右半部分是获取环节, 共同构成了整个学习过程。

显性知识和隐性知识有不同的特征, 但笔者认为, 除了极个别的知识有可能失传外, 其它的知识都可以通过各种不同的学习手段完成转移。本模型并不关注转移的手段, 因而不就显性和隐性知识进行区分讨论。

模型中存在两个反馈。反馈1的作用是使知识传递者了解知识获取者在知识学习后的反应, 并由右面的选择框来决定是否继续向其传递知识;反馈2的作用是明确知识获取者进行知识过滤 (去伪存真、取其所需) 的能力是与其自身的知识水平相关的, 水平越高、能力越强。由于要求系统的稳定性, 因而这两个反馈都是负反馈。

在先验信息下, 因为传递者传递的是他认为对获取者有用的知识, 在一次学习过程结束后, 如果获取者的知识金字塔水平没有提升, 其原因第一种可能是该知识对于获取者并没有用, 也就是传、获双方对知识有用性的理解出现了偏差或二者水平已相当;第二种可能是获取者并未获得该知识, 可能是过滤环节出现了问题 (后面还要详述) 。不论是哪种可能, 笔者都认为这次学习是无效的, 传递者也就没有必要继续向该获取者传递知识。

如果以个体作为节点, 有知识转移发生的任两节点间产生连边的话就可以构成一个知识学习网[6], 网络中的边数对整个群体的知识转移效率有重要影响, 因而如果出现学习无效的情况就去除该两节点之间的连边。

受到资源所限, 中国的教育方式中最常见的就是大班授课。教师作为知识传递者, 拥有对全班学生或大部分学生的先验信息, 但由于授课方法的固定, 即便部分学生没有在课程中获取更多知识 (金字塔无变化) , 教师的劳动量也不受任何影响, 因此教师往往会考虑大多数学生的知识水平而对自己的授课内容进行安排, 以使效益最大化。与之不同的是, 本模型立足理论研究的层面, 只要知识获取者的知识金字塔没有提升, 就断开其与知识传递者的连边, 减少整个网络在传递路线上的消耗。事实证明, 小班、家教等更有针对性的授课方式效果往往更佳, 这也是本模型进行这样断边处理的一个根据。

2.2 传递函数

若获取者知识水平有所提升, 学习就将继续, 这时我们关心的问题就是如何能比较准确地定量描述知识传递的函数。王众托提出用柯布—道格拉斯生产函数来表征知识的作用[1]。笔者认为, 这个函数从形式上也可以较好地描述知识的传递, 但需要做一些修改;同时在具体变量的理解上, 笔者试图站在另外一个角度, 以求能从本质上挖掘知识传递的特点。

知识传递的影响因素包括内生因素和外生因素。内生因素包括知识缺口、经济因素等, 外生因素包括知识需求、环境的脆弱性、制度因素、经济形式、知识保密、距离等[7]。对于个体间的知识传递, 知识缺口和知识需求是两个关键的影响因素, 同时还应当对知识保密兼顾考虑。在技术手段丰富的当今社会, 距离对地区间知识转移可能造成影响, 但对个体间知识传递并不具有决定性意义。本文构建的知识传递函数如下:

$△ u_{j, t} = {\begin{cases} 0, \frac{u_{j, t}}{u_{i, t}} \geq δ \\ A_{t} (u_{i, t} - u_{j, t})^{α} + e_{t}, \frac{u_{j, t}}{u_{i, t}} ＜ δ \end{cases} (1)$

在公式 (1) 中, 节点 i和j分别表示知识传递者和知识获取者。et是传递中外界的干扰 (图2中干扰2) , 也是过滤环节所要去除的对象之一。ui, t和uj, t分别表示t时刻i节点和j节点的知识金字塔水平。图2为了描述的直观而把i和j的创新环节分居左右, 而事实上, 传、获双方的创新往往是在互动的学习中同步完成的, 所以均用t时刻的知识水平来反映t时刻传递的知识量△uj, t, △uj, t与内、外生因素有关。

对于内生因素, 笔者选取知识缺口即i与j的知识差值 (ui, t-uj, t) 来表征, 公式中的α介于0和1之间。对于外生因素, 选取的是知识需求, 用At来表征。笔者认为, 从供求角度来说, 知识的传递不可能是完全无偿的过程, 在传递时需要至少发生下面三种交易之一:知识—物质交易、知识—知识交易、知识—情感交易。知识—物质交易多发生在知识高端和知识低端个体之间;知识—知识交易多发生在知识水平大体相当而存在一定互补性的个体之间;知识—情感交易则主要发生在熟人之间。如果三种交易均不发生, 那么At=0, 否则满足: $\frac{获取者对知识的价值定位}{传递者对知识的价值定位} \leq A_{t} \leq \frac{传递者对知识的价值定位}{获取者对知识的价值定位}$ 。之所以处于这个区间, 是因为供求双方都希望使自己的利益最大化。在完全市场条件下, At最终会是一个均衡值;但在传递过程中也有非经济因素的作用, 比如发生知识-情感交易时, At也存在着大于1的可能。

对于知识保密的考虑是通过δ来体现的。对于i来说, 他倾向于从金字塔由低到高的顺序向j传递知识, 当传递到创新知识层或高级知识层时, 出于保密的考虑可能会停止继续传递。δ是一个小于1但接近1的变量, 当 $\frac{u_{j, t}}{u_{i, t}}$ 达到δ时, 意味着二者知识水平已相差不大, 进入了相对高层传递阶段, 保密的需要将显现。δ的取值由传递者i的主观意愿确定。

2.3 过滤模型

不论知识的传递者在多大程度上掌握了知识获取者的先验信息, 他所传递的知识与获取者所需要的知识总是无法完全匹配的, 而在知识的传递途中还会有各种各样的干扰 (图2中用干扰2表示) 加入, 这就使得知识获取者必须对所学的知识进行去伪存真、取其所需。事实上, 进行知识筛选的能力也是获取者知识水平的一个重要体现。同样的, 在反馈1发生时也会有干扰在途中或反馈完成后加入 (图2中用干扰1表示) , 这造成了知识传递者对获取者知识水平信息的掌握也存在不确定性。因此笔者认为在学习过程中需要有两个过滤阶段:传递者的过滤是对信息的过滤, 不导致其知识的增长;获取者的过滤是对知识的过滤, 会对其知识水平形成影响。下面研究的是获取者的过滤模型。

在控制理论里, 从混合在一起的诸多信号中提取出所需要的信号的过程叫做滤波[8]。滤波与知识过滤的过程有着高度的相似性, 对于本文数学模型的构建具有很高的借鉴价值。传统的滤波方法包括最小二乘估计、最小方差估计、极大验后估计、贝叶斯估计等最优估计理论和维纳滤波等初级滤波方法, 但它们都具有明显的局限性。20世纪60年代提出的卡尔曼滤波理论极大地拓展了滤波的适用范围。

卡尔曼滤波是一种线性最小方差估计, 与维纳滤波相比具有很多优点:仅使用较少的数据观测量就能获得较好的滤波效果;只是简单的递推算法, 不需对微分方程进行处理;便于计算机仿真, 等等, 非常适合于本文构建的系统。由于本文的学习模型中获取者是分时间逐次获取知识, 因此最终选用离散型卡尔曼滤波器。

过滤的对象有两个, 一个是公式 (1) 的At (ui, t-uj, t) α中对节点j没有用的知识, 另一个是传递途中的干扰et, 这两个噪声都发生在过滤阶段开始前;同时, 在学习模型中将每一次传递的知识看做一个整体, 因此建立的过滤模型是单输入—单输出的线性确定系统。

图3所示的就是过滤系统模型, 被控的对象是传递的知识流, 系统的输入是△uj, t, 输出是yt, 系统的状态空间方程为:

${\begin{cases} \hat{x}_{t} = A x_{t} + B △ u_{j, t} \\ y_{t} = C x_{t} + D △ u_{j, t} \end{cases} (2)$

其中, A、B、C、D为参数, xt是状态向量的理论值, $\hat{x}$ t是状态向量的估计值。通过反复的观测, 对xt和 $\hat{x}$ t间的关系进行递推修正, 也就形成了过滤的过程。过滤结束后j所获取的知识为:

yt=θtAt (ui, t-uj, t) α (3)

0≤θt≤1, 表示过滤后知识获取者对知识的吸收率。由于系统本身的某些不完备性, 存在着滤掉有用知识的可能, 需要通过多次实验来验证可靠程度。图2中的反馈2并不影响图3的结构, 但随着获取者知识水平的提高, 传感器、状态观测器和状态反馈控制器的能力会得到提升。

对于传递者的过滤模型, 和获取者的基本一致, 只是输入的内容为“获取者知识水平的信息+干扰1”, 它的作用是加强传递者判断和传递行为的准确性, 对系统中的知识流不构成影响。

2.4 创新函数

对于知识的学习过程来说, 创新是非常重要的一环, 只有存在创新, 知识才能由“死变活”, 宏观上形成推动社会进步的动力, 微观上形成群体中个体的差异, 达到既保持群体高的综合能力, 又使群体内存在一定的竞争压力, 从而有利于群体长久发展的目的[9]。

本文构建的知识创新函数如下:

vj, t=λj, tμj, tτj, tuj, t (4)

公式 (4) 表示t时刻节点j的创新函数, 其中λj, t和μj, t表示客观因素对创新的影响, 含义分别是创新的可能性和创新的正确率, 取值都在0和1之间。从真实的知识创新过程来看, 当主体知识水平越高时, 创新的可能性越大, 正确率也越高, 所以这两个参数与uj, t都存在着正向关系。选用μj, t来表示正确率, 是因为从知识的涵义来看内容必须是正确的, 错误的知识将不能计入知识金字塔形成金字塔的增长;参数τj, t表征了主观因素的影响, 即t时刻节点j进行创新的主观愿望的强烈程度。

2.5 知识增长函数

综合公式 (1) 、 (3) 、 (4) , 可以得出从时刻t到t+1, 即一个学习过程完成后, 知识传递者和获取者的知识增长函数的数学表达式为:

${\begin{cases} u_{i, t + 1} = u_{i, t} + λ_{i, t} μ_{i, t} τ_{i, t} u_{i, t} \\ u_{j, t + 1} = {\begin{cases} u_{j, t} + λ_{j, t} μ_{j, t} τ_{j, t} u_{j, t} \frac{u_{j, t}}{u_{i, t}} \geq δ \\ u_{j, t} + θ_{t} A_{t} (u_{i, t} - u_{j, t})^{α} + λ_{j, t} μ_{j, t} τ_{j, t} u_{j, t} \frac{u_{j, t}}{u_{i, t}} ＜ δ \end{cases} \end{cases} (5)$

3 结论

本文首先提出了知识金字塔的概念, 从知识层次角度合理地解释了个体的知识构成, 随后在先验信息的假设下利用控制理论建立了知识学习的整体模型, 继而对传递阶段、过滤阶段、创新阶段的影响因素依次展开分析, 分别建立了三个阶段的函数关系, 最后综合形成了知识增长的函数方程。

笔者采用控制理论为主导、经济理论和教育理论为辅助所构建起的一系列模型和函数, 在个体间知识学习、知识转移、知识获取等领域的研究新方法上进行了有益的探索, 同时对于团体和组织间的知识学习也具有一定的借鉴价值。由于知识学习的复杂性, 影响因素很难考虑周全, 因此模型本身还存在一定的不足, 用计算机对模型进行仿真验证是下一步的主要工作。由于模型中变量较多, 在仿真过程中为了提高效率, 可能会对部分变量进行简化。文中对个体构成的知识学习网络有一些思考, 群体学习是一种常见的学习方式, 宏观的网络特征会对个体的微观学习行为产生一定的影响, 因而对于在更大的维度上模型的适应性问题也有待今后进一步探索。

参考文献

[1]王众托.知识系统工程[M].北京:科学出版社, 2004.

[2]翁庆雄, 胡蓓.国外知识转移模型的研究进展[J].科技进步与对策, 2007 (3) :195-197.

[3]李顺才, 邹珊刚, 常荔.知识存量与流量:内涵、特征及其相关性分析[J].自然辩证法研究, 2001 (4) :42-45.

[4]谭大鹏, 霍国庆, 王能元, 等.知识转移及其相关概念辨析[J].图书情报工作, 2005 (2) :7-10.

[5]NONAKA I, TAKEUCHI H.The knowledge-creating company[M].New York:Oxford University Press, 1995:75.

[6]COWAN R, JONARD N.Network structure and the diffusion ofknowledge[J].Journal of Economic Dynamics&Control, 2004 (28) :1557-1575.

[7]陈飞翔, 张黎, 胡靖.知识扩散场的构建与实证分析[J].科学学研究, 2005 (4) :253-257.

[8]秦永元, 张洪钺, 汪叔华.卡尔曼滤波与组合导航原理[M].西安:西北工业大学出版社, 1998.

基于先验预知的动态电源管理技术篇4

动态电源管理技术适用的基本前提是，系统元件在工作时间内有着不相同的工作量。大多数的系统都具有此种情况。另一个前提是，可以在一定程度上确信能够预知系统、元件的工作量的波动性。这样才有转换耗能状态的可能，并且在对工作量的观察和预知的时间内，系统不可以消耗过多的能量。

2 电源管理

各个系统设备当接到请求时，设备忙；而没有请求时，就进入了空闲状态。设置进入空闲时，可以关闭设备，进入低耗能的休眠状态；当再次接到请求后，设备被唤起。这就是所谓的“电源管理”。然而，耗能状态的改变是需要时间的，也就是关闭时延和唤起时延。唤起休眠状态中的设备需要额外的能量开销，如图1所示。如果没有这项开销，也就用不着电源管理技术了，完全可以只要设备空闲就关闭设备、这种时延和能量开销确定存在，所以必须考虑，只有当设备在休眠状态所节省的能量至少可以抵得上状态转换耗能的情况时，才可以进入休眠状态。

电源管理技术是一个预知性问题。应寻求预知空闲时间是否足够长，以及于能否抵得上状态转换的耗能开销。空闲时间过短时，采用电源管理的方案就得不偿失了。所以事先估计出空闲时间的长短是电源管理技术中的首要问题。定义“恰当的停止时间段”（tBE）：能达到系统节能的最短空闲时间段。此时间与设备元件本身有关，与系统发出的请求无关。假设状态转换延时t0（包括关闭和唤起延时）耗能为E0；工作状态功率Pw，休眠状态功率Ps，可由以下式求出tBE。

Pw×tBE=E0+Ps×(tBE-T0)

先验信息篇5

1电介质老化中的可靠性分析

电介质老化问题中的可靠性主要指标是可靠度R (t) 、失效率F (t) 、故障密度函数f (t) 及故障率λ (t) 。电力相关部门经过了长期的实践活动, 已经积累了相关的数据资料, 对于上述指标也有了一定的认识。比如电老化问题中的局部放电频率、高温、电痕、体积电阻率、击穿电压与寿命等等。这些对于判断电介质的性能和使用期限是重要的。从这些数据中可以分析常规曲线的新规律。比如对于“浴盆曲线” (见图1) , 早期的故障主要是反映了设计、装配等薄弱环节, 而损耗期失效主要是由于零件磨损和老化引起的α, β, γ。对于电介质老化寿命的概率分析, 一组试样经电压老化后, 分组取最小值作为破坏判据所获得的失效时间是一个Ⅲ型极值Weibull分布。其不可靠度可以表示为:

F (t) =1-exp[-α (t-γ) β]。

其中, α, β, γ分别为尺寸参数、形状参数和位置参数, 见图2。

由故障率、故障率密度与可靠率的关系, 即:

$λ (t) = \frac{f (t)}{R (t)} = \frac{1}{R (t)} α β (t - γ)^{β - 1} \exp [- α (t - γ)^{β}]$ 。

一般, 当β>1时, 表示磨损失效;当β=1时, 表示恒定的随机失效;当β<1时, 表示早期失效, 它们分别对应着“浴盆曲线”中的三个阶段, 然而数据分析显示, 在很多情况下, 电介质的老化规律并不是这样。

2以先验信息为指导的分析与流程

在热老化试验中, 绝缘材料的性能随时间的变化规律可以表示为:f (P) -f (P0) =kt。其中, P, P0, k分别为材料的始末性能以及反应速率常数, 反应速率常数可由阿累尼乌斯方程求出。这说明, 在一定的环境下, 材料的规律是可以被人们所认识的。同样, 电老化也存在一定的老化规律。分析信息的过程是一个对信息进行取舍的抽象的过程。对于电介质的老化问题的分析, 这是在一定的标准下判断的, 比如使用寿命。首先它是一个“变化”的量, 因此, 尽管故障率这个内在的量 (浴盆曲线) 已为人们熟知, 但由于它提供的信息太粗糙, 甚至不是“真”信息, 因此仍不宜使用。不要忽视那些所谓的最基本信息, 从那里可能得到正确的结论。

3以先验信息为元素的电介质老化模型

下面根据以上的分析思路建立以先验信息为元素的分析模型。首先将目标函数R (待求量, 如寿命等可靠性指标) 写为先验信息库的函数:R={X, Y, Z…}。这些信息是分类存放的。r={x1, x2, …, xm, y1, y2, …, yn, z1, z2, …, zl…}。决策的过程就是对信息进行加工、取舍和抽象的过程, 这一过程可用下式表示:D=D (X, Y, Z) 。

在给定的特定条件下, 用这些数据进行分析, 即d=d (x1, x2, …, xα, y1, y2, …, yβ, z1, z2, …, zγ…|b) 。实际上, 由于决策是一个多因子决策的问题, 因此必然存在一个线性或者是非线性影响的多因子矩阵R, 它与权矩阵共同作用生成了决策向量D, 即:

4简例分析

为了测试电压老化的结果, 分别用不同的方法对之进行评价。首先取50根电机线棒做电老化试验对之进行骤死试验分析, 结果见表1。

把试样分为10组, 每组5个试样, 试验结果见表1。按分级理论, 5个1组中的最低值群集中在总体B (12.94%) 点的中值位置。因此, 这10个数代表寿命的个别估计。根据骤死直线与总体直线相平等的关系, 可以获得Weibull分布的特征值以及任何失效百分数的特征值 (见图3) 。上述方法存在的一个明显不足就是如果再进行一次试验, 结果将发生改变, 而且在对数坐标上的很小变化就会导致预测结果的很大改变。下面分析以先验信息为元素的电介质老化模型分析的思路。对于图2中三种不同的曲线, 老化的实际情况相差很大。首先分析尺寸参数与形状参数的影响, 它们决定的曲线是何种形式。如果先验信息是使用中期阶段, 故障有较多的累积, 那么它就接近于正态曲线的趋势, 此时β>1。而用骤死法完全可能做出相反的结果。对于密度是指数函数的情况, 那表示初始阶段, 故障就在大幅度地累积。对于如何利用信息空间求出故障密度曲线的参数, 这就是要用到信息矩阵进行数值计算。我们要求的量是数据空间和先验信息空间中的一个元素。对于电介质老化特征, 它们是相对固定的量。即图4中的向量 $\overset{⇀}{B A} ‚$ 它位于 $\overset{⇀}{B A}$ 所在的子空间中, 信息空间中反映的曲线参数的值是 $\overset{⇀}{C B} ‚$ 二者之间的偏差是distance $(\overset{⇀}{B A} ‚ \overset{⇀}{C B}) = \overset{⇀}{A C} ‚$ 可以根据 $\overset{⇀}{A C}$ 垂直 $\overset{⇀}{B A}$ 所在的子空间解不相容线性或非线性方程组求得。

5结语

电气设备中的各种材料中, 有机电介质对老化因子最敏感, 其老化特性往往决定着电气设备的可靠性。采用系统理论和系统性的模型分析电介质老化这一课题具有重要意义。充分地利用各种先验信息对于准确地分析可靠性指标及密度曲线参数是必须的。通过计算分析与比较, 新模型不仅提出了新方法, 更重要的是新思维方式。分析信息的过程是一个对信息进行加工、取舍、综合和抽象的过程。对大量的数据形成的先验信息空间进行分析和归纳可以找到问题的内在规律。这对于充分利用信息资源进行科学的数值计算提供了新内容。

参考文献

[1]郑飞虎, 张冶文, 肖春.聚合物电介质的击穿与空间电荷的关系[J].材料科学与工程学报, 2006, 24 (2) :316-320.

[2]杨启平, 薛五德, 蓝之达.变压器绝缘老化评估技术的研究[J].变压器, 2006, 42 (5) :1-5.

先验信息篇6

1 水平集方法理论的概述

1.1 基本理论

水平集方法的本质是一种数值技术, 主要用于形状建模。它可以不对曲线 (面) 进行参数化, 直接在笛卡尔网格上对演化中的曲线 (面) 进行数值计算, 这是它最大的优点。水平集方法遵循的是Euler (欧拉) 框架, 在固定的网格上进行计算。它的另一个优点是可以解决曲线参数化所带来的问题, 因为它能方便地处理演化曲线/曲面拓扑结构的改变。

本文总结了水平集方法的基本思想:将移动变化的曲线视为零水平集, 再整合入更高维函数中, 然后由曲面演化方程得到函数演化方程, 而移动变化的曲线保持为函数点集, 这些点集集中在零水平截面上。推算出零水平截面上的点集位置, 就可得到曲线的演化结果。

可知, 水平集方法的实质, 相当于求解一个偏微分方程, 此方程随时间变化而变化。通常, 以下几个部分可以构成一个典型的水平集方法:

(1) 与水平集方法对应的数值求解步骤

(2) 曲面隐式的数据表示式

(3) 表示曲线、曲面变化的偏微分方程式或微分方程组

1.2 国际、国内对水平集方法进行研究的现状

水平集方法由于其自身的优越性, 已被应用于多个领域 (如图像的分割, 图像的恢复、重建等) 以及其他学科 (如材料学、物理学、化学、农业学) 。水平集方法已被众多相关学者作为图像处理领域研究的热点进行研究。国际上的一些知名高校, 国内一些处于理论前沿的图像处理实验室或模式处理实验室都对水平集方法展开了研究。

水平集方法的优点在应用于图像分割时, 尤为明显。主要表现在以下几个方面:

(1) 零水平集可以简便地改变函数的拓扑结构, 有效地分割形状复杂的目标图像;

(2) 水平集方法可以将曲线变化演化转化成偏微分方程 (组) 的解析运算;

(3) 容易实现数值近似算法, 如利用有限差分法来演化函数;

(4) 演化曲线内在的几何特征可以直接由水平集函数计算出来, 如内单位法向矢量;

(5) 有较强的数学理论做支撑, 能够方便而有效扩展到高维情况, 如处理三维图像分割问题。

2 基于水平集和先验信息的图像分割方法

尽管将水平集方法应用于图像处理后, 大大简化了图像处理的步骤, 但是当图像轮廓曲线演化到物体的某些弱边缘或者演化到物体边缘间隙处时, 这些位置边缘的梯度值比较小, 常常会发生泄漏或者过分切割的情况。

出现这个问题的原因是模型没有提供任何的信息, 把这些断开的边缘间隙连接起来。这个问题在农业图像中尤为突出, 物体的边缘对比度和分辨率都很低, 例如小麦与杂草的边缘形状, 往往十分类似, 或者相互重叠、遮挡。这对图像分割增加了难度, 用传统的水平集方法难以获得满意的效果。

为了解决上述问题, 有学者提出在轮廓模型中结合先验信息, 先验信息是关于物体的边界的总体形状的一个估计。研究者希望通过先验信息的作用, 图像轮廓在演化过程中可以和期望的形状进行不断的对比, 最终达到理想的分割结果。

本文通过研究现有材料, 以及在现有材料基础上的深入研究, 归纳出基于水平集和先验信息的图像分割的算法基本步骤如下:

(1) 初始化参数、水平集函数为符号距离函数。

(2) 根据目标形状, 找到能突显出目标的模型, 把原图像转换成此模型, 以此模型表示的目标信息量作为先验信息。

(3) 求解偏微分方程得到新的水平集函数。

(4) 重新将水平集函数初始化为距离函数。

(5) 判断计算结果是否具有稳定性, 若具有稳定性, 则计算结束。若不稳定, 返回步骤 (3) 重新计算, 直到得到稳定的结果。

基于先验形状的水平集分割模型既包含全局形状的约束信息, 又包含局部区域或边缘的约束信息。因此该分割方法对处理有遮挡或信息缺失的图像有很强的鲁棒性。因为这个特点, 该方法尤其适用于在农业研究中应用。

3 实验分析

为了检验基于先验信息和水平集方法分割图像的性能, 本文利用第二章分析的算法对一些存在部分重叠情况的叶片图像进行了分割。

通常情况下, 自然环境中的叶片图像背景比较复杂, 叶片经常和其他叶片交叠, 背景中也有杂草、枯叶或石头等等干扰物。所以对叶片图像进行分割有其实用价值。

常见单叶片的基本形状有阔卵形、披针形、圆形、阔椭形、长椭圆形、倒披针形, 条形、剑形等等。虽然叶片的基本形状各不相同, 但是基本上都有一定的对称性。在自然条件中, 由于叶片的生长位置、朝向和倾斜角度等的不同, 使得叶片不是严格意义上的完全对称, 因为存在小的差异, 我们称之为近似对称性。本文将这种近似对称性引入为先验信息。

图1是本文对存在互相重叠的树叶的图像进行分割, 目的是分割出上层的一片树叶。采取结合叶片近似对称性先验信息和水平集方法的分割方案。图1所示为具体实验过程:

a.首先确定主轴、初始轮廓线条;

b.通过对图像第一次演化, 得到所求图像的最长轮廓曲线;

c.确定主轴、轮廓;

d.通过对称性计算得到中心线;

e.计算窄带区域和二次演化轮廓;

f.第二次水平集演化的分割结果。

可见, 基于水平集和先验信息的图像分割方法可以有效的分割植物叶片。

4 总结

水平集方法虽然已经取得了一定成就, 但仍处于发展阶段, 尤其是在农业研究领域的应用, 还需要进一步的完善和提高。引入先验信息的水平集算法显然更适合应用于农业图像领域的分割。

参考文献

[1]陈波, 赖剑煌.用于图像分割的活动轮廓模型综述[J].中国图象图形学报, 2009, 12 (1) :11-20.

[2]刘国才, 王耀南, 段宣初.基于知识的多层向量值图像分割模型[J].自动化学报, 2009, 35 (4) :356-363.

先验信息篇7

投资决策是指投资者为了实现其预期的投资目标, 运用一定的科学理论、方法和手段, 通过一定的程序, 对若干个可行性的投资方案进行研究论证, 从中选出最满意的投资方案的过程。投资决策的主要任务是针对各个投资方案进行效益评价和风险分析, 以便做出是否投资或者从备选方案中做出最佳选择。

投资方案评价过程中使用的指标分为贴现指标和非贴现指标:贴现指标是指考虑了时间价值因素的指标, 主要包括净现值、现值指数、内含报酬率等;非贴现指标是指没有考虑时间价值因素的指标, 主要包括回收期、会计收益期等。相应的, 可将投资决策方法分为贴现的方法和非贴现的方法。现在关于投资决策的工作往往集中在关于现值的财务分析上, 常见方法有净现值法、现值指数法、内含报酬率法等。

然而, 更值得投资者关注的是, 投资收益情况往往取决于投资方案实施的客观条件如市场销售情况等。能够清楚掌握这些客观条件, 利用先验信息准确预测未来状态, 无疑能极大地降低投资风险。因此, 本文立足于先验信息不确定性程度这一视角对投资决策进行分析研究具有现实意义。

根据先验信息不确定性程度, 可以划分为先验信息完全确定、先验信息部分确定和先验信息完全不确定三种情况。本文根据不确定性程度的逐步递增, 循序渐进分别进行投资决策分析研究。

为了重点突出先验信息不确定性程度的处理, 并且方便说明不同情况下投资决策问题分析方法的原理, 本文论述不涉及现金流量分析的具体细节。

二、先验信息完全确定的投资决策

先验信息完全确定的投资决策, 是指我们根据过去的信息或者经验, 能够可靠把握、预测未来发展状态的各种可能性的风险型投资决策。对于这类型决策问题, 采用Baye (s又称期望值) 判别分析法最为科学有效。具体做法如下:

假设有n个投资方案a1, a2, …, an, 这些方案对应n种不同的状态s1, s2, …, sn;此外, 假定方案ai对应状态sj时的收益 (净现值或者其他财务指标) 是cij=c (ai, s) j。如果利用先验信息能确定各状态的先验分布为:

其中, pj=p (s) j, pj>0, j=1, 2, …, n, 且p1+p2+…+pn=1。按期望收益最大原则, 满足下式的方案ak为最优方案:

例1:某企业需要在三个投资方案 (a1、a2、a3) 中选择最优方案, 这三个投资方案完成后的收益的净现值取决于完成后市场的销售情况, 不同情形下净现值的估算见表1:

单位:万元

根据收集到的先验信息, 销售良好的概率p1=0.25, 销售一般的概率p2=0.4, 销售不良的概率p3=0.35。

根据已知条件, 分别计算出三种方案的期望收益:

E (a2) >E (a3) >E (a1) , 故最优方案选择a2。

三、先验信息部分确定的投资决策

先验信息部分确定的投资决策, 是指我们根据过去的信息或者经验, 只能模糊把握、预测未来发展状态的各种可能性的风险型投资决策。

在现实经济生活中, 由于决策问题的复杂性, 人们往往只能够把握有限的先验信息, 而难以确定各种状态的先验分布, 以致难以直接采用上述方法。对此, 可以用信息熵来描述决策问题的不确定性。

熵, 源于统计物理学, 是系统的无序状态的量度, 也就是不确定性程度的量度。大量研究事实已经证明, 熵的概念不仅仅局限于物理学, 在大系统描述方面也有其不可替代的优势。鉴于熵的这一优点, 决策问题的不确定性可以用信息熵来描述, 熵越大代表不确定性程度越高。因此, 在有限的先验信息条件下, 无法确定唯一的先验概率分布, 可以利用极大熵准则来确定先验概率。

极大熵准则创导者E.T.Jaynes指出:我们的问题是找一个概率分布, 使和我们已有的关于状态集合的 (先验) 信息一致, 并且没有太大的误差, 最直观、最容易想到的概率分布就是使熵达到最大的并且满足约束条件的概率分布。这是因为, 从最小二乘法或者最小距离的原理考虑, 比较平坦的分布比有峰的分布满足已知的信息集合的可能性更大。

离散性随机变量的熵公式如下:

例2:沿用例1, 仅仅将先验信息条件变更为:销售良好的概率p1≥销售不良的概率p3, 销售一般的概率p2≥0.4, 销售不良的概率p3≥0.15。

本题的求解关键在于确定三种销售情况发生的概率, 确定了概率分布之后, 就能采用Bayes判别分析法计算各种方案的期望收益。

这是一个非线性规划问题, 可以利用现有优化计算机软件如Excel、Lindo和Lingo等进行求解。

求解该问题得:p1=0.425, p2=0.425, p3=0.15。

E (a1) >E (a2) >E (a3) , 故最优方案选择a1。

四、先验信息完全不确定的投资决策

实践中很多决策问题是新情况、新问题, 没有前人经验可以借鉴或者难以收集先验信息, 这类决策则属于先验信息完全不确定的投资决策。

显然, 一个已知环境中的某一个方案的风险程度与结果 (如利润) 的概率分布的位置和形状有直接关系。风险的多维性, 决定了对其描述也应该是多维的。因此, 只有从位置和形状出发度量风险, 才能真正地做到全面准确。此外, 要详尽完整地描述一个客观事物, 可以从多个角度去描述它, 以满足不同需求者的需要。

有鉴于此, 面对这类决策, 可以考虑采用风险的三维熵式度量法。此方法从“正面”对风险进行一个全面的综合度量, 考虑了不同投资方案Xi在未来环境状态下的利润情况, 设其利润ωi的分布函数分别为F (ω) i, 密度函数为f (ω) i, 方差为σ2 (x) i, 均值为。

以下, 先对形状风险、位置风险、位置形状风险、保底风险、超利风险这五个风险指标进行定义:

(1) 形状风险用熵来度量。形状风险的定义沿用熵度量的定义, 方案Xi的形状风险定义为:

(2) 设投资者的目标为完成最小利润t、最大利润T (T≥t) , 则把方案Xi的位置风险定义为:

式中:k为分布的上100α百分位点Zα;α可以设为0.05、0.02、0.01等。对于标准正态分布, 当α=0.05时, Z0.05=1.645, 即k=1.645。

(3) 方案Xi的位置形状风险Rx (1) 定义为:

Rx (1) =rx (1) rx (2)

该式综合反映了方案利润的风险, (Rx1) 越大, 表示利润风险越大, 即利润均值越小, 或者密度函数越平坦 (分散) 。

(4) 从不能实现最小利润目标的概率角度来度量的方案Xi的风险称为保底风险。方案Xi的保底风险定义为:

(5) 从不能实现最大利润的概率的角度来度量的风险成为超利风险, 超利风险Rx (3) 定义为:

综上 (3) ~ (5) , 可以建立一个由这三种风险构成的风险矢量:

R可以辅助人们进行方案决策:当人们进行风险无差别 (中性) 决策时, 可以选取R (1) 最小化的方案;当人们进行悲观化决策时, 选取R (2) 最小化的方案;当人们进行乐观决策时, 选取R (3) 最小化的方案。

例3:沿用例1, 没有任何先验信息条件, 设定最小目标利润10万元、最大目标利润40万元, 假定三种方案均服从正态分布。

根据已知条件, 计算三种方案的未来利润预测表, 如表2所示:

金额单位:万元

计算三种方案的三维风险结果, 如表3所示:

单位:万元

根据以上风险分析结果, 笔者认为投资者在进行投资决策时可作如下选择:

(1) 当决策者进行中性决策即决策者不愿意冒太大风险也不是很保守时, 可以选择位置形状风险最小的a3方案。

(2) 当投资决策者进行风险厌恶型决策也就是当决策者为风险厌恶型投资平稳者时, 则可以选择保底风险最小的a3方案。

(3) 如果投资者为乐观决策者, 应该选择超利风险最小的a1方案。

此外, 需要特别提出的是, 本例题的约束条件“最小目标利润10万元、最大目标利润40万元”非限定条件, 可以针对不同方案分别进行设定。其初始值不一样, 将会影响到风险矢量的计算结果, 从而影响到最终决策方案的选择。

五、结束语

美国著名管理学家、诺贝尔奖获得者西蒙认为管理就是决策。决策在管理过程中举足轻重。本文根据先验信息不确定性程度将决策问题分成三大类型, 并运用Bayes判别分析法、极大熵准则和风险的三维熵式度量法对风险投资决策问题进行了探讨。然而, 鉴于未来状态受到诸多不确定性因素的影响, 未来的结果也随之呈现出不可预测性, 我们仅仅能够从既存的历史经验数据或者调研预测经验数据来尝试预测未来结果, 因此好的决策并非一定带来好的结果。投资决策分析的实际意义在于, 为利益相关者提供理论与实务指导, 避免投资者盲目决策, 使其在现有条件下尽可能地达到收益与风险的最佳平衡点。

此外, 为了提高投资决策的精确性, 应当尽可能进一步收集信息来修正先验分布, 尽量减少不确定性因素或者降低不确定性因素的影响, 提高决策质量。

最后, 本文主要把熵思想应用在管理决策中进行探讨, 但是没有一种方法是完美无缺的, 如熵思想认为随机事件不加任何限制将趋于均匀分布达到熵最大, 因而运用熵思想进行决策时, 得到的结果是尽可能接近均匀分布的结果, 从而有可能高估可能性较小的事件、低估可能性较高的事件。为了提高投资决策质量, 可以考虑采取多种方法进行投资决策分析, 以得出最佳决策方案。

摘要：本文围绕先验信息的不确定性程度, 将风险型投资决策分为先验信息完全确定、先验信息部分确定和先验信息完全不确定三种类型, 分别进行投资决策分析研究。

关键词：风险型投资决策,先验信息,期望收益,极大熵准则,风险的三维熵式度量法

参考文献

[1].岳超源.决策理论与方法.北京:经济科学出版社, 2002

[2].邱莞华.管理决策与应用熵学.北京:机械工业出版社, 2002

先验信息篇8

车牌识别系统是智能交通系统的重要组成部分, 可广泛应用于高速公路自助系统、城市交通控制以及停车场或校园关卡等领域, 它的工作流程包括图片采集、车牌定位、字符分割和字符识别四部分。由于用于采集图片的摄像头与车辆的位置角度存在偏差, 所以抓拍的车牌图片有很大的可能存在倾斜。

车牌倾斜可以分为水平倾斜、垂直倾斜和混合倾斜三种。国内外研究人员针对水平倾斜校正提出的常用方法主要包括Hough变换法[1-3]、旋转投影法[4-5]和K-L展开式法[6]等, 且基本都可以得到不错的结果。而针对垂直倾斜校正的研究方法较少, 目前主要有:① 直线拟合法[7-9]。该方法是对车牌左边界部分点进行直线拟合, 认定此直线倾角即为车牌倾斜角度, 此方法在存在车牌左边框且车牌外没有干扰区域时效果较好, 但如果车牌左边框由于被污染等原因导致预处理后左边框区域缺损或不存在时, 考虑到车牌最左边字符为汉字, 且汉字的左边界点大部分都不能拟合成理想的直线, 如“京”、“云”、“广”等, 此时误差很大, 不能达到预期校正效果;②旋转投影法[5]。该方法需要车牌图像以1°为步长对每个角度都进行错切变换, 然后统计垂直投影为0的点, 当统计点数最多时即为此车牌的垂直倾斜角, 此方法需要穷举每个角度, 这将导致效率低下且精确度不高, 易受到字符以外部分的干扰。因此寻求一种更为准确、快速的方法极为重要。

本文在深入研究和分析这些算法的基础上, 提出一种基于先验知识的垂直校正方法。该方法首先在水平倾斜校正的基础上去除车牌的上下边框及铆钉, 然后通过垂直投影法进行粗定位并得到包含每个字符的分割区域, 并求得所分割区域中最大连通域部分即字符点区域的宽最短外接矩形, 统计水平穿过此外接矩形中心的直线在矩形区域内的点数, 从而推导出当前字符仿射变换后的高宽比, 并根据车牌字符原始高宽比推导出车牌倾斜角度。

1 车牌字符的先验知识及宽最短外接矩形

1.1 关于车牌字符的先验知识

根据GB36-2007的规定, 小型汽车车牌、大型汽车前号牌、领馆汽车号牌、港澳出入境车号牌、教练汽车号牌标准如图1所示。

假设每个字符的高宽比为∂H:W , 则:

1.2 连通域的宽最短外接矩形

定义:对于一个连通域, 在它的所有外接矩形中, 存在一个外接矩形, 它的宽比其它所有外接矩形的宽都要短, 则称它为此连通域的宽最短外接矩形。

宽最短外接矩形求取步骤如下:①根据连通域求得外接多边形;②得到外接多边形的凸包;③根据凸包求得宽最短外接矩形。

以字符“6”为例, 首先根据图2得到其轮廓图3, 进而得到其外接多边形。

下面简单介绍得到其外接多边形的步骤, 如图4所示。首先找到轮廓点中相距最远的两个点, 将其连成一条线段AB, 并查找轮廓点中距其最远的点C (图a) , 连接AC、BC, 同时查找出距各个边最远的点D (图b) , 如此反复迭代, 直到所有点到多边形的距离小于某一阈值T时停止。

由多边形可以得到多边形的凸包, 即可将求连通域宽最短外接矩形转换为求此凸包的宽最短外接矩形。

求多边形凸包的过程如下:以图5为例, 首先找出多边形ABCDEF中的凹进点C, 并将C点删除, 然后将通过线段与C点相连的另外两个端点B和D相连, 得到凸包ABDEF, 如此反复迭代, 直到不存在凹进点为止。

通过分析凸包的特征, 可以推断宽最短外接矩形一定经过此凸包的一条边和某个顶点, 只需求出某个点及此点到满足某一条件的边的距离, 比较得到所有距离中的最小值即可。经观察, 并不是所有边都能与当前顶点构成外接矩形, 以图5的D点为例, 只有边AB可以与D点构成外接矩形ABXY, 其它边与D点构成的矩形都会穿过凸包, 不能构成外接矩形。经分析, AB倾斜角θA→B在θD→C与θE→D之间, 即只有倾斜角在与D点相邻的两条边的夹角范围内才能构成外接矩形。

本文推出的这一结论具有一般性, 即对于凸包的任意一个点P, 以它为端点的两条边倾角分别为θ1、θ2, 如果某条边的倾角θ在这两个角之间, 则这条边可以与点P构成外接矩形。

对凸包的每个点寻找可构成矩形的边, 并记录点到这条边的距离, 所有距离中最小的即为宽最短外接矩形的宽, 与此对应的外接矩形即为宽最短外接矩形。

2 基于先验知识的垂直校正算法

2.1 垂直校正原理

根据先验知识可知每个字符的高宽比H∶W= 2。假设字符存在倾斜, 且倾角为α, 如图7所示, 原车牌字符所占矩形区域为ABCO, 有垂直倾斜的车牌图片中某字符所占区域为A′B′CO。在垂直校正过程中, 如图8所示, 车牌字符区域是ABCD, 错切变换为A′B′CD。

首先, 我们由水平倾斜校正, 在去除上下边框及铆钉之后, 可以得到字符区域的高度HSRC, 对应于图6中AY的长度LAY, 对倾斜字符寻找宽最短外接矩形如图7所示, 长度一定小于LBF, 宽度一定等于LBE, 我们过此外接矩形的中心点做水平直线, 与外接矩形交于M 、N点, 显然长度关系为:

因为在矫正过程中字符宽度不变, 可知图6中的LOC与图7中的LDC满足:

结合公式 (1) 的先验知识可知:

可以推得:

2.2 垂直校正算法流程

理论上对每个字符来说都有上述性质, 但考虑到边界可能存在边框或者边框外的干扰区域并不满足上述特性, 所以在粗定位之后应去除左右区域, 以防对最终计算结果造成干扰。在中间几个区域中选择5~7个字符区域, 对每个字符区域内的最大连通域进行标记, 并在原始二值图中依次寻找出每个连通域, 分别求得其宽最短外接矩形, 然后按照上述方法即可确定每个字符的旋转角度θi, 为避免可能出现的意外倾斜导致校正结果出现误差, 需要对θi进行滤除。

假设得到M个字符的旋转角θi, i=1, 2, …M , 旋转角均值为θa, 标准差为θs, 则

当存在θi不满足|θi-θa|<θs这一条件时, 则表示当前θi倾斜角度误差过大, 将其去除, 并对剩余θi求取均值及标准差, 如此反复直至全部θi满足这一条件, 此时求得的θa即为车牌垂直倾斜角度。

3 实验结果与误差分析

在实验中我们使用的车牌图像, 向左倾斜如图9所示, 校正过程如图10~12。图13为向右倾斜图片和校正结果。

利用本实验方法测得图9和图13的倾斜角度分别为-11.83°, 9.68° (顺时针为正) , 校正结果图为错切变换后的结果图。

本文选取100幅存在垂直倾斜的车牌图片, 分别用旋转投影法、直线拟合法与本文方法进行垂直倾斜校正。开发平台为32位WIN7系统下的VS2010, 开发语言为C#, 开发工具为EMGU CV, 处理器为Inter (R) Core (TM) i3CPU3.20GHz, 内存2G, 在去除其它步骤所花费时间之后对100幅图片用时及计算角度取平均值, 结果如表 (1) 。

根据表1, 从误差角度来看, 本文提出的方法明显优于前两种方法, 这是因为旋转投影法每次试探的旋转角度为1°, 产生的误差与步长有关。直线拟合法在左侧边界或字符的干扰下, 校正结果非常依赖原始车牌图的二值化效果, 鲁棒性很差。

在用时方面本文方法远远少于另外两种方法, 这与本文确定旋转角度的方法有关, 既不需要进行多次错切变换寻找最佳旋转角度, 也不需要寻找合适的边界点进行直线拟合, 只需对字符的连通域寻找宽最短外接矩形即可。

4 结语

本文针对车牌的垂直倾斜, 提出了一种新的垂直倾斜校正方法, 测试结果表明, 该方法无论是在校正误差还是校正耗时方面均表现优异, 有着精确度高、运行效率高和鲁棒性好的特点。

摘要：提出了一种车牌垂直倾斜校正方法, 首先通过垂直投影法粗定位字符区域, 标记区域内最大连通域, 然后寻找出原二值图中被标记的连通域部分的宽最短外接矩形, 最后根据先验知识和仿射变换原理求出字符垂直倾斜角度, 从而得到车牌的垂直倾斜角度。与已知的一些经典校正方法相比, 该方法更加简单实用, 能很好地满足工程需求。

关键词：车牌倾斜校正,车牌图像,垂直校正

参考文献

[1]Ching Y T.Detecting line segments in an image-a new implementation for hough transform[J].Pattern Recognition Letters, 2000, 22 (3) :421-429.

[2]潘武模, 焦阳, 王庆人.Hough变换在中文名片图像倾斜校正中的应用[J].中文信息学报, 2001, 15 (3) :50-56.

[3]郝永杰, 刘文耀, 路烁.畸变汽车牌照图像的空间校正[J].西南交通大学学报, 2002, 4 (37) :417-420.

[4]路小波, 包明, 黄卫.基于投影的车牌倾斜检测方法[J].交通运输工程与信息学报, 2004, 4 (2) :10-15.

[5]李文举, 梁笋群, 崔连延, 等.一种新的车牌倾斜校正方法[J].信息与控制, 2004, 33 (2) :231-235.

[6]吴一全, 丁坚.基于K-L展开式的车牌水平倾斜校正方法[J].仪器仪表学报, 2008, 29 (8) :1690-1694.

[7]潘梅森, 郭国强.基于图像矩的车牌号码倾斜校正[J].计算机辅助设计与图形学学报, 2007, 19 (8) :1041-1045.

[8]江建军, 廖爱姣, 吴文光.一个改进的车牌号码倾斜校正方法[J].湖南文理学院学报, 2012, 24 (4) :53-57.

基于暗通道先验的快速图像去雾篇9

然而,雾天图像的复原并非简单的任务,如果不考虑雾化图像的退化机理,采用传统的基于图像处理的增强技术,如直方图均衡,大多难以取得满意的复原效果。式(1)描述了雾天成像的过程[1],其中,t(x)=e-βd(x)定义为透射率,量化出场景辐射光在大气介质中的穿透能力。d(x)表示场景深度。根据式(1),图像退化来源于场景辐射光直线传播过程中引入的衰减,以及环境光经过空气溶胶颗粒的散射。这两部分都依赖于场景深度。若能从雾图中有效估计出场景的深度图(或透射图),将会有效增强图像去雾的效果。

1 相关工作

近年来,关于场景深度的估计出现了不少方法,例如,Kopf[2]提出直接通过给定场景的近似3D几何模型计算景深,Schechner等[3,4]利用同一场景下的多幅不同极化方向的图像推导深度信息,Narasimhan[5,6]依据不同天气条件下的多幅同场景图像对景深进行估计。目前研究最多的是借助于一些已知的先验或假设从单幅雾像中估计景深或者透射率,其中,基于暗通道先验假设的单幅图像去雾方法引起很大的关注。He[7]根据来自大量的户外无雾图片的统计结果,发现了暗通道的先验规律,并在大气散射物理模型基础上借助暗通道先验对降质图像进行复原。He[7]算法的局限性主要体现在两个方面,其一,采用软抠像方法对透射图进行精细化处理,会引入大量的计算和存储开销,影响算法执行效率,不适合实时处理;其二,对于暗通道先验失效区域,特别是天空区域去雾后容易产生色偏现象,复原效果不理想。

为实现实时去雾,近几年涌现出一些面向单幅图像去雾的快速算法。He[8]利用原雾图作为引导图像,通过对暗通道先验粗估计得到的透射图进行引导滤波达到精细化目标,虽然能够较好地保持原图的边缘结构,大幅度提高去雾速度,但无法完全消除边缘附近的光晕现象。Hu[9]利用透射梯度优先规律对软抠图处理进行优化,应用多分辨率处理降低计算复杂度。但由于升采样时并未考虑到原始边缘纹理等因素,容易导致在深度突变处残留部分光晕,而且计算复杂度仍然较高;Meng[10]利用边界限制条件估计出粗透射图,并构造正则函数对粗透射图模糊处理,虽然具有较快的处理速度,但在处理白色物体时,常常引起色偏;Tarel[11]利用中值滤波对大气耗散函数进行近似估计,虽然算法计算复杂度可以达到O(N),N代表图像包含像素的数目,但中值滤波的平滑处理会丢失许多边缘细节,导致复原效果不佳。Gibson[12]在He[7]算法的基础之上,使用中值滤波修正暗通道先验,由于该方法无需对透射图进行边缘优化,大大降低了计算复杂度,但复原效果不理想,容易出现黑斑效应。

为解决暗通道先验失效的情况,文献[13]提出从图像中分离出天空部分,通过特别处理防止发生色偏。但由于目前并未有一个鲁棒的天空识别方法能够适用于所有图像,因此识别出的天空往往是不精确的,容易造成复原图像在天空边界处不连续,影响了图像的视觉效果。

为此,本文将针对原始暗通道先验去雾存在的不足作出针对性的改进。为提高去雾速度,设计新的透射图优化方法替代复杂的软抠图技术,通过引入多分辨率处理,并结合最小滤波和联合双边滤波,实现快速有效的单幅图像去雾处理。另外,为解决暗通道失效的问题,提出透射率下限的自适应调节机制,扩大暗通道先验的适用范围,从而克服天空区域的色偏现象,提高去雾效果。

2 暗通道先验去雾

依据雾天成像模型,如式(1)所示,图像去雾的目标是从雾图I(x)中恢复出J(x)。为了简化计算,假设透射率在局部块中保持不变,并且大气光在所有颜色通道上的分量相同。为计算透射率,对式(1)的两端在所有颜色通道上执行最小滤波,可以得到:

根据暗通道规律,户外清晰图像中任意局部邻域都以很高的概率在某个通道上存在暗像素点,满足:

将式(3)带入式(2),可以得到透射率计算的简化形式:

事实上,即使是能见度极好的天气,大气中存在的微小颗粒也会造成远处景色的雾化效果。为了保证图像复原的自然度,He[7]提出在计算透射率时引入常数ω(0<ω≤1),得到

这样,复原后的图像J(x)可以表示为:

式(6)中,设定透射率下限t0是为远景保留一定的雾气,不破坏去雾后自然的视觉效果。

3 基于多分辨率处理的透射图优化

从式(5)中可以看出,暗原色的计算等同于对图像执行最小化腐蚀,单个亮度小的像素会拉低其邻域范围内的其他像素的暗原色,造成透射率的过高估计,容易覆盖或模糊边缘,导致在复原图像的景深突变区域产生“晕斑”现象。为此,He算法[7]应用软抠像方法细化透射图,本质思想是,采用高精准的插值算法,根据帧内相关性,从已知信息中求出未知信息。虽然能够较好地从粗透射图中还原出与原图像一致的边缘细节,但算法本身计算复杂度过高,耗时过长,不利于实时处理。

针对此问题,本文提出一种新的透射图细化方法,其核心思想是:在多分辨率处理框架下,利用最小值滤波与联合双边滤波代替抠图处理,对基于暗通道先验粗略估计出的透射图进行细化。具体的透射图细化方法描述如下:

首先,为了降低计算复杂度,应用均值化方法对原始雾图I进行下采样处理,得到低分辨率图像Id,如式(7)。

式(7)中,c表示颜色通道,n=max{round[max(h,w)]/Rs),1},Rs为降采样参数,h和w代表原始雾图I的高度和宽度。由于透射率与图像的纹理细节无关,采用均值降采样,除了降低计算量,还可以在保留深度信息的同时,达到模糊图像纹理的目的。

然后,根据式(4)计算Id对应的透射率粗估计td,并应用式(8)进行最小值滤波,执行初步细化处理。其中,Ωm(x,y)为以像素(x,y)为中心的方形邻域,邻域尺寸与He[6]算法中使用的最小操作窗口相同。最小值滤波的目的是,修复被高估计的边缘透射率,从而使透射图的深度信息接近于原始图像。

由于暗原色是基于局部腐蚀处理的,导致估计得到的透射图出现很严重的块效应,使得物体边缘模糊,特别是景深突变区域引起很大的估计误差。虽然经过最小滤波后,透射图在一定程度上减少了边缘附近的错误估计,但边缘结构的精细化程度还不够,并且与原雾图在边缘结构上一致性差。考虑到联合双边滤波在边缘保持特性方面的优势,本算法将原雾图的下采样灰度图作为引导图像,对经式(8)处理得到的初始细化透射图,执行式(9)所示的联合双边滤波,将雾图的边缘结构引导迁移到透射图中,实现边缘细化的目的。

式中f和g分别对应空域高斯滤波器和值域高斯滤波器,Kb为归一化因子,Ωb(x,y)为以(x,y)为中心,边长为r1的方形邻域,Idg为经过下采样后的雾图对应的灰度图像。

最后,对tdmb进行双三次插值处理,得到tmb恢复到雾图的原始尺寸。由于插值操作本身存在误差,当分辨率较高时,将造成透射图的深度结构与原图像相比偏差较大,在去雾结果的深度突变区域会产生少量光晕。所以,针对高分辨率的透射图tmb,需要引入额外的边缘修复。具体而言,采用Sobel算子对tmb进行边缘检测,边缘检测门限为Te,确定明显边缘点后对其执行宽度为w的膨胀处理。对膨胀区域的透射率再次应用联合双边滤波进行细化。为了降低计算开销,对于分辨率高的tmb,应选择较大的滤波窗口r2。

图1为本文算法与He[7,8]算法的去雾效果对比,可以看出,He[8]在景深突变附近仍存在一片薄的雾气,而本文算法能够取得与He[7]近似的去雾效果。更重要的是,对于图1中分辨率为1 024×768的原雾图,本文算法去雾时间仅为He[7]的0.73%,为He[8]的74.4%。

4 基于天空识别的透射率下限调整

根据式(2),推导出,

对于户外清晰图像,若场景中包含天空区域或者白色近景物,暗通道先验就会失效。对于先验失效区域,,意味着,实际的透射率会高于先验假设下的估计值。如果天空部分按照暗通道先验估计得到的透射率进行去雾,容易引起颜色失真。考虑到原雾图中天空亮度较大,根据式(12),天空部分的透射率接近下限。换句话说,式(6)中透射率的下限值主要影响天空区域的复原。因此,通过调节透射率的下限值能够修复因先验失效引起的透射率的错误估计。对于有天空的图像,设置较高的透射率下限值,反之,不包含天空部分的图像,设置较低的透射率下限值。

为实现透射率下限的自适应调节,能否有效识别图像中的天空区域是关键所在。直观上,天空区域具有平坦特性,在较大范围内是连通的,并且亮度较高。这里,为了识别天空部分,算法将同时满足平坦性、连通性以及高亮度这三个特征的像素视为可疑天空像素。统计可疑天空部分所占图像的比例,如果超出一定阈值,则识别出图像中包含天空区域。

为识别出所有具有平坦性的像素,对灰度图Idg进行梯度检测,设定检测门限为Tg,梯度超出Tg的像素为1,否则为0。然后对所有边缘点以宽度l进行方形扩展,得到二值图B,对B取反就得到平坦检测的掩码图Mg。由于天空像素都具有较大的亮度,为了识别出Idg中所有的高亮像素,设置亮度阈值Ti=0.95A,A为环境光强,生成亮度检测的掩码图Mi,将所有灰度值大于Ti的像素为1,否则为0。另外,为检测具有连通性的天空像素,根据像素灰度值,将Idg中灰度值接近的像素划为相同类别,求解式(13)所示的最优化目标函数,类别数目N=8,vi是Idg中的像素,Ck为聚类中心,初始值在图像中等间隔选取。

在分类结果中,选中最亮类别对应区域,将其所有像素设为1,其余为0,得到连通性检测的掩码二值图Mc。

综合考虑天空的平坦性、连通性和高亮特性,可以确定可疑天空像素集合,如式(14)所示,并依此计算可疑天空在Idg中所占比例η。式(14)中,&表示逻辑与运算。

文献[14]经过实验统计,得出天空区域的灰度近似符合正态分布。所以,识别出可疑天空像素还不够,还需要判别可疑天空像素集合是否近似满足正态分布。为此,算法对集合S作正态分布的卡方校验,设置显著水平为α。如果集合S中包含的像素数目达到一定比例Tn,并且S近似符合正态分布,则认定图像中包含天空部分。反之,可疑集合S对应浓雾区,虽然也满足高亮、平坦和连通的特性,但具有较小的透射能力。因此,对于浓雾区,为了获得理想的去雾效果,应该降低透射率下限值。并且,雾越浓,平均亮度越大,透射能力越小。

根据上述分析,我们可以依据集合S的平均亮度来调整透射率下限。定义为集合S的平均亮度。如果图像中存在天空部分,则。这里,λ为调节因子。为了防止下限过高,影响非天空区域的去雾效果,设定透射率下限不超过0.35。如果判定图像中不包含天空部分,设置。越大,t0越小。为保证t0非负,还需限定t0=max(t0,0)。

图2比较固定透射率下限和自适应调整透射率下限两种情况下的复原效果图。从图2中,可以看到,(a)、(c)中天空部分颜色失真,视觉效果不理想,而(b)、(d)天空部分很自然,消除了色偏现象。(e)和(f)不包括天空部分,但由于调整了透射率下限,相比(e),(f)中远处的浓雾区恢复效果更好,可见度得到提高。

5 实验结果与分析

为了验证算法性能,采用matlab(R2010b)运行算法代码,计算机硬件配置为Intel(R)Core(Tm)i5-4210U CPU@1.70GHz with 8.00 GB RAM。实验选取四幅具有较高分辨率的常用雾图(如图3)进行算法比较与分析。本文所提算法中,参数的设置如表1所示。采用K-Means聚类算法求解式(12)所示分类问题,卡方校验中采用的显著水平α=0.05,所提算法的其他参数与文献[7]一致。

5.1 去雾主观效果

图4~图8列出本文算法与目前几个主流算法的去雾结果。这里选取的比较算法包括直方图均衡算法[15],Tarel[11]算法,He[7]算法,He[8]算法。其中,直方图均衡[15]采用传统的图像增强方法执行去雾,在复原过程中不考虑雾图成像的机理,直接通过对比度增强来改善雾图的视觉效果。He[7]算法最早提出暗通道先验,为了优化去雾效果,应用抠图方法细化透射图,保持边缘结构。He[8]算法在暗通道框架下,应用引导滤波执行透射图细化。Tarel[11]算法应用中值滤波加快去雾处理。

从算法的去雾结果,可以看出,直方图均衡算法[15]的去雾效果最不理想,颜色失真严重,存在过饱和现象;Tarel[11]算法复原后的图像也存在明显的颜色失真现象。He[7]对于大部分图像具有较好的去雾效果,但去雾后整体颜色偏暗,缺乏层次感;He[8]能够较好地处理一般深度突变图像,但在部分深度突变剧烈处仍残留少量雾气,导致视觉质量严重下降;本文所提算法能够较好地保留边缘细节,颜色保真度好,复原图像更加清晰、自然。

5.2 去雾客观评价

为了从客观上验证算法的性能,本文采用梯度、平均亮度、信息熵三个性能指标评价复原图像的质量,并比较算法的去雾效率。图像的平均梯度表示边缘两侧附近的灰度变化率,在一定程度上能够反映图像的清晰程度;信息熵量化了图像包含的信息量,其值越大,图像细节特征越丰富;图像的平均亮度越接近0.5,人的视觉效果越好。

表2比较了图4~图8所示算法去雾结果对应的性能指标。从表2中,可以看到,经过本文算法去雾处理后的图像,对应的平均亮度、梯度和信息熵这三个指标,大多大于Tarel[11]算法,He[7]算法以及He[8]算法,仅次于直方图均衡算法。直方图均衡本身是以拉伸对比度为目的,虽然复原后图像在梯度、信息熵和亮度上具有较大的值,但这并不代表去雾效果好。从图3所示的去雾结果,可以明显看出,执行直方图均衡后复原图像表现出严重的颜色失真和过饱和现象。

另外,表3给出各算法对四幅图像进行去雾处理耗费的时间。从比较结果上看,本文算法的处理时间最短,算法执行的速度明显快于Tarel[11]算法和He[7]算法。而且,图像分辨率越高,这种速度优势越明显。可见,采用本文所提的透射图优化算法不仅可以获得更好的图像复原质量,而且计算复杂度低,具有更高的工程应用价值。

6 结论

【先验信息】推荐阅读：