最大信息熵

2024-07-01

最大信息熵(通用7篇)

最大信息熵 篇1

0 引言

在现实工作中经常会遇到将文件 (如纸质文件) 转换为数字信息并存储在计算机中的情况。传统方法是通过人工整理, 将这类文件中所需要的信息提取出来, 并通过相应软件存储在计算机中。若仅需处理少量文件则这种方法还可以接受, 但在现实工作中经常需要频繁地从海量文件中提取所需信息, 而该信息往往只是整个文件信息的一小部分, 如每个文件的下发时间值等, 采用传统方法会造成极大的时间和人力浪费, 因此不可取。针对此类情况, 可先将待处理文件制作成扫描件图像, 再利用计算机图像处理技术提取文件特征信息。

随着计算机技术的发展, 数字图像处理进入高速发展时期, 对海量图像进行特征信息的识别与提取已成为国内外科研人员的研究热点。当前国内外对图像特征信息识别与提取的应用领域研究主要集中在目标检测与识别、图像纹理分析、图像内容检索等。

在“信息大爆炸”的当今世界, 图像信息的获取和使用越来越便捷, 图像文件的交换和传输也越来越频繁, 特别是Web技术和图像数据库的应用使得高效地从海量图像文件中提取感兴趣的信息成为一个困扰人们的难题。在这种情况下, 如何选择合适的图像处理方法并借助计算机软件准确快速地提取图像特征信息, 具有重要的研究价值和意义。

最大熵模型[1]的一个重要优点是将各种不同来源的信息和知识聚集到一个框架下, 用于解决一些较复杂的问题。最大熵模型可以结合丰富的特征, 同时体现出每个特征的重要性。因此, 很多学者已应用最大熵模型来解决模式分类、特征识别等问题, 并取得了令人满意的结果。

1 AMEFE系统功能介绍

将最大熵原理[2,3]应用于扫描件图像特征信息识别分类器设计中, 利用最大熵原理动态地为源特征信息设定分类阈值[4,5], 以提高图像特征信息的识别率。提出了一种图像区域最大熵特征信息提取系统 (Area Maximum Entropy Feature Information Extraction System) , 简称AMEFE系统。本系统从扫描仪生成的位图文件中提取特征信息, 然后把特征信息存储于相应数据库中, 用户则通过建立在此数据库上的各种Web应用了解相关纸质文件信息。AMEFE系统工作方式如图1所示。

2 AMEFE系统工作过程

基于图像区域最大熵的特征信息提取系统 (AMEFE) 主要由文件获取、文件预处理、特征信息提取、文件批处理和特征信息导入5个部分组成, 整个系统的运行流程如图2所示。

2.1 文件获取

利用扫描仪将纸质文件转换为计算机能够直接处理的数字图像文件, 生成的图像文件大都以位图形式存储在计算机中, 由于扫描设备和环境的差异, 生成位图文件的位数也不相同。

2.2 文件预处理

文件预处理质量直接影响后续识别结果, 将待处理的图像文件 (通常是24位位图文件) 先转换为8位的位图文件, 然后采用中值滤波对图像进行平滑处理。中值滤波是一种局部平滑技术, 是一种非线性的滤波方法, 由于它在实际运算过程中不需要图像的统计特征, 所以使用比较方便。中值滤波可以克服线性滤波器所带来的图像细节模糊问题, 而且对滤除脉冲干扰及颗粒噪声最为有效。但对一些细节多, 特别是点、线、尖顶细节多的图像不宜采用中值滤波方法, 因为本系统处理的对象是纸质文件的扫描图像, 图像特征比较明显, 对纹理细节信息不关心, 所以采用此方法进行平滑处理。

对图像特征信息的提取需要解决两个关键问题, 一是选用什么特征来描述提取目标, 二是如何精确地度量这些特征。特征描述是用于区分特征信息的最基本属性, 特征信息的识别要依据特征描述才能正确进行。出于特征信息识别鲁棒性的要求, 设定的描述必须尽可能地保证特征信息不受噪声影响, 同时必须满足平移、缩放、旋转的不变性。图像的复杂背景不但影响对特征信息的描述, 而且还影响对特征信息的识别和其它处理。通过图像进行预处理的方法将识别目标集中在一个特定的较小区域中, 从而减小了目标检测时图像背景的影响。

2.3 特征信息提取

首先进行区域锁定, 将待提取的特征信息所在区域包含在所选取的窗口中, 此窗口的最初选取需要进行尝试性试探, 然后再对窗口图像进行二值化处理。在二值化处理过程中采用窗口图像灰度直方图的阈值法, 即将图像灰度直方图两峰之间的谷底灰度值作为图像二值化处理的阈值。最后依据AMEFE特征信息识别器提取特征信息。

AMEFE特征信息识别器的设计以对被识别特征进行分类所造成的错误识别率最小或引起的损失最小为识别决策, 并建立在对源特征信息识别库的学习训练基础上。AMEFE特征信息识别器的设计流程如图3所示。各个单元之间的任务是相互依赖、相互反馈的。

识别器的设计建立在图像最大熵原理和结构风险最小原理基础之上, 通过适当选择最大熵阈值函数使对训练样本的实际学习风险最小, 保证了通过有限训练样本得到的小误差识别器及对独立测试集的测试误差仍然最小, 进而得到一个具有最优识别能力和推广泛化能力的特征信息识别器, 较好地解决了小样本、非线性和局部极小值等实际问题。

2.4 文件批处理

对同一批次文件进行集中处理, 不仅可以提高特征信息提取效率, 而且可以减少对数据库的操作, 有助于提高数据安全性。批处理的直接结果将生成一个数据列表文件, 包含本次批处理的各个文件名称和其相对应的每个特征信息, 这个数据列表文件可以是Excel文件也可以是txt文本文件。

2.5 特征信息导入

将文件批处理得到数据列表文件中的数据一次性导入到相应数据库中, 此后对数据的所有操作都交给相应的DBMS完成。工作人员或用户即可通过Web页面或各种客户端应用程序完成相应操作, 完全摆脱了对实体文件的依赖, 提高了信息化管理应用水平。

3 结语

当今社会对于信息公开的呼声越来越高, 但有些部门文件具有低度的私密性, 完全以私密性为由拒绝公开全部内容又不太合适, 在这种情况下可采用AMEFE系统将文件中的非私密性信息提取出来, 以Web等形式进行公开。这样既满足了公众对信息公开的诉求, 又保证了原始文件的绝对私密性。

参考文献

[1]胡琛, 王彬.基于最大熵原理的分布模型[J].山东理工大学学报:自然科学版, 2007, 21 (6) :87-90.

[2]曲英杰, 孙光亮, 李志敏.最大熵原理及应用[J].青岛建筑工程学院学报, 1996, 17 (2) :94-100.

[3]杨杰, 胡德秀, 吴中如.基于最大熵原理的贝叶斯不确定性反分析方法[J].浙江大学学报, 2006, 40 (5) :810-815.

[4]史玉峰, 靳奉祥, 王健.基于信息熵的测量数据粗差识别法[J].测绘通报, 2002 (2) :38-41.

[5]汪海洋, 潘德炉, 夏德深.二维Otsu自适应阈值选取算法的快速实现[J].自动化学报, 2007, 33 (9) :968-971.

最大信息熵 篇2

为此, 全世界各国家正在做出努力, 已产生诸多优秀成果。如:欧洲的工业遗产之路、澳大利亚的Sovereign hill主题公园、日本的淡梦露舞台 (安藤忠雄) 及英国的Eden Project (1996~2001, Nicholas Grimshaw) 等。在我国, 约有20家矿业废弃地正在进行改造, 并初有成效, 如:湖北黄石矿山公园、景德镇高领国家矿山公园、阜新海州露天矿山公园等。

1“信息熵”最大化模式理论

为了弥补城市生态系统中的已破坏因素, 1948年Shannon提出了“信息熵”理论。现已成为城市化进程模型的理论根基, 保证城市生态系统能够健康有序地发展。“信息熵”的实质为任何信息都存在冗余, 冗余的大小与信息中每个符号 (数字、字母或单词) 出现的概率或者不确定性有关, 它借鉴热力学概念, 把信息中排除了冗余后的平均信息量称为“信息熵”[1]。从可表示混沌度的“熵”来说, 当熵值越大, 无序的平衡度越强, 则熵的最大化模型越稳定, 向一个方向的流动性就越强。城市生态系统是一个循环统一的体系, 熵的作用就犹如“源—消费中心—汇”循环体系 (John Lyle, 1872~1945) (见图1) , 可使整个城市形成一个再生系统, 在有序、不间断的理想循环状态过程中, 不存在任何废物。即“熵”最大化模式理论在城市发展中的应用。

2 发展模式

2.1 集中发展模式

由于废弃地的大小、形态以及所处城市的位置、气候不同, 废弃地的发展模式也不甚相同。

英国以单元式集中发展模式为主, 把整个国家的遗产节点组合起来形成一条工业遗产之路, 进而形成网络, 每个遗产节点都以一个大型国家生态公园作为遗产依托 (见表1) 。

曾为联邦制国家的德国, 如今发展了许多以“区域模式”为核心、以城市“绿心”为特点的各种废弃地再生项目, 包括各种创意活动、生态环境修复、工业遗产旅游组织等。特别是鲁尔区的卓越成就, 并使其成为2010年“欧洲文化城市”的王牌。

2.2 细胞发展模式

对于土地面积极为广泛的国家来说, 集中发展的模式并不能实现“熵最大化”;这时, 采用细胞发展模式可以带来更大的收益。

如澳大利亚的Sovereign hill主题公园 (见图2) , 它将建筑、留有回忆的工业遗迹等保留, 在既有的环境基础上进行改造, 现已成为支撑该区域经济发展的核心。无论是从保护历史遗迹的角度出发, 还是以城市经济发展的视角都能全面解读废弃土地的“熵最大化”理论。又如我国近些年改造的矿山公园, 它们分布在各个省份, 多以工业遗迹旅游为主题, 不仅给城市创造了更多的“绿色肺部”, 给市民带来更多的城市休闲空地, 而且丰富了城市的部分文化遗存, 并带来了更多的经济效益。

3 生态循环

3.1 水循环

水循环是生态循环系统中的重要组成部分, 这对采矿塌陷区尤为重要。在塌陷区的修复过程中, 应将水体中的重金属、有机、酸性、碱性等污染物及含氮、磷元素的污染物质去除, 并需考虑地表渗水、矿区生活污水和废液处理等方面内容。通过有效的方法去除上述污染物后, 应先使废弃地自身形成一个良性的循环体系, 再结合城市生态产业形成一个完整的生态系统。不可忽视, 雨水和废水是矿区水循环中的两个主要内容。

其中雨水的循环利用最为简单, 如英国Eden Project, 雨水打落屋顶随之跌落到建筑最低点的人工湖后, 人们可以经过压力再把它抽出用来灌溉植物以及形成人工瀑布或人工降雨, 从而使其小空间体系与整个城市系统紧密结合 (见图3) 。

3.2 植被恢复

植被作为生态系统中新陈代谢的重要组成部分, 在废弃地改造中可以起到改良土壤、修复环境的作用;并能对建筑物及构筑物等硬质景观进行柔化协调且在空间造景等方面也能起到一定的强化作用, 是“熵”最大化在城市废弃土地中不可缺少的一部分, 并起到一定的媒介作用。由安藤忠雄设计的淡梦露舞台 (见图4) , 运用了300多种植物, 形成台地式城市绿肺, 将光秃的砂石场变废为宝, 将植物有造型地、顺应地势地铺设在框架之中, 将生硬的混凝土柔和成为城市的休闲娱乐中心, 促使城市生态、经济、文化等的良性循环, 并充分利用了土地, 从而达到“熵”最大化。

4 结语

重工业城市是中国乃至世界发展的基石, 其中对废弃土地的改造和更新在城市发展中起到举足轻重的作用。在适合的城市发展模式下, 围绕良性的生态系统, 加之建筑文化的运用, 可达到“熵”最大化, 从而带动城市的经济、情感和活力, 引导我们走向新一代健康、富有生机的城市环境和社区。

参考文献

[1]张妍, 杨志峰, 何孟常, 等.基于信息熵的城市生态系统演化分析[J].环境科学学报, 2005 (8) :26-29.

[2]孟丹.基于生态修复模式下城市矿业土地的更新利用研究[A].第四届城市与景观“U+L新思维”全国学术研讨会[C].2008.

[3]刘伯英, 冯钟平.城市工业用地更新与工业遗产保护[M].北京:中国建筑工业出版社, 2009.

[4]刘伯英, 栗得祥.唐山市古冶区工业废弃地活化与再生策略[J].建筑学报, 2006 (8) :24-27.

[5]孟丹.矿业型工业废弃地建筑与环境再生性研究[M].大连:大连理工大学, 2011.

最大信息熵 篇3

煤矿生产物流系统是一个多环节、多工序、多种物流并存且生产过程复杂的系统,既受地理环境影响,也受材料、设备、人员、风、水、电等影响[1]。为了保证煤矿生产物流系统处于可持续生产的状态,必要的安全资源投入是确保其安全高效生产的重要前提[2]。然而,通常煤炭企业在资源配置时存在较强的主观性,将有限的安全资源不分重点地投入到生产中,就会使某一子系统的安全资源投入偏多,其他子系统的安全资源投入不足,导致安全资源配置失衡,从而引发安全事故,严重制约了煤炭企业安全水平的提高。因此,对煤矿生产物流系统安全资源进行合理的优化配置,有利于保证其在安全高效的状态下可持续运转。

目前,针对煤矿生产物流系统安全资源配置研究的文献较少,已有文献大多是根据安全水平影响因素配置安全资源,或是在资源配置效率评价、人员资源配置及应急资源配置等方面,采用因子分析、神经网络方法、DEA方法及多目标规划等方法解决整体资源配置评价问题[3,4,5,6]。然而,资源配置是一个复杂多变的动态过程,存在较多的人为因素,而上述研究建立在整体性分析的基础上,较少考虑将复杂不确定系统进行结构化分层,难以清晰、公平、合理地进行安全资源配置。因此,本文在保证公平合理的前提下,结合煤矿生产物流系统动态时序、复杂多变及不确定性的特征,采用信息熵方法[7,8,9]对煤矿生产物流系统各安全资源指标进行定量化计算分析,建立基于最大信息熵的安全资源配置模型,以期能够有效指导煤矿生产物流系统安全资源的优化配置。

1 安全资源指标体系确定

煤矿生产物流系统是一个多种物流并存且由各级子系统相互交叉形成的复杂大系统,可分解为风、水、人员、动力、煤炭、矸石及材料等7种物流形态,不同物流形态间有耦合关系且相对独立。因此,根据煤炭生产过程的不同物流形态,将煤矿生产物流系统划分为7个子系统:开采子系统、储存子系统、装卸子系统、运输子系统、通风子系统、排水子系统及其他辅助子系统[10]。

煤矿生产物流系统安全资源主要指为确保煤炭生产企业处于安全高效的生产状态,在一定时期内对相应物力、财力等无形及有形物质的投入[11]。由于安全资源配置的过程与结果受到人员、设备、环境及管理水平等多因素影响,且上述因素的状态受到煤炭生产企业对其所做投入的制约,不同的安全资源投入组合制约着系统的安全资源配置效果。本文根据安全资源的投入情况,从合理配置安全资源的角度出发,选取人员、设备、环境、管理等因素作为安全资源配置的基础指标Zij(其中i为子系统个数,i=1,2,…,7;j为指标数,j=1,2,3,4),构建煤矿生产物流子系统安全资源配置指标体系,见表1。

2 安全资源配置模型构建

为了确保煤矿生产物流系统安全高效运转,其重点在于公平合理地优化系统安全资源配置。由于煤矿生产物流系统由开采、储存、装卸等7个子系统构成,如何将有限的安全资源在煤矿生产物流的7个子系统中进行合理优化配置成为亟待解决的核心问题。本文在对煤矿生产物流系统进行安全资源配置的过程中,首先运用熵值法确定各个指标的重要程度,即权重系数,以求取各个安全资源指标分配量的加权信息熵总和最大值的函数作为该模型的目标函数;其次,设子系统安全资源分配量为决策变量,在安全资源总量增加和各子系统所需安全资源分配量的约束条件下进行优化求解,最终求出各子系统安全资源的最优分配组合,实现系统内各子系统安全资源的合理配置。

2.1 信息熵基本原理

信息熵方法可用于处理复杂不确定系统概率分布问题[12],它表示任何一种能量在空间中分布的均匀程度。对于一个不确定系统,信息熵方法可以用来评价系统的均衡性。信息熵方法的核心内容是指对于一个不确定的复杂大系统,用随机变量X表示它的状态特征,对于离散型随机变量,假设X的取值为X={x1,x2,…,xn}(n≥2),则每一取值对应的概率:P={p1,p2,…,pn}(0≤pi≤1,i=1,2,…,n)。,得到该系统最终的信息熵计算公式为[13]

本文利用信息熵方法计算每项安全资源分配量的信息熵大小,得到所选取安全资源指标分配量在各个子系统间的差异化水平:安全资源指标分配量的信息熵值越大,表示各子系统间的安全资源配置越均衡,各个子系统间的安全资源指标分配量的差异越小,从而衡量各子系统安全资源指标分配量的差异程度[14]。

2.2 模型构建

(1)信息熵值及权重确定。由信息熵理论可知,信息熵用于衡量信息的不确定性,若某一指标的熵值越小,说明该指标对系统所起的作用越大,应赋予该指标较大的权重。对于第j项安全资源指标,各子系统中该指标值的差异性越小,那么该指标的信息熵值越大,当各子系统的该项指标值全部相等时,该指标的信息熵值为最大,即ej=1,表示该项指标与安全资源配置无关系。反之,则表示该项指标与安全资源配置之间关系越大。本文利用熵权法确定安全资源指标的权重,依据指标的熵值大小ej与该指标下各子系统的偏差程度之间的关系,定义指标j的差异因数为

gj越大,表示第j项指标越重要。若共有n项指标用差异因数gj来确定第j项指标的权重,则其权重为

(2)目标函数。将各子系统安全资源分配量作为决策变量,分别计算每个资源指标的信息熵值,运用熵权法得到每个资源指标权重,以每个指标的安全资源分配量对应的信息熵值加权总和E最大化作为目标函数:

各子系统安全资源分配量占该资源总量的比重Pij及各安全资源指标的单位安全资源分配量Xij计算公式如下:

式中Wi为第i个子系统内安全资源分配量。

各子系统安全资源分配量的信息熵值ej为

第j项指标的权重ωj为

(3)约束条件。安全资源总投入增加约束:为了提高系统整体的安全生产水平,煤矿生产物流系统拟于2016年增加总安全资源投入量,增加的安全资源投入量比例不超过q,可得

式中W0i为第i个子系统安全资源投入量的实际值。

各子系统基于现状的安全资源投入增加比例约束:鉴于煤矿生产物流系统中存在不同物流形态的7个子系统,其各自对安全资源投入量的需求不同,根据某矿业集团对各个子系统基于现状的安全资源投入量增加比例要求,可得

式中ai,bi分别为第i个子系统安全资源投入增加比例的可行上限和下限。

最后,确定安全资源配置模型如下[15]:

3 实证分析

本文选取某矿业集团下属M煤矿生产物流系统(以下简称M系统)作为分析对象,M系统于2015年投入安全资源总量为953万元。为使M系统处于安全高效的可持续生产状态,预计在2015年安全资源总投入的基础上最多增加29%作为2016年安全资源总投入。将获取的相关数据代入已构建的基于信息熵的煤矿生产物流系统安全资源配置模型并求解,并对资源配置前后的安全资源分配比例进行对比分析,提出合理可行的资源配置方案。

3.1 数据收集及处理

2015年M系统安全资源指标初始投入量见表2。

万元

3.2 模型构建及求解

将表2数据代入式(11),得到最终的安全资源配置模型:

根据表2中的数据,利用最大信息熵理论求解,得到了2015年影响安全资源配置的各安全资源指标的信息熵及对应的加权信息熵总和,见表3。

从表3可看出,人员及管理因素的信息熵值较低,表明各个子系统在人员及管理方面的安全资源分配极为不协调;运输子系统属于煤矿生产物流的重要系统之一,在人员方面分配的安全资源最少;设备、环境因素的信息熵比较高,说明各子系统安全资源在设备及环境方面的分配合理且相对均衡。

按照煤矿生产物流系统安全资源配置信息熵模型,利用Matlab软件求解,可得安全资源各指标信息熵优化结果及具体配置方案,见表4、表5。

3.3 结果分析

从表4可看出,设备和环境因素的安全资源分配量基本处于平衡状态,因此,随着安全资源投入量的增加,设备和环境因素2项指标的信息熵值变化程度较小。从表5可看出,安全资源总量增加16.42%时,信息熵值加权和最大,得到最佳安全资源配置方案:2016年安全资源总投入量为1 109.48万元,7个子系统的安全资源分配量分别为164.72,146.74,172.97,175.52,158.97,173.50,117.06万元。对于各子系统而言,具体分析如下:

(1)运输及排水子系统的增加比例较大,属于重点增加投入子系统,结合表2可知,其安全资源分配量偏低。运输子系统的最低安全资源分配量占安全资源总量的17.84%,而在人员方面的分配只有10.76%,在管理方面的分配仅为13.31%;排水子系统的最低安全资源分配量占安全资源总量的15.03%,而在人员方面的分配只有11.54%,在管理方面的分配仅为11.35%,从而造成这些子系统实际的安全资源分配不能满足最低安全资源配置量,应加大在人员和管理两方面的安全资源投入量。因此,对于运输子系统和排水子系统安全资源投入量的增加比例较大。

(2)开采子系统及通风子系统的安全资源投入量过多,2个子系统均存在资源冗余现象。其原因:开采子系统最低安全资源分配量只占安全资源总量的14.43%,而在管理方面的分配已达为16.87%;通风子系统最低安全资源分配量占安全资源总量的14.41%,在人员及管理方面的分配分别达18.45%和16.87%,应适当削减安全资源投入力度,因此,开采子系统及通风子系统安全资源增加比例较小。

(3)储存、装卸及其他辅助子系统的安全资源分配量较为合理。分析表2可得,储存、装卸及其他辅助子系统在人员、设备、环境和管理等方面的安全资源分配量比例均与其最低的安全资源分配量占安全资源总量的比例相一致,因此,2016年安全资源分配增加比例与原有比例相差不大。

4 结语

最大信息熵 篇4

给定经过分词和词性标注的文本T=w1/t1w2/t2…wn/tn,目标是识别T中所有的名词短语。我们将识别名词短语的任务定义为给名词短语添加边界标记。[1]

例:南帆/nrm说/vs,/w没有/vs任何/rg作家/ng可以/vs垄断/vs一/mx种/qk文体/ng。/w

B表示名词短语的开始,I表示在名词短语中,O表示非名词短语,那么上例中我们可以清楚地看到“任何作家”和“一种文体”是名词短语。

2 最大熵模型

设随机过程P所有的输出值构成有限集Y,对于每个y∈Y,其生成均受上下文x影响,x属于有限集X。对于名词短语识别问题,x表示待识别词w0的上下文环境,y表示输出,在此只有三个值:B,I和O。模型的目标是:构造一个可以精确描述随机过程行为的模型,该模型对于给定上下文x∈X,可以计算输出为y∈Y的条件概率p(y|x)。[2]

2.1 问题描述

在机器学习的过程中,我们需要对随机过程进行观察,从专家标注的语料库中抽取大量的训练样本(x1,y1),(x2,y2),…,(xn,yn),即语料库中每个词的上下文及其确定的输出y。可以用训练样本的经验分布来表示它,即

其中,freq(x,y)表示特征(x,y)在样本中出现的次数。

2.2 相关定义

定义1.特征

设x∈X且x=w1w2…wn,设c是x的子串(长度≥1),若c对y∈Y具有表征作用,则称(c,y)为模型的一个特征。特征分为原子特征和复合特征:若串c的1,则称(c,y)为原子特征;否则,称(c,y)为复合特征。

定义2.特征函数

特征函数fi(x,y)是一个二值表征函数,是我们对所获取的特征的一种表示方法,表示(x',y')是否与特征(c,y)有关。定义(x',y')关于特征(c,y)的特征函数为

由以上定义可以看出,样本中待识别词w0和出现在w0周围的词都可以作为模型的特征,因此与模型有关的备选特征的集合会很大,但模型选出的特征只是真正对模型有用的特征,是候选特征集合的一个子集,它能较完整地表达训练语料中的数据。在此引入约束。

定义3.约束

假设为特征f对于经验概率分布的数学期望,表示为

p(f)为特征f对于由模型确定的概率p(x,y)的数学期望,表示为

其中,

令,则限定所求模型的概率为在样本中观察到的事件概率,而不是所有可能出现的事件的概率。若f对模型有用,则令为约束。

概括地说,最大熵模型的基本思想是:给定训练样本,选择一个与训练样本一致的模型,最大熵模型应选择与这些观察相一致的概率分布,而对于除此之外的情况,模型赋予均匀的概率分布。

2.3 最大熵模型的特征

由于是对每一个词进行名词短语标注,每一个词的名词短语标注过程都被看作是一个事件,因此由当前词及它的上下文环境来确定一个事件的特征集合。根据影响当前词名词短语标注的各种因素,可以定义特征空间。[3]

定义4:

特征空间由以下两部分内容组成:

1)词性,当前词及其前后各两个词的词性;

2)词,当前词及其前后各两个词。

根据定义1,我们可以知道最大熵模型中的特征可以分为原子特征和复合特征两种。从以上特征空间的定义4,可以得到十个原子特征,例如当前词的词性,当前词的前一个词的词性等等,表1列出了特征空间中所有的原子特征表达式及各个特征所代表的意义。

由于在上下文中,仅仅用原子特征不足以表示上下文中的一些呈现规律性的语言现象,对文本中词的名词短语标注贡献较小,必定造成低识别率,所以应该在最大熵模型中使用复合特征。复合特征是由原子特征组成,而复合特征集又由复合特征组成。复合特征表示为二值特征函数的形式与原子特征相似,只是在取值时需要满足的条件变多。本文中定义的复合特征集中共含有八条复合特征,这些复合特征能够对名词短语的标注提供较多的信息,可以提高名词短语标注的正确率。符合特征集如表2复合特征表所示。

3 特征选取及实验

上面定义了原子特征集和复杂特征集,然而并非所有特征都适合引入到最大熵模型中去。对于要处理的问题,特征所含的信息量越大,该特征就越适合引入到模型中。通过原子特征和复合特征得到的特征构成候补特征集合,然后从中选取对模型最为有用的特征。本文通过采用实验的方法选取对模型最为有用的特征。

3.1 系统结构

如图1是所示,系统主要有模型训练和名词短语识别两大主要模块构成。在模型训练模块中,系统在训练语料上一次进行特征提取、特征选择和迭代训练工作,从而得到模型的参数。在名词短语识别模块中,系统用训练过的最大熵模型在自动分词后的待标注文种上进行名词短语的标注。在模型训练模块中,最大熵模型采用文献[3]上用JAVA语言开发的Maxent软件包。此软件包运算速度快,占用机器内存少,使得我们的大量数据在较短的时间内完成训练及测试。如图1名词短语识别系统流程图。

3.2 实验结果及分析

在表1中我们给出了实验中用到的特征,但是并不是所有的特征对名词短语的标注贡献都是相同的。有一些特征对标注贡献较大,可是还有一些特征可能对标注起到了副作用。所以接下来我们必须通过实验对这些特征进行检验,选出合适的特征组合,作为最大熵模型的输入。对表2中的八个复合特征分别进行实验,进行了基于最大熵模型的名词短语标注实验。表3是这八个复合特征的实验结果。

从表2中可以看到,系统1采用当前词的词性和当前词的后一个词的词性作为复合特征,系统2采用当前词的词性和当前词的前一个词的词性作为复合特征,而这两个系统的结果相差很大,正确率相差了8.02%,而这两个系统恰恰又是这八个系统中正确率次低和最高的两个系统。这充分说明当前词的前一个词性对分类的贡献非常大,而后一个词的词性对分类的贡献相对较小。接下来我们再来看特征6和特征7。特征6是采用当前词的前两个词的词性和后两个词的词性作为系统实现的复合特征,特征7是采用当前词的前两个词的词性、后两个词的词性以及当前词本身的词性作为复合特征,从表3中可以看到,特征6的准确率要比特征7的准确率高一点点,所以可以得出结论,当前词的词性对分类的贡献不大,而且会起到负面的作用。再来看特征8,特征8的准确率非常低,和其它系统的准确率不在同一个水平上。特征8采用的复合特征由当前词和当前词后的第二个词的词性组成的,由于使用词作为特征,容易引起数据稀疏,再加上当前词后的第二个词的词性这一特征,距离当前词比较远,对分类的影响较小,所以,它的分类结果会很差。

综合表3的实验结果和以上对实验结果的分析,最后我们选定原子特征为Pos-1,复合特征选取在上述实验中效果较好的,在表2中的复合特征2,3,6。所以最终系统的特征模板为:

用此特征模板进行实验,实验结果就是基于最大熵模型名词短语识别的最终实验结果,如表4试验结果表所示。

4 结束语

该文首先介绍了最大熵模型的基本原理,然后针对名词短语识别的任务为最大熵模型选取特征,构建了复合特征。接下来设计了系统的结构,针对8个复合特征分别进行实验。通过对基于复合特征系统的实验结果的分析,选定了4个特征作为最终系统的输入,结果显示了较高的正确率和召回率,完成了使用最大熵模型实现名词短语的识别的任务。

为了进一步提高名词短语的识别的准确率,可以在加入词、词性信息的基础上加词语的语义信息,在统计方法上增加规则弥补模型的不足,并考虑如何减少自动分词错误对识别结果的影响。

参考文献

[1]赵军.基于转换的汉语基本名词短语识别模型[J].中文信息学报,1999,13(2):1-7.

[2]周雅倩,郭以昆,黄萱菁,等.基于最大熵方法的中英文基本名词短语识别[J].计算机研究与发展,2003,40(3):440-446.

[3]周明.基于语料库的中文最长名词短语的自动抽取[J].计算语言进展与应用,北京:清华大学出版社,1995:50-55.

最大信息熵 篇5

在图像研究领域,图像分割是图像处理到图像分析的关键步骤。图像分割通常为了进一步对图像进行识别、跟踪、理解、压缩编码等,分割的准确性直接影响后续任务的有效性,具有显著的实际意义。图像分割方法主要有阈值法、区域跟踪法和边缘检测法等,其中阈值法最为常用。

阈值法是对图像的直方图进行分析处理,选取恰当的阈值。在实际应用中,属于目标的某些灰度值是已知的,还有一些灰度值可能属于目标,也可能属于背景,通常使用双阈值方法将图像分为目标核、邻接核和背景核。在这种情况下,使用第一个阈值来分离目标图像,形成目标核;然后,使用第二个阈值来吸收那些目标核的邻接像素,即两个阈值之间形成邻接核;剩下的就是背景核。1985年印度学者Kapur和加拿大学者Sahoo、Wong 3人共同提出一种最大熵自动阈值法,简称KSW熵法。利用最大熵原理,在阈值法图像分割时,构建关于多个阈值的目标函数,进而转化为一个数学优化问题。

遗传算法是美国Holland教授提出的模拟自然界遗传机制和生物进化论而成的一种并行随机搜索最优化方法。遗传算法简单,可并行处理,能得到全局最优解,在函数优化、组合优化、自动控制、机器人智能控制、人工生命、图像处理和模式识别等领域具有广泛应用。

2 最大熵双阈值算法

在信息论中,熵量度不确定性,不确定性程度越高,可能获得的信息量就越大。通过计算图像灰度直方图的熵,找出最佳阈值,进而区分目标和背景的差异。

2.1 数学模型

设图像有M个像素,图像的灰度值集合为{0,1,…,L-1},fi表示灰度值为i的像素个数,pi表示像素灰度值为i的概率,则:

其中,

于是,熵的判别函数定义为:

最大熵算法的原理就是使得图像中各个目标与背景分布的信息量最大,即得到使熵的判别函数最大的分割阈值。

上述(1)-(5)式是最大熵多阈值算法的数学模型。特别地,当N取3,可以得到最大熵双阈值算法的数学模型,即:

2.2 编程设计

利用Matlab软件编写熵的判别函数,考虑使用5个输入参数,分别为第一个阈值、第二个阈值、灰度最小值、灰度最大值及像素直方图灰度数组;函数输出为双阈值划分后的图像总熵值。实际编程中,还要考虑图像中3个类别划分的合理性,不能出现某个类别概率为0或1的情况。函数的构造原型为:

3 遗传算法设计

3.1 定义

遗传算法将“优胜劣汰,适者生存”的生物进化原理引入优化参数形成的编码序列种群中,按所选择的适应度函数对种群进行评价、筛选,通过复制、交叉和变异组成新的种群,新的种群既继承上一代的信息,又优于上一代。这样周而复始,种群中个体适应度不断提高,直到满足一定条件或进化终止,如图1所示。在遗传算法中使用适应度来量度种群中各个个体在进化中有可能达到、接近或有助于找到最优解的优良程度。

遗传算法的基本操作如下:

(1)复制(Reproduction)。复制是从一个旧种群中选择生命力强的个体产生新种群的过程。根据个体的适应度复制,适应度高的个体遗传到下一代的概率就大,适应度低的个体遗传到下一代的概率就小。它模拟自然现象,符合达尔文的适者生存理论。复制操作可以通过随机方法来实现,即首先产生0-1之间均匀分布的随机数,若某染色体的复制概率为40%,则当产生的随机数在0.60-1.0之间时,该染色体被复制,否则不被复制。此外,还可以通过其他方法,比如适应度比例法、期望值法、排位法等,其中适应度比例法较常见。

(2)交叉(Crossover)。复制可以从旧种群中挑选出优秀者,但不能创造新的染色体。交叉就是模拟个体在进化过程中的繁殖现象,通过两条染色体交换组合,产生新的优良品种。一般过程为:随机选择两条染色体,随机选择一个或多个交换点位置,交换双亲染色体交换点右边的部分,即可得到两条新的染色体。交叉概率高意味着个体更新较快,可以达到更大的解空间,并降低取得非最优解的概率,但对已有优化模式的破坏性也随之增加;交叉概率过低,系统会因搜索范围的减小而变得迟钝。交换过程体现了自然界中信息交换的思想。

(3)变异(Mutation)。变异运算用来模拟生物在自然界中由于各种偶然因素引起的基因突变,它以很小的概率随机地改变染色体序列。在染色体序列以二进制编码的系统中,它随机地将染色体的某一个基因由1变为0,或由0变为1。变异操作可以防止进化过程在早期就陷入局部解而终止,在初始基因组合以外的空间进行搜索,获取质量较高的优化解。

3.2 遗传算法的设计思路

针对最大熵双阈值图像分割特点,遗传算法设计主要包括以下几个方面:

(1)染色体编码。图像灰度值在0-255之间,由于使用双阈值分割,故个体染色体编码为16位二进制,前8位表示第一个阈值,后8位表示第二个阈值,且第二个阈值大于第一个阈值。

(2)种群规模。初始化种群为随机产生的,这里设置初始化种群数量为50,最大繁殖代数为300。

(3)适应度函数。将熵的判别函数作为适应度函数,计算各个个体适应度。

(4)复制操作。采用轮盘赌法,产生0-1的随机数,使用适应度比例法对个体进行概率复制。

(5)交叉操作。采用双点交叉,随机产生两个交叉点分别位于染色体序列的前8位和后8位,交叉长度为1位至7位不等,交叉概率取0.6。

(6)变异操作。采用二进制编码方式,按位取反,每一位都有变异可能,变异概率取0.03。

(7)终止准则。在双阈值分割中,相邻两代平均适应度之差小于0.01,即种群趋向稳定,进化完成。

3.3 遗传算法的编程

根据上述遗传算法的设计思路进行编程,编程的重点放在遗传算法的基本操作上,即复制操作、交叉操作、变异操作。3种操作对遗传算法影响很大,决定着遗传算法的运行速度和效率。Matlab软件对3种操作编程代码如下:

4 结果分析及算法改进

对一个医学CT颅脑图像进行最大熵双阈值分割,处理结果如图2所示,图像右侧软化灶在阈值分割之后清晰可见,具有很高的对比度。在处理图像时,应排除背景纯黑干扰像素的影响,熵的判别函数灰度最小值从1开始。

在程序的运行过程中,发现终止准则和最优解的选取方法对程序运行影响较大,对程序进行以下改进:

(1)将相邻两代最大适应度之差小于0.01加入终止准则。平均适应度仅代表种群整体进化情况,不能代表种群中最优秀者水平。由于算法中要选择最优解,比较相邻两代最大适应度之差就显得比较重要,将这个条件加入终止准则,对最优解的寻找是有利的。

(2)将最小繁殖代数限制加入终止准则。为提高程序的运行效率,繁殖代数只规定了最大繁殖代数,实际的繁殖代数由终止准则确定。实际运行发现,有的繁殖经过几次或者十几次就满足了终止准则,繁殖代数过低对最优解的寻找是不利的,此时规定最小繁殖代数为50。

(3)在每一代种群最大解的基础上挑选最优解。传统遗传算法中,最优解一般在进化完成的那一代种群中寻找,之前进化的种群不参与最优解的寻找,这样做的后果就是将可能的最优解抛弃掉,在每一代种群最大解的基础上挑选最终的最优解是合理的。

经运行发现,上述CT颅脑图像的最优解范围:第一个阈值为96,97或98,第二个阈值为133或134,双阈值分割熵值为10.9600-10.9690。仿真实验在Intel i5-6300U CPU@2.4GHz,8GB RAM的PC机上进行。以Matlab R2016a软件编程实现相关算法。遗传算法运行参数不变,分别运行程序50次,将原算法和改进算法对最优解命中情况进行比较,结果如表1所示。可以发现:原算法命中平均繁殖代数少,平均运行时间短,但命中概率低,不能很好地找到最优解;随着程序不断改进,最终命中概率可达98%,但命中平均繁殖代数较多,平均运行时间较长。对于遗传算法运行参数的最大繁殖代数可改为100代左右,基本保证种群进化完成。

5 结语

遗传算法是处理图像分割问题的优秀算法,通过模拟自然进化过程搜索最优解,以熵的判别函数建立适应度函数,大大缩短寻找阈值的时间。利用遗传算法和最大熵原理,对双阈值图像分割问题进行构建和改进,能准确找出图像分割的双阈值,具有重要的实际意义。图像分割具有广泛应用前景,是研究机器视觉的重要途径,将给人类生活带来更多便利,进而影响社会发展的方方面面。

摘要:图像分割是图像处理的一个基本问题,阈值法是图像分割的常用方法。通过建立最大熵双阈值数学模型和设计遗传算法,对双阈值图像分割进行了有效的解决。进一步提出了遗传算法的改进,能准确找出图像分割的双阈值,对分析和理解图像具有重要用处。

关键词:遗传算法,阈值,图像分割,熵

参考文献

[1]王荣侠,黄敏.一种基于变异操作的改进型遗传算法[J]仪器仪表学报,2008,29(4):184-187.

[2]陈露晨,李光明.快速最大熵多阈值图像分割算法[J]计算机应用与软件,2012,29(3):267-269.

[3]李书全,吴秀宇.遗传算法函数寻优性能影响因素分析[J].计算机工程与应用,2015,51(6):1-5.

[4]胡亨伍.基于改进遗传算法的图像分割方法[J].电脑知识与技术,2016,12(15):193-195.

最大信息熵 篇6

水质恢复是指水体水相中污染物浓度的降低过程,不包括悬浮颗粒污染物浓度的降低。由于受不同污染物污染的水体,其水质恢复的途径不同,主要有物理稀释作用、化学吸附(污染物从水相转移到固相的作用)及化学反应(包括光化学反应)和挥发作用(污染物从水相转移至气相的作用)、生化降解作用三个途径。水质恢复能力综合评价就是根据水质恢复能力的评价指标,通过建立数学模型,对一个地区的水质恢复能力进行评价,为水资源可持续开发利用提供决策支持。河流水质恢复能力是评价河流健康的一个重要指标[1],是水资源可持续利用的基础[2]。

实践中,常存在水质恢复能力各单项指标的评价结果不一致问题,直接利用水质恢复能力评价标准进行水质恢复能力等级评判缺乏实用性。因此,如何科学、客观地将一个多指标问题综合成一个单指标问题,即在一维空间中使水质恢复能力综合评价成为可能,是目前水质恢复能力综合评价研究的难点。本文利用最大熵原理和模糊集合论,提出了基于最大熵的模糊评价法(Fuzzy Assessment Based on Maximum Entropy,FAME),并以黄河干流的水质恢复能力综合评价为例与遗传投影寻踪方法[3](Genetic Projection Pursuit Method,GPPM)进行了分析比较。

1 评价指标

联合国教科文组织(UNESCO)对水资源的定义为:可利用或有可能被利用的水源,水源应具有足够的数量和可用的质量,并能在某一地点为满足某种用途而可被利用;是水质和水量的统一[4]。水资源的可再生性表现为水量的可再生性和污染水体水质的可恢复性。在水量不足的基础上,水质的恶化将加剧水资源的短缺,使水资源不能得到可持续的利用,河流的健康受到严重的损害。

从2001~2005年中国环境状况公报公布的数据可以看出,长江、黄河、珠江、松花江、淮河、海河和辽河等七大水系Ⅳ~Ⅴ类和劣Ⅴ类水质的断面比例分别为30.3~32.2%、27.0~29.7%;主要呈现为有机污染,主要污染指标是氨氮、生化需氧量、高锰酸盐指数、石油类、挥发酚等。 因此,可选用以上水质指标进行水质恢复能力的评价研究。针对具体河流,问题是如何考虑这些污染物指标在数据监测和统计中存在的随机性以及评价标准存在的模糊性。

2 评价模型[5,6]

水质恢复能力一般由下列公式计算:

D=[1-CQC0Q-Μ]1L(1)

式中:D为水质恢复能力值,km;C0为河段段首污染物浓度值,mg/m3;C为河段段尾污染物浓度值,mg/m3;Q为河段段首径流量,m3/s;M为河段沿途接纳的总排污量,mg/s;L为河段长度,km。

设有待分级评价的n个水体样本,每个样本有m项水质恢复能力指标实测值。根据水质恢复能力分级的模糊性,水体样本以不同的隶属度u分属于不同级别的水质恢复能力。构造隶属度模糊矩阵为:

U=[u11u12u1nu21u22u2nuk1uk2ukn]=[uhj]kn(2)s.th=1kuhj=1,uhj0,(j=1,2,,nh=1,2,,k)

式中:uh j表示第j个样本隶属于第h级水质恢复能力的隶属度。

显然,满足约束式的模糊分级矩阵有无穷多个。对水质恢复能力进行评价的目的,是确定出最优分级矩阵。由于水质指标监测值的统计波动性以及水质恢复能力分级本身具有模糊性,[uh j]k m的确定具有不确定性,这样的不确定性可用Shannon信息熵:

Ηj=-h=1kuhjlnuhj(3)

表示。而第j个样本水质恢复能力与第h级水质恢复能力标准的差异则可用加权广义距离表示:

d[eh,fj]=uhj[i=1m(wi|eih-fij|)](i=1,2,,m)(4)

式中:w=[w1,w2,,wm]为指标权重向量,可以通过层次分析法或参考文献[7]的方法获得。fj为第j个水体样本各水质指标的恢复能力,即fj=[f1j,f2j,…,fmj]T,eh为第h级各水质指标恢复能力标准,即eh=[e1h,e2h,…,emh]T

为获得最优分级矩阵,可通过一方面使全体样本与各级水质恢复能力的标准值之间的加权广义距离之和最小,即极小化;另一方面使由于随机性和模糊性所造成的不确定性最小,根据Jaynes最大熵原理,应使Shannon熵极大化。

求最优分级问题是一个目标优化问题,为解决此问题,构造如下复合目标优化问题:

minuhj{j=1nh=1kuhj[i=1m(wi|eih-fij|)]+1Bj=1nh=1kuhjlnuhj}(5)s.th=1kuhj=1,uhj0,(j=1,2,,nh=1,2,,k)

由式(5)知正参数B是用来对两个目标进行平衡,根据实际问题本身预先给定。

构造问题的拉格朗日函数:

L(uhj,λ)=j=1nh=1k{uhj[i=1m(wi|eih-fij|)]+1Buhjlnuhj}+λ[h=1nuhj-1](6)

式中:λ为拉格朗日函数。

求解拉格朗日函数得到水体样本jh级水质恢复能力标准的基于最大熵的模糊评价模型(FAME)为:

uhj=exp[-Bi=1m(wi|eih-fij|)]h=1kexp[-Bi=1m(wi|eih-fij|)](7)

3 算例分析

根据2005年中国环境状况公报,黄河干流水质类别比例分别为Ⅰ、Ⅱ类7%,Ⅲ类27%,Ⅳ类34%,Ⅴ类7%,劣Ⅴ类25%,Ⅳ类水质占多数。选取BOD5、氨氮、挥发酚3个水质指标进行水质恢复能力研究。

对于黄河干流的某一河段,当河段段首某一污染物浓度为Ⅳ类水质时的浓度,如果该河段在接受流域平均排污后(如按流域单位河长接受的平均排污来计算该河段的平均排污),段尾污染物浓度小于或等于Ⅲ类水质时的浓度,则该河段的水质恢复能力强,定为一级;如果段尾污染物浓度小于或等于Ⅳ类水质时的浓度,则该河段的水质恢复能力中等,定为二级;如果段尾污染物浓度小于或等于Ⅴ类水质时的浓度,则该河段的水质恢复能力弱,定为三级;如果段尾污染物浓度大于Ⅴ类水质时的浓度,则该河段的水质恢复能力差,定为四级。对于实际河段水质恢复能力的评价,根据式(1)计算各污染物的水质恢复能力值D

根据研究河段的纳污情况以及各研究污染物的水质标准,计算得到各污染物的水质恢复能力评价标准[3]如表1。

采用文献[8]中的数据,以黄河水质恢复能力为例进行评价分析,并与GPPM进行对比。

为便于比较,取指标权重向量w=[0.1375,0.1623,0.7002]与文献[3]一致,并取B=10,由式(7)FAME模型,计算黄河干流8个河段对第一、二、三、四级水质恢复能力的最优分级隶属度矩阵:

U˜=[123456780.00280.00280.00280.00280.00280.00270.00280.00280.09560.09630.09650.09560.09600.09330.09500.09600.73400.73350.73330.73410.73370.73590.73460.73370.16760.17640.16740.16760.16750.16800.16770.1675](8)

由式(8)中各河段最大隶属度值的大小可以看出,各河段水质恢复能力均为三级,从大到小的排序为:龙门-三门峡、三门峡-花园口、石嘴山-头道拐、龙羊峡-兰州、头道拐-龙门或花园口-利津、兰州-下河沿、下河沿-石嘴山。计算结果表明黄河流域各河段水质恢复能力均较弱。黄河干流这种较差的水质恢复能力表明黄河干流的环境功能较弱。

由式(1)分别计算黄河干流8个河段BOD5、氨氮和挥发酚3个指标的水质恢复能力值,并比较FAME与GPPM的计算结果,见表2。可以看出FAME和GPPM的评价结果完全一致,说明了FAME的有效性,而且FAME方法与GPPM方法相比,考虑了评价指标数据监测和统计存在的随机性,评价标准存在模糊性,使评价模型更符合实际情况。

FAME 建模思路明确,计算方法简便,容易进行计算机编程。评价结果既可以直接给出各河段水质恢复能力值又可以利用隶属度值对具有相同水质恢复能力值的各河段水质恢复能力进行细致评价,提高了水质恢复能力综合评价问题各层次的分辨力。例如:龙羊峡-兰州、兰州-下河沿水质恢复能力级别都三级,而最大隶属度分别为0.734 0和0.733 5,说明一方面从整体上它们的水质恢复能力均较弱;另一方面与龙羊峡-兰州相比兰州-下河沿水质恢复能力更弱一些。

4 结 语

本文提出了一种适合对水质恢复能力进行综合评价的新方法-基于最大熵的模糊评价法,并对黄河干流水质恢复能力进行了综合评价,主要结论为:FAME模型耦合了评价指标监测数据统计存在随机不确定性和评价标准存在模糊不确定性,评价结果更接近实际情况;利用FAME的隶属度值的大小对水体样本集进行统一评价,解决了各单项评价指标评价结果不一致问题,提高了水体水质恢复能力综合评价问题各层次的分辨力;根据黄河干流三类主要污染物BOD、氨氮和挥发酚的浓度对黄河干流的水质恢复能力进行了评价,发现整体上黄河干流的水质恢复能力较弱,FAME模型评价结果与GPPM一致,可为河流健康评价、水资源的可持续利用提供科学依据和决策支持。

最大熵原理在停车场选址中的应用 篇7

在我国, “停车难”已经和“行车难”已成为全社会共同关注的热点问题。可以说, 停车问题是城市机动化发展到一定阶段的产物。当车辆保有量相对较低时, 可停车资源空间相对丰富, 停车问题也就没有显现出来;但是随着城市化和机动化的发展, 车辆保有量迅速增加, 车辆使用强度也日趋增大, 道路交通供给能力 (包括停车供给能力) 相对道路交通需求日显不足, 随意停车、违章停车日益严重, 并开始对道路交通正常运行造成干扰和影响, 停车问题开始出现并逐渐扩散而成为城市交通问题中的热点和难点。城市停车场规划问题不仅仅是一个静态交通问题更是“以静制动”的重要策略。

2 信息熵与最大原理

自从1948年Shannon, C.E.在其《通信的数学理论》一文中首次提出了信息熵的概念而奠定了现代信息论的科学理论基础以来, 关于信息熵的研究已经有了大半个世纪的时间。信息论的中心概念是信息量。信息论量度信息的基本出发点, 是把获得的信息看作用以消除不确定性的东西, 因此信息数量的多少, 可以用被消除的不确定性的大小来表示, 而随机不确定性的大小可以用其概率分布函数来描述[2]。

考虑一个随机实验A, 设他有n个可能的 (独立的) 结果:a1, a2……an;每一个结果出现的概率分别是:p1, p2……pn;他们满足以下条件:

现与否没有完全把握, 为了量度概率试验的不确定性, Shannon引入了函数:作为随机实验结果不确定性的量度, 式中k是 一个与度量单位有关的正常数, 因此0 S。上式中的S称为信息熵或Shannon熵。他的意义为:在试验进行之前, 他是试验结果不确定的度量;在试验完成之后, 他是从该试验中所得到的信息量。S越大表示试验结果的不确定性越大, 试验结束后, 从中得到的信息论也越大[3]。Shannon很好地解决了关于不确定性的度

Shannon很好地解决了关于不确定性的度量问题, 但没有解决如何进行概率分配的问题。后一个问题的解决工作主要是由Jaynes进行的。他在《信息论与统计力学》一文中, 提出一个选择准则:“当根据部分信息进行推理时, 必须选择这样一组概率分配, 他应具有最大的熵, 并服从一切已知的信息。这是唯一的无偏分配;使用其他任何分配, 就等于对原来没有信息做了随意假定。”Jaynes所建立的这样的一个统计推理准则, 就是所谓的最大熵原理。尽管这个准则在性质上也有主观的一面, 但却是一个最“客观”的主观准则, 因为, 由此得出的估计, 人为偏差最小。

在数学上, 把最大熵原理表示为如下优化问题:

Tribus曾经证明, 正态分布、伽玛分布及指数分布等, 都是最大熵原理的特殊情况[4]。

3 停车场选址分析

路外公共停车场的建设不仅要满足地区的停车需要, 还应首先符合城市交通发展战略要求, 与城市交通发展相协调, 对交通需求起到一定的调节作用, 所以在规划路外公共停车场时要兼顾当地的土地资源和道路通行能力, 科学、详细地制定停车场近期、中期和远期规划, 确保停车设施规划应满足可持续发展的要求。在规划停车场的过程中要满足:a.与城市规划、土地利用相协调的原则:城市停车场规划应纳入城市总体规划的范畴, 停车设施布局要与土地功能布局紧密协调, 使停车设施更好地为不同类型的需求服务, 营造一个良好的停车环境, 统一规划, 科学选址, 合理确定停车场的面积。b.路外公共停车场相协调的原则:路外停车场应作为城市公共停车设施的主体, 停车场之间应该相互协调, 相互之间应该有一定的间距。同时路外公共停车设施的规划和布局要为停车换乘和使用公共交通创造良好的条件。c.基于路网容量限制供给原则:出行目的地停车位的供给水平直接影响人们选择什么样的出行方式, 停车位的充足会鼓励小汽车使用, 加剧道路的交通拥堵, 也不利于公交的发展。因此, 在提供停车设施供给时, 必需考虑路网的承受能力, 达到动态和静态交通的合理平衡。在路网资源紧张, 交通拥堵的地区就要采取限制供应的原则, 同时收取较高的停车费用, 引导人们乘坐大容量的公共交通。d.停车设施的多样化:合理利用城市的土地与空间资源, 因地制宜、灵活多样地布置停车场。应根据实际情况选择多种形式的停车设施 (路内与路外停车设施、地面、地下停车场 (库) 与多层停车楼等) 。e.与环境相协调原则:路外公共停车场的设置、选址应该考虑其对环境的影响, 应该与周围的环境协调。

4 最大熵理论评价模型的建立

对于需要评价的m个选址方式, 设有n个评价指标, m个对象对应于n个指标形成的原始指标矩阵为:R= (rij) max, 记R中每列的最优值为rj*, 而rj*的大小因评价指标特性的不同而不同。专家对评价指标的打分, 由于专家对目标的评价带有极强的个人感情色彩, 一般将其具体分为乐观型、悲观型、现实型等。对于乐观型指标, rj*越大越好, 而对于悲观型指标, rj*越小越好, 对于现实型指标, 越接近某个常数越好。即有:

其中I1为效益型指标, I2为成本型指标, I3为固定型指标, rj为第j项的固定值。

4.1 构造标准化评价矩阵X= (xij) min

其中:

4.2 建立加权的标准化评价矩阵Y

由矩阵X可得, 评价指标j的熵为:

且假定, 当xij=0时, 则第j个指标的熵权wj为:

加权的标准化评测矩阵:

4.3 建立最优解Z*与最劣解

其中:yj为第j项指标的固定值。

4.4 计算各评测数据分别与最优解Z*和最劣解Z*的欧氏距离Si*和Si*

4.5计算各评测对象与Si*和Si*的相对贴近度

4.6 排列评测对象

将Ii (i=1, ....m) 按照从大到小的顺序排列, 排在前面的优于排在后面的。由此, 我们可以方便地对各种选址方式进行抉择。

5 应用举例

对于第三节中讨论的停车场选址评价指标我们考虑如下:城市规划及土地利用的协调性指标V1;停车场之间的协调性指标V2;路网容量的限制指标V3;停车设施的多样化指标V4;停车设施与环境的协调性指标V5;停车设施与路网协调性指标V6。

具体的选址方案及评价指标的指标值如表1所示:

标准化评价矩阵为:

各个指标的熵权为:

各评测数据与最优解Z*和最劣解Z*的欧氏距离Si*和Si*

各评测方案与Si*和Si*的贴近度为:

由得方案M3优于M1及M2

6 结论

由于停车场选址选取所涉及的很多因素具有的复杂性、动态稳定性及外界干扰的不确定性, 使得过去在对各种因素的描述都是基于定性的方式进行的。通过最大熵原理的批判方法, 可以将以前对模式选择的定性判断转化为定量判断, 从而能够更公正、客观而有效地选择出更为合理和令人满意的方案。

摘要:介绍了信息论中的最大熵原理, 结合对常用的停车场选址问题的系统分析, 建立了评价停车场选址的指标体系, 提出了基于最大熵理论的评价模型, 为停车场的选址提供了一种有效的决策支持方法。

关键词:最大熵原理,停车场选址,评价方法

参考文献

[1]陆化普.解析城市交通[M].北京:中国水利水电出版社, 2001.

[2]李习彬.熵——信息理论与系统工程方法论的有效性分析[J].系统工程理论与实践, 1994, 14 (2) .

上一篇:梁、板式结构下一篇:固定材料