基于模板(精选10篇)
基于模板 篇1
1 模板匹配算法的描述
在机器识别事物的过程中, 常需把不同传感器或同一传感器在不同时间、不同成像条件下对同一景物获取的两幅或多幅图像在空间上对准, 或根据己知模式到另一幅图中寻找相应的模式, 这就叫做匹配。因为只有当同一场景的两幅图像在同一坐标系下时, 才能进行相似性比较, 所以模板匹配的过程实际上也就是把一幅图像变换到另一幅图像的坐标系过程。图像的模板匹配就是先给定一幅图像, 然后到另一幅图像中去查找这幅图像, 如果找到了, 则匹配成功。这看起来好像很简单, 因为我们一眼就能看出一幅图中是否包含另一幅图像, 遗憾的是电脑并不具有人眼的强大的视觉的功能, 因而需要电脑去判定一幅图片中是否包含另一幅图片是件不容易的事情。对于机器视觉系统而言, 实现匹配首先要对图像进行预处理。先计算模板图片的特征值, 并存储到计算机中。然后计算待测试样板图片的特征值, 与计算机中模板进行比较, 运用匹配算法实现匹配。整个过程如图1所示。
在基于图像处理的应用领域中, 对于图像匹配的研究可以说一直都是数字图像处理技术和计算机视觉理解的重要研究内容。图像匹配在机器视觉、工业自动模式识别、医学图像的定位等方面都有
2 图像匹配的数学描述
以传统的相关算法为例对图像匹配进行数学描述。如图2所示, 搜索图即待匹配图像S为一方形区域, 边长为N, 模板图像T也是一个方形区域, 边长为M。设模板T叠放在搜索图S上平移, 模板覆盖下的那块搜索图 (即图中的阴影部分) 叫做子图Si, j, (i, j) 为子图Si, j的左下角在搜索图S中的坐标为:1
匹配过程如下所示。
假设模板T从待匹配图像S的左下角开始逐点遍历图像, 比较T和Si, j的内容。如果两者一致, 则差值为零, 可以用下面的测度来衡量T和Si, j的内容如果两者一致, 则差值为零, 可以用下面的测度来衡量T和Si, j的相似程度, 如公式 (3-1) 所示。
展开后有:
公式 (3-2) 右边第三项代表模板的总能量, 与 (i, j) 无关, 是一个常数;第一项是子图能量, 随 (i, j) 而改变, T和Si, j匹配时这一项的取值最大, 可以用下面的互相关系作相似性测度:
或归一化为:
显然R (i, j) 越大, 模板T和子图S就越相似, 使得R (i, j) 取得最大值的位置即为最佳匹配位置, (i, j) 也就是我们要搜索的匹配点
3 算法的改进及图示
根据以上对模板匹配的介绍, 可以对字符图像进行识别。但是求相似性度量函数, 求待匹配图像和模板之间的相似性映射关系均比较复杂。上一节知识的介绍中, 也看到了其过程比较麻烦。本系统中识别的图像均为20×36大小的。即模板图像和待测图像大小相同。即会从图像的左下角一直顺着搜索一直至全图结束。而且映射关系及相似性函数均比较复杂, 不是数量级上的关系。此时识别效率就不明显。显得木讷不灵巧。并非像前面介绍的在待测图片中搜索, 并返回得到匹配点。因此需要基于此模板匹配算法原理的基础上, 对算法进行改进, 才能更有效的去完成识别的功能及简化其识别的过程。提高识别速度。即将图片区域化。算法改进的思想:将图片 (3×4) 分为12块区域, 具体区域的划分如图3所示。再加上5条交线。共记有17个特征值。
模板训练时, 将数字模板图片17个特征值的信息记下并存储在数组中。当进行样本训练的时候, 用同样的算法计算图片中数字的17个特征值, 并到计算机存储区中去匹配, 直接利用象素灰度值的差异, 找到特征值最接近的一个图片数字, 便完成匹配识别的过程, 到匹配的结果。这样便简单多。
4 结语
本系统通过对图片进行区域化处理基本能完成对数字图像的识别功能。虽然有一定的误识率。将图片区域化后再进行模板匹配可以很轻松的实现数字的识别, 这是一次对模板匹配算法的新的尝试。通过对数字图片的研究, 可以推广到英文字符的识别, 甚至可以识别手写或打印的汉字字符。研究识别率达到100%是我们的理想, 通过我们的研究可以不断地将字符识别技术推向前进。
摘要:传统的模板匹配算法求待匹配图像和模板之间的相似性映射关系均比较复杂, 本文将对模板匹配算法进行改进, 在模板匹配算法的基础上, 将图片平均分成12块区域, 再加上5条交线, 一共17个特征值。当进行样本训练的时候, 用同样的算法计算图片中数字的17个特征值, 并到计算机存储区中去匹配, 直接利用象素灰度值的差异, 找到特征值最接近的一个图片数字, 便完成匹配识别的过程, 得到匹配的结果。
关键词:模板匹配,特征值,细化,二值化
参考文献
[1]钟志光, 卢君, 刘伟荣编著.《Visual C++.NET数字图象处理实例与解析》[M].北京:清华大学出版社, 2003年6月.
[2]何斌, 马天予, 王运坚, 朱红莲编著.《Visual C++数字图象处理》第二版[M].北京:人民邮电出版社, 2002.
[3]夏良正编著.《数字图象处理》[M].南京:东南大学出版社, 1999年9月.
[4]葛亮.Visual C++从入门到实践[M].北京:清华大学出版社, 2009.
[5]康晓林, 袁建州.Visual C++6.0实用教程[M].北京:电子工业出版社, 2008.
[6]Scott Meyers.Effective C++[M], Addison-Wesley, 1992.
基于模板 篇2
关键词 企业管理 财务会计 模板化
企业管理以财务管理为中心,财务管理离不开规范的财务会计基础工作。因此,加强企业财务会计基础工作,不仅是财务会计工作自身的要求,也是记录、反映、监控企业管理行为和经济活动的需要,更是加强和提升企业综合管理的需要。实行模板化的财务会计管理,能够有效地做好企业财务会计基础工作。
一、开展模板化财务会计基础工作的意义
1.有助于管理规范化。将企业财务活动、会计核算等工作,以模板的形式固化下来,有助于企业管理活动和经济行为的规范,防止管理随意性,便于稽核、检查和监督。
2.有助于提高会计信息质量。将财务会计工作模板化,能够贯彻企业内控要求,将管理制度格式化、表单化、程序化,能够提升会计信息质量。
3.有助于充分发挥财务支持企业管理决策的作用。对各类财务报告、财务分析、财务检查等按照规定的模板进行撰写,能够从全面性、强制性等方面进行深刻财务分析,支持企业管理决策,充分发挥财务在企业管理中的重要作用。
4.有助于提升财会人员的综合能力。模板化简洁明了,使财会人员既能从全局、又能从微观了解具体工作,能够提高财会人员的业务技能和管理能力。
5.有助于提升企业管理的效率和效果。财务活动贯穿企业管理的全过程,会计是企业财务活动的反映,通过实行模板化的措施,能够实现企业管理制度化、制度表单化、表单信息化,从而提高企业管理的效率和效果。
二、模板化企业财务会计基础工作的内容
1.会计基础工作类模板。主要包括:(1)各类自制原始凭证,例如原始凭证粘贴单,差旅费报销单,费用报销单,原材料入库、领料单,产成品出入库单,固定资产折旧计提基础表,无形资产摊销基础表,应缴税费计算基础表,各种收入和成本费用结转基础表,应付职工薪酬计算表等。(2)会计手册,记账凭证格式,会计账簿格式,会计报表格式、会计档案管理等。
2.财务基础工作类模板。主要包括:(1)货币资金收支活动方面,例如货币资金收支预算及执行表(年度、季度、月度)、货币资金收支日报表、资金支付审批单、借款单等。(2)财务管理方面,例如财务预算及执行情况表、合同审批表等。
3.财务分析类模板。主要包括:财务情况说明书(年度、季度、月度),企业营业收入、成本、费用、利润分析,资产负债分析,现金流量分析,财务比率分析等。
4.财务管理业务类模板。主要包括:(1)股东(大)会、董事会、监事会类模板。财务决算报告,财务预算报告,利润分配报告,监事会工作报告,关于聘请会计师事务所的议案,关于公司向银行借款的议案,关于公司对外提供担保的议案,关于公司年度固定资产投资计划的议案,关于关联交易的议案,关于收购股权的议案,关于调整公司会计政策的议案等。(2)汇报请示类模板。会议纪要,考察报告,尽职调查报告,财务负责人履职报告以及有关财务事项请示等。(3)财务会计制度类模板,按照企业统一要求制订。(4)财务协议合同类模板,按照企业规定和交易方的要求统一制订。(5)可行性分析模板。投资可行性分析,发行企业债券(中期票据、短期融资券)可行性分析,收购股权可行性分析,设立子公司、分公司的可行性分析等。
三、实行财务会计基础工作模板化的要求
1.模板设计要贯彻执行国家有关法律法规和规范性文件的要求。财务会计工作政策性强,设计模板时,要认真研究、学习和执行国家相应规定,体现模板的政策性。
2.模板设计要落实企业内部控制制度。加强企业内部控制管理,是防范风险、规范运作的有效办法。各类财务会计模板,要将企业内部控制具体化,以表单为载体,体现模板的流程性。
3.模板格式设计要规范。无论是表单式模板还是文字式模板,务必按照国家写作规范来进行,反映企业文化特色,结构清晰,内容完整,避免随意性,体现模板的规范性。
4.提升模板的执行力。模板是财务会计工作的手段,在实际工作中,一定要加大模板的推行力度,提升财务会计的工作质量,加大对模板执行的检查监督和考核,体现模板的强制性。
5.充分利用现代信息技术和手段。各项财务会计工作模板,要根据模板所反映的内容,充分利用财务核算系统、计算机以及相关软件,实现二者的有机结合,体现模板的先进性。
6.及时更新模板内容。模板内容要结合企业管理需要,及时进行调整和完善,体现模板的及时性。
7.充分运用模板所反映的内容为企业管理发挥财务的决策支持作用。模板是工具,通过研究模板所反映的企业财务会计情况,及时总结管理经验,查找管理不足。对于模板反映出的问题,企业管理者应给予足够的关注,体现模板的实用性。
四、结束语
基于专家知识的仿真分析模板 篇3
关键词:铁路货车,协同,仿真分析,模板
知识管理是企业管理的一项重要内容, 企业的成功越来越依赖于其所拥有的知识。然而对于一个企业而言, 拥有和积累知识只是企业成功的基础, 如何将知识融入到企业业务中并有效支撑研发活动则至关重要。因此当企业发展到一定阶段, 必须要对知识进行总结、归纳、管理, 并将知识规范化和标准化, 以便作为今后工作的指导和依据, 实现知识地系统性传承, 从而使企业获得持续地成功。
近年来随着国内经济的持续高速增长, 制造业更是实现了跨越式发展, 铁路车辆制造企业在各个方面都得到了长足的进步, 企业内部积累了大量的设计经验、仿真经验、试验经验等。铁路货车协同仿真分析平台正是基于多年来的仿真知识和流程规范建立的, 其中仿真分析规范体系更是对仿真分析知识进行总结与应用, 基于知识开发的仿真分析模板则是在应用仿真知识的探索过程中所进行的创新。
1 仿真分析模板介绍
仿真分析模板是一套计算机程序, 基于NX CAE产品开发。它将某类或者某个系列零部件的仿真分析流程以及相关规范和标准固化在程序中, 用户只需要进行少量的必要输入, 就可以完成标准化的仿真分析过程和多次迭代, 得到具有可比性的仿真分析结果。程序参照标准数据对仿真分析结果进行评价, 得到明确的分析结论。
2 需求的提出
多年来, 在重载快捷铁路货车关键零部件的仿真分析上积累了大量的成熟经验, 对分析过程中的模型简化、网格划分、边界条件定义以及结果评价等均形成了企业自身的规范标准, 并且经过了反复的试验验证, 被证明是符合实际情况的。所以企业希望将零部件的初算交由设计工程师完成, 当设计工程师完成初步设计, 运用仿真分析模板, 自行进行仿真分析计算, 以确定零部件是否符合设计要求, 如果分析结果不符合设计标准, 设计工程师需要对设计进行修改, 这个过程不需要仿真分析工程师的参与。当设计通过了仿真分析模板计算, 设计工程师才能够将设计通过仿真分析平台提交给仿真分析工程师进行专业验证。
3 仿真分析模板建立
将重载快捷铁路货车产品进行分类, 筛选出关键的零部件, 这些零部件的分析方法有相应标准指导, 长期以来积累了大量的分析经验, 并在此基础上通过总结以往的分析经验、参照试验数据、借鉴其它行业的相关标准, 总结制定了仿真分析指导书。
仿真分析模板则是以仿真分析指导书为蓝本进行设计:
(1) 将设计指导书中的分析流程进行划分, 使模板的每一个步骤均执行了明确的任务和输入输出内容。
(2) 归纳出仿真分析过程中可能会发生变化的参数与保持不变的参数。不会发生变化的参数, 则不体现在界面上, 由模板默认设置。只为不确定的参数设计界面, 由用户指定, 此外模板还需要维护参数之间的关联关系, 模板需要根据用户输入进行一定的推断, 如同一零件的1/2模型与整模型的分析方案是不同的, 如果用户以1/2模型来进行分析, 那么分析方案要自动作出调整, 载荷等也需要进行相应处理。
(3) 模板设计要简化操作步骤, 重新构建简洁的UI界面, 比如用户选择过了某个对象, 下次再对该对象进行操作时, 则不再需要用户选择;或者如果要多次操作一个对象, 那么可以将其合并在一个步骤中完成。通过这种方式可以实现多轮迭代。
基于以上设计思路, 开发的仿真分析模板的界面如图2所示。
4 仿真分析模板的特性
仿真分析模板主要提供给设计工程师使用, 其结果可以供仿真分析工程师参考, 主要是因为它提供了以下特性:
4.1 标准化流程
仿真分析模板的流程每一个步骤是自动进行的, 其每一个步骤也都是进行CAE分析必不可少的环节。对于流程的某一个步骤, 虽然模板可能默认进行了必要的设置, 但是基本上该步骤所要完成的任务是十分明确的, 使用者会对仿真分析流程有清晰的认识并印象深刻。标准化的设置杜绝了遗漏和减少了人为的失误, 使分析结果具有可比性和较高的参考价值。
4.2 简化输入与配置
因为仿真分析模板处理的是某一类或者某一系列的问题, 所以仿真分析模板可以有针对性地提供优化的操作方式, 将原本复杂的操作简单化, 可以有效地提高效率。仿真分析模板精简了输入选项, 省略了不必要的设置选项, 这可使其具有良好的人机界面, 杜绝了遗漏设置, 大大降低了人为失误的几率。将标准数据融入模板, 用户将不用再去查询标准数据值, 也不用投入过多精力去理解标准中的公式及计算过程。
4.3 释放资源压力
设计结果的初算由设计工程师自己完成, 并可在初算过程中对结构进行优化。由于无需仿真工程师的参与, 减轻了仿真分析工程师的压力, 也避免在设计工程师与仿真工程师之间进行设计、分析、修改、再分析、再修改等可能低效的沟通和无奈的等待。一方面仿真工程师从重复劳动中解放出来专注于复杂仿真分析活动, 另一方面设计工程师对不良设计有了更加深刻的认识, 使其在以后的设计工作中自觉地加以改进和避免。
5 仿真分析模板的扩展与深化应用
铁路货车仿真分析的两个主要应用是转向架与车体, 在建立转向架侧架与摇枕仿真分析模板的基础上, 根据产品在方案设计阶段进行快速验证的需要, 进一步开发了车体的仿真分析模板, 使复杂的车体结构分析流程化、标准化、并有效地提高了车体分析的效率。该车体仿真分析模板包括铁标与AAR分析标准, 具有1/4、1/2及整车的分析类型。
车体的结构分析评价包括强度、刚度、疲劳等方面, 而对于车体的焊缝疲劳仿真结果评价一直是一个难题, 一方面是采用的标准种类较多, 另一方面是一个车体上有许多焊缝, 每条焊缝具有不同的类型, 不同类型焊缝的疲劳计算准则也不同, 因此如何批量地解决焊缝的定义 (焊缝区域、位置、长度、焊缝类型) 、焊接疲劳标准 (AAR、BSI和IIW标准) 的选用及批量焊缝计算与结果观察, 始终是车体疲劳分析的难题。车体焊缝疲劳评价模板的开发与应用很好地解决了这些问题。
6 结束语
仿真分析不仅要求具有高效易用且功能强大的软件, 更要企业自已总结经验, 将仿真与试验结合, 归纳提炼大量仿真数据、试验数据及相关标准, 建立企业的仿真分析规范, 这是一个企业CAE能力形成的标志。仿真分析模板建立的依据就是仿真分析规范, 仿真分析规范是核心, 仿真分析模板相当于对仿真分析规范的程序化、软件化。
仿真分析模板是重载快捷铁路货车协同仿真分析平台中仿真规范体系建设的一个大胆创新, 是在设计工程师中普及仿真分析的一个有益的尝试, 通过这种方式, 将企业积累的知识和流程实现标准化、工具化, 帮助企业充分利用有限的资源在保证研发质量的前提下高效地开展研发工作。
参考文献
[1]范国海, 徐振东, 马东等.齐齐哈尔轨道交通装备有限责任公司CAE分析规范体系建设项目报告[R].2009.
基于模板 篇4
一、技术应用
(一)ASP.NET
网站开发主要使用Asp.net技术,开发环境为Microsoft Visual Studio 2010。Asp.net是Miscrosoft.Net Framework的一部分,是一种可以在高度分布的Internet环境中简化应用程序开发的计算环境。.Net Framework包含公共语言运行库,它提供了各种核心服务,如包含内存管理、线程管理和代码安全。它也包含.Net Framework类库,这是一个开发人员用于创建应用程序的综合的、面向对象的类型集合。相比其它的Web技术来说,Asp.net技术能够更快速、更容易地建立灵活、安全、稳定的Web应用。
(二)DIV+CSS
页面布局使用DIV+CSS技术。CSS(Cascading Style Sheets,层叠样式表)是一种制作网页的新技术。它是一种设计网页样式的工具,能够增强网页样式控制并允许将样式信息与网页内容分离。DIV+CSS具有如下几项优点:方便网页格式的修改、便于减少网页体积、能使网页元素更准确的定位、良好的适应性。
二、网站总体设计
(一)网站功能设计
本文主要针对的是信息发布类型的网站,案例为某国家重点实验室。根据信息发布的需求,主要进行了如下功能的设计:①介绍实验室基本情况,展示实验室资质和获得荣誉;②对外发布实验室新闻,展示实验室最新动态以及发布通知;③展示实验室科研环境和技术实力,允许其他科研群体对限定设备提出使用申请;④对外介绍实验室的研究方向;⑤对外展示实验室的人才队伍建设情况和专家信息;⑥对外发布开放性课题,举办会议,介绍交流合作模式和现状;⑦后台管理功能,通过后台管理页面对前台显示内容进行编辑。
根据功能的划分,对网站栏目进行了设计,分为前台显示和后台管理两类。前台显示为普通用户访问网站时所见到的显示页面,用于实验室对外展示和发布信息,主要由首页、搜索页面和6个一级栏目页面组成。6个一级栏目为:走进实验室、新闻动态、研究方向、科研实力、研究方向、合作交流,且一级栏目下又包含相应的二级栏目。
后台管理是管理员用户对网站内容进行管理时显示的页面,主要实现了对栏目类别的添加、编辑和删除,以及对各栏目文章的管理。主要包括:登陆、网站管理页面、管理员管理页面以及与前台6个一级栏目对应的管理页面。
(二)数据库设计
数据库设计主要是通过对数据间的关系进行分析和研究,从而设计出合理、高效的数据存储结构。由于网站所涉及数据库较为简单,为简化设计,使用Access数据库来存储系统的数据。
(三)网站数据库结构
网站数据库包含5个数据表,分别为:gsclass、gscontent、link、user、contact。gsclass表用于存储网站栏目类别,gscontent表用于存储网站栏目内容,link表用于存储网站首页显示的友情链接,user表用于存储网站管理员用户信息,contact表用于存储网站联系方式。
网页通过后台调用预先定义的类对数据库进行操作。定义的类主要包括数据库访问类、实体类、业务逻辑类3种:①数据库访问类用于实现对数据库的添加、删除、更新等操作;②实体类用于对信息和相关行为建模,以其属性说明自动提取数据库字段的描述信息;③业务逻辑类用于实现简单的功能性操作。
(四)页面模板设计
网站的页面模板分为前台显示与后台管理两类,且前台显示页面模板与后台管理页面模板存在对应关系。通过设定数据库gsclass表中aim列的值,每个二级栏目都与一类前台显示和后台管理页面对应。
1.前台显示页面
Default.aspx:网站首页。
Search.aspx:搜索结果显示页面,将根据搜索内容从数据库中获得查询结果以列表的形式显示。
Search_more.aspx:搜索结果的跳转页面,根据搜索结果所归属的栏目跳转到该栏目详细内容页面,仅执行跳转过程不进行显示。
List.aspx:一级栏目跳转页面,根据首页导航栏的请求跳转到相应一级栏目页面,仅执行跳转过程不进行显示。
基于轮廓模板匹配的物体检测算法 篇5
我们的模型训练方法采用了一种过饱和的模式, 即使用冗余的特征集合进行训练, 而这些冗余特征集合恰恰克服了同类物体的不同点 (如不同的体型、不同的动作以及不同的面部表情) 、图像场景变化 (不同的光照条件、遮挡等) 。
2 检测
整个检测器是建立在局部的基于轮廓特征匹配基础上的, 匹配算法使用了方向性的Chamfer距离考量, 这个距离值通过其权重求和, 并最终作为物体检测分类器。特征集合F代表了物体的轮廓T的局部片段, 每个特征都包括了它自身到物体中心的偏移量p。另外的3个参数分别是:方向量的权重λ, 检测阈值θ以及特征权重量a。
2.1 方向性Chamfer匹配
Chamfer匹配技术在轮廓匹配应用中非常广泛。它提供了一种计算两个轮廓距离量的方法, 并且在有大量非对齐的情况下, 仍有很高的鲁棒性。从最简单的模型讲, Chamfer匹配需要两个边缘点集, 图像边缘点集E={e}和匹配模板点集T={t}, 下面的公式描述了计算这两个点集在偏移量为x情况下的Chamfer值:
NT为T中点的数量。这个公式计算了匹配模板中的边缘点到最近的图像边缘点的平均距离。通过预处理, 例如距离变换 (Distance Transform) , 计算Chamfer距离的效率会提高很多, 公式 (1) 即可以转化为公式 (3) :
欧几里得距离DT的计算可以参照文章[1]。
另外, 一个很大的改进, 就是引用了轮廓的方向考量。这种考量通过边缘点的斜率来表达。在图像点集中, 通常有很多地方边缘非常嘈杂混乱, 方向性Chamfer距离可以很好的解决这个问题。其中一种技术是将图像和匹配模板中的边缘点划分为不同的几个离散的方向通道, 并求出Chamfer值的和。但这种方法的通道数量并不明确, 而且需要格外注意连个通道之间的边缘曲线。我们使用一种略微不同的方法, 精确的计算匹配模板上每个边缘点斜率与图像中每个边缘点斜率的差:
o (·) 代表一个边缘点的斜率, |o1-o2|表示计算两个点的斜率差, ADTE (t+x) 表示在点集E中找出离点 (t+x) 最近的一个点。
这样, 最终的方向性Chamfer值便可以通过下面的公式计算出来了:
其中, λ为方向考量的权重值。
2.2 检测步骤
物体检测器K (c) 可以计算某一点的c的信心值 (Confident Value) , 使用K在整个图片的所有像素点进行扫描, 可以得出一个分类图。这个分类图经过一定的处理 (如降噪、平滑等) , 通过设定一个理想的阈值, 在这个分类图中可以找出物体在图片中的大致位置。
整个检测器K通过一个参数组{Fm}进行训练, 每个参数组表示为Fm= (Tm, pm, λm, θm, am) , K用加性模型表示如下:
δ函数相当于一个判断语句, 如果括号内部表达式为真, 则返回1, 否则返回0。θm是每个一个阈值, 来过滤弱分类器得出的方向性Chamfer值, 通过训练得出。am是每个特征向量的权重, 同样通过训练得出。
3 训练
3.1 建立匹配模板库
首先, 我们要找出大量需要检测的物体图片, 将其分成两部分, 第一部分则用来提取特征, 第二部分则用来用来作为训练样本。首先将第一部分的图片背景信息去除 (通常是下载标准数据集来解决) , 然后使用Canny edge算法算出这些图片相应的边缘轮廓图片。随机指定一些位置, 记录这些位置到物体中心的偏移量, 并截取随机大小的矩形区域的 (不能太大或太小) 轮廓片段, 将这两种信息储存。这样, 库中的每条信息都包括两个内容:物体的部分轮廓曲线以及它相对于物体中心的位置。
3.2 分类器的学习
Boost是现今机器学习领域中较为简单且有效的技术。它由一系列的“弱分类器”构成, 这些分类器的表现仅仅比随机猜测要好一点, 但是一个带有权重的弱分类器的集合, 通常可以构成一个比较准确的“强分类器”。Boost算法在计算机视觉中的应用非常广泛, 大部分是作为一个特征选择机制, 例如:Viola和Jones利用AdaBoost制作了一个效率很高的级联分类器。
我们引入Boost算法主要是为了3点:特征选择, 参数估计以及检测器学习。
4 实验分析
我们使用Caltech人脸数据集进行算法的测试验证。如图1, 左边一列都是包含检测物体的图片, 中间是通过训练好的检测器算出的分类图, 右边列则是检测器K中匹配模板叠加后的效果。可以看出, 需要检测的物体的位置都比较准确。
5 结论
本篇文章对基于轮廓模板匹配的物体检测技术进行了探讨, 并且使其达到了一般基于纹理检测算法的效果。但是此算法所检测的都是某一确定大小的物体, 而通常图片中的物体大小都不是固定的。如何解决这个问题, 则是我们今后要研究的。
摘要:本文提出了一种基于轮廓模板匹配技术的物体识别检测算法。物体检测器使用部分已有的轮廓图片, 通过AdaBoost训练得出。此算法达到了一般基于纹理检测器的效果, 而且更加简单且易于实现。
关键词:轮廓模板,Chamfer,Boost
参考文献
[1]P.F.Felzenszwalb and D.P.Hut tenlocher.Distance transforms of sampled functions.Technical report, Cornell, 2004.
基于统计的网页净化模板生成算法 篇6
关键词:网页净化,信息提取,单边子树
目前基于网页的应用和研究越来越多,各种Web应用,如搜索引擎、Web数据挖掘等,都把网页作为数据源来处理,在处理过程中发现网页中很多数据反复出现,而这些数据又不是在应用中需要的,它们的出现为研究带来了极大的阻碍。对网页单独研究后发现,网页可以根据版面和数据划分为主题内容和噪音内容,前者为Web应用提供收敛后的数据源,有助于提高应用和研究的效率,后者主要由广告、版权说明和导航条构成,是妨碍应用和研究的脏数据。在Web应用之前消除页面的噪音内容,只保留主题内容,从而提高应用和研究的效率。基于此的一个研究领域,Noisy Information Elimination,发展起来,国内学者称之为“HTML页面净化”[1]或者“Web页面区域划分和主题区域搜索”[2]。
要对大量网页实现高效净化,最好的方法是能够生成一个网站的模板,这个模板可用于该网站内所有网页的净化工作。在文献[3]中这种方法称为多模型网页去燥方法,常见的此类方法有文献[4,5,6]。通过对网页观察发现:网页的主题内容包含的文字数量远远大于其它噪音区域的文字数量,也就是说文字数量越多的区域越有可能是主题内容所在的区域。基于此,提出一种基于文字统计的网页净化模板生成算法,可以准确生成各类网站的净化模板。
1基于统计的网页净化模板生成算法
1.1算法基础
1.1.1内容块树
DOM全称是Document Object Model (文档对象模型),定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式。XML创建了标识,而DOM的作用就是告诉程序如何操作和显示这些标识。HTML是一种表示语言,它定义了一套标签来刻画网页显示时的页面布局,HTML网页结构最常用的表示方法是构造网页的标签树。格式化后的HTML网页就是一个标准的XML文档,通过DOM这种标签树构造工具将网页中的标签按照嵌套关系整理成树状结构,即将网页标签称树内的节点,嵌套的网页标签称该节点下的子节点。网页被转换为由HTML节点构成的标签树,也就是DOM树。
HTML标签按照功能可以划分为两类:一种是规划网页布局的标签,也叫容器标签,这类标签把网页从视觉上划分为若干个内容块,常用的容器标签有table、tr、td、p.div、span等;另一种是描述标签,如a、img等[1]。提取网页DOM标签树中的容器标签,去除描述标签,构成一个网页的DOM树变种,在文献[7]中称之为内容块树,网页中的重要内容就存在于内容块树中的某个内容块中。
1.1.2单边子树UST&重要单边子树PUST&站点重要单边子树SPUST
单边子树UST (Unilateral SubTree)是对网页重要内容区域进行结构化描述的一条DOM树,是网页去除噪音内容,只保留需要的重要内容之后的内容块树。定义如下。
定义1内容块树的同级节点中,只保留字数最多的一个节点,当多个节点字数一样且字数最多,则从其中随机抽取一个节点保留,由此构成的一个内容块树叫做单边子树UST。
同级节点是指拥有同一个父节点的所有子节点,节点字数是指节点去除内部HTML标签之后所包含的文字字数。图1中一个网页的内容块树转变为UST,图中Tablel和Table2都是Table标签,在同名标签后面加上数字以方便区分。左图是内容块树,所有元素节点基于容器标签生成,每个节点带有一个属性为该节点里面的所有非标签文字的字数总和;右图是经过内容块树的同级节点字数比较后生成的UST,图中Root只是表示树根,不是元素节点,图中的二级节点是两个Table元素节点,其中Table2包含字数2200,大于它的其它同级元素节点所包含的字数,所以这个Table元素节点被保留,同理,三级节点中Span元素节点包含的字数大于同级节点Divl包含的字数,则Span元素节点被保留,以此类推,最终得出右图的UST。
重要单边子树PUST (Primary Unilateral SubTree)是多个网页的内容块树训练然后合并的结果,是多个UST基于统计得到的另一个UST。PUST基于统计生成,是一组UST依据统计得出的最优化UST。其定义如下:
定义2一组UST合并得到一个DOM树,这个DOM树的同级节点中只保留出现次数最多的节点,这些节点构成的一个内容块树叫做重要单边子树PUST。
选取一组网页生成一组相应的USTs,如图2(a)所示。这组USTs合并后得到一个DOM树,见图2(b),该树的每个元素节点有两个属性:合并过程中该节点出现的次数,该节点包含字数的平均值。在这个DOM树的所有同级节点中进行比较,出现次数最多的保留,由此得到一个UST,这个UST就是需要的重要单边子树PUST,见图2(c)。站点重要单边子树SPUST (Site Primary Unilateral SubTree)是站点所有网页的重要内容在DOM树中的体现,是在PUST的基础上进一步优化得到的。其定义如下。
定义3 PUST中除Body节点外的所有节点与其父节点的字数对比,当某个比值低于一个阈值的时候,认为这个节点的父节点所包含的内容是且仅是网页的重要内容。
如图2(b)PUST所示,其所有节点与父节点的字数比为:Table2/Body=0.8,Span/Table2=0.89,Div2/Span=0.18。给阈值λ赋值0.3。因为Div2节点与其父节点的比值0.18远远低于预定义阈值λ,那么Div2的父节点,也就是Span节点所包含的内容是且仅是网页的重要内容。由此得到站点的SPUST,就是在图2(b) PUST的基础上去掉Div2以及其子节点后剩余的其它节点所构成的DOM树。
1.2算法
通过对大量网页研究发现网页的主要内容可以基于以下假设得到:
(1)网页内容块树的同级节点中包含字数最多的节点重要性最高;
(2)网页对应DOM树的重要内容节点如果有子节点,包含最多字数的子节点与该节点之间的比值必然低于一个阈值λ。
基于假设(1)可以提取一个网页的重要内容并生成相应的UST,基于假设(2)可以在PUST的基础上剔除重要内容区域对应节点下面的子节点,得到完整的重要内容节点,并生成SPUST。
算法分为三步完成:
(1)从网站的待处理网页中取一组作为训练集,参考文献[7],由这组网页生成相对应的一组内容块树;
(2)训练这些内容块树,通过算法1生成每个内容块树的UST;
(3)合并这一组UST,通过算法2计算得到PUST,从PUST的叶子节点开始,比较子节点和父节点包含文字字数,当比值低于一个阈值λ时,删除子节点,由此最终得到网站的SPUST。
通过上述三步得到的SPUST作为一个网站的网页净化模板树,该网站下所有网页生成的内容块树仅保留SPUST对应的节点,从而最终得到这些网页的重要内容所属节点,实现网页净化。
从网站中提取一组网页作为训练集,在其内容块树的基础上生成UST的算法如下:
合并一组UST并得到重要单边子树的算法如下:
2结束语
算法成功的评判标准是针对特定的网站能够生成正确SPUST,从而实现该网站的网页净化。选取50家网站,其中包括一些知名BBS论坛,每个网站下载100个网页作为对应网站的训练集。通过实验证明,对包含大量文字描述的网页,特别是文字新闻网页和BBS论坛,算法可以准确地生成站点的网页净化模板。但是因为本方法基于主题内容文字描述较多的假设,所以对一些主题内容区域文字描述较少的网页,特别是图片新闻网页,其净化效果不理想,这需要进一步完善算法,使其具有更强的适用性。
参考文献
[1]张志刚,陈静,李晓明.一种HTML网页净化方法.情报学报,2004;23(4):387-393
[2]胡飞.基于标记树的WEB页面区域划分方法.计算机科学, 2005:08:182-185
[3]毛先领,何靖,闫宏飞.网页去噪音:研究综述.计算机研究与发展,2010;47(12):2025-2036
[4] Gibson D,Punera K,Tomkins A.The volume and evolution of Web page templates.Proc of the 14th Int Conf on World Wide Web.New York:ACM,2005:830-839
[5] Yi L,Liu B,Li X.Eliminating noisy information in Web pages for data mining.Proc of the 9th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining.New York;ACM,2003:296-305
[6] Yi L,Liu B.Web page cleaning for Web mining through feature weighting.Proc of the 18th Int Joint Conf on Artificial Intelligence (IJCAI-03).San Francisco:Morgan Kaufmann,2003:43-50
基于模板的图像内容检索新算法 篇7
随着计算机技术和互联网的成熟, 图像的绘制和传输已经经历了前所未有的发展。近年来, 图像已成为多媒体数据最重要的类型之一, 并已在各个领域广泛应用。特别是, 随着数字成像器件例如智能手机和带摄像头的平板电脑的快速发展, 互联网中可用的图像数量显著增加。面对如此多的图片, 如何进行高效准确的图像检索逐渐引起研究者的关注。
现有的图像检索方法包括基于文本的图像检索和基于内容的图像检索。传统的基于文本的图像检索方法在二十世纪七十年代被提出来。这种检索方法基于用户提供的关键词, 然后在图像数据库中进行实例匹配。这种方法需要在数据库中的每个图像有一个标签, 但随着图像数量的快速增长, 人工标记每一个图像已经变得越来越不现实。为了检索无标签的图像, 科学家们提出了基于内容的图像检索方法。这种检索方法根据颜色, 纹理和其他特征进行图像的相似性匹配。该方法可以有效地检索数据库中未标记的图像, 但它需要用户在检索图像时提供了一个模板。目前, 现有的图像检索系统需要用户在检索前手动绘制轮廓, 比如IBM的QBIC。在这种情况下, 当用户绘制一个具有比较大误差的轮廓模板时, 检索效率和精度会大大降低。所以用户更习惯于传统的基于关键词的图像检索方法。
考虑到基于文本的图像检索方法和基于内容的图像检索方法的问题, 本文提出了一种基于模板的图像检索系统, 该系统使用模板库来结合基于文本的图像检索方法和基于内容的图像检索方法, 而且只要求用户输入查询关键词。它将首先根据关键字自动提取模板库中的模板, 并用这个提取的模板来检索用户需要的图像。
此外, 为了获得更高的查全率和查准率, 在系统中基于内容的图像检索 (CBIR) 的这个系统模块中, 本文提出了一种基于分裂的主颜色特征和颜色布局特征提取方法 (DCCLI) 来进行图像检索。DCCLI利用分裂聚类来提取主颜色特征, 在迭代聚类过程中逐步降低计算复杂度, 然后将主颜色特征提取的结果与传统的颜色布局特征 (CL) 提取的结果进行整合。我们对DCCLI和CL方法的查准率和查全率进行了比较研究。性能的比较研究表明, DCCLI较于CL获得了更高的查全率和查准率。
本文的结构安排如下:第2部分对现有的基于内容的图像检索方法作了简要的介绍, 这个方法被称为基于颜色布局 (CL) 的图像检索, 这种方法在后来被用于和稳重所提出的算法DCCLI进行比较。第3部分给出了系统的描述, 介绍了系统的四个组成部分:基于文本的图像检索, 模板选择, 基于内容的图像检索和模板库更新。第3.3部分详细介绍了主要算法DCCLI。第4部分讨论了在本文中该系统的实现环境和测试数据集。第5部分是算法的展示。第6部分对DCCLI算法和颜色布局 (CL) 算法进行了比较研究, 然后对结果进行讨论。第7部分是本文最后的结论。
2 现有的基于内容的图像检索方法
2.1 颜色布局特征提取
在本文中, 我们利用在提出的方法来提取颜色布局特征。
2.1.1 颜色模型转换
为了把RGB颜色空间转换到YCb Cr颜色空间, 提出的公式如下:
2.1.2 将图像划分成块
整个图像被划分成64块 (每一个尺寸 (W/8) * (H/8) , 其中W是整个图像的宽度, H是整个图像的高度。然后计算在每个块中的所有像素在YCb Cr的三个颜色通道上的平均值。所得到的值作为每一块具有代表性的颜色。
2.1.3 离散余弦变换
对于每个块中的所有像素在YCb Cr的三个颜色通道上的平均值采用离散余弦变换 (DCT) 。DCT变换是一个单独的变换, 它是国际静态图像压缩标准JPEG的基础。由于大多数的图像的高频分量相对较小, 导致高频成分系数通常最终零, 再加上人眼对高频分量的失真不敏感, 我们可以应用更粗的量化。因此, 在一般的图像检索中, 图像DCT系数的部分可以作为特征向量。DCT变换的计算公式如下:
当在其他情况下得到的DCT系数表示为f (u, v) 。
2.1.4 使用三通道创建颜色布局描述符
对在第2.1.3部分得到的DCT系数矩阵进行锯齿扫描和量化。基于第2.1.3节的解释, 我们提取了一些低频系数作为颜色布局的特征参数。在这个过程中, 使用多少低频系数通常由人工决定。在本文中, 我们在Y通道提取六个低频系数, 这六个低频系统分别是:F (0, 0) , F (0, 1) , F (1, 0) , F (2, 0) , F (1, 1) , F (0, 2) 。我们可以看到, 这个序列顺序是根据锯齿扫描得到的。对于通道Cb和Cr, 我们分别提取三个低频系数:F (0, 0) , F (0, 1) , F (1, 0) 。因此这三个通道在创建图像的颜色布局描述符的过程中总共贡献了十二个参数。
2.2 颜色布局特征描述符的相似性测量
对于两个颜色布局描述符K={Y, r, b}和L={Y’, r’, b’}, 这两个颜色布局描述符的距离计算公式如下
在上面的公式中, Wy, Wcb, Wcr是三个分量的权值, Yp, Cbp, Crp是对应三个颜色分量中的每个分量的第p个DCT系数。
一般来说, 我们赋予低频系数更大的权值, 赋予高频系数更小的权值。在本文中, 如第2.1.4部分所描述的, 我们将Yp的前六个DCT系数设为0, 将Cbp和Crp的前三个DCT系数设为1, 将Cbp和Crp的其他DCT系数设为0。
3 基于自学习模板的图像内容检索
基于模板的图像检索系统的基本思想如下:首先, 通过所有用户输入的关键词检索有标签的图像并把检索出的图像作为模板。然后通过此模板, 该系统进一步进行基于内容的图像检索来从图像数据库中获取图像。最后, 根据用户的意愿, 用户可以更新模板库来提高以后的检索效率。
3.1 基于文本的图像检索
基于文本的检索方法的发展在多年来已经趋于稳定。本文实现的方法分两个步骤: (1) 该系统访问图像数据库, 扫描数据库中的所有图像文件, 提取每一个图像文件的名称并将他们存储到表中。 (2) 将用户输入的关键词和表中存储的所有文件名进行匹配, 将成功匹配上的图像存入结果数据库。
3.2 模板选择
模板选择的过程包括以下步骤:系统访问模板库, 遍历所有的模板图像并提取每个图像的标签。然后匹配提取的标签和用户提供的关键词, 如果有模板库中的图像与用户的关键词匹配成功, 该系统将把该模板图像作为基于内容的图像检索的模板。相反, 如果模板图像没有匹配成功, 该算法对模板库中的图像使用基于文本的图像检索, 将第一张得到的图像作为后来的基于内容的图像检索的模板。
3.3 整合主颜色特征和颜色布局特征
为了进行有效准确的基于内容的图像检索, 本文提出了一种新的整合主颜色特征和颜色布局特征 (DLLCI:Dominant Color and Color Layout Integration) 的特征提取方法。DCCLI利用分层自式自顶向下的思想, 在每次迭代中提取主颜色特征并且逐步降低问题的规模。然后将结果与在第2节介绍的传统颜色布局特征提取的结果整合。DCCLI的主要部分在于如何提取主颜色特征。该方法将在第3.3.1节到第3.3.3节介绍, 提取的主颜色特征的相似性度量以及主颜色特征和颜色布局特征的整合将在第3.3.4节和第3.3.5节介绍。模板的更新将在第3.3.6节介绍。
3.3.1 颜色模型转换
为了将RGB颜色空间转换到CIE XYZ颜色空间, CIE XYZ空间可以用以下公式计算:
将CIE XYZ颜色空间转换到LUV颜色空间, LUV颜色空间可以用下面的公式计算:
在这里u'和v'是色度坐标
3.3.2 颜色量化
有许多方法来进行颜色的量化, 如矢量量化, 聚类方法或神经网络。最常见的做法是将各分量均等分割。相反, 聚类算法将考虑整个空间中图像颜色特征的分布, 因此避免了在一定的垃圾箱中, 像素的数目非常少的情况, 从而使量化更有效。
在图像检索领域, 考虑数据库中的图像检索量巨大, 检索算法的计算复杂度是非常重要的。采用自顶向下的分割聚类方法, 在每一次聚类的迭代中, 该算法只关注“最大”的聚类。在这里, “最大”的聚类定义为目前拥有最高颜色距离的聚类。这个“最大”的聚类会被分割成两个更小的的聚类。最大聚类的缩小会导致在下一次迭代中一个较小的计算成本, 因为不用考虑在自底向上的方法的情况下不同选择的组合数。在下一次迭代中, 最大的聚类继续被分割, 直到聚类的数目达到阈值。该阈值是在聚类执行之前被设定的。在本文中, 阈值被设置为8。
聚类包括下面四个主要步骤:
(1) 初始化聚类中心, 公式如下:
当li, ui, vi是第i个像素的L, U, V系数, n是像素的数目
(2) 分裂最大的聚类。
从现有的颜色聚类, 我们选择“最大”的集群, 即拥有最大的颜色距离D的聚类。聚类颜色距离D的计算公式如下:
假设已有的聚类是M1, M2, …….Mn, 聚类的中心分别是 (l1, u1, v1) , (l2, u2, v2) , ………... (ln, un, vn) , 那么第i个聚类的颜色距离D如下计算:
其中M是第i个聚类的像素数。假设被分割聚类的两个中心分别是C1和C2。C1和C2的计算方法如下:
L, U, V是聚类中心的原始分量的坐标。M是被分割聚类的像素数, FAC的缩放因子, 它是根据特定的应用设置。
(3) 重复聚类过程。
扫描整个图像中的每个像素, 并确定每个像素所属的聚类再次进行聚类。假设现有的聚类是M1, M2, …….Mn, 聚类的中心是: (l1, u1, v1) , (l2, u2, v2) , ………... (ln, un, vn) 。第pi个像素和第j个聚类中心的距离定义为dj, 这个公式可以通过如下公式计算得到:
查全率百分比
我们选择最小dj所对应对应的聚类并把pi加入这个聚类中。然后算法会重新计算这个聚类的中心。
(4) 对比聚类数目和阈值。
是否聚类数等于其预先设定的阈值, 如果相等则终止该算法, 如果不相等则重复步骤2。
3.3.3 主颜色描述符
根据3.3.2节的结果, 聚类百分比是在每个聚类中像素的数目在总像素数目中的比例。主色描述符FC由主颜色和百分比组成。
N是主颜色数目, 即聚类的数目。ci是第i个聚类的中心, pi是第i个聚类的聚类百分比。
3.3.4 相似性度量
假设两个主颜色色描述符:
FC1和FC2的相似性度量可以由以下公式得到:
当ak, l是两个颜色ck和cl的相似度。ak, l=1–dk, l/dmax, 当dk, l是ck和cl的欧几里得距离。对于LUV空间中的两个颜色 (li, ui, vi) 和 (lj, uj, vj) , di, j由如下公式计算:
3.3.5 主颜色和颜色布局特征提取的整合
通过实验结果, 两个图像特征之间的距离被定义为以下公式:
其中w1和w2都被设为0.5。
3.3.6 数据库更新
在基于文本的图像检索完成后, 如果在模板库中的模板图像没有找到, 那么算法将自动选择基于内容的图像检索结果的第一张图像作为新的模板。此外, 为了保持算法灵活性, 该算法允许用户在检索结果中选择一图像, 将图像添加入模板库中, 并用这张图像来更新模板库。
查全率百分比
4 系统实现
第3节中描述的系统在以下环境中实现和测试:Java JDK 1.6, Eclipse JDK 3.6.2, 英特尔 (R) TM i7 CPU q720 1.6GHz, RAM 6G。另一方面, 该系统在数据集下进行测试。这个数据集含有十类共1000张图片, 数据集的样本图像如图1所示。十个类别包括人类, 大象, 恐龙, 公共汽车, 海滩等, 而且每个类别分别有100张图像。
此外, 为了验证的基于文本的图像检索, 我添加了一些标记的图像, 即, 有意义的文件名的图像。这些图像包括恐龙的20张图片, 大象的20张图像, 高山的20张图像, 和马的6张图像。
一个性能研究是比较DCCLI算法和颜色布局 (CL) 特征提取算法d的查准率和查全率。这是判断在图像检索领域中一种算法的性能优于其他算法最重要的统计测量。查准率和查全率的定义如下:
5 性能讨论
我们用标准测试数据集对我们的算法:整合主颜色特征和颜色布局特征 (DLLCI:Dominant Color and Color Layout Integration) 和传统的颜色布局特征提取 (CL) 算法在两个关键性能度量“查准率”和“查全率”上面进行了比较。测试使用了数据集, 并记录下每种算法的查全率和查准率。例如, 表3中的第二行显示“公交车45%, 30%”, 因为在测试数据集, 有100个图像属于“公交车”, 在进行DCCLI算法后, 系统检索到120个图像, 其中有45个图像属于“公交车”, 所以根据查全率的定义, 查全率是45/100=45% (返回的“公交车”图像数目除以“公交车”图像的总数) 。另一方面, 执行CL算法后, 系统返回30个“公交车”图像, 所以CL算法在“公交车”图像上的查全率是30/100=30%。表3中其他数据的计算与上面所讨论类似。根据查准率的定义 (返回的“公交车”图像数目除以算法返回图像的总数) , 我们可以生成表4, 这代表DCCLI算法和CL算法之间的准确度比较。
我们在表3中可以看到, DCCLI在十类图像中有七类优于或等于CL。此外, DCCLI在两个低于CL的类别:“玫瑰”, “海滩”差距也是非常小的, 60%对63%, 35%对39%, 只有在最后一行的“马”, 差距是比较大的。然而, 在前面七行, DCCLI都优于CL, 差距比较大的有大象:45%对30%, 公交车:45%对31%, 高山:39%对32%, 部落:50%对45.8%。所以最后三行不具有统计学意义。因此, 我们可以说, 我们的算法DCCLI在数据集上的查全率优于标准的CL算法。表4中的查准率也显示了同样的结论, 即DCCLI算法在以上标准数据集上优于CL算法。
6 结论
本文提出的算法提供了一个用户友好的方式来进行基于内容的图像检索, 因为用户不需要绘制模板的轮廓, 而只需输入他/她想搜查全率百分比索的关键词, 然后算法将自动匹配这个关键词与标记的图像, 并使用标记的图像作为进一步检索的模板图像。在基于内容的图像检索阶段, 本文提出了一种新的算法DCCLI, 这个算法利用分割聚类方法来提取主颜色特征, 在每一次迭代聚类中逐渐减少计算的复杂度, 然后结合传统的颜色布局 (CL) 特征提取的结果来进行图像检索。性能研究表明, DCCLI算法在查全率和查准率上都优于传统的颜色布局 (CL) 特征提取算法。
摘要:与传统的基于文本的图像检索方法相比, 基于内容的图像检索要求用户在检索图像时提供了一个模板。当用户绘制的模板轮廓有比较大的误差时, 检索效率和精度会大大降低。为了解决这个问题, 本文提出了一种利用模板库来结合基于文本的图像检索方法和基于内容的检索方法的系统。该系统只要求用户首先输入查询关键词, 然后它将自动提取模板库中的模板以及使用提取的模板来检索用户需要的图像。此外, 本文提出了一种新的算法DCCLI来进行分割聚类以提取主颜色特征, 然后将提取的结果与传统的颜色布局特征提取的结果进行整合。该系统比现有的基于内容的图像检索系统更加人性化。实验结果表明, 实现了DCCLI算法的图像检索系统比实现了基于内容的图像检索方法的图像检索系统拥有更高的查全率和查准率。
基于多模板方向的图像修复方法 篇8
关键词:图像修复,Criminisi算法,模板方向,样本匹配
数字图像修复是按照一定的规则, 根据原图像中的有效信息, 对图像中破损的区域进行信息的填充和修正, 以期达到视觉上的修复效果, 最终恢复原图像连续、完整、自然的视觉效果[1,2]。目前存在两大类卓有成效的图像修复技术:一类是基于偏微分方程 (PDE) 的图像修复技术, 该技术适用于修补图像中的小尺度缺损;另一类是基于纹理合成的图像修复技术, 该技术适用于填充图像中大面积的破损区域。
基于纹理合成的图像修复技术借鉴了纹理合成的方法来寻找最佳匹配块并进行复制, 是目前主流的方法, 它有效地结合了偏微分方程和纹理合成的优点, 相对其他算法而言, 可以处理大面积的图像破损, 获得较好的视觉效果。在这类算法中, 最具有代表性的是Criminisi等人提出的基于模板和优先权函数的图像修复算法[3], 该算法在保持图像纹理信息的同时也保持了结构信息, 其实现简单且修复精确, 不会导致模糊, 因而得到大量的应用[4—6]。
但是由于Criminisi算法采用单一方向、固定大小模板寻找最佳匹配块, 容易产生错误匹配甚至查找失败问题, 目前出现了一些Criminisi算法的改进算法。文献[7]分析了Criminisi算法中的优先权函数, 由于置信度值很快下降至零, 使得优先权计算不可靠。通过提出一个更加合理的优先权函数计算公式, 保证了图像中的结构信息和纹理信息被准确的填充, 最终使修复效果更加优化。文献[8]提出了一种“基于可变大小模板的改进图像修复算法”, 在Criminisi算法基本框架下, 采用大小可变的模板来提高搜索准确率。文献[9]通过分析图像的梯度域变化, 提出自适应确定待修复样本块大小的修复算法, 该算法针对具有明显结构变化的图像有着理想的修复效果。
现则根据自然图像中存在大量对称或有规则的物体的特点, 针对Criminisi算法采用单一模板方向的不足, 提出了一种基于自适应模板方向的图像修复算法。该算法在进行模板的搜索时, 通过对待修复块或样本块进行不同角度的旋转和/或映射变换, 来提高最相似模板的搜索成功率, 防止错误匹配的发生, 进而有效改善了图像的修复效果。
1 Criminisi算法
Criminisi算法是Criminisi等人[3]在2003年提出的一种基于样本块的修复算法, 该算法兼顾了图像纹理信息和简单的结果信息, 保持了纹理的自然过度和主要结构的连贯性, 达到了非常震撼的效果, 成为目前主流的图像修复算法。Criminisi算法的主要思想是:首先从待修复区域的边界上选取一个像素点, 同时以该点为中心, 根据图像的纹理特征, 选取大小合适的样本块, 然后在待修复区域的周围寻找与之最相近的最佳匹配块来代替该样本块。
图1为利用Criminisi算法的图像修复过程图[10], I表示输入的待修复图像, Ω表示待修复区域, Φ=I-Ω表示已知区域, ∂Ω为待修复区域与已知区域的边界。图1 (b) 中p是边界上的任意点, np是边界线在p点的单位法向量, ▽Ip⊥是p点等照度线强度和方向 (即梯度方向的垂直方向) 。图1 (c) 中ψp为以p点为中心的待修复块, p点通常选取处于边界的延长线上的点, 且要求被高置信度像素包围。ψq'和ψq″分别为以q'点和q″点为中心的样本块。
Criminisi算法的目的是在Φ的边缘∂Ω上选择合适的像素点p, 按照优先权函数定义的顺序向待修复区域填充修复信息。通过比较图1 (c) 图中ψq'和ψq'的优先权大小得到与待修复块最近似的样本块, 如图1 (c) 所示, 最后将此最佳匹配块复制到待修复块中, 如图1 (d) 所示[11]。
Criminisi算法大致可以分为以下三个步骤
1.1 优先权计算
Criminisi算法首先要确定破损区域的优先权, 通过计算得到具有最高优先权的待修复块。优先权函数P (p) 由下式给出[12]
式中C (p) 为置信度项, D (p) 表示数据项。初始化时, 当p∈Φ时, C (p) =0, 当时, C (p) =1。α为归一化系数, 对于典型的灰度图像, α取值255。np是边界∂Ω在p点的单位法向量, |ψp|为以p点为中心的待修复块ψp的面积。
1.2 最佳匹配块的确定
当算法查找到具有最高优先权的待修复块ψp后, 下一步则要在图像的已知区域内寻找与待修复块最近似的样本块ψq[13]。根据匹配代价函数, ψp和ψq应满足如下条件
对于灰度图像, d (ψp, ψq') 是对应各点的灰度值的方差和
式 (5) 中Vip表示待修复块ψp里第i个像素的颜色值, Viq'表示匹配块中对应的第i个像素的颜色值, m为ψp里已知像素点的个数。
根据式 (4) ~式 (6) 即可找到与待修复块最近似的样本块ψq。
1.3 置信度更新
确定了最佳匹配块后, 将最佳匹配块对应点复制到待修复块中, 此时图像的边缘部分发生变化, 置信度值也需要及时更新[14]:
重复以上三个步骤, 直到修复边缘为0, 完成图像修复。
2 基于多模板方向的图像修复算法
由于Criminisi算法采用单一方向模板搜索最佳匹配块, 得到的最佳匹配块与待修复块难免会产生误差, 经过多次迭代匹配后, 误差不断累计, 使得最终的修复效果不理想。考虑到大自然中大多数图像是有规则的图像, 如人脸、建筑物等对称图像, Criminisi算法没有利用这种规则性, 可能导致最佳匹配块的匹配错误, 造成误差累计, 因此Criminisi算法针对真实的自然图像处理得不够合理。本节针对Criminisi算法的不足进行改进, 提出一种基于自适应模板方向的图像修复算法, 充分利用大自然的特性并加以应用, 从而获得理想的修复效果。
2.1 自适应模板方向的原理
Criminisi算法中关键步骤之一为确定最佳匹配块。通常采用大小为5×5的模板, 利用此模板在原图像中的信息完整区域按照中心像素逐像素进行查找, 当找到与待修复块最近似的样本块时, 拷贝最佳匹配块对应点的像素信息进行当前待修复块未知信息的复制, 即信息填充。由于最佳匹配块与待匹配块之间可能会有误差, 经过多次迭代匹配后, 误差不断累计, 最终造成与原图像的偏差。
图2 (a) 为一个对称的原图像, 图2 (b) 为待修复图像, 对图2 (b) 使用Criminisi算法进行修复, 得到结果图2 (c) 。图中可以看出, 图像的左边部分出现明显的错误, 和原图差距较大。
以图3作为一个典型的错误匹配的例子来进行说明。图3 (1) 为Y轴对称图形, 假设a方块为待修复块, b、c为随机的两个样本块。经观察可见, 此图中无法找到与a待修复块完全一样的样本块。但b样本块与a样本块对称相同, c样本块旋转180°后则与a图相同。这一变换过程如图3 (2) 所示。如果选择的最佳匹配块是b样本块沿Y轴对称的样本块或者是c样本块顺时针旋转180°后的样本块, 则所得到的最佳匹配块与待修复块a完全相同, 此时待修复块a将会得到最完美的修复, 不会出现图2 (c) 所示的误差。
对于图像中存在某些规则或者对称时, 通过样本块的旋转或者映射等可以找到与待修复块完全相同的匹配块, 这样就不存在误差, 也就不会产生累计误差, 得到的修复效果将会是最完美的。本文提出的基于自适应模板方向的图像修复算法正是基于这一原理。
2.2 基于自适应模板方向的匹配
在本文的算法中, 根据自适应模板方向的原理, 对模板的方向进行改进, 使其在一定的范围内进行多方向查找, 从而提高了最佳匹配块的查找成功率, 防止了错误匹配。模板的方向可以在0°~360°之间变化, 变化范围越大, 查找效率越低。为了均衡图像修复的效率及速度问题, 设最佳匹配块的可能状态为以下8种, 分别为旋转0°、90°、180°、270°, 以及映射得到的0°、90°、180°、270°。以图3 (a) 中待修复块a为例, 得到的最佳匹配块可能状态的查找方向如图4所示。
通过模板的多方向匹配改进后, 在求最佳匹配块时的匹配式就有以下八种情况, 分别对应图4中可能状态的查找方向, 假设所用模板大小为m×m
旋转0° (方向1) :
旋转90° (方向2) :
旋转180° (方向3) :
旋转270° (方向4) :
映射0° (方向5) :
映射90° (方向6) :
映射180° (方向7) :
映射270° (方向8) :
式中, Vijp表示待修复块ψp里第i行j列像素的颜色值, Vijq'表示匹配块中对应的第i行j列像素的颜色值, m×m为ψp里已知像素点的个数。
根据以上8种情况, 计算每个匹配块与待修复块之间的差值, 并根据匹配代价函数, 由式 (4) 计算找到最佳匹配块, 然后进行逐像素填充。通过模板多方向的查找, 最佳匹配块的查找成功率有效地提升, 当匹配的错误率降低之后, 累计误差的概率也降低了。因此最终的图像修复效果也得以增强。
3 实验结果及分析
图像修复算法的衡量标准通常有两个方面:图像修复后的视觉效果和修复消耗时间。本文主要针对图像的修复效果进行分析和研究。目前的图像修复评测标准中, 针对图像的修复效果, 最常见的是均方差测度 (MSE) 算法, 其计算量较少, 定义如下所示
式 (15) 中M、N分别为图像的行数和列数, f (i, j) 为原图像中点 (i, j) 的像素值, 是修复后图像中点 (i, j) 的像素值。实验是在配置为2.0 GHz处理器、2 GB内存的计算机上运行的, 利用Visio studio 2010进行仿真实验。图5和图6为分别使用Criminisi算法和本文的改进算法对同一对称图像进行修复的过程图。对比图5、图6, 从图5 (c) 、5 (d) 、5 (e) 可以看出, Criminisi算法逐渐产生错误累积, 最终修复结果图5 (f) 和待修复图像 (a) 差距较大。而本文提出的算法则获得令人满意的修复结果。图7是自然图像分别用Criminisi算法和本文算法进行修复的过程图。从图中可以直观地看出, Criminisi算法采用默认的模板进行搜索, 修复不彻底, 出现了明显的不相容的“垃圾块”, 而改进算法自然地还原了原图像, 从视觉效果上来看比Criminisi算法更好。
图8 (a) 是纹理信息丰富的彩色图像, 图8 (b) 中绿色破损区域为待修复区域, 图8 (c) 是利用Criminisi算法进行修复的结果图, 图8 (d) 是利用本文算法进行修复的结果图。从图8 (c) 、图8 (d) 中可以看出, 本文算法修复的结果非常自然, 而Criminisi算法修复的结果有轻微的人工痕迹, 视觉效果上不连贯, 能看到砖块的变形部分。
为了进一步比较本文改进算法与原Criminisi算法的优劣, 下面采用均方差测度算法, 对图7和图8进行计算, 计算结果如表1所示。
从表1可知, 在均方差这个指数上, 改进算法的结果相比原算法有较为明显的提升, 图7的改进算法的MSE是原算法的65%, 提升了35%, 图8提升了33%, 说明改进算法在匹配精度方面具有明显的优势。在理论分析方面, 因为改进算法在候选模板的数量上增加了7倍, 由原算法的一个模板, 根据上文分析的8个方向, 可以演变为8个模板, 这样大大地增加了匹配的概率, 使得到的最佳匹配块与待修复块的相似性提高, 降低了MSE指数, 图像修复效果得到改善。
4 结论
公文模板的制作 篇9
关键词:公文;模板;制作;方法
中图分类号:TP317文献标识码:A文章编号:1009-3044(2007)12-21716-01
The Creation of the Official Document Template
DU Ka
(The Vocational Technical College, Chenzhou 423000, China)
Abstract:This text introduced the format of the official document and how manufacture the method of the official document template according to the format. There is this template the creation of the consumedly convenient official document, raise to handle affairs an efficiency.
Key words:Official document; Template; Creation; Method
1 引言
公文的格式可以套用WORD中现成的模板,但现成的模板由于新的国家标准《国家行政机关公文格式》(国家质量技术监督局于1999年12月27日发布,以下简称《新标准》。)的颁布实施,许多地方作了较大的修改,因此对于经常用电脑制作公文的人来说,制作一个新的公文模板可以大大提高办公效率,何乐而不为呢!
下面分两部分谈谈怎样用电脑制作公文模板。
2 公文的基本格式
2.1 公文眉首格式
2.1.1 发文机关标识(公文版头)
发文机关标识上边缘至版心上边缘为25mm。对于上报的公文,发文机关标识上边缘至版心上边缘为80mm。“发文机关标识推荐使用小标宋体字,用红色标识。
2.1.2 公文份数序号(印刷顺序号)
“涉及国家秘密的公文应当标明密级和保密期限,其中,‘绝密’、‘机密’级公文还应当标明份数序号”。
份数序号的位置在版心左上角第1行处,顶格书写。
2.1.3 发文字号
发文字号位于“发文机关标识下空2行,用3号仿宋体字,居中排布;
“发文字号之下4mm处印一条与版心等宽的红色反线”。
2.1.4 签发(会签)人
上行文必须注明签发人姓名“平行排列于发文字号右侧。发文字号居左空1字,签发人姓名居右空1字;签发人用3号仿宋体字,签发人后标全角冒号,冒号后用3号楷体字标识签发人姓名。
2.1.5秘密等级和保密期限
“如需标识秘密等级,用3号黑体字,顶格标识在版心右上角第1行,两字之间空1字;如需同时标识秘密等级和保密期限,用3号黑体字,顶格标识在版心右上角第1行,秘密等级和保密期限之间用‘★’隔开”。
2.1.6 紧急程度
“如需标识紧急程度,用3号黑体字,顶格标识在版心右上角第1行,两字之间空1字;如需同时标识秘密等级与紧急程度,秘密等级顶格标识在版心右上角第1行,紧急程度顶格标识在版心右上角第2行”。
2.1.7 红色反线(间隔横线)
红色反线(间隔横线)的作用在于把眉首部分和主体部分隔开。一般放在发文机关标识或发文字号之下。党的领导机关的专用公文眉首,还要在红色反线(间隔横线)中间印一颗红五星。
2.2 公文主体格式
2.2.1 公文标题
公文标题位于“红色反线下空2行,用2号小标宋体字,可分一行或多行居中排布。
2.2.2 主送机关
主送机关位于“标题下空1行,左侧顶格用3号仿宋体字标识,回行时仍顶格;最后一个主送机关名称后标全角冒号。如主送机关名称过多而使公文首页不能显示正文时,应将主送机关名称移至版记中的主题词之下、抄送之上,标识方法同抄送”。
2.2.3 公文的主体(正文)格式
公文正文位于“主送機关名称下一行,每自然段左空2字,回行顶格。数字、年份不能回行”。
要注意的是,为了堵塞编造公文的漏洞,《新标准》取消了执行多年的“此页无正文”格式。
2.2.4 附件及附件说明
“在正文下一行左空2字用3号仿宋体字标识‘附件’,后标全角冒号和名称。附件如有序号使用阿拉伯数码(如‘附件:1.XXXXX’);附件名称后不加标点符号。
2.2.5 印章(发文机关名称)
“单一机关制发的公文在落款处不署发文机关名称,只标识成文时间。成文时间右空4字;加盖印章应上距正文2mm-4mm,端正、居中下压成文时间,印章用红色”。
2.2.6 签署
签署的位置应在正文之后,成文时间之上。即“正文下一行右空4字标识签发人签名章”,“在签发人签名章下空1行右空2字标识成文日期”。
2.2.7 成文日期
“成文日期用汉字将年、月、日标全;‘零’写为‘O’”。由于印章一般要盖在成文日期上,因此,成文日期的位置要依印章的位置而定。
2.2.8 附注
公文附注“用3号仿宋体字,居左空2字加圆括号标识在成文时间下1行”。
2.3 版记(文尾)格式
2.3.1 主题词
“主题词”用3号黑体字,居左顶格标识,后标全角冒号;词目用3号小标宋体字;词目之间空1字”,不用标点,“一般不超过5个”。
2.3.2 抄送机关
抄送,在主题词下1行;左右各空1字,用3号仿宋体字标识‘抄送’,后标全角冒号;抄送机关间用逗号隔开,回行时与冒号后的抄送机关对齐。
2.3.3 印发机关和印发日期
“印发机关和印发日期位于抄送机关之下(无抄送机关在主题词之下)占1行位置;用3号仿宋体字。印发机关左空1字,印发日期右空1字。印发日期以公文付印的日期为准,用阿拉伯数码标识”。
2.3.4 版记中的反线和版记的位置
“版记中各要素之下均加一条反线,宽度同版心”。
“版记应置于公文最后一面,版记的最后一个要素置于最后一行”。
附公文格式(上行文且是党的领导机关发文)图如下:
文件尺寸:297mm×210mm
3 运用WORD-XP进行具体操作
3.1 页面设置
(1)打开WORD,进入WORD窗口。
(2)单击“文件”菜单下面的“页面设置”命令,在“页面设置”对话框中选择“纸张”选项卡,接着在“纸型”列表框里选择A4纸。
(3)同样在“页面设置”对话框中选择“页边距”选项卡,对上(37mm)、下(35mm)、左(28mm)、右(26mm)进行调整。最后单击“确定”按钮。
3.2 输入文字。
3.3 按照上图格式进行排版。
3.4 用文本框插入“★”(党的机关公文就有)。
3.5 单击“插入”菜单下面的“文本框”命令,在下拉菜单中选择“横排”,当鼠标变成“+”字箭头时,在页面空白位置拉出一个文本框。
3.6 在文本框中插入“★”(两种方法;一种是单击插入菜单下面的“符号”命令,找到“★”;另一种是右键单击软键盘,选择“特殊符号”中的“★”)并设为红色,小粗。
3.7 去除文本框边框(把鼠标定位于边框左上角,当鼠标变成+字箭头符号时双击,就会弹出“设置文本框格式”对话框,选择“颜色和线条”选项卡,在“填充”和“”颜色分别设为“无填充”和“无线条颜色”,单击“确定”即可)。
3.8 用文本框绘制两条红色反线。
3.9 复制一个文本框,单击“绘图”工具栏里的“”(直线)按钮,在文本框中画一条直线。
3.10 选中这一直线,双击它,弹出“设置自选图形”对话框,选择“颜色和线条”选项卡,在线条颜色中选择红色,线型为2.25磅的,“确定”即可。
3.11 调整“★”和两条红色反线的位置,使“★”处于两条红色反线正中间。
3.12 绘制黑色反线。
3.13 在“绘图”工具栏中选择“”,按住鼠标左键拖动即可。
3.14 保存为文档模板
单击“文件”菜单,选择“另存为”命令,在弹出出的对话框中,保存位置为Templates文件夹,名字可自己命名,保存类型为“文档模板.Doc”即可。
参考文献:
[1]郭春燕. 办公自动化[M]. 北京:高等教育出版社,2003.6.
[2]张德实. 应用写作[M]. 北京:高等教育出版社,2003.7.
基于级联模板匹配的目标定位 篇10
目标定位广泛用于与计算机视觉和图像处理相关的应用中, 例如目标跟踪﹑目标检测和视频压缩等。在这篇文章中, 我们的目标是要在手机系统桌面上快速定位一个需要查找的图标, 如图1所示。这类问题可以通过目标匹配的方法来解决, 现在流行的目标匹配的方法有两种, 一是基于区域的目标匹配, 另一种是基于局部特征的目标匹配。
模板匹配【1】是基于区域目标匹配的重要方法之一, 现在有许多对模板匹配改进的文章【2, 3, 4】。典型的模板匹配计算模板和图像滑动窗口在每一个像素值上相似度, 并将相似度高于阈值的区域作为目标在图像上的位置。这种方法的缺点是没有考虑到模板尺度的变化, 另一个缺点是必须人为的设定一个匹配度阈值, 这个阈值直接影响着算法的准确性, 因此, 典型的模板匹配不能直接满足我们的需求。
另一种目标匹配算法【5, 6, 7, 8】是基于局部特征的。Lowe引入SIFT描述子来解决目标匹配问题, 首先通过高斯差分检测出关键点, 然后使用SIFT描述子来描述关键点, SIFT描述子具有尺度不变性和旋转不变性, 对目标和源图像的SIFT描述子进行匹配, 使用RANSAC从匹配的描述子中计算出目标在源图像上的仿射矩阵, 最后通过仿射矩阵在源图像上定位出目标。局部特征匹配的方法具有尺度和旋转的不变性, 但却不能满足我们的需求, 一些图标只有很少的关键点, 这样RANSAC算出的仿射矩阵错误率高, 若匹配的关键点对的数目少于4对, 甚至连仿射矩阵都不能算出。
1、基础方法
1.1灰度模板匹配
灰度模板匹配在被搜索的源图上从上到下, 从左到右移动模板并计算相似性, 这个相似性代表了这个模板和源图上候选区域的匹配程度。我们定义源图为S (x, y) , 定义模板为T (x, y) 。源图和模板都已经转化为灰度图像。我们通过累加模板和源图图像快之间像素值差的绝对值 (SAD) 来测量模板和源图图像块间的相似性, 在源图坐标为 (x, y) 处的SAD定义如下:
Trows表示模板的宽度, Tcols表示模板的高度, I (x, y) 表示坐标 (x, y) 处的灰度值。
1.2颜色直方图
颜色直方图是一副图像的全局特征, 它所描述的是不同色彩在整幅图像中所占的比例, 而并不关心每种色彩所处的空间位置, 颜色直方图相对于图像的以观察轴为轴心的旋转以及幅度不大的平移和缩放等几何变换是不敏感的, 颜色直方图对于图像质量的变化也不甚敏感, 它广泛的应用于图像检索和图像分类[9]。
1.3几何不变矩
几何不变矩【10】由不变代数衍生而来, 一幅大小为M×M的二维灰度图像f (x, y) 的 (p+q) 阶矩定义如下:
其中p, q为非负整数。为了保证形状特征的位置不变性, 还必须计算中心矩, 即以图像的质心为原点计算图像的不变矩值。由零阶矩和一阶矩可以算出图像的质心。质心 (x′, y′) 的定义如下:
因此图像f (x, y) 的中心矩定义如下:
为了得到尺度不变性, 可以将中心矩进行归一化, 归一化后的中心矩定义如下:
Hu【11】通过归一化的中心矩定义了7个函数, 这7个函数满足形状的平移、旋转和尺度不变性, 其计算如式 (6) 所示:
2、基于级联模板匹配的目标定位
图2为目标定位算法的框架, 我们首先对目标构建一个带通金字塔, 带通金字塔的每一层都单独地作为模板。通过在源图像上进行多尺度的快速模板匹配, 可以在源图上得到可能包含目标的候选区域, 其次通过非极大值抑制来去除重叠的候选区域, 然后使用颜色直方图对剩下的候选区域进行验证, 接着用Hu不变矩进一步的筛选候选区域, 最后剩下的候选区域就是目标在源图像的位置。
2.1多尺度快速模板匹配
考虑到计算复杂性, 我们加入了快速模板匹配【2】。由于快速模板匹配不具有尺度不变性, 所以我们首先对目标构造带通金字塔。通过对目标进行插值或降采样, 我们得到了包括目标原尺寸在内的19个不同尺度的模板, 这样我们的算法就具有了一定的尺度不变性。我们使用等式 (1) 来测量每一个模板和候选区域的匹配程度。这是一个候选区域的提取过程, 为了降低漏检率, 我们设置了一个较低的匹配阈值0.4 (最大为1) 。对于高于匹配阈值0.4的候选区域, 我们都将它们的匹配得分﹑位置信息等记录下来。图3为多尺度快速模板匹配的过程。
2.2非极大值抑制
由于我们使用了多个不同尺度的模板并设置的较低的匹配阈值, 多尺度快速模板匹配后存在多个重叠的候选区域。我们利用非极大值抑制从重叠的候选区域中挑选出最置信的候选区域, 并去掉与其重叠的候选区域。对于候选区域A和B, 我们定义重叠程度C:
A∩B表示候选区域A和B的交集, min (A, B) 表示A和B之间较小的区域。如果C大于0.5, 我们认为候选区域A和B是重叠, 所以我们移除匹配得分较小的候选区域。
2.3基于颜色直方图的候选区域筛选%
因为快速模板匹配是基于灰度的, 没有充分利用目标和源图像的颜色信息, 所以我们应用色彩直方图来移除错误的候选区域。首先, 我们将目标和源图像都从RGB色彩空间转换到HSV色彩空间上。其次, 我们分别生成候选区域和目标的色彩 (Hue) 直方图, 最后我们归一化色彩直方图并比较它们。两个直方图x, y的相似度定义如下:
其中xi和yi为x和y的若干个小的颜色区间 (bin) , 如果x和y的相似性小于阈值, 我们删除这个候选区域。
2.4基于Hu不变矩的候选区域筛选
直方图与图像是一对多的关系, 所以相似的直方图并不能保证候选区域包含目标。相似的直方图是候选区域包含目标的必要却不充分的条件, 考虑到我们未使用到目标的形状信息, 所以我们加入了Hu不变矩进一步去除错误的候选区域。
我们分别计算目标和候选区域的Hu不变矩, 候选区域和目标在Hu不变矩上的差异性定义如下:
其中A和B分别表示目标和候选区域, h Ai和h Bi分别是A和B的Hu不变矩。若I (A, B) 大于我们设定的阈值, 我们认为这个候选区域不正确并删除它。经过以上4步, 最后剩下的候选区域就是目标在源图像上的位置。我们输入的目标为一个时钟的下半部分, 图4展示了我们方法的结果, 从图上可以看出我们的方法正确的定位到目标。
3、实验结果
我们的程序运行在奔腾4的电脑上, 电脑的cpu是200 GHz。我们构建的数据库包括了100张源图和300个需要查找的目标。为了模拟手机桌面系统, 源图的分辨率在240×320像素到480×640像素之间。
为了模拟真实的应用环境, 并验证我们方法的尺度不变性和对噪声的不敏感性, 300个目标中有100个目标被随机的放大或缩小, 100个被加入了随机的高斯噪声, 另外100个既加入了随机的高斯噪声也被随机的进行尺度变化。基于SIFT和RANSAC的目标定位的方法是非常流行的, 所以我们将它作为对比实验, 因为关键点采集的密度影响到对比实验的正确性和运行时间, 所以对比方法采用了不同的采样密度。
如表格1所示 (sift10表示对比方法的采样密度参数设置为10) , 我们的方法在有噪声和尺度变换的图片上的正确率都高于基于SIFT和RANSAC的目标定位的方法。表格2表明我们方法的计算速度高于基于SIFT和RANSAC的目标定位的方法。
4、总结
本文提出了基于级联模板匹配的目标定位的方法, 我们通过带通金字塔得到了尺度不变性, 通过快速模板匹配提高了定位的速度, 通过非极大值抑制去除了重叠的候选区域, 最后通过颜色直方图和Hu不变矩去除了错误的候选区域。本方法是快速稳定的, 我们已经将它应用在智能手机排版的自动检测上。
摘要:为了实现快速的目标定位, 本文提出了一种基于级联模板匹配的目标定位的方法。首先用不同尺度的多模板匹配来寻来目标在源图中的候选区域, 其次通过颜色直方图对候选区域进行筛选, 最后使用Hu形状不变矩来验证候选区域是否为目标。该方法对于一般的旋转和尺度变换具有鲁棒性。实验结果表明该方法是快速有效的。