内容复制(通用3篇)
内容复制 篇1
由于图像信息的丰富性和重要性,以及行业应用图像数据库的日益庞大,图像近复制检测技术近年来得到了图像分析、计算机视觉等领域科研人员和应用工程师的广泛关注,并成为比较活跃和热门的研究课题。基于内容的图像近复制检测的主要任务是利用图像处理、计算机视觉等技术或方法从图像数据库中找到与给定示例图像内容非常相似的副本,即近复制图像(Near-duplicate Image)。
一般而言,近复制图像是指在同一源图像的基础上经过图像处理操作而产生的图像(副本),这些处理操作包括:图像颜色、对比度、亮度、饱和度的调整,图像缩放、图像旋转、图像裁剪、对源图像进行数据压缩等等。目前,也有些研究学者把不同相机参数、不同拍摄条件下拍摄的同一个场景或目标的图像也看作是近复制图像。以前很多学者的研究工作主要集中在前者,他们关心的是图像是否复制或篡改(整体把握,易于处理),而非图像中的部分场景或目标是否相同(局部匹配,难度增大),本文将以上两种情况都考虑在内。也就是说,只要包含同一场景或目标的图像都可以看作是近复制图像,它们不一定来自相同的源图像。
本文基于VC++开发平台设计了一个基于内容的近复制图像检测系统,本文对该系统的工作原理、功能模块进行了说明,并通过实验验证了系统的有效性。
1 图像近复制检测系统的工作原理
图像近复制检测系统是介于用户和图像数据库之间的一种信息服务系统,用户通过它可按自然方式从库中提取满足所需要内容的图像或图像序列。
本文所设计的图像近复制系统的原理框图如图1所示。
图像数据库中图像的视觉内容经过特征提取算法检测出来并采用多维向量来描述,从而形成一个图像特征库。一般要进一步为该特征库建立索引,以便于实现高效的近邻搜索。这些步骤均可以离线完成。
为了检测到图像库中的近复制图像,用户在线向系统提供待检测图像,系统再利用特征提取算法实时提取待检测图像的特征向量,然后在索引机制、匹配策略、投票机制等决策机制的帮助下,计算待检测图像与数据库图像之间的相似程度,并按照相似程度排序,以可视化的形式返回最可能是近复制的一组图像给用户。
2 图像近复制检测系统功能模块设计
本文设计的图像近复制检测系统按功能模块主要分为图像局部特征提取模块、特征索引模块、K近邻搜索模块以及相似性投票模块,如图2所示。
2.1 特征提取模块
提取稳定而具有区分性的图像特征是计算机视觉应用的根本基础,对于图像近复制检测而言也不例外。图像的特征可分为全局特征和局部特征。由于全局特征难以应对近复制图像中常存在的图像畸变、目标部分遮挡、目标被裁剪等情形,近年来图像局部不变特征得以重视并飞速发展。比较有名的图像局部特征提取算法有SIFT、SURF、HOG等[1]。
本文选择性能与速度俱佳的SURF(Speeded-Up Robust Features)算法[2]完成局部特征提取功能。SURF本意为加速的具有鲁棒性的特征,由Bay在2006年首次提出。SURF算法由SIFT算法改进而来。由于SURF在实现过程中采用了Harr特征以及积分图像(Integral Image)的概念,大大提示了计算效率,一般而言标准的SURF算法比SIFT算法快好几倍。
SURF特征提取模块包括在线模块和离线模块。在线模块处理的是用户输入的待检测图像,对待检测图像完成特征检测和特征描述,并得到一个描述图像视觉内容的64维的局部特征向量集。离线模块处理的是图像库中的所有图像,对整个图像库遍历,依次读取每一幅图像,并对每一幅图像进行特征提取和特征描述,最终就形成一个较大规模的图像特征向量库(64维)。
2.2 特征索引模块
对于大规模图像数据库来说,线性扫描的查询方法满足不了用户的搜索需求,因此需要利用相应的技术和数据结构来组织特征向量并管理搜索过程,从而加速查询,这就是索引的基本功能。多媒体数据库的索引机制与一般索引结构的一个重要区别在于它面临着“维度灾难”[3]带来的影响。围绕着这个问题,近年来有很多研究者提出了很多的解决方法,这些方法都试图适用于各自特定应用背景下的高维数据,如多维索引方法、降维方法等。
在本文设计的图像近复制检测系统中,大量高维局部特征会给后续的特相似性征匹配(近邻搜索)带来“维度灾难”,因此采用位置敏感哈希(LSH)[4]索引方法作为图像高维特征数据的索引方法。LSH算法的基本思想是对数据点集,利用一组具有一定约束条件的哈希函数来建立多个哈希表,使得在某种相似度量条件下,相似的点发生冲突的概率较大,而不相似的点发生冲突的概率相对较小。已有研究表明,LSH在这方面明显优于KD-Tree、R-Tree、R*-Tree等常规索引结构。
特征索引模块属于离线部分,根据LSH算法的特点,它可以将相似的对象(高维局部特征)散列到同一个桶中,这意味着,LSH算法可以将高维的特征向量进行聚类,可近似认为这种方式为这高维图像特征库建立了一个索引集,而根据LSH得到的一个个的桶,就相当于将高维的特征向量分成了一个个的类。从而这个方法能够有效缓解高维特征向量带来的高计算复杂度。
2.3 K近邻搜索模块
K近邻搜索模块属于在线部分,对来自待检测图像的特征向量集中的每个局部特征,要从图像特征库中寻找与之最相似的K个局部特征向量,其相似程度可由这两个特征向量之间的距离来度量,即:若距离越近,则相似度越高。借助上述LSH索引结构,相比于线性扫描的搜索方法,即强力搜索(BF,Brute Force)方法,这个搜索过程可以高效完成。
假如某个待检测图像的特征向量集中包含N个局部特征,最后得到的K近邻搜索的结果为N×K个局部特征,而这些局部特征分别属于特征索引集中的特征向量。
2.4 相似度投票模块
图像近复制检测的最终目的是要从图像库中找到带检测图像的所有副本,即系统的输出是图像,而非特征向量。因此在上述特征相似性匹配的基础上,还需要一个基于K近邻搜索结果对库图像的进行投票的模块。这里称为相似度投票模块,属于在线部分。
通过上述K近邻搜索模块得到了一共N×K个局部特征向量,而这些特征向量来自于图像特征库,每个特征向量都对应于一个库图像。为每个局部特征设置一个标签,标注这个局部特征属于哪一幅库图像,并为每个局部特征设置一个权值,权值的大小设置为这个局部特征与匹配特征距离的倒数,这个权值相当于票数。然后分别对这N×K个局部特征中拥有相同标签的权值求和,将得到的结果是放入一个M行2列的数组中,其中M代表这个N×K个局部特征中所出现图像的个数,而数组的第1列中的值为原本局部特征的标签值,代表属于哪一幅库图像,第2列中的值为具有相同标签的局部特征的权值的和,即相当于得到的票数。最后对这种加权票数进行排序,加权票数最多的,就是与待检测图像最相似的图像,即最可能的近复制图像。一般返回相似度最高的若干个结果,作为可能的近复制图像。
基于以上功能模块的设计,本文在VC++上实现了系统的功能,并部分调用OPENCV函数库中的函数,在MFC上完成可视化界面设计,如图3所示。
本系统的离线操作界面中,生成特征库的功能是提取库图像的SURF特征,并建立SURF特征库。生成特征矩阵的功能就是将特征库中的SURF特征读入内存中;建立索引的功能对对SURF特征库建立LSH索引。每个功能完成,都会显示该步骤所耗费的时间。
本系统的在线操作界面中的输入待检测图像的功能就是让用户提供待检测图像,并显示在其左侧的图像控件中。为了便于比较LSH索引和线性扫描的区别,本系统提供两个检测功能,即基于特征索引检测和线性扫描检测。用户可以通过单选框选择想要进行的检测方法,当选定一个方法后,再选择“近似图像检测”按钮,即可返回相应结果。本系统默认返回前8幅最可能的近复制图像,显示在下面的图像控件中。
3 图像近复制检测实验
图像近复制检测实验用到的图像数据库是UK-Bench[5]。完整的UKBench图像数据库包含多种物体场景上万幅图像,每种物体场景各4幅包含不同变换的图像,可视为近复制图像(样本)。本文选择了其中的一个子集,即前面的500幅图像。UK-Bench图像库的部分图像如图4所示。
为了便于比较,本系统返回与待检测图像最相似的8幅图像。实际上,根据图像库的特点,如果返回的检测结果中包含和输入图像属于同一物体的4幅图像,就认为检测结果完全正确,当然最好是排在前4位的。
线性扫描检测方法没有对特征库建立索引,当进行K-NN匹配时,直接将待检测图像的每个局部特征与特征库中的特征一一匹配,然后找出距离最近的若干个局部特征,这种方法线形扫描方法在处理大图像库时,计算量会相当庞大而基于特征索引检测方法利用离线完成的库图像的SURF特征提取和LSH特征索引,以便于更快的在线近邻特征搜索。如图5(a)所示,随机比较了两种方法下对若干幅图像检测的时间耗费。如图5(b)所示,显示了使用特征索引检测方式对整个实验图像子集的检测结果,平均准确率为84.05%。
4 结束语
本文在VC++平台上设计并实现了一个基于内容的图像近复制检测系统,并通过实验验证了系统的可行性。从用户的角度来说,比较关心的有两点,一是最后得到结果的时间耗费,二是检测结果的准确率。通过实验研究表明,基于特征索引的近复制检测系统更具实用价值,其关于图像库特征提取及索引的工作已经在离线状态下完成,在线检测时只需很少的时间和计算耗费就能够获得用户想要的结果。
摘要:基于内容的图像近复制检测是目前图像分析和计算机视觉领域比较活跃的研究课题。运用SUFR特征提取、LSH高维特征索引以及K近邻搜索和加权投票技术,在VC++开发环境下设计了一个基于内容的图像近复制检测系统,在UKBench图像库的一个子集上通过实验验证了该系统的有效性。
关键词:图像局部特征,高维特征索引,近复制图像
参考文献
[1]Mikolajczyk K,Schmid C.A Performance Evaluation of Local Descriptors[J].IEEE Trans.On Pattern Analysis and Machine Intelligence,2005,27(10):1615-1630.
[2]Bay H,Ess A,Tuytelaars T,et al.Speeded-up robust features(SURF)[J].Computer Vision and Images Understanding 2011(3):346-359.
[3]Indyk P,Motwani R.Approximate nearest neighbor:towards removing the curse of dimensionality[J].Proc.of the Symposium on Theory of Computing,1999(12):1-20.
[4]Gionis A,Indyk P,Motwani R.Similarity Search in High Dimensions via Hashing[C].Proc.of International Conference on Very Large Data Bases,1999.
[5]VISCENTER[EB/OL].(2014-01-20).http://www.vis.uky.edu/~stewe/ukbench/.
内容复制 篇2
小提示:如果网页内容较多且有大量图片,则Word在打开网页时会提示“Word内存不足,修改之后无法撤销操作”,这个提示不会影响复制网页内容。 第3步,选中需要复制的内容,并执行复制操作。然后新建一个Word文档,将复制的内容粘贴到新的Word文档中,保存即可。
点击阅读更多学院相关文章>>
内容复制 篇3
解决方法:
方法1.开始>运行>输入“gpedit.msc”回车,
打开组策略编辑器。依次展开本地计算机策略>计算机配置>管理模块>Windows组件>Internet Explorer,
在右边的窗口中找到“关闭安全设置检查功能”策略项,
双击此项,在“设置”选项中选择“已启用”,
方法2.
1、打开IE8选择“工具”→“Internet选项”
2、接着,选择“安全”页面,点击“Internet”,再选择下面的“自定义级别”按钮。