视频搜索引擎

2024-05-12

视频搜索引擎(共10篇)

视频搜索引擎 篇1

1 引言

搜索引擎经过几年的发展和摸索, 越来越贴近人们的需求, 不断地应用于人们生活的各个领域。在互联网音视频节目监测系统中, 搜索引擎扮演了重要的角色, 它可以在浩瀚的网络中搜索出视听节目的站点。互联网音视频节目监测系统中的搜索引擎主要是对互联网上视听节目信息进行发现、解析、存储、索引、查询, 甚至直接下载, 最后用户根据搜索引擎的搜索结果, 在系统中方便的对互联网上的视音频节目进行监控。

2 搜索引擎在互联网音视频节目监测系统中的重要作用

搜索引擎在互联网音视频节目监测系统中主要作用可以从以下两点进行论述。

(1) 搜索视音频网页:在互联网监测音视频节目监测系统中, 搜索引擎的作用就是在网络上搜寻视音频网页, 网络上的数据是不断更新的, 种类也各种各样, 因此对搜索引擎的要求就大大的提高了。搜索引擎首先负责的就是将网络上的各种MP3、ram、avi等视音频节目的具体信息搜索下来, 包括网页地址、浏览量、用户评论、作者信息等。

(2) 在系统中将网页呈现给用户:网络上的视听网页被搜索出来后, 必须要将所有的网页呈现在系统用户的面前, 这也是在系统中应用搜索引擎的最终目的。互联网音视频节目监测系统可以说是一个用户接口, 用户通过这个接口能看到搜索引擎所搜索到的所有的视音频节目信息。

从上面的介绍中可以了解到, 搜索引擎在互联网音视频节目监测系统中有举足轻重的作用, 它是监测系统的门户, 为系统提供第一手的数据资料。搜索引擎的各个方面贯穿于系统的各重要部分中。互联网音视频节目监测系统就是专门用于搜索视音频节目的搜索引擎, 不过所不同的是这个搜索引擎搜索出所需要的视听节目网页后, 并在监测系统中对这些节目进行监视, 并对违法乱纪、危害青少年的视听节目进行封堵, 以达到净化网络的目的。

3 系统搜索引擎的基本原理

互联网音视频节目监测系统中所运用到的搜索引擎的原理, 可以分为三步:即从互联网上抓取视音频节目网页→将节目信息存入数据库并建立索引→在节目索引数据库中搜索信息, 并按特定方式展现出来。

该搜索引擎是由搜索器、索引器、检索器和用户接口等四个部分组成, 其主要运行如图1所示。

系统通过搜索器在互联网上抓取视音频节目网页, 然后通过索引器的运行建立节目的索引数据库, 最后用户通过接口能够使用检索器在节目索引数据库中搜索到符合自己要求的信息并进行展现。

3.1 搜索器

搜索器即通常所说的网络爬虫, 其功能是在互联网上爬行, 发现和搜集所需要的视听节目信息。搜索器通常是一个计算机程序, 日夜不停地运行, 它要尽可能多、尽可能快地搜集各种类型的新信息, 同时为了应对互联网上信息更新速度快的特点, 还要定期重新爬行, 以发现新的页面以及失效连接。

在系统中, 搜索器搜集的信息类型多种多样, 其中包括各种类型的网页、文章、FTP文件、字处理文档、多媒体信息。该系统中搜索器搜索的目标是用户所关心的视音频节目。

3.2 索引器

系统中的索引器功能是理解搜索器所搜索的视音频信息, 从中抽取出索引项, 用于表示文档以及生成文档库的索引表。

在互联网音视频节目监测系统中, 由于海量的信息数据, 因此必须实现即时索引, 否则无法跟上视音频节目信息量急剧增加的速度。索引算法对索引器的性能有很大的影响。一个搜索引擎的有效性在很大程度上取决于索引的质量, 而在本系统中应用到的索引器, 其主要是利用搜索引擎更好地查找到所需要的视音频节目信息。

3.3 检索器

检索器的主要功能是根据用户的查询在索引库中快速检出所需要的节目信息, 并进行信息与查询的相关度评价, 对将要输出的结果进行排序, 实现某种用户相关性反馈机制。

3.4 用户接口

用户接口的作用是输入查询请求、显示查询结果并提供用户相关性反馈机制。在本系统中, 整个前台系统就是一个用户接口, 用户可以在此系统中查看自己所需要的信息, 并能利用系统中的查询功能, 输入相应的信息, 就可以查找到所需要的视音频节目信息。系统中设计了人性化的搜索查询页面, 其主要目的是方便用户使用搜索引擎, 高效率、多方式地从搜索引擎中得到有效、及时的信息。系统中用户接口的设计和实现, 采用人机交互的理论和方法, 以充分适应用户的思维习惯。

用户输入接口可以分为简单接口和复杂接口两种。

本系统既提供用户输入查询串文本框的简单接口;也提供可以让用户对查询进行限制的复杂接口, 如逻辑运算 (与、或、非;、-) 、相近关系 (相邻、NEAR) 、域名范围 (如.edu、.com) 、出现位置 (如标题、内容) 、信息时间、长度等等。系统中充分利用了这个两种接口的优点以便于将最精确、最合理的数据呈现在用户面前。

4 系统搜索引擎的基本组成

4.1 系统爬虫

互联网音视频节目监测系统中爬虫的作用是为搜索引擎抓取大量的数据, 其抓取的对象为互联网上的传播视听节目的网页。爬虫程序的抓取方法都是顺着网页的链接关系进行爬行的。

互联网音视频节目监测系统爬虫的运行过程如图2所示。

图2便是互联网音视频节目监测系统爬虫程序的运行过程, 在爬虫开始的时候, 需要给爬虫输送一个URL地址列表即系统中所称的种子站点库, 种子站点库中的URL地址便是爬虫的起始位置, 爬虫从种子站点库开始, 逐个网页开始爬行, 一直不断地发现新的视听站点和节目, 在爬虫爬行过程中不断地从网页中发现新网站的URL加入到种子站点库, 如此反复下去。

在系统中, 爬虫在下载网页的时候, 会去识别网页的HTML代码, 在其代码的部分, 会有META标识。通过这些标识, 可以告诉爬虫本网页是否是视音频节目站点, 并判断此页需不需要被抓取, 还可以告诉爬虫本网页中的链接是否需要被继续跟踪。例如:表示本网页不是视听站点, 不需要被抓取, 但是网页内的链接需要被跟踪。

由于现在视听网站的内容不断的在变化, 因此爬虫也需不断的更新其抓取网页的内容, 这就需要网络爬虫按照一定的周期去扫描网站, 查看哪些页面是需要更新的页面, 哪些页面是新增页面, 哪些页面是已经过期的死链接。

一般来说, 在系统中网络爬虫在更新视听网站内容的时候, 不用把视听节目站点重新抓取一遍, 对于大部分的站点页面, 只需要判断网页的属性 (主要是更新日期) , 把得到的属性和上次抓取的属性相比较, 如果一样则不用更新。

爬虫是搜索引擎中非常重要的一部分。而本系统中的爬虫尽可能多、尽可能快地给索引部分输送网页, 为系统的搜索引擎提供强大的数据支持。

4.2 分析系统

分析系统主要完成的任务有视听节目信息的抽取、视听站点网页查重、中文分词等。

4.2.1 视听节目信息的抽取以及网页结构化

对于分析系统来说, 基础和首要的工作是分门别类地从半结构化网页中抽取出有价值的能够代表视听节目网页的属性, 如:节目的名称、节目的描述等。

从图3中可以直观的了解网页结构化的过程, 在系统中网页结构化的目标是针对系统搜索的需要, 将半结构化的HTML网页中的数据按照文件、标题、正文标题、正文、正向链接等属性依次抽取, 最后打包出一个视听网页对象。

在理解结构化网页的目标后, 加上对HTML语法的特点, 以及搜索引擎对视音频节目站点的实际需要, 为这种分析原始网页的过程制定了如下“两步走”的方法。

(1) 建立HTML标签树:系统为了能更好的描述视听网页内容的组织结构, 就将网页中的标签按照出现的顺序依次整理出来并用适当的结构记录。网页中的标签主要作用就是利用HTML的语法对网页的全部内容进行存放。由于标签之间的嵌套关系, 因此整理结果自然是一个树状结构, 把整理一个网页中的标签得到的树状结构称为该网页的“标签树”。

(2) 得到正文:在视听网页中得到完整正文相对于一般的HTML网页要较简单一些。首先视听节目网页中所关心的视听信息都有特定的格式, 这就代表了已经有明显的标签标识出正文, 因此在互联网音视频节目监测系统中, 可以不像普通的HTML文件一样进行投票得到正文, 只要能够将视听节目的标签找出来就可以了。

视听节目网页结构化的过程首先通过标签树进行分析得到文本对应的标签, 然后再得到正文, 这样就完成了结构化的任务, 达到了网页结构化的要求, 将网页上有价值的信息进行保留, 并丢弃无用的信息。同时, 也节约了大量的存储, 不再是存储原始的网页, 而是存储一个结构化了的网页, 这样就省去了系统的存储空间, 大大节省了资源, 更有效的提高了系统的检索效果。

4.2.2 视听节目网页查重

在系统中网页去重技术就是判断一个视听文件内容是否存在抄袭、复制另外一个或多个视听节目文件的技术。

在现在的互联网络中, 网页上的内容是可以互相转载的, 一个好的视听节目肯定会在不同的网络中进行转载, 视听网站上的节目可以以链接的形式在各种不同的网站上进行转载, 因此网页的重复总体可以归结为如图4所示的4种类型。

从图4中可以看出, 视听节目网页重复的形式是多种多样的, 而重复网页的存在意味着这些节目站点就要被搜索引擎多处理一次。并且在搜索引擎的索引制作中可能会在索引苦力索引两份相同的视听站点。当用户用系统进行查询时, 在搜索结果列表中就会出现同一网站的同一个视听节目信息。所以无论从搜索引擎的效率还是系统使用的便捷度来说这些重复网页的存在都是害处极大的。

为了消除那些重复网页带来的不便, 为此需要进行网页查重, 网页查重一般被分为三个步骤:即特征抽取;相似度计算和评价;消重。

(1) 特征抽取:在互联网音视频节目监测系统中所用到的网页查重第一步进行的就是特征抽取。也就是将视听节目网页内容进行内容分解, 由若干组成文档的特征集合表示, 然后对网页进行特征比较并计算相似度。

(2) 相似度计算和评价:特征抽取完毕后, 就需要进行特征对比, 可以根据网页的内容, 输入词汇, 然后根据词汇过滤一些关键特征, 即一个节目中特别高和特别低频的词汇往往不能反映这个节目的本质。因此通过文档中去掉高频和低频词汇, 并且计算出这篇文档的唯一的Hash值, 那些Hash值相同的文档就是重复的。还有一个办法就是抽取多个特征进行比较, 因为在视听节目中文字信息是比较少的, 大部分都是音频信息, 所以在处理的时候一般都是通过词汇进行比较计算相似度的。

(3) 消重:系统网页查重的目标是要进行网页消重, 以便消除那些重复网页给系统带来的不便。对于删除重复内容, 搜索引擎考虑到众多收录因素, 所以使用了最简单的最实用的方法。先被爬虫抓取的页面同时很大程度也保证了优先保留原创网页。但是因为互联网音视频节目监测系统的特殊性, 所以在此系统所用到的搜索引擎进行网页消重的时候也会考虑到网页的版权、寿命等问题。

4.2.3 中文分词

分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。通过近几年web2.0等互联网传播技术的发展, 互联网上的视听信息也在急剧膨胀, 在这海量信息中, 各类信息混杂在一起, 通过引用分词技术, 就可以使机器对于海量信息的整理更准确更合理, 检索效率会大幅度的提高。

目前系统的中文分词主要应用于信息检索方面, 基于关键词 (Keyword) 来匹配结果。采用基于字符串匹配的分词方法。这种方法又叫做机械分词方法, 它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行匹配, 若在词典中找到某个字符串, 则匹配成功。

系统使用的分词系统, 都是把机械分词作为一种初分手段, 通过利用各种其它的语言信息来进一步提高切分的准确率。系统将分词和词类标注结合起来, 利用丰富的词类信息对分词决策提供帮助, 并且在标注过程中又反过来对分词结果进行检验、调整, 从而极大地提高切分的准确率。

4.3 索引系统

可以将索引系统形象的说成是搜索引擎的数据大本营, 在这里存储并索引了从网络上下载的数以亿计的视听节目网页。在索引系统中会用到很多技术, 在互联网音视频节目监测系统中, 应用到的关键技术就是基于ORACLE的全文检索技术。

传统的检索方式存在两个大问题:一是检索结果排序不理想二是只能对标题进行检索。这些问题都没有考虑到用户的需求和文档本身的内容, 因此在系统中使用了一种全新的检索方式对文档的全部信息进行检索, 比如:标题、正文等, 这种技术也就是通常所说的全文检索技术。

互联网音视频节目监测系统所用到的全文检索技术细化了视听信息检索的粒度, 并实现了对网络上的视听节目进行多角度, 多侧面的检索。用户只需提供一个或者多个检索关键词, 就可以检索出视听节目的详细信息如:节目名称、节目的URL、节目所在的网站域名、以及节目的一些详情信息等, 将结果更形象的展现在用户面前, 这都是全文检索技术的功劳。

4.4 查询系统

查询系统主要是在接收用户的查询请求后, 通过检索、排序及摘要提取等计算, 将计算结果组织成搜索结果页返回给用户, 它直接面对的是用户。在此系统中, 通过爬虫、分析系统、索引系统将网络上的视音频节目信息进行下载、整理, 并形成一个强大的视音频节目数据库和海量信息, 因此必须通过查询系统更快、更准、更稳的找到所需要的节目信息。

监测系统所搜集到的信息都是网络上的视音频信息, 随着网络的发展和视听网站的增多, 网络上的视听信息数以万计的在增长, 因此对监测系统中的查询系统提出了很高的要求。为了能更方便用户找到视听节目的站点, 系统中设计了很多的查询条件, 比如:按照站点、域名或者更新时间进行查询, 这些查询条件可以是单项的也可以是重叠的, 查询条件设置的多, 查询出的结果就越符合要求。

监测系统中用户向搜索引擎发出查询, 搜索引擎接受查询并向用户返回资料。因为监测系统并不是大量用户在使用的, 所以即使有几个用户同时在线进行查询, 它可以按照每个用户的要求检查自己的索引, 在极短时间内找到用户需要的视音频资料, 并返回给用户。目前, 普通的搜索引擎返回主要是以网页链接的形式提供的, 通过这些链接, 用户便能到达含有自己所需资料的网页。在本监测系统中, 系统直接以列表的形式将视听节目的名称、节目链接、站点名称及其链接、发布时间等各方面的信息制作成表格, 更形象的展现在人们面前。

为能更好的将查询结果展示在用户面前, 系统中特别设计了查询结果排序功能, 可以按照时间或者节目数量等对查找到的站点进行排序, 这种功能的实现, 使用户在海量信息面前应付自如, 充分展现出查询系统的优点。

5 结束语

伴随着网络的不断发展, 网络上的视音频节目不断增加, 互联网出现到现今, 信息量可以说成密指数的增长, 搜索引擎能从大量信息中找到所需的信息, 提供给用户。因此, 搜索引擎的发展直接决定了互联网音视频节目监测系统的性能。目前如何发现更多的视听网页、如何正确提取视听网页内容、如何下载动态网页、如何提高抓取速度、如何识别网站内容相同的网页等都是搜索引擎需要进一步改进的问题。

互联网音视频节目监测系统要在合理的时间限度内, 以较少的网络资源、存储资源和计算资源的消耗获得更多的与视音频相关页面.就必然对搜索引擎在提高链接价值预测的准确性、降低计算的时空复杂度, 以及增加搜索引擎本身的自适应性等方面有所发展, 有所突破。

邮购以上资料请通过邮局汇款, 款到后即邮寄资料及发票。电话:010-86092062转816传真:010-86092040转810汇款请寄:北京2116信箱发行部邮编:100866 http://www.gbds.com.cn广播电视标准在线订购下载http://www.abp.gov.cn

摘要:本文主要介绍了搜索引擎技术在互联网音视频节目监测系统中的应用, 深入阐述了系统搜索引擎的基本原理和组成, 指出了搜索引擎在系统中的重要作用。

关键词:搜索引擎,网络爬虫,查重,索引

视频搜索引擎 篇2

微课翻转课堂模式应用于小学英语课堂的初探

江文雄

【摘 要】伴随新理念和新技术的不断涌现,信息技术与课程的整合日渐深入,云端协作学习的平台的日趋完善,与之相适应的教学设计也呼之欲出。为了满足学生对学习资源生成与进化、智能与适应等多方面的需求,本文提出了适合学生在学习环境与非正式学习的一种新型学习资源组织方式——微课翻转课堂模式。通过围绕翻转课堂的概念与特点的分析,在对教学实践案例的基础上,构建出翻转课堂的教学模型,并分析了翻转课堂提升英语学习的效果,以期为小学英语的教学改革提供借鉴。

【关键词】小学英语;翻转课堂模式;信息化环境;在线学习

一、“翻转课堂”的定义与特征

翻转课堂,就是在信息化环境中,课程教师提供以教学视频为主要形式的学习资源,学生在上课前完成对教学视频等学习资源的观看和学习,师生在课堂上一起完成作业答疑、协作探究和互动交流等活动的一种新型的教学模式。翻转课堂是一种手段,增加了学生和教师之间的互动和个性化的学习时间;是让学生对自己学习负责的环境;是为了让教师成为学生身边的“教练”而不是在讲台上的“圣人”;是混合了直接讲解与建构主义的学习;是学生虽课堂缺席但不被甩在后面的学习;是课堂的内容得以永久存档,可用于复习或补课的学习;是所有的学生都积极学习的课堂;更是让所有学生都能得到个性化教育的学习。

1、教师角色的转变

翻转课堂使得教师从传统课堂中的知识传授者变成了学习的促进者和指导者。这意味着教师不再是知识交互和应用的中心,但他们仍然是学生进行学习的主要推动者。当学生需要指导的时候,教师便会向他们提供必要的支持。在翻转课堂中,学生成为了学习过程的中心。自此,教师成了学生便捷地获取资源、利用资源、处理信息、应用知识到真实情境中的脚手架。

2、课堂时间重新分配

翻转课堂的第二个核心特点是在课堂中减少教师的讲授时间,留给学生更多的学习活动时间。这些学习活动应该基于现实生活中的真实情境,并且能够让学生在交互协作中完成学习任务。将原先课堂讲授的内容转移到课下,在不减少基本知识展示量的基础上,增强课堂中学生的交互性。翻转课堂通过将“预习时间”最大化来完成对教与学时间的延长。其关键之处在于教师需要认真考虑如何利用课堂中的时间,来完成“课堂时间”的高效化。

3、学生角色的转变

教育者可以利用wikis、blogs等技术工具高效地为学生提供丰富的学习资源,学生也可以在网络资源中获取自己所需的知识。在技术支持下的个性化学习中,学生成为自定步调的学习者,他们可以控制对学习时间、学习地点的选择,可以控制学习内容、学习量。然而,在翻转课堂中,学生并非完全独立地进行学习。翻转课堂是有活力的并且是需要学生高度参与的课堂。因此,翻转课堂是一个构建深度知识的课堂,学生便是这个课堂的主角。

二、“翻转课堂”的混合学习模式

1、吴秉健老师对混合学习模式持有以下观点:学生的随时学习,至少包括在实体学校的学习和在线自主学习。学生拥有对学习时间、学习空间、学习路径以及学习步调的自主管控。学生除了在实体学校上课,也通过与教学设计者一道在校外的其他地点学习在线课程,这就是混合学习的体验[1]。如图1所示。

图1:翻转课堂混合学习模式和六种类型

2、但翻转课堂是由教师的教和学生的学所组成的双边互动过程,过分的强调“学”而忽略“教”容易从一个极端走入另一个极端。受桑新民等(2012)提出的“太极学堂”概念的启发,将翻转课堂的理念、中国传统文化中的太极思想、本杰明·布鲁姆(Benjamin Bloom)的认知领域教学目标分类理论相融合并进行建模,构建出一个太极环式的翻转课堂模型,如图2 所示[3]。

图2:太极环式模型

三、翻转课堂的学习案例应用策略分析

翻转课堂后,教师把结合实时讲解和PPT演示的微视频上传到网络,以此帮助课堂缺席的学生补课。更具开创性的是,我们教师逐渐以学生在家看视频听讲解为基础,节省出课堂时间来为在完成作业或做实验过程中有困难的学生提供帮助。学生能根据自身情况来安排和控制自己的学习[2]。学生在课外或回家看教师的视频讲解,完全可以在轻松的氛围中进行;而不必像在课堂上教师集体教学那样紧绷神经,担心遗漏什么,或因为分心而跟不上教学节奏。学生观看视频的节奏快慢全在自己掌握,懂了的快进跳过,没动的倒退反复观看,也可停下来仔细思考或笔记,甚至还可以通过聊天软件向老师和同伴寻求帮助。学生更多的是带着问题走出教室,探索的空间真正延伸到了课外。

吴秉健老师对翻转学习从创造能力的激发过渡到知识学习和积累,采用了6个动词“识记、领会、运用、分析、评价和创造”构建了金字塔形状(由低阶思维能力向高阶思维能力发展)的布鲁姆教学目标分类的翻转动态图[1]。如图3所示。

图3:翻转学习动态云图

缺少口语和视听训练通常是制约英语学习的瓶颈,提升英语视听说交流能力可以利用云端语音资源库。

1、英语在线云端English Central学习的应用

English Central,它汇聚有大量地道的英语素材,而且是真人发声的。教师可以根据教材和学生的实际需要在English Central找到相应教学内容,经过筛选后从云端中下载制作成PPT,学生就通过视频、音频、文本,可以非实时研讨了。如笔者在教授《Talk about traffic lights》如图4所示。

图4:English Central的视频

学生还可以在English Central资源库中,随时观看自己喜欢的英文小故事,了解与课文相关的知识,通过视频的学习获得更多的英语知识。如图5所示。

图5:English Central的视频教程

2、英语在线Voki平台的学习应用

教师将课文中要教授的内容输入到Voki,选择孩子们喜欢的不同人物(如小动物、卡通人物、老师或公众人物)来录制多个不同人物朗读的视频,这样就会激发学生去课前预习,学生观看视频的节奏快慢全在自己掌握,懂了的快进跳过,没动的倒退反复观看,也可停下来仔细思考或笔记,很多学生也会因好奇而选择不同人物朗读的视频,达到因反复观看而进一步理解学习。如图6所示。图6:Voki学习的平台

3、英语在线Voicethread平台的学习应用

Voicethread的空间具备文本、图片、语音或视频自述功能,访问者也可以用语音或视频以及文本形式参与互动评论。学生可以将他人的语音相册复制到自己的空间,而且可以编辑和添加内容,在云端语音相册留下自己的观点。学生通过自己喜欢的设计和动手操作,将大大提高英语英语视听说交流能力和英语学习的浓厚兴趣。如笔者在教授《Talk about traffic lights》,就通过了Voicethread向学生介绍了外国的交通情况,通过语音相册的观看,学生了解了交通拥堵不单在中国,也是世界的一大难题!如图7所示

图7:在线英语视听说云端语音相册

4、英语在线Nonstop English平台的学习应用

Nonstop English,该网站提供语言训练以及互动语法和词汇的测试积累词汇,每周更新练习题。Nonstop English是学生进行词汇积累和语言语法互动的一个极好的平台,教师可以根据授课内容有选择的进行截取每一单元的词汇和语言语法进行录制,同时给学生提出相应的学习要求,然后上传到自己的博客,这样学生就随时登陆学习啦!

四、翻转课堂是如何改变英语学习

1、学生自己掌控学习。翻转课堂后,利用教学视频,学生能根据自身情况来安排和控制自己的学习。学生在课外或回家看教师的视频讲解,完全可以在轻松的氛围中进行,而不必像在课堂上教师集体教学时那样紧绷神经,担心遗漏什么,或因为分心而跟不上教学节奏。学生观看视频的节奏全由自己掌握,懂了的快进跳过,没懂的倒退反复观看,也可以停下来仔细思考或做笔记,甚至还可以通过聊天软件向教师和同伴寻求帮助[4]。于是就可以形成生成性、进化发展、微型化、智能性、学习认知网络共享,借鉴学习对象的结构模型,建构了学生掌控的结构模型(如下图8)。

图8:学生掌控的结构模型

2、增加了学习中的互动。翻转课堂最大的好处就是全面增强了课堂的互动性,具体表现在教师与学生之间,以及学生与学生之间。由于教师的角色已经从内容的呈现者转变为学生的教练,这让教师有时间与学生交谈,回答学生的问题,参与学习小组,对每位学生的学习进行个性指导。在学生完成作业后,教师可以注意到部分学生会被相同的问题所困扰,于是就组织这部分学生成立辅导小组,为他们举行小型讲座。小型讲座的精妙之处是,当学生遇到难题准备请教时,教师能及时地给予指导。当教师成为指导者而非内容的传递者时,就有机会观察到学生之间的互动,让学生发展起他们自己的协作学习小组,让学生们彼此帮助,相互学习和借鉴,而不是将教师作为知识的唯一传播者。可能有些同行会问:我们如何形成学习文化?乔纳森•伯尔曼和亚伦•萨姆斯认为,关键是让学生将学习作为自己的目标,而不是争取完成任务[3]。因此,教师要着力把课程变成有意义的活动而不是仅仅为完成繁忙的工作。

3、改变了教师与家长的交流。多年以来,在每一次的家长会上,父母问得最多的是自己孩子在课堂上的表现,比如是否安静地听讲、是否行为恭敬、是否举手回答问题、有没有打扰其他同学等。翻转课堂后,这些问题已不再重要。真正的问题是:孩子们是否在学习?如果他们不学习,教师和家长能做些什么来帮助他们学习?这个更深刻的问题会带领教师与家长共同商量:如何将学生带入一个环境,帮助他们成为更好的学习者。学生为什么不学习?他们没有相关的基础知识吗?他们的个人问题干扰了学习吗?或者,他们更关注的是“在学校玩”,而不是学习吗?当家长和教师得知孩子为什么不学习时,就能制定一系列实时的、必要的干预措施。

4、形成多元联系的学习。翻转课堂能够帮助学习者在任何时间、任何地点通过任何途径获取所需资源,在一种轻松愉悦的学习体验中学到特定领域的片段性知识[4]。如图9所示。

图9:多元联系的学习图

五、结束语

“翻转课堂已经改变了我们的教学实践。我们再也不会在学生面前花费30分钟—60分钟来讲解。我们可能永远不会回到传统的教学方式了。”这是笔实施了翻转课堂后的深有感触。

这从表面上看顺理成章,但现实却复杂得多:每位教师的头脑中都有自己的一套“系统”,它从宏观上决定着教师的教育教学行为。大家对“翻转学习”都认同,但是翻转学习中遇到的以下问题却不一定能处理好:学生在外不好管理、学生讨论没有深度、教学时间不够、学生矛盾与冲突增加……这些问题如小草一样不断生长,一个问题刚刚解决,另一个新问题又来了。当这些问题不能顺利解决时,教师往往还会回到老路上。现在,如果你关注翻转课堂,你会看到一些令人兴奋的现象,你会发现掌握学习在21世纪的学习中有可能真正实现,而罕学院利用科技实现了翻转课堂的一对一学习。无论如何,精心制作你的翻转课堂吧,不要受制于教材,而是超越它,采用多种形式,多联系实际,把握精髓,想方设法地让学生们喜欢学科,让他们发自内心地爱上你的翻转课堂,爱上教师您所执教的学科!(荣获国家一等奖论文)

参考文献

[1]吴秉健,基于布鲁姆教学目标分类的翻转学习模式研究[J],中小学信息技术教育,2013第三期P62-P66

[2]杨刚,杨文正,陈立.十大“翻转课堂”精彩案例[J],中小学信息技术教育,2012,(3).[3]苏展,黄忠平(2012)学生上课“玩”平板“云计算”支撑下的“翻转课堂”[EB /OL].[2012-12-19].)

爱奇艺:穿越搜索的视频营销 篇3

这句胜似电影片断的解说词,来自于在线视频网站爱奇艺的烹饪类节目《美食美课》。如果你准备为心仪的他/她亲手做一份浪漫的晚餐,那么可以先通过这个节目,学一学精致的做菜方法。

历来,新鲜的事物总是在新兴市场中诞生的。比起网络上那些图文繁杂的碎片化信息,富有创意的《美食美课》对用户更具吸引力。它将百度搜索量最高的百余道家常菜,高清拍摄还原食材本“色”,通过清晰的步骤演示,让用户在轻松愉悦的感观体验中习得厨艺,并且是随时随地的。更关键的是,不但用户喜欢,广告主也可通过植入的方式获得有效的品牌推广。

很好奇!这个独到的创意是如何诞生的?

基于百度搜索的用户体验

爱奇艺的创立与百度密切相关。自从谷歌退出中国大陆市场后,作为搜索门户的百度就顺理成章地成了老大。用户运用百度搜索,一旦搜寻到自己想要的,就会直接转到所链接的网站去看内容。根据这一特点,百度开始研究哪些信息最具有商业化价值,视频网站爱奇艺应运而生。

“搜索是一个非常重要的环节,约80%用户使用搜索引擎来找自己要看的电视剧。”爱奇艺数据研究院院长葛承志对《中外管理》说。作为视频网站,获取广告收入的根本是流量,即用户覆盖,而搜索决定了用户覆盖。这也是爱奇艺诞生的根本理由。

2010年4月22日,率先以高清、正版长视频为模式的爱奇艺正式上线。它助推了网络视频正版化的转移,解决了叫好与叫座的两难,既在内容上博得用户欢迎,又让广告主产生浓厚兴趣。

截至今年8月份,爱奇艺在短短两年多时间内月独立用户已超3亿,月累计覆盖中国80%的视频用户,并显示出极强的用户黏性。这种扶摇直上的成长,在波澜起伏的视频行业颇为少见。

背靠大树好乘凉。基于百度的资源性支持,越来越多的人在百度视频搜索以后,开始转化为对爱奇艺的直接搜索。其用户早先有95%以上来自于百度用户,现在这个比例已经降到40%左右。

用户的惯性转移,正是百度所期待的。“当人们在百度上搜索这类内容时,我们能将用户导向爱奇艺。”百度掌门人李彦宏如是说。

当然,除却百度的鼎力支持,爱奇艺的快速成长还得益于基于搜索的用户体验。用户体验最直接的要素是,功能是不是更加丰富、便捷,下载速度是不是够快,画面是不是流畅、清晰,爱奇艺对这些做了巨大投入。葛承志说:“我们的总体目标就是,既要功能丰富,又要使用简洁,页面清爽,让用户找到自己想要看的信息。”

一个例证是,爱奇艺在业内率先开发出“自动跳过”功能,让用户看电视剧时跳过片头片尾,直接从正片开始。而不至于一天连看多集被重复的片头片尾崩溃了大脑和视觉。

蒲公英模式

不断挖掘用户需求,精准开发视频产品,满足用户期待,这是爱奇艺追求自制视频节目的探索目标。

时下,通过百度搜索菜谱已成为网民习惯。百度数据显示,2006年以来,用户对于家常菜做法的搜索量持续上升,其中以北上广等一线城市、教育程度较高的白领人群为主。TOP200菜谱的日均搜索量超过40万,TOP50菜谱的日均搜索量超过20万。

尽管如此,几乎全部的搜索结果是以图文形式呈现,要么是大段文字叙述,要么就是步骤过于简略。这对于现代年轻人来说显然不够实用,也不够直观。而“3克盐究竟是多少”、“酱油是用生抽还是海鲜酱油”等类似疑问更成为无法解决的难题。

商机就在这里!爱奇艺风向标般洞悉了每天海量菜谱搜索的重要信息,将做菜的精美过程移位于网络短视频中,通过网络传播与大化众分享,建立自己的品牌营销模式。这就是爱奇艺独家制作的一档美食烹饪类节目《美食美课》,它是“蒲公英计划”的一个标签。

所谓“蒲公英计划”,是爱奇艺的独创模式。它的内涵在于,以视频为核心,打通搜索、SNS、无线,甚至是出版、影视剧等领域,将分散资源聚拢,将要传达的信息成倍数扩散。葛承志说:“就像蒲公英撒播种子一样,落地生根后,再次生发出一个新的网状系统。”

这个充满想象力的比喻,生动地印证了爱奇艺在视频营销上的独特创新力。“这种模式的独特性在于,它和搜索紧密结合。比如:用户搜菜谱的时候,能看到一个短视频的教程,简单说就是教人怎么做菜。”葛承志对《中外管理》说,“《美食美课》建立于百度搜索数据的精密分析之上,更精准地锁定目标用户群——因为每次的搜索行为,都是一次明确的用户需求。”

100道菜就有100段视频,每段视频都是一段鲜活的厨房故事。现在,视频网站本身系统性地自制教程类美食节目,爱奇艺是第一家。

这个节目的特性,已经吸引了与自身需求吻合到极致的广告主。“我们几乎不用推广,只需要在搜索引擎上就可以了,每天用户自然会搜到这些视频。”葛承志轻松地说。

植入营销新体验

《美食美课》于今年9月1日正式上线,首季节目由联合利华家乐品牌赞助播出。如今,广告主进行广告植入,更加注重的是内容品质,以此作为品牌植入的基础。内容品质是《美食美课》的原本优势,但植入方式是否巧妙融合,则是一个更智慧的探索。爱奇艺通过独家视链技术,实现“看到即买到”。

比如:嘉宾在做菜过程中,需要添加海鲜酱油,此时画面会出现浮层,用户可点击链接了解更多,链接至客户指定页面或相关客户定制的“酱油使用”的专题内容中。视链技术使广告植入顺畅如水。

“广告植入要看内容,就是视频本身的内容跟商业信息的传播之间是一致,不相关还是冲突。”葛承志进一步解释,大部分植入式广告的失败,基本上是不相关或者牵强的内容所导致的。当情节跟它植入的内容相关性程度很强时,如何避免生硬就需要技巧了。他认为,如果广告主选择的是艺术创作作品,就要使他的商业品牌与这个艺术创作作品、主题以及人物的性格更加契合,才能够达到预期效果。

和搜索无缝结合,也能帮助广告主找到更多潜在消费者。以前广告主定义自己的潜在消费者,无非以年龄、性别、地区这样的自然属性来定义,而搜索引擎出现之后,爱奇艺可以告诉广告主:在不同的影视剧上,曾经搜索过广告主的产品的占比高低。如此就能找到与其潜在消费者最契合的那部分人群所观看的视频内容,并把它推荐给广告主进行商业合作。

将品牌植入节目中,又可以通过节目植出推广品牌。爱奇艺在视频营销模式的探索上,力求为客户打开更为开阔的营销空间。

视频搜索引擎 篇4

IPTV即交互式网络电视, 是一种利用宽带有线电视网, 集互联网、多媒体、通讯等技术于一体, 向家庭用户提供包括数字电视在内的多种交互式服务的崭新技术。IPTV业务在国内外已经发展多年, 目前国内累计IPTV用户已超过2 000万。然而, 随着视频内容量的急剧增加, 用户迫切希望通过一种快捷的手段迅速找到需要观看的视频内容, 因此如何快速准确地从海量视频库中找到感兴趣的视频内容己经成为视频信息领域发展中的关键问题之一。

目前, 传统的搜索引擎多属于普适性的水平型搜索, 有明显的局限性, 在视频内容搜索领域, 通用搜索引擎的检索必然会带来“信息过载”、“搜索噪音”、“信息冗余”等一系列负面结果, 不能真正实现高效与便捷。为了解决以上一系列问题, 应采用针对视频内容领域的智能搜索技术, 以提高用户搜索过程的准确度[1]。

本文首先分析了现网IPTV视频搜索系统存在的问题, 提出并实现了一套IPTV智能搜索系统, 引入智能化搜索算法, 增强搜索的准确度和首屏命中率。实验结果证明:该套智能搜索系统显著提高了IPTV视频资源的搜索准确度及首屏命中率, 大大提升了用户搜索速度。

2 IPTV视频搜索存在的问题及需求

目前IPTV视频搜索系统主要采用的是片名文字搜索方式, 其搜索引擎是普通水平型搜索系统, 没有考虑视频内容具有以下特点:

(1) 兴趣度:即用户在搜索视频内容的时候, 是有一定兴趣取向的, 一般来讲, 搜索的内容多以影片和电视剧为主, 而目前现网IPTV搜索没有考虑兴趣度, 在搜索时会给出一些用户一般不会关心的内容, 如新闻类、财经类内容, 而且排序往往靠前, 用户需要多次翻页才能找到其感兴趣的内容;

(2) 热度时效:用户在搜索视频内容时, 大多数情况下, 会与当下热门的内容相关联, 如近期热播的电视剧或者新上映的电影, 在IPTV系统中, 也可以统计到目前热播的电视剧和电影情况, 但是在现网搜索系统中, 却没有将热度内容做排序优先的考虑。

以现网IPTV搜索为例, 用户拟搜索影片“武侠”, 在搜索页面内输入“WX”, 共搜索到205个视频结果, “武侠”出现在第8页, 具体情况如图1。

针对上述存在的现网问题, IPTV搜索新系统需要完成以下优化功能:

(1) 提供热词搜索提示功能;

(2) 影片、电视剧等排序优先;

(3) 根据运营数据, 对热点内容优先排序。

3 IPTV智能搜索系统设计与实现

IPTV智能搜索系统主要分为信息采集器、索引器、搜索引擎、搜索服务器。图2标示IPTV智能搜索引擎的平台架构, 并且标示出用户从发起请求到返回结果, 各系统处理请求的整个服务流程:

(1) 用户发起搜索请求;

(2) 负载均衡器接收到用户搜索请求, 根据用户所在地理区域与集群中服务器的当前状态, 将分配最优服务节点来处理此请求;

(3) 搜索服务器收到请求, 将进行三个步骤:

(1) 获取关键字的Key;

(2) 根据搜索key到Cache中检测, 若此关键字已经被搜索过并且缓存中Cache未超时, 则从Cache中取出搜索结果返回给用户;若此关键字未被搜索过或缓存中Cache超时, 则进行第c) 步;

(3) 搜索服务器向搜索引擎集群发起搜索请求, 搜索引擎根据既定的算法从索引库得出最符合规则的搜索结果, 并将此结果返回给搜索服务器, 同时将搜索结果写入Cache中。

(4) 从信息采集系统取得数据, 索引器将建立好的索引分发到搜索引擎集群中的索引库。

具体核心模块功能描述如下:

(1) 数据同步:监听元数据平台是否有数据变更, 实时采集最新数据, 将数据异步发送到MQ中;

(2) 高/标清搜索:提供高清搜索服务的入口, 向IPTV管理平台请求鉴定用户权限, 将搜索结果返回给高清机顶盒;

(3) 索引维护:提供给运维人员手动维护索引库, 系统定时重建索引, 索引分发等功能;

(4) 索引器:索引子系统, 负责索引的创建、更新、删除以及索引库的分发;

(5) 搜索器:搜索子系统, 实现搜索算法、排序算法、过滤规则。

(6) 队列服务器MQ:用作缓冲索引器、数据库的压力, 存储未建索引的元数据、各系统的操作日志。

目前该套智能搜索系统已开发上线运营, 界面截图如图3。

由图3可以看到, 输入“WX”之后, 左边有热词提示, 片名“武侠”已出现其中, 同时右边也显示了一些相关联的搜索结果。“武侠”这部片子已在首屏命中。

4 IPTV智能搜索核心算法

(1) IPTV智能搜索核心算法流程

IPTV智能搜索流程如图4所示, 具体实现流程描述如下:

(1) 用户在搜索框内输入字符, 通过字符匹配, 在热词提示中, 显示相关热词信息, 供用户选择;

(2) 用户完成搜索词选择, 启动搜索;

(3) 系统将用户搜索词进行分词处理, 根据分词结果触发多条搜索路径, 并利用TF/IDF算法、兴趣度算法、聚类算法等算法, 计算出相应的搜索结果;

(4) 由于分词会分出多个搜索路径, 其结果也必然会出现重复的情况, 因此需要做合并去重工作, 将前述计算子路径进行合并去重[3];

(5) 排序显示搜索结果, 这里将引入权重, 将电影、电视剧的权重设置较高, 并考虑播放热度权重, 将电影、电视剧、热片中的搜索结果, 优先显示;

(6) 将排序后的搜索结果给到前台页面, 供用户选择。

由于TF/IDF算法和聚类算法是Lucene搜索引擎的标准算法这里不再赘述, 后文将对兴趣度新方法重点阐述。

(2) 兴趣度算法

(1) 浏览时间及点击次数转化为兴趣度的方法

用户的浏览时间和平均浏览时间是用户兴趣的重要体现。但如何用浏览时间衡量用户兴趣大小是一个很关键的问题。传统的将浏览时间转化为兴趣度的方法比较多, 比如根据用户在页面上的停留时间来判断用户对页面是否感兴趣。但这些方法只是普遍认为只要停留时间大于零, 就判断用户对该内容感兴趣, 即只要用户点击浏览了某个页面就认为用户对影片感兴趣;有些方法只认为只有当停留时间大于5秒时, 才认为用户感兴趣。所有这些兴趣度值转化方法转化以后的结果都不能很好地反映用户的兴趣和浏览时间长短的对应关系。因此提出一个将点击次数转化为兴趣度的方法:

(2) 对影片感兴趣的计算

我们给出一种将用户点击次数和播放时间转化为兴趣度的计算方法, 该方法保证了较高的点击率和较长浏览时间对应的兴趣度也较高, 而且很好的单调分布在0到l之间, 为后续的计算提供方便, 其计算模型为:

其中, Ii为用户对第i个影片的兴趣值, ti为第i个影片的用户播放时间, averagetime为用户平均播放时间, π为圆周率。

5 IPTV视频搜索系统测试

测试人员从影片库中分别等量抽取X个 (X的值根据影片库统计情况确定) 作为最后测试样本, 例如:一字影片300个、两字影片300个、三字影片300个。

本次测试选取300个四字影片名作为样本, 分别记录顺序输入1字简拼、2字简拼、3字简拼、4字简拼时搜索结果的显示情况, 统计首屏命中显示的个数及概率, 得到以下数据。

通过记录数据与300个样本库进行计算得到:

通过测试, 可以看出新系统对比老系统 (含高清和标清) , 有显著的效率提升, 特别是输入2个字简拼时, 新系统已经能够实现高达54%的首屏命中率, 输入3个字简拼时, 超过90%可以首屏命中。

6 小结

本文通过分析现网IPTV搜索系统存在的问题, 结合现网业务需求, 提出了一套适合IPTV业务场景的智能搜索架构及方法, 并在现网ITV系统中进行了上线运营。现网试验测试证明了这套新搜索系统的有效性, 不仅提高了首屏命中率, 而且大幅缩短了用户搜索时间, 提升用户体验。目前这套系统刚刚上线运营, 在热词提示排序、以及搜索结果展示时, 还是会出现一些冗余干扰信息, 这些信息的剔除, 需要根据现网实际运营数据, 自适应调整排序权重值, 进一步优化系统搜索准确度和效率。

参考文献

[1] 王梦溪, 王斌.基于标签的垂直搜索研究及在视频搜索中的应用.仪表技术, 2011, 5:59~65

[2] 王新, 刘晓霞.基于关联规则挖掘的垂直元搜索引擎研究, 计算机工程, 2011, 37 (4) :76~80

视频搜索引擎 篇5

统一的视频搜索、播放、互动平台;

全网视频搜索,视频一搜就有,一点就播;

自主创新的P2SP点播加速技术, 加速点播,流畅稳定;

全方位互动超爽体验,视频观看一站式解决。

官方网址:http://www.vvbox.com/

听专家谈创业

2006年国内视频领域风起云涌,全国出现了数百家类Youtube视频网站,一直从事视频领域研究和开发工作的我也在时刻关注着这一变化,在使用这些网站服务的时候发现这类网站模式大同小异,内容小异大同。我们发现视频网站或者视频搜索网站都不能很好地解决用户体验的问题,用户对统一的搜索、播放、互动平台非常需要。2006年年初我们开始技术研发,目标是给用户最好的视频收视体验,软件采用了先进的网络视频搜索技术、多媒体播放器技术、P2SP点播加速技术等。

专家帮你就业

VVBOX在软件开发上,采用的什么程序?

学文:VVBOX采用VC++平台开发。

为什么要采用该程序开发呢?

学文:因为VC++开发程序执行效率高,占有系统资源少。

对初学者或大学生,您建议他们学C++吗?您认为哪类语言最有前途?

学文:对于初学者学习编程,建议从标准C开始学习,有了一定基础以后可以学习一些可视化编程工具,比如VB等,能比较快地获得一些成就感。

能给大家讲下是为什么吗?

学文:对于将来以软件开发为职业的人来说,基础软件设计开发能力的培养是最重要的,有好的编程技能和编程习惯,可以很容易地掌握不同的编程语言,在实际工作中可以不同的应用软件采用不同的开发工具实现。

如果您在招聘时,哪几方面会是您招人的目标?

学文:基本功扎实,具有创新思维是我们招人的目标。

当大家还在进行HTTP等下载,还认为P2P是很流行的技术时,新的技术已经出现了,那就是P2SP技术。其实P2SP技术大家已经在用了,那就是迅雷,迅雷将P2SP用于了下载,而VVBOX就更进一步,将P2SP用于就是视频播放。于是记者采访了威播网的技术总监吴学文先生。

吴学文

清华大学计算机专业硕士毕业,主要研究方向为多媒体传输以及视频图像编解码算法研究,具有很强的技术创新能力和坚定的创业精神。2001年研究生期间,在清华创业园创办北京东方睿智科技发展有限公司,是公司主要创始人之一,承担主要技术攻关和技术团队管理工作。2003年进入东芝(中国)有限公司先后担任项目经理,高级技术经理等职,曾管理50多人的研发团队,有非常丰富的软件项目开发管理经验,主持开发成功的项目近10个。2006年初,发起创建北京领先英特传媒技术有限公司,公司从无到有,从弱到强,发展到现在逐渐拥有了一支非常强的技术研发队伍和技术支持队伍,在宽带流媒体应用领域具有了非常强的技术实力。公司运营的VVBOX网络视频搜索播放器平台正在成为广大用户观看互联网视频新的门户。

软件精典应用

海量视频瞬间搜索

VVBOX能提供按分类和按关键字等多种搜索功能,点击相应的明星、体育、新闻或学习等视频库,就能找到相关内容,当然,你也可以在搜索栏里输入想要的内容,点击“搜索”一搜就有。

视频下载经典收藏

VVBOX支持本地或者网络flv文件播放,是一款不错的flv播放器。在收看时,点击“保存”即可下载。当然,你也可以点击“收藏”,下次想打开时,只需点击“我的VV”,在“我的收藏”里点击相应的视频即可。

互动体验短信交流

VVBOX支持用户互动发表评论,登录后点击“站内短信”,再输入用户和内容即可发送。支持用户视频文件收藏,推荐视频给好友,定制自己喜欢的视频等功能。如果你没有注册,那你就只能看视频,不能发短信了哟!

防止打扰置顶播放

点击右上角的置顶即可让播放器窗口处于所有窗口的顶层,这能方便你观看视频。再点击一下,即可取消置顶。

视频模式快捷切换

在右上角还有个“精筒模式”按钮,点击即可进入精筒模式,只能看到视频窗口,没有其他的信息窗口。再点击“完整模式”即可轻松返回。也可以按“Ctrl+G”来进行快速切换。

个人设置轻松设置

右击拖盘区的图标,选择“系统设置”,在“系统设置”的“个人设置”里,可以设置“系统运行自动启动”、“是否弹出今日热点”和“下载完成提醒”。当然也可以对模式切换的快捷键进行设置。

赠送珍藏版VV号

视频搜索引擎 篇6

红外搜索系统是通过探测和接收目标的热辐射, 获得目标的红外信息从而解算出目标的方位、俯仰信息。在探测过程中红外系统自身不发射任何辐射, 能够更好的隐蔽自己, 发现敌人, 大大提高了其生存能力;在强电子干扰环境下, 可以替代或辅助雷达搜索跟踪目标, 是在复杂环境下探测目标的首选探测方式, 在未来的战场应用中需求量巨大。

从目前国内外的红外搜索设备研制的情况看, 目前主要还存在以下不足之处:

(1) 在目前的探测器水平条件下, 红外热像仪视场普遍偏小, 故而单帧图像空间覆盖范围小, 仅从单帧图像无法有效对载体周围空情、地情进行有效评估;

(2) 在小视场的条件下, 要快速完成大区域搜索, 必须进行快速搜索, 而在快速搜索时, 红外图像变化过快, 单帧图像基本无法有效提供给操作员观察, 丧失了红外探测能提供昼夜可视图像的突出优点。

红外图像拼接技术可实时将多帧图像拼接成大视场全景图像, 用于解决小视场红外搜索不利于观察的问题;同时通过图像拼接技术, 可获取全景图像, 可在红外搜索阶段加入操作人员观察判断, 能有效降低红外虚警干扰, 提升红外探测的优势, 红外图像拼接技术在红外搜索系统中有广泛的应用前景。

2 图像拼接算法的一般流程

一般来说, 图像拼接的过程由图像预处理, 图像配准, 图像合成三步骤组成[1], 其中图像配准是整个图像拼接的基础, 也是图像拼接技术的关键。

2.1 图像预处理

图像预处理的目的是改善图像的质量, 从而保证下一步图像配准的精度, 包括对图像对比度拉伸、噪声点抑制 (如直方图处理、图像的平滑滤波) 等。对于一些存在几何畸变或者像旋的图像还要进行校正。如果在图像质量不好的情况下直接进行图像拼接, 容易造成误匹配。

2.2 图像配准

图像拼接的质量主要依赖图像的配准精度, 其核心问题是寻找一个变换, 找到待拼接图像中的模板或特征点在参考图像中对应的位置, 根据模板或者图像特征点之间的对应关系, 可以计算出数学模型中的各参量值, 从而建立两幅图像的数学模型, 使图像间相互重叠部分对准, 将待拼接图像转换到参考图像的坐标系, 以此构成完整的图像。精确配准的关键是要有很好描述两幅图像之间的转换关系的模型。

图像配准方法一般可分为基于区域和基于特征两种方法。基于区域的配准方法是利用的是图像的大部分灰度进行匹配, 配准精度高, 但运算量巨大;基于特征的方法则是通过提取图像中的点、边缘、轮廓等特征进行匹配, 运算量相对较少, 受噪声的影响较小, 常用的特征提取算法有SIFT特征提取算法[2]、Harris角点检测算法[3]以及Canny边缘检测算法[4]等, 基于特征的配准方法存在图像特征点提取及匹配困难, 特别是作为单色的红外图像利用特征点匹配存在较大的匹配误差风险。

2.3 图像合成

当准确计算出图像之间的转换参数之后, 我们需要根据求出的参数把多张原始图缝合成一张大的全景图。由于图像配准的结果存在配准误差, 因而不可能在每一点上都精确配准, 因此, 图像合成的策略是尽可能地减少遗留变形以及图像间的灰度差异对合并效果的影响。合成的目标包括:拼接图像的画出, 光度的调整混合, 确定重叠区域和消除拼缝。

2.4 全景图像的生成和视频显示

当结合红外目标信息的红外图像合成以后, 即可生成全景视频图像的编码显示, 每当一个搜索周期结束后, 利用新一周期的空间红外图像实时替换前一周期对应的空间红外图像, 即可生成实时全景红外图像, 能有效的解决红外探测设备快速搜索阶段红外图像无法观察的不足, 突出红外设备探测结果的可观察性的优势, 便于作战人员对战场的直观判断。

3 红外搜索系统图像拼接算法设计

红外图像拼接的算法有多种, 根据红外搜索系统获取的红外图像都具有稳定的像空间位置变化信息的特点, 本文提出了一种结合图像位置信息变化和模板匹配的红外图像的拼接算法, 算法流程如 (图1) 。

为避免红外探测器盲元、坏元点和图像噪声的干扰, 本算法在红外图像获取后即对其进行预处理, 主要的算法为中值滤波[5]和灰度直方图处理[5]。

在完成图像预处理后根据公式 (1) 计算出所需拼接连续图像的重叠区域大小。

式中A为重叠区域的行或列数, V为红外热像仪的搜索速度, f为红外图像帧频, α为红外探测器单个像元对应视场角。

确定重叠区域大小之后, 对参考图重叠区域的灰度进行分析, 提取其灰度梯度的分布情况, 进而选择原图像中一定大小灰度梯度较大的区域 (区域大小根据热像仪视场大小及探测背景复杂程度选取) , 将选取的这一部分区域图像作为拼接的模板, 在待拼接图像的重叠部分中可能匹配的区域进行图像灰度匹配运算 (可能匹配的区域应根据搜索精度确定) , 完成模板匹配算法。由于前后两帧图像亮度的差异, 若在灰度匹配时只将灰度值进行匹配, 必然会造成一定得匹配误差, 特别是当重叠区域图像灰度特征不明显时, 误差会较大, 故而加入了结合灰度比值匹配的方法, 利用图像中两列像元的灰度比值作为模板, 在待拼接图像中找到最优的匹配位置, 大大优化了模板匹配的算法效果, 且计算量小, 速度快。在前后两帧图像基本无灰度特征时 (如热像仪针对均匀的天空背景成像时) , 主要根据红外搜索系统的伺服控制位置信息进行匹配, 解决了无特征图像匹配的技术难题。

图像完成配准后, 再开展图像合成, 若直接进行重叠区域灰度平均, 会造成一定的拼缝和灰度差异, 本算法采用了高斯灰度加权平均的方法[6], 将两幅图像灰度值按照公式 (2) 进行了灰度叠加, 叠加后的图像进行灰度均衡形成最终的合成图像。

式中a为随重叠位置高斯分布的加权系数, I1为参考图的灰度值, I2为待拼接图的灰度值, R1是参考图中未重叠区域, R12是参考图和待拼接图的重叠区域, R2是待拼接图中未重叠区域。

该算法的优点主要有:

(1) 算法设计简单, 计算速度快:利用红外搜索系统图像具有稳定空间位置信息的特点, 只对两帧图像重叠区域进行分析, 并只选择灰度变化梯度较大的区域充当匹配模板, 在与待拼接图像匹配时, 又根据搜索精度的大小确定了可能匹配的位置, 计算量大为减少, 提高了匹配速度, 解决了模板匹配运算量大的问题。

(2) 匹配精度高:结合红外搜索系统高精度的特点, 在待拼接图像匹配区域选择上, 根据红外搜索系统伺服控制精度, 匹配前已设定了匹配运算的可能区域, 在灰度匹配的同时加上了灰度比值匹配, 大大提升了匹配精度。

(3) 适用性强:算法中涉及到的各参数均可根据搜索精度、热像仪视场及成像背景的复杂程度确定, 基本适用于所有的红外搜索系统, 适用性强。

4 算法试验验证结果

4.1 配准算法的仿真结果

根据基于区域特征、基于点特征 (SIFT特征和Canny边缘检测算法) 和本文提出图象配准算法利用同一套图像采集仿真器 (TI-DM642) 对一动态位置控制精度为0.5· (控制精度一般) 的平台搜索阶段采集到的两帧图像 (如图2、3) 进行了配准仿真计算, 各算法的仿真计算时间及精度见 (表1) 。

从 (表1) 可以看出本文提出的配准算法相对于基于区域特征和基于点特征的算法在计算时间和计算精度上都有很大的改善, 且本文采用的搜索平台精度不高, 若采用高精度的控制平台, 本文的配准算法将在计算时间和精度上进一步提高。

4.2 本文提出的图像拼接算法仿真结果展示

根据本文提出的红外搜索系统图像拼接算法, 对某红外搜索平台采集到的连续视频图像进行了试验验证, 验证效果如图4所示。该图为关于某野外树林的连续多帧红外图像的拼接结果, 从图中可以看出该算法较好的实现了一定空域的连续多帧视频图像拼接。

5 结语

本文针对红外搜索系统的特殊性, 提出了一套图像拼接的算法, 从仿真的结果看, 拼接效果较好, 已初步达到工程应用的水平, 成功的解决了传统图像拼接匹配算法运算量大和匹配精度不理想的问题, 运算速度快, 且匹配精度高。

参考文献

[1]SZELISKI R, SHUM H Y.Creating full view panoramic image mosaics and environmentmaps[A].Proc.of SIGGRAPH'97[C], Los Angles, 1997, 251-258.

[2]LOWE D.G.Distinctive image features from scale-invariant keypoints[J].International Journal of computer Vision, 2004, 60 (2) :91-110.

[3]HARRIS, C.&M.STEPHENS.A combined corner and edge detector[C].England:Processing of the 4th Alveyvision Conference Manchester.1988.Pp.147-151.

[4]JOHN CANNY, MEMBER.IEEE.A conputational apporoach to edge detetion.IEEE Trans.Pattern Analysis and Machine Intelligence.Vol.PAMI-8, No.1, 679-697, 1986.

[5]C.Gonzalez, Richard E.Woods著.数字图像处理[M].阮秋琦, 阮宇智等译.第二版.电子工业出版社, 2010.70-81, 93-98.

视频搜索引擎 篇7

当今社会已进入信息时代,网络应用蓬勃发展,人们日常工作生活对计算机信息系统的依赖性很强,当泄漏电磁波携带有用信息时,就有可能造成信息泄漏。针对信息处理设备泄漏发射导致的信息泄漏问题(被截获与重建)的技术,在国际上被称为TEMPEST。进行TEMPEST的研究,不仅有利于相关技术和学科的发展及应用,更重要的是,有利于建设完备可靠的信息安全体系,并占据信息对抗的主动权,保障信息安全和国家安全。

红信号指的是经调制后承载了有用的信号,黑信号不携带有用信息,视频红信号指的是能够还原出原始视频信息的信号[1]。本文通过天线接收平台接收到计算机视频辐射的射频信号,通过对视频信号的频谱进行分析,得到了视频信号的独特的特征,视频信号频谱中的每个波瓣都是由行频与其谐波的等间隔谱线族构成,行频谱线则由场频及其谐波的等间隔的谱线族构成[1]。通过采用基于最小二乘法曲线拟合的波峰搜索算法来进行视频信号识别,我们可以获得视频信号的中心频点及行频等信息,最后根据行频信息和点频信息来复现原始视频图像[6]。

1 理论分析

1.1 计算机视频辐射的截获原理

视频信号其实是一个周期信号,由于视频信号中包含了规律变化的行、场同步信息,又包括随机的视频信息成分,这就使视频信号的分析变得复杂,它的频谱既包含周期信号产生的离散频谱,又包含了随机成分产生的连续的宽带成分[2]。

视频的时域表达式为,也就是说视频信号可用点频信号、行同步、场同步信号的乘积得到的。我们可以理解为场频信号被行频信号调制,而行频信号被点频信号调制。所以可以在行频的谱线中发现场频信息,而在点频频谱的波瓣中可以发现行频信息。(如图1)

我们搭建一个用于获取计算机视频泄露信号的硬件接收平台,泄漏发射计算机的实际行频:31325.997Hz,场频:59.670Hz,计算机辐射视频信号通过天线接收,经过接收机后,使用频谱仪截取的32ms的采样率为250MHz的视频信号的频域数据。根据前面对视频信号的理论分析,我们对视频信号频谱的进行频谱分析,识别出220MHz-280MHz范围有明显的视频信号特征。(如图2)

我们对视频信号进行数字带通滤波,滤出220MHz-280MHz频谱成分,就得到了中频的视频信号,根据前面的分析,可知视频信号的表示可以理解为场频信号被行频信号调制,而行频信号被点频信号调制。我们可以在行频的谱线中发现场频信息,在点频频谱的波瓣中发现行频的信息,我们采用图3中所示的算法流程,来进行视频红信号的识别。

上述算法流程的核心在于分别在1KHz和10Hz的频谱分辨率下进行峰值搜索以及等间隔谱线存在性的判定,从而获得中心频点等信息。如何能够在各种噪声干扰混叠的视频信号频谱中找到真正有用的红信号呢?下面将采用一种二次线性拟合的平滑化波峰搜索算法来搜索波峰,从而获得视频信号中心频点及行频信息,最终通过行同步信息与场同步信息来实现视频泄露信号的图像复现[4]。

2 红信号识别中的波峰搜索

2.1 视频信号频谱的三角窗平滑化处理

视频红信号识别很重要的一环在于对波峰的搜索,而波峰在数学定义上指的是峰值点处的一阶导数为零的地方,这里我们称之为过零点。但是在真实的实验场景下由于各类噪声的干扰,会导致频谱上出现许多无效的过零点,如图4所示。

根据对图中频谱形状分析,采用基于三角窗的平滑算法进行优化,其基本原理是在频谱的幅度值的一维数组上,选择一个固定的宽度的三角窗,三角度依次滑动,在滑动过程中,逐步对三角窗内的数组进行类似求平均值的平滑处理,具体函数如下:

Y表示一维的幅度数组,W表示三角窗窗口的宽度,P表示平滑处理后返回的一维幅度值数组,这里我们三角窗窗口宽度设置为5个频率采样点,通过matlab仿真后,得到如图5所示的频谱曲线。

根据图4与图5在250MHz频点附近的波形,我们可以发现,经过三角窗平滑处理后的频谱曲线的无效过零点明显减少,波峰特性更加清晰,说明经过三角窗平滑处理后的频谱数据能够较好的减少由各类噪声产生的无效过零点的干扰。

2.2 最小二乘法曲线拟合搜索波峰

最小二乘法曲线拟合的基本原理是对给定数据点,在取定的函数类φ中,求使误差的平方和E2最小。

从几何意义上讲,就是寻求与给定点的距离平方和为最小的曲线。函数p(x)称为拟合函数或最小二乘解,求拟合函数p(x)的方法称为曲线拟合的最小二乘法。

根据第一章节中的描述,我们可以得到一个大致频谱波峰搜索的流程,如图6所示。

通过在2.1节中的三角窗的处理,我们得到了经过平滑后的220MHz-280MHz范围内的视频频谱数据,接下来我们继续采用最小二乘法进行分段曲线拟合,我们设置幅度阀值,斜率阀值,曲线拟合宽度阀值来对搜索算法进行调优[5],具体函数如下:

X:平滑后的频谱图的横坐标。

Y:平滑后频谱图的纵坐标。

S:斜率阀值,任何斜率大于该值的波峰被忽略。

A:幅度阀值,任何幅度小于该值的峰值被忽略。

F:一次曲线拟合的宽度(采样点个数)。

按照图3所述的算法流程以及视频电子标准协会发布不同分辨率的视频参数标准,我们在10KHz的频谱分辨率和搜索半径为1MHz的条件下对频谱进行一轮波峰搜索,通过发现存在间隔范围在30KHz-120KHz之间的等间隔波峰谱线来确定可能的中心频点,在第二轮搜索中在10Hz的频谱分辨率和搜索半径为1KHz条件下对频谱进行波峰搜索,通过发现存在频谱间隔范围在40Hz-90Hz之间的等间隔波峰谱线,我们最终确定所有找到的符合要求的最大峰值点,也就是视频信号的中心频点。

另外由于三角窗平滑处理,以及最小二乘法曲线拟合带来了波峰位置,高度,宽度上的误差,所以我们需要在斜率阀值,幅度阀值,曲线拟合的宽度等参数进行调优,从而找到最准确的中心频点。

3 实验仿真

根据上两个章节的描述,我们按照图3与图6所示的算法流程,在matlab上进行中心频点搜索算法的仿真,经过参数调优,在波峰斜率阀值等于0.05,波峰幅度阀值等于1.76,曲线拟合宽度等于13个采样点的时候,得到如图7所示的仿真结果。

各中心频点的具体结果信息如表1:

注:视频红信号算法搜索出的中心频点的序号,波峰位置,波峰高度,波峰宽度

我们采用第三个峰值点250.5834MHz为视频信号的中心频点,认为以250.5834Mhz为中心,5M为半径的区间频谱数据可以还原出原始视频信息,区间以外的频谱数据全部置零,对得到的频谱进行IFFT变换,最后根据计算机的实际行频,场频信息,复现了原视频信号图像[4],如图6所示:

本文在计算机视频泄露红信号识别的理论基础上,详细研究了一种采用最小二乘曲线拟合的平滑化波峰搜索算法。通过对视频信号频谱加三角窗进行平滑化处理,有效的抑制了各类噪声的干扰,同时采用最小二乘法进行曲线拟合,配合幅度阀值,斜率阀值,波峰宽度阀值动态调优,获得了视频信号的中心频点以及行频信息,最后通过点频信息、行频等信息,复现了泄露视频信号的原始图像。

参考文献

[1]杨文翰.实用化的计算机辐射信息截获技术研究[D].北京:北京邮电大学,2011.

[2]张洪欣,吕英华,邱玉春,等.计算机视频电磁信息泄漏效应研究[J].通信学报,2004,25(4).

[3]吕英华,贺鹏飞,张洪欣.多导体连接器孔隙电磁辐射信息泄漏效应研究[J].哈尔滨工程大学学报,2004,(04):517~520

[4]张洪欣,吕英华,贺鹏飞,等.计算机电磁信息泄漏文字再现[J].西南交通大学学报,2007,42(6):653~658.

[5]张洪欣,吕英华,邱玉春,等.计算机电磁信息泄漏阈值效应研究[J].通信学报,2004,25(10):87~92

[6]刘振东,计算机视频泄漏信息截获系统设计.[J]2007,西安电子科技大学.

视频搜索引擎 篇8

该视频搜索及互动服务平台是以互联网宽带用户为直接服务对象, 依托广电网络优质资源, 通过聚合搜索的模式整合内网自有视频内容和其他互联网合作伙伴资源, 针对广电网络环境, 根据第三方网站视频质量, 接入速度等综合因素, 动态的将各视频服务网站的搜索结果进行处理、优化, 去除接入速度慢和无效的链接, 将搜索结果有序展现。同时, 通过在线文字和音视频交流方式, 建立用户使用反馈机制, 以期成为国内视频搜索服务领域内容最权威、最个性、支持终端最多元、服务最互动的视频搜索服务。

2 项目建设目标

该项目是具有广电视频特色的宽带产品和服务, 满足老百姓日益增长的文化需求, 通过视频搜索和互动推荐等功能向广大群众推荐优秀的互联网影视服务产品, 并体现广电自身的内容优势和主流媒体的导向作用。

搜索平台项目以构建安全、规范、高品质、精确、高效, 体验友好的广电级的视频搜索门户为目标, 同时, 为电视互联网门户网站的建立打下基础。

视频搜索平台准确把握自身“优质视频内容聚合引擎”的服务定位, 整合网络视听节目, 构建全国最权威、最专业的“视频搜索”, 做“百姓的视频助理”, 通过自动化技术平台、后台人工运营服务、合作伙伴信息集成等实现方式, 突出“视频质量最好、用户体验最佳、服务模式最新”的平台特色, 打造互联网最安全最有效的搜索平台。

互动服务将利用流媒体交互技术, 建立平台服务人员与用户之间的实时沟通平台, 通过文字、语音、视频的双向交流, 进一步根据用户的观看偏好、个性需求为用户提供内容推荐和扩展服务。

视频搜索项目一期将立足PC接入互联网的用户, 为之提供专业、准确、及时的视频搜索互动服务, 成为视频专业领域内最精确的垂直性搜索平台。二期针对电视机终端, 积极拓宽服务范围;同时, 利用手机终端更高的普及率, 将服务平台拓展到移动互联网, 真正实现PC+电视+手机的三屏互动。

该平台力求打造一个基础的、开放的、集中的、广域的互联网多媒体视听信息服务运营支撑系统。它与各级广电网络的互联网多媒体视听信息服务系统对接, 同时也可与其他运营系统 (数字电视、手机电视) 对接, 以多样的方式将节目内容提供给最终用户, 充分发挥内容优势和网络优势, 尽可能地使更多的用户享受到优质的互联网多媒体视听信息服务内容服务。

3 项目建设方案

3.1 建设原则

为了确保整个系统的协调管理和高效运作, 互联网用户文化服务项目的建设将遵循以下原则:

统一性:

统一建设、统一管理, 以确保整个系统的各种软件、硬件均符合相关的国际、国内标准, 保证业务、功能、界面、内容的高度统一化和标准化, 从而达到服务的规范化和管理的高效性。

先进性:

着眼于近期目标和长远的发展, 采用目前国际上最先进、最成熟的宽带认证、计算机以及网络技术。构造一个性能最佳的实用性系统。

采用先进、成熟的宽带认证技术和产品搭建系统, 主要考虑以下几点:系统设计运用已经有实际使用经验的成熟系统, 减少系统调试时间和运行风险;先提供简单、实用、经济、稳定的业务服务系统, 逐步升级;兼顾技术发展, 紧跟国际先进技术, 保证系统技术水平的持续领先。

实用性:

充分利用广电现有的通信和网络资源, 结合广电的实际业务需求和现有业务系统的情况。

开放性和灵活性:

兼容不同软、硬件平台, 可平滑移植, 采用开放性接口, 可与各家运营商移动手机、通讯系统、IPTV机顶盒进行系统对接。

可扩展性:

软、硬件平台应具有良好的可扩展能力, 能够方便地进行系统升级和更新, 以适应各种不同业务的不断发展。

安全性与可靠性:

采用高可靠性的产品和技术, 充分考虑整个系统运行的安全策略和机制。系统要具有较强的容错能力和良好的恢复能力, 保证系统稳定运行。

3.2 实施目标及方案

设计风格和互动体验要区别于互联网的视频搜索引擎, 体现出广电的特色。

视频搜索内容包括:广电视频网站自有内容;所有持有互联网音视频传播许可证网站, 包括但不限于:PPTV、奇艺网、搜狐高清、新浪高清、腾讯高清、激动网、优酷、土豆、Ku6等。

视频类别包括:电影、电视剧、新闻、娱乐等, 可根据用户需求灵活配置。

关键词搜索:支持关键词智能匹配;中文分词技术;语义等价 (第一集, 第1集等) ;其他根据标准搜索引擎开发思路进行完善。

搜索分类:支持分类 (视频质量:高清、流畅;视频长度:可设定;视频更新时间:可设定等) 。

视频内容推荐:可以对视频内容重点推荐;分类推荐位:分为电影, 电视剧, 动漫, 综艺等类别进行推荐;热点推荐位:重点推荐少数几部节目, 在所有推荐结果页的搜索框下部分展示;图文推荐位:采取一张图片+影片简介方式来推荐给用户。

搜索专题位:采取图墙的形式, 针对当前搜索热点制作专题。

搜索排行榜:展示今日搜索的频次以及趋势变化情况, 可提供所有排行榜及分类排行榜;瞬时排行榜:滚动展示当前时段最近用户进行过的节目搜索内容

搜索响应:用户搜索提交后不超过0.5秒必须完成搜索。

高级搜索:根据视频内容关键字, 建立片库。例如上映日期, 导演, 主演, 获奖情况

视频播放:对于有版权要求的内容, 如电影、电视剧, 所有搜索的视频播放时都回到视频内容门户进行;对于没有版权要求的内容, 可以回到视频内容门户进行, 也可以考虑直接播放。

搜索无结果人工处理:人工干预无搜索结果的情况, 以邮件、电话、网络互动等形式处理。

以下为该项目结构框图。

4 项目进展

4.1 三网融合在即, 得到政府和社会大力支持

广电网络作为党和政府喉舌的重要组成部分, 是党和政府联系群众的桥梁, 具有很强的公益属性。网络视频搜索服务项目的发展根植于广大市民群众的需要, 符合国家的发展, 其出发点和落脚点都是不断满足广大人民群众日益增长的精神文化生活的需要。广电网络的发展需要政府各级领导的关心和指导, 离不开相关部委办局的支持和配合。项目在发展上能够克服技术困难, 突破市场瓶颈, 引进业务内容, 创新发展理念。

4.2 经济效益分析

4.2.1 用户发展前景看好

目前我国宽带用户将近2000万、宽带网覆盖用户越8000万, 而目前电视用户超过3亿台, 其中1亿户的有线电视用户的潜在用户。宽带覆盖的用户几乎都是电视用户, 尤其在城市家庭拥护电视率几乎100%。对于宽带和电视用户数, 可以看到互联网视频信息服务业务的巨大市场潜力。

4.2.2 用户消费显著提高

根据今年初对江苏宽带用户的市场问卷的家庭月收入在2000元以上的占据了总调查用户的78%, 月收入在2000元以下的用户, 年龄层次较低, 这类用户约占总数的22%。针对用户愿意为宽带视音频服务支付的费用, 百分之八十以上的用户均不同的选择了10元~30元, 其中50%以上的用户选择了最低标准10元。网络电视服务的主要用户对象是16~35岁年龄段, 用户每月在互联网多媒体信息服务服务上的花费约在10元左右具有相当高的认知度。

视频搜索引擎 篇9

随着计算机技术、通信技术的发展,开放教育资源应用普及,催生了以“微课程”为主要特点的新教学模式。佛山的胡铁生先生[1]积极推动微课应用,全市的微课平台展播不到2个月访问量就突破15万,受到广大师生热捧。张一川等[2,3]对国内外微课程教学资源网站建设进行了对比研究,发现国外在微课程配套资源建设上比较完整并独具特色,国内则在微课平台建设、应用方面开展研究较多。在翻转课堂应用研究中,微视频已成为教学的主要形式。不仅如此,在移动学习、泛在学习、MOOC中也较多采用微课程的教学形式[4,5]。可以预见微课程将成为在线学习、翻转课堂、移动学习领域主要的教学方式。

1 微课程特征

微课程由美国新墨西哥州圣胡安学院的高级教学设计师Penrose提出的微型知识脉冲(Knowledge Burst)而来,他认为只要在相应的作业与讨论支持下,微课程就能与传统的长时间授课取得相同效果。胡铁生[6]提出了以微视频为主要特点的微课。微视频是微课程的主要学习资源,它根据人类认知特点和注意力保持规律,将每门课程时间压缩到10分钟左右,课程内容常聚焦于一个知识点,将复杂的内容进一步拆分成容易理解的知识块。

微视频具以下特征:①教学时间短;②教学内容微型化;③课程资源使用灵活;④资源构成情景化。微视频顺应了“微时代”数字化学习的新趋势[7]。

2 微视频应用现状

2.1 微视频制作软硬件门槛降低

技术的进步使得视频制作门槛越来越低。以前为了制作教学视频需要多人参与并借助专业的硬件设备和专业软件,历时多日才能完成。当前,硬件性能越来越好,价格越来越低,软件的易用性也有很大提高,一个人就可完成视频录制和后期剪辑处理工作。

2.2 微视频网站现状

可汗学院是典型的使用微视频进行教学的在线学习网站,其录制发布的课程视频高达6 000多门,而且还在陆续增加。中国微课网平台教师提交的微课高达4万多门,每位教师平均提交课程40~50门,与之类似的百度传课课程规模也相当可观。

2.3 微视频网站搜索功能欠缺

各大主流MOOC、微课程平台和在线视频学习平台均通过检索视频标题和简介进行检索,不支持条件表达式检索,这些功能上的限制导致检索精度和效率不高,进而造成部分资源因检索排名长期靠后而利用率不高。

2.4 尚未实现基于视频内容的检索

现有各大平台的搜索模块并不能对视频内容进行搜索。例如要搜索视频中某公式的证明过程,目前平台系统不能完成,因为所有视频信息只有标题和一些简要的描述信息,并不包含课程中的知识点信息。

3 元数据与社会化标签

虽然微视频网站已经开始应用,但是有必要对现有的搜索策略进行改进以更好地满足用户的搜索需求,元数据和社会化标签为解决这些问题提供了思路。

3.1 元数据特点

元数据的产生是为了更好地解决网络资源无序化问题,其根本作用就是对网络环境中无序的数据进行描述和管理,也可以说是描述结构化数据。元数据的使用增强了文献检索能力,提高了检索精度[8]。常见的元数据格式有USMARC格式、都柏林核心元数据集、VRA核心类目等。元数据自由度太高,导致描述数据标准难以统一。尽管如此,元数据对信息的查询准确率提升起着重要作用,如淘宝、京东等电商网站就通过对商品添加丰富的元数据信息来实现商品的精准搜索。

3.2 社会化标签特点

2005年,一种称为社会化标签的元数据描述方法进入了公众视野。本质上,社会化标签与元数据并无差异。和元数据的专业性相比,社会化标签属于自主分类,它更贴近用户,其主要特点是:

(1)自由标注。任何人都可以对资源进行自定义标注。如图1所示,显示的是用户对某一资源标记的标签。

(2)标注共享。任何资源的标记信息都是透明公开的,任何人都可以对资源的标记信息进行修改删除。

(3)动态更新。标签检索越多,标签在显示时就越醒目[8]。社会化标签的开放性,使得这些标签最终反映了所有访问者对资源较为一致的理解或认识,其带来的直接好处就是提高了信息检索精度。

4 应用

4.1 元数据应用

元数据用来改善微视频资源的搜索准确性有着天然优势。微视频在搜索方面的缺陷有:①可用于搜索的信息过少,只存在于标题和描述信息;②视频内容不能有效检索;③现有微视频搜索准确性不高。借助元数据可以为相应的视频资源添加足够的描述信息,信息包括:视频主讲教师信息、视频时长、所属学科、是否讲解例题等,特别是可以将视频的知识点、要点作为元数据进行添加。元数据越丰富,用户在检索时就越容易通过检索条件找到资源。在搜索功能方面,微视频网站可以很好地借鉴淘宝等电商网站的搜索策略,通过附加元数据信息将搜索范围缩小,最终找到符合需要的视频。

在基于视频内容检索方面,各大视频网站做了很好的尝试。如图2,可以看到播放进度条上有诸多标记点,这些标记点通常是视频中一些特定情节开始的播放位置。这些标记点功能类似于书签,可以为用户浏览视频提供导航,而这一功能就是基于元数据实现的。微视频也可以借鉴这一方法,将视频中的知识点信息和播放位置作为元数据进行添加,然后在播放时读取知识点和播放位置,并以标记点的形式呈现在播放条上,用户就可以像使用书签一样随意地在视频中跳转。同时,这些信息也作为视频元数据的一部分,对整个视频内容起到描述作用,更重要的是这些信息能够被检索。

4.2 社会化标签应用

元数据信息通常由管理员和教师添加,相对于社会化标签的随意和灵活而言显得更加标准化和正规化。在元数据的基础上加入社会化标签能够极大增强搜索的灵活性。学生群体对事物通常会有多元化的理解,因此将社会化标签应用到资源描述中,学生也能参与到对资源的自行标注中。例如,利用群体“行话”对资源进行多样化标注,不但增加了学生的参与意识,也有助于提高检索准确率。

5 结语

微视频在MOOC和翻转课堂成为主要的教学资源。随着未来应用的普及,微视频资源的增长规模会相当可观。利用元数据和社会化标签对视频数据进行描述,能够提高视频检索的准确性,提升用户的检索体验感。但是,由于目前没有平台支持,具体的使用效果还有待检验。笔者后期的研究重点是搭建小型平台进行测试,通过实际数据来分析元数据和社会化标签的使用效果。

参考文献

[1]胡铁生.微课---区域教育信息资源发展的新趋势[J].浙江教育技术,2013,6(4):6-8.

[2]张一川.国内外微课资源建设与应用进展[J].远程教育杂志,2013(6):26-33.

[3]陈怡,赵呈领.基于翻转课堂模式的教学设计及应用研究[J].现代教育技术,2014(2)51-56.

[4]金陵.从联系中看MOOC_微课和微课程[J].中国信息技术教育,2013(6):35-38.

[5]梁莎.探讨微视频在移动学习中的实践意义[J].数字技术与应用,2014(12):229-231.

[6]梁乐明,曹俏俏,张宝辉.微课程设计模式研究[J].开放教育研究,2013(1):67-75.

[7]李小刚,王运武,马德俊,等.微型学习视野下的微课程设计及教学应用研究[J].现代教育技术,2013(10):33-37.

视频搜索引擎 篇10

运动目标跟踪主要是通过分析图像(视频)序列,求出其中各运动目标的轨迹和速度,它在工业、交通、医学、军事、航空航天等领域均具有重要应用。跟踪的速度、精度和可靠性是衡量有关方法性能的主要指标[1]。Kalman滤波和Mean-shift(均值平移)是两种较常用和有效的目标跟踪方法。Kalman滤波通过迭代的预测(状态和误差协方差)、修正(增益、状态和误差协方差)等步骤,可以较精确地预测目标位置和匹配范围,对于较简单的场景可实现有效的跟踪,但无法胜任存在目标变形、遮挡和多目标等的场合[1,2,3]。Mean-shift跟踪将视频运动目标跟踪转化为模式最优匹配问题,配合对目标形态变化等不敏感的目标模式(如颜色分布直方图),可获得较好的跟踪稳定性。但因模式最优匹配的运算量较大,以整幅图像为操作对象的Mean-shift跟踪方法的跟踪速度较差[1,4,5]。

本文提出一种融合Kalman预测和Mean-shift搜索的运动目标跟踪新方法,利用Kalman滤波估计出运动目标在下一帧中最可能出现的位置,利用Mean-shift方法据此进行较小范围的搜索和目标匹配,从而可用较小的运算量获得较为可靠的跟踪效果,并且适用于较复杂的场景。通过实验证明了该算法的有效性。

1 Kalman运动跟踪方法

Kalman滤波器是在协方差估计误差最小的意义上最优的递归算法[2]。对于运动目标跟踪问题,以目标的位置和速度作为运动状态参数。因相邻两帧图像之间的时间间隔较短,目标运动状态的变化较小,故可假设目标在其间是匀速运动且目标大小是线性变化的。相应地,Kalman滤波器的状态方程定义为

x(t)=A(Δt)x(t-Δt)+ω(t-Δt)(1)

其中,x(t)是t时刻的系统状态;A(Δt)是Δt时间内的状态转移矩阵;ω(t)是t时刻的估计误差。x(t)、ω(t)均为包括目标的位置、大小及其变化的8维向量:

x(t)=[xc(t),yc(t),xs(t),ys(t),xc'(t),yc'(t),xs'(t),ys'(t)]Τ(2)ω(t)=[ωxc(t),ωyc(t),ωxs(t),ωys(t),ωxc'(t),ωyc'(t),ωxs'(t),ωys'(t)]Τ(3)

其中(xc, yc)表示目标质心位置,xs,ys分别代表目标外接矩形的宽度和高度,xc′、yc′分别表示Δt时间内目标在XY轴方向上的速度;xs′、ys′代表Δt时间内目标外接矩形的宽度、高度的变化率。则状态转移矩阵A(Δt)为:

A(Δt)=[1000Δt00001000Δt00001000Δt00001000Δt00001000000001000000001000000001](4)

相应的Kalman滤波器观测方程是:y(t)=H(t)x(t)+v(t)。其中,y(t)是观测向量,v(t)是观测误差,H(t)是观测矩阵

Η(t)=[10000000010000000010000000010000](5)

为简便起见,假设估计误差ω(t)、观测误差v(t)均为零均值的正态白噪声序列,二者互不相关,且可分别用协方差矩阵QR来代表。从而可按照图1所示的迭代过程和公式[1,2,3],在初始化之后通过多次循环的预测、修正步骤,利用Kalman滤波来估计目标质心的位置和窗口大小。

2 基于颜色直方图的Mean-shift搜索

运动目标跟踪可以通过目标特征匹配的方式来实现。常用的匹配特征有目标的位置、大小以及形状、颜色等。由于待检测图像的直方图纪录的是颜色出现的概率,对目标形态变化不敏感,故将直方图作为目标模式,依据颜色分布进行匹配,可获得较好的跟踪稳定性[1,4,5]。

假设被跟踪目标是一个中心为Xc而窗口为h的矩形;目标在图像中的像素以{Xi}i=1,…,n表示;目标模型为m值的直方图,b:R2→{1,…,m};对于任一像素点Xi,b(Xi)是其对应的颜色直方图。考虑到目标像素会被遮挡或受到背景影响因而具有相对不可靠性,特引入核轮廓(profile) k(·),对目标内部的像素根据其位置不同而赋予不同的权值——距离目标中心越近的像素,其权值越大。这样,模型中颜色u的概率可以表示为:

p^u=Chk((Xc-Xi)/h2)δ[b(Xi)-u](6)

其中δ(·)是Δ函数;Ch是归一化的常数,从隐含条件u=1mp^u=1,可得:

Ch=1i=1nk((Xc-Xi)/h)2(7)

基于上述目标模型(m值直方图),设目标的离散密度函数估计为:

q^={q^u}u=1,,m(s.t.u=1mq^u=1)(8)

在位置Xc上的候选目标密度函数估计为:

p^={p^u}u=1,,m(s.t.u=1mp^u=1)(9)

则目标和候选目标的相似系数可以表示为:

ρ^(Xc)=ρ[p^(Xc),q^]=u=1mp^u(Xc)q^u(10)

不失一般性,假设初始值{p^u(Xc,0)}u=1,..,m(p^u(Xc,0)>0)与候选目标{p^u(Xc,)}u=1,..,m之间没有很大变化。使用泰勒公式展开上式,并结合颜色u的概率公式可得:

ρ[p^(Xc),q^]12u=1mp^u(Xc,0)q^u+Ch2i=1nωik((Xc-Xi)/h2)(11)ωi=u=1mδ[b(Xi)-u]q^u/p^u(Xc,o)(12)

这样,目标匹配便等价于在当前帧中寻找使相似系数ρ^(Xc)最大的位置X*c,即式(11)中第二项(概率密度估计的加权和)的最大值点。为有效地求取Bhattacharyya系数ρ[p^(Xc),q^]的最大值,特使用下述Mean-Shift迭代算法:

①在当前帧初始化其位置,并按式(6)、式(10)计算{p^u(Xc)}ρ[p^(X^c,0),q^];

②按式(12)计算得到{ωi}i=1,…,n;

③由Mean-Shift向量,得到新的位置估计参数:

X^c,1=i=1nXiωig((X^c,0-Xi)/h2)i=1nωg(X^c,0-Xi)/h2)(13)

④更新{p^u(X^c,1)}u=1,,m,同时计算ρ[p^(X^c,1),q^]=u=1mp^u(Xc,1)q^u;

⑤若ρ[p^(X^c,1),q^]<ρ[p^(X^c,0),q^],则X^c,11/2(X^c,0+X^c,1);

⑥若|X^c,1-X^c,0|<e,则停止迭代;否则X^c,0X^c,1,返回到步骤①。

这样便可保证目标在当前帧中的新位置与前一帧中的估计位置之间的距离最小。

3 融合Kalman预测和Mean-shift搜索的运动目标跟踪新方法

由于Kalman跟踪方法和Mean-Shift算法各有优缺点且可优势互补,本文提出一种融合Kalman预测和Mean-Shift搜索的运动目标跟踪新方法。如图2所示,其处理流程可概括为:在发现新的目标出现后,先使用Kalman跟踪器估计出目标在下一时刻最可能出现的位置,再利用Mean-shift算法在以该估计位置为中心的窗口范围内搜索,以确定目标的最终位置。若Mean-Shift搜索是成功的,即Mean-shift迭代的终止条件|X^c,1-X^c,0|<e成立,则将Mean-shift跟踪的结果作为Kalman跟踪器的观测值,参与下一时刻目标运动的估计。

在上述跟踪框架下,我们主要关心目标的质心坐标和大小的运动信息。因此,Kalman滤波器的观测值是由该目标的Mean-shift跟踪器(而非Kalman滤波器)给出。Kalman跟踪器估计出的该目标运动信息,被当作下一时刻该目标Mean-shift迭代的初始值。同时Mean-shift返回目标精确的观测值。这里目标初始的质心位置参数和搜索窗口大小由该目标的Kalman运动估计器给出。这样,既能有效缩小Mean-shift算法搜索范围,又能可靠的更新目标的特征数据,以适应目标在运动过程中发生的旋转和遮挡等引起目标特征的变化。

4 实验与讨论

运用上述算法对实际视频目标进行了多组实验[1]。图3所示是针对某足球比赛录像片段的实验结果,在中线附近的一名运动员被选作跟踪目标。从中可以看出,本文算法可以有效地跟踪视频运动目标,跟踪精度高于单纯的Kalman滤波跟踪。更多的实验结果表明,与单纯的Mean-shift跟踪相比,本文算法的跟踪速度平均提高了2.8倍以上。


5 结 语

为了提高视频运动目标跟踪的精度和速度,本文提出了一种融合Kalman预测和Mean-shift搜索的新方法。实验结果表明,该算法可以有效地实现跟踪,且跟踪精度高于典型的Kalman滤波跟踪算法,而跟踪速度显著优于典型的Mean-shift跟踪算法。该算法的DSP实现和优化是需要继续研究的问题。

参考文献

[1]赵俊.智能视频监控系统关键技术研究[D].西安:西安电子科技大学,2006.

[2]Kalman R E.A new approach to linear filtering and predictionproblems[J].Transactions of the ASME-Journal of Baisc En-gineering,1960,82(1):35-45.

[3]Jang Dae-Sik,Kim Gye-Young,Choi Hyung-Il.Kalman filterincorporated model updating for real-time tracking[C].Proc.1996 IEEE TENCON,Digital Signal Processing Applications,1996:878-882.

[4]Comaniciu D,Ramesh V,Meer P.Real-Time tracking of non-rigid objects using mean shift[C].Proc of the IEEE Conf.onComputer Vision and Pattern Recognition(CVPR),2000:142-149.

上一篇:讲学稿下一篇:门诊体检