数字视频处理

2024-10-08

数字视频处理(精选11篇)

数字视频处理 篇1

0 引言

21世纪以来, 我国在电子科学技术和计算机技术水平的飞速发展中, 人类社会的步伐逐渐走向了一个高速化、现代化的时代, 信息的获取和处理在我们的生活与生产中已经发展成为了一种重要的产业。据统计, 人类从外部环境中直接获取的信息大约可以占到所有获取信息的一半以上。但是这个庞大的数字在数字的传输与处理中给数据存储过程增加了处理负担。在我们的日常生活中, 我们可能仅仅需要图像所传递的基本信息, 但是, 在对图像进行一些加工和处理后, 我们能够在以前的基础上获取更多的相关信息, 这就是我们所说的视频图像, 也称之为运动中的视觉信息。

1 数字视频的内容与实际应用

1.1 数字视频处理的层次

数字视频视觉处理可以根据处理前后的输入、输出的信息划分为3个层次:1) 低级层次:在处理的过程中, 处理后的输出结果和处理前的输入信息都显示为图像, 不包含其他的特征信息;2) 中级层次:在这个层次中, 处理之前输入的信息内容为图像, 但是在经过处理之后, 输出的结果显示为特征性的信息, 而不是抽象意义的图片;3) 高级层次:这个层次的视觉处理就像是人类的视觉认知能力一样, 具备一定的人中与感知的能力。低级的数字视频视觉处理是为了通过这一过程, 达到改善图像的质量的目的。中级层次的主要目的是将低级层次的图像描述的内容进行系统性的分类, 然后做出相应的分析, 最后直接提取有兴趣的信息。高级层次的视觉处理是将提取后的信息做进一步深入的处理和归类, 促进与人类视觉相似的逻辑推理的有效完成, 得出一种信息符号, 作为其标志。

1.2 数字视频处理研究的领域

在数字视频视觉的处理与控制系统的基础之上, 数字视频处理系统可以应用到以下几个领域:1) 机器制造领域, 主要用于工业产品的检测, 产品包装的印刷、产品终极损伤度的检测等;2) 视觉上的导航, 包括日常生活中的驾驶GPS导航、自主导航和智能交通导航等领域;3) 安全防卫监控领域, 这一技术广泛运用于电子警察、远程行为监控和区域性的防盗等区域。鉴于我国的制造业的迅猛发展, 视频视觉处理和控制系统已经普遍性的应用于工业的生产、发展之中, 我们预言, 在未来不久的日子里, 我国也势必走向全球市场, 成为一个与世界媲美的生产场地。

2 数字视频视觉采集与处理系统的实现

数字视频的采集与处理系统大致由三个主要的模块构成:成像模块, 在这一模块中, 主要包括图像传感器和镜头这两个部分, 不用类型的图像传感器具备不一样的分辨率、感光面积和动态的范围等。这些技术已经广泛的应用与我们日常生活中常见的数码相机、摄像机、手机等一系列的电子产品中。在处理控制模块中, 我们最常见的成分有:PC机、通用的DSP和常用的ASIC等部件构成。在PC机主要是由不同类型的板卡和人机相互应用的一种软件类型, 生活中也常见此技术得以应用, 比如在高速公路上的收费站选用的收费系统, 我们身边的医疗成像系统。通用的DSP和ASIC的工作效率很高, 体积相对较小, 便于携带, 基于以上优点, 我们生活中广泛应用的是在对实时性要求比较高的一些特殊的场合:工厂里面的生产流水线上的监控、无人驾驶车上的监控装置。传输与显示模块会将获取的信息加工、处理, 最后发送到中端处理器上, 再进行深度的存储和加工。这种系统针对于视频图像而言, 数据处理的数量相对较大, 对实时性的要求也很高, 当然在传据的传输率要求也是非常的严谨。

3 数字视频处理技术

3.1 数字视频处理器具

3.1.1 多媒体计算机

对于计算机的硬件配置相求较高的计算机主机, 在数字视频处理的过程中的要求是相对较高的。比如说如果选用的CPU是双核配置, 就可以选择AMD和INTEL这两种类型, 最好的选择是后者或者酷睿系列的配置。对于主频而言, 越高的配置当然是越好的。为提高整体的速度和处理的能力, 最好选用内存在DDR21G以上大小的, 硬盘的平均存取时间一般要低于15ms, 然而这样速度的前提是选用SCSI系列的硬盘, 这样能更好的保证系统的稳定性。

3.1.2 视频采集卡

视频采集卡的主要用途是获取数码视频信息, 并在获取信息之后将其有效的存储和播放, 视频素材的选择非常重要, 一般选取模拟信号, 并结合视频采集卡来完成整个视频的处理。部分特殊的视频采集卡还会配备有更多的功能, 比如说压缩功能, 而且数据处理的速度较快, 更为重要的是, 它还可以全屏幕的数字视频捕捉。

3.1.3 主流显卡与压缩卡

在日前的市场上推出的主流显卡和压缩卡的类型比较多, ATI4870和GTX280等都是性价比相对较高的两款。但是在压缩卡的选择上, 要着重考虑压缩之后的文件的各种性质, 比如说文件的质量状况、稳定性能、价格及其功能的综合情况。当然, 显卡和压缩卡的匹配度对于数据视频的处理而言是相当重要的。

3.2 数字图像捕获和测量技术

3.2.1 桌面视频捕获过程

数字视频的捕获与压缩是一个非常复杂的过程, 一般称为桌面视频的捕获, 它是通过视频卡从视频源基地获得模拟性的视频信号, 并借助一系列的工具将其接收的视频信号有效转化为数字视频类的信号, 一般包括视频的采集和视频的压缩两个过程。

经过采集压缩之后的视频媒体文件需要在一系列的处理之后完成编辑的工作, 这个过程中就包括:剪切、编辑、切换以及特效功能的搭配, 因此借助计算机的编辑技术可以解决这个问题。在数字图像捕获和测量的过程中不仅要注重过程的严谨, 更要注意测量方法的合理搭配。只有通过科学的、合理的测量方法, 才能获取多样化的视频信息, 并逐渐展开, 提高数字视频视觉的采集和系统处理的过程。

3.2.2 像素当量测量法

每个像素都代表有实际的长度, 在没有标定数据的图像像素所代表的实际长度是不一样的, 一旦经过了标定, 每个像素所代表的实际长度就会成为一个常函数。在我们的后续工作中, 先将给定的图像进行校正, 然后求得各个特征点的像素, 和像素当量相乘的结果就是我们要求取的各个特征点之间的实际的距离。

像素当量测量方法的具体过程如下:1) 针对图像进行中值滤波, 在原始的灰度差别较大的图像基础上, 保持一个相对稳定的状态, 这样就避免了复杂的预处理全过程, 可以有效的去除存在于图像中的多种噪声;2) 分割水平方向和竖直方向的阈值。根据水平方向和竖直方向的标尺灰度的差值, 进行有效的修改, 得到一个最优值, 最后, 将标尺边缘的部分去除, 就能得到有效的部分。

3.2.3 边缘检测技术

图像边缘产生的原因是灰度值不连续而导致的结果, 在图像显示中, 指那一部分灰度变化特别显著的部分。在图像中, 往往会因为景物的物理特性的变化而产生图像边缘, 物理特性主要包括以下几个方面:阴影部分、物体的方向和深度以及反射的系数。

实际中图像是一个复杂的整体, 这就导致了边缘类型的多样化。我们可以根据灰度的变化情况, 将边缘划分为阶跃型和屋脊型的边缘。通过灰度的导数, 我们可以在实际的数学运算中刻画出边缘点的具体的变化过程。对于阶梯型边缘, 它的灰色变化曲线越大, 它所对应的导数值就会到达一个极限值。

目前主要通过两方面的改进来提高图像测量系统的精准度:第一, 硬件设备的改进;第二, 有效的利用空间目标的成像特征, 利用亚像素定位技术来测量定位的精准度。

4 结论

数字视频视觉的采集与处理技术在安防监控的相关产业、工业检测与包装印刷等领域里以及图像、内容的处理与控制系统中得到了广泛的应用与发展。它的最大优势在于处理和传输、存储的途径快捷, 通过数字视频技术对视频材料进行有效的编辑与整理, 是多媒体综合课件中一个必不可少的环节。因此, 本文对此研究热点进行了探析, 希望可以为人类社会的开发和发展提供一定帮助。

摘要:伴随着我国电子科学技术和计算机技术水平的飞速发展, 数字视频视觉的采集与处理技术得到了广泛的应用与发展。无论是安防监控的相关产业, 还是工业检测、包装印刷等不同领域, 在图像、内容的处理与控制系统中, 数字图像和数字视频都占据了不可替代的位置。它的最大优势在于处理和传输、存储的途径快捷, 通过数字视频技术对视频材料进行有效的编辑与整理, 是多媒体综合课件中一个必不可少的环节。因此, 本文将针对这一研究热点展开深入的讨论, 使之更好的服务于人类社会的开发与发展。

关键词:数字图像,数字视频采集,自动化处理系统

参考文献

[1]冈萨雷斯.数字图像处理.北京:电子工业出版社, 2004.

[2]李玉山, 来新泉, 等.电子系统集成设计技术.北京:电子工业出版社, 2007.

[3]刘文开.数码影像处理实用技术[M].沈阳:辽宁科学技术出版社, 2000.

数字视频处理 篇2

教学目标:

知识与技能

会用超级解霸进行视频剪辑。

会用会声会影进行视频剪辑。

过程与方法

学生通过动手实践,学会对视频素材进行简单地加工、处理。

情感态度与价值观

学生通过实践,进一步提高自己的动手能力。

学生通过自主探究、互助学习,增强积极探索、小组协作的意识和培养他们的探究能力。

教学重点:

用超级解霸进行视频剪辑。

教学难点:

用会声会影进行视频编辑。

教学过程:

一、导入课题:

利用多媒体网络教室,通过自制的多媒体课件,分别演示编辑前和编辑后的两段视频,引导学生体验编辑的作用。

二、新课:

(一)截取视频片断

引导学生打开“超级解霸”软件。

引导学生尝试按钮的使用。

将提前准备好的视频文件提供给学生,布置操作任务及要求,学生练习视频的截取。

(二)视频编辑

提示“超级解霸”对于视频的整段截取操作方便,但是无法实现片头、片尾以及特殊效果的制作„„引导“会声会影”的使用。

引导学生启动“会声会影”。

通过演示简单介绍“会声会影”的窗口界面。

出示本节课的第二个小任务,提出任务要求。

组织同学交流个人作品,选出典型作品展示。

三、拓展延伸:

布置任务:阅读本节的“加油”,了解视频格式的转换。

四、课堂小结:

数字技术在数字视频开发中的应用 篇3

关键词:数字技术;数字视频;多媒体课件;应用

中图分类号:J218.7;J954

数字技术的逐步发展和广泛应用,催生了各种新媒体平台的不断涌现,且正以排山倒海之势影响着各个领域。本文探讨了数字技术的概念及特点,并就数字技术在数字视频开发中的应用进行了探讨。

1 数字技术的概念及特点分析

数字技术,即所谓的数码技术,该技术是将一系列连续性的信息进行数字化或不连续化处理。其主要具有如下特点:(1)数字技术通常采用的是二进制,因而元件若具有两个稳定状态,都可用以表示二进制,如,在计算机中,高、低电平可采用“0”和“1”来进行表示,因此,该单元的电路较为简单,对其中各元件精度方面的要求也并不十分严格,允许元件的参数存在较大程度的分散性,可以对这两种状态进行区分即可。此特点有利于实现数字电路的集成化;(2)拥有较强的抗干扰能力,且精度较高。数码技术加工及处理的属于二值信息,因而不易受到干扰。此外,该技术可用于二进制数数位的增加,以便更好地提高精度;(3)数字信号能够长期存储,有效保证了大量珍贵的信息资源;(4)拥有良好的保密性,数字技术可进行加密处理,确保信息资源不受窃取;(5)具有较强的通用性,可利用标准化逻辑部件对各类数码系统进行组建。

数字技术上述特点及优势极大地推动了其发展,并在数控领域、电子计算机领域、数字化仪表、通讯设备、及其他领域得到了广泛的应用。

2 数字视频开发过程中数字技术的应用分析

2.1 视频信号的采集

视频信号包括两种类型,即模拟和数字视频信号,二者性质不同,因此,在计算机中安装的方式也不尽相同。就后者而言,可通过将其直接拷入硬盘中来实现,前者则需要借助相应的软件及设备才能对信号进行采集,具体而言,步骤如下:

(1)安装相关软件及视频采集卡,或借助于Premiere来进行信号采集。

(2)将模拟视频设备和采集卡对应接口进行连接,通常而言,采集卡都携带有视频接口及S-video端子,应优先选用后者,以确保视频信号的清晰性,此外,应注意将音频信号线进行连接。

(3)进入软件中,对所需采集文件的相应参数进行有效设定。

(4)采集文件的实际格式应以依据采集卡的实际性能,通常而言,采集卡拥有MPEG格式的采集功能,有些可采集AVI或MPEG格式的文件,并需要通过Premiere软件对文件予以编辑。将文件存储在计算机硬盘中,即可为MPEG文件,也可为AVI文件。

2.2 剪辑的编辑

采集所得到的单个视频文件,即为一个剪辑,各剪辑都可能需要进行编辑,或将多余部分剪掉,或将若干剪辑合并,共同组成一个视频文件,此外,还可能需要插入音乐、文字、图像及所需效果等,这一系列过程需要利用Premiere软件实现:

(1)进入Premiere软件,选择File\import\file,弹出相应的Import对话框,将待编辑剪辑导入,注意可同时将多个文件一同导入,也可以根据需要随时导入相关文件,同时,要将编入剪辑中的诸如声音、动画、文字等其他文件一同导入。

(2)将导入的文件根据编辑顺序依次拖至Timeline窗口中,该窗口包括Video和Audio编辑两大部分,前者负责视频编辑,后者负责音频编辑,音视频编辑均需在Timeline窗口下进行,可分别进行文件的裁剪、合成,动画效果的添加,过渡效果的添加,滤镜效果的添加,编辑音频文件等。

(3)编辑结束后,按Enter,此时会生成预览文件,可对所编辑的视频效果进行查预览,若仍有待修改,可返回进行进一步编辑。利用Premiere软件所编辑的文件格式均为PPJ,无法直接应用于多媒体课件中,必须将其输出为AVI格式,输出时应可以根据编辑之后文件大小选择所需输出的方式,例如,文件尺寸较小可借助于Export\movie,文件尺寸较大时可借助于Utilitie\batch processing,此时,所输出的格式为AVI格式。输出过程中需要对参数进行设定,此时需要以文件采集时所设定的方法为依据来进行,最终,文件将存储于计算机硬盘中。

3 多媒体课件中数字视频的应用与效果分析

(1)将文件插入Powerpoint中。打开编辑栏中的新幻灯片对话框,对幻灯片版式进行选择,对话框中包括文本与媒体剪辑以及媒体剪辑与文本两种版式,选择所需版面进行布局。如,当选择的是媒体剪辑与文本版式时,会弹出相应的设计面板,通过对媒体剪辑进行选择,通过菜单将所需视频文件插入即可。可利用调节钮对视频文件窗口大小进行调节。

(2)在Authorware中插入所需视频文件。进入Authorware中,在待插入流程线上将数字电影图标拖入,双击该图标,出现“属性动画图标”对话框,点击“输入”,确定待插入视频文件。

(3)将视频文件插入Frontpage网页。将待插入视频文件的网页打开,对插入位置予以确定,听过选择菜单一栏中的插入/图片/视频,弹出“选择文件”对话框,对所需插入文件进行选择,点击确定即实现了视频文件在网页中的插入。其中,视频播放窗口的大小可通过调节窗口四周调节钮实现。

利用IE浏览器浏览相应的网页,下载时其速度和网速以及文件大小有关,若待下载文件过大,则下载所需时间较长,较其他文件不同,视频文件的尺寸要大很多,尤其是AVI格式的视频。为此,网络插入视频文件应尽量选择尺寸较小的,最好对AVI格式的文件进行转换,可转换为RM格式,以提高下载速度,可借助于Realproducer plus转换AVI格式的文件,该软件的向导界面友好,用户可按向导提示对视频文件进行转换。下文针对《工程化学》等课件的制作为例,对数字视频的应用效果进行分析。

采用的视频信号源包括如下:一是原有电教录像内容。利用计算机系统分别进行采集、压缩、编码等处理,并将模拟视频文件转换为数字视频文件。在制作《机械原理》课程的课件时,必须对录像资料进行充分、合理地利用,利用编辑与制作,使其插入课件中,最大限度地发挥录像资料所应有的教育作用;二是应依据需要随时录像,获取录像信号,在对《工程化学》课程的课件进行制作时,可将重点放在某些重要的实验过程及结果方面,并对该过程进行拍摄,经编辑之后插入课件之中,教师在对该内容进行讲解时,所得效果更为直观,使学生更易理解,达到了事半功倍的效果。将所编辑的文件导入课件时,可利用如下方式:一是在课件的页面上直接放置视频文件,这样,在页面打开时该文件就开始播放,因而提高了页面的动感效果;二是将文件同页面某个关键词及按扭进行超链接,需播放文件时可将其调出,极大地提高了灵活性,应用过程更为方便。

参考文献:

[1]杨旭明.Premiere Pro视频编辑实训教程[M].上海:上海科学普及出版社,2009.

[2]时春雨,赵景亮.Premiere 6.5教程[M].北京:北京希望电子出版社,2008.

[3]徐金胜,刘宝森,陈晟等.数字技术的开发与应用[J].天津理工学院学报,2003(03):83-85.

[4]周光明.数字技术与广播电视信息产业[J].电视技术,2000(01):11-13.

数字视频处理 篇4

一、视频的获取

在录像带、各类电子资源、网络资源中有很多视频素材,因此视频素材获取的方法主要有以下几种:

1、用视频采集卡采集视频素材

常见的电视、电影、录像都是视频,但是它们是模拟信号的视频,而计算机中使用的是数字信号的视频,即数字视频。为了将电视、电影、录像等模拟信号的视频转换为数字视频,需要用到视频采集卡。视频采集卡(简称视频卡),是计算机机中用于将视频信号数字化的插卡,其功能是将模拟视频信号(及伴音信号)数字化并存储在硬盘中。通常采集步骤如下:

(1)安装好视频采集卡和视频采集软件。Premiere、会声会影、数码大师、Nero等软件都具有视频采集的功能。

(2)将录像机、摄像机、影碟机等的输出端口连接到视频采集卡的输入端口。计算机的视频输入端口常用1394口(俗称火线口)或USB口。

(3)打开视频采集软件的“采集”功能窗口,设置好相关参数。

(4)在“采集”窗口中浏览找到需要采集的片段,点击“记录”按钮。

(5)采集完成后保存成一定的文件格式。

2、从VCD、DVD中截取视频素材

有些软件可以在播放VCD、DVD时截取其中片段,如国产软件超级解霸。

[示范案例1]用超级解霸3000截取VCD片段。

(1)打开超级解霸3000,执行菜单中的“播放各种影碟”命令,播放一张视频光盘或一个视频文件(如图3-23)。

(2)点击工具栏中的“循环/选择录取区域”按钮使之激活。

(3)在适当位置选择开始点和结束点。

(4)点击工具栏“录像指定区域为MPG或MPV文件”按钮。

(5)在弹出的保存对话框中选择文件的路径、格式,设置好文件名。

(6)单击保存按钮即开始转换录制。

用超级解霸播放器还可以将视频的当前图像保存为一张图片,或者将一段视频保存为连续的图像序列以便在视频编辑软件中加工成新的视频素材。

VCD光盘中的视频文件通常放在光盘根目录下的MPE-GAV文件夹中,扩展名是“.DAT”。DVD光盘中的视频文件通常放在光盘根目录下的VIDEO_TS文件夹中,扩展名“.VOB”。可以直接将这些扩展名为“.DAT”或“.VOB”的文件拷贝到计算机的硬盘中作为视频素材资源。但是,这些格式的视频素材通常不能在一般的多媒体课件开发软件中直接使用,我们可以用类似【实践案例10】中的方法,借助“格式工厂”等工具软件将它们转换成多媒体课件开发软件支持的格式,请读者自行尝试。

3、网络上查找、下载视频素材

随着网络技术的发展,互联网上的视频教学资源越来越丰富,从互联网上获取视频教学资源已经成为获取视频教学资源的最重要的途径。我们可以在一些专业教学视频资源网站中查找视频资源,也可以利用百度、谷歌等搜索引擎查找,找到视频资源后再用适当的方法下载下来。

对于提供下载的网络视频资源,常用下载方法有:

(1)根据下载的提示,直接用迅雷等下载工具下载使用。

(2)有些视频网站需要注册登陆后并安装本网站特定的下载工具才能下载。例如土豆网的视频需注册登陆并安装“itudou”下载工具,优酷网的视频需注册登陆并安装“iku”下载工具才可下载。

很多视频网站只提供在线观看,不提供视频文件的下载,这种情况需要找到视频文件在网络上的真实地址,将找到的真实地址复制并粘贴到迅雷等网络下载工具的地址栏中,按确定按钮即可开始视频的下载保存。

获得网络上视频文件地址和下载视频的办法主要有:

(1)从正在播放视频的网页源代码中查找。在网页的空白处鼠标右击,在弹出的快捷菜单中选择“查看源文件”,用记事本打开网页的源文件。可用编辑菜单中的“查找”菜单项来查找视频文件的真实地址。查找的关键词可输入RTSP、MMS等流媒体传输协议,也可以输入视频文件的扩展名如WMV、RM、ASF等。

(2)对于一些在线播放的RM格式的视频文件,如不能直接查找到该文件的真实地址,可以在播放过程中断开网络,往往会弹出类似“播放错误”的对话框,在对话框中能看到该视频文件的真实地址。

(3)对于用Windows Media Player播放的WMV格式的视频,可以直接在播放的视频画面上右击鼠标,在弹出的快捷菜单中选择属性,在属性中可以找到视频文件的地址。有一些网站上用Windows Media Player播放器播放的视频文件,在播放器的“文件”菜单中有“媒体另存为”菜单项,可用该菜单项来直接保存正在播放的视频。

(4)利用专业下载软件。Bitcomet、e Mule可以直接查找并下载视频资源;维棠、硕鼠等视频下载工具可以对FLV、MP4等正在播放的网络视频获取地址并下载;Web Video Cap等工具软件可以抓取正在观看的FLV、SWF、WMV、RTSP、MMS等网络流媒体,并且质量还不错;我们观看网络影视的一些P2P软件如PPTV附带的PP加速器也带有下载的功能,当把鼠标移到正在播放的网络视频窗口时就出现下载标识或“保存”按钮,点击“保存”按钮进行下载。

(5)利用专门视频地址获取软件。例如网络嗅探等工具软件可以找到并列出正在播放的网络视频的真正地址,然后在网际快车等软件中下载。

(6)有些网络视频播放完后就已经自动缓存到了本地计算机的“Temporary Internet Files”文件夹中。通过IE浏览器上的“工具-Internet选项”→“常规”→“设置”→“查看文件”按钮,能打开Temporary Internet Files文件夹窗口,从中可以直接查找到其中已经下载的FLV视频文件。在菜单“查看”→“排列图标”中选择“类型”来按类型名称的顺序排列文件,并根据时间的先后顺序就可以很容易找到所需要的FLV视频文件。另外,有的网络视频存储到其他专门路径如D盘的“Favorite Video”文件夹,需要时打开这些文件夹找到相应视频即可。

二、视频的加工处理

1、视频的截取和分割

课件中往往只需要视频的一部分,这就需要对视频文件进行截取和分割。不同格式的视频往往使用一些专门的截取和分割软件。ASF格式的视频可使用ASF Tools等软件来分割成多个视频片段,或从整个视频中截取其中的一段。RM或RMVB格式的视频则可用Real Media Editor软件来截取和分割。Split It和Ultra Video Splitter等软件可以对WMV、ASF、RM、AVI、Divx、Xvi D、MPEG、MOV、3GP、MP4等多种格式格式的视频则进行截取和转存。

【实践案例2】使用Split It3.8工具软件分割视频文件(如图3-24)。

(1)打开Split It3.8工具软件窗口,设置输出文件的保存目录。

(2)点击左下角“添加”按钮添加需要切割的文件。

(3)双击文件列表中的文件名可对文件预览播放。

(4)设置截取的开始点、结束点。

(5)如果需要把截取的片段再分段,设置分段数。如果不需要把截取的片段再分段,分段数设为1即可。

(6)点击窗口左上角“转换”按钮即可分割文件并存到相应目录下。

2、视频的合并

有时候也需要把几段视频组合到一起使用,如果觉得Premiere、会声会影等视频编辑软件复杂,可以用一些小的工具软件,如“视频合并专家”等。

3、视频格式的转换

不同多媒体课件开发软件对视频文件格式的兼容不尽相同,因此常常需要将一种格式的视频文件转换为另一种格式的视频文件。常用的视频格式转换工具有格式工厂、视频转换大师(Win MPG Video Convert)、Total Video Converter等。

张骥:数字视频时代的千里驹 篇5

张骥在数字网络和视频压缩技术领域的技术和产业的人生跋涉近乎此。

数字时代的中流击水

世界已经进入数字电视时代。

仅就美国而言,截至2006年,至少有2000万台数字电视被购买,预计2008年将有1.04亿台数字电视被购买,数字化家庭达到7800万户。美国政府规定,2007年所有电视台都必须数字化,2009年将关闭模拟电视。按照中国官方的时间表,2015年前,中国将全面取消模拟信号。

事实上,欧美日等发达国家正在加速数字化的发展,这可能内蕴着另一个时代的大国技术的竞争。在这场全球性的数字化中,数字电视以及衍生的IPTV的巨量的市场和巨大的社会影响力将会催生新的技术、经济乃至文化生态。

从全球和中国而言,2010年左右是数字电视产业大发展阶段。

张骥认为,数字电视已经成为世界公认的取代现行模拟信号数字电视技术的最佳选择。从模拟技术向数字化的转变可以和第一次工业革命、电气革命以及信息革命相并提。

这是一个正在开始的时代。

从模拟信号到数字信号的过渡将会带来数万亿美元的巨大市场商机。市场分析显示,全球数字电视及相关产业的年产值将于2010年达到3000亿美元。其中每千亿美元的全球市场,中国将占150亿美元的市场份额。

正是在这个前景中,张骥携在数字网络和视频压缩领域20多年的研发和市场经验,以及拥有的16项已授专利和18项待授专利创立了亿科三友公司,来见证这个时代。

广告是数字视频的最大经济收入。在这个领域耕耘,符合经济原则。亿科三友目前通过数字视频个性化广告智能插入技术为视频运营商如有线电视、电信、IPTV、宽带互联网等商家的整体广告和个性广告提供了解决方案。

传统的电视中,广告插播很生硬,影响许多人看喜欢的节目,也使许多对某种广告不感兴趣的观众“被强迫地”接受广告信息。事实上,广告应当影响其想影响的人。那么,如何为电视台和广告商户提供各种有效数据,并使广告的出现成更为人性化且个性化地的受人欢迎呢的一种存在?个性化广告是指广告商能够具有一对一的、有针对性的广告提供能力。这是目前广告插播的一次革命。

亿科三友推出的产品是Intelligent Stream Advertiser,它的技术有许多独特之处。首先,广告不是预先进入视频系统,并被整合编码为与内容统一的整体;而是与视频内容独立的,能够随时被个性化选择并在视频内容中插播插入。亿科三友创造了采集数据和模式分类的数学算法,能将最合适的广告匹配并播放给最有可能购买该产品的观众。这极大地增加了广告的有效性,降低广告成本,并同时增加运营商的总体广告收入。其次,不会影响质量,更重要的是该技术的实现能大规模降低硬件系统成本。最终,能达到在极低的成本条件下实现高并发流。

事实上,这项技术还可以延伸到视频搜索技术,帮助用户使用包含在视频内容中的可检索媒体数据来定位自己需要的、相关的视频内容。

张骥告诉记者,上述技术拥有数项待授的美国专利和中国专利。他认为,Intelligent Stream Advertiser具有如下功能:1)、以软件为基础的数字视频插播系统,通过这个软件,普通服务器电脑平台就完全可以支持该技术,使个性化视频广告可以在多个并发视频频道流上插入。2)、将用户对节目的欣赏习惯与视频内容播放及数字广告插入有机地结合在一起。3)、提供更快捷、更准确的高质量视频内容标定指数和搜索。4)、普通计算机群条件下的高速计算能力,能实时编码,将节目通过数字加工存储后实时传递和播放。这是编码史上的一次划时代的创新。

这些技术是未来互动电视模式的基础。正是在这个意义上,Intelligent Stream Advertiser具有颠覆性的技术意义。

显然,张骥的技术能量可以覆盖整个数字视频技术领域,但将力量集中于爱数字电视发展的关键技术——个性化数字广告智能插播——上,对于整个产业和亿科三友本身,都具有桥头堡或者支点的意义。

颠覆性技术的经济可能

张骥认为,广告是电视的主要收入,电视的运营是离不开广告的,广告是电视的命根子。在这个意义上,很多人认为,广告是电视的血液。

广义上,广告传递的依然是一种信息。只不过,广告使交易双方结合起来,出售商品、服务或信念。广告在完成这些任务时,为电视带来收入。

广告的经济魔力在于,电视的广告越多,就越有钱投向内容制作。电视收看费用的低廉,就是因为广告的作用。广告使广告商户和电视都能赚钱,又能使电视和商品的价格降低。广告不但能扩大和普及消费,而且能创造消费,形成一种新的生活方式。

张骥告诉记者:“正是这种魔力,使得广告商户和电视台纷纷挖掘电视广告的潜力。”

根据调查,电视消费者对滥发广告日益反感,对于电视内容需要日趋细分化。这种趋势,使得传统电视的收视率下降,这一方面和互联网等媒体的分流有关,另一方面说明电视面临竞争——互联网的竞争和电视消费者需求的竞争。这种竞争正在演绎一种经济动力,张骥所领衔研发的Intelligent Stream Advertiser就是这种经济动力的结果。个性化的互动广告肯定意味着细分而精确的广告发布模式,也意味着广告产生不同既往的经济渗透力和经济张力。就像Web2.0时代的博客与维客一样,个性化的、互动的、相互丰富的广告传播方式肯定会将电视广告带入一个不一样的经济境界。无论是从收入体量和结构上看,还是从对电视广告业的传统的彻底扬弃上看,这都是一场行业大变革。张骥认为,这本质上是一个技术问题。也就是说,这种愿望需要技术来变现。而亿科三友的Intelligent Stream Advertiser恰恰就是这样的圆梦的技术。

根据研究者的调研,全球网站广告年平均收入250亿美元,全球电视广告收入2500亿美元,是为网站广告的10倍。但广告价格和效率则是前者的1/20,网站每千次点击的广告价格为540美元,传统电视的每千次收视印象价格仅20-25美元。据分析,电视区域化广告每千次收视印象价格已经达到40-70美元,而个性化广告(即互动性、精确化)的千次收视价预计将高达250亿美元。显然,数字电视广告如果实现个性化、互动化、人性化,那么全球电视广告将增加10倍以上,达到25000亿美元。这种发展,肯定决定是颠覆性的。它不仅仅改变人们的消费方式,也将重塑一种生活文化。

事实上,即使按照张骥保守的估计,也将带给整个行业近5倍的净增值。这个数字同样保守。也许,这也是他率领亿科三友耕耘Intelligent Stream Advertiser的经济理由。

颠覆性技术的实现路径

随着数字技术的发展,电视内容的传递也日益数字化。如今,数字视频压缩技术在高效利用频谱,提高信号质量,降低成本、内容版权保护以及高清电视等方面的作用也日益显著。电视信号的数字化从根本上改变了电视节目的传输方式和消费者的接受方式,数字电视与网络、游戏和电话的结合已经成为一种趋势。这也意味着一个技术时代的来临。

但是,有效地普及数字电视,必须有完善的技术和解决方案,如转换、粘接、速度及格式转换、加密、存储、网络普及和数据服务整合等等。所有这些都需要高速的计算、存储和网络资源来完成。“数字电视要求使用压缩技术,将多路数字电视信号压缩并通过一个模拟信号进行复用传输。压缩技术是数字电视最主要的技术。正是这个技术使数字电视取代现行的模拟数字电视技术成为可能,引发一场产业革命。其意义可以同工业革命等相并论。” 作为世界顶尖级的数字专家,张骥站在一个历史的高度评价数字化技术。

事实上,对于压缩技术的深刻理解和挖掘,才是把握这个数字化时代的技术密钥。

张骥告诉记者,亿科三友的Intelligent Stream Advertiser由数学算法和视频食品处理组件构成,能在压缩的视频内容中无缝高效地个性化地插入个性化数字广告。这是对数字视频压缩技术充分利用的结果。

数字视频压缩过程是首先将电视信号转换成0和1的格式数字流,再运用不同算法处理数字流,将数据量大大压缩,并仍能表达等量的图像信息。其原理主要是1)、减少时域冗余信息;2)、减少空间域冗余信息。

对于减少时域冗余信息而言,视频信号具有高度的时域相关性,也就是说,从一幅图形投入乡到另一幅近邻图像,只有一小部分图像内容出现变化,通过不同编码方法消除图像间的冗余即相同部分,就可以大大减储存量和传递的带宽。

就减少空间域冗余信息而言,可应用于所有的图像压缩。在数字电视技术中的不同处在于,每一视频图像都被单独处理,压缩第一步是将图像取样转换为频域取样,然后用量化技术减少显示每个样本所需要的数量级,最后用熵代码,像五笔字型一样减少每个样本的字节数量。

事实上,视频压缩流程就是减少视频图像的时空冗余信息后,再用更有效的方式排列压缩过的视频序列。这个过程叫压缩过程或编码过程。而在客户端则进行反向操作,称为解压或解码。

张骥指出,压缩后的视频图像是一个结构化的完整表达,任何信息的缺失都会导致数字流的无法被正确解码。

那么,作为个性化的广告,作为跟踪不同消费者喜好而智能化提供其兴趣广告并给予评价和量化分析的数字电视广告将何以实现?

这就需要在一个技术高位来解决。亿科三友公司的视频粘接技术能将一个压缩的视频流和另一个压缩的视频流无缝对接,使数字视频的插入成为可能,

在亿科三友的解决方案中,编码视频在广告插入之前被预先处理和转换,将部分视频原有图像之间按去除时间参考数据的方式重新编码。张骥强调,这一流程应用于所有导入的视频节目内容,从而使数字广告可以随时插入,接收方能够正确解码。

从全球尤其和中国市场而言,2010年左右是数字电视产业大发阶段。所以,张骥将亿科三友的Intelligent Stream Advertiser定位于未来的一到三年,并重点布局在可重复设置的视频内容流分发网市场,这个市场必须支持所有的压缩格式,不同的性能和网络协议。张骥称,该技术以软件为主,符合国际标准,是基于非专用硬件的一款产品,并具有兼容性和可升级性。因此从成本和灵活性上远远领先于当前的硬件解决方案。例如,全球只有两家供应商能提供实时数字插播设备,且单频道价格就达1500美元。而亿科三友的解决方案只有不到1/4的成本。而且单位机架高度可提供的数码流量比现有解决方案高了5倍翻。

事实上,亿科三友真正的优势是对视频压缩算法及网络技术的深度理解。张骥等人具有成功而丰富的公司运作经验,在思科等公司进行过高层管理,创立的公司曾完成超值并购,且在美国成功上市。

所有这些,都在推动Intelligent Stream Advertiser成为数字电视广告业的颠覆性技术的这一事实。

在路上……

张骥常说自己是一个幸运儿。1977年恢复高考那年,他以优异的成绩考入清华大学电子系,后又被国家选送到美国留学,并于1989年获得美国普渡大学博士学位。直到1996年,张骥一直担任美国夏威夷大学和RPI大学电机系助理教授。

张的创业史是一个传奇故事,三次创业,三次成功。

1989年,张骥以创始人之一的身份成为美国数字视频领导企业Divicom公司的主要成员,负责视频编码和设备开发。虽然Divicom公司只有20多名员工,但是他们拥有世界先进的视频压缩技术,甚至到现在,很多电视台依然在采用他们当时研发的产品。后来,这家公司被其他公司收购。

1997年,张骥创办了V-Bits公司,担任技术总裁。公司的主要项目依然是视频压缩。在苦心经营下,两年后,美国思科公司看中了V-bits在视频电缆多路传输领域的技术能力,以1.2亿美元收购了V-bits,一时之间业界震动。随之,张出任思科的首席技术官。两年后,张骥离开了思科。因为,他喜欢做自己的事业。

2006年底,张骥并几位业内人士和周建会引入风险投资创立了亿科三友科技发展有限公司,专门从事数字媒体领域的前沿科技产品研发,。到数字时代的中流击水……

丙戌年临近春节,记者和张骥在清华见面。十分随意而轻松,隐隐有着一种路人生所积淀的厚重。也许,对于事业的把握能力使张的微笑发自心底,并充满魅力……

不过,张骥确实在一路前行,用千里马的速度……

我们姑且用亿科三友总经理宋翠萍女士经理的话来结束关于这位“千里马”的专访:“挫折对他来说可能都是小问题,就像小病痛对于一个强者没有打击力。他的成功并不是出自偶然和幸运。”

数字视频处理 篇6

LED视频显示屏由于亮度高、视角广、寿命长、性价比高,而且具有可与计算机同步显示各种文字、图形、图像,可实时播放电视、录像、影碟等视频信号,可即时输入、编辑各种多媒体数据等优点,使其在街头、广场、商业中心、运动场所、娱乐场所、控制中心许多公共场合得到了广泛的应用。但是由于技术的问题,特大视频显示屏还面临着严峻的挑战,主要表现在灰度级低,亮度损失严重,刷新速度低。另外,本文的视频信号源来自DVI(Digital Video Interface)接口,DVI接口输出的为数字视频信号,信息量大,一般是先经过外部RAM(Random Array Memory)缓存,然后由处理器对视频信号进行处理。可用于数字图像存储的外部存储器有很多种,如,和,它们的容量和速度各不相同。DRAM和SDRAM属于动态存储器,容量大,使用中需要刷新,当处理器没有外部动态RAM接口时,就需要设计刷新电路,这给系统应用带来不便;SRAM不用刷新,不需要专用接口,实时性好,并且可以进行跳地址寻址,所以本文利用SRAM作为外部缓存存储器。采用分场分区存储技术,使刷新频率大为提高,图像显示效果清晰稳定,实现了分辨率800×256,刷新频率90 Hz,红绿蓝三色256×256×256灰度级的视频显示系统。同时,采用该技术,亮度和灰度级方便可调,亮度损失小。

2 系统组成

LED视频显示系统总体框图如图1所示:该系统由发送和接收两部分组成,发送部分的功能主要是对DVI接口传输的视频信号进行编解码形成24 b真彩色视频数据和点时钟(CLK),行同步信号(HS),场同步信号(VS),数据有效信号(DE)等控制信号,通过LVDS(Low Voltage Differential Signaling)电平传输到接收卡上,经过接收卡的数据处理传送给具有特定驱动结构(1/8扫描方式,74HC595驱动芯片)的LED大屏。本文的重点是介绍接收卡的数据处理模块。

3 数据处理

数据处理流程如图2所示:接收卡接收发送卡传输过来的视频信号(控制信号和数据信号),将视频信号中的数据经过位面分离,分场存入外部缓存,然后分区读出,传送给显示驱动屏。其中位面分离模块将不同数据的同权位重新组合成新的数据存储在存储器中。外部缓存采用两个SRAM乒乓缓存的技术,实现数据的流水线处理。下面分别介绍位面分离模块和分场分区存储的原理和实现。

3.1 位面分离模块

视频显示屏采用的灰度级控制方式为分场叠加与占空比相结合的方式[1,2],如表1所示:其中分场叠加是指用不同场次的恒频扫描来实现不同灰度级,如表1的D7~D4;占空比控制是指控制点亮时间与关断时间的占空比来实现灰度的调节,如表1的D3~D0。而这两种方式的前提都是要实现视频数据的位面分离。位面分离用FPGA来实现,一共包括两大模块,数据移位寄存器和数据选择器。用VHDL实现的原理框图如图3所示,其中r0-7,g0-7,b0-7分别是真彩色图像数据的红绿蓝三色,分别占用一个字节。把这24位数据线分别通过一个8位宽数据移位寄存器寄存,然后通过一个颜色位选择器输出到外部缓存器中。通过控制缓存器的地址实现位面分离,外部缓存的数据宽度为24位,使RGB三种颜色并行进行位面分离。其中移位寄存器使用了流水线的技术,在锁存输出前8个数据的同权位的同时,移进第9个数据的同权位,这样提高了数据处理的效率。

3.2 分场分区存储

数据经过位面分离以后,不同数据的同权位[3]组成了新的数据,通过控制存储器的地址使一帧所有数据的同权位写在存储器的同一段中,因此对写地址发生器要求比较高。该系统要求级灰度,那么将存储器分成8个段,每个段存储代表同一个权值的位(场)。其中,8个段用3(23)根地址线来代替,分辨率为800*256的大屏有256行,800列,那么行地址用8(28)根地址线表示,这8根地址线前5位为区地址(32区),后3位为一个区的行地址(1/8扫描)。列地址用7(27)根地址线来表示,因为存储器为24位宽,一个存储单元代表LED显示屏8个RGB点的同权位,其优先级从高到底的顺序为:场地址>列地址>行地址。分别用计数器来实现,这三个计数器级联就构成了存储器的写地址,其连接方式为:场地址(A17~A15),区地址(A14~A10),区内行地址(A9~A7),列地址(A6~A0)。由此可见,通过改变存储器地址线的优先级可实现分场(8场)存储。

数据分8场写入存储器,读出时要求分19场读出,并且要控制每一场的显示时间。所以在产生读地址的场地址计数器的时候,先设计一个19进制的计数器counter19(0~18)。表2为counter19和场地址计数器的关系:每一场的显示时间是用比较器来实现的,可以通过改变比较器中的值灵活地校正灰度和亮度。

LED显示屏要求32区同时点亮,采用数据的并行处理,降低硬件消耗和系统工作频率。提高刷新频率。由于存储器每次只能读出一个数据,所以必须采用分区锁存,然后把32区数据并行输出。

行地址和列地址同写地址发生器原理相同,这里主要介绍一下它们的优先级。数据已经是位面分离的,所以要想实现32区数据同时显示,那么区地址的优先级应为最高,其次是列地址,然后是行地址,最后是场地址。与存储器连接方式同写地址一样。

4 仿真波形

位面分离模块的仿真波形如图4所示:其中RGB-din[23..16]为输入数据的高八位,rgb regroup output[23..16]为输出数据的高八位。flag为输入数据有效信号标志,flag delay85为输出有效信号的标志。

波形分析如下:

输入数据前8个数据的前面7个都为00h,第8个为02h,这8个数据进行位面分离后输出见表3,由表3可以看出位面分离实现了前8个数据转置后从右往左读出。

图5为写地址的仿真波形,可以看出,场地址优先级最高,当场地址为7h时,列地址加1,当列地址为63h时,行地址加1,当行地址为7h时,区地址加1。同理可以看出图6读地址的进位顺序为:区地址为1Fh时,列地址加1,列地址为63h时,行地址加1,行地址为7h时,场地址按19场原理进行计数。图6中行地址为7h时,场地址并没有加1。图7为场地址计数器控制的占空比信号。该信号接显示屏驱动板行扫描信号的使能端,通过控制扫描信号控制显示时间,从而实现灰度级。

5 结语

针对LED视频显示屏的系统遇到的刷新速度和灰度控制问题,本文提出了一种分场分区存储技术,详细地介绍了其原理和实现。通过波形仿真和工程应用,该方法很好地解决了LED显示控制系统中图像闪烁,亮度损失大的问题,并且其灰度和亮度控制可以灵活校正。

参考文献

[1]蔡林飞,高杨,刘佳,等.LED全彩大屏幕同步显示系统设计[J].电视技术,2007,31(3):31-33.

[2]蔡林飞.LED全彩大屏同步显示控制系统设计[D].绵阳:西南科技大学,2007.

数字视频处理 篇7

当今随着INTERNET及多媒体技术的高速, Web上或多媒体光盘中存在的大量生动逼真的数字化图形图像, 给电视节目制作人员带来了许多非常优美直观的信息源, 也使利用他人的灵感、作品来丰富电视节目的制作, 包装成为可能, 因而倍受人们的喜爱。但多数电视制作人员对种类繁多的机图形图像文件知之甚少, 本文将重点介绍数字图像处理研究的主要内容和一些常见常用的计算机图形图像文件格式以及获得高质量视频素材的方法。

1 数字图像处理研究的主要内容

图像获取和图像表现阶段主要是把模拟图像信号转化为计算机所能接受的数字形式, 以及把数字图像用所需要的形式显示出来。

图像复原当造成图像退化的原因已知时, 复原技术可用来进行图像的校正。复原技术是基于模型和数据的图像恢复, 其目的是消除退化的影响, 从而产生一个等价于理想成像系统所获得的图像。

图像增强当无法知道与图像退化有关的定量信息时, 可以使用图像增强技术较为主观地改善图像的质量。

图像分析对图像中的不同对象进行分割、特征提取和表示, 从而有利于计算机对图像进行分类、识别、理解或解释。

图像重建由图像的多个一维投影重建该图像, 可看成是特殊的图像复原技术。

图像编码和压缩对图像进行编码的主要目的是为了压缩数据, 便于存储和传输。

2 图形图像的存储格式

BMP文件:是Microsoft Windows所定义的图像文件格式, 最早应用在Microsoft公司的Microsoft Windows窗口系统。众所周知, Microsoft Windows现今已成为PC机环境下窗口系统的事实上的标准, 因而BMP图像文件格式也越来越受到人们关注, 在Windows环境中运行的图形图像软件都支持BMP图像格式。

GIF文件:GIF文件是“Graphics Interchange Format” (图形交换格式) 的缩写, 是由Compu Serve公司为了方便和BBS使用者传送图像数据而制定的一种图像文件格式。, GIF图像文件已经成为网络和BBS上图像传输的通用格式, 经常用于像动画、透明等特技制作。

TIF (TIFF) 文件:TIFF文件是“Tag Image File Format”的缩写, 是由Aldus公司与微软公司共同开发设计的图像文件格式。它的最大特点就是与计算机的结构、操作系统以及图形硬件系统无关, 它可以处理黑白、灰度、彩色图像。在存储真彩色图像时和BMP格式一样, 直接存储RGB三原色的浓度值而不使用彩色映像 (调色板) 。对于介质之间的交换, TIF可以称得上是位图格式的最佳选择之一。

PCX文件:PCX图像文件是由Zsoft公司在80年代初期设计的, 专用于存储该公司开发的PC Paintbrush绘图软件所生成的图像画面数据。目前PCX文件已成为PC机上较为流行的图像文件。对存储绘图类型的图像 (例如大面积非连续色调的图像) 合理而有效, 而对于扫描图像和视频图像, 其压缩方式可能是低效率的。

JPEG格式:JPEG格式一般用来显示照片和WWW以及在线服务的HTML (超文本标记语言) 文件, 它能保存RGB图象中的所有颜色信息。JPEG也是一种带压缩的文件格式, 但在压缩时文件有信息损失。当需要在INTERNET上发布新闻图片时, 一般以.jpg格式的图片上载, 不能太大, 一般为180*160像素, 以免文件过大。

TGA格式:是由Truevision公司为视频摄像机图像而设计, 用于帧捕捉的最主要的24位图像格式, 其典型的图象尺寸为400*512个像素, 每像素16、24或32位彩色。目前各电视台节目制作时叠加的台标和栏目标花多是以.tga图片文件引入字幕机的。在电视台节目的制作中, 制作人员有时也需要利用非线性编辑设备从录像带上抓取画面 (抓帧) , 然后将所抓画面用于印刷或上网发布新闻图片。这时抓帧所得的图像就是TGA文件格式, 可以利用Photo Shop进行格式转换。

3 Image J不同的运行版本

目前, 关于图像处理和分析的软件或者函数库, 很多采用的都是c和c语言, 对很多常见的图像处理函数都有现成的代码和成熟的工具。然而, 针对java这一面向对象程序设计语言, 却没有能很好地利用起来, 在这上面开展的工作也较少, 相关的工具也很少。Image J的出现在一定程度上改变了这一局面。Image J是目前世界上最快的纯java图像处理程序。它能在0.1秒内对一张2048x2048的图片进行过滤。Image J不同的版本可以在Windows, Mac OS, Mac OSX和Linux系统上运行。它能读入许多种图片格式, 包括TIFF, GIF, JPEG, BMP, DICOM和FITS。它支持“栈”, 也就是一系列的图片共用一个窗口。它还是多线程的, 所以像在处理读入图片这种费时的操作时, 还可以并行进行其他的操作。它提供一些标准的图像处理函数, 比如锐化、平滑、边缘检测和中值滤波等, 能对图片进行缩放、旋转和反转等。更重要的是, Image J采用了一种开放式的结构, 通过加入java语言的插件来完成它的扩展。这样, 使用Image J的内置编辑器和java编译器就能得到各种插件。这样的机制就使开发人员自己编写的插件能解决他所需要解决的任何图像处理和分析的问题。与之配合使用的macro语言, 也为Image J带来了更多的方便。

4 获得高质量视频素材的几种方法

采用序列帧的方式:这是最传统、最有效也是使用最广泛的一种方法。具体作法是在一些CG素材创作软件系统中完成制作工作后, 将CG素材输出成一系列大孝格式相同而以一组连续数字编号命名的图片, 为了能很好地在其它剪辑或合成软件中使用该素材, 一般采用支持Alpha通道的图片格式, 如tga、tif等。现在几乎所有的后期剪辑软件、合成软件及专业视频板卡系统都具有将序列帧转换成单一素材的功能, 由于输出时选用的一般是不压缩的图片格式, 因此就实现了素材的无损传递, 但其最大的缺陷是所得到的素材的数据量非常大。

采用带Alpha通道的AVI格式:普通的AVI格式的视频文件一般是不支持Alpha通道的, 因此这种方法一般是在CG素材创作软件系统中完成素材的制作后, 在视频硬件板卡的支持下将素材输出成压缩的、包含Alpha通道的AVI格式, 例如在Matrox Digi Suite LX板卡的支持下可以输出成MPEG-2IFrame格式。这种方式通常也能获得较好的视频质量, 因为有硬件板卡支持所以输出速度很快, 其数据量也不是很大。

采用无损压缩的方法:这种方法也能做到素材的无损传递, 通常是采用无损编码器将CG素材输出成Videofor Windows格式或Quicktime Movie格式。由于MOV格式可以很好的支持Alpha通道, 而没有板卡支持的AVI格式中无法包含Alpha通道, 板卡支持的AVI格式又都是有损压缩, 因此这种方法中AVI格式应用不是太多, 主要以输出成MOV格式为主。特别是随着最近新的、高水平的Quicktime无损编码器的出现, 很好的解决了序列帧数据量大而AVI对Alpha通道支持不好的问题, 成为一种在各软件系统之间无损传递素材的好方法。

摘要:数字图像处理即是计算机图像处理, 也就是说把图像信号转换成数字信号并利用计算机对其进行处理的过程。本文将重点介绍数字图像处理研究的主要内容和一些常见常用的计算机图形图像文件格式以及获得高质量视频素材的方法。

数字视频处理 篇8

1 PLD的结构与特点

数字逻辑器件主要包括标准产品(逻辑门、触发器、译码器等)、由软件配置的LSI器件(微处理器、单片机等)和专用集成电路ASIC。专用集成电路又分为全定制、半定制和可编辑逻辑器件——PLD。其基本结构是数据输入后,输入控制电路——“与”阵列——“或”阵列——输出控制电路,然后输出数据。PLD的分类有三种,按集成密度、制造工艺和不同阵列的可编辑性又进行了详细的分类。

1.1 EDA技术

EDA技术是指以计算机为工作平台,融合了应用电子技术、计算机技术、信息处理及智能化技术的最新成果,进行电子产品的自动设计。EDA工具在PLD技术中有重要的地位,EDA的核心是利用计算机完成电路设计的全程自动化。在中国,EDA软件开发的性能不强,通过不断的学习,未来可能会有更好的技术出现。

1.2 CPLD和FPGA

CPLD是指复杂可编程逻辑器件,规模大,结构复杂,属于大规模集成电路范围。是一种用户根据各自需要而自行构造逻辑功能的数字集成电路。CPLD器件是电子产品不可缺少的组成部分。FPGA是指现场可编程门阵列,它是作为专用集成电路领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

2 PLD技术的应用

随着科技的发展,我们生活的方方面面都会应用到集成电路,特别是智能手机的出现,大大增加了集成电路的需求量。传统的老式手机运行速度慢,存储量低,更新换代速度慢。现在的手机研发公司代表例如苹果、三星、步步高等牌子,占据了绝大部分中青年的生活领域,手机的更换速度加快,对集成电路芯片的数量要求增加,在保证数量的同时,更要保证质量。PLD作为集成电路的一种,适用于大批量的应用,更可以大批量的生产,降低经济成本。其具有可编辑、用户可配置性,在使用上更加灵活。应用PLD技术会带来更好的性能,降低功耗和成本等。

2.1 LED显示屏

LED显示屏是一种通过控制半导体发光二极管的显示方式,用来显示文字、图形、图像、动画、行情、视频、录像信号等各种信息的显示屏幕,广泛应用于车站、机场、商场、医院等其他公共场所。LED显示屏具有先进的数字化视频处理,亮度自动调节,影像画面清晰、无抖动和重影,杜绝失真。传统的驱动板电路不能迅速更新和储存信息,为了使视频的输出效果良好,选用Altera公司的PL D芯片ACEXIK30,利用硬件描述VHDL语言,对其内部逻辑功能进行设置,实现了驱动板的设计,显示板由驱动板改造而成,其控制逻辑会在ACEXLK30芯片中实现。

2.2 新产品或样机的开发

PLD具有在线可编程性。随着PLD技术的成熟,运用该技术对新产品或样机进行开发,使新产品的性能有所提高,功能更加完善,开发时间短,对经济的支出带来益处,为企业带来更大的利润,对市场的竞争起促进作用。

2.3 消费类电子产品中的应用

PLD器件的批量快速生产,使生产规模不断扩大,各种依靠PLD技术的企业也在不断壮大,高超技术和低廉价格的完美搭配,使消费类的电子产品数量增加,如DVD、TV、游戏机、空调等。运用在线可编辑性,在不改变线路板的前提下,只需改变程序,就能使产品功能增加或完善。

3 应用实例

3.1 输入奇偶校验电路

奇偶检验电路有奇、偶校验两个输出标志,可用作发送端的奇偶检验位发生器;也可用作接收端的奇偶校验器,产生奇偶检验和。运用FPGA器件,使复杂的逻辑变得简单,从而方便实现奇偶的校验。

3.2 三态缓冲器

三态缓冲器又称为三态门、三态驱动器。为了减少信息传输线的数目,大多数计算机都采用总线传输的方式。即同一类的信息都走同一组传输线,且信息是分时传输的。运用FPGA器件的总线,将信号放置总线上,三态缓冲器打开,将驱动信号传递至总线。

4 结语

PLD器件经历了漫长的发展过程,从PROM、PLA、PAL、GAL、EPLD、CPLD、FPGA直到现在的PLD技术,不仅在结构、工艺上发生了改变,也在功能、速度、灵活性等性能上做出了进步和完善。目前,大规模的可编程器件可以用来设计更为复杂的集成电路。

PLD技术是未来具有发展力的一项技术,PLD依靠电子计算机,在EDA工具软件平台上完成逻辑编译等功能。LED显示屏的大量应用,有利于PLD器件的发展,为数字视频的未来起铺垫作用。PLD技术在20世纪90年代以后的飞速发展,同时推动了EDA软件和硬件描述语言的进步。

参考文献

[1]刘雯,马晓辉,刘武.中国大陆集成电路产业发展态势与建议[J].中国软科学,2015,11:186-192.

[2]蒲灵巧.基于单片机的旋转LED显示屏控制系统的设计与实现[D].电子科技大学,2014.

数字视频基础简介 篇9

在传统教学过程中, 通过电视机播放的教学视频几乎都是模拟信号, 是通过摄像机的光敏元件将光信号转化为电信号储存在录像带上, 然后通过播放器和电视机, 把电信号还原成视觉信息。数字信号是使用A/D转换器将模拟信号其数字化, 呈现在数字媒体上。一般来说, 直接将模拟信号数字化后的视频是无法或者不建议直接使用的, 因为视频信号数字化后的数据量很大, 非常占用磁盘空间, 给视频的使用带来储存和传播的障碍, 效率较低, 所以必须要对视频进行压缩。

2 数字视频的压缩与文件格式

2.1 MPEG与H.264

MPEG (Moving Pictures Experts Group) 是动态图像专家组的英文缩写, 是在ISO/IEC (国际标准化组织/国际电工委员会) 联合指导下成立的, 专门负责为CD建立视频和音频标准。MPEG是一个标准系列, 包括MPEG-1、MPEG-2、MPEG-4。MPEG-1压缩后的码率为1.5Mb/s, 主要用于VCD的制作。MPEG-1中最著名的第三代音频协议被称为MPEG-1 Layer 3, 简称MP3, 成为广泛使用的音频压缩技术。MPEG-2制定于1994年, 压缩后的速率有多种, 应用较为广泛的是DVD制作, 速率为5~15Mb/s。MPEG-4第一版在1998年10月通过, 第二版在1999年12月通过。本标准制定了较低的传输速率情况下, 获得较高的画面质量。压缩后的码率最低可达64Kb/s, 为网络传输视频提供了强大的基础, 因此主要用于虚拟现实、远程教育、网络直播家庭摄像等。

H.26x系列数字视频编码标准是由国际电信联盟 (ITU) 提出的, 其制定的标准有H.261、H.263、H.263+等。目前使用最广泛的H.264标准是国际电信联盟 (ITU) 联合国际标准化组织 (ISO) 共同提出的, 是在MPEG-4技术基础上, 发展的新一代数字视频压缩格式。H.264最大的优势是具有很高的数据压缩比, 在同等画质下, H.264的压缩比是MPEG-2的2倍, 是MPEG-4的1.5倍, 在同等网络带宽情况下, 可以传输更高质量的视频。因此, 目前网络视频资源普遍都是使用H.264进行压缩。

2.2 常见的文件格式简介

我们在使用数字视频的时候, 通常会发现视频有多种封装格式, 每个封装格式都有其特点, 在不同的使用环境, 可选择不同的封装格式。

AVI格式是由微软、INTEL、IBM公司联合发布的用于windows的视频技术规范。本规范未限定压缩标准, 也就是说可以使用多种压缩算法生成AVI文件, 也必须使用相同的解压缩算法才能播放, 兼容性较差, 并且是采用软件辅助压缩的视频技术。视频文件比较大, 不利于储存和传播。但是其视频画面质量好, 通常对视频原始素材进行封装。

MP4文件格式是基于Quick Time容器格式定义的, 是一个十分开放的容器, MP4文件中的媒体描述与媒体数据是分开的, 并且媒体数据的组织也很自由, 不一定要按照时间顺序排列, 甚至媒体数据可以直接引用其他文件。同时也支持流媒体。因此, MP4封装格式目前被广泛应用, 也是封装高清H.264视频和AAC音频典型格式。

MOV是美国苹果公司开发的基于MAC计算机的视频技术, 如果要在PC机上播放, 需要安装播放插件;RM/RMVB是REAL公司推出的视频压缩技术, 可以把庞大的AVI格式文件压缩到原来的几十分之一, 但是画面质量也较差, 由于其文件较小, 占用较少的网络带宽, 曾被广泛的应用到网络视频;ASF是微软公司开发的流媒体格式文件, 使用的是MPEG-4压缩技术, 具有高压缩比和高质量, 被广泛的应用。

3 视频制作常用工具简介

在制作视频资源过程中, 通常会经历素材获取, 素材编辑, 生成成片三个环节。

视频的原始素材大多数是通过拍摄设备和软件制作而成。专业数字摄像机, 单反相机, 手机等都可以获取拍摄的素材。使用屏幕录制软件可以获取计算机操作过程的素材资源。屏幕录制软件Camtasia Studio由于操作简单, 功能强大, 性能较好, 使用较为广泛。使用二维动画, 三维动画软件可以制作动画素材。制作二维动画软件比较多, 常用有Adobe Flash, Anime Studio。制作三维动画的软件一般使用3d MAX, Maya。

原始素材一般都需要经过编辑处理成为需要的视频资源。专业的视频剪辑软件有Windows Movie Maker, Adobe Premiere, EDIUS等, 面向低端的有会声会影, Pinnacle Studio等, 做视频特效的软件有After Effect。根据不同的素材和差异化的需求, 选择不同的工具进行组合完成。

通过对元素素材的编辑过后, 需要生成成片。这个过程一般分为两个步骤:首先生成没有压缩, 或者高数据流压缩的成片, 作为母片, 然后再根据视频的需要, 将母片压缩成为需要的格式的成片。这个压缩过程可以通过编辑软件完成, 也可以使用格式工厂等转换软件完成。

4 视频资源的使用

教学视频一般都是上传至网络学习平台或者视频服务平台。免费的学习平台可以使用moodle平台, 功能强大, 操作简单。视频服务平台免费的可以使用优酷视频, 但是视频内容会被投放广告。

总的来说, 数字视频已经逐步深入到普通教师的教学过程中, 希望通过以上的介绍使普通教师能够了解数字视频技术, 熟悉数字视频的制作过程以及制作技能, 能够合理的使用数字视频, 为自己的教学工作带来更多的生机和活力。

参考文献

[1]侯自强.数字视频技术进展[N].中国图像图形学报, 1996 (01) :58-59.

数字视频化安防监控系统构建浅论 篇10

关键词:数字视频化 安防监控系统 设计方案

中图分类号:TU7 文献标识码:A 文章编号:1674-098X(2011)03(c)-0096-01

数字视频化安防监控系统作为计量管理的一个重要手段,越来越为人们所重视,并且随着企业信息化应用水平的不断提高,制定企业信息化的总体设想,建立一套以生产指挥为核心的系统,把分散的、自成体系的监控系统进行集中管理和监控已经成为一种趋势。

1 数字化视频安防监控系统基本要求

数字化视频安防监控系统的要求是: (1)能对主要对象进行视频探测的画面再现、图像的有效监视和记录,对重要部分和设施的特殊部位应能进行长时间录像,并设置视频报警装置。(2)系统的画面显示应能任意编程、手动与自动切换,画面显示摄像机的编号、部位、地址和时间。(3)应能自成网络,可独立运行;应能与周界入侵报警系统、人员出入口管理等部分进行系统联动。当报警发生时,能自动对报警现场的图像和声音进行复核,能将现场图像自动切换到指定监视器上显示并自动录像。

2 数字视频安防监控系统组成

摄像系统、传输系統、录像控制与显示系统构成了数字视频安防监控系统的三部分。

2.1 摄像系统

该系统主要包括摄像机、镜头、防护罩、支架和电动云台。它的任务是对被摄体进行摄像,并把摄得的光信号转换成电信号。数字视频安防监控系统主要用黑白摄像机视。但是,如果所摄场所有颜色需求则应选择彩色摄像机。

2.2 传输系统

该系统包括同轴视频线缆、局域网线缆、公共通讯线缆等。视频信号的传输一般采用屏蔽铜线被覆率不小于90%、中间无接点的专业视频电缆SYV75-5。为了保证终端显示的清晰度和画面质量,系统需要具有较好的抗干扰性和匹配性。该系统的作用是把现场摄像机取得的电信号传送给硬盘录像主机或将主机信息传输给网络用户。

2.3 录像控制与显示系统

该系统的任务是实现对前端传来的图像信号进行储存、显示、回放、控制以及远程传输等的处理,包括安放在控制端DVR主机、分控主机、监控中心管理主机、数字矩阵主机及电视墙、显示器等。

3 系统的硬件设计

硬件设备主要包括DVR主机、分控主机、监控中心管理主机、数字矩阵主机、中转主机及电视墙、显示器等。

3.1 DVR主机的设计

DVR主机就是在计算机中插入视频采集压缩卡,然后在此基础上开发上层监控软件。DVR主机多用工业控制计算机作为主机。选用工控机箱,主板采用技嘉848PE,电源为工控电源400W,内存为Kingston DDR 256M,音视频采集压缩选用海康或者金鹏,显卡是GF4MX4000 64M,CPU采用P42.4G,采用松下软驱,硬盘扩展卡用Promise。

3.2 分控主机的设计

分控主机只需要开发并且对分控端的软件进行安装,它只需要对任何一台普通的PC机安装分控端软件。同一台分控主机连接远端的一台DVR主机,而同一台分控端可以同时与不同的DVR主机连接,有支持动态IP地址功能,具有网络回放功能,远程画面调节功能和远程云台镜头控制功能等。

3.3 管理主机设计

监控中心管理主机无需加插额外板卡,只需开发并安装监控中心管理软件,用对网络内的DVR主机进行统一的集中管理。选用工控机箱,主板采用技嘉848PE,电源为工控电源400W,内存为Kingston DDR 256M,显卡是GF4MX4000 64M,CPU采用P42.4G,采用松下软驱,硬盘扩展卡用Promise,硬盘为迈拓80G以上,集成声卡网卡。

3.4 数字矩阵主机的设计

数字矩阵主机就是在计算机中插入音视频解码卡,然后在此基础上开发数字矩阵软件,将网络内的DVR主机发送过来的多路数字视频信号还原成模拟视频信号,从而可以直接连到电视墙上。选用工控机箱,主板采用技嘉848PE,电源为工控电源400W,内存为Kingston DDR 256M,显卡是GF4MX4000 64M,采用松下软驱,硬盘扩展卡用Promise,硬盘为迈拓80G以上,集成声卡网卡,海康DS-4004D音视频解码卡。其功能特点如下:一点对多点;支持动态IP地址自动解析;实时监看功能;实时监听功能;网络回放功能;图片抓拍及浏览功能;远程画面调节功能;报警图像上传电视墙功能等。

3.5 其它硬件的设计

主要准备摄像机,镜头,云台等视频输入设备。麦克风,拾音器,音箱等声音输入输出设备。报警传感器,报警控制器,报警输出设备,报警主机等。编解码器,视频切换矩阵,音频切换矩阵等。HUB,SWITCH,路由器,网络线等网络设备。其他上网设备,如ISDN适配器或调制解调器等。

4 数字视频化安防监控系统软件设计

4.1 操作系统和平台

采用Microsoft Windows2000系列操作系统,开发平台为Microsoft Visual C++6.0 English Version,设计平台为Rose2002,项目管理平台为Project 2002,文档编写平台为Office 2000,网络平台为LAN、PSTN、ISDN、ADSL、DDN和INTERNET等多种带宽的通用或专用网络平台,支持TCP/IP协议。

4.2 数字监控软件的设计

数字监控软件是整个系统的数据处理中心,负责采集处理来自前端设备的各种音视频及报警信息以及监听来自客户端的各种通信请求,并根据客户端的请求发布相关信息,实现音视频信息在网络中的传输。

4.3 网络分控软件的设计

网络分控软件也叫客户端软件,负责向服务器/主机端软件发送各种请求并负责对服务器端软件的响应作出相应处理,从而实现对服务器/主机端的视频图像的实时监看、网络回放、云台控制等功能。

5 结语

数字视频监控系统实现了监控信息的远程集中控制,增强了各系统的数据互访及系统整合能力,减少了就地监控人员,减少了各子系统单独设计造成的资源浪费。在现代化的冶金、电力等企业,通过网络一体化的数据监控平台,生产与或管理人员都可及时、全面地了解现场各计量系统情况,综合考虑各方面因素,进行决策。

参考文献

[1]吕潇超,侯增选.基于C/S结构的构的数字视频监控软件系统[J].科学技术与工程,2007,7.

[2]刘富强.数字视频监控系统开发及应用[M].北京:机械工业出版社,2003.

数字视频监控系统设计 篇11

1 设计原则

1.1 先进性与适用性

数字视频监控系统的设计思想符合视频监控的发展潮流, 该系统的技术性能和指标达到国际水平;以先进的视频监控技术进行组网, 支持视频数据的实时传输及多路监控。另外数字视频监控系统容易安装、使用方便, 适合于各种层次的管理层使用, 学校保安室的工作人员不用经过专门的培训就可以直接使用, 符合学校的特点。

1.2 经济性与实用性

充分考虑学校的治安情况, 在该数字视频监控系统的功能和性能满足学校安防的实际需要前提下, 充分利用学校现有的网络、设备资源来组建该系统, 实现最佳的性价比, 大大节约了建设该数字视频监控系统的成本。

1.3 可靠性与安全性

数字视频监控系统支持管理员和用户的二级权限管理, 管理员利用管理服务器对数字视频监控系统中的所有成员进行集中式管理;每一个成员加入或退出监控系统必须通过组管理服务器进行认证或登记。该系统的可靠性较高, 在系统发生故障造成中断时, 视频图像数据能够准确、完整的保存下来, 并且在较短的时间内迅速恢复它的监控功能。

1.4 灵活性

学校的校园面积和师生人数在不断的变化, 需要组建更加灵活的数字视频监控系统来满足它的安防需要。该数字视频监控系统在设计中充分考虑到以后的技术发展和使用的需要, 具有扩充和升级的功能, 它的前端连接网络摄像机, 无论将来增加多少个摄像机都不影响系统的正常运行, 只要将摄像机连接到网络就可以形成系统, 当系统变大时, 只需要升级服务器软件和增加网络储存硬盘就可以实现。

2 系统设计

2.1 总体架构

该数字视频监控系统以学校的保卫室为监控中心, 系统采用全数字化监控结构。以视频监控专用网络为资源, 作为监控信息的传送和管理平台。前端网络摄像机直接接入专用交换机, 后端采用视频管理器进行录像存储及视频网络流媒体转发, 交换机之间采用光纤直联。将分散在学校中的各个监控点网络联接起来, 并且利用多媒体服务器、管理服务器、交换机等设备对监控单元所提供的视频进行管理, 对校园监控环境进行跟踪监视。系统联网架构如下图1。

系统的建设必须是IP网络、视频处理、图像存储及业务软件等一系列技术及产品的有机整合。它的具体组成应具备如下几部分:

2.1.1 视频处理部分

网络摄像机是指以公开方式安装在现场的摄像系统, 完成视频信号的获取及输入功能, 包括各种固定摄像机、半球摄像机、高速智能球机等前端摄像器材设备, 全部采用高清 (HD) 网络型设备。它是整个系统的眼睛, 网络摄像机把监视的内容转化为图像信号, 并传送到控制中心的显示器上。它的好坏以及产生的图像信号将影响整个系统的质量, 因此, 网络摄像机的指标应高于整个系统的指标, 该部分的选择是决定整个系统图像清晰稳定的关键。

2.1.2 监控管理及控制部分

视频监控中心是整个安全防范的神经中枢和心脏, 承担着整个系统的动态图像及监督、显示、记录、调度等任务。这部分完成对所有监控设备、业务的管理及控制, 包括了视频管理器、数据管理器等组件。其中视频管理器是系统的管理中心和控制中心, 视频管理器的授权用户可以在任意一台PC管理终端上完成对全网的设备管理、资源调度、云台控制和解码输出控制, 所有的控制指令由视频管理器集中处理和发送。通过视频管理器, 可以很容易地实现对系统所有视频的集中管理。

2.1.3 网络承载、交换、及传输部分

完成视频流的传送及交换功能。构建的网络可同时具备传输和交换的功能, 可实现视频流的无阻塞交换, 确保图像的清晰度和实时性, 并具备高度的安全性、天然的可扩展能力和灵活性。

2.1.4 软件系统

由于数字视频监控系统对远端设备的稳定性和实时性要求很高, 这就决定了普通的操作系统没有办法满足它的工作要求, 选择一款合适的操作系统能缩短开发周期, 系统也更加稳定, 还会大大降低系统的开发成本。本系统选择的嵌入式操作系统软件Clinux, Clinux是专门为无MMU微处理器使用的嵌入式Clinux操作系统, 由linux2.0内核发展而来。由于大多数内核的二进制代码和源代码都被重写, 进一步缩减了Clinux内核的代码, Clinux内核比Linux2.0原内核小得多, 支持多任务, 并保留了linux的主要优点:稳定性、优异的网络能力以及优秀的文件系统支持。

2.2 硬件设备

数字化视频监控系统硬件主要设备: (1) 解码器; (2) 流媒体服务器; (3) 管理服务器; (4) 网络存储; (5) 路由器; (6) 液晶显示器。系统的控制中心, 通过视频编码器、PCI总线等接口完成监控数据的采集与存储、报警和网络分控功能。

3 结语

把先进的计算机网络技术、流媒体技术等应用于视频监控系统中, 实现了视频监控的数字化、网络化, 改变了传统的工作模式, 给监控系统带来了改革。本系统所设计和实现的核心模块具有较高的视频处理速度, 控制管理模块使系统具有多会话的功能。数字视频监控系统的实施将为学校的安全防范工作做到人防、技防、物防的全面化管理, 使学校的财产和人身安全得到了足够的保障, 为学校的管理带来了便利, 为新世纪的校园安防管理提供了良好的保障。

参考文献

[1]张宗平, 张咏.网络数字视频监控系统设计与实现[J].甘肃科技, 2007, 23 (9) :24-26

[2]孟凡蕊.数字视频监控系统的设计与实现[J].中国有线电视, 2003 (21) :52-55

[3]宋智.基于流媒体的网络视频监控系统的研究与实现[J].现代电子技术, 2006, 29 (8) :66-67

上一篇:制动踏板感觉下一篇:脑瘫防治