视频录像

2024-11-06

视频录像(精选12篇)

视频录像 篇1

随着视频压缩技术的迅猛发展, 新的视频压缩标准不断推出。MPEG-4是由国际运动图像专家组 (MPEG) 在继MPEG-1和MPEG-2之后, 制订的又一个ISO/IEC标准, 即ISO/IEC 14496。它能够获得更高的音/视频压缩率, 具有基于内容的交互能力。目前, 国内外许多公司都在开发有关MPEG-4视频标准的产品, 最具代表意义的即是数字视频录像机 (DVR) 。

1 数字视频录像机的硬件设计

在基于S3C2410与AT2042的数字视频录像机的设计和实现中, 其终端设备以Samsung公司的32位处理器S3C2410为主控处理器, 利用Pentamicro公司的AT2042芯片完成双通道视频编码与解码, 其视频录像功能具有高分辨率和高质量。本文将介绍此终端的系统整体设计, 并详细分析系统软硬件设计, 最后给出测试结果和结论。根据市场的需求, 本系统预计实现下列几项指标:

(1) 实现对视频数据的MPEG-4标准的编解码;

(2) 编解码像素为720X576像素点, 实现25 f/s;

(3) 实现JPEG编码和解码;

(4) 实现USB/SD卡储存。

1.1 基于S3C2410与AT2042的数字视频录像机整体设计

该系统主要依靠AT2042的编解码功能, 系统的硬件框图如图1所示, 它主要由视频编码子系统、主控系统、数据处理子系统和视频解码子系统4大部分构成。

韩国Pentamicro公司生产的AT2042芯片的功能模块如图2所示, AT2042 是一个内置微控制器ARM946E 的2 通道音视频编解码 (A/VCODEC) 芯片, 主要完成对视频和语音数据的编码和解码, 支持多种音视频编解码标准, 可直接与IBM, Motorola, ARM, Xscale 和Axis 等多种CPU接口, 无需其他附加电路。

1.2 视频编解码电路设计

视频编解码电路主要包括视频编解码电路和视频压缩/解压芯片AT2042。其中, AT2042 主要负责对数字视频数据进行硬件压缩和解压缩, 而视频编解码电路则是基带模拟视频信号和AT2042 之间的一个接口电路, 它包括一个视频编码芯片和一个视频解码芯片, 主要负责视频数据的模/数和数/模转换, 以及数字视频信号格式的转换。在压缩编码过程中, 输入的NTSC/PAL/SECAM视频信号先经过视频解码芯片进行前端处理, 产生符合AT2042 视频接口标准的8 b ITU-R BT.656数字视频信号。在外部主CPU 的控制下, 该数字视频数据由压缩/解压芯片AT2042 进行硬件压缩编码, 产生的编码数据流通过芯片内部集成的Mux FIFO 接口输出。网络视频服务器的解压缩编码是压缩编码的逆过程, 需要解压的数据流通过AT2042内部集成的Demux FIFO 接口输入。视频采集接口框图如图3所示:

摄像头采集输出信号为NTSC, PAL或SECAM制式的电视信号, 必须经过视频解码处理才能转化成适合AT2042进行编码的数字信号。TVP5150是TI公司生产的一款电视信号解码专用芯片, 它对输入的模拟信号进行A/D转化, 通过设置相应的寄存器可以使输出信号满足RGB格式或YUV422格式。由于在本系统中AT2042视频接口满足ITU.RBT656标准, 故TVP5150输出配置为8位YUV422格式。如图4所示。

现在的数字电视视频接口还没有实现统一的工业标准, 故在视频输出端设计时, 仍使用现在比较流行的A/V接口或S-video接口。由于上述2种接口传输的为模拟电视信号, 故在AT2042的视频输出端口需要增加一级处理, 即将数字信号转化为模拟电视信号。在后端设计中选用SAA7121, 它是一款专用的电视信号编码芯片, 可以将输入的数字信号经过内部的D/A转化为适于传输的模拟电视信号, 通过配置相应的寄存器可以输出满足S-video接口或复用接口的信号。

1.3 AT2042的主机接口

主控CPU (S3C2410) 和AT2042 是数字视频录像机的核心处理芯片, S3C2410 控制整个数字视频录像机系统的运行, AT2042 除完成对视频信号的硬件压缩编码外, 还可对压缩后的视频数据进行硬件解压缩。AT2042 压缩编码后的视频数据通过芯片内部集成的Mux FIFO接口输出后, 外部主CPU 负责对其进行USB存储器处理, 处理后的视频数据可以存储在物理介质上, 以便在需要时通过键盘操作进行回放。

图5为S3C2410与AT2042接口框图。

AT2042的CPU_SEL[2:0]是主控CPU选择引脚, 经配置这几个引脚的高低电平, 使AT2042可选择主控CPU, CPU_SEL[2:0]为010选择ARM结构芯片;

nCS, nWAIT等为总线控制信号线;

HCLK是AT2042主机接口的工作时钟, 一般要求工作在50 MHz, 当S3C2410 在复位后设置FCLK为200 MHz, HCLK为100 MHz, PCLK为50 MHz。故将S3C2410的PCLK引脚与AT2042的HCLK引脚相连。

通过这种机制, S3C2410可以实现简单的访问AT2042。

AT2042 与CPU的通信机制如图6所示, CPU对AT2042的控制和访问主要通过AT2042的2个寄存器 (status register和command register) 和4个FIFO (Tx FIFO, Rx FIFO, Multiplex FIFO和De-Multiplex FIFO) 完成。

2 数字视频录像机的软件实现

数字视频录像机系统的软件设计包括:Bootload 代码的编写、Linux 操作系统的内核生成和Linux下驱动程序和应用程序的开发、文件系统的生成和配置以及用户应用程序4大块。

数字视频录像机软件开发的整体架构如图7所示。

2.1 系统启动Bootloader程序设计编写

Bootloader是系统启动时执行的第一个程序, 其主要完成对硬件系统的初始化。具体包括:S3C2410的初始化、TVP5150功能配置、SAA7121功能配置、加载AT2042固件、以太网及串口初始化。由于在开机时要显示开机画面, 故除在Bootloader中初始化相应硬件资源外, 还应将开机画面的图片数据, 传送到AT2042 SDRAM中。Bootloader整体流程图如图8所示。

显示开机画面, 其主要通过AT2042的JPEG解码功能来实现。首先配置AT2042的JPEG解码功能, 将要显示图像先以头文件的形式添加到程序中, 当需要显示时再将图像数据发送给AT2042。

2.2 Linux系统的配置及设备驱动程序的编写

本系统使用的是Linux2.4.18内核, 在内核配置中需增加以下几个内容:由于本系统中要实现对视频编码数据的存储, 故要添加内核配置中USB support选项中的USB Mass storage support;在调试时需要通过以太网来烧些程序, 故内核配置时需添加LAN91C111网卡驱动, 方法为在NetWork device support选项下选择SMC91111 support, 同时内核要支持各种文件系统, 需在File system选项下进行相应配置。

系设备驱动程序主要完成以下的功能:

AT2042 设备驱动子模块系统调用是操作系统内核和上层应用程序之间的接口, AT2042 设备驱动子模块是操作系统内核和AT2042 硬件设备之间的接口。操作系统内核向AT2042设备驱动子模块提供内核API 和其他的内核支持。AT2042 设备驱动子模块为上层应用程序屏蔽了AT2042硬件的细节, 这样在应用程序看来, AT2042 硬件设备只是一个设备文件, 应用程序可以像操作普通文件一样对AT2042 硬件设备进行操作。AT2042 设备驱动子模块作为系统内核的一部分, 主要完成对AT2042 的初始化、编解码数据的读写、以及编解码功能参数的设置。包含的功能函数主要有模块入口函数、设备操作函数集合和中断服务程序等。

2.3 数字视频录像机应用软件的设计与实现

(1) 界面显示与菜单功能的设计与实现。

界面和菜单的显示是通过AT2042的OSD (on Screen Display) 功能来实现的, AT2042共有3个显示层面, 分别为底层是背景层、中间是回放层, 顶层是OSD层。

OSD层支持16色的调色板。由于AT2042自身没有相应的ROM存储OSD所要显示的图片及文字数据, 故在利用OSD功能来显示图片或文字时, 首先要将需显示的图片或文字数据加载到AT2042的SDRAM中, 然后调用显示功能将图片或文字显示在OSD层上。

这个功能的实现过程中主要调用以下2个函数:

void at2042_load_font (uns8 *font_data, uns32 font_data_size) 该函数的主要功能是把要显示的数据加载到AT2042的SDRAM中, 同时设置显示位置, 即垂直、水平像素点的位置。

void osd_on_off (uns8 temp) 该函数的功能是打开或关闭OSD模式。

(2) MPEG-4视频编码实现。

该功能主要利用AT2042来实现。首先, 配置相应的编码寄存器, 例如编码模式、编码像素点、编码帧率及设置编码流格式 (PES, PS, TS) 等。本系统中采用MPEG-4模式、720X576、每秒25帧及生成PES流来对视频数据进行编码。

AT2042视频编码的流程如图9所示。

实现这一功能主要通过对以下几个函数的调用:

void set_encoder_parameter (uns16 hsize, uns16 vsize, uns8 rate, uns8 mode) 该函数用来设置编码参数;

void video_encoder_start (uns8 mode) 该函数用来启动AT2042的编码功能;

void video_encoder_stop (uns8 mode) 该函数用来关闭AT2042的编码功能;

void encoding_stream_read (uns8 *data, uns32 data_size) 该函数实现将编码数据从MuxFIFO中读出。

(3) 解码功能实现。实现的具体流程如图10所示。

实现这些功能主要通过对以下几个函数的调用:

void set_decoder_parameter (uns16 hsize, uns16 vsize, uns8 rate, uns8 mode) 该函数用来设置解码参数;

void video_decoder_start (uns8 mode) 该函数用来启动AT2042的解码功能;

void video_decoder_stop (uns8 mode) 该函数用来关闭AT2042的解码功能;

void get_file_length (const char *file_name) 该函数用来获取文件的长度;

void video_replay (const char*file_name, uns8 mode) 该函主要实现对视频文件的播放控制, mode控制播放模式 (暂停、快进、快退) 。

3 测试结果

实验结果进行测试, 可以采用2套方案来完成。

(1) 使用自行设计的硬件平台, 在该平台上完成对视频编解码的测试。

图11为在本系统平台上对编码数据的解码播放截图。

(2)

将编码后的视频文件拷贝到PC机上, 应用Media Player、暴风音影和风雷音影等视频播放软件对编码结果进行测试, 同时可以对比解码播放的效果。

因为本系统中视频文件是以PES流形式保存到储存介质, PES满足ISO13818标准, 所以PC平台上的普通视频播放器都能播放该文件。图12是用风雷音影播放器对编码结果进行解码播放的截图。

由图可以看出, 解码出的视频文件是720X576像素点, 解码播放的速率为25.59 f/s。画面没有出现失真现象, 没有明显的块效应。由表1中的数据可得, 在使用AT2042对静止图像编码时, 可实现接近100∶1的压缩比, 在对动态画面进行编码时, 可以实现40∶1的压缩比。

4 结 语

本文详细介绍基于专用视频编解码芯片AT2042的数字视频录像机系统的硬件设计和软件开发流程。该系统已实现对视频数据的编码和解码, 同时实现了MPEG-4/MPEG-2/MPEG-1 H.263视频标准, 并已作为成型产品推向市场。

参考文献

[1]王学龙.嵌入式Linux系统设计与应用[M].北京:清华大学出版社, 2001.

[2]周立功.ARM嵌入式Linux系统构建与驱动开发范例[M].北京:北京航空航天大学出版社, 2006.

[3]Pentamicro.AT204x_DataSheet_v20 (Eng) [EB/OL].www.pentamicro.com.

[4]李严.基于ARM7TDMI和μClinux的嵌入式MPEG4网络视频终端及服务器[D].浙江:浙江大学, 2006.

[5]王卉, 吴庆洪.MPEG-4嵌入式视频解码系统的研究与实现[J].现代电子技术, 2007, 30 (18) :149-151, 155.

[6]于雪莲, 陈钱.基于MPEG-4网络视频服务器的研制[J].现代电子技术, 2007, 30 (16) :122-123, 127.

视频录像 篇2

01:47 幼儿园小班舞蹈

辽阳市久久艺术幼儿园2010年毕业文艺汇演 用户: 郭朱朱

发布: 2年前

播放: 58,535

05:31

幼儿园小班舞蹈

用户: wjxxx 发布: 1年前

播放: 7,037

04:32 幼儿园小班舞蹈

用户: 正义刀客

发布: 26天前

播放: 7

04:16

红枫叶幼儿园小班舞蹈视频

可爱极了!用户: beiqinghua 发布: 1年前

播放: 2,851

01:00

城东幼儿园小班舞蹈

城东幼儿园小班舞蹈表演 用户: 城东幼儿园

发布: 1年前

播放: 1,338

08:54

桂竹幼儿园小班舞蹈

桂竹幼儿园十年园庆暨6.1儿童节小班舞蹈 用户: 幼儿园管家

发布: 6月前

播放: 389

02:11 小班舞蹈课

棒棒糖艺术幼儿园 用户: 棒棒糖幼儿园

发布: 1年前

播放: 1,122

01:28 小小班舞蹈

广州市荔湾区龙湾幼儿园是一所一美术教学为特色,注重培养孩子热

用户: 龙湾幼儿园

发布: 5月前

播放: 309

04:37

幼儿园小班舞蹈 《我上幼儿园》

用户: 天方幼儿园

发布: 3年前

播放: 550,696

01:57

舞蹈幼儿园早操 幼儿舞蹈 幼儿舞蹈视频大全

快乐宝贝 用户: relyn 发布: 2月前

播放: 8,687

02:02

幼儿园小班舞蹈三只小熊

2011年庆六一班级节目 用户: 三丫幼儿园

发布: 1年前

播放: 146,464

01:56

三鑫幼儿园小班舞蹈oh my bady 三鑫幼儿园小班舞蹈oh my bady 用户: 一天天的爱

发布: 1年前

播放: 66,005 03:37

三鑫幼儿园小班舞蹈日不落

三鑫幼儿园小班舞蹈日不落 用户: 一天天的爱

发布: 1年前

播放: 63,004

02:45

我爱洗澡-喜洋洋幼儿园小班舞蹈

用户: 落单糖霜

发布: 1年前

播放: 38,576

02:19

涧里幼儿园小班舞蹈-我是小宝贝 用户: 我是少伟

发布: 4月前

播放: 6,077

03:32

瑞洪启蒙幼儿园小班舞蹈不怕不怕

幼儿舞蹈

用户: 瑞洪启蒙幼儿园

发布: 6月前

播放: 24,943

02:03

瑞洪启蒙幼儿园小班舞蹈别偷我的菜

幼儿舞蹈

用户: 瑞洪启蒙幼儿园

发布: 6月前

播放: 6,354

02:13

岑溪市天才教育英..幼儿园小班舞蹈握紧拳头

岑溪市天才教育英语培训幼儿园小班舞蹈握紧拳头 用户: mmkf 发布: 2年前

播放: 21,371

02:50

2011年蓓苗幼儿园小班舞蹈《长江7号》

用户: cairuirui789 发布: 1年前

播放: 12,011

02:23 大新县直幼儿园小班舞蹈泡泡

用户: 薇然007 发布: 1年前

视频录像 篇3

【关键词】“壹读”视频;“一条”视频;短视频广告;商业模式

【作者单位】华佳,苏州科技大学传媒与视觉艺术学院。

随着互联网的兴起,视频广告突破了电视广告的单一模式,开始迈向多元的媒介与形态。一方面,视频广告的主要播出媒介由电视转变为各种互联网平台,依托互联网的强大数据分析与处理能力,视频广告可以更有效地确定受众的目标与地域,从而针对不同的目标群体进行投放,提高了视频广告投放的针对性与适用性;另一方面,视频广告的形态也日益多元化,尤其是在互联网中,前置式广告、贴片式广告、浮层广告、播放器背景广告以及植入式广告多种形态并存[1],这些多元形态以更高的自由度、更丰富的内容、更强的互动性与受众参与性服务于广告业主的差异化需求。

除此之外,视频广告的制作主体也开始多元化发展。随着视频广告制作的技术成本不断降低,以往主要由电视台、广告公司、影视公司制作的视频广告此时也出现了一些新的制作者,这当中最具代表性的就是自媒体。移动互联时代,各大自媒体聚集了大量受众,借助其在平台上的影响力,以及数量庞大、各具特点的部落性质群体,自媒体成为视频广告的最佳投放平台。自媒体发展到一定阶段之后,商业模式成为其首要解决的问题。因此,自媒体,尤其是以制作视频为主要内容的自媒体都开始努力发展自身的视频广告业务,其中比较具有代表性的两家自媒体是“壹读”视频与“一條”视频。

本文关注的自媒体短视频广告,属于典型的内容植入式广告。本文试图通过对“壹读”视频与“一条”视频的商业视频广告分析,探讨移动互联时代自媒体视频广告的不同商业模式,以及其内容与形式上的特征。

一、“壹读”视频与“一条”视频

“壹读”是壹读天下文化传媒(北京)有限公司所运营的一个自媒体,创办于2012年8月。最初新媒体“壹读”与纸质媒体《壹读》杂志同时运营,2015年2月,《壹读》杂志停刊后,“壹读”自媒体继续运营。正是由于其传统媒体的转型背景,“壹读”成为当下新媒体的代表。截至笔者成文之日,“壹读”微信公众号大概有189.7万粉丝,微博有35.9万粉丝,优酷专区有46.8万订阅量。而“壹读”视频则是“壹读”的一个重要板块,其定位为“不走浅娱乐路线,以严肃话题的轻松有趣解读和常识的科普为主打”,“为移动互联网时代提供有品质、有创意、有价值的内容产品、传播方式和综合媒介服务”。“壹读”视频选题往往以时政选题和热点选题为主,以动画形式对严肃话题的轻松解读与常识的科普是其主要风格。“壹读”视频在其主平台优酷自频道中共更新了137集自制视频以及113集“小伙伴视频”,共计1.6亿次播出量。

“一条”视频创办于2014年9月8日,以每天一条的频率发布原创短视频。据其微信公众号获得的2016年《合作刊例》数据,“一条”视频在全媒体大概有1800万的粉丝,其中微信公众号粉丝1400万,新浪微博粉丝180万,腾讯视频日播90万次,秒拍日播100万次。“一条”视频的定位为“生活、潮流和文艺”,其受众主要为对生活品质有较高追求的中产阶级,视频内容涉足美食、茶饮、建筑、酒店、艺术、摄影等领域。“一条”视频内容分类与一般杂志的设定一致,虽然每天只推出一条视频,但是分布到每个具体的栏目,可能是一周一条,或者两周一条的周播栏目形态。截至笔者成文之日,“一条”视频在主要投放平台腾讯视频中一共更新了842集,共计8.7亿次播出量。

应该说作为视频自媒体的代表,共同的时代语境、共同的移动互联网背景使“壹读”视频与“一条”视频具有很大的相似性,比如,二者创始人都是出身传统媒体,开创自媒体是传统媒体人转型互联网创业的典型。“壹读”的创始人林楚方曾任《看天下》杂志执行主编、《南方周末》高级编辑、《瞭望东方周刊》北京采访中心主任,另一位创始人马昌博职业生涯起于《南方周末》,曾获2008年南方报业集团首届“年度记者”称号。“一条”视频的创始人徐沪生的职业生涯起于《青年报》,30岁时参与创办了《上海一周》,创办“一条”视频之前他是《外滩画报》主编。这两个自媒体都被视为现象级的存在,在业界获得了广泛关注。“壹读”被《中国记者》《中国报业》等期刊评价为当下中国媒体转型的代表,2014年获得中国新媒体影响力指数榜20强第6名。“一条”视频创办半个月便“涨粉”100万,几轮融资共计千万美元,市场估值1亿美元。二者视频制作精良,风格独特,都具有强烈的杂志风格。“壹读”视频从创办时就与《壹读》杂志高度协调一致,“一条”视频的创始人徐沪生则认为:“我做的还是原先的活儿,用的也是杂志的经验,知道什么样的选题是好的,什么样的人值得去采访,坚持杂志的美学标准”[2]。当然于这众多相同中,二者区别也是很明显的,尤其是体现在视频广告上,二者有着不同的定位、不同的商业模式、不同的内容创造方式以及不同的视频形式风格。

二、“小伙伴视频”与“媒体+电商”

互联网的普及与移动终端的发展,带给传统媒体前所未有挑战的同时也带来了新的发展机遇,不可避免的一个话题就是寻找商业模式。自媒体作为一种个人媒体形态,不像传统媒体一方面有相关的财政经费支持,另一方面其发行与广告已经形成独特的商业模式。奇虎360公司的创始人周鸿祎认为,互联网时代的商业模式大概有三种,“第一种是利用互联网卖东西,第二种是依靠广告收入,第三种是以网游为代表的增值服务”[3]。这些商业模式本质上都是一致的——那就是依靠互联网所凝聚的受众群,建立一种产业链模式——这也是近年讨论较多的社群经济问题。每个自媒体所凝聚的受众都是一个社群,“而社群经济正是基于社群而形成的一种经济思维与模式,它依靠社群成员对社群的归属感和认同感而建立,借由社群内部的横向沟通,发现社群及成员的需求”[4],从而以满足这些需求为目的,建立一种商业模式。

nlc202309090353

毫无疑问,自媒体具有多样的盈利模式,短视频广告只是其众多收入来源的一个方面。当然,短视频广告对不同自媒体的要求也是不同的,其产品定位、广告内容与自媒体自身的定位有着密切的联系。“壹读”视频把自己制作的植入广告视频称为“小伙伴视频”,以体现“壹读”与广告主之间的合作关系。2013年,“壹读”分别与“复兴路上工作室”和“朝阳工作室”深度合作,推出了《群众路线动真格了?》《跟着习大大走之博鳌篇》等动画短视频,引发国内外媒体的热议。这是“壹读”比较早的“小伙伴视频”;之后“壹读”与阿里巴巴、优酷、丰田、欧莱雅等公司甚至政府机构都有合作,制作了大量植入广告短视频,其广告风格与“壹读”视频整体风格一致。“壹读”传媒CEO李强把“‘壹读’视频以及‘壹读’传媒的核心竞争力称为解释能力[5]。”“壹读”擅长利用幽默的语言和有趣的动画形式在3分钟之内向受众传达一个核心信息,尤其是比較抽象的政治、经济等话题。

由于“一条”视频涉及的内容比较杂,有时我们很难很精准地区别哪些是广告,哪些是自制的节目形态,但是其中都多少包含一些商业性因素。“一条”视频《合作刊例》对每一个栏目适合的对象都做了针对性标示,如《中国最美民宿》适合汽车与旅游类品牌,《谈话》适合以年轻人为受众的品牌,《艺术现场》适合高端设计品、奢侈品,《美食》适合食品、厨房用品、酒类等。可以说,“一条”视频的广告植入方式是比较多元的,但是其整体都服务于自己的“媒体+电商”商业模式。“规模化、成建制的‘媒体+电商’,我们并没有能见到一个完整、成熟的案例”[6],所以“一条”视频算是国内此种商业模式的开创者。依托短视频中的故事,“一条”在悄悄地推销一种生活理念、一种消费模式以及各种各样的商品。“一条”有一个电商平台,在短视频中出现的东西平台基本都有出售,如2016年9月16日推送的插画师白茶和他的作品《就喜欢你看不惯我又干不掉我的样子》,9月17日推送的《美食台》三个家常菜中的厨具,在“一条”的电商平台都能买到。

三、如何创造病毒传播:知识与情怀

自媒体的短视频广告要想起到更好的宣传作用,其内容必须符合互联网时代信息传播推广的需求。尤其是当下,各种社交媒体成为广告发现、传播的主要平台,自媒体如何结合自身定位,为自己的广告视频找到好的内容与形式切入点,实现病毒传播,是自媒体视频广告必须要探索的问题。自媒体自身定位与受众群,显然是需要考虑的首要问题。在各自的宣传材料中,“壹读”和“一条”对自己的受众和粉丝的定位基本一致:从学历层次看,他们主要是本科以上受过高等教育的人。不同的一点是,在“壹读”的受众群中有27.5%是在读学生,而“一条”从来没有强调其在读学生的人数。可见二者的目标受众群有着不同的侧重点,“壹读”强调的是他们的受教育程度,“一条”强调的则是他们的中产阶层背景以及相应的购买力。

“壹读”视频更像是一个互联网时代的知识普及者,其视频的受众层更宽广一些,单条视频的阅读量更大一些,并且有创造病毒传播的可能。“壹读”的合作方往往是有大众化传播需要的一些大公司与政府部门等机构,所以“壹读”制作视频更多是从大众文化的角度切入,渴望以知识的娱乐化传播、幽默的二次元表达来吸引观念。比如“壹读”在2016年8月4日推送的《摆脱夏日宿命的黑科技》,从人类使用工具的历史切入到空调的历史,最终揭示主题——松下空调的双离子净化技术。至此,这则视频广告的全貌才呈现在受众面前,而之前受众可能觉得这只是一个介绍空调发展的知识视频。2014年6月所推送的《你所不知道的阿里巴巴》则是典型的利用“壹读”所擅长的数据解读能力向大家科普阿里巴巴公司形态的视频广告。

“一条”视频所关注的受众群是非常具体的,在《合作刊例》中将他们描述为“高收入、高教育程度,注重生活品质的精英人群”。“一条”副总裁范志行自己也说,“一条”在移动互联网舞台上所讲述的生活故事,就是对中国中产阶级生活方式的升级塑造[6]。在“一条”提供的数据中,尤其强调其中的北上广以及深圳、成都、杭州的受众占全部受众的43%,毫无疑问看重的是他们的购买力。所以,在“一条”的合作方中,除了少数是大公司层面的,多数是具有个人化性质的合作方,他们所面对的消费对象多数都是高收入的中产阶级。“一条”视频的制作更多是从中产阶级的亚文化角度切入,渴望以富于生活情趣的、独具情怀的内容以及精致的实拍来引起受众的关注。如“一条”在2016年4月7日推送的《好的工作,就是宁可看天的脸色,也不用看人的脸色》讲述茶农福庆做茶叶的故事,饱含个人的追求与情怀,并为福庆的龙井茶专门开辟购买通道;9月18日推送的《人最无防备的时候,是什么样子?》则是以喻红教授口述的形式,将个人际遇与艺术追求相结合,其中的情怀意味不言而喻。

同样是视频广告,“壹读”视频与“一条”视频却有着不同的形式风格。“壹读”视频走的是动画模式,借由第三者的旁白来说明,但“壹读”更愿意将之称为“动态图形”,因为“动态图形的本质是传递信息,重点表现的是知识与数据”[5];而“一条”走的是精致实拍,借主人公口述形式来创造口述体的节目形态,这种精致的纪实风格同样符合“一条”的定位与风格。二者都强调自己制作品质的精良:“壹读”强调每3分钟的视频会有8个知识点、15个笑点以及5个以上具有说服力的数据,平均每分钟会有12-15个镜头,技术水平业内领先;“一条”则强调3-5分钟短视频会有10小时以上的拍摄素材,全程使用两个机位,后期剪辑超过1个星期,有专人谱曲配乐。二者关于制作技术精良的描述并不是为了强调其视频的艺术性,而是在强调其制作的标准化、流程化与规范化,强调其视频的商品属性而不是艺术属性,言外之意是好的广告是可以复制的,而好的广告效果同样可以复制。

探索商业模式是自媒体发展到一定阶段的必然选择,而植入视频广告以其内容与形式的优势,在移动互联时代借自媒体传播平台获得了新的发展,也为自媒体的盈利模式提供了一种可能。“壹读”视频与“一条”视频作为国内自媒体视频广告的开创者,其在短视频广告上的实践值得以自媒体为代表的新媒体乃至传统媒体的学习——如何结合自身定位,开创独特的商业模式,在内容与形式之间找到符合自身特点的发展之路。

[1] 张莹. 网络视频广告研究[J]. 宁波大学学报(人文科学版),2010(4).

[2]刘璐. “一条”里的每一条,都是怎么来的[N]. 解放日报·解放周一,2015-06-29.

[3]范卫锋. 新媒体十讲[M]. 北京:中信出版社,2015.

[4]胡泳,宋宇齐. 社群经济与粉丝经济[J]. 中国图书评论,2015(11).

[5]李强. 壹读视频:核心在于信息的解释能力[J]. 传媒评论,2015(4).

[6]腾讯传媒研究院. 众媒时代——文字、图像与声音的新世界秩序[M]. 北京:中信出版社,2016.

视频录像 篇4

随着自动化技术和软硬件技术的不断发展, 传统工业对于自动化技术的要求显著提高, 极大地促进了视频监视技术的发展;同时由于“911”事件的影响, 世界对于安全的注重超过以往任何时候, 安全防护成了各项活动的重中之重[1]。在工业中, 仪器设备的正常运行对工厂的安全正常运行有着决定性的意义, 所以很有必要对这些仪器、设备进行监视[2]。在安防中, 由于涉及到巨大的人身及财产伤害, 对于监视的实时性以及准确性的要求不言而喻[3]。基于此, 视频监视技术取得了长足的发展。而在视频监视技术的发展过程中, 监视视频的质量成为视频监视系统中最重要的部分[4,5]。因此对监视视频质量的优化策略研究直接影响整个视频监视系统的性能。

1存在的问题

监视视频的质量主要体现在实时性、流畅性和清晰度等性能指标上。在一般视频监视系统中, 实时性主要由监视终端视频处理性能决定。实时性要求客户端软件以最快的速率进行网络视频数据解码。由于远程监视系统中, 监视终端存在接收缓冲区, 缓存网络数据流, 因此实时性要求数据在缓冲区中几乎不进行缓存。而对于视频流畅性, 主要由监视终端解码、显示速率与网络视频流接收速率的相对关系决定, 当解码、显示速率比视频流接收速率高时, 解码、显示会阻塞等待视频接收, 由于此等待过程并非平均分布在每一帧, 因此会造成播放视频流畅性问题。清晰度主要和视频数据的丢包率有关, 在网络状况理想的情况下, 丢包率主要与监视终端数据处理效率有关, 当终端数据处理速率较低时, 由于视频数据累积, 会造成接收缓冲区溢出, 从而导致丢包率升高, 引起清晰度问题。在实际应用中, 网络拥塞对丢包率影响很大, 决定了视频的清晰度。

由上述分析可知, 要想保证视频实时性能, 必须提高视频终端的处理性能。而同时由于实时性和流畅性存在矛盾:实时性要求监视终端以最快速率进行数据处理;流畅性要求视频流进行缓冲, 同时控制监视终端解码、显示速率。为了达到好的监视效果, 必须找到均衡控制策略, 一方面让视频进行缓冲, 保证视频解码、显示不阻塞, 另一方面保证数据快速解码, 不产生累积时延。同时必须对网络拥塞进行抑制, 以保证视频清晰度。

2优化控制策略

2.1 零拷贝缓冲区策略

流媒体编程中处理的数据量非常大, 减少数据拷贝可以提高客户端对流媒体数据的处理速度、降低时延以及减轻处理器的负载;也可以减少客户端因为数据拷贝, 来不及处理后续数据包而带来的丢包现象。从而节约系统资源, 提高流媒体的播放质量。零拷贝缓冲区策略通过合理的缓冲区设计, 能减少90%的数据拷贝工作, 大大提高系统性能。

零拷贝缓冲区策略合并接收缓冲区和解码器输入缓冲区, 使得缓冲区间的数据拷贝操作变成指针操作。

零拷贝缓冲区原理图如图1所示, Read-ptr:视频解码指针, 指向待解码的数据;Write_ptr:接收数据指针, 指向网络数据的存放地址;valid_data_ptr:有效缓冲区首地址, 网络数据存放的首地址。备用缓冲区不存放从网络接收的视频流, 当如图2所示, 有效数据分为2块时, 并且解码数据分别存在于缓冲区中的2个部分, 则传递给解码器Read-ptr并不能满足要求, 因此需要使用到备用缓冲区, 具体策略是将Read-ptr后的数据拷贝到Buffer_ptr里, 使得解码数据变成一块连续缓冲区。由于在视频监视系统中, 一帧数据的数据量比接收缓冲区小得多, 因此发生这种拷贝的几率很少, 而且每次拷贝的数据量也很少, 能大大优化系统性能, 提高监视终端解码、显示的效率。

2.2 网络拥塞抑制策略

当通信网络中有太多的分组需要传输时, 会使整个网络的性能降低, 传输质量下降, 产生网络拥塞现象。当发生网络拥塞时, 如果不能及时地对网络拥塞进行抑制, 视频延时会上升、网络丢包率急剧增长, 同时也会带来一定的流畅性问题, 给视频质量造成很大的影响。对于拥塞的解决办法无非只有2种:增加网络资源和降低负荷。前者由整个互连网络决定, 没有办法进行控制, 后者由每个用户决定。当出现网络拥塞时, 适当地减少服务器端视频采集的速率, 这样既减少了传输的数据, 降低了网络负载, 同时又降低了客户端数据的需求, 减少了视频质量下降的几率。

在RTP[6]协议中, 使用RTCP[7] (实时传送控制协议) 来进行流量控制和拥塞控制。在RTP会话期间, 各参与者周期性地传送RTCP包。RTCP包中有5种不同类型的RTCP控制分组, 其中有2种:SR (Sender Report) 发送者报告, 用于当前发送者的发送情况和接收情况的统计;RR (Receiver Report) 接受者报告, 用于当前接受者的接受情况的统计。

RTCP包中含有已发送的数据包的数量、丢失的数据包的数量等统计资料, 可以利用这些信息动态地改变传输速率, 甚至改变有效载荷类型。

在客户端可以周期性统计接收数据包的总个数以及丢失数据包的个数, 然后按照RTCP的数据包格式填充数据包, 发送至服务器端, 然后服务器端通过相应的流量控制算法, 利用客户端传输过来的具体参数, 则可以动态的调节数据包的采集以及发送速率。

2.3 编解码速率协调策略

在一般视频监视系统, 监视终端进行视频解码时, 为了确保每帧数据的完整性, 需要判断接收缓冲区中数据是否达到一定要求Limit_A, 但是由于监视图像在背景固定和背景剧烈运动时, 每帧数据量相差非常大, 剧烈运动时的数量量往往是静止时的几倍, 因此对于Limit_A的选择比较困难。当Limit_A选择较小时, 在剧烈运动的情况下, 解码数据可能不是完整一帧, 造成视频质量问题;当Limit_A选择较大时, 在几乎静止的情况下, 可能会造成视频的停顿以及长时间的视频延时。因此Limit_A必须是动态变化的, 同时缓冲区中的数据由于静止和运动时的数据量不同, 数据量也必须进行严格的控制, 防止在静止情况下出现大规模延时。

在监视系统中, 接收缓冲区就像一个漏斗, 从网络接收数据写入缓冲区就像往漏斗里注水, 从缓冲区取出数据进行解码播放, 就像从漏斗出水一样[8,9]。在一个漏斗中, 当入水和出水相同时, 不仅能使水流顺畅, 同时漏斗里的储水量也几乎恒定, 如图3所示。当然在监视的系统中, 由于存在时间差 (往缓冲区里存储的帧与从缓冲区中取出的帧在时间上存在着差异) , “出水速率”和“入水速率” (帧的大小) 往往不相同;当视频从运动变为静止时, “出水速率”会比“入水速率”大, 当视频从静止变为运动时, “出水速率”会比“入水速率”小。因此不能简单地套用此模型。

由于视频显示速度不是以比特 (bit) 为单位而是以“f/s”为单位, 所以当“水”的单位变为“f”, 相应的“出水速率”和“入水速率”也变成“f/s”, 则整个系统模型变为:当输入帧率和输出帧率相同时, 就可以保证缓冲区中具有恒定的帧数stay_M, 如图4所示。同时只要确保Limit_A的值正确, 那么每帧数据都可以是完整的, 视频也会是流畅、完整的。

输入速率就是从网络接收视频帧的速率, 理想地来讲, 也即是监视服务器采集、发送视频的速率;而输出速率应是从缓冲区取出数据进行解码的速率, 由于视频质量最后呈现给用户的部分是显示部分, 因此将输出速率改为显示速率更为妥当, 同时为了保证视频帧的完整性, 解码速率也要进行适当的控制。

此策略的实施办法就是控制服务器端视频采集、编码的速率和客户端视频显示的速率, 使它们速度相同, 同时在Limit_A的选取上, 根据视频连续性的关系, 由实际消耗数据决定下一帧Limit_A的值, 同时平滑解码速率, 使得每帧的解码过程能够平均分布。

3实验结果分析

本文的测试环境为:监视服务器运行Davinci[10]开发平台, 具有ARM+DSP双核结构, ARM子系统进行常规处理, DSP子系统进行快速数字信号处理。ARM子系统最高主频为297 MHz, DSP子系统最高主频为594 MHz, 最高速度为每秒4 752百万条指令;监视终端运行于PC机, 处理器为奔腾42.8 GHz, 内存1 GB, 显存256 MB, 内置100 Mb/s网卡, 160 GB硬盘, 操作系统为Windows XP。监视服务器与监视终端通过校园网络相连。测试内容主要是针对客户端发出连接请求后5 s, 10 s, 30 s, 60 s, 90 s, 120 s, 150 s, 200 s, 250 s, 300 s时的系统状态:主要包括时延、丢包率以及产生停顿现象帧的百分比率。测试过程为单用户情况下, 对优化前后视频质量进行比较。如图5所示为优化前、后的时延变化图。从图中可以观察出, 优化前时延随着监视时间的增加而增长, 这是由于监视终端缓冲区之间拷贝操作过多, 造成客户端解码显示、速度相对较低, 因而引起监视终端累积延时。而优化后的时延基本稳定, 大概在1.5 s左右, 没有累积时延。这是由于缓冲区策略的控制, 监视终端视频解码、显示速度有了大幅提高, 同时在编解码速率协调策略的控制下, 视频编解码速度相对比较平均, 有效的抑制了累积时延, 保证了系统实时性。因此优化控制策略对于时延的控制十分有效。

如图6所示为优化前、后的丢包率变化图。从图中可以观察出, 优化前, 系统丢包率在开始监视的时比较稳定, 但随着监视时间的增长, 丢包率迅速增加。由于累积时延存在, 缓冲区必定会溢出, 因此导致丢包率迅速增加。而在优化后的系统中, 由于不存在累积时延, 因此系统缓冲区利用率比较小, 不会造成由于缓冲区溢出而产生的丢包现象, 因此确保了系统的监视视频质量。在优化后的系统中, 丢包率依然存在较大波动, 这是因为在网络拥塞的情况下, 不可避免会产生较大丢包率, 但是由于拥塞控制的作用, 丢包率会受到抑制, 缓慢恢复到正常水平。

图7为停顿帧百分比的变化图。从图中可以看出, 优化后的停顿帧百分比比优化前有了较大的提升, 优化后的停顿帧百分比大概稳定在1.5%左右。随着视频实时性的提高, 视频缓冲的时间也大大减小, 缓冲区数据量也大大减小, 因此造成监视终端解码、线程间歇性等待网络数据流, 从而造成停顿百分比增高, 视频出现停顿现象。由于优化后视频停顿百分比基本稳定且居于可以接受的范围, 这也进一步表明编解码速率协调策略进行了有效的控制。

4结语

视频监视系统中, 对系统软件硬件设计实现完成后, 很重要的工作就是对监视视频质量的优化, 只有监视视频的质量达到要求, 系统才能满足实际应用的需求。因此本文基于这个问题, 首先分析了监视视频性能指标的影响因素, 然后提出2种优化策略, 实验结果表明, 这两种策略有效地提高了监视视频的质量, 保证了监视视频的实时性, 流畅性和高清晰度。

摘要:为了对视频监视系统中监视质量的进行优化, 提出了3种优化控制策略:零拷贝缓冲区策略、网络拥塞抑制策略、编解码速率协调策略。零拷贝缓冲区策略降低了终端负载, 提高了系统处理能力, 网络拥塞抑制策略有效地减少了丢包率, 编解码速率协调策略平衡了系统延时与流畅性。实验测试结果显示, 随着监视时间的增加, 优化后系统时延基本稳定、丢包率显著减少、视频播放流畅, 系统性能满足一般应用需要。

关键词:视频监视,优化,实时数据处理,视频播放的流畅性

参考文献

[1]欧扬, 付保川.一种嵌入式智能网络视频监控终端的研究与设计[J].微计算机信息, 2005, 21 (32) :55-57.

[2]LAM K Y, CHIU C K H.Mobile video stream monitoring sys-tem[C]//Proc.of the 11th ACM Int.Conf.on Multime dia.Berkeley, CA, United States:ACM, 2003:96-97.

[3]FAN X H, HU J, JIN W D.Embedded MPEG-4 remotevideo surveillance system based on G07007SB[J].Journalof Heilongjiang Institute of Science&Technology, 2005, 15 (2) :32-36.

[4]崔云红, 何青林.视频监控联网系统管理平台的测试研究[J].电视技术, 2009 (6) :92-95.

[5]阮若林, 胡瑞敏.基于感兴趣区域的率失真优化帧内刷新算法研究[J].计算机科学, 2009 (10) :284-288.

[6]SCHULZRINNE H, CASNER S, FREDERICK R, et al.RTP:a transport protocol for real-time applications[R].[S.l.]:IETF, 1996.

[7]SCHULZRINNE H, RAO A, LANPHIER R.Real timestreaming protocol (RTSP) [R].[S.l.]:IETF, 1998.

[8]刘富强.数字视频监控系统开发及应用[M].北京:机械工业出版社, 2003.

[9]梁笃国, 张艳霞.网络视频监控技术及应用[M].北京:人民邮电出版社, 2009.

海量视频搜索与视频侦查系统 篇5

1 系统概述

随处可见的视频监控,无非就是摄像头不停地抓拍录像。然而,一旦须要检索视频中的特定目标,人们面对的往往是在成千上万个小时的海量视频中大海捞针,传统上须要投入的人力和时间,简直让人不敢想象,也很不现实。因此,如何通过计算机程序快速从海量视频中搜索特定目标,已经成为当前视频检索和视频侦查迫切须要解决的问题。

当前市场存在的视频侦查系统,普遍仅仅是依赖于传统局限的“帧差法”、“背景建模法”、“颜色分类法”等,从视频中检测所有运动目标,开发出的系统大多停留在“视频摘要”、“视频浓缩”、“拌线检测”、“人车分类”等非常初期、浅显的检索阶段,并没有进行特定目标的搜索,在海量视频检索任务中,人工筛选工作量仍然非常巨大,甚至无法接受。此类视频检索系统,尽管有关公司宣传如何地增强案件侦查能力,实际应用效果却非常有限,经受不住实际案件的检验。

因此,近年来,越来越多的开发者将重点投入到“以图搜图”这一热点主题的研究上,希望能够取得明显进展成果。然而,因技术方面主要存在很大的困难和挑战,如同类别差异、视点变化、光照差异、遮挡问题、复杂背景等,指望单纯通过“以图搜图”计算的“图像相似度”搜索海量视频中的特定目标,研究进展举步维艰,实际应用效果也非常局限,满足不了复杂多变的海量视频侦查任务。

作者完全自主研发的“梯度视频搜索系统”,继承并突破传统图像处理技术,允许用户根据实际情况,自定义视频侦查任务,创新性地提出并构建“级联检测器检测+验证器校验”的多级多个神经网络组成的神经计算专家系统,实现海量视频“多目标多场景”的同时搜索。系统特点

不同于单纯的“以图搜图”,“梯度视频搜索系统”根据侦查任务的N(N≥1)个已知场景或M(M≥1)张已知图像,提取、处理和扩充已知视频或已知图像中的特征图像序列,将其作为样本集合训练侦查系统内核(多级多个神经网络组成的神经计算专家系统),实现海量视频“多目标多场景”的同时搜索,并且根据案件侦查的深入推进,支持已知场景的增加、删除和修改等。

“梯度视频搜索系统”首先根据已知的嫌疑人视频场景片段(已知场景可通过“梯度视频浓缩系统”检索等其它辅助方法得到),自动提取关键特征图像序列,并经一序列预处理和后处理,将关键特征图像序列扩充成不同光照、不同角度、不同变形等多种情况,形成更多的特征图像序列,将其作为样本集合,模拟人类大脑思维训练人工神经网络,最后使用经过训练的侦查系统内核,对海量视频执行搜索任务。运行环境

CPU:推荐Intel Core i5 M 460 @ 2.53GHz或更高主频的处理器或兼容处理器; 海量视频搜索与视频侦查系统

内存:2GB及以上内存,推荐8GB; 硬盘:1GB空余硬盘空间,推荐1TB;

键盘:标准101/102键或Microsoft自然PS/2键盘; 鼠标:普通或光电鼠标; 显示:14寸以上显示器;

平台:Windows XP及以上操作系统,推荐64位Windows 7。使用说明

4.1 定义侦查任务

启动“梯度视频搜索系统”,首先进入第一个页面“定义侦查任务”,如图4.1,该步骤主要是定义侦查任务根目录、任务名称和任务描述。

定义侦查任务时,请确保根目录所在磁盘有足够的空间,并确保任务名称的唯一性。任务描述则是供填写有关任务的简介和案情,这可以根据具体情况酌情填写,也可空白不写。

图4.1 定义侦查任务 海量视频搜索与视频侦查系统

4.2 定义已知场景

在图4.1中,单击“下一步”按钮,进入第二个页面“定义已知场景”,如图4.2,该步骤主要是为侦查任务定义已知场景,“梯度视频搜索系统”支持“多目标多场景”的同时搜索。

定义已知场景时,场景编号必须唯一,场景描述内容允许空白不写。

场景列表中的“视频”、“起始帧”和“终止帧”,开始时为空,其内容和取值是在后面第三个页面“选取视频片段”中定义的。

图4.2 定义已知场景

4.3 选取视频片段

在图4.2中,单击“下一步”按钮,进入第三个页面“选取视频片段”,如图4.3.1,该步骤主要是为已知场景定义视频片段。

首先单击“打开视频”按钮,选定好已知场景的视频,然后调节播放到起始帧所在的位置,单击“设为起始帧”按钮,完成起始帧的定义,如图4.3.1。继续调节播放视频,待到终止帧所在的位置时,单击“设为终止帧”按钮,完成终止帧的定义,如图4.3.2。海量视频搜索与视频侦查系统

图4.3.1 选取视频片段 – 设定起始帧

图4.3.2 选取视频片段 – 设定终止帧 海量视频搜索与视频侦查系统

4.4 预处理已知场景

在图4.3.2中,单击“下一步”按钮,进入第四个页面“预处理已知场景”,如图4.4,该步骤主要是为第五个页面“分割目标区域”做准备工作。

预处理已知场景时,单击“开始”按钮,程序全自动运行所有预处理工作。

这里,“梯度视频搜索系统”支持对M(M≥1)张已知图像(非视频片段)的预处理,可单击“从目录增加”和“从文件增加”按钮,直接增加已知图像,程序自动对其进行所有预处理。

图4.4 预处理已知场景

4.5 分割目标区域

在图4.4中,单击“下一步”按钮,进入第五个页面“分割目标区域”,如图4.5,该步骤主要是手动框取待搜索的目标在图像中的区域。

分割目标区域时,请耐心多框取一些目标区域,样本框取的多与少、好与坏,将直接影响后面的搜索速度和准确度。海量视频搜索与视频侦查系统

图4.5 分割目标区域

4.6 后处理已知场景

在图4.5中,单击“下一步”按钮,进入第六个页面“后处理已知场景”,如图4.6,该步骤主要是对手动分割的目标区域进行后处理,批量生成可供人工神经网络训练用的样本集。

后处理已知场景时,单击“开始”按钮,程序全自动运行所有后处理工作。

这里,旋转角度默认为“0,-5,5,-10,10”,裁剪因子默认为“0.5”,区域默认为“0,0,1,0.8”,可根据实际须要修改调整。

另外,在单击“开始”按钮后弹出的询问“裁剪背景边界?”对话框,多数情况下,单击“否”按钮便可,即在后处理过程中,不再自动修剪背景,保持手动框取待搜索的目标在图像中的区域不变。海量视频搜索与视频侦查系统

图4.6 后处理已知场景

至此,一个已知场景的定义全部完成。

如果还想继续定义已知场景,请单击最下方导航栏中间的“跳转”按钮,在弹出的快捷菜单中,单击“定义已知场景”,程序将直接跳转到第二个页面“定义已知场景”。

4.7 训练神经网络

定义好所有已知场景后,在第六个页面(图4.6)“后处理已知场景”中,单击“下一步”按钮,进入第七个页面“训练神经网络”,如图4.7,该步骤主要是训练多级多个神经网络组成的神经计算专家系统。

训练神经网络时,学习次数默认为1000,可根据须要调整,学得越久,将来的系统搜索准确率越高。单击“开始”按钮后,程序全自动运行所有训练工作,该过程可能须要持续数分钟,实际训练时间取决于计算机软硬件配置条件的优劣不同。海量视频搜索与视频侦查系统

图4.7 训练神经网络

4.8 执行搜索任务

在图4.7中,单击“下一步”按钮,进入第八个页面“执行搜索任务”,如图4.8,该步骤主要是应用训练过的神经网络专家系统,执行海量视频中特定目标的批量搜索和侦查。

搜索过程可能须要较长时间,实际搜索速度取决于计算机软硬件配置条件的优劣不同。搜索结束后,单击“忽略同物”按钮,进行重复同物目标图像的剔除。海量视频搜索与视频侦查系统

图4.8 执行搜索任务

4.9 浏览搜索结果

在图4.8中,单击“下一步”按钮,进入第九个页面“浏览搜索结果”,如图4.9,该步骤主要是对程序自动批量搜索到的目标进行人工筛选,形成最终的搜索结果。

浏览搜索结果时,可以根据须要过滤显示不同得分等级和排序顺序的目标图像,并可以双击每张目标图像,程序自动定位到该图像对应的原始视频位置,并可以进行倒退和前进播放,实现图像到视频的定位和回放,对人工筛选工作起到非常重要的辅助作用。海量视频搜索与视频侦查系统

图4.9 浏览搜索结果

4.10 生成报告视频

在图4.9中,单击“下一步”按钮,进入第十个页面“生成报告视频”,如图4.10,该步骤主要是对搜索结果图像进行视频剪辑处理,生成缩略报告视频。

“延时帧数”默认为100,即使用搜索结果图像在视频中前后各100帧的图像子集生成缩略报告视频,该值可根据须要修改,比如改为200。海量视频搜索与视频侦查系统

图4.10 生成报告视频

4.11 播放报告视频

在图4.10中,单击“下一步”按钮,进入第十一个页面“播放报告视频”,如图4.11,该步骤主要是播放观看缩略报告视频。

播放报告视频过程中,可以“跳转原视频”,并可对视频截取、合成和编辑。海量视频搜索与视频侦查系统

图4.11 播放报告视频 案件实测

截至2014年08月31日,“梯度视频搜索系统”已先后经过3个案件的实测:2013年04月06日江夏杀妻抛尸案、2013年08月07日武昌小区盗窃案、2014年04月11日武汉大学强奸案。

5.1 2013年04月06日江夏杀妻抛尸案

该案共有73GB约292小时的监控视频,视频格式全部为.mp4,画面质量模糊。

实测中,采用一台普通i7台式计算机,运行2个进程,搜索时间分别为:4.1小时、4.5小时,平均搜索时间为4.3小时。

在这73GB约292小时的监控视频中,通过传统人工方法检索受害人和嫌疑人,共找到6处。“梯度视频搜索系统”的搜索结果为:搜到6处,遗漏0处。

搜索结果如图5.1,第1张为受害人2013年04月05日00:49:54出来捡垃圾的截图,第2张为嫌疑人2013年04月05日00:53:01穿着短裤出来看他妻子捡垃圾的截图,第3张为受害人2013年04月05日海量视频搜索与视频侦查系统

02:52:46捡完垃圾回家的截图,第4张为嫌疑人2013年04月06日16:08:02从外面回家的截图,第5张为嫌疑人2013年04月06日19:49:29提着他妻子尸体出来的截图,第6张为嫌疑人2013年04月06日19:52:49骑电动车抛尸的截图。

图5.1 2013年04月06日江夏杀妻抛尸案搜索结果(6处)

5.2 2013年08月07日武昌小区盗窃案

该案共有90GB约117小时的监控视频,视频格式全部为.mp4,画面质量高清。

实测中,采用一台普通i7台式计算机,运行2个进程,搜索时间分别为:5.4小时、6.2小时,平均搜索时间为5.8小时。

在这90GB约117小时的监控视频中,通过传统人工方法检索嫌疑人,共找到20处。“梯度视频搜索系统”的搜索结果为:搜到21处(其中,人工已找到的有17处,人工未找到的有4处),遗漏3处。

搜索结果如图5.2(其中带有红色边框的为传统人工检索未找到的4处截图),第1张为嫌疑人作案前在第2路摄像头第1次出现的截图,第2张为嫌疑人作案前在第2路摄像头第2次出现的截图,第3张为嫌疑人作案后在第2路摄像头第3次出现的截图,第4张为嫌疑人作案前在第3路摄像头出现的截图,第5张为嫌疑人作案前在第5路摄像头第1次出现的截图,第6张为嫌疑人作案前在第5路摄像头第2次出现的截图,第7张为嫌疑人作案前在第6路摄像头出现的截图,第8张为嫌疑人作案前在第7路摄像头第海量视频搜索与视频侦查系统

1次出现的截图,第9张为嫌疑人作案前在第8路摄像头第1次出现的截图,第10张为嫌疑人作案后在第8路摄像头第2次出现的截图,第11张为嫌疑人作案前在第9路摄像头第2次出现的截图,第12张为嫌疑人作案前在第10路摄像头第1次出现的截图,第13张为嫌疑人作案前在第10路摄像头第2次出现的截图,第14张为嫌疑人作案前在第10路摄像头第3次出现的截图,第15张为嫌疑人作案后在第10路摄像头第4次出现的截图,第16张为嫌疑人作案前在第11路摄像头第1次出现的截图,第17张为嫌疑人作案前在第11路摄像头第2次出现的截图,第18张为嫌疑人作案前在第12路摄像头第1次出现的截图,第19张为嫌疑人作案前在第13路摄像头出现的截图,第20张为嫌疑人作案前在第15路摄像头第1次出现的截图,第21张为嫌疑人作案前在第15路摄像头第2次出现的截图。

图5.2 2013年08月07日武昌小区盗窃案搜索结果(21处)

遗漏3处分别为:嫌疑人作案后在第7路摄像头第2次出现(图5.2.1)、嫌疑人作案前在第9路摄像头第1次出现(图5.2.2)、嫌疑人作案前在第12路摄像头第2次出现(图5.2.3)。

“遗漏3处”的主要原因在于拍摄条件和已知场景的差异较大,这可以通过“二次搜索”解决,即:将第一次搜到的21处场景全部作为已知场景,再次执行搜索任务,便可搜到“遗漏3处”的嫌疑人目标。

“梯度视频搜索系统”支持“多目标多场景”的同时搜索,可根据案件侦查的深入推进,增加、删除和修改已知场景,执行“N次搜索”,确保搜索到的嫌疑人目标及其时空轨迹的完整性。海量视频搜索与视频侦查系统

图5.2.1 嫌疑人作案后在第7路摄像头第2次出现

图5.2.2 嫌疑人作案前在第9路摄像头第1次出现 海量视频搜索与视频侦查系统

图5.2.3 嫌疑人作案前在第12路摄像头第2次出现

5.3 2014年04月11日武汉大学强奸案

该案共有221GB的监控视频,包含.264、.mp4、.csv5、.dat等多种视频格式,画面质量既有高清,也有模糊。

实测中,采用两台普通i7台式计算机,每台运行2个进程,共4个进程,因硬件配置差异和视频分配不均,搜索时间分别为:7.6小时、8.9小时、11.3小时、16.9小时,平均搜索时间为11.2小时。

在这221GB的监控视频中,通过传统人工方法检索嫌疑人,共找到4处。“梯度视频搜索系统”的搜索结果为:搜到3处,遗漏1处,搜到另外2处疑似。

“遗漏1处”的主要原因在于拍摄条件和已知场景的差异较大,这可以通过“二次搜索”解决,即:将第一次搜到的3处场景全部作为已知场景,再次执行搜索任务,便可搜到“遗漏1处”的嫌疑人目标。

“梯度视频搜索系统”支持“多目标多场景”的同时搜索,可根据案件侦查的深入推进,增加、删除和修改已知场景,执行“N次搜索”,确保搜索到的嫌疑人目标及其时空轨迹的完整性。

图5.3.0为已知场景(1处),图5.3.1至5.3.3为搜到结果(3处),图5.3.4为遗漏结果(1处),图5.3.5至5.3.6为疑似结果(2处)。海量视频搜索与视频侦查系统

图5.3.0 已知场景(1处)

图5.3.1 搜到结果(3处)-第1处 海量视频搜索与视频侦查系统

图5.3.2 搜到结果(3处)-第2处

图5.3.3 搜到结果(3处)-第3处 海量视频搜索与视频侦查系统

图5.3.4 遗漏结果(1处)

图5.3.5 疑似结果(2处)-第1处 海量视频搜索与视频侦查系统

图5.3.6 疑似结果(2处)-第2处

5.4 实测总结

案件实测表明,“梯度视频搜索系统”值得推广应用,通过计算机程序快速从海量视频中搜索特定目标,大大提高案件侦查效率。

今后,“梯度视频搜索系统”将在“增大检测率的同时减小误判率”上加以改进和升级,进一步提升软件系统的搜索性能。联系方式

作者:李瑞鑫 网站: 邮件:ruixin_1981@sina.com

视频播放器能播放什么视频? 篇6

掌上电脑在所支持的视频格式上优势明显,你可以通过安装第三方解码器的途径来“通吃”绝大多数不同格式的视频,其中包括MPEG-4、AVI、ASF等等。但遗憾的是这种建立在软解码基础上的兼容性会受到处理器性能的限制,因此如果您不清楚机器性能又准备在掌上电脑上播放视频,我们建议您将视频分辨率控制在320x240,并尽量不要使用640x480的标准(目前掌上电脑还不具备流畅解压该分辨率MPEG-4视频的处理能力),如果你对这个规格下获得的视频质量感到不满意,那么我们建议你使用PMP作为随身影院。

PMP播放器在播放视频方面的优势之一在于其采用了硬解码的方式来实现视频回放,因此不会因视频分辨率的高低的改变而影响到播放速度,时下的PMP播放器已经可以流畅地播放720×480规格的MPEG-4视频。当然PMP播放器也并非“随身影院”的终极解决方案,它能播放的视频种类相对要少,甚至不少PMP播放器只能播放AVI、Xvid两种视频,如果能够支持更多种格式则堪称完美。

智能手机所能播放的视频种类有些寒酸,甚至相当多的手机不能播放诸如AVI、MPEG等通用格式,而必须通过一些第三方软件对已有格式重新编码为特定格式后才能播放,以至于很多人宁可放弃视频播放功能也不愿意自己费时完成转换。此外智能手机所能播放的视频普遍分辨率低而且并不流畅,在支持通用格式的产品中RM、ASF两种格式比较常见。

现在你应当对掌上影院的概况有所了解了,那么从性能、实用两方面考虑,你到底需要何种产品?

如果站在纯粹的商品角度来看,手机、掌上电脑以及新兴的PMP播放器都拥有相当数量的用户群,本着存在即合理的逻辑,对任何一款产品市场前景或用户接纳程度妄加评论显然不够严谨;但任何用户在购买产品时又有一个最基本的起点,这就是需求。如果在这个起点出发也许你能够发现并不是所有的产品都能够“胜任”视频的需求。

还有什么新玩法

坦白说,带个“电影院”出门的你在内心深处是不是有一丝炫耀的成分?不用回避,作为一种娱乐的工具,我们甚至认为你还应该让它更加眩目。

让它变成真正的影院

无论掌上电脑还是PMP播放器,它们的影音效果都不能恭维,毕竟这两种产品都是针对个人设计的,而且由于体积的关系,想要在这两方面有所作为显然有些力不从心,但如果你额外购买这两方面的附件就能感受到真正的影院效果。

实际上能够解放“视界”的产品已经出现,在今年Infocomm上我们看到一款来自三菱公司的便携式投影仪——PocketProjector SD,这款与Palm大小相仿的产品重量仅为400克,但却可以在1英尺(0.305米)的距离内实现20英寸的图像显示,如果你能给它1米的投影距离,它还能够为你提供40英寸的图像显示。想象一下,几个朋友在外聚会时你从容的支起投影机与大家共赏岂不是乐趣无穷?

与显示部分需要添加附件来提高显示品质一样,想要提升音响效果同样需要购买其他附件,比如便携式音箱。可以肯定的是便携式音箱会让你的随身影院的变得更有情趣,但是不要指望便携式音箱给你带来“震撼”的音响效果,事实上使用便携式音响更大的好处在于你能让同伴更加清楚地听到声音,单纯从音响效果来看,便携音箱还是不如耳机。

现在便携式音箱在市场中很常见,例如创新TravelSound、罗技mm22都可以在市场中找到,我们建议有PMP的用户在户外使用时尽可能带上一台便携音箱,独乐乐不如众乐乐嘛。

此外上面提到的两类附件也可以在掌上电脑上使用,但如果你想要让掌上电脑具备视频输出的能力还需要额外购买相关的视频输出配件,不过这种配件在零售市场并不常见,您可能需要通过国外网站订购。

把PMP变成随身秘书

我们知道掌上电脑可以作为“随身秘书”使用,但实际上PMP播放器也有这种功能,例如爱可视 PMA400就集成了Opera浏览器,并具备电子邮件收发、游戏等功能,甚至还带有WiFi模块,因此不少情况下它完全可以起到商务秘书的作用。

视频录像 篇7

随着法律对公众服务平台的视频内容合法性要求的严格化,视频服务云平台对视频内容合法性检测是一个迫切需要解决的问题。在云平台中,视频都需要存储在云端的服务器上,这些数据是纯粹的可播放的视频数据。由此带来一个内容安全的问题:如果云端服务器被黑客攻破,只要替换云端服务器存储的视频文件,就可以输出被替换的内容,这将带来很大的内容安全隐患。为解决视频安全播出,防止视频被篡改和替换的问题,本文提出一种基于视频内容抽样加密生成视频指纹进行内容安全验证的方法,可以快速检测文件被替换的问题,并基于该方法设计了一个视频内容安全播出控制系统。

1 背景技术

1.1 对视频的访问请求的合法性检查

对视频的访问请求的合法性检查,目前广泛采用的技术包括referer反盗链、链接签名、url加密、session校验等。Referer反盗链方式下,服务器通过获取用户提交信息的网站地址进行判断是否合法用户;链接签名和URL加密则是通过在访问链接中,以参数的形式提供加密信息供服务器进行判断;Session校验则是根据访问的上下文中的session信息进行。这些技术中,用于验证的信息都是包含在用户提供的请求的特定字段中。这些技术主要用于对访问的请求者的有效性进行验证,不涉及视频文件内容的验证。

1.2 对视频的内容的合法性检查

对视频内容的合法性的检查,主要是对视频内容生成的特征值以及用户秘钥等信息进行验证,主要技术包括视频签名、视频水印和视频指纹[1]等。

视频签名和视频水印,要求内容提供方必须对视频进行预处理,如提取摘要或嵌入验证信息,还要由内容提供方、取证方及可能存在的第三方可信赖机构,在共享算法和密钥的前提下进行取证。DRM[2]技术就是一种为了保护数字媒体的版权而提出的数字签名技术。因其验证过程需要第三方机构,在网络不稳定时容易带来许可证损坏等问题,给用户带来了使用上的困难。而实际上在应用中,由于DRM技术并不能真正确保文件不被盗版,提供音乐下载的苹果公司及华纳音乐集团等公司都已不再提供带DRM的音乐。

视频指纹,表示视频内容的内在本质属性,可唯一地标识一段视频序列。视频指纹技术可以用于防止视频被篡改[3],也可以用于检查视频中包含的盗版、违禁内容。一个好的视频指纹,通常包括如下特征[4]:

(1)鲁棒性:对同一媒体的不同变化具有唯一性,也即对有损压缩算法具有鲁棒性,以保证低误检率。

(2)独立性:对不同视频具有强可分性,即按照同一算法,对不同的视频文件生成的指纹应该有较大差别。

(3)搜索高效性:指纹数量小,且易于做高速匹配算法。

2 一种快速采样加密生成视频指纹的方法

由于提供视频播放服务的云平台,具有高并发性和上层应用多样性的特点,对视频安全播出的检查方法性能要求高。一方面云平台存在海量视频,数据量大,面向用户多,视频播放的并发性高,处理压力大。另一方面作为底层视频服务,其上层应用形式多样,因此需要做到无缝连接,易集成,免装定制播放器。因此,本文采用一种快速采样加密生成视频指纹的方法,通过比对视频指纹,进行视频安全验证。

快速生成视频指纹的方法描述如下:

(1)采用视频抽样,快速获取视频片段的抽样位置,读取样本数据。

(2)对抽样算法进行快速加密,生成唯一性的视频指纹。

在抽样定位的算法的选择上,抽样模式必须具备相当的防御破解的能力,同时也必须满足性能问题。本文采用双向斐波那契数列寻址,采用中段位获得8个采样地址。斐波那契数列的数值可通过加法运行获得,运算速度快。在加密方式的选择上,主要考虑性能问题,采用轻量级的快速XXTEA算法,可有效降低对视频服务性能的影响。

算法示意图如图1。

该方法运算速度快,对视频服务性能影响小,可用于高并发云服务环境下视频被播放前进行的校验,有效防止文件被篡改或替换。

3 基于视频指纹的视频安全播出控制系统

基于快速采样加密生成视频指纹的方法,一个视频安全播出控制系统结构如图2,包括以下三个主要部分:

(1)视频指纹生成模块

根据快速生成视频指纹的方法,对合法视频文件进行快速抽样,再快速生成视频指纹,将视频指纹嵌入到文件名称中。该方法可与转码引擎集成,通过转码参数配置功能启用/关闭;也作为独立操作,可对已有的视频文件进行处理。

(2)视频指纹校验模块

该模块集成于web服务中。在视频文件被请求播放时,采用同样的快速生成视频指纹的方法获取被请求的文件的视频指纹,与视频名称中的视频指纹进行对比。若不相同则发出警告,终止web传输。以NGINX作为Web服务提供者为例,可将视频指纹校验模块作为NGINX的内嵌module进行编译,与NGINX的web传输服务在核心层集成。

(3)日志管理

记录、跟踪系统运行使用,监控系统运行及安全异常,并且及时发出告警。

4 结束语

随着视频业务的推广,特别是公众直播平台的快速发展,视频内容合法性验证的重要性日趋明显。本文提出的基于快速采样加密生成视频指纹的方法,及基于该方法的视频安全播出控制系统,具备计算速度快,性能损耗小的特点,并且可与上层应用无缝连接,不额外增加视频应用的集成难度,可方便应用视频云服务平台中,提供视频安全播出检查功能,以防止视频文件被替换或篡改。

参考文献

[1] 聂秀山,刘琚,孙建德.基于二叉树和随机邻域嵌入的视频指纹算法.电子学报,2013,41(12):2410~2415

[2] DRM.百度百科.http://baike.baidu.com/link?url=jbe4E16EVW-ZIl TIdjsdsocd WOPNvu VMIDkr Ai9q19jp Wiere-PAOJZ-10lsrvf1j EZK-IQr EZp4qf4sd Mbguq 2016.3

[3] 田一添,孙钱锋,蒋兴浩.基于指纹的H_264视频内容认证方法研究.计算机科学,2012,29(1):66~68

基于视频教室的音视频编码的研究 篇8

视频教室系统(Videoconference)是指两个或两个以上不同地方的个人或群体通过传输线路及多媒体设备将声音、影像及文件资料互传达到实时互动的沟通从而完成会议目的的系统设备。视频会议系统是集通信技术、计算机技术、多媒体技术、微电子技术于一体的远程异地通信方式,它将计算机的交互性、通信的分布性以及电视的真实性有机地结合在一起。

1 音频编码

通过Internet传输实时的语音或图像与传输普通数据是不一样的,应用网络的组成必须符合这种实时传输的需要。表1列出了国际电信联盟G系列典型语音压缩标准的参数。

表1中的语音质量是在理想情况下的比较,实际上,不同的编码方法在语音质量上的性能,在不同的具体条件(如背景噪声、多重编码、丢帧影响)下有不同的表现。

在实际选择语音压缩的算法时,要综合考虑各种因素。例如,高比特率可以保证良好的话音品质,但要占用大量存储空间,耗费更多的系统资源;而过低的比特率又会影响话音的品质和增加延迟。所以,在较低比特率的前提下,保持较好的话音质量,是选择压缩算法的原则。

我们选用了G.729 A标准采用的算法,可以仅用8Kbps传输话音,话音质量与32Kbps ADPCM(G.724)相同(ADPCM(差分脉冲编码调制)在全球的公共电话网络中被用于提供长话级话音)。G.729A标准在标准PCM或线性PCM的话音采样基础上,每10ms生成一个10字节长的话音帧。这个算法提供了优秀音质,且延时很小,采用G.729A能最好的满足我公司在视频会议系统对音频实时性和高清晰方面的高要求。

静噪抑制技术,节省您的带宽提高其他应用的质量:

所谓静噪抑制技术,是指检测到通话过程或传真过程中的安静时段,并在这些安静时候停止发送语音包。大量的研究表明,在一路全双工电话交谈中,只有36%~40%的信号是活动的或有效的。当一方在讲话时,另一方在听,而且讲话过程中有大量显著的停顿。通过静噪抑制技术,大量的网络带宽节省下来用于其他话音视频或数据通信。

1.1 回声抑制技术

在视频会议的实际应用中,特别是会议室场景中,音箱放出的声音又回到麦克风返回到远程说话人那里,说话人会明显听到系统中有自己的回音。而系统允许多人同时发言,这样发生回声的可能性大大提高。为了防止类似回声对系统效果的影响,我们采用了回声消除技术,使用特殊的软件代码监听回声信号,并将它从听话人的语音信号中排除掉。

1.2 话音丢包处理技术

网络的一个特征就是网络延时与网络抖动,这可能导致音质下降。网络延时是指一个IP包在网络上传输平均所需的时间,网络抖动是指IP包传输时间的长短变化。如果网络抖动较严重,那么有的话音包因迟到而被丢弃,会产生话音的断续及部分失真,严重影响音质。目前互联网的质量,尤其是中国互联网的质量参差不齐。很多时候,用户即使有较高的带宽,但却同样存在较高的网络丢包率和较大的网络抖动,这些都会对用户在实际使用中的视频会议质量尤其是声音质量产生严重影响。

为了防止这种抖动,我们采用了独特的语音数据包缓冲和纠错技术,该技术可以在高达20%丢包率的网络环境下仍然保持声音的连贯性和良好的音质,采用上述技术山大联润视维TM网络视频会议系统在与同类产品竞争中因为语音质量的优秀脱颖而出。

1.3 话音优先技术

话音通信实时性要求较高。为了保证提供高音质的IP电话通信,在广域网带宽不足(拥挤)的IP网络上,一般需要话音优先技术。针对音频和视频的传输特点,我们对RTP线程的设置很高的优先级别,把其音频的级别设置为最高。

2 网络视频技术(H.264/AVC)

我们在系统中首先引入了新兴的视频编解码标准H.264。由国际电信联盟、国际标准化组织(ISO)以及国际电工委员会(IEC)组成的一个联合视频小组的成员对该系统的技术设计基础达成了一致意见。国际电信联盟将该系统命名为H.264/AVC,国际标准化组织和国际电工委员会将其称为14496-10/MPEG-4 AVC。

在互联网技术方面,H.264/AVC同以往的标准如广泛使用的H.262/MPEG-2或H.263等格式相比,在设计上能够更好地处理信息包和数据丢失。在视频质量、压缩效率和数据包恢复和数据丢失等方面,超越了现有的MPEG-2、MPEG-4和H.26X视频通讯标准,得到了显著的提高目前,该系统已吸引了视频和广播行业的极大关注。

H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输,网络亲和性好。

经过我们研究发现,互联网络的丢包率与包的大小及数据包的发送间隔相关如图2。

根据上述结果,我们对不同的带宽条件规定了视频数据包的大小范围,可能把数据大包拆成小包传送,到缓冲区后,再装配;也可能将数据小包组成大包后发送。关键帧的数据包理所当然的被优先传送。

3 音视频数据的流控技术(RTP/RTCP)

RTP(Real-Time Transport Protocol)/RTCP(Real-Time Transport Control Protocol)是一种应用型的传输层协议,它并不提供任何传输可靠性的保证和流量的拥塞控制机制。它是由IETF(Internet Engineering Task Force)为音视频的实时传输而设计的传输协议,定义在RFC 1889中。

RTP协议位于UDP协议之上,在功能上独立于下面的传输层(UDP)和网络层,但不能单独作为一个层次存在,通常是利用低层的UDP协议在组播(Multicast)或单播(Unicast)网络服务中传输实时数据,而实时数据的传输则由RTCP协议来监视和控制。

顺序号(Sequence Number Field)域的长度为16位。每发送一个RTP信息包顺序号就加1,接收端可以用它来检查信息包是否有丢失以及按顺序号处理信息包。

时间戳(Timestamp)域的长度为32字节。它反映RTP数据信息包中第一个字节的采样时刻(时间)。接收端可以利用这个时间戳来去除由网络引起的信息包的抖动,并且在接收端为播放提供同步功能。

同步源标识符(Synchronization Source Identifier,SSRC)域的长度为32位。它用来标识RTP信息包流的起源,在RTP会话或者期间的每个信息包流都有一个清楚的SSRC。

实时传输控制协议(Real-Time Control Protocol,RTCP)也定义在1996年提出的RFC 1889中。RTCP是RTP的控制协议,它单独运行在底层协议上。RTCP是由接收方向发送的报文,它负责监视网络的服务质量、通信带宽以及网上传送的信息,并将这些信息发送给发送端。

RTCP的主要功能包括,数据传输的质量提供反馈,并提供QoS的检测;根据时间戳提供不同媒体间的同步;在会话的用户界面上显示会话参与者的标识。

我们知道,视频流和音频流在时间轴上的连续性要求网络的实时传输及高带宽,同时又允许传输中存在一定的数据错误率及数据丢失率。由于RTP本身并不具有一种独立传输能力,它必须与低层网络协议结合才能完成数据的传输服务。又由于视频和音频在时间轴上的相关性不强,而数据的实时性要高于其可靠性,所以在UDP之上利用RTP/RTCP协议对媒体(视频和音频)流进行封装、打包和同步,可以使数字视音频信号的网络传输延时达到最小。

3.1 自适应带宽适应

在网络会议过程中,经常会出现网络带宽波动的情况。如果带宽的波动幅度使得视频会议本身的音视频数据无法正常传输,就会造成音视频质量的下降。这时候往往会出现以下情形:声音断断续续,视频出现大量马赛克甚至完全模糊不可辨认。这就要求系统对网络带宽的异常波动做出相应的处理。

经过大量的用户调查我们发现,当网络发生波动的时候,用户可以接受视频效果的一点降低但要求声音仍保证连续、清晰。所以,视频会议系统的设计为:当系统检测到网络带宽变化时,会首先降低视频帧率以保证声音的连续性。帧率变化的机制完全建立在对国内互联网络环境的研究和测试的基础之上的,在整个帧率调整过程中,语音的码率是保持不变的。

3.2 宽带环境下的高质量音视频

随着宽带的不断普及,用户对宽带环境下的高质量音视频效果的要求也越来越强烈。针对这样的需求,针对宽带专门做了音视频质量的优化。在宽带环境下,用户的视频幅面可以达到CIF(352x288),25帧/秒,并可放大到全屏,在带宽允许的情况下(每路视频带宽大于500 Kbps),视频质量甚至可以超过VCD的画质。同时,在宽带环境下选择了G.711的宽带语音压缩算法,保证声音更清晰,混音效果更好,同时大幅度降低了对用户机器资源的消耗。

4 总结

视频教室系统在H.262标准不断的发展和完善的同时得到了很大的发展,它应用的日渐普遍表明了视频技术的发展符合了当今社会发展的趋势,得到各界的肯定和支持,它将朝着多功能、高性能、智能化、集成化的方向不断发展,我们相信,视频教室系统在学校教育中的应用将会越来越广泛,越来越好。

参考文献

[1]张启浩.视频会议系统技术架构浅析[J].智能建筑,2005(8).

[2]徐迎川等.基于IP网络的多点视频会议系统的设计与实现[J].电信科学,2004(11).

视频录像 篇9

1 原创内容角度各异

据统计,包括央视网本身在内,共有搜狐、新浪、网易、腾讯等九家网站获得授权进行奥运视频转播。这意味着各家获得的赛事视频资源并没有很大区别,所以转播之外的原创内容就显得尤为重要。

奥运期间,除了和央视合作的奥运视频直播外,搜狐格外强调原创性内容的丰富性,推出了《央视奥运直播》《搜狐体育播报》《搜狐北京播报》三个视频频道。其中,《搜狐体育播报》拥有《冠军面对面》《奥运·紫微·星》《赛事直播点评》等评论及访谈类视频节目,还有《搜狐奥运早报》《搜狐奥运午报》《搜狐奥运晚报》三档新闻播报栏目。搜狐还首创了辩论类视频节目——《奥运辩论会》,邀请专家与网友就奥运热点进行辩论。《搜狐北京播报》则由搜狐CEO张朝阳以奥运官网首席记者的身份出镜,独家对话奥运冠军和其他名人。

与搜狐强调娱乐性相比,新浪的奥运视频则朝着电视化的方向努力。新浪推出了金牌频道,根据赛事及时推出《金牌快讯》节目,每次3~5分钟,介绍金牌诞生情况及冠军简况,并反复滚动播出“金牌榜”和“每日金牌”。此外,还设置了《早新闻》《午新闻》《晚新闻》《夜新闻》《奥运整点播报》五档固定新闻资讯节目,定时播报最新奥运进展。一些业内人士认为,新浪金牌频道越来越像一个专业电视新闻频道,开创了互联网新闻电视化先河。 (1)

总的来看,借奥运东风,门户网站的原创视频出现了井喷式的发展,从原来单一的访谈节目到播报、评论、辩论,仿佛是“忽如一夜春风来,千树万树梨花开”。各网站也借此积累了丰富的视频报道和制作经验,为其软实力增长带来非同凡响的意义。

2 重视页面设计及导航功能

网上海量的视频内容如果杂乱无章,对网民的吸引力将大大减弱。所以,如何简洁有序地组织节目及设计页面,对突出视频内容起着关键作用。搜狐和新浪的优势在此次奥运大战中凸显无遗。

2.1 出色的页面设计

新浪奥运视频的页面简洁易读、重点突出。搜狐则擅于集纳丰富的信息量,将网页分为几大部分,分别突出不同的视频节目,其图片、文字都安排得错落有致,繁而不乱。搜狐还非常重视每个视频栏目LOGO的设计,不仅时尚现代,而且不惜用相当多的页面篇幅来强调和推介。

2.2 便捷的导航功能

网站导航功能是通过菜单设置或其他形式方便用户浏览网站信息,让用户在整个浏览过程中不至迷失,并可以方便跳转到其他内容。

腾讯和搜狐都在视频页面上方增设了多条菜单,用于补充说明各频道下设的丰富栏目,并在具体的视频页面中嵌套快速导航框。一旦用户对浏览页面的视频不感兴趣,就可以点击快速导航框,重新选择其他内容。

2.3 立体的展示方式

视频内容是活动的,但是它在网页上的展现方式却是“死板”的,因为它只能靠静止的内容截图和文字说明来吸引网民。在奥运期间,搜狐原创视频的展示方式却出现了别出心裁的设计,更直观、更立体。

搜狐将视频节目中的亮点内容提炼成标题,与视频截图结合,做成如杂志般的视频“封面”。在这些“封面”中,图片只占了2/3,但由于其杂志化的设计美观大方,又融合了文字信息,视觉冲击力反而胜过单纯的一张内容截图。另外,搜狐还悉心设计了视频节目的文字说明,尽量在文字表述中传递更多的细节信息。

无论是将视频节目的展示图片做成杂志封面,还是在文字说明中大做文章,搜狐都是在将原先扁平的视频节目展示方式向纵深的立体化方向拓展,目的是快速吸引网民的注意力。

3 运用互动手法吸引网民深度参与

网络视频优于传统广播电视的最大特点就是互动性。在此次奥运视频报道中,几家网站把与用户之间的互动演绎到了极致。

留言板、聊天室、论坛这些刺激网民表达与交流的网络工具几乎成为每个视频节目的必备配置。网民在欣赏奥运视频的同时,可以就赛程中的任何关注点发言。不但可以和视频附带聊天室中的发言者辩论,也可以在视频下面的留言板发表自己的观点,或通过视频下方的链接,跳转到论坛或者圈子进行深度讨论。

实际上,这次网络视频报道最出色之处并不在于设置了这些互动工具,而是通过这些工具,不论从制作理念上还是从生产流程上都已将网民深度卷入,让他们成为节目本身的组成元素。例如央视国际推出“网民解说”,选择了乒乓球、篮球、体操等6个热门项目,在直播的同时邀请网民进行独具特色的解说;搜狐的《奥运辩论会》邀请网友与主持人、嘉宾就热点事件进行辩论;腾讯的《建宏一点谈》则邀请网友参与确定节目的选题以及细节。可见,视频节目的各个环节已经无处不见网民的身影,由网民主导、掀起广泛互动的视频节目才是真正区别于电视,代表web2.0精神的作品。

4 多媒体手段创新用户体验

有人曾说,用户体验与粘性决定了网络视频的生死。奥运期间,各网站的视频频道都十分重视创新用户体验,不光利用技术手段将博客、社交网络等新媒体工具与视频内容对接,还加入了FLASH动画、视频游戏、虚拟地图等多媒体元素,让视频有了耳目一新的感觉。

央视网推出网络视频客户端——CCTV网络电视奥运台,用户不仅可以通过直播和点播的方式收看所有赛事节目,还可以建立博客、空间、圈子,与朋友一同分享和互动。另外,视频客户端内还设置了“图片墙”、“虚拟地图”、“节目单”、“游戏”四个选项,用户可以收看奥运期间精彩的图片,查找场馆地图及其他服务信息,查询节目单,还有18款奥运小游戏可以选择。可以说,央视网的视频客户端充分研究了用户的心理需求和特点,集纳了一切可以想到的多媒体元素,旨在为用户提供“一站式”体验。

搜狐、新浪、腾讯、网易这些商业网站在创新用户体验方面更是不遗余力。值得注意的一点是,腾讯利用即时聊天工具主动推送消息的模式被其余几家门户网站争相效仿。搜狐利用搜狗拼音输入法弹出新闻,网易与新浪或在网页上弹出新闻、或和外部合作伙伴进行尝试,均是变传统等待用户浏览为主动向用户推送。

5 用户自制内容锦上添花

奥运期间,虽然各家网站的视频报道仍以编辑部原创为主体,但用户上传的视频仍以其独特的角度散发出别样魅力,而且数量上也达到了以往没有的规模。

央视网选出了2008名拥有奥运会门票的手机用户作为“CCTV奥运手机观察员”,让他们用手机随时拍摄与奥运相关的图片或视频,通过央视手机网传送至60分钟大型互动节目《今日我之最》,在央视网上也开设专栏展示全部作品。

这些手机观察员身份各异,杨澜、莫慧兰等文体明星都是其中一分子,还有学生、普通职员,有中国人,也有外国人,有摄影爱好者,也有体育爱好者、火炬手,甚至奥运歌曲创作者,他们不同于专业记者的视角,各式各样的社会身份,给节目内容增添了新鲜感。 (2)

新浪推出了“走进奥运英雄家”视频栏目,派出200多位拍客奔赴全国各地,带回了包括郭文珺、谭雪、佟文、刘子歌等10多位奥运冠军以及姚明、易建联等著名运动员家乡的逾40段独家内容和近500段原创视频。 (3) 相较于网站编辑部的原创视频,网友的作品虽然比较庞杂,质量参差不齐,但是其中不乏角度新颖的闪光之作,很可能一鸣惊人,所以,用户自制内容仍是网络视频比较重要的补充部分。各大网站都对此进行了精心的组织和策划,一方面是善于利用平时积累的用户资源,另一方面是对用户进行主题引导,并给予必要的帮助,这样用户自制内容才有用武之地。

6 强大的视频搜索为受众提供便利

浏览几家网站的奥运视频页面,发现它们有一个共同的特点,就是都拥有强大的视频搜索功能。网友可以按照场馆、时间、比赛项目进行分类搜索,也可以按照热门搜索词以及精彩专题点击观看最新奥运赛况,还可以按照相关度或时间选择搜索结果的排序。

各网站都将视频搜索与新闻、图片、资料并列为四大搜索门类,并在网页显著位置予以突出。网易在奥运视频中心的页面中间设置视频搜索框;新浪在页面右下方设置多个搜索框,用户可以通过人物、项目、日期、关键词等各种可以想到的搜索方式来查找所需视频;腾讯则根据每个视频节目的特点分别制作了不同的搜索项。大多数网站都建立了视频日历以及按比赛项目分类的搜索框,一些网站还将运动员的历史成绩都收录在资料库中,方便网民进行延伸阅读。沸点、悠视等网络电视均采用先进的视频搜索技术,搜索内容可精确到帧。

7 启示

此次奥运报道,几乎所有的门户网站及视频网站都进行了精心准备,大大提升了网络视频的影响力。更重要的是,奥运之后,大部分视频节目的创意和做法仍将延续下去,使整个行业站在更高的起点上继续前行。从这次奥运视频大战中,我们可以得到这样一些启示:

1)网络视频原创内容比重逐渐上升

自网络视频风行以来,内容资源的匮乏一直是困扰产业发展的难题。视频分享网站“自下而上”,主要依靠网友上传自制内容,门户网站则“自上而下”,不仅积极从传统广电机构获取节目资源,而且不断加大原创内容的比重。奥运之际,门户网站的视频内容光彩夺人,这不仅是对其长期积累的视频制作能力的回报,更证明了以传统门户运作图文内容的媒体属性来运营视频内容的发展模式是可行的。 (4) 原创是门户视频服务差异化竞争的必须手段,只有加大原创视频的力度,在激烈的竞争中才能抢得更多先机。

2)网络视频形式与内容同等重要

网络视频的特点决定了视频频道绝不能仅仅是单纯的视频内容展示,也不能采用填鸭式的推送方式,而应该集丰富的内容资源、精妙的网页设计、出众的呈现方式及灵活的推送手段于一体。可以看出,通过这次奥运报道,门户网站在探索网络视频的表现形式上也有了一定的突破,出现了一种区别于传统图文内容的专门的展示手段。相信经历这次成长,将来的网络视频会有更成熟的表现。

3)网络视频已从1.0向2.0迈进

网络视频1.0是单纯的“视频+图文”,而2.0的全部精髓在于“互动”。无论是在视频频道中融入博客、社交、聊天室、论坛,还是在视频之外添加游戏、FLASH等多媒体元素,都是利用新媒体内容与传播方式建立一个能够与用户实现广泛互动的多功能网络。在这次奥运报道中,用户不仅深度参与互动,甚至决定了视频内容的方方面面。可见网络视频2.0已经由起初单纯的概念运作转向了实际应用的探索,拉开了新视频时代的序幕。

注释

1[1]刘兴亮.奥运传播中新媒体凸显营销价值[J].新营销, 2008年第10期.

2[2]陈怡.新媒体奥运报道四大看点[J].中国记者, 2008年第9期.

3[3]参见“新浪奥运报道全面领先”专题.http://tech.sina.com.cn/focus/2008_sina/.

视频录像 篇10

视频质量评价方法分为主观和客观质量评价方法。客观质量评价方法是模拟或是预测人眼对视频质量的评价。然而, 这些客观质量评价方法与人眼主观质量评价之间的准确性和一致性却不尽相同。这样的局面是多方面的原因造成的。首先, 到目前为止, 人们对人眼视觉系统 (HVS) [1]的认识有限;其次, 造成视频质量下降的表现很多, 诸如模糊、噪声和块效应等;再者, 视频质量与本身的内容有很大关系, 任何一个客观质量方法都不可能在所有的视频内容上得到验证;最后, 缺少对客观评价方法进行大规模的、可靠的比较。结果, 主观质量评价方法仍然是最可靠的质量评价方法。

压缩编码对视频传输来说是必不可少的, 此过程由视频编码器实现, 目的是把数据量很大的视频流压缩成为适应不同带宽信道的文件。在这个过程中要实现在码流速率以及视觉感知失真之间的折中, 即率失真优化过程。具体可以描述为在比特率R满足小于定制的码率R0[2]这样一个限制下, 使得压缩后的视频感知失真D最小。

这是一个典型的最优化问题, 其中视觉感知失真D用客观质量评价来衡量。因此, 客观评价算法的选取对率失真优化过程乃至最终编码器的性能都有很大的影响。

国际标准化组织———运动图像专家组 (ISO MPEG) 和国际电信联盟电信标准化部门———视频编码专家组 (ITU-T VCEG) 联合开发的新一代的视频编码标准———HEVC[3]在2013年1月25日国际电信联盟电信标准化会议上通过后, 许多专家学者对HEVC编码性能进行了研究。J.R.Ohm等[4]通过用峰值信噪比 (PSNR) 和主观评价结果计算出的Bjontegaard比特率差量 (BD-Rate) [5], 来比较HEVC测试模型HM8.0与之前存在的编码标准之间的编码效率。Y.Zhao等[6]用PSNR, SSIM[7]和图像质量指数 (PQI) [8]评价HM5.0的性能, 但只给出了不同指标的平均BD-Rate, 没有针对不同客观评价方法进行进一步的分析。

本文针对1 080p的视频序列, 首先, 把BD-Rate的概念推广到12个常用的全参考客观质量评价方法, 来对HEVC的测试模型HM9.0和H.264/AVC的开源编码软件x264的编码效率进行对比。然后, 对视频材料进行主观质量评价, 进而得出主观评价的BD-Rate。反过来通过比较主客观评价所得到的BD-Rate在不同视频序列之上的接近程度、皮尔逊相关系数 (PLCC) 和斯皮尔曼等级相关系数 (SROCC) 来评估客观质量评价方法的性能。

1 Bjontegaard测度介绍

VCEG建议用Bjontegaard测度来计算两种编码方式的编码增益。由于PSNR指标具有计算简单等特点, 被广泛用来评价编码器的性能。最初的Bjontegaard也测度模型中选择PSNR去评价两种编码方式对视频的编码损伤。Bjontegaard测度包括BD-Rate和Bjontegaard PSNR差量 (BD-PSNR) 两个指标。BD-Rate表示在同样的客观质量下, 较优的编码方法可以节省的码率百分比;而BD-PSNR表示了同等码率下, 两种编码条件下压缩后视频PSNR值的差异。

考虑到在率失真曲线上, 高比特率区域在相同的百分比下的范围比低比特率区域大, 如33%的码率节省在1 500~2 000 kbit/s范围是375~500 kbit/s范围的4倍[5]。所以, 率失真曲线图的比特率坐标轴取了对数。

不失一般性, 以某一测度为例, 通过率失真曲线图, 阐明Bjontegaard测度值的计算方法, 如图1所示。

具体步骤如下[9,10,11]:

第一步, 压缩好视频后, 用客观评价方法评价视频, 然后给每个视频序列描绘出不同的率失真点系列。

第二步, 观察画出的率失真点系列, 确定积分区间, 如水平方向[a, b], 垂直方向[c, d]。

第三步, 对点序列进行多项式拟合, 用确定的多项式表示, 如s1和s2。

第四步, 对拟合后的多项式在积分区间上积分。根据积分的结果, 计算Bjontegaard测度值

在式 (2) 和式 (3) 中, s1和s2有区别, 式 (2) 中是比特率的函数, 而式 (3) 中是质量指标的函数。BD-Rate一般为负值, 代表在两种编码方式中较优的一种比较差的一种节省的码率百分比。

在本文中, 把Bjontegaard测度中的PSNR推广到常用的图像质量评价方法, 以用HEVC测试软件HM9.0和H.264/AVC开源软件x264压缩的1 080p的视频材料为载体, 来估计这些图像质量评价方法在评价由压缩带来的损伤时的性能。

2 客观质量评价算法和视频序列的选取

2.1 客观质量评价模型

视频质量评价算法往往由图像质量评价方法推广而来, 通过对视频中的每一帧进行评价后整合得出对视频质量的评价结果, 如SSIM, 视觉信息保真度 (VIF) [12]和视觉信号噪声比 (VSNR) [13]等经常用于视频质量评价。本文选取了一组常用的全参考图像质量评价算法, 具体介绍如下:

PSNR由于计算简单等特点被广泛用来评价图像和视频质量, 是参考图像和损伤图像二者均方差的函数。

图像质量等级 (PQR) 由泰克公司的PQA序列计算出。其融合了HVS特点, 对比参考图像, 计算出被测图像的质量等级。关于PQR的更多信息可参考[14]。

SSIM根据图像的结构相似度来对图像质量进行评价, 是目前使用最多的算法之一。

多尺度SSIM (MSSIM) [15]是在SSIM上改进而来的一种算法。

信息保真度准则 (IFC) [16]表示图像信息保真度, 理论上其值范围为0 (表示图像无保真) 到无穷大。

信噪比 (SNR) 类似于PSNR, 用信号的实际大小代替PSNR中的峰值即可得到。

视觉信噪比 (VSNR) 是基于小波变换来计算视觉信息信噪比。

加权信噪比 (WSNR) 模拟人类视觉注意模型, 用加权的方法计算SNR, 加大了对图像中的某些区域的权重。

通用质量指数 (UQI) [17]把图像损伤度归结为3个因素:相关度降低、亮度和对比度失真。

噪声质量指标 (NQM) [18]揭示了加性噪声对信噪比的非线性权重影响。

VIF是通过在小波变换域中计算视觉信息保真度来对图像进行评价。

像素域的VIF (VIFP) [19]类似于VIF, 但是在像素域中计算得出。

以上质量评价算法除了PQR指标由泰克公司的PQA600测试得到外, 其余算法均可以从图像质量评价工具箱中[20]获得。

2.2 视频序列的选取

在实验中, 选取了12个全高清的视频序列, 这些视频序列均从慕尼黑工业大学的网站[21]上下载得到。表1列出了所有视频序列的基本信息。

所选取的视频序列在时间和空间复杂度均不相同。根据文献[22]中计算视频序列时间 (TI) 和空间信息 (SI) 的方法进行了分类。选取的视频序列的时间和空间信息分布如图2所示。

3 实验设置和结果分析

3.1 视频编码参数设置

在文献[23]中介绍了HEVC测试软件HM9.0编码可选项, 编码算法复杂度 (HE10和LC) 和4种基本的编码设置一共有8种测试条件。在本文的实验中, 选用了随机访问编码设置 (Random-Access) 配置文件来进行编码配置, 编码的量化参数选取了22, 27, 32, 37, 42共5个点。对应地, 用x264进行编码时, 量化了参数也选取了相同的点。其余编码参数设置见表2。

对视频序列的压缩完成后, 用第3部分中介绍的客观质量评价算法对编码后的视频进行评价, 所有的视频质量评价值都是通过逐帧计算视频的亮度分量, 然后再取平均得出。然后对每一个客观质量评价算法、每一个视频序列画出两条率失真曲线的图。基于视频序列的率失真曲线图, 进一步计算出Bjontegaard测度指标值。

3.2 主观质量评价方法

在主观质量评价中, 选用ITU-R BT.500-13[24]推荐的双激励失真方法 (DSIS II) ) 。在这种评测方法中, 首先播放参考序列, 接着播放测试序列。这样的过程重复一次后, 提示评估者对测试视频序列进行评分。评分采用5分制, 用1, 2, 3, 4, 5分代替非常差 (Bad) 、差 (Poor) 、一般 (Fair) 、好 (Good) 和非常好 (excellent) 5个质量等级。共有16个评估人员参加了此次视频质量评价。

另外, 在主观质量评价中, 在正式评测之前有一个训练过程, 使评估人员熟悉具体的评价步骤。用来训练的视频序列损伤程度与5级评分制对应, 组织人员向评测人员解释了二者的对应关系。整个主观评价环境按照ITU-R BT.500-11[24]来布置, 评测人员的观看距离为电视屏幕的3倍。

3.3 实验结果分析

对每一个客观质量评价算法, 每一个视频序列均可计算出一个对应的BD-Rate。对同一客观质量评价算法在不同的视频序列上计算出的BD-Rate取平均后, 将最终结果作为此客观质量评价算法对两种编码条件下产生的BD-Rate。同样, 主观质量评价结果也可以计算出一个BD-Rate, 见表3。

注:相关系数由不同视频序列上的BD-Rate得出。

首先, 从表3主观质量评价结果可以看出, 对于选取的视频序列, HEVC的编码效率要比H.264的高档次高出43%。HEVC标准在提出之时的目标是与H.264/AVC高档次相比, 在视觉感知质量一致的情况下, 比特率节省50%。在文献[4]的主观评价结果中, HEVC比H.264/AVC的高档次相比, 在不同视频序列上比特率可以节省30%到67%, 平均节省49.3%。文中未能达到50%, 可能与选取的视频序列有关。另一方面, HEVC编码标准刚刚通过, 很多编码算法还有待于进一步的优化和改进。就编码效率来说, HM9.0还有很大的空间来提升。

其次, 由主观质量评价得到的平均BD-Rate是最可靠的。而由不同的客观评价算法计算得到的平均BD-Rate各不相同, 通过计算这些值与主观结果的接近程度、一致性、精确性, 就可以体现不同客观评价方法的性能, 这一点也恰恰是本文的目的所在。图3给出了不同的客观评价算法计算出的平均BD-Rate与主观评价的平均BD-Rate的差的绝对值, 可以更清楚地看出客观评价算法与主观评价结果之间的差异。可以看到, SSIM与主观评价结果的差只有0.126 072, 是所选的客观评价算法中是最小的。也就是说, SSIM是在文中选择的客观评价算法中对压缩编码造成的损伤的评价最准确的一个, MSSIM紧跟其后。由UQI、UQI、VIFP、PSNR、SNR、IFC和WSNR计算得到的平均BD-Rate与主观评价的结果差值在2~4以内, 因此, 从视频编码器的编码效率角度来说, 可以认为它们的性能比较接近。而用来做很多编码器性能测试指标的PQR得到的结果与主观得到的结果差距最大。

从与每个序列主观评价得到的BD-Rate的准确性和一致性角度来分析不同的客观质量评价算法性能, 每个客观算法在每个序列上计算出的BD-Rate与主观评价结果在每个序列上计算出的BD-Rate之间的PLCC, SPOCC值在表3中给出。从表中可以看出, SSIM仍然是本文所选的客观算法中性能最好的一个。

本文以12个全高清视频序列为载体, 经过HEVC和H.264/AVC编码标准的编码器压缩后, 用客观质量评价算法对压缩后的视频进行质量评价, 计算出每一个客观评价算法对每一个视频序列的BD-Rate。分别从与主观评价得出的平均BD-Rate的接近程度、精确性和一致性程度角度, 对选取的客观质量评价算法进行了分析与比较。这样从一个新的角度对不同的客观质量评价方法的性能有新的认识。主要反映的是不同的客观质量评价算法对有压缩编码带来的损伤的敏感程度以及对特定的编码损伤的评价是否符合人眼感知。SSIM对编码带来的图像降质的评价从编码效率角度与人眼感知比较接近, 与很多对客观质量评价算法性能评价的结果一致, 这也从某种程度上论证了本文方法的合理性。

4 小结

视频录像 篇11

华录文化公司相关负责人透露,目前“华录坞”已与卓越、当当等国内外电子商务平台及知名商品品牌达成长期战略合作,今后,用户在观看“华录坞”影视节目的过程中,可通过“华录坞”购买影视节目中出现的心仪商品,而“华录坞”的在线即时互动评论功能则可以为同时观看影片的观众提供交流平台。

据了解,华录文化产业有限公司隶属于中国华录集团,后者是国务院直属管理的162家企业中惟一立足于音视频行业的央企。业内人士认为,华录此次依靠产业链的国内独家优势、突破传统视频媒体的单一形态,开创的“视频综合商务平台”运营模式是有益的尝试。据悉,华录文化的视频商业模式,其实是建立在原创整合基础之上的—旗下华录百纳拥有强大的电视剧资源。目前北京电视台播放的电视剧40%都来自华录百纳,其商业模式也非一般视频网站容易复制。

视频录像 篇12

在这初始部分, 要点就是不断地看。通过观看提供的视频作品, 了解电视电影中的一些镜头所表达的意思。提供的视频作品, 是几年来累计的学生的优秀作品, 这也是激励当前学习的学生, 在同样的基础和设备之下, 通过努力一样是可以做到的。在这一部分, 要求学生去观察作品中各片段所运用的景别, 拍摄的手法及视频片段衔接的方式。

1.1 常用的选景方式

远景:是视距最远的景别, 包含整个拍摄主体及周遭大环境的画面, 它表现开阔, 如专区规模、大型集会等。

全景:摄取人物全身或较小场景全貌的影视画面, 在全景中可以看清人物动作和所处的环境。

中景:俗称“七分像”, 指摄取人物小腿以上部分的镜头, 或用来拍摄与此相当的场景的镜头, 常用于表现人物手臂的各种动作、人与人之间的圣诞联系和情感交流。

近景:指摄取人物胸部以上的动作和神态, 有时也用于表现景物的某一局部。

特写:指摄影、摄像机在很近距离内摄取对象。通常以人体肩部以上的头像为取景参照, 突出强调人体的某个局部, 或相应的物件细节、景物细节等。

大特写:又称“细部特写”, 指突出头像的局部, 或身体、物体的某一细部, 如眉毛、眼睛等。

实践经验:取景最多的是中景+近景。前后镜头取景必须符合观众的思想方式和影视表现规律, 要“循序渐进”, 在拍摄方向要遵循轴线规律。

1.2 摄影、摄像机的运动 (拍摄方式)

摄像机的拍摄方式, 包括推、拉、摇、移、跟、升、降、俯、仰、甩、悬、空、切、综、短、长、反打等多种拍摄手法。下面主要介绍几种常用拍摄手法。

推:即推拍、推镜头, 指被摄体不动, 由拍摄机器作向前的运动拍摄, 取景范围由大变小, 分快推、慢推、猛推。

拉:被摄体不动, 由拍摄机器作向后的拉摄运动, 取景范围由小变大, 也可分为慢拉、快拉、猛拉。

摇:指摄影、摄像机位置不动, 机身依托于三角架上的底盘作上下、左右、旋转等运动, 使观众如同站在原地环顾、打量周围的人或事物。

移:又称移动拍摄。从广义说, 运动拍摄的各种方式都为移动拍摄。但在通常的意义上, 移动拍摄专指把摄影、摄像机安放在运载工具上, 沿水平面在移动中拍摄对象。移拍与摇拍结合可以形成摇移拍摄方式。

实践经验:在拍摄时, 尽可能多使用固定镜头, 即站好固定位置, 用DV对准目标, 取景拍摄, 以保证画面的稳定。但是固定镜头不要拍得过长和太短, 长则无“生气”, 短则“零散细碎”。进行景物全景拍摄时, 进行将摄影机由右到左或是左到右的扫摄时, 正确的做法是以腰部为分界点, 下半身不动上半身移动。

1.3 影视的画面处理技巧

影视作品中的视频片段, 衔接方式有很多种, 如淡入、淡出、化、叠、划、出入画、定格、起落幅、闪回、蒙太奇等等, 下面介绍几种最常用的技巧。

淡入:又称渐显。指下一段戏的第一个镜头光度由零度逐渐增至正常的强度, 有如舞台的“幕启”。

淡出:又称渐隐。指上一段戏的最后一个镜头由正常的光度, 逐渐变暗到零度, 有如舞台的“幕落”。

化:又称“溶”, 是指前一个画面刚刚消失, 第二个画面又同时涌现, 二者是在“溶”的状态下, 完成画面内容的更替。

叠:又称“叠印”, 是指前后画面各自并不消失, 都有部分“留存”在银幕或荧屏上。它是通过分割画面, 表现人物的联系、推动情节的发展等。

蒙太奇:法文montage的音译, 原为装配、剪切之意, 指将一系列在不同地点、从不同距离和角度、以不同方法拍摄的镜头排列组合起来, 是电影创作的主要叙述手段和表现手段之一。

实践经验:通常视频衔接使用硬切, 即不用任何画面技巧。很多故事型作品会使用蒙太奇技巧。

2. 摄像的实战操作

在这一部分, 主要是让班级学生分成小组, 以小组形式进行实地拍摄活动, 进行真人实地的拍摄过程。在这一部分主要分摄像的设备标识、策划准备、基本要领等。

2.1 摄像的设备标识

电子产品更新迅速, 型号种类繁多, 对于拍摄的设备, 主要掌握电源开关、摄像开始与

停止控制、电池更换与充电操作、摄像存储器的装卸及播放即可。我院提供的摄像机主要是索尼公司的43E和201E。

2.2 拍摄的策划准备

摄像前的策划工作是整个摄像过程必不可少的环节。这种预备性的工作主要包括摄像内容的策划和摄像设备的准备两个方面的工作。

(1) 摄像内容的策划

摄像内容的策划是一种有目的、有计划、有组织进行摄像的前期准备工作, 具体包括项目命题、脚本编写、任务及日程安排等方面的工作。

●项目命题:实际上是一个确定摄像总体目标的工作过程, 如毕业留念、校园生活、军训纪事等。

●脚本编写:按照拟订的命题完成相应摄像任务的总体方案及其实施细则, 相当于电影作品的剧本。

●任务及日程安排:根据脚本制定出具体的工作任务和详细的日程安排, 并在实施过程中及时记载完成情况。

实践经验:良好的开端是成功的一半。正式拍摄前一定要进行脚本的编写, 越详细越好, 准备得越充分, 后期的拍摄工作会越顺利。

(2) 摄像设备的准备

在实地摄像之前, 一定要做好设备的准备工作。摄像设备的准备主要是针对摄像设备完好状况的检验和摄像附件的完备情况的检查。

●摄像检验操作:摄像机通电能正常运行, 进行开关状态、时间设置、变焦操作等检验和调整。建议拍摄一段录像并播放, 保证设备正常。

●供电配件检查:电池是否已经充足电, 后备电源是否准备。●存储附件检查:检查DV带的数量是否够用。

●附加设备准备:摄像对象比较固定的场合, 带好三脚架;人物专访, 应附加麦克风。

2.3 摄像的基本要领

摄像操作是一种技能, 掌握好基本摄像要领才能拍摄出具有一定专业水准的优质画面和良好作品。摄像操作的基本概念可以用“平、稳、准、清、匀”五个字来概括。

●平是指静止或运动状态拍摄时, 摄像机一定要端平操作。

●稳是指在静止或运动状态拍摄时, 应始终保持画面的平衡, 尽量不抖动。拍摄过程中凭靠一些固定的支撑物和稳定点来确保你的画面质量

●准是指实地拍摄对象的准确无误, 运动节奏的和谐均匀, 重现被摄景物的真实色彩。清是指摄取的画面力求清晰, 摄录的声音力争清楚, 养着重要求调整焦距快速和准确。

●匀是指摄像镜头移动的速度应该均匀, 拍摄画面变化的速度和节奏力求协调合拍, 整个镜头的运动速度变化力争均匀平稳。

实践经验:稳定高于一切, 凡是有利于图像稳定的东西一定要坚持, 正确的持机方式就是好的摄像作品的开始。有条件的话, 最好使用三脚架, 正确均匀的呼吸方式也是尤为重要的。另外记住先决定要拍摄什么才开机拍摄, 而不是开着摄影机到处找目标。

总之, 以上提供这些方式仅仅是拍摄时的参考, 最重要的是要多进行实践摄, 及时总结经验, 才能提高拍摄技巧。

摘要:我院开设《音视频媒体采编》课程已经多年, 本课程是专业基础课, 课程目标主要是能掌握一定的拍摄技巧, 掌握视频作品的基本流程, 完成视频作品的设计与制作。在本课程中, 如何让从来没有接触过摄像的学生从零基础到能掌握基本的拍摄手法, 下面简单的从几个方面来谈。

关键词:景别,拍摄手法

参考文献

[1]影视制作综合实训, 于恩普主编, 电子工业出版社,

上一篇:谈心艺术下一篇:艺术手段