视频图像技术(共10篇)
视频图像技术 篇1
0 引言
机载航空摄影主要特点是:几何分辨率更高, 视场角较大。因此, 位于扫描航片边缘的图像变形较大;另外, 航空平台的姿态远不如航天平台稳定。
但是, 航片获取的时效性很高, 图像分辨率相对于卫星遥感数据也比较高, 在很多对时间反应要求较高的应用领域, 航空摄影图像发挥着越来越大的作用。因此对于航片的处理有很高的实用价值。
系统几何校正是航空视频图像处理中的重要环节, 通常在遥感图像处理的前端。针对视频处理所采集的单帧视频图像, 并利用该图像对应的遥测数据, 建立几何校正模型, 对图像进行系统几何校正计算, 完成图像的系统级的初步定位, 校正因为传感器倾斜拍摄导致的图像像素的局部变形;系统几何校正处理关系到航拍图像的定位精度, 对于以后的地理精校正、情报应用处理等处理打下基础。
1 系统几何校正模型
本文利用坐标变换方法建立原始图像和输出图像的几何关系, 即几何校正模型, 其步骤如下:
① 建立从当地地理坐标系到相机的空间坐标系群;
② 完成各个坐标系之间的相互转换关系;
③ 把原始图像剖分成适当大小的矩形网格;
④ 根据坐标系转换关系建立几何校正模型;
⑤ 利用几何校正模型, 计算网格点 (i, j) 在WGS-84坐标系下的大地坐标 (LWGS-84, BWGS-84) ;
⑥ 利用 (LWGS-84, BWGS-84) 进行地图投影变换, 得到投影坐标 (Xi j, Yi j) ;
⑦ 再把 (i, j) 、 (Xi j, Yi j) 作为控制点, 利用多项式拟和方法, 对原始图像进行校正, 以下简称为“图像重构”。
1.1 系统概述
本文仅概述图像信息中与几何校正建模有关部分。图像信息获取由机载侦察设备 (光电平台) 完成。对于光电平台, 可以装载CCD光电摄像机 (简称CCD相机) 、前视红外热像仪 (简称红外相机) 。
飞机采用GPS和惯性导航系统进行组合定位、测量姿态;平台采用四框架两轴稳定。
1.2 坐标系
在几何校正模型中采用以下坐标系:
① 地球坐标系 (e系) , 采用WGS-84坐标系;
② 当地地理坐标系 (t系) ;
③ 机体坐标系 (b系) ;
④ 光电平台坐标系, 简称平台坐标系 (p系) ;
⑤ CCD相机坐标系 (c系) ;
设图像共Ic行、Jc列, 中心坐标是 (Ic/2, Jc/2) , 像元cp在图像中的行、列数分别为Icp、Jcp, 像元大小为lc×lc, 相机焦距为fc, 则其相应扫描角αc, 偏角βc, 根据画幅式相机摄像原理有:
(6) 红外相机坐标系 (h系)
设图像共Ih行、Jh列, 中心像元坐标是 (Ih/2, Jh/2) , 像元hp在图像中的行、列数分别为Ihp、Jhp, 像元为方像元lh×lh, 因为图像为正像, 则:其相应的扫描角αh和偏角βh, 则根据全景摄像原理有:
1.3 坐标转换
系统校正的目的是利用目标图像和飞机位置、姿态, 以及平台的参数计算该目标在WGS-84坐标系中的大地坐标, 算法核心是对以上坐标系中进行准确的坐标变换。本文用到的坐标系变换有:
① 由地球坐标系到当地地理坐标系的坐标变换。其变换矩阵R1为:
式 (1) 和以下各式中的Rx (θ) , Ry (θ) , Rz (θ) , 分别表示绕X轴、Y轴和Z轴旋转θ角的坐标旋转矩阵。B0表示飞机当前纬度;L0表示飞机经度。
② 由当地地理坐标系到机体坐标系的坐标变换。其变换矩阵R2为:
式中, Ψ为航向角;θ为俯仰角;γ为横滚角。
③ 由当机体坐标系到平台坐标系的坐标变换。其变换矩阵R3为:
式中, η为方位角;ζ为平台滚动角。
④ 由平台坐标系到CCD相机坐标系的坐标变换。其变换矩阵R4为:
⑤ 由平台坐标系到红外相机坐标系的坐标变换。其变换矩阵R5为:
从CCD相机坐标系到地球坐标系的转换, 利用上述变换矩阵得:
从红外相机坐标系到地球坐标系的转换, 利用上述变换矩阵得:
1.4 激光测距的应用
如果在计算过程中, 光电平台上加载激光测距仪, 能够输出成像时刻的激光测距值, 校正计算的精度将大大提高, 尤其在较高海拔地区。
在原模型中未加入激光测距数据, 因此计算过程中, 默认拍摄地区海拔为0;当平台高低角不为0时 (平台相机光轴指向不是垂直向下) , 计算结果与实际地理坐标有很大出入, 如果海拔较高, 该误差将非常明显, 这样的图像定位结果将无法实际使用。如果加入激光测距, 可以有效计算拍摄图像地区的海拔高度, 降低原模型误差。
1.5 图像输出
建立系统校正模型后, 输入划分的图像网格点坐标, 输出投影坐标。这些点的图像坐标和投影坐标形成一组控制点集, 使用该控制点集, 对原始图像数据进行多项式校正计算, 重采样生成输出图像数据, 根据当前拍摄区域中心点位置, 设置图像投影条带, 指定图像投影信息, 最后输出为图像文件。
2 实验结果以及误差分析初步
根据上述模型, 输入图像文件, 并同时获取与图像生成时所对应的遥测数据, 从中分离出建立模型所需的飞行器位置、飞行器三姿、平台姿态、相机参数、激光测距值等数据。利用这些遥测数据建立系统校正模型, 对输入的图像进行校正计算, 生成图像数据, 写入输出图像文件中。因工程应用需要, 还要在图像中加入地理坐标数据, 图像投影信息等。为后续的图像处理以及情报应用处理提供支持。
在进行图像校正定位过程中, 由于多方面因素, 会导致产生光轴指向误差。造成该误差的因素包括:系统安装误差、飞机位置误差、飞机姿态误差、平台姿态误差、结构安装误差、相机内方位元素误差等。
对于飞机姿态误差、平台姿态误差、相机内方位误差, 通过各个设备出厂调试, 以及在系统联试过程中进行设备调校。
飞机位置, 是由机载GPS定位系统提供, 在实验中, 使用差分GPS以及组合惯导, 通过插值运算得到精度更高的飞机空间坐标, 理论上可以达到10 m以内的误差。
对于结构安装误差, 这也是一个系统误差, 通过地面检测, 可以测出部分误差结果;然后在模型中加入误差修正量, 弥补误差因素对校正计算精度影响。在实验过程中比较常见到, 并且对校正输出结果影响较大的是平台的安装误差, 该误差有时达到十多度, 这意味着, 在飞行器据地几千米的空中, 该误差量直接导致最终图像校正结果将有上百米, 甚至于几百米的定位误差。为了降低该误差, 首先在系统安装时, 进行系统误差校准。另外, 还需要在实验前, 对已安装的平台进行地面测量, 测定该误差值。并将该值加入到校正模型中的误差消除模块, 降低这种系统误差对校正精度的影响。
3 结束语
本文利用坐标变换方法给出了机载CCD电视摄像机和前视红外热像仪遥感图像的几何校正模型, 实施视频单帧图像的几何校正计算, 完成该图像的定位。同时结合实验, 通过对激光测距数据的引入校正模型, 对平台安装误差进行分析和计算, 提高校正精度。在实际应用中, 该方法取得良好的图像定位效果, 但同时也存在不足, 图像定位经度目前还不算太高, 在今后的工作中, 需要继续研究, 以达到更好的结果。
参考文献
[1]张永生.遥感图像信息系统[M].北京:科学出版社, 2000.
[2]朱述龙, 张占睦.遥感图像获取与分析[M].北京:科学出版社, 2000.
[3]黄世德.航空摄影测量学[M].北京:测绘出版社, 1992.
[4]陈述鹏, 童庆喜, 郭华东.遥感信息机理研究[M].北京:科学出版社, 2000.
视频图像技术 篇2
关键词:视频监控系统;硬件;设计;实现
中图分类号:TP391.41 文献标识码:A 文章编号:1674-1161(2014)12-0017-03
煤炭资源对于国民经济的发展具有至关重要的作用,因此要对煤炭资源的开采与利用进行有效监控与保护。为此,提出基于图像跟踪识别技术的煤炭运量视频管理系统。这里介绍该系统的硬件设计与实现。
1 系统硬件整体设计
系统使用DVR-SV4125的工业级计算机作为上位机,该计算机抗干扰能力强,能够在恶劣的环境下正常工作。考虑到整个视频监控系统的应用环境,将系统硬件设计为车辆到达感应部分、图像采集部分、云台控制部分及上位机4个部分(如图1所示)。
2 车辆到达感应部分的硬件设计及实现
2.1 PCI开关板
AC6652(如图2所示)是一款低价格通用光电隔离I/O板,具有16路输入、16路输出。采用PCI总线,支持即插即用,无需地址跳线。采用大规模可编程门阵列设计,提高可靠性。AC6652的输入支持5~24 V输入,同时输出为集电极开路输出(OC输出,输出芯片为6N33或TIL113),输出驱动电流大于30 mA,可以方便地驱动小型继电器、LED等负载。AC6652采用CH系列PCI接口芯片及门阵列作为主控芯片。AC6652具有光电隔离的作用,有大规模可编程门阵列,可靠性高。可以接收来自AC140的信号,然后经过模块处理,转换为PCI通信格式,使上位机读取车辆到来的数字量信号,或者通过该模块的写操作向下位机发送操作命令。
2.2 隔离抗干扰模块
由于整个系统工作环境比较恶劣,容易对输入信号带来干扰,为保护现场的正常信号,设计隔离抗干扰模块(如图3所示),选用具有光电隔离功能的端子卡AC140。
AC140端子的连接方式为:1) K0~K7,分别对应8个继电器0~7的常开开关接点,每个K接点都是2个接线端子,对应一路的继电器开关接点。2) DI0~DI7,分别对应8路光电隔离输入0~7号。3) GND,光电隔离输入地线,即DI0~DI7的地线。4) POWER,对应+12 V电源输入,且电源负极与光电隔离输入地线GND相互隔离。
2.3 地磁传感器
整个视频监控系统开始工作的首要条件是:要准确地感应到车辆的到来。感应车辆到来的方法很多,如红外线、超声波、地磁感应等。超声波传感器容易受环境的影响,当风速在6级以上时,反射波会产生漂移而无法正常检测;探头下方通过人或物也会产生反射波,造成误检。红外传感器会因工作现场的灰尘、冰雾而影响系统正常工作。而地磁信号受环境因素影响较小,且比较稳定,所以该系统采用地磁传感器。
地磁传感器利用车辆通过道路时对地球磁场的影响来完成对车辆的检测。地球磁场在几公里之内基本上是恒定的,但大型的铁磁性物体会对地球磁场产生巨大的扰动。当车辆通过时,对地磁的影响将达到地磁强度的几分之一,而地磁传感器可以分辨出地球磁场1/6 000的变化,因此利用地磁传感器来检测车辆具有极高的灵敏度。
3 图像采集部分的硬件设计及实现
3.1 视频采集卡
在PC机上通过视频采集卡可以接收来自视频输入端的模拟视频信号,对该信号进行采集并量化成数字信号,然后压缩编码成数字视频。由于视频采集卡具备硬件压缩的功能,在采集视频信号时首先在卡上对视频信号进行压缩,然后再通过PCI接口把压缩的视频数据传送到主机上。一般的PC视频采集卡采用帧内压缩的算法把数字化的视频存储成AVI文件,高档一些的视频采集卡还能直接把采集到的数字视频数据实时压缩成MPEG-1格式的文件。由于模拟视频输入端可以提供不间断的信源,视频采集卡要采集模拟视频序列中的每帧图像,并在采集下一帧图像之前把这些数据传入PC系统,因此,实现实时采集的关键是每一帧所需的处理时间。如果每帧视频图像的处理时间超过相邻两帧之间的相隔时间,则会导致数据的丢失,即丢帧现象。采集卡都是把获取的视频序列先进行压缩处理,然后再存入硬盘,即视频序列的获取和压缩是在一起完成的,免除了再次进行压缩处理的不便。不同档次的采集卡具有不同质量的采集压缩性能。该系统采用天敏4000视频采集卡(如图4所示)。
3.2 摄像头的选型及特点
系统采用Sony公司的EVI-D30彩色摄像机。EVI-D30摄像机的主要功能是自动跟踪功能(Auto Tracking),可以不停地自动摘取用户预定义的主题。围绕选择的主题,EVI-D30会摘取相似的像素颜色和明亮度。EVI-D30有4种预定义的主题:自动跟踪功能、自动聚焦、自动曝光和运动检测。
4 云台控制部分的硬件设计及实现
4.1 云台
云台是安装、固定摄像机的支撑设备,分为固定云台和电动云台两种。固定云台用于监视区范围不大的场合,使用时将摄像机固定于云台上,调整好摄像机水平、俯仰的角度,达到最好的工作姿态,然后锁定调整机构即可;电动云台可以扩大摄像机的监视范围,提高摄像机的使用价值,主要用于对大范围进行扫描监视,电动云台调整姿态通过两台执行电动机来实现,电动机接受来自控制器的信号精确地运行定位,在控制信号的作用下,云台上的摄像机既可自动扫描监视区域,也可在监控中心值班人员的操纵下跟踪监视对象。
根据回转的特点,云台可分为左右旋转的水平旋转云台和既能左右旋转又能上下旋转的全方位云台。云台水平转动的角度为0~350°,俯仰角度为0~90°。有的云台还有自动巡视功能。根据使用的环境,云台还可分为室内用云台和室外用云台。选择云台的主要指标为回转范围、承载能力和旋转速度。一般的云台均属于有线控制的电动云台。
4.2 云台设备安装
云台通常是与摄像头结合在一起的, 摄像头提供额外的线路用于云台设备与计算机的连接。该线路通常以COM端口的形式连接计算机,在线路的一端连接有云台控制转换器(如图5所示)。
云台控制转换器以COM端口的形式连接计算机,图6显示了云台控制转换器与上位机的连接。
4.3 云台控制分析
计算机与云台之间的通信是通过串行通信实现的。PC机只拥有标准RS-232接口,而云台只提供工业标准的RS-485接口,因此中间需要一个RS232-485转换器,以将RS-232信号转换为RS-485信号。云台通过云台解码器、RS232-485转换器与计算机串口相连,程序通过向云台解码器发送指令来实现云台控制。这里的指令是由云台控制协议确定的。不同的厂家,云台控制协议也不尽相同。该系统所采用的协议是PELCO-D2400。
参考文献
[1] 刘效静,成瑜.汽车牌照自动识别技术研究[J].南京航空航天大学学报,2003,30(5):573-576.
[2] 崔家磊.风云一号接收系统定时同步与PCI接口研究[D].西安:西安电子科技大学,2008.
[3] 詹诩强,戚飞虎,刘天明.基于MPEG-2视频流的目标跟踪快速算法[J].上海交通大学学报,2001,35(9):1 321-1 324.
[4] 金世佳.图像跟踪识别技术在煤炭运量视频管理系统中的应用研究[D].沈阳:东北大学,2010.
视频图像检测火灾探测技术比较 篇3
第一代商用的视频图像检测(Video Image Detection,VID)火灾探测器出现在2000年左右,它在原有的辐射能量型火焰探测器基础上做出改进。VID使用黑白CCD获得火灾特征,而不是传统技术中使用的紫外或红外光谱传感器。传统的辐射能量火焰传感器可测量预先定义的单个或多个波长的能量总和,以此确定测量的信号是真实的火灾,或是错误特征干扰。然而,VID改变了算法,通过测量光强、颜色、形状、移动、闪烁频率和每帧图像时间的改变确定火灾。两年以后开发出可以检测烟雾的VID软件,宣称可以配合现有的安防摄像头,安装在客户现有的个人电脑上使用。但是随着摄像头技术的进步,分辨率增高,产生太多的附加数据,使现有的软件无法正常工作。另外,如果在黑暗环境下烟雾识别软件也无法工作。在以上技术的基础上,2005年出现第二代VID火灾探测器,它将火焰探测和烟雾探测结合起来,使用高感光或者内建红外光的摄像头,并使用数字信号处理器完成视频图像的处理和检测算法。2008年出现的最新一代VID火灾探测器,将火焰和烟雾的视频图像检测紧密结合,有效整合成一个产品。
1 视频图像检测火灾探测技术
基于视频图像检测技术的火灾探测器,包括一个常规彩色摄像头、一个红外摄像头,一个红外光源,图像俘获处理和数字信号处理器(DSP)。使用红外摄像头是为了增强探测器检测火焰并减少误报的能力。红外摄像头提供的图像中只能看到火焰和热源。红外光源使探测器能在黑暗的环境工作,特别是检测烟雾火。图1为探测器的结构示意图。
探测器可以将视野分为16个子区域,包括重要监控区域和非重要监控区域,重要区域可能存在的错误和干扰源或者火灾发生的可能性非常小。DSP中装载了智能图像识别和处理算法。首先输入来自常规彩色摄像头和红外摄像头的数字图像,然后通过数据滤波处理、背景学习和建模、物理特征分析、数据融合、报警可行性计算,最后输出。算法流程如图2所示。
VID系统有两种类型的报警输出——烟和火焰。火焰和烟信号的识别和处理是分离的。在探测中,一帧或多帧图像被放上疑似火焰或烟雾的标记。这些标记在视频屏幕监控器中被追踪并显示。DSP将量化和处理来自多张图像的烟雾和火焰特征。一旦烟雾和/或火焰特征的可能性超过预先设定限度,图像帧的颜色将从绿转红。然后,探测器发布火灾报警给本地火灾安全系统,同时VID火灾探测器上的报警灯也打开。
VID系统可作为独立的火灾探测器使用,视频处理和报警算法执行在探测器内完成。也可组成中心化检测系统,单个计算单元可连接和处理8个以上的摄像头信息。VID探测器会将烟和火灾的检测灵敏度分为5级,1级最高,5级最低,3级是VID探测器的默认灵敏度等级。灵敏度的等级可根据应用的环境调节。探测器摄像头的视野决定了在VID系统应用中的性能。可通过使用不同的透镜调节视野大小,默认设置是32°。
2 技术比较
现有5种火灾探测技术,包括:视频探测器、线型温度探测系统、火焰探测器、烟雾探测系统和点式探测器[3],其性能比较列于表1。
3 结束语
视频探测器结合了火焰探测器和烟雾探测系统的功能,基本可以取代后面4种技术。点式探测器主要是和火灾安全系统中的水喷淋头结合使用,探测对象包括温度、烟雾以及气体等。线型温度探测系统包括传统的基于电传感的感温电缆、新型的拉曼散射感温火灾报警系统(欧洲)和光纤光栅感温火灾报警系统(中国)。这些新型的基于光纤传感技术的火灾报警系统具有探测区域范围广、受环境影响小以及可靠性高等优点。VID火灾探测技术和其他技术比较起来有反应速度快,定位火灾的同时可监测火灾的发展。但是可靠性和有效性不确定,因为该技术受环境影响较大,如:镜头被污染及应用现场能见度低等。VID火灾探测技术可作为辅助手段配合感温火灾探测系统一起工作。
视频图像技术 篇4
0 引言
变电站是重点电力生产场所,须对其环境状况、设备运行、文明生产等各类情况加以监视,特别要对安全生产构成极大威胁的情况加以监视,以防范火灾、爆炸、泄露、失窃及恶意破坏等。
当前变电站监视系统[1][3][5][6][7]已基本覆盖上述区域,并实现了遥视功能[2],为变电站安全生产提供了直观监视手段。但是面对上千路视频图像,通过带宽有限的网络传输到远端的监控平台上,只能在局限的显示平台上采取轮询显示方式,而这些显示在画面的视频图像,也是仅仅靠人工肉眼判断是否有安全事件发生,存在明显的漏检,同时庞大的数据量也可能影响数据获取的实时性,以致对事件的处置表现出一定的滞后性。
本文提出了针对变电站安全生产的相关视频图像分析算法的设计,并将其嵌入到当前的传统监控系统中,附加智能监控设备,使得各变电站独自监控检测事件,将结果通过网络传回主控中心汇总报警。
1 系统总体结构
系统总体结构设计如l图1:
在传统的视频监控系统设计的框架结构之上,嵌入视频图像分析模块,只需在每个变电站安装一个智能视频分析的服务器,该服务器接收变电站的实时画面,并分析出其中的异常事件,然后将报警信息传送至视频监控中心。
2 视频图像智能分析原理
智能视频(IV,Intelligent Video)技术源自计算机视觉(CV,Computer Vision)与人工智能(AI,Artificial Intelligent)的研究,其发展目标在于将图像与事件描述之间建立一种映射关系,使计算机从纷繁的视频图像中分辩、识别出关键目标物体,这一研究应用于安防视频监控系统、将能借助计算机强大的数据处理能力过滤掉图像中无用的或干扰信息、自动
本文提出了智能视频图像分析模块嵌入到变电站的视频监控系统中设计方案,大大提高了视频监控的效率,从而使变电站的生产运行更加高效智能。目前无人化智能变电站已成为未来电网发展的趋势,如何高效的引入新的技术,与变电站的实际情况相结合,并提高人员工作效率,仍有很多研究课题亟待解决。
参考文献
[1] 陈水标,沈祥.图像监控系统在无人值班变电所的应用 [J].浙江电力,2001,20(2):8-11.
CHEN Shuibiao,SHEN Xiang.Application of remote video surveillance system in non-attended substation.Zhejiang Electric Power,2001,20(2):8-11.
[2] 涂光瑜,罗毅.电力遥视系统原理与应用 [M].北京:机械工业出版社,2005:17-85.
TU Guangyu,LUO Yi.Principles and Applications of the Power remote monitoring system[M].Beijing:Mechanical Industry Press,2005:17-85.
[3] 任广杰.智能视频质量诊断系统在监控系统中的应用[J].电信技术,2012,3,12-14.
视频图像技术 篇5
图像监控技术是目前得到广泛应用的技术, 基于图像监控技术研发的图像监控系统已经成为银行、大型商场、保密单位、制造企业、交通部门等企业和政府部门正常运行必备的系统。
就目前的市场而言, 图像监控系统的主要用户包括:生产制造企业, 主要用于监控无人化的生产线, 随着柔性制造线的发展, 自动化和无人化是企业现代化的特征, 因此, 生产制造企业对图像监控系统地需求已经成为监控系统市场中的热门;银行、交通、旅店、小区以及大型商场, 对图像监控系统的需求也非常大, 小区停车场、银行营业部都需要监控系统进行全天候监控;军事基地等保密单位出于保密的需求, 必须安装图像监控系统, 以防不法分子窃取情报;由以上案例可知, 图像监控系统的市场需求量极其庞大。
目前, 图像监控系统市场上占主导地位的是模拟监控系统, 这种传统监控系统有很多缺点。传统监控系统利用录像机录制镜头的画面, 存在清晰度差、监控有死角、查询麻烦、保存困难等问题, 因此无法广泛应用, 必须研制新的图像监控系统, 对图像监控系统进行升级改造。
网络数字视频图像监控技术是现代高科技的结晶, 将图像处理与信息技术进行了完美结合, 新技术的应用使得网络数字视频图像监控技术比传统的模拟监控系统有非常明显的优势。因此, 本文从网络数字视频图像监控技术的优化角度进行深入的研究。
2 网络数字视频图像监控系统新技术
2.1 网络数字视频图像监控系统新技术研发的必要性
网络数字视频监控系统与传统的模拟监控技术相比有很多的优点, 其中最突出的优势就是提升了监控系统的自动化水平。监控自动化水平的提高主要源于视频序列检测技术。传统的图像监控系统中, 需要人工观察, 当监控人员发现危险情况或者异常情况时, 人工进行报警。网络数字视频图像监控技术出现之后, 基于数字视频技术的平台, 图像序列检侧技术也逐渐成熟。运用图像序列监测技术, 可以代替监视人员对图像中人或物的活动进行检测, 如果活动与系统中的设定的危险情况相符, 则发出报警信号, 此项技术的应用可以使得网络数字视频监视系统的自动化水平得到质的提升。图像序列检测技术除了自动报警的功能之外, 还可以对检测到的各种数据进行统计, 例如, 交通部门中运用此项技术, 可以对城区各主干道车流量进行统计, 绘制出每日的城区车流量曲线图。
2.2 图像序列运动检测技术的研发难点
在我们的日常生活中, 运动是生活的主要方式, 有意以的信息大多包含在运动之中, 因此图像序列运动检测技术主要研究物体的运动信息。比如, 交通部门的监控系统的重要职责包括车流流量的监测, 生产制造企业的监控系统关注生产线自动运行的全过程。图像序列运动检测技术的难点在于难以准确分割物体的运动过程, 而且由于此项技术给予数字视频监控技术, 运动物体之间的遮挡给分析带来了很大的困难。
2.3 图像序列运动检测流程
图像序列运动检测的算法有很多, 根据技术的应用范围不同而选择相应的算法。数字视频监控系统中应用此项技术, 首先要检测出监控系统检测的图像内有没有物体发生运动, 然后根据需要检测物体运动的位置和方向, 这些需要根据特定的需求来编写相应的算法。例如, 对于有自动报警需求的系统, 在算法中列出自动报警的条件, 如果检测到物体的运动位置和方向信息满足算法中的条件, 系统就会自动发出报警信号。
以上的算法关注的重点是监控系统中物体是否运动, 以及物体运动位置、运动方向等信息。实际上图像序列的亮度分量己经包含了物体运动的绝大部分信息, 因此运动检测采用的图像数据是灰度图像序列。采用灰度图像序列有一个最大的缺点, 就是当监控多个目标时, 由于个别目标的灰度序列无法良好分辨, 就给运动分析和检测带来了很大难度。为了提高检测精度, 主要讨论监控系统中运动物体数量少的情况。
图像序列运动检测技术在实际应用中, 会受到很多方面因素的影响, 比如, 当光照条件发生变化时, 静止物体的灰度值将会与运动物体接近, 对物体运动的采集精度将会降低, 当摄像机受到干扰, 使得图像画面发生抖动, 在算法中, 会将静止物体当作运动物体, 占用检测资源, 造成检测错误, 而且会给算法带来扰动, 使得计算精度降低。
在不同应用范围中, 对检测精度的要求也不相同。采用不同算法, 图像序列检测技术可以满足不要应用范围的要求。本文以简单运动和复杂运动两种运动的检测方法为例进行分析, 并给出各自的处理流程。
简单运动检测系统流程如图1所示。
图1所示的流程用来实现简单的运动报警。首先在算法中列出报警条件, 当监控系统中发现运动物体的运动位置和运动方向符合要求时, 就自动发出报警信号。简单运动处理流程只关注物体运动信息, 不关注物体大小和数量等信息。
复杂运动处理流程图比简单运动处理流程图要复杂的多, 采用的算法也复杂的多。因为处理的是一个完整的视频运动。本算法是很多算法的基础, 通过改进本算法, 根据不同场合提出不同要求, 可以应用在不同的场合。该算法流程就是基于边缘提取的逐帧差分运动检测算法。应用本算法, 第一要判断检测视频中是否有物体发生运动, 其次要判断物体的运动方向、运动位置等信息, 还要判断运动物体的大小, 如果运动物体较小, 可以忽略不计, 提高精度的同时, 还可以防治误报警。
复杂运动处理流程需要多种技术同时应用, 包括计算机图像的预处理技术、图像的边缘提取技术以及图像的匹配技术等等。
在算法中, 首先是获得数字视频序列中的图像帧, 然后选择一定的算法对图像进行预处理以消除各种噪声、通过简单差分判断是否有运动、提取图像边缘特性、再次差分去掉非运动边缘、图像匹配, 获得运动物体的信息。
3 结束语
计算机网络数字视频监控技术优化的目的主要在于开发图像序列检测技术, 本文分析了数字图像序列的运动检测和运动报警算法, 在算法中, 通过对基础算法的改进, 首先实现了物体是否运动的判断, 其次分析出运动物体的运动方向和运动位置等信息。该算法经过改进, 不仅适合于自动报警, 而且还能够进行各种数据的统计。
数字视频监控系统还有许多地方需要改进。比如, 进一步完善图像序列运动检测技术, 区分多运动目标、小运动目标以及摄像头运动时的运动分析, 这些都会使得数字视频监控技术得到进一步发展。
参考文献
[1]彭华.远程视频图像监控在变电站设计中的实现[J].中国新技术新产品, 2014, 25 (24) :19-20.
论视频图像处理与传输技术的应用 篇6
1 视频图像处理与传输技术简介
1.1 视频图像处理概述
视频图像就是运用一些的技术手段和工具观测客观世界所获得的图片, 其实也就是人眼所看到的一些视觉实体。视频图像处理技术就是指对所捕获的图像进行一系列的加工和处理, 以得到操作者所需要的信息。视频图像处理的另外一大任务是对图像的格式等参数进行调整, 以便于其传输, 这对于当今这个需要进行大量数据交流的时代来说是至关重要的, 只有如此其才能满足实际应用的要求。
1.2 视频图像处理与传输技术发展简介
视频图像处理与传输技术在我国已有一段较长的发展历史, 尤其是近几年来, 随着计算机技术的发展, 视频图像与处理技术得到了更加广泛的运用。在二十世纪八九十年代以前, 图像处理技术只能进行二维空间的处理和应用, 其运用范围也比较窄, 一般都只能用在相片处理、电影图像处理等地方, 那时的视频图像传输技术也不高, 传输质量也相当低。到了二十一世纪, 视频图像处理与传输技术发生了巨大的变化, 图像处理技术已经在三维空间里也得到了很好的运用, 其在三维动画技术、电影特效技术等领域都发挥了巨大的作用。视频传输技术在这个阶段发生的变化更为明显, 如今是视频传输技术不仅传输质量提高了, 其实时性也得到了巨大的改善, 还能在传输的过程中对信息进行加密处理, 确保了信息在传输过程中的安全性。
2 视频图像处理与传输的主要工作内容
2.1 视频图像的实时捕捉和压缩
视频图像的捕获是后续一切工作的基础, 只有得到了视频图像才能对其进行处理与传输。随着手机的普及, 可以说现在绝大部分人都已经拥有了视频图像捕捉的工具, 这是是视频图像处理技术能够如此快速发展的原因之一。现在手机、摄像头、数码相机的像素都在不断提高, 其所捕获的图像的质量也越来越高了, 但这也增加了视频图像传输的难度。如果对捕获的图像不加以任何的处理, 那么很难保证传输的实时性, 即使能达到要求其付出的成本也过于昂贵。因此图像压缩工作就相当有必要了, 其能降低传输的成本, 提高传输的效率。
2.2 视频图像的加密
图像加密技术的运用范围并不是十分的广泛, 其主要用在一些对信息安全性要求较高的领域, 例如国防工业、商务机密等。图像加密就是按照一定的算法程序, 对图像进行处理, 以提高安全性。进过加密之后的图像信息, 即使在视频传输的过程中被别人窃取了, 如果窃取者没有解密程序的话, 其仍然无法正常播放所窃取的视频信息, 因此在视频传输之前对图像进行加密也是一项主要的工作。
3 视频图像处理与传输技术的运用实例分析
3.1 视频处理与传输技术在道路监控中的运用分析
视频处理与传输技术在道路监控的中已经运用了相当长的一段时间, 其也发挥了相当重要的作用, 道路监控系统可以帮助监控人员更加全面及时的了解交通情况, 以便于及时的采取应对措施, 在发生道路交通事故时还可以通过视频图像取证, 分析相关人员的额责任。但是随着现在交通系统的日益复杂, 其对视频处理与传输技术的实时性等提出了更高的要求。比如要捕获高速移动的车辆的车牌信息, 即必须提高视频图像的处理技术, 要运用合理的技术手段排除其它干扰因素的干扰, 对图像进行分割处理。如今大部分城市的道路监控系统都建立了自己的视频图像传输网络, 这大大的提高了视频图像的传输范围, 借助互联网技术的发展也极大的改善了视频图像传输的距离。
3.2 视频处理与传输技术在航空航天的运用分析
近些年来我国的航空航天事业得到了巨大的发展, 特别是神州系列飞船、嫦娥系列探月器和天宫一号的升空, 无一不让世界为之震惊。视频处理与传输技术在这些重大的项目中也发挥着不可或缺的作用, 最为直接的就是在直播的过程中所看到的一些实时传输的图像, 那都是采用的视频传输与处理的技术完成的。与道路监控系统相比, 航空航天项目对视频传输与处理的技术要求更高, 特别传输距离。由于航天航空事业的特殊性, 一般都是采用无线传输的方式进行视频图像传输, 其能增加传输过程中的抗干扰能力, 也能提高传输的速度。在航空航天领域的视频图像在传输之前一般都要进行多次的压缩和加密, 一方面是提高信息的安全性, 另一方面是尽可能的在不损害图像质量的前提前减少图像所占用的存储空间, 以提高图像的传输效率。
4 结语
视频图像处理与传输技术在各行各业都得到了广泛的运用, 但是随着科学技术的不断发展, 对视频图像处理与传输技术的要求也在不断提高。在今后的发展过程中, 只有对现有的技术不断的进行改革创新, 才能使视频图像处理与传输技术满足时代发展的需求。
摘要:随着科学技术的不断发展, 视频图像处理与传输技术发挥的作用也日益明显, 其应用已经深入到了每一个普通人的生活当中。本文主要介绍了视频图像处理与传输技术的主要发展历程和视频图像处理与传输技术的主要工作内容, 最后结合相关的实例对其应用进行了分析。
关键词:视频图像,图像处理,信号传输,应用分析
参考文献
[1]秦瑞.现代图像处理技术的发展趋势[J].光机电信息, 2012 (03) :48-50.
[2]周艳玲, 袁鸿, 李博.“视频图像处理技术”课程设计研究[J].公安教育, 2013 (09) :62-64.
视频图像技术 篇7
关键词:视频图像去雾,实时性,图像增强,物理模型
近年来, 雾霾天气在我国频繁出现, 对人们的健康和出行造成较大影响, 引发了全社会的普遍关注。雾和霾是两种不同的物质组成, 在大气中以微小粒子的形态悬浮在空中, 可用米氏散射理论进行描述。
目前, 视频图像去雾技术还处在研发阶段, 各方面可供参考的文献并不多。相较国内, 国外的研究工作起步较早, 进展相对快一些。美国国家航空航天局 (NASA) 的Langley研究中心深入研究基于领域的Retinex算法, 对雾、烟、水下和夜晚图像进行增强, 并将其算法移植到DSP图像增强系统中, 处理分辨率为256×256的灰度图像效率达到30帧/s, 能够基本满足小分辨率下的实时性要求。与此同时, 国内的中科院自动化所、清华大学、天津大学以及中南大学也视频图像去雾方面取得了进展。
1 图像去雾的方法
随着图像去雾算法理论研究的深入和实际应用中的需要, 近年来国内外学者越来越关注在小信息量输入 (单幅图像) 的条件下对数字图像外观的建模与重绘。基于大气退化物理模型的单幅图像去雾是通过合理的数学推演和假设, 还原清晰、高品质的图像。在这方面的早期工作是由Tan等人完成的。他们通过统计发现无雾图像相对于有雾图像必定具有较高的对比度, 从而利用最大化局部对比度处理, 基于MRF框架对结果进行规整化, 达到单幅图像的去雾。
Fattal等人在大气衰减的物理模型的基础上, 运用独立成分分析的方法, 通过假设入射光在大气中的传播 (transmission) 和场景对象的表面特性 (surface shading) 是不相关的, 并利用图像邻域信息的马尔科夫特性和局部最优化的思想计算得到清晰的图像。
香港中文大学的何恺明博士等人在2009年的CVPR上提出了基于暗通道优先提取的单幅图像去雾技术。通过DCP (Dark Channel Prior) 先验, 能够快速估计出大气传递参数, 进而求解清晰图像。何凯明等人在后期的研究中引入导向滤波的方法进行处理, 大大提升算法效率。在该研究的基础上, 衍生出很多进型DCP算法, 取得了不错的效果。
Kratz等人应用MAP的方法解决图像雾的问题, 假设有雾的图像是由场景反照率场景深度两个独立的层组成的, 并利用FMR (factorial Markov Random Field) 思想建模最终得到了较为准确的深度信息。
Zhang通过引入边界保持的非线性滤波的方法, 利用该方法能够使transmission m信息更加准确, 同时能够得到较准确的对象界信息, 而且不受图像局部反照率的影响。
在单幅图像去雾的实时性方面, 也存着一些进展。Codruta O.Ancuti等人提出基半求反 (Semi-Inverse) 的检测去雾算法。算法同样提出一种先验, 即在日光条件下通对多幅图像进行统计, 得到在有雾图像中, 雾区域的半反图像和原始图像基本无差异。因是有雾的区域或者天空的RGB分量各元值都比较大, 而无雾的地方符合暗通道原理即总有一个分量的值比较小。在以上先验假成立的条件下, 估算大气传递参数, 进而对像进行去雾处理。文中提及的数据表明, 该法已能基本支持视频图像实时去雾处理。
2 视频图像去雾时效评估
通常情况下, 图像去雾算法的评估没真实的图像可供参考, 属于无参考客观质量估范畴, 仅能依据对降质图像和复原 (或增强) 图像的分析比较来衡量算法的性能。目前, 针对图像去雾效果的无参考客观质量评估主要是由Hautiere等人所提出的可见边梯度法。
3 视频图像去雾效果
为了考查现阶段去雾算法是否能够满足视频图像去雾的实时性要求, 利用对数图像处理 (LIP) 模型从定量分析的角度对现阶段几种典型的图像去雾方法的时效进行实验分析。通过单幅图像的去雾处理的运算速度和清晰化指标, 来推算处理方法是否能够满足视频流去雾处理的实时性要求, 为视频图像去雾算法的选择提供理论依据。表1比较了几种典型的去雾算法的运算速度与清晰化指标。
由表1可得, 在处理图像大小为450×600的图片时, 理论上传统的基于物理模型去雾方法在运算速度上普遍比基于图像增强去雾方法的慢, 并且能满足视频流实时处理要求的算法仅有自适应直方图均衡化、自适应色阶和对比度和改进的实时去雾算法。
4 结论与展望
本文对视频图像去雾处理进行了综述性介绍, 给出了国内外几种典型去雾算法的时效分析, 为进一步探索视频图像去雾处理方法, 提高算法效率提供理论依据。
视频图像技术 篇8
关键词:视频,流媒体,图像识别,技术
当前计算机相关技术与通信网络的发展达到前所未有的高度, 信息的消费对于社会环境中的生产生活而言, 已经不仅仅是单纯的提高效率, 而是上升到了成为社会各类活动必要支持的高度。而在网络环境中的数据格式, 也随着相关技术的进步有所变化, 其中流媒体成为首当其冲的重点所在。
1流媒体环境下的图像识别技术价值与应用
流数据格式在当前网络环境中愈加常见, 其应用范围已经突破了常规的传媒以及安全领域, 而进入到了更多的应用环境中, 对应的制作工作人员也不再限于相关专业, 更多专业和不专业的人参与到了流媒体的工作环境中来。这种情况, 从客观上要求在视频流环境中引入更为自动化的工作方式, 从而实现对于相关工作的支持, 其中图像识别技术就是首要的需求之一。
图像识别技术在流媒体领域中有着较高的应用需求, 主要的需求来源于对大量数据的有效存储和阅读, 以及工业环境的实时监控两个方面。对于前者而言, 由于流媒体本身的特征, 决定了它在存储和查找的时候都无法做到像传统数据格式那样的快捷有效, 甚至于一直以来对于流媒体的存储、归类以及检索, 都要依赖于工作人员添加的标签才能完成, 而这对于流媒体的相关操作效率的提升无疑有着不利影响。
当前图像识别领域的应用已经日趋成熟, 流媒体本身由众多的数据帧组成, 因此在图像识别技术成熟的基础之上应用到流媒体领域, 无论从技术还是价值方面都有一定的积极价值。而从应用的角度看, 众多领域都存在显著需求, 突出表现的几个方面, 包括流格式数据的存储与检索, 安全领域的自动识别应用以及工业环境中对于数字仪表的自动读取, 以及新闻视频中的字幕信息自动提取等。相对而言, 当前在安全和工业领域中的需求较为突出, 并且也取得了瞩目成果, 但是从长远的角度看, 流格式数据的深入识别, 必然能够推动其存储与检索的优化, 这对于带动流媒体在多个领域中的深入应用都会存在积极意义。
2视频流环境下图像识别的主要技术与发展
当前在流媒体领域中, 图像识别技术的发展已经取得一定成果, 依据不同领域中的需求状况以及图像特征, 可以有多种技术供选用。在实际工作中, 应当依据具体情况进行选择, 才能获取良好效果。
对于流媒体数据格式中的文字识别而言, 常规的方法有基于边缘、基于纹理、基于区域的三种主要工作方式。其中基于边缘的识别方式, 主要是在图像中寻找垂直边缘来对文字实现检测。其主要的工作方式是先确定出图像的边缘, 而后通过平滑滤波或形态学膨胀的方法来将边缘连接成为文字块, 最终加以识别。此种工作方式表现出良好的工作效率, 但是如果图像背景复杂文字区域反差小, 也会造成误码率偏高问题的发生。而且基于纹理的识别方法, 是利用图像中的纹理特征去对比, 从而确定一个像素点是否属于文字区域。此种识别方式通用性较强, 不仅仅能够实现文字的识别, 对于其他类型的图像识别, 诸如对运动物体等的识别也能发挥良好作用。但是此种工作方式在有效提取纹理信息的过程中可能会面临较大运算量, 从而造成系统整个运行缓慢, 工作效率低下的问题, 并且无法抵御高噪影响。最后, 基于区域的方法则是基于文字像素均存在相似颜色的架设而展开, 此种工作方式可以对于新闻视频中的文字进行识别, 但是无法对工业仪表等示值有效识别, 整体效果和应用领域都相对有限。
除去对于文字的识别, 对人脸的识别同样也是当前视频流数据中图像识别的重要的技术表现。相对于文字识别而言, 人脸识别更为复杂, 并且经过了更漫长的探索过程, 至今都仍然处于不断地完善之中。当前在人脸识别领域中, 比较常见的方式是为人脸建立起对应的面部模型用于图像中的识别和对比, 实现匹配之后进一步对其面部数据进行分析和提取, 最终实现识别。
无论是人脸识别, 还是对于流媒体数据内相关信息进行识别, 都需要必要的硬件以及软件运算能力加以支持。除此以外, 系统本身的学习能力, 作为图像识别技术前进的重要技术因素不容忽视。学习本身是系统的一种自适应体现, 例如对视频流字幕进行定位的过程中, 即便是同一场景也有可能会出现字幕的不一致问题, 包括位置以及大小、色彩等, 都会发生变化, 同样的变化也会出现在工业环境中的仪表示值监测领域, 因此系统必须能够实现主动学习, 才能切实展开图像识别。除此以外, 人工智能等方面技术的深入应用, 对于流媒体系统中的图像识别工作质量提升同样意义重大。而实际在展开图像识别的过程中, 图像数据的多帧平滑, 以及多层前向反馈神经网络等技术的应用, 同样也是推动该领域工作效果提升的重要武器。
3结论
对于视频流媒体的图像识别, 关系到社会工作的多个方面, 其有效存储和管理关系到数据挖掘和分析的技术实现效果, 并且从效率方面有着不容忽视的影响, 而图像识别更是相关领域自动化的坚实基础和有力保证。实际工作中需要依据具体情况来对众多技术进行选择, 确保能够满足准确和效率两个方面的均衡需求。
参考文献
[1]黄万军, 尹宝才, 陈通波, 等.基于三维可变形模板的眼睛特征提取[J].计算机研究与发展, 2002, 39 (4) :495-501.
[2]李默, 李弼程, 邓子健.新闻视频主持人镜头的半屏幕检测算法[J].计算机工程与应用, 2005 (15) :183-185.
视频图像技术 篇9
摘要: 主要研究基于表面等离子共振(SPR)技术的纳米级金属膜厚在线测量系统中的视频信号处理问题。由于CCD在动态连续采集图像的过程中会受到环境以及工作台旋转的影响,从而会随机地产生高斯白噪声和图像的扭曲现象,造成视频图像的模糊或者扭曲失效。通过对视频图像进行滑动平均滤波、小波分析以及动态补偿时域滤波的处理,消除了高斯白噪声和避免图像扭曲的发生,确保了CCD获取视频图像的有效性与清晰度,从而提高了从图像中获取的共振角度变化量的准确性,并进一步提高了金属薄膜厚度的测量精确度与可靠性。
关键词: SPR; 纳米级; 膜厚; 在线测量; 滑动平均滤波; 小波分析; 时域滤波
中图分类号: TH 744文献标识码: Adoi: 10.3969/j.issn.1005
引言纳米级金属膜厚的在线精确测量主要是基于等离子体共振技术实现。当入射光以一定角度入射时,因金属对光具有吸收特性,而产生消逝波,使得发生反射现象时反射系数不为1,从而引发全内反射现象[1]。入射光与金属薄膜的表面的自由电子相互作用,在沿着金属介质界面上产生表面等离子振荡,又当入射光的波长与入射角度在一定范围内时,使得消逝波与金属介质表面所产生表面等离子震荡的频率与波矢相同,产生表面等离子体波共振[24]。根据共振角的变化可以得出10 nm以内的金属薄膜厚度,以达到精确测量的目的。本文所提出的在线测量系统主要利用表面等离子体共振(surface plasmon resonance,SPR)技术结合CCD进行动态的视频图像信息采集,以获得SPR共振角度的变化,反演计算金属薄膜厚度。由于整个系统是处于一个动态的工作环境,CCD在进行视频图像采集时容易因为测量环境以及工作台的转动而产生噪声以及图像的扭曲失真,使得获取的SPR共振角度变化信息不够精确而对膜厚测量结果造成干扰。本文提出利用滑动平均滤波与小波分析法对视频图像进行滤噪处理,增强图像的清晰度,以动态补偿时域滤波对视频图像进行动态补偿,以确保图像不会出现细节上的模糊扭曲造成失真,增强视频图像采集的可靠性,达到精确获取SPR共振角的变化量,精确测量纳米级金属膜厚的目的。
1.1Kretschmann结构模型及原理1970年德国物理学者Kretschmann E提出了Kretschmann结构模型[5]。该模型的工作原理是在特定棱镜的底部直接镀上一定厚度的某种金属薄膜,待测定的介质则在金属薄膜下方,倏逝波透过金属薄膜,与其在待测介质表面发生等离子体波共振。依据Kretschman型结构的等离子体波振荡原理,根据SPR的反射光强角度分布,可精确获得纳米级金属薄膜的厚度。Kretschman模型结构图如图1所示[5]。在图1中ε1、ε2、ε3分别为棱镜、金属薄膜以及真空的介电常数;kx1、kx3为激发表面等离子体振荡的光波在X轴方向的波矢分量;kz1、kz2、kz3为入射光在对应介质中垂直于分界面的波矢分量;λ为入射光的波长;d为金属薄膜的厚度;SPW表面等离子体波的波矢为kspr,
等:基于SPR原理的纳米级金属膜厚在线测量系统中的视频图像处理
1.2在线测量系统本文的SPR纳米级金属膜厚在线测量系统主要是利用棱镜适配临界角的典型Kretschman结构,当金属薄膜被大于临界角的光束照射时,在金属膜与真空的界面上将产生表面等离子体震荡,根据SPR反射曲线随着膜厚的变化而变化的原理,利用曲线匹配的方案最终实现金属薄膜厚度的实时在线测量。图2所示为整个系统在线测量的原理图。在图2所示的测量系统中,半导体激光器经过准直扩束之后的输出光,通过柱面透镜转化后,变为有效覆盖角度约为40~57°的较为理想的柱面光,该柱面光经过偏振片后得到P偏振光,P偏振光进入棱镜后,在金属薄膜表面激发等离子体波,形成衰减全反射。实验时以中低速旋转工作平台,可以获得产生等离子共振现象时的共振角。由前面的基本原理可知,当产生SPR现象时,反射光光强最小,该反射光经过成像透镜与CCD接收到的反射光强信号在纵轴方向的分量进行叠加,以消除散斑的影响。该系统中短天线目的是为了CCD接收到的信号与计算机之间的通信,利用短天线通信不仅免除了多线干扰,而且提高了系统的稳定性。在利用短天线进行通信时,考虑到外界其他信号对通信模拟信号的干扰,利用钟罩来避免。整个系统采用二维标准视频CCD,该CCD获取帧率为每秒25帧,在CCD采集到图像之后将其转换成数字信号通过短天线传输到计算机内进行分析和处理。计算机根据所采集的由系统角度自定位所标记的角度与光强数据建立一个供曲线匹配专用的数据库,可反演出CCD所采集的每一帧之间金属薄膜增量,从而达到精确控制膜厚的要求。
由于CCD在采集图像的过程中容易受到环境等因素的影响而随机产生高斯白噪声使得获取到的视频图像不清晰,而在动态采集图像过程中又由于工作台的中低速转动极易造成视频图像扭曲和拖尾,对获取共振角度的准确值造成影响,从而影响反演出的金属薄膜厚度的精确数值,因此需要对获取到的视频图像进行处理。
2视频图像处理在本文中所设计的在线测量纳米级膜厚精密测量系统中,在CCD采集到图像之后,通过短天线进行通信,并将其转换成数字信号传输到计算机内进行分析和处理这一过程中,在系统自定位角度进行标记与曲线进行匹配时,发现所采集到的视频信号会到噪声的影响而上下浮动。经过分析发现该噪声属于高频白噪声,因此需要对视频信号先进行滤波处理。鉴于本系统的特性,结合滑动平均滤波方法的特点,考虑采用该方法对视频信号先进行粗略的滤波处理,再利用小波分析得到平滑的信号。由于系统是一个动态测量过程为了避免由于运动“拖尾”造成影响,提出基于运动补偿的时域滤波方法,更好的保护视频细节。
2.3时域滤波由于本系统的数据采集是一个以中低速转动获取数据的动态过程,而视频信号所带的噪声是随机产生的,因而在某些特定时刻会发生运动图像的扭曲及失真现象造成“拖尾”。为了解决在视频信号采集过程中对静止部分的去噪有效性,以及尽量消除运动图像的失真和扭曲产生的“拖尾”所带来的影响,采用基于运动补偿的时域滤波方法。该方法主要利用运动补偿技术,在时域上跟踪并提取视频信号中的噪声,并沿着物体的运动运动轨迹进行滤波,W表示滤波器的滤波强度,其流程图见图6[9]:
nlc202309011252
运动补偿时域滤波通过空间的相关性和图像序列在时间维上的相关性,不会引入各帧图像在细节上的模糊,并克服了由于运动所引起的时域非平稳方式,利用运动估计与运动补偿技术保证整个滤波过程始终沿着像素运动轨迹进行。
图7中,为某一时刻所采集的视频图像经过滑动平均滤波与小波分析进行除噪处理之后,发现该图像由于运动采集的影响,出现了细节上的模糊。利用运动补偿时域滤波进行图像恢复,实验证明,该方法能够克服由于图像动态采集所引起的图像失真,并能保证视频图像的清晰性与完整性。
所采集的视频图像信息传输至计算机进行图像滤波处理之后,将视频图像信号利用AD转换成离散数据点,通过归一化处理以及Y方向上的数据叠加,进行反射光强峰值点(最高点a)和谐振吸收峰值点(最低点b)的标记,并与计算机内的原始数据库进行数据比对和曲线匹配,从而反演出金属膜层厚度。图8反映的是在三组不同厚度(1 nm、5 nm、10 nm)情况下,入射角度与反射率关系曲线图。随着入射角度的逐步增大,反射光强亦随之增大,当反射光强增至峰值点时,继续增大入射角,反射光强反而降低,增至一定角度时,反射光强最弱,此时所对应的入射角即为SPR共振角。在理论上,所得的关系曲线是平滑的,但在实测中发现,由于CCD的非线性光电响应引起光强误差、金属薄膜在蒸镀上的粗糙、角度定位以及标记点所引起的角度误差导致实测数据曲线会在理论曲线上下浮动。由于金属薄膜较为粗糙,使得所获精度是通过与理论曲线进行对比而得的平均精度,平均误差不超过0.5 nm。在未进行滤波处理前,所对应的实测曲线相对理论曲线浮动较大。滤波之后,可以明显看出实测曲线相对滤波前更为接近理论曲线,同时测量精度有所提升,平均误差不超过0.3 nm。3结论本文研究了基于Kretschmann结构模型的测量10 nm以内的金属膜厚的在线精密测量系统,通过CCD进行动态连续性图像采集,以获取在每一帧之间共振角度的变化量,从而反演出金属薄膜的厚度。但在这个视频图像数据采集过程中,会因工件架转动而随机造成图像扭曲失真现象,以及由于环境等因素而随机产生高斯白噪声造成的图像不清晰的现象,均会造成测量上获取数据的不准确。文章研究了利用滑动平均滤波与小波分析2种方式相结合对所采集的视频图像进行滤波处理,以获得清晰图像,同时,利用运动补偿时域滤波有效地避免了在视频图像采集过程中的图像扭曲,保证图像的有效性。利用三种方式进行视频图像的滤波处理之后,增强了获取共振角变化量的准确性,提高了厚度测量的精确度。
参考文献:
[1]李湘宁.工程光学[M]北京::科学出版社,2005.
[2]吴英才,顾铮先.表面等离子共振谱半波全宽的算法讨论[J].光子学报,2010,39(1):53-56.
[3]吴英才,顾铮先.激励表面等离子共振的金属薄膜最佳厚度分析[J].物理学报,2008,57(4):2295-2299.
[4]牟海维,王宏瑾,王强,等.表面等离子体共振理论与仿真研究[J].光学仪器,2011,33(2):1-6.
[5]李艳敏,李孟超,刘芳芳,等.基于SPR的类铬型金属膜厚在线纳米测量研究[J].光学技术,2012,38(1):9-13.
[6]朱彩莲.光纤SPR检测及数据处理[D].南京:东南大学,2005:35-37.
[7]沈兰荪,卓力.小波编码与网络视频传输[M].北京:科学出版社,2005:62-63.
[8]飞思科技产品研发中心.MATLAB6.5辅助小波分析与应用[M].北京:电子工业出版社,2003:42-45.
[9]谢剑斌,徐晖.数字视频处理与显示[M].北京:电子工业出版社,2010:119-120.
视频图像技术 篇10
运动视频图像处理技术在竞技体育研究中有着最为广泛的应用,是教练员、运动员和相关科研工作人员最常用的技战术分析手段之一。在竞技比赛中经常可以看到一些赛事的相关人员:比如运动员和教练员、科研工作人员、赛事组织者和管理者、裁判和观众、媒体记者和电视工作者,他们利用手中的摄像机或照相机,记录着每一个重要的比赛画面、收集重要的比赛视频录像、进行现场的视频转播、捕捉运动员赛前准备活动和赛后活动的重要视频图像信息等,运动视频图像采集记录了当时最为真实的比赛情景和运动员最真实的技战术能力状态。这就是本文所说的最为普通意义上的视频图像采集,这些视频图像采集资料都是作为进一步的运动技术视频图像处理、分析和研究的基础和来源。不同的人在后期利用不同的视频图像处理软、硬件设施,进行不同形式的视频处理和分析,以达到和实现相应的工作目的。
1 运动视频图像处理技术的过程
通常,教练员是现场进行演示和回放观察,或者赛后播放给运动员观看,同时进行研究、分析、讲解、综述评价运动员的技战术表现的优缺点。而科研人员则要用更加专业的和先进的视频图像采集设备,按照一定的运动视频图像采集的要求和规定,对不同运动项目、不同运动形式和不同运动员的技战术特征进行有针对性的视频图像采集,进而利用较为专业的视频图像处理软、硬件系统进行较为专门的技战术分析研究,在比赛现场或者赛后提供给运动队更为详细和全面的比赛信息,以达到研究和评价运动员个人的技战术表现和团队技战术能力,提高运动员技战术水平和团队竞技能力的科研监测目的。这就是视频图像多重处理技术在运动训练实践中最普遍和最常用的一种方法和手段。目前,视频图像处理技术在我国任意一个竞技比赛运动队里都已经得到了广泛的应用,同时也得到了广大教练员、运动员和科研工作人员的支持和认可,对提高运动员技战术能力和水平起到了很重要的帮助和保障作用。
2 运动视频图像处理采集技术
在大量的运动视频图像多重处理技术手段和形式面前,非常有必要对运动视频图像处理的采集技术进行更为科学合理的深层次研究和总结,以期更好地为我国体育领域内运动实践的科学化服务,以求利用运动视频图像处理技术更好地指导和评价运动员技战术能力,科学监测和评定现代体育科学的训练和比赛的实践活动,同时帮助运动员和教练员提高技战术分析和研究能力,提高对技战术监测和评价的能力,并更好地提高运动技术视频图像在现代运动训练的科学化进程中的作用和效益。
3 体育科研中运动视频图像处理采集技术的方法和途径
视频图像处理技术的常用工作流程是首先进行运动技战术的视频或者图像采集,运动视频图像采集根据研究的目的不同而采用的方式不同。但不同的视频采集方式都是要按照一定的运动生物力学和训练学研究要求和步骤,实现一定的研究内容。不同的视频图像采集方式有着不同的规范的视频图像采集要求。田径科研领域中的视频采集方式通常可以分为以下几种:
3.1 平面定点定焦采集
运动生物力学中进行二维录像解析时,必须采用平面定点定焦的视频采集。这种采集方法规定摄像机的视场开角度约5o左右,拍摄距离要求为25m左右,视场宽度要求为5m左右。这是田径科研中经常用到的一种视频图像分析技术。
3.2 平面定点变焦采集
如在正前面拍摄直到栏或跳远等项目的视频图像时,就需要采用平面定点变焦的采集方式。先把摄像机的镜头推远,然后随着运动员的靠近,逐步拉近摄像机的镜头,以采集到研究对象的全程技术视频图像资料。这是运动视频采集中经常用到的一种方式。
3.3 平面定点定焦扫描采集
在运动员的正侧面进行运动技术的全程视频采集时,经常要用到平面定焦扫描采集的方式。这种采集方式的特点是使摄像头紧紧跟随运动员的移动,保持焦距不变,人物由远及近,再由近到远的一种跟踪扫描采集方式。
3.4 平面定点定焦移动采集
如对田径跑道上的运动员比赛全程技术进行视频采集时,就需要利用平面定点定焦的追踪采集方式。利用现代的滑轨技术,在跑道的内侧或外侧安装滑轨,在滑轨上安装视频采集设备如摄像机,在比赛时对运动员的全程技术进行全程的定点定焦移动跟踪采集。这种采集方式经常能够在比赛的现场看到。
3.5 平面变焦移动采集
在现代竞技比赛中尤其是球类项目的比赛中,对某个重点运动员全场比赛技战术表现进行视频图像跟踪时,就需要采用平面定变焦移动采集方式。根据比赛变化和运动员移动变换的需要,进行平面视频图像追踪时就必须根据运动员在场上的变换,采用摄像机移动和变焦采集,或者移动和变焦同步改变的视频采集方式。
3.6 三维定点定焦同步采集
这也是运动生物力学研究中经常使用的一种视频图像采集方式,如在铅球、铁饼和链球等项目的比赛中,采用两台摄像机三维定点定焦同步采集运动员的比赛技术录像。这种视频图像研究运动员的技术时,摄像机的拍摄距离要求不高,但两台摄像机之间的夹角最好介于60o~120o之间,拍摄视场宽度最好包含运动员的整个运动范围。进行三维定点定焦同步录像采集时,必须在赛前或赛后要进行三维框架的拍摄和采集,以进行三维坐标的直接线性变换法(DLT)换算和三维运动学参数分析和研究。
3.7 三维定点变焦同步采集
这是目前运动生物力学三维录像中一种较新的研究方法,如在标枪比赛中,运动员向前和向侧的移动和旋转,可以采用最新的三维定点变焦录像同步采集方式进行三维录像分析。进行这项研究分析时必须在运动员每一个运动画面内拍摄到事前标定好两个固定的点的图像,这两个固定点的三维坐标也必须通过三维框架标定和全站仪测量获得。因为每个画面中的两个固定点的是不动的,在进行每个画面的三维坐标转换时,就能得到较为精确和科学的人体或者器械的三维坐标参数,从而进行三维视频图像的运动学参数研究和分析。
3.8 三维定点变焦大范围扫描同步采集
在Peak motus和Simi Motion等三维录像解析软件中,软件开发人员设置了三维定点变焦扫描同步采集视频图像的方式来进行三维录像的运动学分析。这就使得传统的三维定点定焦的采集方式发生了很大的变化,科研人员根据需要改变焦距来大范围的跟踪运动员的运动进行视频图像的采集,这样获得的运动员视频图像画面较大,图像比较清晰,便于后期的手动解析。然后通过这些专门的三维视频图像解析软件,完成大范围的视频图像研究需要。进行三维定点变焦扫描同步采集时,必须在运动员运动背景内的每一个画面内采集事先标定好的两个固定参照点的图像。
图1为使用三维定点变焦大范围录像扫描三级跳远项目的录像分析示意图。通过这种视频视频采集计时,研究人员可以获得更大范围的运动员运动技术视频图像解析资料,于传统的三维定点定焦相比,三维大范围录像扫描技术可以进行变焦和大范围的视频采集,使用较少的视频采集设备研究更大范围的运动技术资料,并且可以获得更大图像和更加清晰的视频图像资料。进行三维视频录像解析,在解析过程中需要对每一个控制点进行全站仪的三维坐标标定和三维直接线性变换法(DLT)线性转换,同时在进行视频图像解析时,每一幅画面都要至少出现两个控制点,并要求对这两个控制点进行标定解析。
3.9 高速视频图像采集技术
由于对运动技术更加精细研究的需要,在田径科研领域中常常需要进行高速视频图像采集技术,这包括使用高速摄像机(高速摄像头)采集和使用高速照相机采集。由于高速摄像机采集视频图像的信息量大,在田径科研领域中一般应用的高速频率为100Hz~500Hz即可,运动速度越快,需要采集的频率越高。使用高速摄像机进行视频采集时一般是固定位置和摄像机焦距不动,采用定点和定焦的采集方式,但也有改变物距来调整景深的。高速摄像机或者摄像头的拍摄速度和图像的分辨率一般呈反比,也就是速度越高图像的分辨率越低。
在田径项目的科研工作中,为了能够更加精细的分析和研究运动员的技术动作,尤其是对技术动作中时域参数的研究,需要使用高速摄像机(或者摄像头)来完成,高速摄像机能够更加精确了解运动员各个运动阶段的时间特征和技术表现特征。一般对田径项目来说,跑跳使用到200Hz即可,投掷类摄像机速度达到500Hz即可,不必要使用更高速度的摄像机来采集运动视频图像。
目前常用的高速摄像机名称较多,但大都需要专门的高速摄像机采集程序进行高速视频图像采集,而且高速摄像头的使用需要直流电源供电,这就使得高速摄像机使用的范围和频率受到一定的限制。
3.10 多机视频同步采集和处理技术
同步一直是视频采集的常见问题,通常研究人员采用机内时标法和机外时标法两种形式进行。目前一些较高级的视频图像处理软件提供了多台摄像机同步采集功能,这需要使用较多的视频图像采集端口,通过专门的同步采集命令控制实现多机视频的同步采集。
根据研究的需要,进行运动生物力学三维录像分析有时需要对2台以上的摄像机进行同步视频采集。同步采集的方法可以分为三大类:一是采用机外时标法进行,就是所有的摄像机在开始拍摄时共同拍摄外界的一个时间参考体(比如精确到千分之一秒的时钟),然后通过录像带的倒放,都找到开始拍摄的起始点;二是采用机内时标法,就是把每台摄像机的时间统一设为一个标准的时间格式,然后利用拍摄到的运动技术动作的起始和结束时间标志,来同步每台摄像机的时间;三是使用同步控制器(一种同时触发控制多台仪器开始工作的装置),来控制每台摄像机进行同步视频信号的采集和停止,以达到多机的同步采集目的。
同样利用专门的视频图像处理软件可以实现视频图像的多机同步采集和输出。视频图像的多机同步采集技术可以很好地实现运动生物力学三维录像解析中的同步问题,对于同步采集到的视频图像可以根据研究需要进行同步的裁剪和输出。
3.11 红外光点摄像机视频图像采集技术
近年来,一些国际大的运动捕捉视频图像公司纷纷推出红外光点摄像机和运动捕捉系统,该系统的功能特征就是数据采集精度很高,主要是在实验室或者是在光照条件较好的室内比赛场馆内使用。受试者身上必须粘贴有反光标志的marks点,该技术系统使用多个红外摄像机对受试者身上的marks点进行光点的空间和时间测量,该系统的测量视场宽度较大,在测试前必须对整个测试系统进行标定,同时受试者身上的marks点必须至少被3台红外光点摄像机捕捉到,才能获取它们的空间坐标,同时利用计算机专门处理软件,快速自动技术出人体运动的各个环节参数,并应用逆向动力学,反推人体肌肉所受的力。
目前在田径科研领域应用较为广泛的是美国的QUALYSIS红外光点捕捉系统和英国的VICON系统。图2就是使用VICON系统进行红外光点摄像机测量的视频图像采集图示。
3.12 其他形式的视频图像采集技术
除了上述的视频图像采集的方式之外,还可以使用其他形式的视频图像采集设备对运动视频图像光盘、视频图像存储介质和电视转播视频图像信号进行运动视频图像的采集,也可以在不同视频图像采集设备之间进行视频图像内容资料的相互采集和转录。这些都是常用的视频图像采集的方式和途径。可以说,现代生活中存在着海量的运动视频图像采集的信号源和资料内容。
目前,视频采集设备大多为数字DV信号的采集仪器,也有使用模拟AV信号的模拟采集仪器,当然,随着技术的进步,模拟信号采集仪器的使用越来越少了。数据DV信号也随着技术的发展,逐渐转向高清晰的视频图像采集仪器,数字高清晰视频图像信号HDV需要更加高级的视频图像采集镜头和存储介质(如目前出现的高清晰数字录像机),不同形式的DV视频图像采集如图3所示。
4 结语
4.1 体育科研领域中的运动视频图像采集技术是最为基础的科研分析和研究方法,也是教练员和运动员广泛采用的技术分析形式。运动视频图像采集是体育科研工作中最为直观、快速和有效的形式和手段之一。
4.2 体育科研中运动视频图像采集形式多样,不同的研究目的需要不同的运动视频图像采集形式,不同视频图像采集形式与体育科研的目的和研究内容紧密相关,不同的运动视频图像采集形式的要求和形式都不相同。在体育科研中一定要实现运动视频图像采集形式和研究目的相统一。
4.3 运动视频图像在体育科研领域中的作用和意义是:运动视频图像是最基本的运动技战术信息源,是最常用的运动技战术分析形式及研究的基础,它是最无干扰的技术分析和评价方法与手段,是最直接和客观的运动情况最真实的反映和记录,在体育科研领域中是最实用和最直观的运动技术诊断和评价资料,是运动员和教练员最受欢迎和最容易接受和理解的最基础信息资料。
摘要:运动视频图像采集是田径科研工作中最为直观、快速和有效的形式和手段之一,是最为常用和最为基础的科研分析和研究方法,也是教练员和运动员广泛采用的技术手段。田径项目科研中运动视频图像采集形式多样,不同的研究目的需要不同的运动视频图像采集形式。本文的研究结果是把目前在田径科研领域运动视频采集方法进行了一次归纳和总结性的综合研究,并给出了相应的应用研究结论。