视频信号分类

2024-12-08

视频信号分类(共7篇)

视频信号分类 篇1

0引言

早期交通 视频的分 类方法[1]是使用车 辆分割或 目标跟踪 技术的方 法进行判 别分类 ,但是由于 这种方法 计算量较 为复杂且 对视频分 辨率有较 高的要求 ,所以不适 合多目标 情况下的 分类应用 。 Saisan等人提出 一种基于 动态纹理 模型参数 间距离的 识别方法 ,这种方法 不需要提 取局部特 征 ,而是将图 像序列看 作是一个 二阶平稳 随机过程 。 基于此 ,Antoni在文献[2] 中提出了 基于动态 纹理模型 的交通视 频分类方 法 ,对已知的 交通图像 序列进行 模型参数 化 , 根据模型 参数计算 各模型间Martin距离[3]实现对交 通视频的 检索和分 类 。 然而 ,由于视频 数据的动 态短暂性 ,使得对传 统采样方 法的采样 率的要求 随之变高 , 且采样获 得的视频 数据量大 , 不便于储 存 。 近年来 ,高速发展 的压缩技 术很好地 解决了这 一问题 。 压缩感知[4]是美国科 研学者Donoho提出的一 种新的采 样方法 , 即当信号 为稀疏或 可稀疏信 号时 , 能够通过 获得的随 机采样少 量数据实 现对原始 信号的精 确重构 。 该文方法 在视频传 统分类方 法的基础 上结合了 压缩采样 技术 , 首先 , 对每帧图 像用统一 压缩测量 矩阵进行 观测 , 利用得到 的测量数 据通过奇 异值分解 的方法估 计出模型 的动态参 数 ; 其次 , 使用一个 时变的测 量矩阵对 每帧图像 进行测量 , 由于得到 测量数据 之间的不 相关性质 , 结合已估 计得到的 模型动态 参数 ,通过求解 一个凸优 化问题估 计出系统 模型的静 态参数 ; 最后 , 通过压缩 测量数据 直接得到 的模型参 数进行模 式判别 ,从而实现 低采样率 下的交通 视频分类 。

1动态纹理模型与距离度量

1.1线性动态系统

线性动态 系统 (LDS) 模型是Soatto等人[5]提出的用 来描述动 态纹理变 化特征的 模型 ,其主要目 的是通过 建立一个 数学模型 来描述一 个物理系 统的动态 特征 ,图像序列 的动态纹 理模型可 定义如下 :

其中xt∈Rd是d维的隐藏 (状态 )随机变量 ,yt∈RM是M维的视频 序列 。 A∈Rd×d表示状态 转移矩阵 ,C∈RM×d表示观测 矩阵 , vt、 wt表示噪声 信号 , 有vt~ N ( 0 , R ) 、 wt~ N ( 0 , Q ) , Q ∈ RM × M和R ∈RM×M表示计算 处理过程 和观测过 程的噪声 矩阵 。 动态纹理 可以由线 性动态系 统模型中 的参数集 Θ={A,C,x0, R , Q } 来表示 , 不考虑噪 声信号 , 动态纹理 模型可由 参数集 Θ={A,C} 确定 。 在已知N帧完整视频 序列信号Y1N= [ y1, y2, … , yN] 的情况下 , 文献 [ 6 ] 通过实验 提出一种 简单有效 的参数估 计方法 ,即通过对Y1N进行奇异 值分解 ,Y1T= UΣVT, 纹理模型 的参数可 由如下计 算式表示 :

其中表示状态 向量矩阵 的估计 ,表示伪逆。

1.2Martin距离

将动态纹 理的模型 参数A、C组成一个 新的变量M= ( A ,C) , 并生成一 个拓展的 观测矩阵 , 如下所示 :

动态纹理 间的Martin距离可用On( M1) 和On( M2) 列向量的 主角来定 义 ,如下式所 示 :

其中 θi表示拓展 观测矩阵On( M1) 和On( M2) 之间的第i个主角 。 马氏距离 的大小代 表了两个 纹理模型 之间的相 似程度 , 通过计算 马氏距离 能够对交 通视频进 行分类 , 其分类框 架如图1所示 。

2视频压缩感知与模型参数估计

2.1视频压缩感知

在本文中 , 规定yt∈RM表示视频 信号的第t帧图像 ,Y1N= [ y1, y2, … , yN] 表示为N帧原始图 像序列 , 在视频压 缩感知[7]中 , 通过如下 压缩采样 公式对视 频信号进 行逐帧采 样 :

其中zt、 Φt、 yt分别表示t时刻的压 缩测量值 、 测量矩阵 以及原始 视频帧 。 式(9)是一个凸 优化规划 问题 ,当yt为稀疏信 号时 , 使用L1-Minimization算法求其 最优解就 能够精确 恢复原始 视频帧 ,即少量的 随机采样 数据已经 包含了原 始视频帧 的足够信 息 。 基于此 ,本文结合 视频压缩 感知技术 , 对交通视 频信号进 行压缩采 样 , 从少量采 样数据中 直接估计 模型参数 , 实现交通 视频的分 类 (2.2节将作详 细讨论 ), 降低了硬 件系统编 码端的结 构复杂度 。 其分类框 架如图2所示 。

2.2模型参数估计

2.2.1状态转移矩阵的估计

由动态纹 理模型的 性质可知 , 状态向量 矩阵X1N包含的是 视频数据 信号的动 态特征 ,然而在进 行分类识 别的过程 中 , 会对得到 的状态向 量矩阵进 行降维处 理 ,即丢弃部 分不必要 动态特征 , 提取感兴 趣的动态 特征 ,从而更为 精确地实 现纹理的 识别 ,所以对每 帧视频进 行全采样 。 采样数据 包含了多 余的动态 特征信息 ,这个过程 浪费了大 量的采样 资源 , 本文通过 引入压缩 采样技术 , 能够很好 地解决这 个问题 , 即用一个 固定的测 量矩阵对视频的 每一帧图 像序列yt进行压缩 采样 , 如下式所示 :

通过N次采样得到的观测值矩阵为对每态相关性 ,所以对进行奇异 值分解 (SVD) 同样可以 得到状态向 量矩阵的 估计即在采样 的过程中 就实现了特征的 降维处理 ,继而估计 模型参数A。 本文从网 站[8]下载获得 交通视频 数据库 , 对交通图 像序列 (64×64×40)进行仿真 如图3所示 , 图 (a) 为原始交 通图像序 列直接计算得 到的前10个状态向 量曲线图 , 图 (b) 为交通图像序列经 过高斯随 机矩阵压缩采样 后 ,由观测值矩阵估计得到 的前10个状态向 量曲线图 , 其中采样数m=60。 从图3可以看出 ,本文压缩 采样得到 的观测值 矩阵能够 较好地抓 住原始图 像序列的 动态特性 。

2.2.2观测矩阵的估计

由2.2.1节可知 , 利用压缩 采样技术 能够有效 地估计出状态 向量的估 计值, 结合式 ( 2 ) 和式(9),得到下式 :

从式 (11) 中可以看 出 , 对于任意 时刻t, 动态参数为t时刻的状 态向量且 已知 , 模型参数C是静态不 变的 。 为了能够 从式(11)估计出模 型参数C,其中t 时刻的观测 值 , 定义时变 测量矩阵( 即不同时 刻取不同测量矩 阵 ),, 通过对视频序 列YN1进行N次连续测 量 ,测量公式 如下 :

由上式可 知 ,通过解决 如下一个 凸优化问 题 :

其中ci表示观测 矩阵C的第i列 ,Ψ 表示ci的稀疏基 。通过求解 上式的凸 优化问题 得到观测 矩阵的估 计本文采用Co Sa MP算法求解 式 (13), 在文献 [9] 中有详细 的算法求 解过程 ,本文不再 赘述 。 综上所述 ,本文通过 压缩采样 得到少数 测量值 ,通过少量 测量值直 接有效地 估计出纹 理模型参 数 ,其参数估 计框架如 图4所示 。

3实验结果与分析

本文从网 站[8]下载得到 交通视频 样本数据 库 , 数据库是 由西雅图 高速公路 上固定相 机拍摄的254个视频数 据组成 ,数据库中 考虑了多 种天气条 件(下雨 、晴天 、阴天)下的交通视频数据,为了更方便有效地进行实验测试 , 本文将下载得到视频数据库中的视频数据进行像素修剪, 将每个视频数据体素变为64×64×40的灰度数据 。 为了证明 本文方法 能够有效 估计出交 通视频信 号的动态 纹理模型 参数 , 本文选取 编号为 “cctv052x2004080516x01638 ” 的交通视 频序列作 为实验样 本 ,通过本文 提出的方 法对视频 序列进行 参数估计 , 其中本文 方法参数 设置如下 :, 稀疏基选 择为小波 基 , 其中comp表示压缩 采样比 ,即,仿真得到 如图5的实验结果 图 ,其中图(a)为原始交 通视频序 列 , 图 (b) 为根据本 文方法 (CS-DTC)估计得到 模型参数 恢复的交 通视频序 列 。

通过上面 的实验结 果可知 , 本方法能 有效估计 出交通视 频序列的 模型参数A、C。 为了更为 直观看出 本文方法 对交通视 频有较好 的分类效 果 , 对通过下 载得到的254个视频样 本进行分 类测试 , 视频库已 经通过人 工标记 , 其中包含44个重度 (heavy) 交通视频 ( 车流量较 大 , 车流速度 缓慢或停 止 ) 、45个中度 (medium ) 交通视频 ( 车流量一 般 , 车流程减 速运动 ) 、 165个轻度 ( light ) 交通视频 样本 (车辆量较 少 ,车流程匀 速运动 )。 本文将75% 的数据作 为实验的 训练样本 ,25% 的数据作 为测试视 频样本 , 本文方法 设置参数 :, 采样压缩 比comp分别取2 、 5 、 10 , 绘制多条 曲线 , 并通过本 文方法计 算得到模 型参数 ,采用马氏 距离为度 量对测试 样本进行 分类,仿真结果见图6,其中横坐标为拓展观测矩阵On(M) 的参数n, 纵坐标表 示分类正 确率 。 从图6中可以看 出 ,当压缩比comp小于5时 ,本文方法 在降低采 样率的同 时不会明 显影响交 通视频的 识别率 ,而随着压 缩比的继 续增大 , 由于大幅 降低了图 像序列的 采样率数 目 ,本文方法 在识别率 上整体低 于传统全 采样方法 。

本文通过 更改状态 向量维数d的大小 , 比较传统 方法和本 文方法对 交通视频 数据的识 别正确率 ,其中本文方法的参 数设置为 :, 仿真结果 比较如表1所示 。 从表1中可以看 出 ,状态向量 的维数大 小也会影 响分类的 正确性 , 状态向量 维数过小 , 其携带的信息量也 少 , 会影响分 类的正确 率 ; 反之状态 向量维数 过大 , 在携带不 必要信息 的同时也 会增大计 算的复杂 度 ,所以在实 际应用过 程中应该 合适地选 择状态向 量维数d的值 ,以获得更 好的分类 效果 。

为了直观 有效地看 出本文方 法能够有 效降低采 样率 , 并且不明 显影响分 类效果 , 本文选择 合适的仿 真参数 :通过调整 不同采样 压缩比comp下估计出模 型参数分 别进行试 验比较 ,试验结果 如表2所示 。 从试验结 果可以看 出 ,本文方法 在较低的 采样率下 依然能够 有不错的 分类效果 。

4结论

该文根据 交通视频 信号的纹 理模型特 性 , 在估计模 型参数的 过程中引 入了压缩 感知技术 ,通过压缩 采样得到 少量的测 量值 ,由少量的 测量值直 接估计出 纹理模型 参数 ,根据模型 参数对交 通视频数 据进行计 算分类 。 实验结果 表明 , 相比于传 统方法 , 本文方法 不仅能够 在非常低 的采样率 下较为准 确地估计 出模型参 数 ,且整个识别过程都 不需要对 视频信号 进行重构 ,为预报和 缓解交通 拥堵现象 提供了有 利的条件 ,本文方法 在视频纹 理识别的 其他领域 也有着非 常广泛的 应用前景 。

摘要:针对视频数据的动态纹理特性,提出结合视频压缩感知技术,首先通过压缩采样技术对视频数据进行采样,得到少量的采样数据;然后建立线性动态系统模型,通过少量的压缩采样数据直接估计出模型参数;最后通过计算模型间的马氏距离实现动态纹理视频数据的分类。实验结果表明,提出的压缩感知参数估计方法在20%的低采样率情况下,对交通视频数据的分类正确率达到87%以上。

关键词:动态纹理模型,压缩感知,马氏距离,视频信号分类

视频信号分类 篇2

1.1 电平的定义

为了避免混淆,对“电平”的含义必须明确加以定义[1]。在数字QAM信号中,“电平”是指在任意一个时间间隔中所测得信号的真实功率。另一方面,在模拟视频信号的情况下,“电平”是指在水平同步脉冲周期内所测得的已调制RF载波的真实功率,有时也被称为“峰值视频包络功率”。如果在一个经延伸的时间周期内,用一个被称作“视频滤波器”的电路对同一个已调制载波进行测量,那么所得之结果将是“平均”功率。

1.2 模拟和数字信号的幅度分布

首先假设将QAM信号电平设置成等同于模拟视频信号的平均功率[2,3]。诚然,即便如此,两种信号的幅度分布情况大不相同。这就是说,在同一瞬间两种信号的特定瞬时值截然不同。在同一个示波器上交替观察这两种信号就可以看出它们之间的差别。通过对模拟信号的行、场消隐脉冲的重复显示,就可对它进行测量。而数字信号则完全是随机的。从统计学角度来看,两种信号“密度函数的或然率”( Probability Densi ty Functions,PDF)是不相似的。数字信号经常是呈现“高斯”(Gaussian)型的。

然而,当许许多多独立的信号被组合在一起时,整个信号的幅度分布将趋向于“高斯”分布。人们常用“中心限制理论”(Central Limit Theorem)来证实这一点(详尽的数学计算已不属于本文范围)。实际结论可以这么说,随着信号数目的增加,两种不同信号的“峰值”将越来越相似。这样,在激光发射机中经过峰值限幅,两种信号将更为近似了。本文所指大量模拟视频信号的组合,其数目约为大于20个。

1.3 模拟视频信号的峰值包络功率和平均功率的差别

一个模拟视频信号的峰值包络功率是等于未调制RF的载波功率,这是因为在水平同步脉冲周期内的调制深度为0。当载波被调制时,功率之减少取决于在白色峰值电平出现时的最大调制深度以及平均的图像电平(Average Picture Level,APL)。

对一个单一信号来说,APL的变化将跟随图像内容的变化。当节目内容不同时,APL的值将完全不同。但是,当一组图像信号被组合在一起后,APL的变化必将会减少。所以要选择一个适当的APL值。根据以上分析,选择APL为50%,这是因为图像的中间亮度在全白与全黑之间,这样的假设看来较为合理。另外,应考虑到有足够多的一组信号被组合在一起。

因而,在随后的计算中考虑的是一个模拟视频信号的平均功率有50%的APL。

1.4 场消隐期间的效应

在PAL制中,场消隐持续时间约占25 行的时间。在场消隐期内不传视频信号,但其间有几“行”可能包含图文数据和测试信号等信息。由于有此场消隐期效应,APL更难计算。考虑到这个因素,在计算时可作一个小的调整。但如何来给这个调整作具体设定较难给出。通过大量的实际测试发现,在最差的情况下,因场消隐期效应引起的已调制信号的平均功率增加约为0.2 d B。

1.5 色度信号与音频信号的效应

由于色度信号与音频信号之幅度远低于各种同步信号之幅度,因此,对亮度信号的50% APL来说,它们的效应可以忽略不计。

1.6 电视制式标准的选择

以下各项计算的根据是采用PAL制(除PAL–I制外)特性标准。经过简单的各项修正可证明,如采用NTSC制特性标准,其结果也基本相同。对PAL–I制标准来说,差别较大(特别常涉及到调制深度),就需要另作计算。

2数字与模拟信号电平差的计算

2.1 采用一般制式时的计算

图1 展示了在行消隐期间一个模拟视频信号的时域响应过程。需要注意的是,标准已规定了各种电视信号的详细特征,行同步脉冲和消隐的持续时间在某一特定的信号电平上是唯一的。当然,从一个电平瞬间转换至另一个电平也是不可能的。

然而,为了简化计算,假设从行同步脉冲到行消隐电平之间的转换为瞬时转换,并且它们的持续时间是平均值。从图1中可见,行同步脉冲(B)的时间宽度取值为4.7 μs,整个行消隐持续期,包括消隐前沿(A)、行同步脉冲(B)以及消隐后沿(C)(后沿内包含色同步信号),总共为12 μs。

如果从同步顶点到峰值白电平之间总的视频信号幅度为1 V,设同步头峰值点作为参考点,其值设为0 V,则消隐沿为0.3 V,50%的APL值为0.65 V。

基带模拟视频信号对RF载波的调制采用负极性调制方式(大部分电视系统都采用负极性调制方式)。这意味着在行同步脉冲期间的RF载波幅度为最大。在PAL制式中,当图像信号处于峰值白电平时,“残留”(residual)的载波幅度是最大值的1/10,即0.1(要特别注意“幅度”与“功率”之区别)。图2展示的是在行消隐期间的已调制信号。

相应于消隐电平的RF载波幅度导出过程为:

在基带信号中,同步头到峰值白电平为1 V,消隐信号出现在0.3 V处(见图1)。如果RF载波的最大幅度为1.0,其幅度变化可从1.0~0.1,即0.9 的动态范围。将0.3 乘以0.9,得到0.27。所以,消隐信号可表现出一个最大值为0.73(由1.0-0.27得)倍的RF载波电平。

类似地,相应于50%白电平的RF载波幅度导出过程为:

在基带信号中,50%白电平信号出现在0.65 V处(见图1)。把0.65乘以0.9,得到0.585。因此,50%白电平信号可表现出一个最大幅度为0.415(由1.0-0.585得)倍的RF载波电平。

在行同步脉冲期间,RF载波处于最大幅度值,即1 V。现在又如何来确定已调制载波的平均功率呢?这就需要测定在整个一个行周期中(64 μs),信号在3 种电平(0.415,0.73,1.0)上各自的信号持续时间。

信号的3个持续时间如表1所示。

以上计算都是以电压(V)为单位的,现在则应以功率为单位来计算。因功率与电压的平方成正比,则可按电压平方关系计算

因此,功率从最大值下降了10lg(0.274)= 5.62 d B。换言之,一个被具有APL为50%的视频信号调制的RF载波,其平均功率比峰值包络功率或未调制载波的功率低5.62 d B。这就表明,对数字QAM信号来说,建议应用的平均功率电平应比模拟信号的峰值包络功率电平低约6 d B。这样就与模拟视频信号具有相同的功率电平了。

同样的方法也可用来分析在场消隐期间所增加的RF信号功率。诚然,如前所说有些电视系统常在场消隐期内插入文字、数据、测试信号等信息,有些系统则很少插入这些信息。在最差的情况下,假设不插入任何信息,则RF信号的平均功率被增加0.2 d B。这一点微小的调整可以忽略不计,而实际情况是,在场消隐期内插入测试信号是较为普遍的一种应用。

2.2 采用PAL-I制时的修正

在计算信号平均功率时,要考虑PAL–I制与其他制式的基本差别在于载波的调制深度。在PAL–I制中,与峰值白电平相应的残留载波幅度是最大值的1/5,即0.2,不同于其他PAL制的0.1,如图3所示。

用如前所述测定时间长度的方法来决定已调制载波的平均功率。这就是测定在整个行周期中(64 μs),信号在3 种电平(0.48,0.76,1.0)时各自的信号持续时间。

信号的3个持续时间如表2所示。

按电压平方关系计算

因此,功率从最大值下降了10lg(0.326 5)= 4.86 d B。事实上,PAL–I制的最大调制深度与其他PAL制相比略小一点,结果造成调制信号的平均功率略大。现在的结论就是在PAL–I制系统中,数字QAM信号的电平设置可比峰值包络视频功率电平低5 d B。这样就与模拟视频信号具有相同的功率电平了。

实际上,在有线电视系统的应用中,采用降低6 d B的方法较为普遍,而不管其为何种电视制式。

3 QAM信号的测量和设置

3.1 正确测量QAM信号的幅度

HFC设备正常工作的最基本要求是下行RF电平要设置正确。大多数人对模拟频道的测试都已经很熟悉,使用频谱分析仪和电平表很容易做到,但要正确测量64QAM和256QAM就遇到了麻烦。首先,这些载波形式的幅度是8 MHz带宽的平均功率。其次,数字调制载波很像充满频带的噪声,这使测量变得复杂。

在模拟电视频道幅度测量中感兴趣的是已调频道的视频载波的瞬时同步峰值的均方根值(RMS)。那就是为什么电平表使用峰值检波的道理,那样的仪表就可以决定瞬时同步峰值和显示载波RMS幅度。峰值检波电平表对视频是最佳的,但对噪声和类噪声的信号则无法测量。

当用通常的电平表去测量噪声时,必须使用检波器校对因子来修正。因为电平表是在较窄的带宽下测量的,对视频载波可以取得最佳效果,但对噪声就不行了。对8 MHz带宽的调制载波测量必须取整个带宽的平均功率。很明显这个带宽要比电平表的测量带宽(MBW)宽得多。有些仪表已具备数字平均功率测量的功能。频谱分析仪提供了一个很方便的测量数字调制载波的方法。但是,如果不注意使用方法非常容易得到错误的结果。

从图4 和图5 可以看出,尽管信号没变,但由于频谱分析仪上的分辨率带宽(RBW)设置不同,在频谱仪屏幕上显示出的QAM信号相对模拟信号的幅度差是不一样的。

通过公式计算的方式可得到正确的QAM功率为

式中:PT是总功率;PRBW是光标点测量值(图4 是90 d BμV,图5 是95 d BμV);BWE信号带宽;BWR是分辨率带宽(RBW)(图4是100 k Hz,图5是300 k Hz)。

通过图4所得到的数据计算得

通过图5所得到的数据计算得

可见图4、图5 中QAM信号强度都是109 d BμV。按国内大多数网络的设置,如果要求QAM信号比模拟信号低10 d B,则此时恰恰相对于模拟信号100 d BμV高出了9 d B,高于正常值19 d B。

3.2 正确设置QAM信号与模拟信号的电平差

通过上节分析可知,正确的设置见图6和图7。

PRBW的光标点测量值在图6 是中71 d BμV,图7 中是76 d BμV。 根据图6 中所得数据,依据式(3)得

根据图7中数据计算得

可见,这样的设置才是正确的。

4数字平移后发射机电平的调整

在实际应用中,由于数字平移后模拟频道数大大减少,一般从60 个减少到6 个,而增加的QAM数字频道数约在30个左右,所以光发射机的输入总功率下降,时常会引起发射机显示输入过低告警。此时就需要增加发射机的RF输入功率。必须清楚地知道,这个功率是指发射机得到的RF输入总功率。一般会通过提高每频道电平来提高总功率。

4.1 计算平移前后的信号总功率

如果平移前模拟频道为60 个,每频道的电平为15 d Bm V,则有

这个功率就是平移前发射机得到的总功率。

如果平移后模拟频道为6个,每频道电平提高到23 d Bm V,QAM频道为30个,QAM信号比模拟信号低10 d B,则有

这个总合成功率就是平移后发射机得到的总功率。可见,平移前后发射机得到的总功率基本相等,发射机工作状态没有改变,仍处在正常工作状态。

4.2 建议的调试方法

根据上节的计算可以看到,平移后如果把模拟信号电平提高8 d B,就可以保持光发射机得到的总功率与平移前一样。但也应该注意到,由此会带来3个问题:

1)要将前端原有的信号分配系统提高信号电平较困难,需要在前端增加前置放大器。

2)随着将来QAM频道的增加,需要降低信号电平,否则会引起发射机过载,信号质量变差。

3)无论是现在提高发射机的每频道输入电平还是将来随着QAM频道的增加而降低每频道电平,都会引起光站的输出电平变化,进而引起用户电平的变化。整个电缆分配网电平需要重新调整。

鉴于这3点,笔者建议在平移后不通过提高每频道电平的方法来提高发射机的总功率,而是采用如下3种方法:

1)有条件的可将整个频段内的QAM频道布满,不用的频道不加调制。将来仅需开启调制,电平无需调整。

2)关闭的且频点未被替换的模拟调制器继续保留,仅关闭调制,载波继续输出。将来根据QAM频道的增加而逐一替换。

3)用1台(也可2台或3台,根据具体情况)替换下的模拟调制器,放在频段最高点,调高其输出电平,使其与正在使用的模拟和数字信号的合成总功率与平移前一致。其输出电平的计算及总合成功率的计算方法与上节计算方法一样,区别的仅是此时是3个信号的合成,即在用模拟信号、QAM信号和这个仅供调试用模拟载波信号。将来随着QAM频道的增加,仅需通过降低这个模拟载波电平来保持总功率不变。而这个输出电平较高的模拟载波,由于处在频段的最高点,其产生的寄生杂波不会影响到频段内正常使用的频道。如果有多台替换下的模拟调制器可被用来放在频段的最高处用作调试用信号,则每台调制器的输出电平可相应降低。

无线视频信号采集系统设计 篇3

现在对无线信号的采集和处理主要通过视频采集卡进行采集,有一些公司生产的采集卡提供第三方的软件开发包(SDK)这样便于用户进行第二次开发。在监视计算机方面主要使用VC++,VB等开发软件进行监视界面的开发,但是总体比起来VC++在视频处理上比VB较为成熟,利用VC++中的VFW视频开发包对视频采集卡采集回来的视频信号进行处理。

1 视频信号采集系统组成

该系统的组成大致分为硬件和软件部分,该文对软件部分的设计和开发做着重的介绍,软件部分则利用VC++6.0为软件开发平台。

1.1 硬件部分

硬件部分由无线摄像头、摄像头信号接收器和USB视频采集卡三部分组成。硬件连接如图1所示。

USB视频采集卡工作原理。

该次视频采集系统采用的是EASY CAP的USB视频采集卡,视频采集卡是我们进行视频处理必不可少的硬件设备,无线摄像头发送的和无线信号接收器接收的信号是连续的模拟信号,但是计算机却不会识别模拟信号,计算机只识别0或1这样的二进制码,这样就需要一个像本系统中的USB视频采集卡把无线视频接收器采集到的模拟信号进行模/数转换,把连续的模拟信号转换成离散的数字信号,这样经过转换后的数字信号就可以被计算机编辑、处理和保存了。

在该系统中视频采集软件通过驱动识别USB视频采集卡并对采集回来的信息进行处理,因为视频采集卡采集到的都是一幅幅静态图片,所以要在软件中设置与USB视频采集卡相匹配的采集速率,这样就能对视频信号进行静态图片的抓取和保存,对视频流信号进行保存。具体数/模转换流程如图2。

1.2 软件部分

软件部分主要采用了VC++6.0来编写采集程序。

VC++6.0由微软公司开发,它是一个基于Windows操作系统的可视化集成开发环境,同时也具备C++语言编译器的功能。Visual C++6.0由编辑器、调试器以及程序信息技术向导AppWizard、类向导Class Wizard等开发工具组成。

VFW(Video for windows)是视频开发应用的一种早期技术。Microsoft的Visual C++从4.0版开始就支持Video for Windows(简称VFW)了,这给视频捕获编程带来了很大的方便。VFW(Video for Windows)是微软公司开发的针对于Windows自带的一个数字视频编辑软件开发包。用户不用自己安装VFW,而是Windows系统中自带了这个视频开发包,方便了用户的使用。VFW的中心就是一个A VI文件标准,A VI(Audio Video Interleave)就是一种声音和视频同步组合在一起的一种文件,它是一种有损的压缩形式。

在VFW中为用户提供了一套完整的应用程序接口(API),API可以为用户提供一种与应用程序访问一组例程的能力,而且用户不需要访问源码和了解内部工作的细节。编写程序时可以利用API函数来编写应用程序,这样就可以避免编写无用程序,减小工作量。

VFW的视频捕获主要由AVICap窗口类来完成。AVICap窗口类为应用程序提供了一个基于消息的接口。在该系统中视频的捕获和单帧捕获都是靠AviCap所提供的强大全面的函数和宏实现的,这是微软公司开发的VFW开发包为我们编辑视频采集软件提供的一条捷径,可以使用简单易读的函数和宏就可以达到我们编程需要达到的目的。

AVICap有两种显示视频的格式:(1)预览模式(preview),这是一个使用CPU资源的模式。视频流首先从采集硬件保存到系统内存,之后通过GDI函数将视频信息显示在捕获窗口中。从硬件角度讲,该模式需要使用VGA卡,通过VGA卡显示在监视器上。(2)叠加模式(Overlay)该模式显示视频是通过硬件的叠加,叠加的视频是不需要通过VGA卡的,叠加视频的硬件把自身的输出信号与VGA输出信号合并,最后显示到监视器上的信号是二者的组合信号。

2 VFW视频采集的开发

2.1 开发应用程序的步骤

V C++应用程序开发的一般步骤为:(1)创建一个项目;(2)采用workspace窗口和它的class view,file view,resource view去建立项目中的C++类、文件和资源;(3)将文件从项目中添加或删除;(4)编辑项目的源代码和资源;(5)为项目指定配置(Debug或Release);(6)连遍项目文件;(7)纠正连遍错误;(8)执行并测试生成的可执行文件;(9)测试项目文件;(10)剖视以及代码优化。

2.2 VFW采集开发流程

使用VFW进行视频采集大致分为如下几个部分基本流程。

(1)使用函数capCreatureWindows(…)创建应用程序的视频捕获窗口。(2)使用函数capsetcallbackonstatus(...)函数处理回调函数状态,并用capsCalLbackonerror(…)函数来设置错误信息的回调处理。但是该次系统设计没有使用回调函数。(3)查找USB视频采集卡的驱动并连接。(4)得到USB视频采集卡的驱动信息。(5)判断是否连接正确,并设置采集速率。

2.3 监控系统的建立

使用VFW的宏函数实现视频捕获和预览,应用程序简单、控制灵活。在本系统中,是基于VC++6.0的对话框应用程序框架实现编程开发,很多的应用程序都是基于这种开发方式的。另一部分应用就是基于文档的编程开发,单文档是主流。文档应用程序的最大特点是有标准菜单、客户区域任意调整;缺点是相对比对话框类,开发难度较大。

2.3.1 建立单文档应用程序

该系统是基于VC++6.0的项目建立向导创建一个单文档、无工具栏和状态栏的应用程序,下面是建立单文档应用程序的详细步骤:首先启动VC++6.0,选择“文件”一“新建”一“工程”命令。在工程选择卡中,选择MFC AppWizard(exe)。

工程名称栏中输入工程的名称,位置栏中输入的是工程所保存的文件位置。

下一步需要选择创建应用程序的类型有三类分别为:单文档、多重文档和基本对话框,由于本系统是视频采集界面,所以选择的应用程序为基本对话框应用程序,点击完成就成功的建立了一个基本对话框的应用程序工程。

2.3.2 建立对话框

对话框是监控软件和用户的交互平台,使用者可以在对话框中直接预览由USB视频采集卡采集到VC++中的视频信息,并对其进行抓取截图、录像、暂停和退出等功能,这些功能会以按钮的形势提供给使用者,方便对视频信号进行想要的处理。对话框建立的详细步骤如下:在工作空间下选择“resource view”选项卡打开dialog下拉文件并在dialog文件夹上右键单击选择插入dialog,创建一个新的对话框,此时新建的对话框就出现在右侧工作区中,我们可以对其进行大小的任意改变。

2.3.3 添加图像和按钮控件

对于本次系统的设计,需要对对话框添加“图像”和“按钮”控件,在工具箱中就可以找到并选择加入到对话框中的任意位置,“图像”的作用是显示由USB视频采集卡转换成的数字视频信号,起到一个监视屏的作用,因为代码中已经把窗口的大小作为一个指针,送到窗口创建函数capCreatureWindows()中了,当程序初始化时可以自动识别到窗口的大小并返回一个宽度和高度值,所以图像控件可以随意更改大小,函数中设置窗口X轴坐标和Y轴坐标的数据已经被指针所取代了。“按钮”则为使用者提供对采集回来的视频信息进行处理的功能,按钮有五个各自的功能分别为:播放、截图、录像、暂停和退出。在添加按钮时可以改变其名称,这个名称就是显示在按钮上的名称,起到提示其功能的作用。当添加好按钮时双击按钮就可以进入到按钮代码的编辑,用来响应函数的功能,在修改控件ID后,比如一个按钮控件,假设使ID为BUTTON 1则建立按钮后在窗口类中的对话框类中自动添加了一个名为ONBUTTON1的按钮控件类。这个类则包含了这个按钮所包含的一些属性和信息。

关于窗口类,我们在运行程序的时候可以直接看到窗口对话框,在窗口建立之前系统要知道怎样建立一个窗口,和窗口返回的一些信息要交给谁处理。这样就需要我们创建一个窗口类来定义我们设计的窗口的各种信息,比如窗口的消息、函数的处理、窗口的风格、图标、鼠标、菜单等等。可以使按钮实现各种功能。下图为设计好的对话框。

具体程序代码不再详述。

3 运行调试

代码编辑完成后就要把工程保存,之后就可以编译了,在编译菜单下选择编译选项(也可以直接按F7键,同样可以对源文件进行编译),对源文件进行编译、执行及编译配置等操作,该菜单位于编译器的顶层菜单中。按F5可以调试应用程序,查看程序的运行情况。如果在调试程序时遇到问题,可以使用编译器中的“帮助”菜单调用MSDN帮助文件来解决问题。编译后在工程的文件夹下有个一DEBUG的文件夹中就会生成应用程序图标,双击就会运行应用程序。查看应用程序的运行情况,以及各个功能的实现情况是否正常。

在运行程序后,因为视频信号进入到USB视频采集卡后,采集卡又对信号进行一次硬件压缩,性质类似于对信号进行了编码,而本系统采用的是CapAvi来采集的信号,把压缩过的信号直接显示到了预览窗口中,所以会有信号的不稳定与数据的丢失。

其他的功能正常,程序运行正常。

4 结语

该系统基于VC++6.0利用VFW开发包,对无线视频信号进行采集和处理系统进行了设计。搭建了一个无线视频信号采集的平台。该系统主要的开发部分为软件部分,硬件只需进行驱动的安装和硬件连接即可。通过运行调试,取得了比较好的效果。

参考文献

[1]刘锐宁,梁水,李伟明.Visual C++项目开发案例全程实录[M].北京.清华大学出版社,2011:1-62

[2]任观就,张永林.实时视频图像捕获的实现方法[J].计算机工程,2002,28(8):268-270.

[3]陈珲,张会汀,周杰华.利用VFW实现实时视频捕获及其应用[J].计算机应用.2003,23(8):141-143.

自适应视频信号传输解决方案 篇4

关键词:视频传输,均衡器,双绞线,视频切换系统,安全监控系统

在安防监控系统中,视频信号传输是整个系统中一个至关重要的环节,选择何种介质和设备传送视频信号将直接关系到监控系统的质量和可靠性。目前,在监控系统中用来传输视频信号的介质主要有同轴电缆、双绞线和光纤,对应的传输设备分别是同轴视频放大器、双绞线视频传输设备和光端机。

同轴电缆是较早使用,也是使用时间最长的传输方式。后来,由于远距离和大范围图像监控的需要以及人们对监控图像质量要求的提高,监控网络中开始大量使用光纤来传输视频信号。至于双绞线被使用到视频监控网络中则是近来的事, 它的出现主要很好地解决了两个方面的问题:一方面它解决了200米至2000米距离范围内高质量视频信号传输的问题,因为在这段距离范围内同轴电缆传输难以达到要求而光纤传输又显得不经济;另一方面它解决了大规模密集型监控网络的布线问题,双绞线自身的尺寸和柔软性克服了大量使用同轴电缆时的布线难题。当然,双绞线还具有抗干扰能力强、价格便宜等优点。正是由于双绞线很好地解决了长期困扰着人们的这些问题,所以它在监控网络的应用立即引起了业界广泛的关注,在较短的时间内已经被大量使用到工程实践中,并且取得了很好的应用成果。

视频信号双绞线传输的典型应用

图1示出双绞线传输的典型应用框图。

在摄像机端, 一般采用无源变压器将单端CVBS视频信号转换成差分视频信号;双绞线传输设备完成差分信号至单端信号的转换以及视频信号的放大、滤波、驱动;信号输出可接至监视器、DVR设备或视频矩阵设备。双绞线一般是5类双绞线, 如网线。

视频信号双绞线传输的传统解决方案

传统解决方案一般采用无源发射 (如不平衡变压器) 和有源接收 (如EL5175) 。有源接收电路里需要设计由阻容构成的均衡网络,采用拨码开关来设置不同补偿距离下的补偿参数,同时一般还需要增设两个机械电位器,用于亮度和色度的微调。

由于传统方案采用手动均衡方式,而实际应用中网线质量、安装距离和阻容器件参数分散性等因素,造成拨码开关设置的补偿参数的补偿效果不是很理想。虽然通过微调两个机械电位器可以改善补偿质量,但由于两个电位器的调节是相互影响的,现场工程人员不好掌握调节的尺度。

视频信号双绞线传输方案

Maxim提供的1200米自适应视频信号传输方案是:M A X 4 4 4 5+M A X 7 4 7 4+MAX11504,采用三级结构:第一级采用MAX4445配合外部阻容均衡网络,实现差分信号至单端信号的转换并进行预均衡;第二级采用MAX7474,实现信号自动均衡,补偿由于网线质量、安装距离、阻容器件参数分散性等带来的差异;第三级采用MAX11054,实现信号滤波、缓冲和ESD保护。原理电路如图2所示。

该方案的优势在于:

·消除线材质量的差异带来的补偿效果的差异

由于实际安防工程中,用户采用的网线品牌有多种,质量会有差异,而传输设备中设置好的补偿参数又是在特定一种材质的网线下调试的。因此当工程中铺设另一种网线时,补偿效果就会有差异。在Maxim方案中,由于采用了具有自动均衡功能的芯片MAX7474,从而可以很好地消除线材质量的差异带来的补偿效果的差异。

·消除工程中实际安装距离的差异带来的补偿效果的差异

传输设备中设置好的补偿参数一般是在特定距离下调试的,如600米。而在实际安防工程中,安装距离不会刚好是600米,可能是650米,则设备中拨码开关设置的补偿参数的补偿效果就会有差异,图2中由于采用了具有自动均衡功能的芯片MAX7474,从而可以很好地消除工程中实际安装距离的差异带来的补偿效果的差异。

·消除均衡网络中阻容器件参数的差异带来的补偿效果的差异

众所周知,常用的电阻和电容的精度都较低,电阻的精度一般是1%或5%,电容的精度一般是10%甚至20%。因此,即使在特定安装距离和特定材质的网线下调试均衡网络的补偿参数,两组阻容器件由于参数的分散性,补偿效果就会有差异。图2电路由于采用了具有自动均衡功能的芯片,从而可以很好地消除均衡网络中阻容器件参数的差异带来的补偿效果的差异。

对比图3、图4和图5,我们可以清楚地看到该方案对视频信号的补偿效果。

结语

MAX7474为复合视频信号通过非屏蔽双绞线传输时提供电缆损耗补偿,通过监测输出端彩色视频信号的同步信号和色同步信号的幅度调节增益,自适应均衡电缆长度。采用网线传输时,MAX7474可完全均衡300米传输电缆的损耗,并可有效提高600米传输电缆的信号完整性。MAX7474接受NTSC和PAL制式的差分视频信号,包含单位增益视频输出驱动和可调节的后肩钳位直流电平,器件还提供LOS和LOB逻辑输出指示。

在本方案中,我们采用MAX4445配合外部阻容均衡网络固定补偿特定的传输距离,并结合MAX7474自动均衡的特点来补偿网线质量、安装距离和阻容器件参数分散性等带来的差异,很好地解决了1200米视频信号的自适应传输。

参考文献

[1]MAX7474数据手册[R], Maxim公司

[2]MAX4445 Datasheet[R], Maxim

[3]MAX11504 Datasheet[R], Maxim

[4]Ben Nader.模拟视频滤波技术[J].电子产品世界, 2008, 3:110-112

基于谱分析的信号分类算法研究 篇5

随着通信技术的发展,无线通信环境越来越复杂,通信信号的调制方式也越来越多。要有效地分析这些通信信号并获取信号中的信息,就必须要知道信号的调制方式。信号的调制识别,也被称做信号的分类,即给出信号的调制方式及信号载波频率、码元速率等信息,为后续的信号分析提供依据[1,2]。

频谱分析是信号分析非常重要的方法之一,通过信号的频谱可以获得信号很多信息。不同的调制信号,其频谱结构和特征也会不同。通过提取这些特征并加以区分,便可以得到信号的调制类型[3,4]。

1 MFSK信号的谱特征

1.1 MFSK信号的调制原理

MFSK信号是以载波的频率变化来传递数字信号的。它的表达式为:

其中,an是M进制数字序列,△ωm(m=0,1,…,M-1)是与相对应的载波角频率偏移。

1.2 MFSK信号的频谱

以2FSK信号为例,式(2)给出了FSK信号的频谱表达式[5]:

其中fs为信号采样频率。从上式可以看出,2FSK信号的频谱由连续谱和离散谱组成。连续谱之间的距离由信号的调制指数,即信号的频率间隔决定。当|f1-f2|>fs时,信号频谱呈现为两个谱峰;当|f1-f2|

同理,MFSK信号的频谱具有同样的结构。在调制指数够高时,信号频谱呈现M个谱峰,否则,信号频谱呈现单峰。

1.3 MFSK信号的高次方谱

对式(1)平方并去除直流分量后,得到MFSK信号的平方信号为:

MFSK信号平方后,其调制指数会加倍,同时它的带宽也会变成原来的两倍。

同理,对式(3)平方得到MFSK信号的4次方为:

式(4)表明,MFSK信号四次方后,它的调制指数将会再次加倍,变为原来信号的4倍,即信号谱峰之间的分辨率也提高了4倍。

图一给出了调制指数为0.5的2FSK信号和4FSK信号的频谱、平方谱和4次方谱。

2 MPSK信号的谱特征

2.1 MPSK信号调制原理

MPSK信号是用载波的相位变化来传递数字信号的。它的时域表达式为:

其中φn∈{2π(m-1)/M|m=1,2,…,M-1}为受信息控制的相位参数。

2.2 MPSK信号的频谱

以2PSK信号为例,式(6)给出了PSK信号的频谱表达式[5]:

式(6)中fs为信号采样频率。从式(6)可以看到,2PSK信号的频谱同样由连续谱和离散谱两个部分组成,但是在符号出现概率相同时,离散谱为0。2PSK信号的频谱呈现为一个谱峰的形状。

同样的,MPSK信号的频谱结构与2PSK信号类似,在频域呈现一个谱峰的形状。

2.3 MPSK信号的高次方谱

将式(5)平方并减去直流分量后,MPSK信号平方后为:

/M|m=1,2,…,M-1},M为PSK信号的调制阶数,是2的整数次幂。令M=2n,m=1,2,…,M-1,对于BP-SK信号,有m=1,φn=π,则BPSK信号的去直流后的平方信号为:

可以看到,2PSK信号的平方信号是一个频率为2ω0的单载波信号。而对于M>2的其他MPSK信号,由式(7)可以看出,对其进行平方后,信号都会变成(M/2)PSK信号。

再对式(7)平方并去除信号直流成分后得到MPSK信号的4次方信号:

式(9)中φn∈{2π(m-1)/M|m=1,2,…,M-1},M=2n,m=2,3,…,M-1。对于4PSK信号,有m=2,因此由式(9)可以看到,4PSK信号的四次方是一个频率为4ω0的单载波信号。而对于M>4的其他MPSK信号,对其进行四次方变换后则变为(M/4)PSK信号。

图二给出了2PSK信号和4PSK信号的频谱以及其高次方谱。

3 基于谱分析的信号分类算法

从上面的分析我们可以很明显地获得MFSK信号和MPSK信号在频谱及高次方谱方面的区别。MFSK信号的频谱通常是有M个谱峰,其高次方谱中,谱峰的分隔会更加的明显。MPSK信号的谱峰通常是一个谱峰,BPSK信号的平方谱会有一个很大的单载频分量,QPSK的四次方谱会有一个很大的单载频分量。通过这些谱特征,就可以将这些信号进行分类。图三给出了基于谱分析的信号分类算法流程图。图四给出了5—20d B的信号正确识别率。从图中可以看到,在信噪比不低于0d B的情况下,信号的综合正确识别率不低于95%。

4 结束语

本文通过分析PSK信号和FSK信号的频谱特征,提取了一组基于信号频谱及高次方谱的特征参数来区分信号。仿真实验结果表明,在低信噪比情况下也能够获得较高的正确识别率,证实了算法的可行性。

摘要:本文通过对常用数字信号的频谱及高次方谱进行分析,通过信号频域区别提取一组有效特征对常用数字信号进行分类。这组特征提取简单,且无需任何先验知识。仿真结果表明,在信噪比不低于0dB的情况下,正确识别率达到95%以上。

关键词:数字信号,频谱,高次方谱,信号分类,调制识别

参考文献

[1]E.E.Azzouz,A.K.Nandi.Automatic identifica tion of digital modulation types Signal Processing[J].Signal Processing,1995,47(01):55-69.

[2]敖仙丹,何世彪,吴乐华.认知无线电中调制识别算法研究[J].通信对抗,2008(,02):29-32.

[3]Fangjuan Xie,Chisheng Li,Guojin Wan.An Efficient and Simple Method of MPSK Modulation Classification.WiCOM2008.2008IEEE,Page(s):1-3.

[4]杨志俊,范海波,曹志刚.基于谱分析的通信信号调制方式自动识别[J].无线通信技术,2003,(02):30-33.

基于模糊分类的视频对象分割 篇6

视频对象分割是指把图像序列或视频按一定的标准分割成区域, 目的是为了从视频中分离出有一定语义的实体。这种有语义的实体在数字视频中称为视频对象面VOP (Video Object Plane) 。视频对象分割涉及对视频内容的分析和理解, 这与人工智能、图像理解、模式识别和神经网络等学科有密切联系。至今仍没有通用的有效方法去根本解决所有视频对象分割问题, 视频对象分割被认为是一个具有挑战性的难题, 基于语义的分割则更加困难。

由于目标运动的随机性, 使得运动变化区域不确定而具有模糊性, 因此可采用模糊分类的方法在差分图像中对运动变化区域和相对噪声区域进行划分, 从而检测出运动变化区域。

2 算法描述

2.1 算法流程图 (见图1)

本算法采用假定不存在由于摄像机运动而引起的全局运动, 如果存在该运动, 可以通过全局运动估计与补偿来消除由于摄像机运动而带来的相邻帧之间的背景变化。

2.2 模糊划分

在运动目标可视条件下, 差分图像中的运动变化区域内的像素具有灰度值相对较大的特点, 而相对噪声区域的像素具有灰度值相对较小的特点, 因此我们可以选取灰度作为对差分图像中的运动变化区域和相对噪声区域进行划分的特征。此外, 由于运动变化区域内的像素具有灰度值相对较大的特点, 而隶属度函数中的S函数的特点是特征值较大的样本所对应的隶属度较大, 因此我们选择S函数作为运动变化区域的隶属度函数;同理, 选择Z函数作为相对噪声区域的隶属度函数。

令 表示差分图像中运动变化区域的隶属度函数, 表示相对噪声区域的隶属度函数。i表示差分图像中的灰度值, 则

其中b取a, c的中点。

模糊分类方法采用模糊C均值分类算法。设 是n个样本组成的样本空间, C为预先确定的类类别数目, 是每一类的聚类中心, 是第i个样本对第j类的隶属度函数。用隶属度函数定义的聚类损失函数可以表示为:

其中, 为控制聚类结果模糊程度的常数。

在不同的隶属度定义方法下最小化 (3) 式所示的聚类损失函数, 就得到不同的模糊聚类方法。其中, 最有代表性的是模糊C均值分类算法, 它要求观察样本空间中的每个样本对各个类别的隶属度和为1, 即:

在以上条件下求 (3) 的极小值。令J对mj和 的偏导数为0, 可得:

以上两式可由迭代方法得到。

在该算法中, 采用 (3) 为准则函数。由于将差分图像分为运动变化区域和相对噪声区域, 所以分类类别数目为2。

设差分图像中灰度值出现的次数为hi, 令CMR和Cn分别为差分图像中运动变化区域和相对噪声区域的模糊聚类中心, 则有

令 (3) 中的为2, 可得到对差分图像中运动变化区域和相对噪声区域进行划分的准则函数为:

准则函数J是关于a, c的函数, 现在的任务是求使J达到最小值时a, c的值, 设 可使J达到最小, 则:

根据 的值可以确定差分图像中运动区域和相对噪声的隶属度函数, 从而完成对运动区域和相对噪声的模糊划分。当灰度值为

时有 当 时i隶属与运动区域的程度更大, 反之隶属于相对噪声区域的程度更大。设分类门限为

根据t进行划分, 大于t的属于运动变化区域, 小于t则属于噪声区域。从而将模糊分类的结果去模糊化, 并检测出运动变化区域。即

其中: 分别为差分图像, 运动变化区域和相对噪声区域。

2.3 提取视频对象边界

采用Sobel算子提取边缘。设第k+1帧图像为为边缘检测算子,

设MR为通过以上模糊分类方法得到的运动区域在当前帧中的对应位置, 则视频对象的边界 为:

2.4 视频对象生成

由于检测出的边界不一定是闭合的, 所以可以通过填充技术来确定视频对象的大致边界, 然后通过边界后处理器来纠正错误边界, 最后得到准确的视频对象边界, 并根据闭合的视频对象边界生成视频对象。

结束语

本文提出了一种基于模糊划分的运动变化区域自动检测和视频对象生成方法。讨论了基于模糊划分的运动变化区域自动提取和视频对象生成的系统模型, 提出了一种运动变化区域和相对噪声区域的隶属度函数确定的方法, 在确立的模糊分类准则函数的基础上通过寻优计算得到最佳划分, 从而检测出运动变化区域, 并结合当前帧的边界特征生成视频对象。实验表明该算法能够检测出运动变化区域并生成运动对象, 具有较好的鲁棒性和较强的自适应性。

摘要:本文提出了一种基于模糊分类的视频对象分割算法, 确定了运动变化区域和相对噪声区域的隶属度函数, 在确立的模糊分类准则函数的基础上通过寻优计算得到最佳划分, 从而检测出运动变化区域, 并结合当前帧的边界特征生成视频对象。

关键词:模糊分类,视频对象,隶属度函数

参考文献

[1]王军, 沙芸, 吴裕树.基于背景模型的自动视频分割方法[J].计算机工程与应用, 2003, 9.

[2]包红强.基于内容的视频运动对象分割技术研究[D].上海:上海大学, 2005.3 (3) :55-56.

[3]袁基炜, 史忠科.一种快速运动目标的背景提取算法[J].计算机应用研究, 2003.

电视系统中数字视频信号的监测 篇7

对于数字电视节目监测离不开监视器, 为了使监视器准确重现原图像, 需要规范调整。根据ITU BT-818和ITU BT-815标准, 首先调整监视器的亮度和对比度。亮度调整是进行黑电平调整, 调整亮度电平时, 视频信号是在垂直方向整体移动。一般使用PLUGE信号中的三电平信号调整亮度, PLUGE信号中的三电平信号包括-2%黑、0%黑和+2%灰。将PLUGE信号输入到监视器的输入端, 如果我们从屏幕上看到-2%黑的电平条, 说明信号的黑电平有些偏高。如果从屏幕看不到+2%黑的电平条, 表明信号的黑电平有些偏低。实际上, 只要调整到从屏幕上看-2%黑和0%黑两个条相同, 同时能够显示出+2%黑的电平条, 此时, 亮度电平已经调整到适当位置。其次对比度调整是调整亮度信号的放大量。将亮度的层次拉开, 信号底部的基点是不动的, 对比度的调整没有相应的标准, 一般根据环境以及人眼的主观感觉调整到一个适当位置。而颜色调整实际是色度信号幅度的调整, 表现在屏幕上就是色彩饱和度的调整。调整过程中, 需要输入彩条信号, 对于标准的100%彩条信号, 若监视器色度的调整符合标准, 相应的蓝路信号在白、青、紫和蓝条的电平幅度就完全一致。一般在监视器上有一个只看蓝色的按键, 按下去后, 屏幕上只显示蓝色信号, 此时只需要调整色度旋钮, 使相应的亮度区域一致即可。这样就可以使监视器准确的重放出原始颜色。

在数字节目图像信号记录和技术质量审查时, 不仅要监测复合全电视信号幅度不超过标准规定, 而且要确保分量信号R、G、B色域不越限超标。这一点在进行数字节目质量监测时已经充分得以证明, 有些图像信号的复合全电视信号幅度测量时并没有超过800mV, 但在R、G、B信号色域监测时已经越限超标, 而且实际观看的图像也是明显偏色的。根据上面所说的监测方法, 不仅要有复合全电视信号幅度监测功能, 而且应具备R、G、B色域监测功能。目前具有钻石显示和箭头显示功能的监测仪, 以及具有Five Bar显示功能的监测仪, 都能用于判定R、G、B信号色域是否越限超标, 而且很容易区分是哪个通道色域超标。这些显示功能上/下限指标均可以预置门限值, 用户根据不同标准任意设定使用。

不同的是:具有钻石和箭头显示功能的监视仪除上/下门限值可预置外, 还具有超标象素占整个画面象素面积的百分比数值的设定, 这给使用者一个宽限, 即只有超标象素面积占整个画面面积达到或超过设定的百分比时才报警, 确定为超标;而具有Five Bar显示功能的监测仪没有此项面积百分比设定, 即超标象素不管占整个画面象素面积的百分比多大, 只要超标幅度达到设定的门限值, 就以红色警示区显示超标。

数字信号还可以用眼图来确定和检验串行数字信号的传输质量, 把串行数字信号输入到示波器的信号输入端, 并用本输入数字信号作为示波器的扫描触发信号, 扫描周期选为二个时钟周期, 即两个码元的时间, 由于输入数字信号以扫描周期重叠显示在荧光屏上, 形成一个图形, 宽度同一个码元宽, 高度同数字信号的脉冲幅度。对于一个频带宽度无限宽的系统, 数字信号从1到0和从0到1的转换速度非常快, 转换时间可为零, 显示出的图形为矩形。但实际传输系统的频带宽度有限, 数字信号的0和1的转换时间变慢, 脉冲的上升沿和下降沿不再陡峭, 并有上冲和下冲, 相位抖动, 不同宽度脉冲的幅度有了差别, 甚至脉冲的顶部和底部变得倾斜了, 因此显示图形形状与人眼形状相似, 称为眼图。

如果数字信号的模拟波形是理想的, 眼图会呈现为一系列方框, 但在实际系统中, 由于带宽、噪声以及抖动等因素的影响, 会造成眼图的闭合, 数字系统最终关心的是眼图的闭合程度。通常幅度变化, 噪声等因素造成眼在垂直方向上的闭合, 定时抖动影响水平闭合, 整个数字系统在正常工作时, 应保持眼的开度。眼图广泛应用于确定设备的特性和技术标准、安装后的验收检测、以及系统设备维护测试, 眼图观测和分析是对数字信号质量进行检验的一种较好的方法。

眼图观测通常包括:幅度、时钟周期、上升和下降时间、过冲和下冲以及抖动等参量, 使用专用的数字分量波形监视器或示波器可以进行观测。SMPTE 259M规定的信号电平和参数的容限如下, 对于非平衡输出的串行接口, 输出阻抗为75Ω, 反射损耗≥15dB (5MHz~270MHz) , 输出信号幅度变化在800mVpp的±10%以内, 直流偏置信号半幅度点电平在0V±0.5V范围内, 20%~80%上升时间0.4~1.5ns之间, 80%~20%下降时间0.4ns~1.5ns之间, 上升时间与下降时间差值0.5ns, 上冲小于信号幅度的10%, 下冲小于信号幅度的10%。对于非平衡输入的串行接口特性和参数容限为输入阻抗75Ω, 反射损耗≥15分贝 (5MHz~270MHz) , 电缆均衡1/2时钟频率上电缆的衰减量≤30dB。

串行数字信号监测的另一个指标是抖动。数字信号在形成、编码、处理、传送和变换中, 数据发生跳变, 由于数字信号的跳变对它们的理想位置在时间上的变化, 产生了偏移。抖动是串行数字传输系统中最重要的参数之一, 它能够在数字数据的传送和恢复中引起差错, 当这种偏差变得足够大时, 数据可能被译错。表征和测量抖动性能对串行数字系统可靠和可预测的工作非常重要。

根据不同抖动频率成分使接收机失锁的幅度频率曲线, 可见抖动速率越高, 对设备影响越严重, 抖动的分类要以所包含的频率成分来划分, 大致分为绝对抖动、定时抖动、校正抖动和低频抖动, 与其它抖动相比, 校正抖动是最重要的抖动测量参数, 它能够直接给出影响数字接收机正确恢复数据能力的信息。串行数字信号抖动参数和限值:定时抖动的下限频率为10Hz, 校正抖动的下限频率为1kHz~100kHz之间, 测量的上限频率在1/10时钟频率以上, 定时抖动限值应小于0.2UI, 校正抖动限值应小于0.2UI。

电视图像中对于数字视频信号除了以上几种监测指标外, 还有误码的测试。误码不仅使电视图像出错, 而且严重时还会造成图像丢失, 误码的产生主要由传输环境, 如信噪比下降、高频抖动、设备接地、设备间连接的电气特性不好、电源干扰等造成, 其测试主要通过固定图形测试法和在线EDH检测和处理。

随着数字化进程的不断深入, 数字产品逐渐进入了电视领域, 传统的测量和监测手段已不能适应新技术的要求, 如何对数字电视信号进行有效的监测和可量化的管理就成为各个电视台普遍关心的问题。使用具有性能优良的数字图像测试仪器对电视系统进行测试, 从而客观的、公正的对数字电视系统给出全面评价, 有利于数字电视系统进行科学的设备选型、系统验收, 一个好的信号监测系统应该能够具有良好的检测精度、丰富的检测内容、灵活多样的报警方式以及操作方便的监测软件, 这样可以更好地提高电视设备的数字化改造。

摘要:随着数字化、网络化技术在广播电视领域的应用, 数字电视图像的清晰度、饱和度都有了质的飞跃, 对数字电视节目系统图像质量的监测与测量, 有利于科学的进行设备选型、系统验收, 促进广播电视技术事业的发展。

关键词:监测,PLUGE信号,色域,眼图,抖动

参考文献

[1]李汉舟, 潘泉, 张洪才, 赵春晖, 冯旻.基于数字图像处理的温度检测算法研究[J].中国电机工程学报, 2003, 6.

上一篇:社会系统工程下一篇:异质行为