动态范围

2024-10-11

动态范围(精选8篇)

动态范围 篇1

摘要:从接收机动态范围的概念出发,讲述了动态范围在接收机设计中的重要性。分析影响动态范围的几个因素,包括前端预选器的选择性、放大器增益分配、自动增益控制等,并基于数字中频接收机给出了扩大接收机动态范围的常规方法,如自动增益控制、中频限幅器和对数放大器等,分别指出常规方法应用于宽带数字接收机的局限性。

关键词:动态范围,放大器,AGC,宽带数字接收机

在现代密集而复杂的电磁环境中,为了实现通信、侦察等功能,接收机不仅需要较高的灵敏度,也对其动态范围提出了更高的要求。制约接收机完成功能的参数已不是早期的灵敏度而是它的动态范围。由于软件无线电技术的发展,目前大多数接收机都是采用模拟射频前端结和数字中频来实现整个接收功能的。本文主要分析了射频前端动态范围。

1 动态范围的概念

不失一般性,假设输入端有m个振幅和频率都不同的信号同时输入,即:

Vi(t)=n=1mVncosωnt(1)

由于非线性,输出信号可以表示为输入信号的非线性函数,展开成幂级数,可表示为:

Vo=n=0ΚnVin(2)

式中:Vi为输入信号电压;Kn为复系数。

Vi代入其中并整理,可得:

Vo=n=1mΚ1Vn+34Κ3Vn(Vn2+2p=1nmVp2)+n=1m[p=n+1mΚ2VnVpcos(ωn+ωp)t]+34Κ3n=1p=1pnmVn2Vpcos(2ωn±ωp)t+(3)

由式(3)可得输出信号中各分量如下:

直流与基波:

n=1mΚ1Vn+34Κ3Vn(Vn2+2p=1nmVp2)(4)

二阶互调:

n=1m[p=n+1mΚ2VnVpcos(ωn+ωp)t](5)

三阶互调:

34Κ3n=1p=1pnmVn2Vpcos(2ωn±ωp)t(6)

考虑单音输入时,输出端将会有直流、基波及多次谐波出现。由于在一般情况下,K3<0,因此小信号输入时,基波增益可视为常数,当输入信号增加到一定时,式(4)中的高阶项不能忽略,出现增益压缩情况(若K3>0,则出现增益扩张现象)。然而,更为普遍的情况是接收机输入端有多个信号同时到达,由于非线性效应,其输出端除了基波分量(线性产物)外,还出现了大量与输入信号频率不同的新信号。此时,为了便于比较各个接收机的动态范围,业内定义了一个无虚假响应的动态范围SFDR,即若接收机的三阶互调产物折合到输入端恰好等于基底噪声,则此时的输入信号Pin,max规定为上限,下限输入信号规定为最小可检测信号MDS,两者之差即为SFDR。用数学表达式可表达为:

SFDR=Ρin,max-ΜDS(7)

假设系统输入三阶截入点为IIP3,则可根据SFDR定义计算得到其进一步的表达式[1,2,3]为:

SFDR=2(ΙΙΡ3-ΜDS)3(8)

2 动态范围对接收机的影响与分析

由式(5)及式(6)可得,多信号输入时,接收机的输出端会产生非常丰富的高阶组合分量,若产生的这些新信号在噪声电平以下,可以不予考虑。但随着输入信号的增大,这些非线性产物也随之增大,若其落入接收机的带内,则构成虚假信号。图1展示了三阶互调落入带内造成虚假响应的过程。

一般情况下,RF预选器并不能很好地解决互调造成的虚假响应问题。三阶互调失真具有自身独有的特性,当两个强干扰信号同时落在接收机通带内时,由于非线性的作用,就会产生三阶互调量,其中一个或两个同时都可能落在通带内。减小RF预选器带通滤波器组的带宽可以降低三阶互调对接收机的影响,然而要实现相对带宽很窄的RF滤波器是非常困难的,因此在当今高信号密度的环境背景中,两个不希望的强干扰信号同时落在RF预选器通带内,并且在接收机调谐频带中产生不希望的杂散响应的可能性非常大。三阶互调失真并不局限于接收机射频前端,以上讨论的带内三阶互调干扰特性同样适用于接收机的中频级。当两个强干扰信号的频率间隔小于第一级中频带宽时,互调失真就可能在中频级产生。因此,为了使互调失真的影响最小,就必须在整个接收机RF-IF链的设计,电路结构的选用与确定,器件的选择等方面作仔细慎重的考虑,并且作合理的优化[4]。

由式(8)可以看出,SFDR直接正比于三阶截断点IP3,反比于接收机的最小可检测电平。三阶截断点越高(值越大),噪声基底越低,则带内强信号互调产生的杂散响应对系统的影响越小。然而,高三阶截断点与低噪声基底是一对矛盾,因此在对接收机线性度和噪声基底均有要求时,接收机设计必须在这两个指标间做折衷考虑。

3 扩展动态范围的方法

要实现接收机的大动态范围,第一种方法是合理分配增益。放大器有三个重要的参数,即增益、噪声系数和三阶互调截交点,这三个参数将影响接收机的性能。一般都希望设计一个具有尽可能最低的噪声系数和尽可能最高的三阶互调截交点的放大器链。放大器链的增益是由设计的系统确定的,依赖于放大器链末端所使用的ADC特性。设计放大器链所用的射频放大器可简单地分为两类。一类具有较低的噪声系数;另一类具有较高的功率。低噪声放大器通常有一个低的三阶互调截交点,高功率放大器通常有一个高的噪声系数。在级联系统中,低噪声放大器应设置在链路的开头,高功率放大器则应设置在链路的末尾。噪声是由第一个放大器发挥主导作用的,三阶互调截交点则是最后一个放大器发挥主导作用的。在接收机选择性好的前提下,整个系统的带外三阶截点主要由第一级来决定,因此要尽量提高接收机前级,尤其是第一级的选择性,而带内三阶截点则不受接收机选择性的影响,并且越往后级,对整个系统三阶截点的影响越大,因而要改善接收机的带内三阶截点,必须提高后级各模块的三阶截点。在各模块三阶截点及选择性一定的情况下,还可以通过适当安排各级的增益来提高接收系统的三阶截点[5,6]。

其次,自动增益控制系统AGC也能扩展接收机的动态范围。AGC系统能够有效地防止接收机饱和或过载,保证接收机具有足够的输入动态范围。但AGC适用于单个目标信号处理,不适用于多目标信号处理。在对具有高度随机性和时间很短的脉冲信号时,AGC环路的使用受到一定的限制。传统AGC方法只能适用于窄带信号处理,对宽带信号无能为力,而且反应时间长,与提高系统的反应速度相矛盾[7]。

IF限幅器先对输入信号宽频带放大,通过设定一个门限值对信号电平进行限制,再用窄频带放大,使输出信号电平在ADC的动态范围之内。使用IF限幅器的接收机,对噪声调频干扰有较好的抗干扰能力。带通IF限幅器在频率范围内灵敏度不受大幅度杂波的影响,但当存在大功率信号时,限幅器将导致输出信号产生非线性谐波。IF限幅器适用于处理以频率为重要信息的信号,不适合用于需要幅度参数的接收系统中。对数放大器是一个输入、输出信号幅度成对数函数关系的瞬时压缩动态范围装置,通过对输入信号幅度进行对数压缩来扩展接收机的动态范围。对数放大器有三个特点:第一,输入、输出信号幅度成对数关系,在对数精度范围内呈一一对应关系;第二,实现输入信号动态压缩,把大动态范围的输入信号压缩为小动态范围的输出信号,呈现增益自动控制特性,具有抗过载能力;第三,对信号进行瞬时处理。通常在对数放大器中可以得到大于100 dB的瞬时输入动态范围,相应的输出动态范围则与线性放大器的相同(20~30 dB)。在对数放大器后加上微分电路,还可以抑制杂波干扰。对数放大器在通信、雷达、电子对抗等领域得到了广泛的应用。但对数放大器的输出信号产生严重畸变,后端信号处理难度加大。在要求高精度PD的接收系统中不适用[4]。

4 结 语

对于接收机而言,大动态设计是非常重要的。在实际的信号环境下,进入接收机频带的信号频谱很多,除了有用信号外,还有杂波和干扰信号频率。所以,在设计接收机时,为了使有用信号都被接收,必须使接收机的动态范围足够大。作为高线性大动态范围的接收机,不仅要能够检测并放大所期望的有用信号,更重要的是,就高线性、大动态范围而言,接收机对信道中大信号的非线形互调产生的虚假响应要具有高度的抑制能力[8,9]。

参考文献

[1]Ulrich L,Rohde,Jerry C,Whitaker.通信接收机:DSP、软件无线电和设计[M].3版.王文桂,肖晓劲,译.北京:人民邮电出版社,2003.

[2]朱庆厚.通信侦察接收机的动态范围——概念、分析、讨论、测试与计算[J].无线电工程,1996,26(3):5-20.

[3]陈邦媛.射频通信电路[M].北京:科学出版社,2002.

[4]袁舜轶.大动态高灵敏度数字接收技术研究[D]成都:电子科技大学,2004.

[5]冯康年,张炳荣.接收机动态范围的扩展[J].电子对抗技术,1996(1):124-127.

[6]王吉滨,孟宪德,袁业术.提高接收系统线性度的研究[J].哈尔滨工业大学学报,2002,34(4):566-569.

[7]储飞黄,杨景曙,黄崧.一种提高数字宽带接收机动态范围的误差补偿方法[J].电路与系统学报,2003,8(3):125-127.

[8]Joseph J Carr.RF Circuit Design[M].3版.北京:电子工业出版社,2001.

[9]Tsui J B Y,Stephens J P.Sr.Digital Microwave ReceiverTechnology[J].IEEE Trans.on Microwave Theory andTechniques,2002,50(3):699-705.

[10]James Tsui.宽带数字接收机[M].2版.北京:电子工业出版社,2002.

通过环路内增益控制延展动态范围 篇2

今天,模数转换器(ADC)已很难满足在更大程度上满足现代通信系统所要求的动态范围。延展系统动态范围的方法之一,是在数控AGC环路内使用数字控制可变增益放大器(DVGA)和高速高分辨率的ADC。

采用高性能元件来进行系统设计已成为大趋向。不同的元件需要在不同的操作环境下才能发挥出最佳性能。放大器和数据转换器具有不同的输入和输出要求,而且通常都需要不同的电源。元件在电路上如何布局以及如何根据其它元件来对自身定位等都是很关键的问题。

这篇文章将会详细介绍数控可变增益放大器(DVGA)和高速子采样ADC在典型中频(IF)无线电基站中的应用。

将放大器的增益设定信息进行编程,然后与经数据转换器测量的电压值相结合,从而可以得出终值(增益 + 实测电压 = 实际电压)。由于可以将增益下调,所以通常用来固定ADC输入的信号亦可被衰减和量度。DVGA经由数字电路进行实时控制,增益可因根据进入信号的调制而改变。对于GSM EDGE/EGRPS等拥有远超均值的峰值调制机制而言,这个功能尤其重要。

图1:ADC14155和LMH6515。ADC时钟频率 = 150MHz、信号频率 = 180MHz。信号 = -1dBFS、本底噪音= -66 + -1 = -67dBFS

要获得最佳动态范围内,最小预期信号也必须采用最大的增益设定,并且信号脉冲绝不能拑固ADC。因此,很重要的一步就是对AGC环路进行调谐,从而把信号大大减降低至ADC全标度以下。此外,最好还有一个AGC环路控制,它可在信号脉冲时迅速地调度增益。另外,旁边通道和障碍通道的干扰必需纳入动态范围的计算内,所需信号的结合电平以及任何干扰信号必须保持在产生ADC输入拑固的水平以下。

如图1所示,信噪比(SNR)和无寄生动态范围(SFDR)是在接近信号全标度的情况下得出。在图2中,放大器/ADC的设定是一样的,但信号幅值较低。假如信号波幅下降16dB,那么SNR下降12dB,同时SFDR提高5dB。这表示输入波幅的范围可以提供好的信号保真,而且自动增益控制(AGC) 可尽可能将输入信号维持在这个范围内。对多数ADC来说,优化操作的最佳范围为-6 dBFS~ -18 dBFS。

要从DVGA获取最大的收益,必须在设计早期时考虑几个条件。正确的电源电压和电路板布局对于系统性能的表现有很大的影响。当设计系统电路板时,DVGA和ADC的位置必须尽量贴近,两者之间留下的空隙足够放置一个小噪声滤波器即可。

图2:ADC14155和LMH6515。ADC时钟频率 = 150MHz、信号频率 = 180MHz。信号 = -17dBFS、本底噪音 = -53 + -18 = -71dBFS。

由于DVGA会在整个放大器的频宽上产生输出噪声,故在DVGA和ADC之间放置滤波器是不可或缺。ADC的前端应拥有京赫级以上的频宽。采用带通滤波器可大大改善系统的本底噪音。在选择滤波器方面,无需使用精密的类型,相反简单的滤波器可减少对AGC环路定时的调校。当然,产生自滤波器的过多时延是大家不想看见的,再者滤波器的损耗亦会直接影响系统的增益。这样,滤波器的频宽可以比信号的频宽大很多,同时仍可削减大部份的频带噪声。一个频带过窄的滤波器会因为带通平整度的影响以及过量的集体时延而将信号降格。

图3显示出相对大频宽滤波器的优点。这个放大器拥有2.0nV/rtHz的输入噪声、26dB的增益和500MHz的频宽。放置在放大器之后的是一个14位的ADC,其采样率为150MHz兼有1.1GHz的前端全度频宽。假如在放大器和ADC间不设滤波器,那噪声值便为:

放大器输出噪声 = 1.8 nV/rtHz X 20 V/VX SQRT(600 MHz) = 881 uV

ADC 本底噪音: 71.3dBFS @1V 全标度 = 272 μV

在这情况下,由放大器所引致的噪声会比ADC大很多。 一个WCDMA接收器的每条通道具有5MHz的信号频宽。为了在5MHz下达到一个常效率,需要使用一个25MHz的滤波器。此外,为了获得一个良好的滤波器拒波,我们会选用一个185MHz的中频(我们ADC的第三条Nyquist频带)。加入滤波器后便得出以下结果:

放大器输出噪声 = 1.8 μV/rtHz X 20 V/VX SQRT(30 MHz) = 197 μV

ADC 本底噪音: 71.3dBFS @1V 全标度 = 272 μV

配合加入滤波器,放大器的噪声现在比起ADC本底噪音低很多。设计滤波器时,尽量模仿ADC的输入电容、放大器输出电容和板寄生电容。此外,放大器输出引脚和ADC输入引脚会有大约1nH的接线电感。模仿时需小心谨慎,一旦电路建立起来后便需很小心地量度滤波器的响应,并需要将滤波器调谐调整至中央频率。无疑,频率越高对准确模拟滤波器的难度就越大。此外,较小的元件的容错性更好。

一旦选定了IF频率和滤波器的频带,那便必须选定滤波器的阻抗。滤波器阻抗的重要性几乎与滤波器的频带和插入损耗一样重要。要选出最佳的滤波器阻抗,需要在ADC和放大器的要求之间进行平衡。图3中,滤波器被设计成在通带中拥有200Ω的阻抗,并以400Ω作端接以减低损耗。假如以200Ω作端接,那它便可拥有较平整的频率响应。滤波器的实测响应已在图4中表示出来。如果滤波器接入端为200 Ω,便可拥有更平滑的频率响应曲线。由此可见,系统设计时取舍的必要性。

图3: 180MHz中频采样应用中的放大器、ADC和噪声滤波器Gain1-5:增益1-5Latch: 锁存*数据在时钟下降边沿处被采样,所以使用时钟高电容

噪声滤波器被设计成在放大器一方,并通带外拥有高阻抗。将放大器的输出电流尽量降低,有助于维持低水平失真。滤波器也 被设计在数据转换器一方,并在停止频带具有低阻抗特性。当ADC对输入信号采样时,这样的设计有助于减低由电容器开关产生的电流尖峰。

在决定如何驱动之前,阅读特定数据转换器的数据表是非常重要的。问题在于是否对ADC输入进行阻抗匹配。有些低阻抗缓冲输入的数据转换器需要在输入处进行阻抗匹配。相反地,大部份带有高阻抗输入的数据转换器则不应进行匹配。上述提及过的14位数据转换器属于典型的高分辨率高速转换器,它拥有一个高电容性的输入(9 pF时钟低及6 pF时钟高)。这类数据转换器最好是由一个低阻抗电源来驱动。

数据转换器是一种离散式定时器件,在某时间点下,ADC将会替信号采样,然后在处理该样本时忽略其他信号。ADC14155的产品说明资料已表明信号会在时钟的下降边沿被采样,当时钟在高和低时,ADC14155的输入电容分别为6 pF和 9 pF。从这些资料可知道滤波器应该围绕着6pF的时钟高电容来设计。同一时间中,ADC正准备替模拟输入采样。一旦时钟下降至低状态,样本就会被提取。第二个样本被采集前,我们无需关注输入电容。

图4:滤波器的实测频率响应Normalized Gain: 正常化增益

放大器低阻抗输出的优点是可为系统设计带来很高的灵活性。一般的通用放大器可提供一个很低的输出电阻(<1 Ω),而射频放大器则可提供50Ω~400Ω的阻抗。为了尽量增强放大器的性能,外部负载(反映在滤波器的特性阻抗内)应尽量高。如前所述,ADC的驱动需要低阻抗的电源。 实验室的多项试验表明,为图3的电路提供最佳性能的是400Ω的滤波器。放大器和ADC的不同组合可从略有区别的滤波器阻抗中获益。

电源(为何放大器和ADC需要不同的

电压)

放大器和ADC的一个主要差异是放大器本身需要重生一个信号,并送到一个需要电压和电流(亦可说成是电源)的负载内。数据转换器的唯一目的是量度电压,以及产生一个与该电压成比例的数字信号。这种基本的差异引伸出不同的电源要求。在大部份的应用中,放大器比数据转换器需要的电源电压范围更大,从而在最高信号电压处,容许放大器有足够的净空释放功率。此外,尤其对于DC耦合信号链,一个负电源电压可大大改善性能表现。

在电路板上设有最佳的电源电压可以说是成功设计的关键。要尽量减低电源噪声,应该使用功率板或很宽及低电感的布线。对于数据转换器和放大器而言,它们均要求低信噪比(SNR)和低电感的旁路电容器。为了达至最佳的信号完整性,经由旁路电容器带载的电流不应行经信号布线附近。此外,附近有信号端电阻器连接接地时,而电源旁路电容器不应连接到接地面。

为了在极高频下提供无失真性能,我们在使用诸如LMH6515或LMH6555的放大器时,会选用开放集极(共用发射极)A级操作。尤其该单一电源已给出对大信号的要求时,这种放大器拓扑可从严谨的电源容差中受惠。幸运的是,现在可以获得具有绝佳稳压准确度的电源。线性稳压器不单可提供最低的噪声,而且还可提供最好的稳压准确性。一个如LP2989的稳压器其标准准确度可达1.25%,而在整个操作温度及负载下的准确度为-4~+2.5%。由于LMH6515 DVGA的静态电源电流会比释放至负载的电流更大,所以由DVGA提取的电流很大程度上会被固定。这就是电源稳压的最佳情况,因此对电源的准确性更高。

高动态范围电视系统技术漫谈 篇3

然而近几年人们对超高清电视的普遍认识在高分辨率、高帧率基础之上又增加了另外的三个维度, 即宽色域、高量化比特位以及高动态范围 (见图1) 。高动态范围在照相机功能上早已走进我们的视野, 但是在电视转播中尚处于起步阶段 (见图2) 。

高动态范围 (High-Dynamic Range, HDR) 是相对于标准动态范围 (Standard-Dynamic Range, SDR) 而言的。是针对图像的亮度明暗范围而言, 由于亮度和色彩相关, 因此高动态范围常常与宽色域被一并提及。亮度单位为尼特nit (cd/m2) 。自然界中景物的亮度范围可以从10-6到109, 即达到1015:1, 但人眼在无瞳孔调节时的可视范围只有105:1。对于105的信息量的内容使用线性进行记录时需要16bit地信息位, 因此摄像机输出的16bit的raw文件就可以完整地保存采集信号的亮度信息。而传输域 (包括基带和编码传送) 多为8bit, 因此必须要进行线性到非线性的转换。在高清SDR时代, 调色软件使用伽马曲线进行线性到非线性的OETF转换, 实现使用8bit来传输最高100nits的内容, 图3是BT.1886对HDTV电光转移曲线的定义。

另一方面, 对于显示终端, 液晶显示器LCD和OLED的动态范围都有了比较大的提升。随着背光光源能力的提升, 目前市面上的LCD绝大多数已能达到300nits。同时, 通过动态背光技术 (Local dimming) 得以动态地关闭局部区域发光光源, 即实现了“亮部更亮、暗部更暗”, 解决了LED背光的LCD被动发光无法“绝对黑”的难题。现有的高端LCD的最高亮度可以达到2000nits, 动态范围达到105:1。相比LCD, 由于OLED是主动发光, 可以做到“绝对黑”, 为了达到以上动态范围不需要特别高的最大亮度。目前市场上高端的OLED最高亮度已经可以达到500nits以上, 最低0.0001nits, 动态范围达到106:1。但是过低的亮度值人眼是感受不到明显差别的, 因此对OLED不能因为亮度下限的一再扩展就认定其可以提供更大的动态范围了, 仍要对其亮度上限给予要求。

综上, 我们看到在摄像机采集时已经可以生成比105:1亮度范围更广的图像, 显示终端的亮度范围也有了更大范围的提升, 因此瓶颈就停在了8bit的传输环节中。通过电光转移曲线处理后, 绝大多数的亮度信息得以保存, 但是由于非线性转换的存在和信息量的丢失, 在显示端进行电光还原后, 虽然显示终端可以进行一定的扩展修补, 但对已经缺失掉的信息仍无法有效还原。这就造成了原有的HDR图像恢复显示时没有足够的灰度等级、缺少细节信息, 更甚者会产生色彩的偏差 (见图4) 。

一电光转移特性曲线

为了避免这种现象, 业界针对HDR内容提出了新的电光特性转移曲线, 目前已经被标准化了的 (参加ITU-R BT.2100) 包括Perceptual Quantization (PQ曲线, 见图5) 和Hybrid Log-Gamma (HLG曲线, 见图6) 。PQ曲线由Dolby公司提出, 在SPMTE 2084里也有所定义。HLG曲线由BBC和NHK联合提出。两条曲线有所差别:

第一, PQ曲线定义的是绝对亮度, HLG曲线定义的是相对亮度。根据SMPTE ST 2084定义, PQ曲线支持的最大亮点范围为10, 000nits。

第二, 两条曲线对OOTF的处理不同。PQ曲线定义的是EOTF, 其OOTF处理在摄像机采集环节进行, OETF=OOTF*EOTF-1 (见图7) 。HLG曲线定义的是OETF, 其OOTF处理在终端显示环节进行, EOTF=OETF-1*OOTF (见图8) 。

二传输系统

上述两条电光转移特性曲线较好地保留了亮度范围的细节信息。在业界提出新的电光转移特性曲线的同时, 传输系统和传输编码也在随之发展。适配于超高清视频编码的HEVC标准以及国标的AVS2标准也随之发布。较H.264/MPEG-4 AVC而言, 传输位由8bit提升到10bit, 这就给HDR内容的传输提供了更多的信息位。

三HDR前/后处理方案

1. PQ曲线的HDR内容传输

对于HDR的处理业内最早由端到端部署方案的是Dolby公司提出的Dolby Vision方案。早期的Dolby Vision方案主要立足8bit的传输系统, 同时该方案有一个鲜明的观点即唯有使用12bit以上的信息量对亮度进行描述, 才能避免出现“条带效应”。因此早期的方案是一个两层的方案:一个基本层+增强层;基本层用于传输SDR内容, 增强层用于传输HDR的额外内容;每层都可以使用8bit的视频编码系统进行传输 (见图10) 。

随着HEVC 10bit的应用, MPEG组织也分三个阶段提出了HDR的解决方案。

方案一:基于HEVC标准, 增加新的编码工具集, 形成HDR Profile。

方案二:基于HEVC标准, 不增加新的工具, 靠优化编码里面的前处理后处理环节实现对HDR的支持。

上述两个方案有一个共同的问题, 即只能传递HDR内容并只能支持在HDR终端上的显示。类似的方案就是HDR10, 这是一个用HEVC 10bit传输PQ曲线的方案, 该方案基于上述方案二, 较好地解决了PQ曲线的HDR内容的传输和显示, 但不兼容SDR终端的显示需求。

方案三:类似于Dolby Vision的方案, 传输SDR或HDR以及必要的Metadata, 在终端通过tone mapping恢复生成HDR或SDR。事实上, 现有业界的很多方案都基于此思路, 包括Philips和Technicolor的方案以及Dolby公司后续提出的单层方案。这种方案的优点在于同时兼顾了HDR终端显示和SDR终端显示。MPEG的方案三有图12所示四种变形方案, 但基本思路一致。

MPEG的方案更多地立足于PQ曲线, 在传输层倡导使用10bit的HEVC编码, 这与超高清的整体技术过渡一致。整体技术路线上, 包括只解决HDR终端显示的HDR 10方案以及兼顾HDR和SDR显示的Dolby方案、P&T方案等。

2. HLG曲线的HDR内容传输

除此之外, 另一条曲线HLG的传输解决方案较上述方案相比比较简单, 主要是利用了HLG曲线在100nits范围内与BT.709曲线高度重合的特点, 具备了在SDR终端上可以兼容显示的能力。事实上, 由于HLG曲线不是一条绝对亮度值曲线, 通过在显示终端的OOTF亮度拉伸处理, 具备了容纳更大亮度范围的能力。HLG方案不用传递元数据, 与既有的10bit传输系统兼容, 处理比较简单。HLG方案是BBC和NHK联合推出的, 在HDR推广的早期很好地解决了兼容性显示的问题。但是业界也有测试结果表明, 这种不通过元数据的曲线原生态处理, 在某些图像中会产生明显的色偏现象。HLG方案如图13。

四关于兼容性的考虑

业界对兼容性的考虑经过了几个发展阶段, 包括从最初的对8bit传输系统的兼容, 对既有的解码模块 (含机顶盒、智能电视机等) 的兼容, 以及对SDR电视机的兼容等。目前比较普遍的认识是不再考虑对H.2648bit传输系统的兼容, 而是面向HEVC10bit传输系统 (在我国, 需要考虑AVS210bit传输系统) 。同时全面考虑对HDR电视机和SDR电视机的兼容显示要求。

因此BBC和NHK首先提出的HLG方案, 通过曲线自身特点, 消除兼容性障碍, 但是仍对显示终端有所要求 (OOTF的处理) 。从目前应用来看并不能做到技术上的“完美”且存在局限性, 但是有部署简单、成本低的优势。

另一方面, 以Dolby、Philips和Technicolor等为代表的一派, 则全力倡导带Metadata的兼容解决方案。即在前处理环节获得元数据, 通过传递SDR或HDR, 在后处理环节结合元数据恢复HDR或SDR。这样一种方案基于既有的传输编码算法, 不增加新的编码工具或新的编码类, 只需要将相应的元数据写入扩展数据域, 视频编解码器能够将其透明传输即可, 对既有的编解码设备改动较小。而所增加的元数据内容通常不超过100Kbps, 对既有传输系统影响不大。通过后处理环节可同时解决SDR和HDR的兼容显示问题。

由于这一类方案既可以传输SDR恢复生成HDR, 也可以传输HDR恢复生成SDR, 具体使用哪一种方案可以通过市场上的电视机及解码终端存量情况统筹考虑。如果SDR电视机存量大、既有解码模块尚不能支持HDR的后处理, 可以选择以传输SDR为主, 通过Metadata恢复生成HDR的方案 (见图14) 。反之如果市场上SDR电视机存量有限 (事实上, 市场上的LCD电视机已能普遍支持300nits的最高亮度范围) , 或者解码模块尚未大面积部署, 则可以考虑直接传送高质量的HDR内容, 通过Metadata恢复生成SDR的方案 (见图15) 。

五关于元数据

以上在方案说明时提到, 除HLG方案、HDR 10方案以外, 其他的兼容性方案都需要传递元数据。HDR元数据分为静态元数据、动态元数据。

静态元数据可以理解为:一组静态不变的HDR元数据, 不随节目场景内容而变化。静态元数据是在制作域调色时产生, 是对主显示单元的 (即所制作内容) 整体情况的描述。静态元数据在SMPTE 2086中进行了定义, 包括Display Primaries、Chromaticity of White Point、Maximum Display Mastering Luminance、Minimum Display Mastering Luminance。这部分数据主要用来指导显示终端根据自身的亮度范围适配调整和显示所传递的HDR内容。

动态元数据可以理解为:一组动态变化的HDR元数据, 随节目场景内容而产生变化。动态元数据主要是用来配合所传输的SDR或HDR内容而恢复生成HDR或SDR内容。因此各家方案中动态元数据的定义不尽相同。SMPTE 2094给出了一部分可参考的动态元数据项。

六小结

动态范围 篇4

在连续语音识别中为了减少上述不匹配的问题, 有三种主要解决技术。一是多条件或者多类型的训练方法, 也就是使用带噪数据来进行训练。虽然这个方法能够在特定的噪音环境下可以得到较好的识别精度, 但是如果噪音环境发生变化识别精度还会急剧的降低。换言之, 如果待识别数据与模型数据的条件 (环境) 不同, 如:信噪比或者噪声类型, 在待识别数据和模型之间仍会存在不匹配的现象。二是采用自适应模型方法, 通过自适应模型来减少不匹配的问题。这种训练模型方法同时使用纯净和噪音数据来进行训练, 这又会导致模型的区分度不高, 同样会是识别精度下降。三是采用特征归一化方法, 这种方法虽然不能从根本上改变待识别特征与模型之间的不匹配, 但是在一定程度上会保留模型的区分度并减少由于环境变化导致带噪语音失真的影响。本文主要研究第三种方法。

语音增强和特征补偿方法以恢复语音特征为目的, 但是特征归一化方法只是对语音特征的某些统计信息进行改变, 并期望由此减少噪声引起的失真。不论是语音补偿还是特征补偿, 都需要改变语音的特征向量, 而传统的归一化方法只是对语音特征统计信息的范围进行处理, 提出的算法在保证原有语音统计信息的前提下, 适当改变部分语音特征向量。从而减少由噪音引起的语音特征曲线的失真。

动态范围调整方法属于归一化方法的一种, 能够对干净和带噪语音的特征统计信息处理到相对较小的一个范围内。归一化方法能够根据一些模板值减少噪音特征在统计信息上的影响。相比使用归一化方法之前, 在干净语音特征和带噪语音特征之间的不匹配部分会显著减少。语音增强一般应用在时域和频域中恢复语音特征的质量。特征补偿方法通常应用在加强连续语音系数在对数滤波阶数和频谱域使用。

减少待识别语音特征和模型的不匹配的方法虽然不是提高语音识别鲁棒性的唯一方法, 但却是一种很有效的方法。通过这种方法可以减少待识别特征和模型之间的不匹配使得识别性能得以提高。

1 噪音对孤立词语音数据的影响

加法性噪音和乘法性噪音是影响语音信号最普通的两种噪音类型。例如:加法性噪音包含背景噪音, 交通噪音, 等等。乘法性噪音主要是传输过程中产生的信道失真。例如麦克风自身的噪音, 房间的反射噪音等等。干净的语音信号首先被信道失真所干扰, 进一步被加法性噪音干扰。

包含噪音的频谱可以用如下公式描述:

噪音干扰在增益部分和直流分量部分的影响是不同的, 如图1所示:在孤立词识别中, 很多实验表明使用DRA方法对加法性噪音和乘法性噪音都具有很好的性能。

图2展示了噪音影响在孤立词中的性能。在图2中, 有两条不同的特征曲线, 曲线表示了干净语音和10db信噪比的噪音特征在第二项MFCC中。者两条曲线来源于同一个语音数据。

然而, 由于噪音严重的影响, 噪音下的MFCC特征曲线的动态范围要小于干净语音的MFCC特征曲线的动态范围。如果使用干净语音特征建立HMM训练模型, 能够获得理想的模型并在同等条件下获得更高的识别率。但是对噪音下的语音识别, 由于上述的原因, 自动语音识别系统无法在任何噪音下获得正确的识别结果。虽然DRA归一化方法能够在孤立词识别中获得较好的识别结果, 但直接用于连续语音识别并不是特别的理想。

图2展示了在孤立词中不匹配的峰值。DRA归一化方法算法使用最大值的方法将频谱系数范围标准化到一个统一的范围。在每个维度, DRA方法将干净或者带噪语音频谱系数的动态范围调整到同一个标准范围中。但在孤立词识别中, 特征曲线中的峰值是有限的。归一化方法非常适用于孤立词识别。而连续语音识别特征曲线的峰值要远多于孤立词识别, 归一化方法并不直接适用。

2 噪音对连续语音数据的影响

对连续语音特征曲线来说, 不匹配的峰值随着语音特征曲线的增长而增加, 语音特征曲线的动态范围随着噪音的增加而减少。因此简单的归一化算法不能有效适用连续语音识别。

我们的目标是缩小待识别噪音特征曲线与干净的语音特征曲线之间的差异。经过噪音鲁棒性方法和DRA方法, 语音信号中的直流分量的不同得以减少, 特征曲线中不匹配的峰值也得以减少。

基于前面提到的孤立词识别的归一化方法, 我们可以假设噪音没有改变原有的特征曲线的统计顺序, 也就是在语音特征曲线上会存在很多峰值, 如第一高峰值, 第二高峰值, 等等。在连续语音特征中, 全局的统计信息的匹配就在整个训练数据集中显得比较重要。一般来说, 这些特征曲线上的峰值信息代表了元音的语音特征。随着训练量的增加, 这些峰值信息一般会集中到相对稳定的区域。但实际上, 噪音通常会改变特征曲线的统计顺序。如果能恢复部分特征曲线上统计信息的顺序, 就能增加这些峰值的匹配几率。

虽然通过上述的图示可以看出通过归一化方法可以增加干净语音特征曲线和带噪语音特征曲线的拟合程度, 连续语音特征曲线中存在较多的峰值, 带噪语音特征曲线会改变一些峰值的统计信息, 因此把归一化方法简单的使用到连续语音识别中无法达到如图的拟合程度。提出的算法可以尽最大可能恢复带噪语音的峰值统计信息。

使用DRA归一化能提高特征曲线的峰值匹配概率。孤立词特征曲线通常不含静音部分, 但在连续语音中, 语音之间存在由于思考或者换气产生的静音, 在此部分仍然使用归一化方法在过渡位置会放大只有噪音的信号特征。这就导致了连续语音特征在此部分无法匹配。

根据上面的讨论, 可以通过下面两步对特征曲线进行处理。

第一步:从连续语音数据中提取所有的短句子。

估计无音部分。连续语音包含许多无音部分和只有噪音的部分, 因为这些部分不适合使用DRA。在下一步中消除连续语音特征曲线中各个动态范围的不平衡性。

第二步:把选取出来的短句子分成更小的片段, 在每个片段中使用归一化方法。

如果片段的长度接近短句长度, 导致识别结果与传统DRA方法接近, 如果片段的长度特别小, 则导致识别精度急剧下降。根据实验得到经验数据当片段长度为80帧时, 识别精度最高。不同片段长度得到的识别结果如下图:

3 小结

在训练过程中使用大量的数据可以使使各个音素的模型逐渐集中在某一个范围围。对于测试数据来说, 音素的范围很有可可能与模型不在同一个范围内, 待识别音素素是有限的, 不可知的。

使用噪音鲁棒性方法和DRA在建立区区分度较高模型方法, 这些鲁棒性方法在发发音较短的孤立词识别中展现了良好的识识别性能, 并说明了这些方法无法直接在连连续语音识别中的原因。

虽然在带噪语音特征曲线和干净语音音特征曲线仍然有不匹配的峰值, 需要指出出的是, 对比使用传统的DRA算法, 减少了了不匹配的峰值。由此可以看出, 使用提出出的算法调整带噪语音特征曲线可以增加加峰值部分的匹配几率。使用该算法在干净净和噪音环境下可以提高整体的识别性能能。特别指出的是, 提出的算法大幅提高了了在噪音环境下的连续语音识别性能, 根本本原因就是相对于传统的DRA, 选择了更合合适的调整值, 适当的放大了峰值。该算法法在语音频谱系数的对数系数特征里也适适用。

参考文献

[1]张雄伟等编著.现代语音处理技术及应用[M].机械工业出版社, 2003.

[2]王欣, 罗代升, 王正勇.基于改进谱减算法的语音增强研究[J].成都信息工程学院学报.2007 (02) .

动态范围 篇5

在航天侦查以及观测深空星体、太阳活动、运载火箭的发射等领域,由于真实场景所展现的亮度范围超出了成像系统本身所能显示的动态范围,因此会造成图像传感器的大面积饱和,形成日晕、blooming等现象,使成像设备失灵,不能准确获取指定目标的图像数据。普通光电成像设备(CCD或CMOS图像传感器)的动态范围一般仅能达到50~60 d B,即使在科学研究领域所使用的图像传感器的动态范围在常温条件下也只有70 d B左右,往往满足不了高动态范围成像的要求[1]。

目前适应高动态范围场景观测的主要手段有:1) 采用双图像传感器成像方法[1,2],其中一个积分时间长,另一个积分时间短,获得同一时刻开始积分的两幅亮暗图像,最终经过图像融合处理的方法实现提升适应高动态范围场景观测的能力;2) 通过改变CMOS图像传感器的读出结构,将图像传感器信号输出幅度与接收的光电子数由线性关系变为对数关系,提高适应高动态范围场景观测的能力[3,4]。但此项工艺不适合深空探测所采用的CCD图像传感器;3) 通过增大图像传感器的像元尺寸,提高图像传感器每个像元积累光电子的能力来提高成像动态范围[5];4) 对于高帧频的图像传感器,可以通过设定多帧不同积分时间,进行连续快速的成像,再通过多帧不同感光程度的图像进行合成,得到一幅亮暗目标融合的合成图像,达到提高动态范围的目的[6,7]。

上述手段和方法一般能够使得成像设备的成像动态范围提升到70~80 d B,然而很多技术手段不能同一时刻获得的图像,主要采用事后图像处理的办法,因此这些技术手段仍然不能满足高动态目标实时成像观察测量的要求。

本文基于数字微镜器件,提出了一种提高光电成像器件可探测动态范围的方法,根据这一方法设计了一种能够对高动态目标进行自动区域调光的望远系统。

1 系统原理

1.1 DMD 的工作原理

DMD由美国Texas(TI)公司开发,采用微电子机械原理,是一种用二进制数字信号控制的数字光调制器,由上百万片的微米级反射镜片组成,利用静电使微反射镜转动,其具体结构如图1。

DMD底层是衬底,衬底表面刻有CMOS半导体存储器件,CMOS上面是带有铰链可偏转摆动的反射镜片支架,微反射镜片固定在支架上。微反射镜片利用铝溅射工艺制成正方形。每个微镜面的尺寸约10.8μm×10.8μm或更小,微镜面之间的间隔约1μm,每个微镜面代表一个像素,每个微镜面都可以沿着它的对角轴线做±12°翻转,翻转频率可达数千赫兹[8,9,10,11,12]。微反射镜的工作原理如图2所示。

当偏转+12°时,微反射镜处于开状态,将光线反射至目标光学系统;当偏转-12°时,微反射镜处于关状态,将光线反射出光学系统,使其不能到达目标光学系统。利用每一个微反射镜片下的存储单元以二进制信号进行寻址,控制每个像素的开关状态以及开关时间,即可形成不同亮度、对比度和灰度的图像。DMD可通过二进制脉宽调制技术实现全数字方式控制图像的灰度等级。

1.2 系统结构分析

为提高系统的动态范围,提出了一种全新的光学系统,该系统为二次成像系统,采用非远心光学结构,利用处于中间像面位置的DMD作为光强调制器件。整个光学系统原理图如图3所示。

成像物镜将目标景象成像在DMD光调制器上,当DMD上的微反射镜处于开状态时,微反射镜将成像物镜上的光反射到转置镜上,再由转置镜成像到探测器上;当DMD上的微反射镜处于关状态时,入射到DMD上的光线被反射到非成像吸光装置内并被完全吸收。非成像吸光装置由平面反射镜、黑体球组成。

为对高动态目标进行成像,DMD上的微反射镜首先需要全部处于开状态,获取一幅目标景象的图像,然后按照平均灰度和局部动态将图像划分为若干小区域,并设定各区域相应的曝光时间等参数。最后根据已设定的参数逐区控制DMD微反射镜的开关状态及开关时间,同时完成探测器的曝光成像过程,获得具有高动态范围的图像。

为方便光学系统装调并提高DMD调制精度,选择DMD垂直于成像物镜的光轴放置。平行于成像物镜光轴的光线入射到DMD上被DMD反射后出射光方向与DMD法线成24°夹角,即中间像面DMD不再垂直于转折后的光轴。系统采用常规的透射镜头将DMD上的像成像到探测器上,由于物面与光轴出现24°的夹角,相应的探测器与光轴也存在一定的夹角。DMD与探测器间物像关系如图4所示。

2 光学系统设计

2.1 主要技术指标

设计的望远系统主要用于观测高动态范围、强度相差悬殊的目标,如太阳活动等。系统采用DMD作为光强调制器件,使用sC MOS作为图像传感器,DMD上的微反射镜与s CMOS上的像元一一对应,通过控制DMD进行像素级调光,实现高动态目标成像,其主要技术指标如表1所示。

2.2 光学系统结构

设计的基于DMD的高动态范围望远系统是一个较长焦距、小相对孔径、小视场的光学系统,采用透射式光学系统较为简单合理,其光学系统结构如图5所示。

该望远系统主要由成像物镜和转置镜组组成。其中成像物镜由一片胶合透镜、两片单透镜组成,是望远系统的主要部分;转置镜组将DMD上的像成像在探测器CMOS上,其放大倍率为-1,采用双高斯形式设计。由于光线经DMD反射后与光轴成24°夹角,即DMD上的像相对于转折后的光轴为斜物,因此设置探测器CMOS与光轴的夹角为变量进行优化,最终探测器与光轴的夹角为25.93°。为避免转置镜组中的透镜遮挡成像物镜后的光线,需要使成像物镜具有较长的后工作距且转置镜组有较长的前工作距。优化完成后成像物镜的后工作距为142.5 mm,转置镜组的前工作距为78.4 mm。

2.3 像质评价

由于系统需要根据探测器上的像对应调节DMD微镜像元的开关状态及开关时间,因此要求DMD上的像也要有良好的成像质量。图6为DMD像面上的传递函数、场曲和畸变,图7为探测器像面上的传递函数、场曲和畸变。

由图6可以看出,在DMD的Nyquist频率处,全视场范围内子午方向和弧矢方向的系统传递函数接近或大于0.70,场曲小于0.1 mm,畸变接近于0。由此可知,DMD上成像质量良好,能够达到区域调光的要求;由图7可以看出,在探测器CMOS的Nyquist频率处,全视场范围内子午方向和弧矢方向的系统传递函数大于0.55,场曲小于0.1 mm。由于经DMD反射之后为斜物成斜像,因此系统存在一定畸变,但畸变小于2%,对成像质量影响不大。

3 成像系统动态范围估算

一般光电成像器件的动态范围定义为探测最大光能量和最小光能量的比值。本文设计的望远系统的动态范围主要由两个因素决定:1) 图像传感器固有的动态范围;2) DMD器件的调制能力。

设计的望远系统采用高动态科学级CMOS作为图像传感器,其动态范围是23 000:1,约为87 d B。考虑系统帧频很高并且系统噪声会有影响,预计其动态范围不小于20 000:1。

DMD器件的工作方式与控制方式决定了其光强调制的动态范围,理论上DMD器件的摆动频率为3 000Hz,光强调制范围为3 000:1。但DMD需要复位,且在摆动过程中也有部分光线进入图像传感器,因此图像传感器的积分时间不能与DMD的开状态相位完全一致,但是其动态范围至少可达到500:1。

系统总动态范围为(20 000:1)×(500:1)=10 000 000:1,即设计的像素级区域调光的望远系统动态范围至少可达140 d B。

4 结 论

动态范围 篇6

人眼视觉范围指人眼所能感知的亮度范围,从10- 6cd / m2( 注: 1 cd/m2= 1 nt) 到了108cd / m[1,2],范围( 亮度比值) 达到了1014( 即1014∶ 1 ) ,而典型的景物亮度大致在105范围。当人眼适应了某一环境亮度后,其瞬时视觉范围可达到104( 即同一瞳孔开度下可辨别的亮度范围) 。现今的电视显示器对比度范围大致能做到2 000∶ 1,远小于人眼的感知范围。所以,人们从电视上所看到的仅仅是一个屏幕表现,而非真实世界景色的再现。图1 真实世界中,人眼可感知的亮度范围从暗处的2 cd /m2到明亮处的10 000 cd/m2,其亮度分辨率能力远高于目前的任何显示设备。

传统显示器CRT曾长期占据显示屏的统治地位,CRT能提供的最高亮度不超过100 cd / m2。现代的视频显示器,比CRT显示器提供更高的性能。特别是可提供更明亮的图像和更深的黑色。换句话说,现代显示器可提供比CRT显示器更高的动态范围。现今消费级液晶显示器亮度可达到400 cd/m2,高质量产品可达到1 000 cd /m2,某些专门用途的商用产品则可实现4 000~5 000 cd / m2的高亮度。

目前以CRT为基础的光电转换特性标准限制了新型显示器表现真实景物亮度范围的能力,单方面提高显示器件的亮度范围仍无法实现高动态范围景物显示。本文介绍了杜比Vision和英国广播公司BBC提出的HDR( 高动态范围) 显示方案,二者从HDR需求出发,提出了新型的光电转换特性,可实现高达10 000cd / m2的亮度,有效扩展了显示器的动态范围。

2 电视系统的非线性光电变换

电视中的非线性最初来自使不同亮度等级上获得一致的噪声效果的理念。CIE规定了一个亮度的函数,使之尽可能接近人眼对亮度的响应,这函数关系大致是幂指数0. 42。对于线性电视系统,同样的噪声量级,在暗区表现明显而在亮区则很弱。因此,模拟电视系统用非线性变换使主观视觉在不同亮度区看上去噪声处于相同的水平。在摄像机输出端,把信号用幂指数0. 42 加以压缩,而在显示器端把信号扩展,使整个系统的亮度传输基本线性,而视频噪声则在不同亮度区趋于一致。早期电视工程师利用CRT电- 光转换的非线性来实现噪声均匀性要求,CRT的转换幂率为2. 4( 2. 4 大约是0. 42 的倒数) 。

实际操作中,用于摄像机变换的预校正指数平均值为0. 5,由ITU BT. 709 标准化。通过与显示器的2. 4结合,整个系统的伽马值为1. 2,即图2 表示的系统伽马值。这种对前端信号的预校正补偿称为意图再现( rendering intent) ,是人眼在室内较暗环境观看图像较为适宜的变换值,它较好地反映了人眼视觉系统对真实世界景物的客观响应。

视频信号数字化后,量化比特成为图像噪声的主要来源。量化级数直接影响动态范围,而且是图像中亮度差的重要体现,量化比特不足会在图像的平滑区域引入不规则的边界,这种现象被称为“条带”、“轮廓”或量化误差,图3 表示一种极端的轮廓效应。BBC在1974 年的研究表明[3],对于100∶ 1动态范围,8 bit已经使图像足够平滑,几乎看不出“轮廓”。

电视演播室中常用10 bit视频,但实际中,使用BT.709的变换值,对增加动态范围几无贡献,因为多出来的2 bit用于最低有效位,指望提高暗区分辨率,可以降低最小黑电平,但不能增加屏幕的最高亮度。类似的情况,ITU BT.2020中提出的12 bit也不能增加屏幕的最高亮度。

BT. 709 规定从景物亮度到电信号的光- 电转换关系,称为OETF。摄像机制造商希望能支持更高的动态范围,但BT. 709 只提供100∶ 1动态范围而无法实现。目前的摄像机甚至可支持16 bit视频动态范围,达到105量级。为规避BT. 709 限制,摄像机制造商在OETF曲线中加入一个“膝盖”状拐点,来延伸亮度范围,使信号不至于饱和[3],见图4。

采用不同的OETF可增加视频信号的动态范围。BT. 709 规定的伽马曲线设计目的,在于不同亮度下产生均匀的视频噪声,由此设计出近似于人眼视觉的主观亮度曲线。但是,视频信号数字化以后,视频信号量化的目标是避免产生量化的轮廓噪声,而不是提供均匀的感知噪声。所以,量化视频信号时,重点放在展现人类视觉系统的亮度范围感知能力,以及能够区分亮度差的能力。

3 人眼视觉系统特性

量化视频信号希望避免轮廓,即相邻点的量化电平差。研究人眼视觉系统的韦伯定律指出,人眼可察觉的物理亮度差与亮度成正比。也就是说,在可察觉亮度差的边界上,韦伯分数( ΔL/L) 趋于一个常数。研究表明,人眼锥细胞的韦伯分数在2% ~ 3% 之间,表示受试者能可靠地检测出物理亮度在2% 到3% 的变化[4,5]。

韦伯定律表明,对数关系的OETF将提供最大的动态范围,同时再现图像中察觉不到的量化轮廓。韦伯分数为2% 表示可以获得100∶ 1的动态范围。使用233级量化电平,即709 中的8 bit,没有可感知的轮廓。

这也就是说,人眼瞬时的亮度动态范围在104,这并非量化级要达到214= 16 384 才能满足分辨要求。例如亮度从0. 1 cd/m2到1 000 cd /m2,动态范围104,而人眼随亮度增加,在100 cd /m2处分辨率只有1 cd/m2而不是0. 1 cd/m2,亮度越高可分辨的亮度差越大,维持 ΔL/L基本不变,所以并不需要按最小亮度均匀量化。只要按照某种适合人眼视觉特性的变换关系,就可以用1 000 个量化级实现亮度动态范围104,甚至更大,如杜比Vision用12 bit实现107的亮度动态范围。

Barten根据人眼视觉系统规律,并经过大量试验得出复杂的Barten模型,是图像研究领域公认的基础,成为图像显示中人眼最小亮度差分辨率阈值理论依据。ITU BT. 2246 中给出Schreiber和Barten模型曲线,见图5[6]。

BT. 1886 根据CRT的Gamma特性,规定幂指数为2. 4 的电- 光转换特性。图5 中给出3 种12 bit量化的BT. 1886 随亮度范围变化的最小对比度特性,在高亮度区,BT. 1886 量化误差小于人眼对比度阈值,但低亮度区则高于人眼对比度阈值,表明对高动态范围显示的高亮度区,BT. 1886 量化浪费了过多的比特,而低亮度区则比特量化太粗,比特数不足。

4 支持HDR的光电转换特性

为摆脱以CRT为基础的光电转换特性束缚,实现高动态范围( HDR) 显示,现已有杜比、BBC、NHK和Philips向ITU提出4 个HDR标准化建议,其中杜比Vision提出的感知量化( Perceptual Quantizer,PQ ) 成为SMPTE ST2084 标准,可实现10 000 cd / m2屏幕亮度,BBC提出的10 bit HDR建议,支持超过1 000 cd / m2的HDR显示。图6 给出几种光电转换特性的比较,其中BT. 709 只有100 cd / m2亮度范围,DICOM是医学数字成像和通信领域的标准,规定医学图像质量,10 bit可实现5 000 cd/m2以上的高亮度,杜比Vision则有107高动态范围,支持10 000 cd/m2亮度。

4. 1 系统级光电转换特性

电视传播信号链如图7 所示,信号的变换包括摄像端和显示端的非线性特性。摄像机非线性特性称为光- 电转换特性( OETF) ,显示端则称为电- 光转换特性( EOTF) 。常规电视通常把这两者混为一谈而统称为“伽马校正”。整个信号链为适应人眼视觉系统而呈现非线性,是光- 光的系统转换特性( OOTF) 或系统伽马。系统伽马用来补偿人眼在不同观看环境的心理视觉效果,适合的系统伽马值能更好地完成景物真实再现( rendering intent) 。电影业选择系统伽马值为1. 6 ~1. 8,适合黑暗环境下观看,电视在室内较暗环境观看,系统伽马值为1. 2,计算机从业者偏爱系统伽马值为1,因为它适合在室内较亮环境下观看图像。

BBC对系统伽马值进行了主观测试,测试的室内照度10 lx,一台参考显示器显示亮度为600 cd/m2的参考图像,另一台测试显示器显示9 个不同伽马值( 1. 0~2. 4) 的测试图像,测试图像亮度从68 cd /m2到5 200 cd / m2变化,参试者从中选出与参考图像匹配最好的测试图像。测试结果中得出优选的系统伽马值如图8 所示,并得到如下经验公式[8]

图8 表明,HDR系统伽马值随显示器峰值亮度而改变,例如室内常用环境亮度10 lx下,相当于背景亮度10 cd /m2,亮度为1 000 cd/m2显示器系统伽马值优选为1. 4,而数千坎德拉每平方米亮度的显示器,则系统伽马值宜取1. 5。为此,BBC的研究报告建议,厂商根据显示器亮度不同而采用不同的系统伽马值,可获得最佳观看效果。

4. 2 杜比Vision

杜比实验室提出一种用于显示器的电信号到屏幕光输出的非线性变换,即电- 光转换特性EOTF,也称感知量化( Perceptual Quantizer,PQ) ,其商业名称为杜比Vision。杜比PQ根据Barten对比度敏感特性,构造显示端非线性变换EOTF,使量化误差形成小于Barten对比度阈值的PQ曲线。

Barten模型给出对比度敏感函数CSF公式,表示在给定观测条件下,CSF对不同空间频率的图像分辨能力,CSF是可察觉亮度差与亮度的比值[6]

对不同类型的图像,人眼视觉敏感度不同,以不同空间频率的图像( 图像呈现不同距离的光栅) 作为敏感度的测试。图9 中画出不同亮度下的敏感度CSF曲线,找到每个亮度下CSF最大值,也就是指该亮度下人眼对此光栅图像最为敏感,所谓的图像勾边效应,而此时的亮度差作为人眼可察觉的最小亮度差阈值。将这些亮度差阈值连成随亮度变化的一条曲线,即得到Barten最小可觉差( Just Noticeable Difference,JND) 曲线,如图10 表示[7]。

图10 中虚线表示的折线段为Schreiber可觉差阈值曲线,在1 ~ 10 000 cd/m2亮度范围,呈对数关系,而在0. 01 ~ 1 cd/m2范围为1 /2 幂指数关系。另一条虚线表示的弯曲线段即从Barten模型公式中得出的可觉差阈值曲线,该曲线下方即为不同亮度下不可察觉的亮度差值,也就是量化阶梯的取值范围。沿着这条阈值曲线构造的变换特性,便可用最少的量化比特获得最佳量化效果。

杜比实验室按照Barten阈值曲线做出3 条12 bit量化曲线,分别是0. 46JND,100 cd /m2; 0. 68JND,1 000 cd / m2; 0. 9JND,10 000 cd/m2。分别对应不同的量化误差和最大亮度。误差最小的是0. 46JND,位于最下方。

以0. 9JND,10 000 cd /m2曲线为基础,得到杜比PQ。杜比PQ用了不同的函数规律来逼近Barten阈值曲线,低亮度区为平方根关系( 斜率- 1 /2) ,高亮度区是斜率接近0 的对数关系,低亮度和高亮度之间的中间区域,则为变化的斜率,中间区斜率平均值表现为BT. 1886 的变换斜率。杜比PQ提出的EOTF由下式表示[7]

其中:Y是屏幕亮度;V是视频信号值,0≤V≤1;L0=10 000;m=78.843 8;n=0.159 3;c1=0.835 9;c2=18.851 6;c3=18.687 5。

根据杜比PQ曲线,屏幕亮度为

反过来得到视频信号

经过导数运算,写成对比度敏感形式

式中: ΔV是数字量化的最小单位,12 bit时,ΔV =1 /4 060。

按照式( 10) ,画出12 bit,10 000 cd/m2时的PQ曲线见图11,可见杜比PQ构造的EOTF亮度范围从0. 001 cd / m2到10 000 cd/m2,动态范围107,整条曲线在不同亮度区量化阈值均小于Barten阈值。同样是12bit量化的BT. 1886 EOTF,最高亮度1 000 cd / m2,在小于2 cd / m2的低亮度区,量化阈值高于Barten阈值,表明杜比PQ比BT. 1886 量化效率更高。

杜比PQ是显示端的非线性变换特性EOTF,与摄像端不发生关系,只考虑了信号量化和人眼亮度分辨率的关系,认为若视频信号从摄像机获取,则摄像机端信号与景物亮度呈线性关系。换句话说,若摄像端存在类似BT. 709 给出非线性变换,则需要去除这种非线性,才能正确显示所摄取的景物亮度。因此,杜比PQ是作为表现视频信号特征的视频监视器角色出现,而非指定从景物到显示屏整个系统的变换关系。

4. 3 BBC建议的HDR光电变换特性

BBC的HDR建议考虑电视信号的产生到显示整条信号链,提出OETF和EOTF。从信号产生端看,在图像的较亮部分符合韦伯定律,即感知亮度差和亮度的比值近似恒定。这意味着对数规律的OETF在给定的量化深度下将提供最大动态范围。例如现今专有的摄像机OETFs,如S-LOG,Panalog和Log C等已获得广泛使用。但对数变换在低亮度区域分辨率很差,会出现可察觉的量化误差。低亮度区人眼视觉感知阈值符合De Vries-Rose规律,很凑巧的是,传统的指数型OETF特性与De Vries-Rose规律匹配很好。这种传统的伽玛曲线当初就是为低亮度表现的CRT所设计。因此,理想的OETF应在低亮区符合指数规律,在高亮区符合对数规律。

BBC提出混合型OETF如下式表示[8]

式中: E是代表景物线性亮度的摄像机各彩色通道( R,G,B) 信号值。E'是非线性变换信号,归一化范围0~1。r = 0. 5 是白电平参考值。

固定常数a = 0. 178 832 77,b = 0. 284 668 92,c =0. 559 910 73。对应这组常数,相对亮度为12 时,信号值E' = 1。

图12 表示按照log-Gamma规律的组合型OETF变换,其中虚线为BT. 709 的伽马预校正,实线为适合HDR的OETF,相对亮度从1 扩大到12,避免了高亮度区的信号饱和。这种log-Gamma规律的组合为提高量化效率埋下伏笔。

BBC建议的显示器非线性变换EOTF如下[8]

式中: Yd为像素表示的屏幕亮度; Ys是景物亮度; α =LP- LB,表示屏幕亮度最大值; β = LB; γ 为系统级光电转换特性。LP是峰值白(对应Ys=1),LB是黑亮度(Ys=0)。

EOTF实际计算过程见图12。EOTF把线性景物亮度Ys映射到屏幕亮度Yd。与常规动态范围SDR不同,EOTF将变换施加到景物亮度Ys,而不是加到每个颜色通道,来防止颜色变换的不一致。

Ys可通过预校正信号E'来获得

E是线性景物亮度的每个彩色分量RGB分量表示,可得到

显示亮度Yd确定之后,显示器每个像素的显示值Rd,Gd和Bd由下式决定

计算量化误差曲线,取 α = 2 000,β = 0. 01,γ =1. 5。按10 bit量化有 ΔE' = 1 /1 020,得到BBC EOTF量化误差曲线如图13 所示,图中3 种EOTF均为10 bit量化,杜比PQ是最接近Schreiber阈值的EOTF,支持亮度到10 000 cd /m2。BBC和1886 传统Gamma支持2 000 cd / m2亮度,但1886 在中低亮度区已经超过Schreiber阈值,量化误差为可察觉。BBC EOTF结合了Gamma和对数转换特性,量化误差正好在阈值之内,表现出较好的量化效率。需要指出的是,按照本文的推导计算曲线,与BBC研究报告给出的曲线略有差别,尚未找到原因。BBC研究报告误差曲线如图14 所示。

BBC HDR转换特性首先从摄像端入手进行非线性预校正,低亮度区采用BT. 709Gamma特性,在高亮度区采用对数特性,这样充分发挥摄像机已具备的高亮度景物摄取能力,同时将人眼视觉亮度差阈值与量化级相适配。其次,对于显示端,按照观看环境亮度和显示器峰值亮度参数选择系统级Gamma值,从整个亮度观看全过程适应人眼视觉特性。BBC HDR方案与现有的电视伽玛特性标准在低亮度区域有一定兼容性,转换特性产生的量化误差对大多数自然景物图像而言不易察觉,转换特性没有杜比PQ那么复杂,因此,日本已将其作为扩展图像动态范围电视( EIDRTV) 系统的ARIB国家标准。

5 结束语

本文以杜比感知量化和BBC摄像端和显示端分开考虑的转换特性入手,介绍HDR电视系统光电转换特性原理和设计实现。这两种HDR方案均基于人眼视觉系统的感知特性,以最少的量化比特实现高动态范围显示要求。杜比方案基于显示器屏幕亮度,以人眼视觉感知阈值来确定电- 光转换特性,使量化误差正好小于视觉阈值,形成精确复杂的高亮度转换特性。BBC方案在摄像端采用扩大景物亮度范围非线性预校正,在显示端以适合观看环境的系统级伽玛数设计电- 光转换特性,同样以较少的量化比特实现高动态范围显示。HDR电视系统将传统基于CRT特性,亮度范围在100 cd/m2以内的常规显示扩展到2 000 ~10 000 cd / m2高亮度,适应新型显示器的发展现状,为用户提供更加绚丽多彩的真实世界再现。

参考文献

[1]DENTON E J,PIRENNE M H.The absolute sensitivity and functional stability of the human eye[J].The journal of physiollogy,1954,123(3):417-442.

[2]NARISADA K,SCHREUDER D.Light pollution handbook[M].[S.l.]:Springer Science&Business Media,2004.

[3]BORER T.Non-linear opto-electrical transfer functions for high dynamic range television[EB/OL].[2015-11-01].http://downloads.bbc.co.uk/rd/pubs/whp/whp-pdffiles/WHP283.pdf.

[4]STEVENS S S.On the psychophysical law[J].Psychological review,1957,64(3):153-181.

[5]DAVSON H.Physiology of the eye[M].5th ed.London:Macmillan Academic and Professional Ltd.,1990.

[6]BARTEN P G J.Formula for the contrast sensitivity of the human eye[C]//Proc.SPIE-IS&T.San Jose,CA:[s.n.],2004,5294:231-238.DOI:10.1117/12.537476.

[7]SCOTT M.Perceptual signal coding for more efficient usage of bit codes[J].Motion imaging journal,2013,122(4):52-59.DOI:10.5594/j18290.

动态范围 篇7

1 单元电路结构及原理

单元读出电路功能可由CTIA结构、相关双采样和缓存输出电路三部分级联实现。传统的焦平面读出电路在处理皮安级甚至更小的探测器电流时将出现输入动态范围过小的问题。这是由于电路工作于采样阶段时处于断开状态的开关on有漏电流流过, 即在积分电容上产生误差[1]。本文设计的改进型单元读出电路, 在紫外探测器输出端与地之间接一个开关onn, 其控制信号与开关on相反。开关on断开后开关onn导通, 探测器电流经过开关onn短路到地, 这样流经开关on的漏电流将急剧降低, 电路可检测的探测器最小电流也随之减小, 从而增大了输入动态范围。

为进一步提高精度, 双采样结构中使用了采样电容的大小按照探测器输出电流大小进行选择的新型的设计方法。采样电容与积分电容同步控制, 当开关sh3导通后积分电容为Cint1+Cint2=400 f F, 采样电容为Csh1+Csh2=600 f F。可识别电流精度达50 f A。

最后采样的数据通过缓存器输出, 输出速率为10 MHz, 当应用于128×128阵列时, 把全部像元数据顺序输出耗时1.64 ms。其他性能参数为, 积分时间5 ms~25 ms、积分电压摆幅1.2 V、积分电容50 f F+350 f F、采样电容为Csh1+Csh2=600 f F、单元电路功耗约为10μW。

2 电路设计

本文设计的新型单元读出电路如图1所示, Ⅰ为CTIA结构、Ⅱ为双采样电路、Ⅲ为缓存输出电路, 共由三部分组成。

CTIA结构中CMOS差分放大器采用低功耗和低噪声设计。为降低噪声, 由于p管噪声比n管小, 差分放大器输入管采用p型管同时在面积允许范围内把输入管和负载管的栅面积设计的足够大;为实现低功耗要求, 该放大器的MOS管工作于弱反型区。根据UMC 0.18 um模型计算得出:n=2.2和ID0=11.75 p A (n管) , n=2.36和ID0=1.05p A (p管) 。为电路的设计提供理论支持。该放大器工作于200 Hz时开环增益达到90.5 d B, 故能较好的实现虚短特性, 从而能为探测器提供较稳定的偏置电压, 同时还可实现较高的注入效率。

传统的CDS电路由两个采样电容和一个差分放大器构成, 该结构在读出电路中占用面积过大, 所以本文采用由一个采样电容和MOS开关组成的电路结构。当积分时间取t=16 ms时两次采样的时间间隔也为16 ms, 所以1/f噪声中噪声频率高于1/16 ms的噪声无法通过CDS结构消除。

为节省缓冲器所占的芯片面积, 采用源跟随结构。M1管提供偏置电流, M2管为p型管源跟随器, 因为p型管噪声低于n管。M3管的作用是在数据输出前预先给负载电容充电, 当输出数据时, 负载电容通过M2管放电。开关read的控制信号由行选和列选信号生成。

当负载电容为100 f F时, 该缓冲器在10 MHz的频率下, 缓冲器的增益Abuffer=0.88, 尽量减小对采样信号的衰减。

3 仿真与结论

采用UMC 0.18标准CMOS工艺提供的器件参数, 对传统的和改进型单元读出电路进行精确的SPICE仿真。图2为探测器输出电流18 p A时流过开关on的漏电流对比, 其中曲线b为传统单元电路中无开关onn时流过断开的开关on的漏电流, 大约为16 p A, 开关几乎失去作用;曲线a为改进型单元电路中存在开关onn时流过断开的开关on的漏电流, 大约为10 f A, 漏电流低于1%。当探测器电流为1PA时改进型电路对漏电流亦有很好的抑制效果。由反相时钟控制的开关onn对开关on的漏电流的抑制效果非常好, 提高了读出电路对探测器输出电流的处理范围。

在采用上述方法大幅度提高输入电流范围的基础上改变双采样中采样电容的大小来提高采样精度。当采样电容恒定为200 f F时对5 p A左右的探测器电流进行采样, 采样电容上产生的误差已经超过采样的电流精度50 f A。当采样电容可变时对18 p A左右的探测器电流进行采样, 采样电容上产生的误差低于采样的电流精度50 f A, 如图3所示。该方法进一步提高了输入电流的动态范围。

改进型单元读出电路把探测器输入电流范围扩大到50 f A~20 p A。

图4是一个1×8阵列的读出电路电压输出波形。当负载电容为100 f F时输出速率可达到10 MHz。在数据输出前, 负载电容预充电到电源电压3.3 V, 数据由多路传输器控制依次顺序读出。

改进后的单元读出电路可识别的最小探测器电流为0.05 p A, 最大电流为20 p A。输入动态范围:

本文在传统读出电路的基础上对电路的双采样部分及读出电路输入端开关部分进行了改进, 大幅度的提高了探测器输入电流范围和采样的电流精度, 同时并没有增加电路的复杂度。该单元读出电路可应用于工作在快照模式下的128×128 FPA读出电路, 像素输出速率达10 MHz, 为探测器提供0.3 V~2 V的稳定偏置电压, 可处理的探测器电流为0.05 p A~20 p A。

参考文献

动态范围 篇8

同样, 在无线测试领域, 为了研制出功能和性能更加优异的产品, 人们不懈追求, 探索更新的测试手段。德国罗德施瓦茨公司 (R&S公司) 自1933年成立以来, 不断创新, 为不断挑战自我, 寻求卓越的研发、生产、质量监督、维修等部门提供精度更高、速度更快、频谱更纯、动态范围更大的测试仪器和系统。

罗德与施瓦茨, 挑战无线测试极限!

ROHDE&SCHWARZ

罗德与施瓦茨 (中国) 有限公司

北京:TEL:+86-10-64312828 FAX:+86-10-64379888 上海:TEL:+86-21-63750018 FAX:+86-21-63759170

成都:TEL:+86-28-86527605 FAX:+86-28-86527610 广州:TEL:+86-20-87554758 FAX:+86-20-87554759

西安:TEL:+86-29-87415377 FAX:+86-29-87206500 深圳:TEL:+86-755-82031198 FAX:+86-755-82033070

上一篇:竞赛培训下一篇:温度预控制