数字压缩

2024-06-15

数字压缩(共8篇)

数字压缩 篇1

0 引言

数字图像压缩的概念

在当前这个信息化社会中, 多媒体技术已被人们频繁使用, 多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一, 发挥着越来越重要的作用;而传输图像需要占用大量的数据空间, 严重影响传输速率和实时处理量, 因而我们要将图像进行压缩, 来解决这一问题。

数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术, 图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息, 提高传输速率, 节省存储空间。

1 发展现状

目前数字图像压缩已取得了划时代的发展, 在国际上形成了一系列国际标准, 如JPEG标准。此标准是负责开发静止图像压缩标准的“联合图片专家组”于1989年形成的基于自适应DCT的JPEG技术规范的第一个草案, 后经多次修改, 最终在一年后形成国际标准。随着多媒体应用的不断增长, 为满足人们在图像压缩领域的迫切需要, 于2000年联合图片专家组又研究出新一代静态图像压缩标准——JPEG2000。系列的国际标准的提出标志着数字图像压缩技术已由学术研究转为产业化, 逐步走向成熟。它使通信、广播、计算机产业的界限变得模糊, 促使现有信息产业的结构发生巨大改变, 当前分形图像压缩和小波图像压缩是研究的新方向。

2 图像压缩基本方法

图像压缩有两种基本的压缩方法:一种是有损数据压缩;另一种是无损数据压缩。有损数据压缩一般采用变换编码方法, 例如, 基于离散余弦变换 (DCT) 的变换编码方法, 如JPEG;还有基于小波变换的方法, 例如JPEG2000、EZW、SPIHT等等。JPEG是有损数据压缩。通过DCT变换后选择性丢掉人眼不敏感的信号分量, 实现高压缩比率。PNG是无损数据压缩中图片压缩常采用的格式, 采用LZ77派生的无损数据压缩算法。而音频压缩格式Fl LAC、TTA和视频压缩格式HUFFYUV也是无损数据压缩常采用的压缩格式。

2.1 有损数据压缩

有损数据压缩是一种破坏性压缩。它在压缩过程中, 允许有一定信息的失真, 但此失真对原图像影响较小, 得到一个与原图像相近似的图像, 但压缩比却大大提高了。有损数据压缩常用于因特网、流媒体、视频以及电话领域。有损数据压缩方法有色彩空间、色度抽样、变换编码、分形压缩。

2.2 无损数据压缩

无损数据压缩采用数据的统计冗余进行压缩, 使数据通过其压缩后信息没有受到损失, 均可还原到压缩前的原样。比如在工程制图、计算机程序、医疗图像、指纹图像等方面此方法得到广泛应用。经常使用的无损压缩方法有Shannon-Fano编码、Huffman编码、游程 (Run-length) 编码、LZW (Lempel-Ziv-Welch) 编码和熵编码法等。无损压缩的优势有100%的保存, 没有任何信号丢失;音质高, 不受信号源的影响;转换方便。无损压缩的不足是缺乏硬件支持, 占用空间大, 压缩比不高。

3 图像压缩算法

比较常用的数字图像压缩方法有:基于傅立叶变换的图像压缩算法、基于离散余弦变换的图像压缩算法、基于小波变换的图像压缩算法。此外还有NNT (数论变换) 压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等。下面简单介绍近年来任意形状纹理编码的几种算法。

3.1 形状自适应离散小波变换

SA-DWT编码主要包含SA-DWT和零树熵编码的扩展以及嵌入式小波编码 (EZW) 。

其中经过SA-DWT之后的系数个数, 同原任意形状可视对象的像素个数相同;EZW则是采用渐进式量化和嵌入式编码, 算法复杂度低, 打破了常规, 即使用低复杂度的算法就可以完成高效的压缩编码器的编码。

3.2 Egge r方法

Egger方法使用了小波变换的局域特性, 把可视对象的行像素推到与边界框的右边界相平齐的位置, 然后对每行的有用像素进行小波变换, 接下来再进行另一方向的小波变换。此方法可能引起重要的高频部分同边界部分合并, 不能保证分布系数彼此之间有正确的相同相位。

3.3 形状自适应DCT (S A-DCT) 算法

SA-DCT把一个任意形状可视对象分成的图像块, 对每块进行DCT变换, 它实现一个类似于形状自适应Gilge DCT变换的有效变换, 但它比Gilge DCT变换的复杂度要低。可是, SA-DCT也有缺点, 它把像素推到与矩形边框的一个侧边相平齐, 因此一些空域相关性可能丢失, 这样再进行列DCT变换, 就有较大的失真了。

4 结论

今天, 数字图像压缩技术取得了卓越的成果, 它广泛应用于网络互联、媒体传播、医疗图像等生活的各个方面, 由于它的存在, 使我们大大减少了传输数量, 提高了通信速率, 使生活更加便捷, 同时也使多媒体技术上了一个新的台阶, 数字图像压缩技术在更深更广层次上的应用值得我们进一步研究。

参考文献

[1]刘方敏等.JPEG2000图像压缩过程厦原理概述[J].计算机辅助设计与图形学报, 2002.

[2]T Sikora, B Makai.Shape-adaptive DCT for genericcoding of video[J].IEEE Trans.Circuits Syst.Video Technol., 1995, 5 (1) :59-62.

[3]M Bi, S H Ong, Y H Ang.Comment on“Shape-adaptiveDCT for generic coding of video”[J].IEEE Trans.CircuitsSyst.Video Technol., 1996, 6 (6) :686-688.

[4]P Kauff, K Schuur.Shape-adaptive DCT with block-basedDC separation and Delta DC correction[J].IEEE Trans.CircuitsSyst.Video Technol., 1998, 8 (3) :237-242.

[5]吴乐南.数据压缩[M].电子工业出版社, 2005.

[6]张晓娣等.新一代的静止图像压缩标准JPEG2000[J].电信科学, 2001.

[7]孙即然.图像压缩与投影重建.北京:科学出版社, 2005.

走进数字AV压缩技术(下) 篇2

前文提及的WMA是Windows Media Audio编码后的文件格式。在意识到网络流媒体之于互联网的重要性之后,微软很快就推出了Windows Media与Real Media相抗衡,同时开始对其他音频压缩技术一律不提供直接支持。最初版本的Windows Media在音质方面并没有什么优势,不过最新的Windows Media 9携带了大量的新特性并在Windows Media Player的配合下已经是不可同日而语。特别在音频方面,微软是唯一能提供全部种类音频压缩技术(无损、有损、语音)的解决方案。微软声称,在只有64kbps的速率情况下,WMA可以达到接近CD的音质。和以往的编码不同,WMA支持防复制功能,它支持通过Windows Media Rights Manager 加入保护,可以限制播放时间和次数甚至是播放的主机等。WMA支持流技术,即一边读一边播放,因此WMA可以很轻松的实现在线广播。WMA凭着本身的优秀技术特征加上微软的大力推广,这种格式被越来越多的人所接受。

Windows Media是一种网络流媒体技术,本质上跟Real Media是相同的。但Real Media是有限开放的技术,例如RTSP(Real Time Stream Protocol,实时流协议)网络传输协议是提交到网络工作组RFC网络协议集的其中一个,而Windows Media则没有公开任何技术细节,据称是为了更好地进行版权保护,因此要完全封闭,还创造出一种名为MMS(Multi-Media Stream多媒体流)的传输协议。目前Windows Media还是处于推广期,播放器和编码器可以免费下载,服务器端捆绑在Windows服务器版中,不另外收费。而且由于微软的影响力,支持Windows Media的软件非常多。虽然它也是用于聆听用途,不能编辑,但几乎所有的Windows平台的音频编辑工具都对它提供了读/写支持,至于第三方播放器更是无一例外了,连Real Player都支持其播放。通过微软自己推出的Windows Media File Editor可以实现简单的直接剪辑。微软推出的Windows XP Media Center版本,通过在Windows XP中捆绑Windows Media 9技术以及相关娱乐媒体软件来加强Windows作为家庭娱乐中心的作用。如果微软继续保持其在操作系统特别是桌面操作系统的垄断地位的话,Windows Media的未来肯定是一片光辉。

7. OGG

2002年7月,网络上出现了一种号称MP3杀手的音频编码,叫Ogg Vorbis。Vorbis 是这种音频压缩机制的名字,而Ogg则是这个多媒体开发项目的名称,它将涉及音/视频等方面的编码开发。

在压缩技术上,Ogg Vorbis除了支持VBR还支持ABR(平均位率)方式进行编码。Vorbis是高质量的音频编码方案,可以在相对低的数据率下实现比MP3更好的音质。Vorbis文件的设计格式是非常灵活的,可以被分成小块并以样本粒度(granularity)进行编辑。Vorbis还具有位率缩放功能,可以不用重新编码便可调节文件的位率。它的最大特点是在文件格式已经固定下来后还能对音质进行明显的调节和新算法。现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。Vorbis同时可以对所有的声道进行编码,而不是MP3只能编码2个声道。多声道音乐的兴起,给音乐欣赏带来了革命性的变化,尤其在欣赏交响时,会带来更多现场感。而且,OGG源码是完全开放与免费的且没有专利限制的。Ogg Vorbis取得的最大成就是获得英国BBC广播公司的认可,使用Ogg Vorbis音频流在线播放节目。

8.Dolby技术

1、Dolby Digital

Dolby Digital是杜比实验室最闻名的数字技术,是一种利用了人类的听觉特性,通过对高质量多声道数字音频信号压缩进行有效的存储与传输的音频编解码工艺。Dolby Digital有时也被称为杜比AC-3,它是Dolby Digital技术的基础。该技术通过不同介质提供多声道环绕声。Dolby Digital技术于1992年首次用于电影院中,是目前唯一的全球性多声道音频标准和ATSC数字电视及SCTE数字有线电视的音频标准。

此外,Dolby Digital技术已被确认为DVB的音频传输标准。目前许多欧洲的数字机顶盒均可对Dolby Digital数据流进行处理。

事实上全世界所售出的DVD播放机都装有进行Dolby Digital译码的电路。

Dolby Digital声能够提供从单声道到5.1声道环绕声的各种制式的声音。所谓5.1声道环绕声包括五个分离的全频带(20Hz~20k Hz)音频信号-左、中、右、左环绕、右环绕声道加上第六个分离的低频(20~120 Hz)效果声道,通常称作LFE(低频效果)声道。而其所占用的存储空间比CD上一路线性PCM编码的声道所占用的空间还要少。基于对人耳听觉的研究,Dolby Digital音频技术中的先进算法使存储或者传输数字音频信号时使用更少数据成为可能。在5.1声道的条件下,可将码率压缩至384kbps,压缩比约为10:1。Dolby AC-3最初是针对影院系统开发的,但目前已成为应用最为广泛的环绕声压缩技术之一。

2、Dolby E

浅析数字音频压缩技术 篇3

音频压缩技术指的是对原始数字音频信号流 (PCM编码) 运用适当的数字信号处理技术, 在不损失有用信息量, 或所引入损失可忽略的条件下, 降低其码率, 也称为压缩编码。它必须具有相应的逆变换, 称为解压缩或解码。所以说, 压缩技术从一出现便受到广泛的重视。

2 MPEG压缩技术原理

在MPEG-1压缩中, 按复杂程度规定了三种模式即层Ⅰ, 层Ⅱ, 层Ⅲ。目前广泛使用的VCD的音频压缩方案为层Ⅰ, 它的典型的码流为每通道192Kbit/S。层Ⅱ即称掩蔽模式通用子带集成编码与多路复用, 典型的码流为每通道128 Kbit/S, 广泛应用于数字音频广播、数字演播室等数字音频专业的制作、交流、存储和传送。层Ⅲ则是综合于层Ⅱ和AS-PEC的优点提出的混合压缩技术。MPEG-1的压缩技术方案是子带压缩, 子带分割的实现是通过时频映射, 采用多相正交分解滤波器组将数字化的宽带音频信号分成32个子带;同时, 信号通过FFT运算, 对信号进行频谱分析;子带信号与频谱同步计算, 得出对各子带的掩蔽特性, 减少了对量化比特率的要求。在解码端, 只要解帧, 子带样值解码, 最后进行频——时映射还原, 最后输出标准PCM码流。其原理方框图如图1所示。

2.1 层Ⅰ

时频映射:数字的多相正交滤波器组把信号分成32个子带信号, 因为层Ⅰ是均匀的划分, 所以每个子带频宽为24K/32=625HZ。这种划分与关键频宽段的概念不一样, 在低端只有一个子带625HZ, 这样对低频的量化比较简单, 容易引起低频端的量化误差。

心理声学模型:使用512个点的FFT变换得到信号的短时频谱功率信息, 输出的电平和时频映射的子带样值同步计算, 得到每个子带的掩蔽阈值。最后将该子带的最大信号/掩蔽阈值率输入给量化器。

量化/编码:首先检测每个子带的样值, 找到最大相对值, 并且将比特量化, 对该子带来讲叫比例因子。通过最小化噪音/掩蔽值, 由比例因子决定动态量化比特数, 将该子带值样值线性量化。这样每个子带用的量化比特数和每个子带的最大样值都在MPEG的码流里, 在接收端再按照这些信息还原原信号的幅值。

帧形成:每一帧的开始都有一个同步的信息, 还有CRC的循环冗余纠错码。帧是MPEG-1处理的最小单元, 一帧信号处理384个PCM的样值, 因为要检测每个样值的大小后, 才能开始处理, 所以延时时间384/48K=8ms。一帧相当于8ms的声音样本。

2.2 层Ⅱ

时频映射:和层Ⅰ类似, 不同之处在于每个子带不是均匀频带宽, 因为人耳低频时的灵敏度在700HZ以后急剧降低。与之相关的一个概念叫关键带宽, 在按关键带宽分割时, 低频取的带宽窄, 即意味着对低频有较高频率分辨率, 在高频端时则相对有较低一点的分辨率。这样的分配, 更符合人耳的灵敏度特性, 可以改善对低频端压缩编码的失真。

心理声学模型:和层Ⅰ类似, 但是使用的FFT精度高一些, 是1024点的FFT运算方式, 提高了频率的分辨率, 得到原信号的更准确瞬间频谱特性。

量化/编码:和层Ⅰ类似。但是层Ⅱ的帧长度码流是层Ⅰ的三倍, 所以层Ⅱ允许每个子带有三个连续的比例因子, 但编码时用一、二个或者三个, 由它们之间的差别来定。子带内有三个比例因子, 这就意味着带内再进行动态比特分配, 更增加了MPEG1的压缩率。

帧形成:描述比特分配的比特位数和层Ⅰ是不一样的。在低端子带用4位码来描述, 相对低端子带量化比特数最大为24=16bit, 在中间子带用3位码描述, 相对中间子带比特最大为23=8bit, 高端子带用2位码来描述, 相对最大比特为22=4bit, 这种分频率不同而比特率不一样的做法, 也是关键带宽的应用。

2.3 层Ⅲ

层Ⅲ比层Ⅱ更为复杂, 它除了使用多相正交滤波器组之外, 还使用了DCT变换滤波器组, 提高频率的分辨率, 还应用了预测心理声学模式, 使用更为复杂的量化和编码, 允许不同的帧码流。另外还使用了一些新的方案:如:a.在MP-3的码流中增加了一些冗余的字节, 以便在需要的时候可以在短时间内提到较高的码率。b.Ⅲ中, 还采用了Huffman编码进行无损压缩, 更进一步降低了数码率, 提高了压缩比, 节省20%的码率。

3 压缩技术的发展及其应用

3.1 多声道音频信号压缩与Dolby AC-3

随着技术的不断进步和生活水准的不断提高, 原有的立体声形式已不能满足受众对声音节目的欣赏要求, 具有更强定位能力和空间效果的三维声音技术得到快速发展, 最具代表性的就是多声道环绕声技术。

3.1.1 Dolby AC-3是一种感知型压缩编码技术。

在5.1声道的条件下, 可将码率压缩至384kbps, 压缩比约为10:1。在Dolby AC-3中, 音频输入以音频块为单位, 块长度为512个样值, 在经过3Hz高通滤波器去除直流成分后, 通过另一高频带通滤波器以检测信号的瞬变情况, 并用它来控制TDAC变换的长度, 以便在频域分辨率和时域分辨率之间得到最好的折中效果;定点/浮点转换主要是为了获得宽的动态范围;比特分配主要是通过计算解码后的频谱包络和掩蔽曲线的相关性来进行的;在对尾数的量化过程中, 可对尾数进行抖晃处理, 抖晃所使用的伪随机数发生器可在不同的平台上获得相同的结果。

3.1.2 MPEG-2BC (后向兼容方式) , 即ISO/IEC13818-3, 是另一种多声道环绕声音频压缩技术。

与MPEG-1相比较, 它主要在两方面做了重大改进。一是支持多声道声音形式, 二是为某些低码率应用场合, 如多语声节目、体育比赛解说等而进行的低采样率扩展。

3.1.3 DVD是新一代的多媒体数据存储和交换的标准。

在视频DVD的伴音方式及音频DVD的声音格式选择上, AC-3和MPEG-2BC之间的争夺也很激烈。

3.2 音频压缩算法

一般来讲, 可以将音频压缩技术分为无损压缩及有损压缩两大类, 而按照压缩方案的不同, 又可将其划分为时域压缩、变换压缩、子带压缩, 以及多种技术相互融合的混合压缩等等。

3.2.1 时域压缩 (或称为波形编码) 技术是指直接针对音频PC码流的样值进行处理, 通过静音检测、非线性量化、差分等手段对码流进行压缩。此类压缩技术的共同特点是算法复杂度低, 声音质量一般, 压缩比小, 编解码延时最短。

3.2.2 子带压缩又称感知型压缩编码技术, 是以子带编码理论为基础的一种编码方法。其思想是将信号分解为若干子频带内的分量之和, 然后对各子带分量根据其不同的分布特性采取不同的压缩策略以降低码率。这种技术目前广泛应用于数字声音节目的存储与制作和数字化广播中。

3.2.3 变换压缩技术是对一段音频数据进行“线性”的变换, 对所获得的变换域参数进行量化、传输。通常使用的变换有DFT、DCT、MDCT等。根据信号的短时功率谱对变换域参数进行合理的动态比特分配可以使音频质量获得显著改善, 而相应付出的代价则是计算复杂度的提高。

摘要:介绍数字压缩音频技术的原理及其发展应用。

数字影像无损压缩算法研究 篇4

随着计算机技术、通讯技术和生物医学工程技术等相关技术的高速发展, 通过对医学影像进行数字化处理, 进行计算机智能化处理, 将使依据医学影像进行的诊断放弃传统的肉眼观察和主观判断, 并可依据同一影像进行多种疾病的诊断和多科疾病的诊断。在应用计算机技术后, 医学影像将从形态图像向功能图像转变, 对医学影像数据库和特征库的内容进行提取分析, 将可以帮助医生进行科学的诊断, 提高诊断的科学性、客观性和准确性。

应用DICOM3标准和网络通讯协议标准TCP/IP可以方便地实现对直接具有数字化接口的影像设备的成像数据的提取;小波分析 (Wavelet Analysis) 在时域和频域同时具有良好的局部化性质, 而且由于对图像信号的高频成分采用转件精细的时域或频域取样补偿, 从而可以聚焦到对象的任何细节, 这一特点在医学影像分析中将得到较好的应用。

1总体方案设计

ACR和NEMA联合组成委员会在1993年发布的医学数字成像与通信 (Digital Imaging and Communication in Medicine, DICOM) 标准3.0, 是医学影像设备间联网的专用数字接口, 是进行网络通信时应满足的标准协议, 是一组具有DICOM兼容性的设备所共同遵循的协议。在DICOM标准中, 医学图像包含了许多如图像获取设备对图像的分析、医生的报告及患者情况等信息, 这种信息与图像的结合方便了图像的检索、图像的分析和诊断。医学影像处理的总体结构如图1所示。

1.1符合DICOM标准中间件实现方案

DICOM3消息交换的网络支持对应于ISO/OSI定义的网络传输中的会话层、表示层及联接控制服务单元, 这部分底层 (传输控制层、网络层) 的信息交换定义为通用的网络传输协议。在设计实现中将采用智能Agent中间件技术。当设备采集影像数据后, Agent中间件自动将数据传送到医学影像数据库中, 减少不必要操作的处理, 并能保证数据传输的一致性和同步性。

1.2压缩存储中间件实现方案

影像图片大约需要8~15 MHz的存储空间, 为了缩小存储成本和便于网络传输, 必须对图像进行压缩。现阶段常用的压缩存储方案有4种:① 基于JPEG标准下的无损压缩算法JPEG-LS, 这是DICOM标准支持的一种成熟的无损压缩算法;② 基于整数小波变换的单帧图像无损压缩算法, 它利用了医学图像象素之间存在高度的相关性和整数小波的特性;③ 基于三维整数小波的序列图像无损压缩算法, 对整个序列进行无损压缩, 可以有效地提高图像的压缩率;④ 利用JPEG2000标准支持ROI (Region Of Interest 感兴趣区域) 编码的特性, 对图像的ROI进行无损压缩编码, 对次要信息区域 (如背景) 采用高压缩比的有损压缩方法。

本文在综合分析以上4种方案的基础上, 提出了基于适形离散小波变换 (SA-DWT) [1]与整数小波变换相结合的影像无损压缩算法。并应用该方案构件了智能Agent中间件。

1.3检索诊断中间件实现方案

在应用存储的数字化医学影像和影像特征进行诊断时, 需要完成大量的检索和比对处理, 为了减少网络流量, 提高检索速度, 应用了基于小波模极大值及多尺度不变矩相结合的检索算法, 并建立了算法实现的中间件, 运行效果明显, 能够较好地完成影像的检索和诊断作用。

2无损压缩算法研究

无损图像压缩是指解压缩后的图像与原来图像完全相同, 没有任何信息的损失。医学图像是医学诊断和疾病治疗的重要根据, 在临床上具有重要的应用价值。确保医学影像压缩后的高保真度是医学图像压缩首要考虑的因素。现在医学图像常采用无损压缩, 因为它能够精确地还原图像。但是无损图像压缩的缺点是压缩比低, 仅为2~4;而有损图像压缩的压缩比可高达50, 甚至更高。所以将这2种压缩法方法在保证使用要求的基础上结合起来, 在获取高的压缩质量的前提下提高压缩比。本文提出的基于SA-DWT与整数小波变换相结合的压缩算法, 就是应用SA-DWT算法确定感兴趣区域, 对该区域进行无损压缩, 其他区域进行有损压缩, 大大提高了压缩效率, 并不损失影像的医学作用。

2.1SA-DWT算法

传统的二维小波变换都是针对矩形区域进行的, 得到的变换系数个数一般会大于原始区域像素点个数, 而且由于填充, 变换后区域的边界会出现钝化, 所以限制了任意形状区域的编码效率。

现代的患者同一部位的医学影像可以应用到相关的不同的多个诊断过程中, 因此, 整幅影像中可能存在多个特征区域, 而每个区域的形状都不是规则的图形, 不适合采用传统的二维小波变换。本文采用了Li等提出的适形离散小波变换 (SA-DWT) , 该变换可以用于对任意形状的图像对象进行变换, 因此适合与对医学影像中的感兴趣区域进行编码。测试结果表明:

① 变换域的变换系数同像素域的相同;

② 只要采用的L阶小波滤波器具有完全重构特征, 并且下采样的位置已知, 就存在一个唯一的反变换, 可用于完全重构原始的影像;

③ 长度自适应的小波变换保留了分段采样点的位置, 不会产生超出边界的系数。

由于对奇数长度图像信号的剩余采样点进行了缩放, 因此这种任意长度的小波变换得到的低通系数具有相同的尺度, 这就避免了边界处小波系数的突变。

2.2提升算法原理

由Sweldens等提出来的提升方案 (Lift Scheme) 是构造紧支集双正交小波的一种新方法, 被称为“第二代小波”[2], 也叫做整数小波变换。该方法可以将整数映射到整数, 可以实现由SA-DWT算法分割的不同区域内影像的无损压缩。

对于原始信号sj, 经小波分解成为低频信号sj-1和高频细节信号dj-1两部分。有提升方法构成的小波变换包括:分裂 (Split) 、预测 (Predict) 和更新 (Update) 3个步骤。

2.2.1 分裂

此过程是将原始信号sj分裂成2个互不相交的子集sj-1和dj-1, 通常是将这个信号序列分解成偶数序列和奇数序列, 即

split (sj) = (evenj-1, oddj-1) = (sj-1, dj-1) 。

2.2.2 预测

针对数据间的相关性, 可用sj-1去预测dj-1, 故可以采用一个与数据集结构无关的预测算子P, 使得dj-1=p (sj-1) , 这样就可以用子数据集sj-1代替原始数据集sj。若再用子集dj-1与预测值p (sj-1) 之间的差值去代替dj-1, 则此差值反映了二者的逼近程度。如果预测是合理的, 则差值所包含的信息就比原始子集dj-1包含的信息要少得多。预测表达式为:

d^j-1=oddj-1-p (evenj-1) =dj-1-p (sj-1)

将数据集合分成偶数集合和奇数集合后, 最简单的一个预测算子就是用相邻2个偶数的均值来作为它们之间的奇数的预测值, 即

p (sj-1) =s (j, 2k+sj, 2k+2) /2。

由此可得预测表达式为:

d^j-1, k=dj-1, k-p (sj-1) =sj, 2k+1- (sj, 2k+sj, 2k+2/2)

2.2.3 更新

经过上述2个步骤后, 所产生的系数系数子集sj-1的某些整体性质 (如均值) 并不和原始数据中的性质一致, 因此需要采用更新过程。其目的是通过算子U产生一个更好的子数据集合s^j-1, 使之保持与原始数据集一致的特征。s^j-1定义如下:

s^j-1=evenj-1+U (d^j-1) =sj-1+U (d^j-1)

具体的更新计算的过程为:

s^j-1, k=sj, 2k+ (d^j-1+d^j-1, k-1)

对于数据子集s^j-1重复进行上述相同的3个步骤, 即将s^j-1分解成s^j-2dj-2, 经过n次分解后, 原始数据sj的小波表示为:

{s^j-n, d^j-n, d^j-n+1, , d^j-2d^j-1}

式中, s^j-n代表了信号的低频部分;{d^j-n, d^j-n+1, , d^j-2, d^j-1}代表了信号的高频部分。

重构数据时的提升为:

sj-1=s^j-1-U (d^j-1) dj-1, l=dj-1, l (1) +a-1 (sj-1, l-2-sj-1, l-1) sj=Μerge (sj-1, dj-1)

2.3整数小波变换

Sweldens已经证明在提升的基础上可以进行整数集到整数集的小波变换。一个整数集合通过小波变换得到的仍然是整数集合。在进行影像压缩编码处理过程中, 不需要对变换后的系数进行量化, 因此可以实现影像的无损压缩。

在进行影像的无损压缩时, 主要采用了S变换和S+P变换。针对影像的特点并结合Haar变换的整型表示方法, 提出如下形式:

S变换之后, 在低通系数sj-1, l的基础上进行线性预测, 以产生新的高通系数dj-1, l, 这就是S+P变换。

2.4实验与分析

在验证算法中, 主要选取了3组MR图像 (256*256*16 bits, 每组30幅) 和2组CT图像 (512*512*16 bits, 每组30幅) , 分别采用了本文提出的算法进行压缩处理, 同时用预测整数小波变换 (简称:PIWT) 、整数小波变换 (IWT) 和差分脉冲编码调制 (DPCM) 等算法对这5组序列影像进行压缩编码, 得到平均压缩率如表1所示。对其中的数据进行分析可知:本算法的压缩率分别比PIWT算法、IWT算法和DPCM算法平均提高81.15%、100.73%和67.61%。表1中的二维算法的压缩率是序列图像中个图像压缩率的平均值。

应用SA-DWT变换可以方便地找到影像中的多个感兴趣区域, 应用整型小波变换对影像象素本身灰度值进行变换, 且保持了变换前后的整数的一致性, 可以实现对感兴趣区域的无损压缩。

在进行若干次提升变换后, 再利用哈夫曼编码对变换后的系数进行编码, 将较好地去除像素间的相关性, 极大地减低了原始图像的信息量。

3结论语

DICOM标准可以方便地将医学影像处理的数据传到计算机中进行处理, HL7标准可以提高医院不同应用软件间的通信能力。根据多媒体技术和关系数据库理论, 建立医学影像数据库。在构建影像数据库和影响特征库时, 为了减少数据存储量, 提高影像传输速率, 而不影响影像的诊断效果的基础上, 本文提出了基于适形离散小波变换 (SA-DWT) 与整数小波变换相结合的影像无损压缩算法, 并构建了该算法的中间件, 在实际的验证测试中, 该算法可以较好地完成影像的压缩存储, 效果良好。

下一步的研究工作将针对目前影像压缩存储算法和影像检索的算法进行深入研究和比较, 进一步发展各种医学影像内容分析的理论和技术, 深入研究能够充分表示医学图像内容的各种特征, 进一步发展系统架构、性能评价、相似性度量方法、人机交互方式、高维度检索和智能诊断等技术。

参考文献

[1]CINKLER K.Very Low Bit-rate Wavelet Video Coding[J].IEEE Journal on Selected Areas in Communication, 1998, 16 (1) :4-11.

数字影像技术中无损压缩模式应用 篇5

1 图像压缩

图像在压缩的过程中有以下2大类: (1) 有损压缩; (2) 无损压缩。从有损压缩角度来看, 主要利用分形以及多分辨率编码, 从无损压缩角度来看, 主要包括字典以及预测等方法[3]。目前来看, 对图像的处理有许多的方法, 因此在应用效果方面较为理想。从信息论的角度来看, 图像是一个信源, 是描述海量数据的综合方式。图像压缩主要是将多余的不需要的信息进行处理。通过输入图像-变换器-熵编码器-压缩图像等方式来进行相关处理, 其中变换器主要值得是利用DPCM (整数差分脉码调制) 以及ritiwt (可逆整数小波变换) 来有效减少图像数据的相关性;熵编码器 (算术编码器、LZ系列编码器) 主要利用1个模型来确定概率是个的编码, 继而让输出的编码能够小于输入流。

2 可逆变换算法

2.1 预测方法

预测方法主要是通过对每一个像素信息进行编码和提取, 继而能够消除部分多余而无用的消息, 为了能够有效实现预测的可逆性, 因此需要对整个结果进行提取。其主要公式为: (1) en=X (n) -X’ (n) ; (2) X (n) =en+X’ (n) .从上述公式来看, 其中X’ (n) 是预测器根据相关预测结果得到的数据, 而预测器则主要是根据M个像素的线性组合生成的。利用预测编码的相关优点进行计算能够比较容易实现, 但是, 预测编码也存在一定的劣势, 主要表现在某个像素之间与同一组像素之间产生较大的差异时会相应的扩大预测误差, 继而在一定程度上影响到了预测结果。

2.2 可逆整数小波变换

可逆整数小波变换的方案在很大程度上提高了整数到整数的小波变换, 继而使得小波变换能够有效应用于无损压缩的领域当中, 根据JPEG1844 (静止图像标准) 可以采用 (5, 4) 整数小波变换来实现无损压缩。可逆整数小波变换的方案能够将小波变换的多分辨特性发挥得淋漓尽致, 在一定程度上放弃了平移和升缩, 此类方案既能够分解相关信号, 也能够通过预测计算以及更新结算进行基本的提高[4]。

3 熵编码计算方法

3.1 LZW编码

LZW编码是字典方法的一种, 其最早是由LZ77以及LZ78发展而来[5]。LZW编码的主要原理是利用字典把每个字符串编码为1个标识, 在此基础上, 找出重复出现的编码字符, 并且以标识来代替字符串, 在最后达到压缩的目的。总而言之, LZW编码的基本原理是通过字符的读取, 一旦在字典中找到适合的匹配, 自然也能够用字典复制代替找到的字符, 在完成此种工序后把字符加入到字典中读出下一个相关的字符, 并且直到循环结束才完成此项工作。

基本的编码流程表现在以下几个方面:

初始化的字典常常使用8位字符, 置码字CODE, 搜索字S;

在编码器内输入下一个字符F, 输完之后则停止;

S=Sc, 将字符c串接在S后;

搜索字符S, 成功结束后则转向;

输出CODE, 将Sc添加到字典中去;

S=CODE转到编码器内输入下一个字符F, 输完之后则停止。

从上述具体步骤来看, 字典质量的高低决定了压缩效果的质量高低, 简而言之字典中的词条越短则压缩比就会越低, 总而言之, 加大字典的压缩容量就能够加大压缩比但是字典的容量。从另外一个角度来看, 字典中的容量会受到计算机内存的限制, 而字典也存在被填满的可能性, 因此当字典不能再加入新的词条之后, 旧的字典则很难保证比较高的压缩比。

3.2 HUFFMAN编码

HUFFMAN编码属于统计压缩方法 (此方法采用的是变长编码) , 长编码是出现概率最小的符号, 短编码是出现概率最大的符号, 继而能够使得其平均编码实现压缩。HUFFMAN编码的主要流程体现在以下几个方面: (1) 统计灰度频率; (2) 建立灰度序列表W; (3) 在W序列中选出最小的概率。

4 结束语

综上所述, 数字图像技术应用无损压缩模式中的可逆整数小波变换方法是最理想的。除此之外, 由于每种方法都有其特点, 所以应该根据图像的具体特点来进行相关选择, 以期能够达到最好的应用效果。

参考文献

[1]路建方, 王新赛, 贺明等.基于ADV212芯片的红外视频无损压缩研究[J].红外, 2013, 34 (1) :2001-2004, 1000.

[2]王春洁, 沈燕飞, 卢毓海等.无损压缩中基于块的梯度预测模式[J].计算机工程, 2013, 16 (6) :2900-2904, 1211.

[3]周雨田, 左芝勇, 张天序等.基于空间-时间多预测模式的无损压缩方法[J].计算机与数字工程, 2015, 11 (8) :1481-1485.

[4]罗坚, 赵苏璇, 姜勇强等.气象格点资料的准无损压缩方法[J].数据采集与处理, 2011, 26 (3) :3200-3205, 1244.

计算机数字压缩安防监控系统 篇6

在社会经济快速发展所带来的市场繁荣的同时, 社会治安的形态也逐渐在发生改变。当前, 在科学技术的不断进步与发展中, 各种犯罪活动也呈现出一种隐蔽性强、智能化水平高、行动速度快的态势。为了有效控制犯罪活动的发生, 确保人们生命财产安全, 加强安全防范措施建设, 是社会治安所面临的重大问题, 同时也是重大考验。

面对各种犯罪方式与手段的日益科技化与智能化, 传统的电视监控技术以不能满足安防措施的需要了, 这时, 计算机数字压缩的安防监控系统成为了人们所急切需要的安防技术。从社会生产与生活的各个领域中, 我们可以看到, 这种安防技术已被广泛地使用, 而且, 在其中也发挥出了应有的作用, 成为现代安防措施中重要的安防技术之一。

2 计算机数字压缩安防监控系统的使用特点概述

2.1 高新、高质的视频监控技术

与传统的电视监控相比, 计算机数字压缩安防监控系统的使用过程中, 并不需要监视器、录像带、录像机等设备设施作为辅助工具。它完全是独立工作的, 仅仅只需要一台电子计算机, 并安装必要的软件与硬件系统。通过这样的方式就可以组建成一套高新、高质的视频监控系统。对于它的更新工作而言, 也是随着计算机的不断更新而更新, 随时都可以把自身的巨大功效给发挥出来。该视频监控系统完全是处于一种独立运行的工作状态, 只要保持电源的正常开启, 就可以实行无人值守的手段, 自主地进行监控。在此过程中, 它省去了大量的值班时间, 既减少了人力的使用量, 也减少了录像带的消耗量, 大大提高了工作效率。

2.2 现代科学技术的广泛应用

在计算机数字压缩安防监控系统中, 它所采用的是先进的计算机数字压缩技术, 所以, 其中的图像输出也采用的是数字接收信号。对于这种数字信号来说, 它有较强的抗干扰性能, 输出图像的质量也很高, 而且接收的信号也不会受到损失, 同时, 在图像的远程输送中, 只需要采用普通的电话线或者是简单的通信渠道, 就能轻易完成。

2.3 良好的使用功效

对于计算机数字压缩安防监控系统来说, 它里面所包含的各种功能比较齐全。比如, 摄像机的启动只需要通过报警触发器, 就能轻易将画面记录在计算机里面, 实现自动存储, 同时, 图像的自动存储也是可以自动循环, 并且常年累月地不断工作。另外, 可以预先设置好时间, 发生突发事件之后再启动报警器, 在这种情况下, 系统已经将这个过程中所发生的所有事情都记录下来了, 而且完好地保存在计算机硬盘里面。该系统所提供的画面效果非常好, 分辨率也比较高, 同时, 软件还能对系统所记录保存的视频进行有效地自我改进, 包括放大、缩小、回访、快进等等。

2.4 高效的安全性能

该计算机数字压缩安防监控系统可以在具体的使用之前设置好密码, 这样就可以有效防止内部人员对已经记录保存好的视频、图像进行改动, 所以, 它有良好的安全性能。

3 记录方式的具体操作

3.1 开机

在计算机数字压缩安防监控系统完成开机之后, 它就直接进入到了监控的状态, 而这时, 计算机的屏幕上可以最多显示32个不同摄像机所拍摄出来的视频与图像。当系统已经记录好了摄像机所拍摄下来的画面时, 它可以自动地存储到计算机的硬盘中去。同时, 在系统的运行中, 可以对事件的日期与时间作出相应地调整, 以适应每个摄像机的拍摄需要。

3.2 设置

对于每一个摄像机的设置来说, 可以针对具体的要求来设置它的扫描顺序, 对于有的画面可以优先调出。当然, 在设定扫描所需要的速率时, 可以从客户的具体需要出发, 具体问题具体分析。对于摄像机所录制的日期与时间来说, 可以设置成不同的形式, 比如工作日和节假日的区别等等。而对于摄像机在计算机屏幕上的数量, 也可以根据具体的需要随意设置。对于报警的优先级以及报警之后的画面捕捉塑速率, 同样也可以根据具体需要来设置。视频的监控人员在具体的操作中, 既可以观看所有摄像机所拍摄的画面, 也可以只针对某一台摄像机的拍摄画面进行观看, 同时, 也可以根据需要来设置摄像机的拍摄角度与拍摄焦距。通过对系统进行一定的设置之后, 用户并不需要在发生突发事件时, 立即按下报警器按钮, 因为在此过程中, 系统会对整个报警前后的画面进行全面地扑捉, 用户只需要在数据库进行查阅, 就可以获得想要的信息了。鉴于各用户对系统安全保密性能的需要, 可以在系统中预先设置好密码, 除非经得管理员本身的同意, 其他人员无权删改, 也无法进入到系统中去, 同时, 密码设置之后, 还可以设置进入系统的优先等级和使用的权限等等。一旦系统被设置了密码, 各种视屏与画面的提取与观看都要在密码的操作下才能完成。这样的做法能够有效提高系统的安全保密性能, 防止内部人员地删改。计算机记录保存的报警视频与画面, 在硬盘的自动循环中是不会被删除的, 同时还会用红色的感叹号对它做好标记。该系统在远程的信息输送中, 只需通过普通的电话线与简单的通信渠道与远端的计算机取得连接, 就可以轻易地完成。比如把本机的工作状态自动传送到远端的计算机上面去。同时, 在此过程中, 也可以让远端的计算机通过密码进入到本计算机的系统中去, 以便随时取得想要的信息, 或者是进行系统的更新与升级等等。

4 回放方式的具体操作

1) 在计算机上, 可以根据已经记录保存好的文件菜单, 进行多层次、多角度的检索操作, 比如某个时间段之内的视频与画面、某台摄像机的视频与画面或者是某台摄像机, 某个时间段之内的视频与画面。

2) 计算机在对文件的记录与保存中, 其存储的方式可以分为两组, 即系统正常运行中的无终止循环储存和报警状态下的文件储存。

3) 用户在选择了自身想观看的视频与画面信息之后, 计算机的屏幕上将会出现第一帧画面, 这样, 用户可以针对自身的需要, 从工具栏中来选择观看的模式, 顺序或者是倒序。

4) 在计算机数字压缩安防监控系统中, 可以同时打开两个窗口, 用以比较同一摄像机在不同时间内的拍摄情况, 或者是不同摄像机在相同时间内所拍摄的情况, 这样就可以形成良好的对比形式。

5) 想对计算机中所有储存的图像与视频进行快速的再现, 可以通过外接设备的事件查祥来完成。同时, 系统中所包含的特殊处理器, 可以根据用户的实际需要, 多视频与画面进行放大、缩小、编辑、检索等等, 这样就可以获得更好的识别效果。

6) 对于用户所需的视频与画面, 可以采用压缩或者非压缩的形式, 把视频与画面存储在软盘上, 再通过视屏打印机将其打出。

5 结束语

随着社会经济的不断发展, 计算机数字压缩安防监控系统已经被广泛运用到生产与生活的各个领域, 而且该系统也在其中日益发挥着不可替代的作用, 成为现代安防措施中重要的技术手段。

参考文献

[1]赵深茂.计算机数字压缩技术初探[J].硅谷, 2011 (3) .

[2]侯晓华.计算机数字艺术[J].科技视界, 2012 (30) .

[3]刘淑萍, 刘建平.地测计算机数字化制图分析[J].计算机光盘软件与应用, 2012 (20) .

[4]孙娜, 任爱华.浅谈计算机数字化绘测技术的应用[J].计算机光盘软件与应用, 2012 (17) .

数字压缩 篇7

1 对高清数字电视视频压缩编码的概述

在对高清数字电视视频压缩编码色度采样为例进行概括, 我们对高清数字电视视频压缩编码技术有效研究的目的是更新视频压缩标准, 用新的压缩标准来满足宽带传输高标准要求, 这样可以提高数字电视画面的分辨率。我们在平时用电视在接收4K信号图像的时候, 这个时候我们电视接收到的这个信号图像, 它的用一个原始数据率, 通过原始数据率我们可以归总出来一个结果:2.78Gbit/s。假如我们接收到一个8K的图像信号, 它相应的也应该有一个原始数据率, 这个原始数据率是11Gbit/s, 我们在运用传统的视频压缩标准的时候, 在一定程度上我们用H.264的形式对4K进行模式图像, 然后对其开始压缩, 在对4K图像进行压缩的时候, 它的压缩量会变小。这样的话就不能满足视频图像处理要求, 但是这种压缩方式对宽带传输有很大的要求。降低宽带传输时的限制要求, 世界研究人员经过精心的研究, 研究出了HEVC技术, 它是从264/AVC新一代视频编码技术, 它的主要功能是在对其压缩的时候, 这样电视会给电视一个很好的视频压缩效率, 它与原来的视频图像压缩效果相比不仅性能提高了, 而提高了一倍。所以, 它在领先于其他编码技术的同时, 也在高清电视压缩技术上取代了传统视频编码技术。

2 电视压缩编码技术

2.1 HEVC编码结构技术

电视编码技术主要是HEVC编码技术, 它采用的是H.264中的编码框架, HEVC编码采用H264的同时在内容结构上也运用先进的技术得到了更新, 让他在性能上更具有应变度。有关人士通过研究, 在HEVC编码技术的基础上通过精心研究, 发明了新型的, 在新能上更具优势的超大尺寸的编码结构, 该编码还加入了三种不同的结构方式, 并且还运用这三种方式来进行有效的分隔、编码, 这样做的好处是很大程度上保障了的编码压缩后的效果。还有就是HEVC编码技术在结构上要比H.264编码结构很大程度上大很多。有了HEVC编码结构, HEVC编码结构中的CU代表的是编码单元, CU的内部结构方式和整体上的结构是相同的, 在整个CU编码中, 最大的CU是64×64, 最小的CU甚至可以达到8×8。这就说明了划分出的CU单元它的形状应该都是正方形。TU的作用和CU相关, 它的功能是是对预测CU。TU在预测CU时, TU单元的大小要小于CU的大小, 在划分中可以成为任何形状, 完全不受限制。

2.2 帧内预测编码技术

HEVC不单单是只有压缩编码的功能, 它还有帧内预测编码的技术, 就是可以对高清电视视频进行编码。它的这种功能, 也是在H.264编码技术的基础上发展出来的。在HEVC帧内预测编码技术中, 在HEVC编码中, 预测单元的PU大小是不相同的, 他们的分布分别在一个规中规矩的位置。但是在实际预测的过程中, HEVC对大小不同的PU提供出了相应的非方向性预测方法, 并且它还为此提供了多方向性帧内预测的有效方法, 很好的为PU预测单元操作成功提供了有利条件。

2.3 编码环路滤波技术

提到环路滤波技术, 我们就必须要提到SAO了。SAO在类型方面有两种类型:一种是带状补偿;另一种是边缘补偿。边缘补偿是把一种像素和它旁边的像素, 两者充分的进行优势对比, 完成之后, 要把像素分类标识的方法进行合理的分类。解码的过程应该根据对应的分类标识有效的补偿。各个模板只对相邻的像素产生相比较现象, 因此在实际操作的时候非常简单。LCU能够在一定环境下进入独立解码状态, 在顶行和底行的LCU像素一般不对模板进行有效处理;根据这个现象我们可以看出, 任何一个LCU的左右两列, 它们的像素也不对模板进行信息处理工作。一般重建图像很容易在一定环境下失真, 为了避免这种失真现象进一步发生, 科技人员用HEVC引入了一项自适应环路滤波器技术。这种技术是采用了一种叫树形的自适应环路滤波器, 科技人员采用这种形式的滤波器主要是为了防止编码图像产生噪声。自适应环路滤波器对于亮度分量来说, 滤波器在形状上是以点对称的二维滤波器;在色度分量上, 滤波器形状又变为一个正方形点对称矩形二维滤波器。

3 结语

高清数字电视在技术已经发展到领先地位, 在短时期内不会有更新的产品, 但是IVIPEG2在数字电视上还会起很长时间的作用。高清数字电视内部结构标准有很大的开放性, 所以它有非常广泛的应用, 在高清数字电视方面有很大的竞争力。它在很长一段时间内不管是在多媒体领域还是在移动视频领域都会有个一很好的前景。

参考文献

[1]王玉柱.浅析超高清数字电视视频压缩编码技术[J].黑龙江科技信息, 2014, (4) :17.

[2]李强, 贺晓华.数字电视视频压缩标准[J].湖南人文科技学院学报, 2006, (3) :82.

数字压缩 篇8

脉冲压缩体制在现代雷达中被广泛采用,通过发射宽脉冲来提高发射的平均功率,保证足够的作用距离;接收时则采用相应的脉冲压缩算法获得脉宽较窄的脉冲,以提高距离分辨力,从而能够很好地解决作用距离和距离分辨力之间的矛盾问题[1,2,3]。

线性调频(LFM)信号通过在宽脉冲内附加载波线性调制以扩展信号带宽,从而获得较大的压缩比。所需匹配滤波器对回波信号的多普勒频移不敏感,因此LMF信号在目前许多雷达系统中仍在广泛使用[4,5]。

本文基于快速傅里叶IP核可复用和重配置的特点,实现一种频域的FPGA数字脉压处理器,能够完成正交输入的可变点LFM信号脉冲压缩,具有设计灵活,调试方便,可扩展性强的特点。

1 系统功能硬件实现方法

该系统为某宽带雷达系统的数据采集和数字脉冲压缩部分。系统要求在1个脉冲重复周期(PRT)内完成距离通道的数据采集及1 024点的数字脉冲压缩,并在当前PRT将脉压结果传送至DSP,其硬件结构如图1所示。

数据采集系统主要包括前端的运算放大器和模/数转换器。运算放大器选用ADI公司的AD8138,将输入信号由单端转换为差分形式以满足ADC的输入需求,并且消除共模噪声的影响。模/数转换器选用TI公司的ADS5500,具有14 b的分辨率和125 MSPS的最高采样率,用来对输入LFM信号进行60 MHz的高速采样。

数字脉冲压缩模块在FPGA中实现,FPGA选用Xilinx公司的XQ2V1000芯片。在对输入采样数据进行脉冲压缩后,结果存储于FPGA片内的双口RAM中,并向DSP发送中断信号。DSP在接收到中断信号后读取RAM中的脉压数据进行主处理。

2 脉冲压缩模块的设计和实现

2.1 脉冲压缩原理

数字脉冲压缩技术是匹配滤波和相关接收理论的实际应用,频域的匹配滤波等效于时域的相关接收。基于匹配滤波理论实现数字脉冲压缩的原理如图2所示。

图2中θ(f)为发射信号的非线性相位谱,接收的回波信号在经过匹配滤波后,非线性相位谱得到校正。输出的窄脉冲为:

y(t)=-+|Η(f)|2ej2πftdf

匹配滤波器有一个重要的特性:对波形相同而幅度和时延不同的信号具有适应性。也就是说,与信号s(t)匹配的滤波器,对信号αs(t-τ)也是匹配的。回波信号s(t)在波门中的位置反映在脉压结果峰值出现的位置,这也是利用雷达脉冲进行测距的主要依据[6]。

2.2 脉冲压缩原理

脉冲压缩模块包括FFT与IFFT单元、复数乘法单元以及存储单元,其结构框图如图3所示。其中,FFT和IFFT单元是通过复用Xilinx公司提供的快速傅里叶变换IP核来实现的,而硬件乘法器则为复乘提供了解决途径。

采样数据首先存入FIFO中进行全局缓存,然后FFT单元从FIFO中读取采样数据,紧接着进行FFT运算,结果在流水输出时直接与匹配滤波器系数相乘,并将运算结果写入块RAM1中,最后IFFT单元从块RAM1中读取复乘后的数据进行IFFT(复用FFT运算IP核)运算,结果写入块RAM1后发送中断信号,等待DSP读取。

2.2.1 FFT处理单元的硬件复用

在系统中FFT处理单元通过使用软核Fast Fourier Transform v3.0来实现的。该IP核提供3种结构选择:

(1) 管线级,数据流水I/O。这种结构将若干基-2蝶形单元级联起来,使得数据的输入、计算、输出可以流水进行,从而可以达到很高的处理速度,但资源消耗较大;

(2) 基-2,最少资源消耗。这种结构采用单个基-2蝶形单元对输入数据进行变换,运算消耗的时间较长;

(3) 基-4,突发I/O;这种结构采用单个基-4蝶形单元对输入数据进行变换,并利用块RAM来存储旋转因子,占用系统资源较少,在1个PRT内可以完成脉压结果的输出,从而在资源和速度这两者之间达到很好的平衡,也是设计中实际采用的结构。

FFT处理单元主要包括2个过程:数据I/O和运算过程,但两者不是流水执行的。FFT启动信号有效后,数据开始进行装载,装载完成后开始进行FFT运算;等待运算结束后,结果才可以输出。在运算过程中,不发生数据的装载或输出。

在数字设计中,FFT和IFFT处理单元时可以采用相同的结构来实现的[7]。具体的方法是:在做IFFT运算前,先交换输入数据的实部和虚部,然后送入FFT处理单元按照FFT的结构进行运算,并交换FFT运算结果的实部和虚部,最后除以运算点数N,就可以得到IFFT的运算结果。

该IP核基于上面的方法同时具有进行IFFT运算的功能,通过实时配置端口FWDINV上的电平可以实现复用,分别完成FFT和IFFT运算。在FPGA设计中,利用结构复用减少逻辑单元块,不仅可以节约系统资源,而且能够减少结构间的硬连线及传输线时延,有利于提高系统的工作频率。

2.2.2 脉冲压缩模块的时序设计

由于FFT和IFFT的逻辑运算功能已经在IP核中实现,因此时序设计便显得尤为重要。在FFT(或IFFT)运算单元中,主要的状态与时序控制信号及其功能描述如表1所示。

在采样距离门有效期间,将样本数据写入FIFO中进行缓存。采样结束后,通过FFT单元的写使能信号(NFFTWE和FWDINVWE)将NFFT = 01010及FWDINVWE=1写入状态控制寄存器设定工作模式,接着启动START信号进行FFT运算,写使能信号与START之间仅差1个时钟周期。运算结束后,DONE信号有效1个时钟周期,输出使能信号UNLOAD与DONE同步,经过7个时钟周期后数据有效信号DV开始有效,FFT运算结果开始流水输出,同时与匹配滤波器的系数相乘,并存入RAM中。由于乘法运算的固有延迟,写使能RAMEN延迟DV信号2个时钟周期。存储结束时,IFFT单元的写使能信号同时有效,并设定NFFT=01010及FWDINVWE=0,接着启动START信号进行IFFT运算。运算结束后,DONE信号(与UNLOAD同步)再次有效,IFFT运算输出结果在DV信号有效期间直接写入RAM中。单个PRT内各控制信号的具体时序说明如图4所示。

2.2.3 块浮点数据格式

在数字信号处理系统中,数据表示格式可分为定点制、浮点制和块浮点制,它们在实现时对系统资源的要求不同,工作速度也不同,有着不同的适用范围。定点表示法使用最多,简单且速度快,但动态范围有限,需要用合适的溢出控制规则(如定比例法)适当压缩输入信号的动态范围,但这样会降低输出信号的信噪比。浮点表示法的优点是动态范围大,可避免溢出,能在很大的动态范围内达到很高的信噪比,主要缺点是系统实现复杂,硬件需求量大,成本和功耗高,而且速度较慢[8,9]。

块浮点表示法兼有定点法和浮点法的某些优点,是以上2种表示法的结合[10]。这种表示法首先对一组数据进行检测,归一化最大数的小数部分,再建立适当的指数。接着把剩下数据的小数部分转化为合适的数,使它们可以使用最大数的指数。块浮点算法的主要优点是:大动态范围、低截断(或舍入)噪声,是一种有效的数据表示形式。从芯片实现角度上看,块浮点表示法能够保证较高的信号处理质量,尤其适用于FFT运算的场合。脉压模块中的FFT核带有块浮点运算的功能,整个运算过程中的数据格式表示如图5所示。

ADC输入数据为14 b的二进制补码形式,对其低位补零扩展为16 b(IP核要求的输入精度)后送入FFT运算单元,输出结果为16 b的定点数以及指数EXP1。复乘包括乘法和累加运算,即FFT结果与匹配系数进行16 b×16 b的乘法运算,所得结果再进行加法运算;在进行加法运算前,所有数据扩展为33 b以防止溢出的发生,最终数据截取高16 b送入IFFT处理单元,输出为16 b的定点数和指数EXP2,将其与EXP1相加后得到指数EXP。脉压的最终结果即为IFFT后的16 b定点数以及指数EXP,两者分别存储在FPGA片内RAM中。

2.3 脉冲压缩模块的测试

设输入理想LFM信号参数如下:带宽B=40 MHz;时宽T=6 μs;系统样本速率为60 MHz;使用海明窗加权。在上述条件下,脉冲压缩系统的输出结果对数图如图6所示。

在图6中,横轴代表距离采样单元,即系统最小距离分辨率。通过系统实际处理结果与Matlab仿真结果的对比验证了设计的正确性和实用性。

3 结 语

系统采用ADS5500完成14位、60 MSPS的数据采集,并在FPGA中实现1 024点的数字脉冲压缩。设计采用并行流水方式提高工作速度,而块浮点算法则充分保证运算的精度。IP核的复用大大降低硬件规模,从而使整个系统具有高速度、高精度和低功耗的特点。

参考文献

[1]张明友,汪学刚.雷达系统[M].2版.北京:电子工业出版社,2006.

[2]宋晓风.数字脉冲压缩技术在雷达中的应用[J].现代电子技术,2009,32(12):118-120.

[3]唐宇,王洪,韩雁.脉冲压缩雷达提高距离分辨率的仿真研究[J].中国雷达,2007(1):27-31.

[4]杨立柱,郭英,齐立峰.脉冲压缩雷达系统分析与仿真研究[J].现代防御技术,2007,35(3):90-94.

[5]韩放,谢红,孙巍.LFM脉冲压缩技术仿真研究[J].信息技术,2007(4):103-105.

[6]侯民胜,金梅.线性调频信号的匹配滤波处理[J].电子测量技术,2008(8):123-125.

[7]熊吉,赵刚.基于FPGA的可变点数数字脉冲压缩处理器的实现[J].通信与信息技术,2008(3):176-179.

[8]王超,田黎育,高梅国.基于FPGA的高速数字脉冲压缩[J].计算机工程,2008(4):75-78.

[9]徐玉芬.现代雷达信号处理的数字脉冲压缩方法[J].现代雷达,2007,30(7):156-159.

上一篇:气韵下一篇:乡村空间格局