信息论与编码

2024-07-02

信息论与编码(共12篇)

信息论与编码 篇1

(一)引言

《信息论与编码》是由Shannon奠基的一门信息及数学学科,是电子信息、通信工程及应用数学专业的专业基础课。通过该课程的学习,学生能够对信息论有一个比较全面和系统的了解,要求学生掌握信息论的基本理论和概念,如熵、互信息、自信息量等,掌握信息的统计度量,以及离散信源和离散信道有关信息理论,掌握信源编码方法,如Huffman编码、算术编码等基本原理和具体实现方法,使学生能够把理论知识与日常生活结合起来,做到活学活用。然而,在授课过程中存在许多问题:首先该课程中的许多理论知识以及公式的证明过程用到了很多随机信号及概率统计方面的数学知识,这些知识对于水平参差不齐的本科生来是说,存在一定的困难;其次,该课程内容较多、前后知识联系紧密,且比较抽象,如果前面的知识没有完全理解,后面的理论也就很难懂,形成恶性循环现象。正是因为存在这些问题,使得教学很难达到理想的效果。针对这种情况,对该课程的教学进行了探讨,提出了几点具体教学方案,实践证明可以达到良好的效果。

(二)信息理论与编码教学方案

1. 在授课开始时让学生明确课程研究的主要内容及实质。

信息论对许多人来说都是比较抽象陌生的,因此在课程的第一节课时,首先,要让学生明确课程所研究的主要内容及实质,即信息论研究的对象及内容是整个通信系统模型,而研究的实质是信息如何在整个通信系统中传输和转换,里面的每个章节都是研究通信系统中的某一模块的具体内容。其次,把课程在实践中是如何体现的给学生讲清楚,这就要求教师多收集一些实际生活中与通信系统模型及信息论相关的具体例子,让学生明确学习的用途以及与自己所学专业的联系,突出了信息理论与编码这门课程学习的必要性。

2. 在授课过程中始终贯穿一条主线,由整体到局部,再由局部到整体。

信息论研究的对象是通信系统模型,重点讲述的是数字通信,所以一般针对数字通信系统模型来讲解(见图1),给学生明确消息是如何在数字通信系统中传输的,在传输过程中大致都经历了哪些具体变化,把数字通信系统的每个模块的功能讲清楚,从整体上描述消息是如何承载着信息在整个通信系统中传输的。在后面章节的学习中,让学生明白该章在整个通信系统中处在哪一模块,主要完成什么功能,具体实现该功能又经过哪些环节。如在讲信源这章时,必须明确信源是消息的发出者,根据信源发出的消息的不同又可以把信源分为很多种:单符号离散信源,平稳信源、马尔可夫信源等,研究在各种信源的情况下,如何对信源分类,如何度量信源发出的消,所含的信息量,然后再分开讲解。在授课过程中要不停的提醒学生所讲内容在整个通信模型中的位置以及作用,做到从整体到局部,再从局部到整体,并且始终贯穿信息传输这条主线。“保真度准则下的信源编码定理”中:“在信源给定,且又具体定义了失真函数以后,我们总希望在满足一定失真的情况下,使信源必须传输给收信者的信息传输速率R尽可能地小”,并由此引出R (D)。如何让学生更深刻的理解其中的含义,这就要从整个通信系统考虑了。

在信息论这门课的第一章中已经对学生很清楚的介绍了消息是如何在图1所示的数字通信系统中传输的了,他们对这个模型已经有了很深刻的理解,但是如何把这个模型和信息率失真函数联系在一起,这就要从通信的实质上来理解。通信的实质是信息的传输,信源发出消息后在数字通信系统传输,消息中携带着信息,而消息不一定适合在该模型的各个环节中传输,为了达到有效而又可靠的传输信息的目的,就用到了信源编码和信道编码两个模块,信源发出的消息总体含的信息量可以认为是H (X),信息在传输的过程中不会增加,只会减少或者不变,但是消息在整个通信过程中可能会混入一些噪声,所以站在信宿的角度来看,信宿收到的消息中含有一部分信息,而有一部分信息可能损失掉了,损失掉的信息即H (X/Y),而噪声叠加的一部分熵为H (Y/X),所以信宿实际得到的信息量为信宿总的信息量减去噪声引起的那部分信息量,也可以是信源发出的总的信息量减去损失掉的信息量,即H (X)-H (X/Y),或者H (Y)-H (Y/X),这就是信宿得到的关于信源的信息量,即平均互信息I (X;Y),让学生深刻理解信息的传输过程并掌握信源熵与噪声熵、损失熵以及平均互信息之间的联系,信道容量以及平均互信息实际上与信道的信息传输率是联系在一起的,平均互信息的大小直接反映了信道的信息传输率,而信息率(下转第189页)(上接第200页)失真函数与平均互信息有密切关系。信源编码的目的是提高通信系统的有效性,而这种有效性是靠对信源输出的消息进行压缩来实现的,即通过减少冗余来达到有效的信息传输,若给定失真度D,在保证失真度小于D的情况下对信源压缩的越大,则信息传输效率就越高,此时信源熵就越小,最后信宿得到的平均互信息就越小,也就是信道的传输率就越低,而信源压缩后的熵实际就是信息率失真函数的大小,即R (D)。这样不仅解释了该节中提到的那句话,由此也引出了信息率失真函数的物理意义以及与其他参量之间的关系。

3. 避开烦琐的公式证明,从物理意义的角度出发,用具体实例来讲解基本理论。

信息论中的主要内容一般都是看不见摸不着的,是比较抽象的,并且一些定理及公式的证明过程都是应用随机过程及概率统计的知识证明的,学生学起来非常困难。为了使比较抽象难懂的知识变的生动形象,而且让学生容易理解且不容易忘记,唯一的方法就是在授课过程中穿插一些趣味性的和学生生活贴近的例子,用这些例子来讲述基本原理,通过这些例子来激发学生的学习兴趣同时调节课堂气氛。教师在举这些例子的时候可以采用提问、启发、讨论或者作业等多种形式进行。例如:可以把教师授课、学生听讲的过程抽象成一个通信系统模型,让学生自己讨论在整个授课环节中,哪些环节对应信源、哪些环节对应编码,谁是信宿、什么是信道,信息是如何被学生接收的,为什么老师经常重复某些知识点,等等,这些提问都可以让学生把最常见的事情抽象为信息论里面的相关知识点。另外学生打手机或者打电话、通过QQ聊天,这些都是很好的实例并且是学生经常做的事情,体会起来也就很深刻,同时还可以让学生了解一些枯燥的理论知识在实践中是如何应用的,使学生有学以致用的感觉。

4. 最后进行综合复习,把知识点再重新串起来。

学习完任何一门课程不管是教师还是学生都有一种如获释重的感觉,此时有些学生可能根本不知道该课程讲了些什么,到底有什么用途,这时就需要教师带领学生对该课程有一个综合的复习过程,复习的重要环节就是把课程的知识再重新串成一串,就象穿珍珠似的,要有一条主线,而主线中的每颗珍珠所对应的内容要让学生清楚的理解并掌握,这样就可以做到前后呼应,从整体到局部,最后又从局部回到了整体。使学生有个系统的认识。

(三)结论

《信息论与编码》不管对于研究生还是本科生,都是比较抽象且难理解的,要想让学生真正掌握其中的精髓,深刻理解课本上的知识并灵活运用到实践中,确实不是很容易的事情,因此,广大教师还需要不断努力,探索更好更有效的教学方法。

摘要:为了适应信息与通信技术的飞速发展, 许多高校本科生开设了“信息论与编码”这门比较抽象难懂的课程, 文章针对该课程在教学中存在的问题, 提出了几点教学方案, 不仅提高了学生的学习兴趣, 而且使学生有学以致用的感觉, 为以后的工作打下坚实的基础。

关键词:信息率失真函数,信息,信息论与编码

参考文献

[1]傅祖芸, 赵建中.信息论与编码[M].北京:电子工业出版社, 2006.4.

信息论与编码 篇2

一、设计目的

通过课程设计使学生更进一步掌握信息论与编码课程的有关知识,提高编程的能力,并将所学的内容加以综合。通过查阅资料,了解所学知识的应用情况。同时也使学生通过动手进行程序设计从而提高解决实际问题的能力。

二、课程设计要求

1、认真查阅资料

2、遵守课程设计时间安排

3、按时上机,认真调试程序

4、认真书写报告

三、报告书写格式

1、课程设计封面

2、课程设计任务书

3、正文

4、参考文献

5、课程设计成绩报告单

四、设计题目

1、符号信源熵的求解

给定信源各个符号发生概率,条件概率,编程求解各个符号的自信息量和信源的熵,条件熵,联合熵。

2、图像信源熵的求解

读入一幅图像,编程实现求解图像信源的熵。3、互信息的求解

已知信源发出x的概率,及接收到y后的x的后验概率,编程实现互信息、平均互信息的求解。

4、唯一可译码的判断

总结唯一可译码的概念与判断方法,编程实现:给定码字,判断是否为唯一可译码。5、即时码的构造与判断

总结即时码的概念与判断方法,编程实现:构造给定码长的即时码;给定码字,判断是否为即时码。

6、Kraft不等式的分析与判断

编写程序,给定信源符号个数,码元进制数和码长,判断唯一可译码是否存在。7、香农编码的分析与实现

给定信源各个符号及其发生概率,编程求解其香农编码的码字,平均码长,及编码效率。8、费诺编码的分析与实现

给定信源各个符号及其发生概率,编程求解其费诺编码的码字,平均码长,及编码效率。9、用香农-费诺-埃利斯编码的分析与实现

给定信源各个符号及其发生概率,编程求解其香农-费诺-埃利斯编码码字,平均码长,及编码效率。

10、哈夫曼编码的分析与实现

给定信源各个符号及其发生概率,编程求解其哈夫曼编码码字,平均码长,及编码效率。11、LZW编码的分析与实现 12、算术编码的分析与实现

13、线性分组码的编译码的分析与实现

14、对称信道容量的求解

给定信道的概率矩阵,编程判断其是否为对称信道,并求解其信道容量 15、准对称信道容量的求解

给定信道的概率矩阵,编程判断其是否为准对称信道,并求解其信道容量 16、信道容量迭代算法的分析与实现 17、率失真函数R(D)的计算

说明:

(1)课程设计的题目共17个,一个班一个题目最多供6人选。

(2)课程设计说明书一般应包括理论分析与仿真,编程语言可自行选择,说明书字数在3000字左右;

(3)把任务书信息补充完整,参考文献可更改,设计的内容细节和具体要求可以和指导老师协商后,有所更改。

(4)多人做一个题目时要有不同的分工或侧重点,写出的课程设计说明书不能雷同,如重复率超过50%,同组人均不能通过。

五、时间安排

1、查阅资料及程序设计(4天)

2、上机调试程序(4天)

3、书写报告(2天)

六、成绩评定

1、未完成设计任务,没达到设计要求则成绩为“不及格”。

2、基本完成设计任务,并撰写出课程设计报告则成绩为“及格”。

3、学生能够认真查阅资料,独立完成设计任务,程序调试通过,并且撰写出课程设计报告则成绩为“中”。

4、学生能够认真查阅资料,独立完成设计任务,程序调试通过,功能完善,操作灵活,界面美观,并且撰写出课程设计报告则成绩为“良好”。

5、学生根据自身的实际能力,在实现设计题目基本要求的基础上增加一些功能,评定成绩时根据其难度和完成情况给与适当加分,如界面效果,系统操作的方便性、灵活性、创新性等,如果设计非常完善则成绩为“优秀”。

信息论与编码 篇3

关键词信息;信息的编码;教学实践

“信息的编码”是浙教版的《高中息技术基础》(必修)教材中第一章第二节内容,信息技术是对信息进行采集、处理、传输、存储、表达和使用的技术,要是用计算机对信息进行处理,必须把待处理的信息(数字、字符、汉字、声音、图像等)用二进制进行编码,即对信息进行数字化。通过对信息编码的学习,初步了解数的编码、字符编码和多媒体信息编码的基本原理,从而揭开电脑工作的神秘面纱,激发学生深入学习信息技术知识的兴趣和强烈的求知欲,也激励学生不断向高科技挑战。

一、信息的编码简介

信息的编码这节课是一堂纯理论课,原理很抽象,对于学生来说是难以理解的。如何化抽象为形象,使学生更容易理解是一个关键。虽然学生在初中阶段对二进制数有一定的基础,但可能已经忘记或者似懂非懂,所以总的来说学生在这方面的基础还是薄弱的,如何上好本节课。我把重点放在:1,让学生结合身份证的认识、电话号码组成等,了解用数字编码在日常生活中的实际应用。2,通过让学生了解生活中其它编码的知识,进一步体会数字与现实生活的密切联系。3,提高学生收集、分析信息的能力。4,了解为什么要对信息进行编码。5,了解二进制计数系统的特点。6,知道各种数制之间的转换方法及字符信息的编码等。

其实,说信息讲信息,在生活中编码到处可见,如:教师随便播放1、2、3、4、5、6、7这七个阿拉伯数字,可能对于不同的学生理解完全不一样,有的学生想到的数字一、二、三……七,有的学生可能想到的是乐谱中的哆、来、咪、法、……可能也会有学生想英语课的one、tow、three……;由此认为,同一种信息,对于不同的接受对象,可以有不同的识别方法。所以对于电脑这个信息接受者来讲,就需要统一的信息编码,没有信息编码系统即不能对信息进行加工,也不能进行信息的传输和存储。

人类社会所使用的语言文字就是一种信息编码,不同国家和地区对于语言和文字的表达是不同的,这种表示就是某种意义上的编码。这种编码有其共同性,所以它能被一个大的群体接受,我们将英文翻译成中文,让只懂中文的人能够接受,这种工作实际上就是把信息编码转换了。如果没有编码什么信息也不可能发挥作用。例如:在原始社会,人类祖先都是乱喊乱叫,由此这些祖先就形成一套信息交流,逐渐形成了这个社会的信息编码。那么在现代信息系统中,采用计算机和现代通信技术,也就产生了新的编码,信息编码这些编码就更加重要了,这是因为在信息系统中,有三个特点:一、人与人之间的信息传递;二、人与机器之间的信息传递;三、机器与机器之间的信息传递。由此,数字也是一种最简单的信息,所以电脑把人类的种种复杂工作最简单化了,电脑是用数字化来工作的,这是我们常常说的数字化。我们常用的计数方法是十进制,十进制的计数特点的:一、0、1、2……9十个数字组成,逢十进一;二、每个数字在十进制数中所处数位不同,其位权值也不同。生活中时间的表示就是六十进制;旧制市称使用的是十六制;生活常用的电源的通、断,脉冲的有、无。磁化的极性方向就是我们常用的二进制;生活中使用的进制很多。

二、计算机内部代码的特征及转化

在信息科技中,特别是在计算机领域,“代码”两个字具有特指性,是指由“0”、“1”两种符号组成的数字代码。因为数字计算机只能识别和处理由“0”、“1”符号串组成的代码。所以,其他信息代码都要转换成这种由“0”“1”符号串构成的代码,才能被计算机识别和处理。20世纪40年代以后,在自动控制和电子技术中大量应用开关线路,迫切需要用数学工具来处理开关线路中日益复杂的逻辑问题,进一步推动了布尔代数的发展,使其内容日益丰富。电子计算机本身是由众多的高速电子开关组合而成的。著名科学家冯·诺依曼关于电子数字计算机系统结构的经典性建议中,有一条是关于计算机内的信息,包括数据和程序都应采用二进制代码表示,这已成为业界共同遵守的标准。电子计算机将所有输入的信息(数据、程序等)都转化为机器能识别和处理的二进制数字代码。由于二进制代码中用到的只有“0”“1”两个符号,从而可以方便地用电脉、电位、电路的状态、磁化的极性方向来表示。所以在使用计算机进行信息处理时,首先要对信息进编码,把问题转化成二进制代码的计算问题。也就是说用二进制计数系统代替十进制数系统,大大减少了计算机运算和存储所需的电子元件的数量。要使计算机能够处理文字、声音、图像和视频等信息,采用正确的编码方法是首先要解决的问题之一。

三、信息编码的处理和转换

计算机内部用二进制代码可以方便地存储、处理和传送信息,我们生活中却习惯使用十进制代码。那么二进制与十进制之间是怎么转换的呢?

(一)二进制与十进制互换

例如:十进制56789.23按权展开如下:

从十进制数的动态认数过程中,发现数制的原理(或是规律)——“按权展开相加法”。也可针对二进制,提出速算法(8421法),从右到左书写……256 128 64 32 16 8 4 2 1。就是二进制转换成十进制,各个1数的对应2数相加即得对应的十进制数。例如:二进制数(100011)2转换为十制数。

(100011)2=1×25+0×24+0×23+0×22+1×21+1×20

=32+0+0+0+2+1

=35

即(100011)2=(35)10反之,十进制也可以采用相同的方法转换成二进制数。如(75)10=(100111)2

即(75)10=64+8+2+1=(100111)2

当然十进制转换成二进制也可以用“除2反序取余法”;运用计算机中的“计算器”进行进制转换操作等。同样可以利用逆向思维,得出二进制转换成十进制的速算法。

(三)提供自主探索、研究的时间

信息论与编码本科教学探讨 篇4

由于这门课程理论性强、概念抽象, 国内很多高校最初只向研究生开设此课程。随着信息技术的发展, 编码技术在移动通信、数字多媒体以及信息安全等领域得到广泛的应用, 国内许多高校将信息论与编码作为本科教学中的主干课程, 但在本课教学过程中, 存在下列问题: (1) 本课程要求学生掌握的基础知识较多, 包括概率论、数理统计、线性代数、随机过程以及通信原理等, 而国内大部分高校是把随机过程作为研究生课程来开设的, 这就导致本科学生先修知识不足, 对某些公式的证明理解起来较困难; (2) 学生在学习的过程中, 会与其他专业基础课 (如信号与系统、数字信号处理等) 进行比较, 误认为本课程对其所学专业影响不大, 以后的工作中用不到, 再加上研究生考试不需要, 所以大部分学生普遍存在不重视的心理; (3) 本课程涉及到的概念比较抽象, 公式推导比较复杂, 对于数学基础薄弱的学生来说, 学习起来比较困难, 从而产生畏学厌学的心理。

为了解决上述问题, 提高教学效果, 本文将从教材、教学内容、教学方法三方面进行探讨。

一、教材

目前, 国内外有关信息论与编码课程的教材很多, 有的偏重于理论的介绍, 涵盖的学科范围较广, 这种教材以国外教材为主, 像Thomas M.Cover Joy A.Thomas的《信息论基础》, 适合于研究生阶段来学习;有的是以通信为背景突出理论的物理含义, 这类教材国内较多, 用的较多的是姜丹的《信息论与编码》、李亦农和李梅的《信息论基础教程》、陈运的《信息论与编码》。我们根据自己专业的特点及学生先修课程的情况, 选用陈运的《信息论与编码》, 该书最大特点是把信息论涉及的数学知识限制在通信系统的范畴内, 避免了复杂的公式推导过程, 使本科学生易懂易学。

二、教学内容的选取及组织

信息论与编码这门课程的内容分为基础理论与编码两部分, 其涉及的主要内容为:信源熵、信道容量、率失真函数、信源编码以及信道编码五个基本内容。我们专业共安排了48个学时, 其中有44个学时的理论教学, 4个学时的实验教学。此外, 我们在五个基本内容的基础上, 又安排了密码学的内容。

信源熵解决了无失真信源编码的极限问题, 在信息论中占的比重较大, 这部分内容的讲解过程如图1所示。我们首先由单符号离散信源入手讲解信息量、熵的基本概念, 从消息的发送、传输及存储三个角度分析它们的物理含义, 再由单符号离散信源推广到多符号离散平稳信源。由于多符号离散平稳信源存在缺陷:只考虑每个消息 (组) 中符号间的约束关系, 没有考虑各个消息 (组) 间的相关性, 引出马尔科夫信源的概念。实际信源都可以近似成马尔科夫信源, 如数字电视信号可以看成二维的一阶马尔科夫信源, 传输过程中采用隔行隔列扫描传输。对于连续信源, 由于现在通信基本上是数字通信, 连续信号都经模数转换成数字信号, 这部分内容, 我们只讲解服从高斯分布、均匀分布以及指数分布信源的熵。

信道容量解决了信道信息传输的问题, 即信道传输一个符号所能传输的最大平均信息量, 实质上就是求解平均互信息量的最大值。在一般教材中, 互信息量及平均互信息量是放在信源熵这一章讲解的, 为了让学生更好地理解平均信息量, 我们的做法就是打乱次序, 把其放在信道容量这一章讲解, 这样可以做到主次分明, 让学生认识到平均互信息量主要解决的问题。信道容量的讲解过程相对于熵的讲解过程较容易, 只要详细讲述其概念及物理意义, 剩下的任务就是信道容量及最佳输入的求解过程。这里我们重点讲解单符号离散信道、并联信道、组合信道及加性连续信道的信道容量。

信源编码部分, 我们讲解次序是紧随信源熵内容之后。首先简单介绍变长编码及无失真编码定理, 再引入无失真编码方法———熵编码 (统计编码) 。内容上, 一般教材只是简单介绍统计压缩编码方法, 其缺点是没有消除像素间的冗余度, 由此提出变换编码的概念, 将相关冗余变为变换后的统计冗余, 由于人类存在心理视觉冗余, 采用量化手段可以消除。此处, 引入静态图像压缩标准JPEG, 重点讲解其压缩及解压缩过程, 让学生了解数码相机的压缩机理。

信道编码部分, 由于跟通信原理课程内容重合, 我们专业放在通信原理中, 这里不再表述。

信息率失真函数的求解过程涉及到变分方程, 较复杂, 这部分重点讲解其基本概念、物理含义, 简单介绍离散信源和连续信源率失真函数的求解思路, 简化其推导。

密码学的内容主要介绍古典密码学、现代密码学较经典的DES算法和RSA公钥密码算法。这里为了激发学生的学习兴趣, 我们引入了密码学在战争中和网络安全等方面的应用例子。

讲解内容经过上面的选取和组织, 避免了大量公式的推导过程, 解决了学生先修课不足的情况, 达到了良好的教学效果。

三、教学方法探讨

(一) 培养学生学习兴趣

信息论与编码理论课程理论性强, 一般的教学都是基于数学层面讲解其定理的推导过程, 学生学习起来抽象、乏味, 从而容易失去兴趣。

为了避免这种现象的产生, 授课过程中, 我们引入信息论在专业学科中的应用。如讲述注水定理时, 可以结合数字电视、第四代移动通信中OFDM调制方法的最佳功率分配。在讲述密码学时, 引入数字水印技术, 指出其在版权中的应用, 并以实际的水印例子展示给大家看。

另外, 概念讲解时, 可以举几个学生比较熟悉的例子。如平稳信源的概念, 理解起来较困难, 可以以抛硬币的例子来讲解, 任意时刻抛一枚均匀的硬币其概率分布都是一样的, 所以是平稳信源。又如数字通信过程中, 发送端输出的消息是随机的 (0或1) , 但其任意时刻的概率分布都相同, 一般情况下服从等概分布, 所以通信系统的信源也可以看成平稳信源。

这样的方法可以使学生认识到, 信息论在工程上的应用, 加深对概念的理解, 提高他们对知识的兴趣, 从而易于接受和掌握相关的思考方法。

(二) 加强师生互动

传统的教学方式是以老师为中心, 而学生是被动参与的。这样很容易造成课堂气氛沉闷, 学生产生消极心理, 教学效果差。

为了让学生很好地理解本课程内容, 我们的做法是: (1) 课前精心设计几个问题, 课堂上让学生积极参与讨论。 (2) 针对我们专业及学生后续课程的学习, 我们设计了信源编码方法研究、JPEG压缩、注水定理以及数字水印技术四个研究课题。课下, 学生分成四组讨论, 并用MATLAB工具实现这几个课题的仿真结果, 最后每组提交一个讨论报告, 报告占考试成绩的20%。这样, 学生从被动转为主动, 从“要我学”变成“我要学”, 提高了他们独立思考问题、解决问题的能力。

(三) 引入实验教学

我们实验教学共有4个学时, 安排了两个实验项目。

我们采用MATLAB软件作为实验平台。MATLAB软件简单易用, 可以利用其Simulink环境进行通信系统仿真。实验内容分别是信道容量迭代算法及离散熵曲线实验, 前者占3个学时, 后者占1个学时。要求是学生上课之前写好预习报告, 编写好程序, 上机调试修改, 实验老师检查学生的预习报告, 学生在实验后交实验报告, 占成绩的10%。

这样避免了空洞的理论讲解, 让学生从实践过程中理解概念的物理意义, 达到一定的教学效果。

(四) 采用多样的教学形式

传统的教学形式是习惯采用板书教学, 随着多媒体技术的发展, 多媒体教学已成为一种被普遍认可的教学形式, 也是现在大部分高校教师采用的教学形式。这两种教学形式各有利弊, 前者更有利于学生的理解, 后者更直观, 信息量更大, 我们在教学过程中, 进行两者结合。由于信源熵和信道容量这部分理论性强、难度大, 对于某些定理可以板书, 对其复杂的推导过程, 采用课件传授, 这样可以加深学生对定理的理解。

四、结束语

本文分析了信息论与编码本科教学过程中所面临的问题, 从教学内容与教学方法两方面进行了探讨, 教学实践表明这样做能取得更好的教学效果, 激发学生的积极性和创造性。对于本课程的教学探索还要在今后的教学工作和教学实践中深入研究, 不断完善。

摘要:信息论与编码是信息类专业的一门重要的专业基础课程。由于理论性强、概念抽象, 导致学生难学, 老师难教。本文分析了信息论与编码教学过程中存在的问题, 从教材、教学内容和教学方法上进行了探讨, 并提出一些有益的建议, 取得了良好的教学效果。

关键词:信息论与编码,教学方法,实验教学

参考文献

[1]陈运.信息论与编码[M].第2版.北京:电子工业出版社, 2007.

[2]孙龙杰, 刘立康.移动通信技术[M].北京:科学出版社, 2008.

信息论编码论文 篇5

信息论与编码

信息论概述:

信息论是运用概率论与数理统计的方法研究信息传输和信息处理系统中一般规律的新兴学科。核心问题是信息传输的有效性和可靠性以及两者间的关系。

信息论作为一门科学理论,发端于通信工程。它具有广义和狭义两个概念:

狭义信息论是应用统计方法研究通讯系统中信息传递和信息处理的共同规律的科学,即研究概率性语法信息的科学;

广义信息论是应用数学和其他有关科学方法研究一切现实系统中信息传递和处理、信息识别和利用的共同规律的科学,即研究语法信息、语义信息和语用信息的科学。

信息是事物及其属性标识的集合。

信息就是信息,信息是物质、能量、信息及其属性的标示。

信息是确定性的增加。即肯定性的确认。

当我们使用一个数据库时,总希望数据库的内容是可靠的、正确的,但由于计算机系统的故障(包括机器故障、介质故障、误操作等),数据库有时也可能遭到破坏,这时如何尽快恢复数据就成为当务之急。如果平时对数据库做了备份,那么此时恢复数据就显得很容易。由此可见,做好数据库的备份是多么的重要,下面笔者就以ORACLE7为例,来讲述一下数据库的备份和恢复。ORACLE 数据库有三种标准的备份方法,它们分别为导出/导入(EXPORT/IMPORT)、冷备份、热备份。导出备份是一种逻辑备份,冷备份和热备份是物理备份。

信息论形成和发展:

人们对于信息的认识和利用,可以追溯到古代的通讯实践。中国古代的“烽燧相望”和古罗马地中海诸城市的“悬灯为号”,可以说是传递信息的原始方式。随着社会生产的发展,科学技术的进步,人们对传递信息的要求急剧增加。到了20世纪20年代,如何提高传递信息的能力和可靠性已成为普遍重视的课题。美国科学家N.奈奎斯特、德国K.屈普夫米勒、前苏联A.H.科尔莫戈罗夫和英国R.A.赛希尔等人,从不同角度研究信息,为建立信息论作出很大贡献。1948年,美国数学家C.E.香农(被称为是“信息论之父”)出版《通信的数学理论》,1949年发表《噪声中的通信》,从而奠定了信息论的基础。20世纪70年代以后,随着数学计算机的广泛应用和社会信息化的迅速发展,信息论正逐渐突破香农狭义信息论的范围,发展为一门不仅研究语法信息,而且研究语义信息和语用信息的科学。它的建立是人类认识的一个飞跃。世界上各种事物都是充满矛盾不断发展的,物质的运动主要是靠内部矛盾运动所产生的能量,而事物之间的普遍联系则靠的是信息。信息是关于事物的运动状态和规律,而信息论的产生与发展过程,就是立足于这个基本性质。信息论迅速渗透到各个不同学科领域,但还不够完善。为了适应科学技术发展的需要,迎接信息化社会的到来,一门新的科学正在迅速兴起,这就是广义信息论,或者叫做信息科学。信息科学是由信息论、控制论、计算机、人工智能和系统论等相互渗透、相互结合而形成的一门新兴综合性学科。信息科学登上现代科技舞台,与能量科学、材料科学鼎足而立,将为科学技术的发展作出贡献。

信息论

信息论内容:

信息论内容包括信息熵、信源编码、信道编码、信道容量、信息失真率理论、信号检测和估计等。

信息量:

信息的度量是信息论研究的基本问题之一。对于应用范围如此广泛的信息提出一个统一的度量是困难的。美国数学家C.E.香农在1948年提出信息熵作为信息量的测度。根据人们的实践经验,一个事件给予人们的信息量多少,与这一事件发生的概率(可能性)大小有关。一个小概率事件的发生,如“唐山发生七级以上大地震”使人们感到意外,它给人们的信息量就很多。相反一个大概率事件的出现,如“12月15日北京未下雪”给人们的信息量就很少。因此,用I(A)=-logP(A)〔P(A)表示事件A发生的概率〕来度量事件A给出的信息量,称为事件A的自信息量。若一次试验有M个可能结果(事件),或一个信源可能产生M个消息(事件), 它们出现的概率分别为,则用来度量一次试验或一个消息所给出的平均信息量。当对数取 2为底时,单位为比特;当对数取e为底时,则单位为奈特。H的表达式与熵的表达式差一个负号,故称负熵或信息熵。

信息传输模型:

信息传输系统主要由信源、信道和信宿组成,下图为信息传输系统的基本模型。信源是产生消息的系统。信宿是接受消息的系统,信道则是传输消息的通道。图中编码器、译码器的作用是把消息变换成便于传输的形式。

信源编码:

信源是产生消息(包括消息序列)的源。消息通常是符号序列或时间函数。例如电报系

信息论

统中的消息是由文字、符号、数字组成的报文(符号序列),称为离散消息。电话系统中的消息是语声波形(时间函数),称为连续消息。消息取值服从一定的统计规律。因此,信源的数学模型是一个在信源符号集中取值的随机变量序列或随机过程。信源编码器将消息变换为一个数字序列(通常为二进制数字序列)。在离散情形,若信源产生M个可能消息,它们出现的概率分别为,每个消息由N个信源符号组成,便可取信源编码与数字序列一一对应。第i个消息对应的数字序列长(数字个数)为li,li相等的称等长编码,否则称变长编码。定义为编码速率,它表征平均每个信源符号要用多少个数字来表示。若取信源译码器为信源编码器的逆变换器,则在无噪信道(信源编码器的输出即为信源译码器的输入)情况下,消息可以正确无误地传送。这时信源编码问题是要找出最小的速率R及其相应的编码。已经证明,对于相当广泛的信源类,当N可以任意大时这个最小极限速率,称为信源的熵率,是信源的一个重要参数。对于固定的N,最优编码就是赫夫曼编码。在连续消息的情形,信息编码器不可能使消息与数字序列一一对应,因此译码也不是编码的逆变换。通常的方法是先对连续消息进行采样和量化,变为离散消息,再将离散消息变换为数字序列。信源译码器先将数字序列逆变换为离散消息,再用内插法求得连续消息。这样一来,即使在无噪信道的情况下,发送消息与接收消息之间也会产生误差,称为消息失真。可以用一个非负函数d(u,v)来度量消息 u,v之间的失真大小。这时信源编码问题是在保证平均失真不超过给定允许极限D 的条件下找出最小速率R 及其相应编码。求解这一问题导致熵推广到失真率函数,信源编码的失真率理论因而得到发展。

信道编码:

信道是传输信息的媒质或通道,如架空明线、同轴电缆、射频波束、光导纤维等。有时为研究方便将发送端和接收端的一部分如调制解调器也划归信道。信息论把信息传送过程中受各种干扰的影响都归入信道中考虑。根据干扰的统计特性,信道有多种模型。最简单的是离散无记忆恒参信道,它可以用信道入口符号集X、出口符号集Y和一组条件概率P(y|x)(x∈X,y∈Y)来描述。若信道输入信号x=(x1,x2,„,xN),则相应的输出(受扰)信号y=(y1,y2,„,yN)出现的概率为信道编码器将数字序列每K个一组变换为字长N 的信号(码字),称为分组编码。若数字和信道符号都是二进制的(可用0,1表示),则R=K/N 定义为编码速率,它表明每个信道符号表示多少个数字。N-K 称为编码冗余度。信道编码(纠错编码)的基本思想就是增加冗余度以提高可靠性。更确切地说,信道译码器可以利用编码冗余度将受扰信号变换为正确的发送数字序列。重复编码乃一简例。信道编码器将输入数字重复三次, 如将01011变换为***。信道译码器可用门限译码,即先将输入译码器的信道符号每三个一组地相加,再将结果逐个与阈值 2比较,小于阈值2的译为0,否则译为1。这样若受扰信号***虽然错了 5个符号,但译码仍为01011与发送数字序列完全相同。信息论得出的重要结论是:对于一个有噪信道,只要在信道编码中引入足够而有限的冗余度,或等价地说编码速率足够小,就

信息论

能通过信道渐近无误地传送消息。更确切地说,对充分长的数字序列,其接收错误概率可以任意小。信道编码问题是要找出使信道渐近无误地传输消息所能达到的最大编码速率R和相应的编码。已经证明,对于离散无记忆恒参信道,这个最大极限编码速率为它是对X上一切概率分布 p取极大值。p为信道转移概率(条件概率),的重要参数。

。称为交互信息;C 称为信道容量,是信道信道编码概论:

通过信道编码器和译码器实现的用于提高信道可靠性的理论和方法。信息论的内容之一。信道编码大致分为两类 :①信道编码定理,从理论上解决理想编码器、译码器的存在性问题,也就是解决信道能传送的最大信息率的可能性和超过这个最大值时的传输问题。②构造性的编码方法以及这些方法能达到的性能界限。编码定理的证明,从离散信道发展到连续信道,从无记忆信道到有记忆信道,从单用户信道到多用户信道,从证明差错概率可接近于零到以指数规律逼近于零,正在不断完善。编码方法,在离散信道中一般用代数码形式,其类型有较大发展,各种界限也不断有人提出,但尚未达到编码定理所启示的限度,尤其是关于多用户信道,更显得不足。在连续信道中常采用正交函数系来代表消息,这在极限情况下可达到编码定理的限度。不是所有信道的编码定理都已被证明。只有无记忆单用户信道和多用户信道中的特殊情况的编码定理已有严格的证明;其他信道也有一些结果,但尚不完善。

数字信号在传输中往往由于各种原因,使得在传送的数据流中产生误码,从而使接收端产生图象跳跃、不连续、出现马赛克等现象。所以通过信道编码这一环节,对数码流进行相应的处理,使系统具有一定的纠错能力和抗干扰能力,可极大地避免码流传送中误码的发生。误码的处理技术有纠错、交织、线性内插等。

提高数据传输效率,降低误码率是信道编码的任务。信道编码的本质是增加通信的可靠性。但信道编码会使有用的信息数据传输减少,信道编码的过程是在源数据码流中加插一些码元,从而达到在接收端进行判错和纠错的目的,这就是我们常常说的开销。这就好象我们运送一批玻璃杯一样,为了保证运送途中不出现打烂玻璃杯的情况,我们通常都用一些泡沫或海棉等物将玻璃杯包装起来,这种包装使玻璃杯所占的容积变大,原来一部车能装5000各玻璃杯的,包装后就只能装4000个了,显然包装的代价使运送玻璃杯的有效个数减少了。同样,在带宽固定的信道中,总的传送码率也是固定的,由于信道编码增加了数据量,其结果只能是以降低传送有用信息码率为代价了。将有用比特数除以总比特数就等于编码效率了,不同的编码方式,其编码效率有所不同。

数字电视中常用的纠错编码,通常采用两次附加纠错码的前向纠错(FEC)编码。RS编码属于第一个FEC,188字节后附加16字节RS码,构成(204,188)RS码,这也可以称为外编码。第二个附加纠错码的FEC一般采用卷积编码,又称为内编码。外编码和内编码结合一起,称之为级联编码。级联编码后得到的数据流再按规定的调制方式对载频进行调制。

前向纠错码(FEC)的码字是具有一定纠错能力的码型,它在接收端解码后,不

信息论

仅可以发现错误,而且能够判断错误码元所在的位置,并自动纠错。这种纠错码信息不需要储存,不需要反馈,实时性好。所以在广播系统(单向传输系统)都采用这种信道编码方式。

下面是纠错码的各种类型:

1、RS编码

RS码即里德-所罗门码,它是能够纠正多个错误的纠错码,RS码为(204,188,t=8),其中t是可抗长度字节数,对应的188符号,监督段为16字节(开销字节段)。实际中实施(255,239,t=8)的RS编码,即在204字节(包括同步字节)前添加51个全“0”字节,产生RS码后丢弃前面51个空字节,形成截短的(204,188)RS码。RS的编码效率是:188/204。

2、卷积码

卷积码非常适用于纠正随机错误,但是,解码算法本身的特性却是:如果在解码过程中发生错误,解码器可能会导致突发性错误。为此在卷积码的上部采用RS码块,RS码适用于检测和校正那些由解码器产生的突发性错误。所以卷积码和RS码结合在一起可以起到相互补偿的作用。卷积码分为两种:

(1)基本卷积码:

基本卷积码编码效率为,η=1/2, 编码效率较低,优点是纠错能力强。

(2)收缩卷积码:

如果传输信道质量较好,为提高编码效率,可以采样收缩截短卷积码。有编码效率为:η=1/

2、2/

3、3/

4、5/

6、7/8这几种编码效率的收缩卷积码。

编码效率高,一定带宽内可传输的有效比特率增大,但纠错能力越减弱。

3、Turbo码

1993 年诞生的Turbo 码,单片Turbo 码的编码/解码器,运行速率达40Mb/s。该芯片集成了一个32×32 交织器,其性能和传统的RS 外码和卷积内码的级联一样好。所以Turbo码是一种先进的信道编码技术,由于其不需要进行两次编码,所以其编码效率比传统的RS+卷积码要好。

4、交织

在实际应用中,比特差错经常成串发生,这是由于持续时间较长的衰落谷点会影响到几个连续的比特,而信道编码仅在检测和校正单个差错和不太长的差错串时才最有效(如RS只能纠正8个字节的错误)。为了纠正这些成串发生的比特差错及一些突发错误,可以运用交织技术来分散这些误差,使长串的比特差错变成短串差错,从而可以用前向码对其纠错,例如:在DVB-C系统中,RS(204,188)的纠错能力是8个字节,交织深度为12,那么纠可抗长度为8×12=96个字节的突发错误。

实现交织和解交织一般使用卷积方式。

交织技术对已编码的信号按一定规则重新排列,解交织后突发性错误在时间上被分散,使其类似于独立发生的随机错误,从而前向纠错编码可以有效的进行纠错,前向纠错码加交积的作用可以理解为扩展了前向纠错的可抗长度字节。纠错能力强的编码一般要求的交织深度相对较低。纠错能力弱的则要求更深的交织深度。

下图是交织的原理图:

一般来说,对数据进行传输时,在发端先对数据进行FEC编码,然后再进行交积处理。在收端次序和发端相反,先做去交积处理完成误差分散,再FEC解码实现数据纠错。另外,从上图可看出,交积不会增加信道的数据码元。

根据信道的情况不同,信道编码方案也有所不同,在DVB-T里由于由于是无线信道且存在多径干扰和其它的干扰,所以信道很“脏”,为此它的信道编码是:RS+外交积+卷积

信息论

码+内交积。采用了两次交积处理的级联编码,增强其纠错的能力。RS作为外编码,其编码效率是188/204(又称外码率),卷积码作为内编码,其编码效率有1/

2、2/

3、3/

4、5/

6、7/8五种(又称内码率)选择,信道的总编码效率是两种编码效率的级联叠加。设信道带宽8MHZ,符号率为6.8966Ms/S,内码率选2/3,16QAM调制,其总传输率是27.586Mbps,有效传输率是27.586*(188/204)*(2/3)=16.948Mbps,如果加上保护间隔的插入所造成的开销,有效码率将更低。

在DVB-C里,由于是有线信道,信道比较“干净”,所以它的信道编码是:RS+交积。一般DVB-C的信道物理带宽是8MHZ,在符号率为6.8966Ms/s,调制方式为64QAM的系统,其总传输率是41.379Mbps,由于其编码效率为188/204,所以其有效传输率是41.379*188/204=38.134Mbps。

在DVB-S里,由于它是无线信道,所以它的信道编码是:RS+交积+卷积码。也是级联编码。

参考文献

1)2)3)4)5)6)李立萍,张明友.信息论导引.成都:电子科技大学出版社,2005。田宝玉.工程信息论.北京:北京邮电大学出版社,2004。朱雪龙.应用信息论基础.北京:清华大学出版社,2000。李建东,王永茂,胡林敏.最大熵原理及其应用.信息科学。王 栋,朱元甡.最大熵原理在水文水资源科学中的应用.水科学进展,2001,12(3)。[6]董伟民等.最大熵原理在地震重现关系上的应用.地震工程与工程程动,1983,3(4)。

政务信息资源标识符编码方案研究 篇6

2006年国家信息化工作领导小组发布的《国家电子政务总体框架》(国信[2006]2号)中提出,政务信息资源开发利用是推进电子政务建设的主线,是深化电子政务应用取得成效的关键,并且将政务信息资源目录体系与交换体系列为电子政务基础设施,以支持政务信息资源的共享交换。

政务信息资源目录体系是按照统一的标准和规范,为发布、发现和定位政务信息资源和各类交换服务目录而建设的信息服务体系。政务信息资源目录体系由政务信息资源、政务信息资源元数据、政务信息资源目录、标准规范等要素构成,如图1所示。其中政务信息资源标识符编码标准是政务信息资源目录体系标准规范的重要组成部分。通过建立统一的政务信息资源标识符编码方案,为每一项政务信息资源赋予一个唯一的标识符,依托政务信息资源目录体系,可以实现信息资源的准确检索、查询、定位和发现,实现信息资源的有效管理和利用。

政务信息资源标识符编码概述

我们研究政务信息资源标识符编码方案,首先需要了解标识符、政务信息资源标识符以及编码等相关概念。对于标识符,国家标准《电子数据交换术语》(GB/T 14915-1994)中定义为“用于标识或命名一个数据项目并可能指出该数据确定性质的一个或一组字符”。在国家标准《政务信息资源目录体系 第5部分 政务信息资源标识符编码方案》(送审稿)中,政务信息资源标识符是指“用于唯一标识政务信息资源的一组字符”,编码是指“按一定规则将一个集合的元素映射为另一个集合的元素的过程。”。

国外的信息资源标识符编码通常采用集中和分布管理相结合的分段式管理模式,多为两段或三段。比较有代表性的编码有美国的数字对象标识体系(Digital Object Identifier,简称DOI)和英国的信息资产登记注册库标识码(Information Assets Register Number,简称IARN)。DOI的主要目的是唯一标识网络环境下的各种信息资源实体。DOI是从统一资源定位符(Uniform Resource Locator,URL)发展而来,被称为“下一代URL”。它与URL的最大区别就是实现了对资源实体的永久性标识。DOI唯一标识符由前缀和后缀两部分组成。前缀和后缀由“/”分隔。其中前缀是由IDF(国际DOI基金会)分配给DOI注册者的号码,后缀是注册DOI的组织或个人对数字对象定义的本地标识符。一般DOI的注册者都通过后缀融入现有的唯一标识符,如ISBN和其它标识,以达到兼容的目的。英国的信息资产登记注册库标识码(IARN),是英国皇家文书局(HMSO)制定的一套服务于信息资产登记注册库系统(IRA)的信息资源标识体系。IARN是两段式的编码结构,其中,前一个码段实行统一维护管理,后一个码段由获得前一码段的机构自由决定编码方案并维护。

在我国的一些行业和领域,已经存在着一些标识符编码,如公民有身份证号码;组织机构也有全国统一代码标识,但是与能源,材料并列为未来的三大战略资源的信息资源却没有一个统一的编码制度。政务信息资源是信息资源的重要组成部分。目前,有关部门正在组织制定政务信息资源标识符编码国家标准,尚未正式发布。部分省市在政务信息资源目录体系的建设过程中,结合本地区的实际,开展了统一政务信息资源标识符编码的研究与实践。现以北京市为例,从编码规则与赋码管理两方面进行阐述。

政务信息资源标识符编码规则

从2004年开始,北京市从政务信息资源目录内容建设、标准规范制定、目录系统建设、和管理制度制定等多方入手,启动了政务信息资源目录体系建设工作,其中内容建设,即政务信息资源梳理与目录编制是核心。

按照北京市地方标准《政务信息资源目录体系》(DB11/T337-2006)中规定的政务信息资源元数据标准,在编制政务信息资源目录时,全市统一将信息资源标识符编码、相关业务事项、信息资源名称、信息资源负责方、信息资源描述、更新周期、资源采集途径、共享需求单位、涉及的数据库、备注等10项设定为基本项,进行目录编制的国家机关可以直接使用,或者在此基础上进行扩展。

信息资源标识符编码作为政务信息资源目录的基本项,是政务信息资源目录体系建设的关键要素,在编制目录时必须填写。为了将全市政务信息资源统一编码,以支持信息资源的统一登记、共享、交换等工作,北京市遵循国家标准送审稿中的两段码的构成形式及编码规则,并在适当扩展的基础上制定了全市统一的政务信息资源标识符编码方案。目前,这一方案已在全市范围内推广使用。

(1)标识符编码的表示形式

北京市的政务信息资源分布在各国家机关,各国家机关在梳理本部门信息资源时,采用先梳理本部门的业务,在形成业务目录的基础上,再梳理业务所需要的信息资源和产生的信息资源,形成部门信息资源目录的方法。根据政务信息资源的应用属性,在部门信息资源目录的基础上,还可以派生出政务基础信息共享目录、政务主题应用信息共享目录和政府信息公开目录等。

结合北京市编目的特点,北京市的政务信息资源标识符编码分为前段码和后段码两部分。其中前段码为机构编码,后段码为业务类编码、信息资源类编码或其它编码。标识符编码的表示形式如图2所示。

(2)前段码

前段码是标识符中的字符“/”之前的部分,表示产生或提供信息资源的机构编码,该机构可以是拥有并提供政务信息资源或承担某项业务的国家机关。前段码共6位,由10个阿拉伯数字(0-9)和24个大写英文字符(除I和O之外的其他A—Z的字符)组成。

北京市国家机关统一使用11XXXX,其中前两位“11”代表北京;第三位“0”代表市级,字母代表区县级;后三位代表政务机构或乡镇、街道。后3位由各级前段码的管理机构参考政府各级编办的组织机构代码编写。例如:110001为北京市人民政府办公厅,11A001可代表东城区政府办公室。

(3)后段码

后段码是标识符编码中字符“/”之后的部分,分为业务类编码、信息资源类编码和其它编码。后段码的第1位表示编码类型,其中业务类编码用Y表示,信息资源类编码用Z表示,其它的编码类型根据需要扩展。

考虑到编码规则的兼容性,在编码规则中规定,各国家机关既可以采用已有的业务编码方案和信息资源编码方案;也可以制定本部门的业务编码方案和信息资源编码方案;在缺省情况下,可采用6位无意义顺序码。如北京市发展改革委“煤炭经营企业设立许可”的编码为“110002/Y0001C014”,其中“/”前为前段码,后段码划横线部分依据北京市地方标准《网上审批业务编码规则》(DB11/T369-2006);北京市各国家机关在编制政府信息公开目录时,后段码第1位表示编码类型,第2位用“K”表示公开,从第3位开始依据《北京市政府信息公开目录编制规范》进行编码,即后段码为ZKXX…XXX,横线部分的编码依据《北京市政府信息公开目录编制规范》。

政务信息资源标识符编码的赋码与管理

为了保障政务信息资源标识符编码规则的有效推广和使用,北京市先后以地方标准、政府文件的方式发布了编码规则和管理要求。在北京市质量技术监督局2006年批准发布的地方标准《北京市政务信息资源目录体系》(DB11/T337-2006)中将“政务信息资源标识符编码方案”作为规范性附录提出。经过近两年的推广使用,在2008年北京市信息化工作办公室发布的《北京市政务信息资源目录建设管理办法(试行)》(京信息办发[2008]12号)中,发布了修订后的“政务信息资源标识符编码方案”,将编码规则作为强制性规范加以规定,并提出了具体的赋码与管理要求。

(1)前段码的赋码与管理

在北京市政务信息资源目录体系建设的过程中,市信息化主管部门承担着市级目录中心的职能,负责政务信息资源目录的注册、发布、维护、查询等工作。

因此,在北京市,由市信息化主管部门负责区县信息化主管部门前段码的分配和市级国家机关政务信息资源前段码的分配管理工作;区县信息化主管部门负责同级及下一级国家机关前段码的分配,并把前段码分配方案以电子文件的形式向市信息化主管部门备案。对于未予赋码的国家机关,可按赋码管理规则向同级信息化主管部门申请前段码。如遇到机构调整的情况,新成立的部门或合并重组的部门都需要向本级信息化主管部门重新申请前段码。

(2)后段码的赋码与管理

考虑到编码规则的易实施性,在北京市目录体系建设的过程中,后段码由拥有政务信息资源的各国家机关自行编制,各国家机关根据部门实际需要选择或制定后段码的编码方案,但对于被垂直管理的国家机关,如其上级部门已有后段码的编码方案,则必须使用其上级部门已有的后段码编码方案。

采用分布管理与集中管理相结合的原则,在北京市的政务信息资源编码方案中同时也规定:无论采取何种编码规则,都应将编码方案以电子文件的形式向同级信息化主管部门备案。

通过几年来北京市政务信息资源目录体系建设的实践探索,我们发现,政务信息资源标识符编码方案的研究不仅涉及信息化技术领域,同时也涉及行政管理领域,二者相辅相成。尽管北京市在借鉴国家相关标准研究的基础上,提出了一套解决方案,并取得一定的管理效果。但是我们必须看到,该项工作无论是理论上还是实践上都还处于起步阶段,有许多问题尚待解决。

信息论与编码课程改革探索与研究 篇7

信息论与编码是南通大学电子信息类本科三年级的一门专业必修课, 主要是研究信息传输的有效性和可靠性的一门学科[1,2]。该课程是通信技术与概率论、随机过程、数理统计等学科相互融合而发展起来的一门交叉学科[3]。该课程要求学生掌握线性代数、微积分等基本的数学工具, 还需要学生对通信原理等课程有较深刻的认识。个人计算机的普及和通信专业软件的日益成熟, 使得该课程的实验教学成为可能。可见, 该课程理论性强、内容多, 与先修课程有密切的关系。针对该课程的变化与最新发展, 为了提高教学效果, 笔者在理论教学、实验教学、科研联系教学、考核方式等多个方面进行了改革。

二、教材选择

根据学校的层次、专业特点和教学对象选择一本合适的教材是教学改革的一个基本方面。目前, 有关信息论与编码这一课程的教材非常多。如王育民编著的《信息论与编码理论》以及Cover著写的《信息论基础》的中译本和英文影印本。随着网络技术的迅猛发展, 最近出现了一些新教材, 如仇佩亮编著的《多用户信息论》、Yeung编写的《信息论基础》和Gamal编著的《网络信息论》。这些教材的知识体系结构和侧重点各有不同, 而且差别很大。根据信息论与编码专业必修课的性质, 按照强调基础理论学习, 突出对所学理论知识灵活应用的原则, 我校选用了曹雪虹主编的《信息论与编码》作为教材。该教材吸收了国内外众多现有教材的精华, 注重基本概念, 突出基础理论, 强调应用。而且, 该教材难度适中, 文字通俗易懂, 用较多的例题和图示阐述了基本概念、基础理论和应用, 适合作为我校信息工程和通信工程等专业的教材。

三、课程内容改革

教学内容改革是课程改革的核心。根据我校相关专业的实际教学情况和效果, 对信息论与编码教学内容改革有如下的考虑。

(一) 注重教学内容的承上启下

教师在该课程教学中, 要强调已学专业基础课中的信号与系统、数字信号处理和通信原理, 分别解决点对点通信系统中关于信源和信道的一些具体问题, 而信息论与编码将从更抽象的层面看待整个通信系统, 为通信学科的发展指明了方向。正如著名通信理论家Viterbi所说, 如果把现代通信技术比喻成飞船, 则晶体管是它的引擎, 而信息论是它的方向盘[4]。注重该课程与已学课程融合的同时, 还要突出该课程在后续课程学习中的作用, 指出该课程是数据压缩技术、语音信号处理、图像处理等课程的理论基础。另外, 教学过程中, 还要适当介绍信息论的最新进展和研究热点, 以激发学生的学习兴趣。

(二) 教学内容的模块化

教学过程中, 将信息论与编码的教学内容看作一个有机整体, 遵循注重结论表述的通俗易懂、突出理论严密和精美的原则, 把课程内容分为信息度量、香农三大定理、编码三大块内容。信息度量描述了将抽象信息量化的方法, 为学习香农三大定理提供了理论基础。随后, 结合学生已学课程, 介绍香农三大定理的意义, 通俗形象地表述香农三大定理, 指出香农三大定理是信源编码和信道编码技术的理论基础。

编码理论包含信源编码和纠错码两大块内容。其中信源编码部分主要包括香农编码、费诺编码、霍夫曼编码、游程编码、算术编码、变换编码等, 是香农第一和第三定理的应用。纠错码包含线性分组码、循环码、卷积码、TCM码和Turbo码等, 是香农第二定理的经典应用。讲授这部分内容时, 主要向学生介绍二元编码, 以简代繁, 让学生能够快捷掌握实用的编码技术。

(三) 融合最新研究成果, 突出实践和应用

授课过程中, 一方面, 注意引导学生用所学到的理论解释先前所学专业基础课的部分经典内容和结论, 突出所学课程的应用功能。例如用数据处理不等式解释为什么信号经过处理会丢失部分信息, 用限平均功率最大熵定理解释为什么总假设信道噪声是高斯白噪声, 用信息论的基本概念导出香农信道容量公式等。另一方面, 随着信息和通信技术的进步和发展, 在讲课过程中, 需要向学生讲授LDPC码、协作通信、MIMO通信系统和网络编码等最新出现的通信和编码技术, 以及网络信息论的最新理论成果。

许多高校在讲授信息论与编码这门课时, 往往注重理论教学, 重视向学生讲解抽象的概念、理论和对重要结论的逻辑推理, 而忽略了这门课是理论和实践紧密结合的课程, 对实验教学的关注非常有限, 学生很难将学到的理论知识与实际相结合[5]。课程改革后, 为该课程确定了四个实验, 分别是信息熵计算、信道容量计算、霍夫曼编码实验、CRC校验编码实验。

四、教学方式改革

教学方式改革的目的就是要激发学生的学习热情和学习兴趣, 让学生成为教学的主体, 信息论与编码的教学方式的改革包含以下几个方面。

(一) 传统板书与多媒体结合

信息论与编码这一课程的内容多、理论性强, 许多结论需严格的推理证明。因此, 课程教学中需要把多媒体教学信息量大和传统板书易于展示复杂理论推导、表现力强、便于师生交流的优点相结合。这样, 生动形象的多媒体教学保证了课堂的信息量, 而严格的推理证明可以让学生深刻理解相关结论, 领悟理论的精要, 掌握课程的重点和难点。

(二) 内容讲述形象化, 逻辑推理严格化

信息论与编码是运用数学工具解决通信中问题的典范。课改过程中, 讲授该课程时, 做到语言通俗易懂;表述重要结论时, 尽量形象生动。例如, 讲授香农第二定理时, 先指出香农第二定理所给出的结论是信息传输是否出错, 取决于信道容量和信息率之间的关系, 而不是数据传输的次数, 这和人们直观认识不一样。在学生对香农第二定理有了感性认识后, 给出香农第二定理严格的推理证明, 让学生感受理论的严密和精美。

(三) 灵活运用多种教学方法

综合运用多种教学方法, 不仅能将理论知识融会贯通, 而且可以引导学生进行主动的探究性学习, 还可以引导学生主动思考, 积极参加讨论, 提高学习效率及综合运用所学知识解决实际问题的能力[6]。

在信息论与编码课程改革过程中, 笔者根据学生所在系别和专业的不同, 综合运用案例式教学、研究型教学、启发式教学、演示练习式教学、互动讨论教学等多种教学方法, 将这些教学方法贯穿于该课程教学的始终。并在该课程教学中引入实验教学, 使用Matlab仿真软件搭建通信系统模型, 实现理论和实践的有机结合。

五、课程考核方式改革

课程改革后, 采用的考核方式比传统考核方式更加全面、细致、科学。学生的成绩将由平时作业、课堂练习、学习报告、课堂讨论发言、实验和期末考试几个部分组成。

布置适量的课后作业可以让学生及时巩固所学知识, 深化对基本概念和基本理论的理解, 掌握解决问题的基本方法, 提升学生解决问题的能力。同时, 能激发学生探索发现解决问题的方法, 通过一题多解、一题巧解能够把学生的发散性思维和聚敛思维结合起来。

针对课程的典型例题和解决问题的典型方法, 教学过程中进行精讲和演示, 尔后选择合适的习题, 让学生做课堂小测试。这种小测试是根据“90后”学生喜欢看手机、注意力容易分散的特点设计的, 小测试可提高学生的注意力, 增强教师对课堂气氛的调动和掌控, 同时可让学生及时巩固所学理论和方法。

要求学生组成3~4人的学习小组, 围绕与该课程紧密相关的抽象概念、基本理论展开讨论, 让学生经过讨论对课程有更全面的认识。每个学习小组的学生一起完成实验, 并选择和该课程密切相关的科研课题, 阅读与所选课题密切相关的书籍和论文, 合作书写一份不少于3000字的手写报告, 要求参考文献不少于10篇。

该课程最终需要闭卷考试, 教学改革后, 我们更新了题库的部分题目, 增加了近年来出现的新题型。同时, 各任课教师统一了考试要点, 重点检测学生对核心内容的理解和掌握, 避免了偏题和怪题的出现, 有效检验了学生对课程内容掌握情况, 真实反映了学生对课程的理解程度。

六、结语

该文分析了信息论与编码课程最新的发展和变化趋势, 根据课程组各位任课教师多年的教学心得, 对课程进行了教学改革, 因地制宜地调整了教学大纲, 重新对课程教学进行了整体设计, 优化了教学内容, 增加了实验教学环节, 综合运用多种教学方法, 提高课程的趣味性和应用性, 促使学生积极、主动地学习该课程。

摘要:该文是针对信息论与编码教学过程中存在的问题进行全面教学改革的论述。教学改革优化了教学内容, 提高了教学效率;让学生参与到教学过程中, 实现师生的良性互动;精心引入前沿科研问题, 开拓学生眼界;合理布置作业, 及时巩固所学知识;加强了实验教学, 培养学生的应用能力;完善课程考核方法, 真实反映学生学习情况。

关键词:信息论与编码,教学改革,教学方法

参考文献

[1]曹雪虹, 张宗橙.信息论与编码[M].北京:清华大学出版社, 2009.

[2]Cover M Thomas, Joy A Thomas.Elements of Information Theory[M].北京:清华大学出版社, 2007.

[3]谢正光, 包志华, 章国安.概率统计在信息论与编码教学中的应用[J].南通大学学报, 2008, 25 (4) :88-90.

[4]仇佩亮.信息论与编码[M].北京:高等教育出版社, 2011.

[5]曹红梅, 张涛.仿真实验在信息论与编码课程中的应用[J].实验室科学, 2014, 17 (4) :97-100.

信息论与编码技术课程教学探讨 篇8

信息论是应用概率论、随机过程和数理统计等方法, 研究信息的存储、传输和处理中一般规律的学科, 主要目的是提高通信系统的可靠性、有效性和安全性, 以便达到系统的最优化, 是现代信息科学和通信科学领域中的一门基础理论。编码技术以信息论基本原理为理论依据, 研究编码和译码的理论知识和实现方法, 在媒体技术、网络技术、无线通信技术、数字电视技术等方面得到广泛应用。因此国内许多高校将信息论与编码技术作为电子与信息类专业本科教学中的主干课程, 但在实际教学中, 却存在许多问题。1.学生普遍存在不重视本课程心理。对于一般应用型本科院校的学生来说, 他们认为信息论与编码技术理论性太强, 与实际应用有一定差距;与其他课程联系少, 学习好坏对别的专业课影响不大;招聘单位不看重;研究生入学考试不需要, 因此他们也就不重视, 缺勤旷课时有发生。2.信息论理论知识抽象复杂, 学生难以掌握。信息论是一门用数学方法来研究信息的存储、传输和处理中的一般规律的学科, 需要用到大量的概率论与随机过程的知识, 而随机过程是理工类硕士研究生的必修课, 很多高校都选择随机过程作为博士入学的必考课, 理论难度可想而知, 一般高校中并没有相关本科课程的教学, 在其他课程中可能有简单的介绍, 但由于课时所限, 不可能做深入讲解, 因此信息论中的许多公式证明对于本科生而言十分晦涩难懂, 使本来就不想学这门课的学生更是兴趣全无, 敬而远之, 毫无学习的积极性可言。3.很多学生在学过信息论后, 只会计算相关题目, 而不知其应用价值。在多年的信息论教学中, 有不少学生反映这门课的教学内容能理解, 但布置的作业不会做;或者给定某个题目, 按照上课所讲的步骤, 可以计算出结果, 但是在现实生活中如何应用却不知道。所以学习纯粹是为了应付考试。

(二) 教学改革实践

1. 正确引导学生, 端正学习态度, 培养学习兴趣。

学生是教学活动的主体, 一切富有成效的教学都离不开学生积极主动地参与。学生的学习动机是直接推进他们进行学习的内部动力, 既是促进教师改革教学内容和方法的手段, 也是提高学生学习效果和综合素质的途径。教育实践表明, 学生对某些学科缺乏学习的积极性, 常常是由于对学习这门学科的重要意义缺乏认识。信息论是揭示有关信息的一般规律的科学。人们对信息的研究, 现在已经由以前单纯的通信范畴, 扩展到了自然科学和社会科学的所用领域, 逐渐形成和发展为光学信息论、量子信息论、生物信息论等重要分支。在当今高度信息化时代, 只要涉及到信息的存储、传输和处理就要用到香农的三大定理, 人们娱乐生活中用到的数字激光影碟机、数码相机等等都普遍采用了纠错码技术和数据压缩技术。教师在授课过程中如果能有意识地从教学内容上强化这一点, 不仅扩大了学生的知识面, 而且能够让学生充分认识到信息论与编码技术这门课并不是纯粹抽象的理论, 而是与我们的生活息息相关, 就会在很大程度上激发学生学习这门课程的兴趣和动力。学习兴趣是人们渴求获得知识与深入认识世界的积极倾向, 是推动学生学习的有效动力, 是学习动机中最现实最活跃的心理成分。对于信息论与编码技术这门理论性较强的课程来说, 如何培养学生的学习兴趣尤为重要。首先, 与生活实例相结合, 激发学生的学习兴趣。例如在讲信源熵这一节时, 可以比较一定数量的图像和语音两者所含信息量的差异。每帧电视图像认为是由3*105个像素组成, 所有像素均是独立变化的, 且每一像素又取128个不同的电平, 并设亮度电平等概率出现, 按照香农定义的信息度量方法计算, 则每帧图像含有的信息量为2.1*106比特。若有一广播员在约10000个汉字 (假设汉字之间无关联, 等概率出现) 中选1000个字来口述这帧电视图像, 则广播员描述此图像所广播的信息量是1.33*104比特。若要恰当的描述此图像, 广播员在口述中至少需用159000个汉字。日常生活中, 我们只是感性的认识到图像所含的信息比语言所含的信息量多, 但究竟多多少, 怎样定量的描述却不知如何下手, 通过信息论的学习, 就可以迎刃而解。另外信息论对语言翻译也具有指导意义, 在相应章节的授课中可以举几个例子。其实信息论中的相关结论在现实生活中的例子很多, 只要善于发现、总结, 并应用于教学, 就会激发学生浓厚的学习兴趣。其次, 理论与实践相结合, 培养学生的学习兴趣。信息论的一个显著特点就是理论性强, 内容枯燥, 如果仅仅停留于理论, 学生学到的就是死的知识, 也不能很好地调动学生对课程学习的兴趣, 很难体现培养创新思维和动手能力的要求。因此结合信息论的相关内容, 设计不同的实验, 例如LZW压缩算法是一种高效的通用编码, 由Lemple-Ziv-Welch三人共同创造, 现在已成为计算机文件压缩的标准算法, 常用的ZIP、ARC压缩解压程序就是LZW码的改进算法。学生通过编程实现该算法, 不仅弥补了课程内容概念抽象、难以理解的不足, 而且加深了对相关概念、知识的理解, 培养了严格、有序、科学的工作作风, 提高了自身的分析问题、解决问题和实际动手能力。最后, 紧跟信息论相关学科的发展潮流, 保证教学内容的新颖性和教学方法的多样性也是激发学生学习兴趣的重要方面, 大学生的学习兴趣常常是在丰富多彩、新颖的教学内容中得到激发的。

2. 教学内容适当取舍, 合理组织。

因为信息的数字化处理具有模拟处理不可比拟的优势, 现代信息的存储、传输、处理等过程绝大多数都采用数字化处理, 所以信息论作为通信的基本理论, 其教学的侧重点也应当顺应形势发展的需要, 在教学内容安排方面, 应适当减少连续信源理论、连续信道容量等相关内容。另一方面, 信息论中连续内容的讨论是建立在随机过程等基础之上的, 本科生一般不具备足够的基础知识, 而离散信源理论及其信道容量等方面的内容是建立在概率论、线性代数等基础之上的, 这些内容都是理工类本科生的必修课, 因此在教学中, 应将离散方面的相关内容作为重点来讲述, 而对连续信源理论、信道容量等有关内容只作简单介绍。信息论作为一门理论性较强的课程, 其内容不可避免涉及一些应用概率统计、随机过程知识的数学运算和公式推导。由于概念抽象, 对研究生来说, 理解起来都感觉吃力, 更何况层次低、课时少的本科生。因此, 可以淡化理论的推导过程, 使理论结果可视化, 概念直观化, 从物理意义的角度出发, 用具体实例来讲解基本理论。为此, 一方面, 在教学过程中可增加课堂演示性实验和课后实验环节来保证学生对课程知识的理解。另一方面, 因为信息论是从通信实践中总结出来的理论, 所以信息论中的相关理论都应该具有某种物理意义, 而不应该是单纯抽象的某个公式, 应侧重从物理意义方面来讲述这个公式, 这样既减少了课程的抽象性, 又便于学生理解掌握, 增加学习的兴趣。例如在信道编码理论这一节中, 有一个重要的费诺不等式H (X|Y) ≤H (PE) +PElog2 (r-) 1, 该不等式体现了平均错误概率与信道疑义度之间的关系。在对公式证明之前, 可以先对这个结论的物理意义进行详细的讲解, 为了便于理解, 先以H (X|Y) 为纵坐标, PE为横坐标画出费诺不等式的曲线图, 当信源、信道确定, 信道的疑义度H (X|Y) 就确定了, 从图上可以清晰的看到, 此时译码的平均错误概率的下限也就确定了, 也就是说, 信源若不进行信道编码, 译码后的平均错误概率就不是一个任意小的值。因为公式的证明比较繁琐, 对于本科生来说, 可以不作统一要求, 只把证明的思路讲一下, 但公式及其物理意义却应该让学生理解掌握。

3. 板书教学与多媒体教学有机结合。

传统的教学系统是由教师、学生和教材这三个要素构成, 教师采用板书的形式进行上课, 但随着计算机的日益普及, 在现代化教学环境下又增加了一种形式, 那就是多媒体教学。两种教学形式各有利弊, 需要有机结合。在教学过程中, 恰当地融入多媒体教学手段, 利用图形、图像、文本、声音、动画等多种媒体信息刺激学生的感官, 可以使教学内容生动、形象、有趣, 信息量增大, 降低教学难度, 增强自信。但多媒体教学同样存在缺陷, 课件画面停留时间短, 学生缺少思考的空间和时间, 不利于学生记忆和做笔记;多媒体课件都是事先设计好并在教学中按照预先设计的进程执行, 在课堂上难以有效地、随机地调整内容;多媒体课件设计若过于花俏, 则会分散学生的注意力, 降低教学效率。传统的板书教学是广大教育工作者经过长期的实践和研究所总结出来的一种行之有效的教学模式, 教学思路清晰, 便于学生理解和记忆, 特别适用于理论推导类的教学。缺点是信息量小, 上课不如多媒体教学生动, 有些图表不能展现。因此, 在运用多媒体教学时, 要结合课程特点和教学对象的实际情况, 精心设计教学内容, 准备高质量的课件, 将多媒体教学和传统教学有机结合起来, 从而提高教学质量。信息论与编码技术课程内容分两部分, 第一部分介绍信息论的基础知识, 理论性强, 难度大, 因此在课堂内可采用板书教学为主, 辅以多媒体教学的形式。第二部分介绍编码, 相对应用性强, 图表繁多, 因此在课堂内可采用多媒体教学为主, 辅以板书教学的形式。

4. 以学生为本, 培养学生的创新能力。

教学的首要任务不是教给学生知识而是教给学生获取知识的能力, 应突出对学习方法的指导, 培养学生的自学能力。在教学过程中, 采用研究式教学方法, 通过以“教师引导, 学生为主”团队协作和共同探讨的模式来使学生掌握信息论的精髓, 培养学生的创新意识和解决问题的能力。自从1948年香农发表了“通信的数学理论”一文, 宣告了信息论作为一门独立的、全新的学科成立。因此, 首先推荐学生通读该文, 并制定研读任务和提交时间, 让他们体验科学巨匠是如何探究自然, 进行创造性思维活动的, 同时构建出本门课程的理论框架。不断更新教学内容, 介绍本学科的最新成果和研究动向、发展趋势, 可以使学生产生更高水平的求知欲, 引起学生的探究活动。课堂教学注意多从创设问题情境出发, 激发学生的兴趣和探究激情, 引导学生自主探究和体验知识的发生过程, 还原原来的科学思维活动, 通过师生互动、双向交流的形式, 鼓励质疑批判和发表独立见解, 培养大学生的创新思维和创新能力。在适当的章节让学生变成老师, 让学生上讲台, 这样既让学生对所讲授的内容有深刻地理解, 也锻炼了学生思维能力、口头表达能力和学生的组织能力。

摘要:针对信息论与编码技术在教学过程中存在的问题, 从教学内容、教学方法等方面进行改进, 激发学生的学习兴趣, 培养了学生的创新能力, 提高教学质量。

关键词:信息论与编码,教学改革,教学实践

参考文献

[1]傅祖芸.信息论——基础理论与应用[M].北京:电子工业出版社, 2001.

[2]张文新.高等教育心理学[M].济南:山东人民出版社, 2004.

信息论与编码 篇9

关键词:信息论与编码,教学现状,教学探讨

“信息论与编码”课程,运用高等数学、随机过程、概率论和数理统计等数学方法来研究通信过程中的信息的获取、存储、度量、编码、传输与处理等问题,是通信技术和数学知识相结合的交叉学科,其理论性和实践性并重。目前,信息论与编码理论已发展为重要的交叉学科,涉及到信号处理、自动控制理论、人工智能、网络、通信等多个领域。在数年教学实践中,发现部分学生对这门课的学习兴趣不高,教学效果不佳。所以,探讨“信息论与编码”课程教学,对于改善课程的教学效果,提高学生学习积极性,培养学生的创新能力和实践能力都具有重要意义。

1 信息论与编码课程地位和特点课程中的地位

信息论是整个信息学科学发展的起源和基石,研究目的是寻找信息传输过程的共同规律,来提高信息传输可靠性、有效性、保密性和认证性,从而获取最优信息传输系统。“信息论与编码”与“通信原理”、“通信电子线路”共同组成了通信工程专业课程的“铁三角”,如图1所示。

概念抽象、理论性强、需要的预备知识种类众多等是信息论与编码这门课程的主要特点。课程中涉及到大量的数学知识,几乎覆盖了理工科学生所学的大部分数学课程,包括:高等数学、概率论与数理统计、线性代数、随机过程、离散数学以及数值分析等。例如:信道编码涉及线性代数,信息量度量涉及到概率知识,信道容量的计算涉及到高数知识等。而且信息论与编码课程还涉及了通信方面的一些知识,如果学生对此课程所涉及的某门前期课学得不扎实,这将会给课程的学习带来一定的难度。

2 信息论与编码课程教学中存在的问题

目前,大部分高校电子类专业都开设了“信息论与编码”这门课。在对我校通信工程和电子信息工程多年教学经验的基础上,分析了教学现状,将教学过程中存在的普遍问题归纳如下。

(1)涉及的数学知识多,学生理解困难

“信息论与编码”是一门应用科学,是使用随机过程、概率论等数学方法来研究通信系统的存储、度量、传输等问题。课程涵盖了大量的数学知识,并对学生的逻辑推理能力、抽象思维能力以及空间想象有较高的要求。有些同学若对前期数学课程没有充分掌握,那么在学习信息论课程时碰到数学概念、数学推导时就会产生恐惧心里,感到课程难学、枯燥,失去学习的热情和积极性。

(2)理论多,具体应用和实践少

在本科教学中,主要是理论讲解为主,缺乏在实际中的具体应用,导致学生弄不清学习该课程的目的,有的同学甚至认为该课程不重要,上课的时候不认真听讲。另外,该课程缺乏实践环节,导致理论与实际脱节,更加模糊了学生对该课程的认识,使教学效果大大折扣,影响了学生学好该课程的决心。

(3)实验方式有限

实验是“信息论与编码”课程教学的重要部分,目前在高校中,验证性实验是信息论与编码课程的普遍教学方式。再者,有些高校本科生只有理论教学,并没有开设实验课程,学生只知道基本原理、编码方法等,对于具体的实现并不清楚。

(4)考核方法单一,不能正确反映学生的学习情况

教学实践已经表明,合理的考核评价体系有利于准确衡量教学效果。我校“信息论与编码”课程采用闭卷测试,用卷面考分的高低来衡量学习效果的好坏。

3 信息论与编码课程教学的改革

鉴于课程本身特点及本科生的知识结构,从理论、实验、考核方式方面提出了一些改革。

3.1 理论教学方面的改革

(1)理论联系实际,激发学生学习热情

本课程涉及大量数学知识,理论性强。在教学过程中适当结合社会生活现象,往往会引起学生的兴趣,提高学生对本课程的学习积极性。在讲信息量时,由于信息量是事件发生概率对数的负值,所以事件发生的概率越小,信息量越大,事件发生的概率越大,信息量越小。如果2队实力相当的篮球队员比赛,2队获胜的几率相当,信息量就大,大家看比赛的兴趣就高;如果2队实力悬殊,比赛结果基本是肯定的,大家就几乎没有激情去关注这场比赛,所包含的信息量就小。

(2)鼓励学生提前预习,课后复习

在课堂教学计划中,首先列出本课中所涉及的相关数学知识,让学生做好相关知识的预习;对该课中应用的重要数学知识应进行特殊说明,为部分深入研究的学生提供借鉴。例如在学习信息度量前,建议学生预习高等数学和概率的某些知识;在讲信道容量时,提醒学生预习线性代数等。

(3)选择合适的教材,重点突出

在选择教材时,要充分考虑到学生的实际情况,考虑教材的实用性。强调学生对基本原理的理解。教材所涵盖的数学知识尽量在本专业所学过的数学范围内,尽量做到学生在学习时不陌生,并尽量以通俗形象的语言描述基本概念、原理以及结论。尽量避免复杂的数学推导证明,直接给出结论即可,根据物理模型和数学表达式分析物理含义,并说明在通信系统中如何应用。这样一定程度上增强学生学习的自信心,强化对知识的理解。

(4)教学手段多样化

在实际教学过程中,可以采用板书、多媒体和小组讨论等多种教学手段。对于课程中的难点、重点需要学生充分掌握的定理,应在黑板上认真分析、讲解,既能加深学生的理解又能引起学生重视;对于节标题、定理的说明,数学公式的最终表达等可以通过形象直观的多媒体呈现给学生;在教学中也可以根据教材内容、教学要求为学生拟定有启发性的讨论题目。讨论结束后,教师对每组学生的讨论结果进行总结,对学生的不同观点给予明确答复,指出讨论中存在的不足,使学生通过对理论的深入理解,解决存在的理论理解偏差问题。

3.2 实验实践教学的改革

有些高校没有开设实验课,只是纯理论讲解;有些高校开设了实验,但也只是验证性的实验。本课程实验可以“信息论与编码”课程的基本内容为出发点,在验证性实验基础上引入综合性实验。课程实验既有课堂展示实验,又有验证性实验,还有综合性实验。教师首先将一些MATLAB实现的结果在课堂上演示给学生,让学生对知识点有个感性的认识,主要以理论的验证为主,例如霍夫曼编码、费诺编码的演示实验;其次是算法的验证性实验,主要是增强学生对所学知识的理解,培养学生的应用能力;再次就是综合性实验,这类实验学生可以根据自己的课余时间和兴趣去完成,如语音编码和图像编码的应用实验等。实验结束后,学生可以向老师汇报实验结果,总结实验得失。

3.3 考核方式的改革

课程的考核方式分为3部分:平时成绩、实验成绩、期末考试成绩,各占30%、30%、40%。平时成绩主要由课堂考勤、平时作业完成质量,上课参与课堂教学,参与小组讨论等各方面综合考虑;实验成绩以实验考勤、实验操作、实验报告完成质量,以及对实验整个过程的理解分析来进行考核;期末考试以卷面分数为主,考试内容注重考核学生对基本概念、原理和方法的掌握情况,考查学生综合分析问题的能力。该方式改进了以前闭卷考试的单一的考核方式,由于平时学习占据很大的比例,所以学生能够认真对待教学中的每一个环节,注重平时课程的学习,缓解了备战闭卷考试的压力。

4 结论

“信息论与编码”是一门理论和实践都很强的课程,本文分析了“信息论与编码”课程的特点和地位,讨论了教学存在的一些问题,提出了一些改进的方法。但是教学改革是一个长期的不断探索、逐步完善的过程。只有不断改进教学方法,不断更新教学内容,不断总结教学经验,不断提高自己的业务水平和素质,才能进一步培养学生的实践能力和创新能力,才能更好的促进学生的学习积极性,进而提高教学质量,为信息社会培养更多有用人才。

参考文献

[1]吕锋,王虹等.信息理论与编码(第2版)[M].北京:人民邮电出版社,2010.

[2]Cover M Thomas,Joy A Thomas.Elements of In-formation Theory[M].阮吉寿,张华,译.北京:机械工业出版社,2007.

[3]马杰,张志伟,张小美,等.“信息论与编码”课程教学改革与实践[J].中国电力教育,2013(16):90-91.

[4]时翔.“信息论与编码”课堂教学方法的改革与实践[J].中国电力教育,2013(4):69-70.

[5]燕善俊.信息论与编码课程教学探讨[J].高等函授学报(自然科学版),2011,24(2):9-11.

[6]刘孝锋.新建本科“信息论与编码”教学改革探讨[J].中国电力教育,2011(25):130-131.

信息论与编码 篇10

0 引言

信息论理论基础的建立,一般来说开始于香农(Shannon)在研究通信系统时所发表的论文。他在1941年至1944年对通信和密码进行深入研究,并用概率论的方法研究通信系统,揭示了通信系统传递的对象就是信息,并对信息给以科学的定量描述,提出了信息熵的概念。还指出通信系统的中心问题是在噪声下如何有效而可靠地传送信息,而实现这一目标的主要方法是编码。

1 信道编码的应用与研究

1.1 信道编码的现状

信道编码是通过信道编码器和译码器实现的用于提高信道可靠性的理论和方法,是信息论的内容之一。信道编码大致分为两类:(1)信道编码定理,从理论上解决理想编码器、译码器的存在性问题,也就是解决信道能传送的最大信息率的可能性和超过这个最大值时的传输问题;(2)构造性的编码方法以及这些方法能达到的性能界限。编码定理的证明,从离散信道发展到连续信道,从无记忆信道到有记忆信道,从单用户信道到多用户信道,从证明差错概率可接近于零到以指数规律逼近于零,正在不断完善。编码方法在离散信道中一般用代数码形式,其类型有较大发展,各种界限也不断有人提出,但尚未达到编码定理所启示的限度,尤其是关于多用户信道,更显得不足。在连续信道中常采用正交函数系来代表消息,这在极限情况下可达到编码定理的限度。不是所有信道的编码定理都已被证明。只有无记忆单用户信道和多用户信道中的特殊情况的编码定理已有严格的证明,其它信道也有一些结果,但尚不完善。

1.2 信道编码的研究

数字电视中常用的纠错编码通常采用两次附加纠错码的前向纠错(FEC)编码。前向纠错码(FEC)是具有一定纠错能力的码型,它在接收端解码后,不仅可以发现错误,而且能够判断错误码元所在的位置,并自动纠错。这种纠错码信息不需要储存,不需要反馈,实时性好。所以在广播系统(单向传输系统)都采用这种信道编码方式。

信息论主要应用于通信领域,在有噪信道中传输信息的最优方法到今天还不十分清楚,特别是在数据的信息量大过信道容量的情况下更是毫无所知,这是经常遇到的情况。

2 现有信息理论的缺陷

(1)信息对象的层次区分没有得到重视。不少研究者将本体论层次的信息与认识论层次的信息混为一谈,将普适性信息范畴与具体科学,特别是技术层次(如通信、控制、计算等)的信息概念混为一谈。抓住信息的某一层次或某一方面当成信息对象的总体。

(2)对产生和构成信息存在的基本要素、对象及关系区分不清。如将对象的直接存在(对象的物质、能量、相互作用、功能等存在)当成信息存在;将信息的载体存在当成信息存在;将信息与载体的统一体当成信息存在;把信宿获得的“实得信息”当成唯一的信息存在,这是主观信息论。或者把信源和信道信息当成唯一的信息存在,称之为客观信息论。这二种极端的信息理论正是忽略了信息在关系中产生、在关系中存在的复杂本质。忽略了信息存在至少涉及三个以上对象及复杂关系。

(3)适用于复杂信息系统的理论比较少。目前的狭义与广义信息论大多是起源和立足于简单系统的信息理论,即用简单通讯信息系统的方法来类比复杂系统的信息现象,将复杂性当成了简单性来处理。而涉及生命现象和人的认识论层次的信息是很复杂的对象,其中信宿主体内信息的语义歧义和信息创生问题是难点,用现有信息理论难以解释。

(4)现有信息理论体系中缺乏核心的“实有信息”概念。

(5)现有信息理论对信宿实得信息的理解过于简单,没有将直接实得信息与间接实得信息区别开来。

(6)现有信息理论不能很好地解释信息的创生和语义歧义问题。

3 信道编码的发展与前景

移动通信的发展日新月异,从1978年第一代模拟蜂窝通信系统诞生至今,不过20多年的时间,就已经过三代的演变,成为拥有10亿多用户的全球电信业最活跃、最具发展潜力的业务。尤其是近几年来,随着第三代移动通信系统(3G)的渐行渐近,以及各国政府、运营商和制造商等各方面为之投入的大量人力物力,移动通信又一次地在电信业乃至全社会掀起了滚滚热潮。

移动通信的强大魅力就是它能为人们提供了固话所不及的灵活、机动、高效的通信方式,非常适合信息社会发展的需要。但同时,这也使移动通信系统的研究、开发和实现比有线通信系统更复杂、更困难。实际上,移动无线信道是通信中最恶劣、最难预测的通信信道之一。由于无线电波传输不仅会随着传播距离的增加而造成能量损耗,并且会因为多径效应、多普勒频移和阴影效应等的影响而使信号快速衰落,码间干扰和信号失真严重,从而极大地影响了通信质量。为了解决这些问题,人们不断地研究和寻找多种先进的通信技术以提高移动通信的性能。特别是数字移动通信系统出现后,促进了各种数字信号处理技术如多址技术、调制技术、纠错编码、分集技术、智能天线、软件无线电等的发展。

1993年出现的Turbo码,由于其很好地应用了编码定理中的随机性编译码条件和最佳译码算法,而获得了几乎接近香农理论极限的译码性能,立即在通信界引起了研究Turbo码的热潮。

3.1 Turbo码的信道编码方式及研究

在第三代移动通信系统中,信道编码方案已不仅仅是纠错码的选择、编译码算法和交织算法的问题,它还涉及与高层消息的通信,如从高层获得业务质量指示、业务复用方式等信息,以实现不同业务的不同编码和复用方案,从而以最高的效率提供多种业务的组合等问题。

WCDMA的信道编码方案包括以下几部分:纠错编码/译码(包括速率适配)、交织/解交织、传输信道映射至/分离出物理信道。

近几年来,人们对Turbo码的编译码结构及译码算法进行优化和改进,以期进一步提高Turbo码的译码性能,考虑硬件实现的可行性,并试图从理论上解释其性能优越的根本原因。

3.2 Turbo码在第三代无线通信中的应用

信道编码技术可改善数字信息在传输过程中由于噪声和干扰而造成的误差,提高系统可靠性。因而高效的信道编译码技术成为3G移动通信系统中的关键技术之一。3G移动通信系统所提供的业务种类的多样性、灵活性,对差错控制编译码提出了更高的要求。WCDMA和CDMA2000方案都建议采用除与IS-95CDMA系统类似的卷积编码技术和交织技术之外的Turbo编码技术。

3.3 Turbo码与其他技术的结合

随着Turbo码的研究发展,在3G移动通信系统设计中,Turbo码以及Turbo思想越来越多地被用于和其他技术的结合上。例如在CDMA中,由于Turbo码编码中使用交织,可以通过分散信息码元的位置降低扩频码间的相关性。实现时,将Turbo码与DS-CDMA系统的扩频编码结合起来,扩频码做内码,Turbo码做外码,用交织器相连,类似于级联码的形式。接收端,先通过匹配滤波器分离出各用户的接收信息,再根据信道模型计算出传递条件概率进行解扩,经过分支概率产生器后得到各个用户接收信息的后验概率,分别送入相应的Turbo码译码器,每个译码器得到一个软判决输出和一个边信息,其中边信息送回分支概率产生器,作为下一次迭代译码的先验信息,从而实现了Turbo码的迭代译码。此外,Turbo码与调制结合的T-TCM,Turbo码与ARQ结合,Turbo码的迭代思想用于多用户检测,已成为现在3G移动通信技术研究中的热点。

摘要:信息论理论的建立,提出了信息、信息熵的概念,接着人们提出了编码定理。编码方法有较大发展,只有无记忆单用户信道和多用户信道中的特殊情况的编码定理已有严格的证明,其他信道也有一些结果,但尚不完善。但近几年来,第三代移动通信系统(3G)的热衷探索,促进了各种数字信号处理技术发展,而且Turbo码与其他技术的结合也在不断完善信道编码方案。

关键词:信息论,纠错编码,3G,Turbo码

参考文献

[1]张棕橙.纠错编码原理和应用[M].北京:电子工业出版社,2003.

[2]孙桂萍,刘君,唐艳娜.Turbo码的基本原理及发展[J].科技信息(学术研究),2008,(19).

[3]吕安强,尹成群.新一代纠错编码技术——Turbo码[J].电力系统通信,2004,(11).

信息论与编码 篇11

关键词:CDK5基因;物种;生物信息学

中图分类号: Q813 文献标志码: A 文章编号:1002-1302(2014)07-0032-03

收稿日期:2013-10-17

作者简介:张永改(1987—),女,河北定州人,硕士研究生,从事动物遗传学研究。E-mail:zhangyonggai1022@126.com。

通信作者:李祥龙,博士,教授,从事动物遗传学研究。E-mail:lixianglongcn@aliyun.com。CDK5主要参与神经元正常功能的维持,但在非神经元的组织或细胞中也广泛表达并发挥作用[1]。研究表明,CDK5可能通过调节黑色素细胞核中MITFmRNA、TYR的表达,从而参与调控羊驼毛色的形成[2]。在羊驼皮肤组织中,Agouti基因、MC1R基因、酪氨酸酶基因家族、KIT基因、CDK5基因都参与了羊驼毛色的形成与调控[3]。本研究利用比较基因组学、生物信息学方法研究了该基因编码区种间、种内变异,以期探明该基因在不同种间及种内的遗传分化,进而为相关黑色素基因的遗传学分析奠定基础。

1材料与方法

1.1序列来源

2.3.3信号肽的预测、分析信号肽位于蛋白质的N端,用于指导分泌性蛋白到内质网膜上合成。利用在线工具 SignalP 3.0 Server分析人CDK5氨基酸序列的信号肽的存在位置及序列,结果显示,人的CDK5氨基酸序列无信号肽[7]。 对其余几个物种CDK5氨基酸序列的信号肽的存在位置及其序列进行相应的分析,也得到了一致的结果。

2.3.4跨膜结构域的预测和分析跨膜结构域通常是由跨膜蛋白的效应区域所显示。利用在线工具TMHMM 2.0 Server预测人CDK5氨基酸序列的跨膜结构域,结果显示,其不具跨膜结构域,在细胞膜外与细胞膜内都有CDK5肽链[8]。对其他物种CDK5氨基酸序列的跨膜结构域进行分析,得到的预测结果与人的相似。结合上述导肽的预测,可以推测CDK5在细胞质基质中合成后,很可能也要转运到膜外,该蛋白可以在细胞质与细胞膜外行使其功能。

2.3.5疏水性/亲水性的预测和分析蛋白质亲/疏水性氨基酸的组成是蛋白质折叠的主要驱动力。蛋白质在折叠时会形成疏水内核、亲水表面,同时在潜在跨膜区会出现高疏水值区域,据此可以测定跨膜螺旋等二级结构及蛋白质表面有氨基酸分布[9]。利用在线工具ProtScale预测人CDK5氨基酸序列的疏水性/亲水性,结果表明,精氨酸(Arg)具有最低分值-4.500,亲水性最强,异亮氨酸(Ile)具有最高分值4.500,疏水性最强[10]。总体来看,亲水区域明显大于疏水区域。因此,整个多肽链表现为亲水性。对其他物种CDK5氨基酸序列的疏水性/亲水性进行预测,其预测结果与人的相似,因此认为CDK5蛋白是亲水性蛋白。

2.3.6二级结构的预测和分析蛋白质的二级结构是指氨基酸残基形成的α-螺旋、β-转角、β-折叠片延伸链、无规则卷曲。用SOPMA对10个物种的CDK5氨基酸序列的二级结构进行预测,结果表明,CDK5蛋白质二级结构的主要结构元件是α-螺旋(39.73%~42.81%)、无规则卷曲(34.93%~38.70%),其次是β折叠延伸链(13.46%~14.73%)、β-转角(6.75%~8.85%)[11-13]。

3结论

本研究表明,不同物种间CDK5基因的核苷酸歧异度、净遗传距离、单倍型间的遗传距离差异都较大,种内及种间遗传分化明显。CDK5基因对密码子有较强的偏爱性,非同义替换位点数均明显高于同义替换位点数,CDK5基因在进化过程中可能受到正向选择的影响。CDK5基因物种间的亲缘关系与动物学分类相符。CDK5蛋白N 端无信号肽、无导肽、无跨膜结构域,整个多肽链表现为亲水性,蛋白质二级结构的主要元件为无规则卷曲、 α-螺旋,除此之外还有少量β 折叠、β 转角。

参考文献:

[1]刘佳,董常生,范瑞文,等. 周期素依赖性蛋白激酶-5在不同毛色羊驼皮肤中的表达[J]. 畜牧兽医学报,2010,41(4):478-483.

[2]张瑞娜,范瑞文,程志学,等. CDK5对羊驼皮肤黑色素细胞TYR和MITF mRNA表达的调节[J]. 畜牧兽医学报,2011,42(12):1712-1717.

[3]邸文达,杨川. 羊驼毛色相关基因研究进展的综述[J]. 畜牧与饲料科学,2012,33(8):84-86.

[4]Smith S D,Kelley P M,Kenyon J B,et al. Tietz syndrome(hypopigmentation/deafness)caused by mutation of MITF[J]. Journal of Medical Genetics,2000,37(6):446-448.

[5]李易. 基因进化的同义与非同义替代计算及统计检验的比较分析[J]. 曲靖师范学院学报,2006,25(6):1-8.

[6]强毅. 植物蔗糖磷酸合成酶的生物信息学分析[J]. 现代生物医学进展,2007,7(4):557-560,570.

[7]Emanuelsson O,Nielsen H,Brunak S,et al. Predicting subcellular localization of proteins based on their N-terminsl smino acid sequence[J]. Molecular Biology,2000,300(4):1005-1016.

[8]Ikeda M,Arai M,Lao D M,et al. Transmembrane topology prediction methods:a re-assessment and improvement by a consensus method using a dataset of experimentally-characterized transmembrane topologies[J]. In Silico Biology,2002,2(1):19-33.

[9]薛庆中. DNA和蛋白质序列数据分析工具[M]. 3版.北京:科学出版社,2010.

[10]Kyte J,Doolittle R F. A simple method for displaying the hydropathic character of a protein[J]. Journal of Molecular Biology,1982,157(1):105-132.

[11]Geourjon C,Deléage G. SOPMA:significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Comput Appl Biosci,1995,11(6):681-684.

[12]薛永常,聶会忠,刘长斌. 木质素合成酶 C3H基因的生物信息学分析[J]. 生物信息学,2009,7(1):13-17.

浅谈信息分类与编码的实施 篇12

随着企业信息化程度的提高,企业普遍采用各种信息管理系统来存储、管理、使用企业生产、经营和管理活动产生的数据,各种信息管理系统己经成为企业运营的核心支撑平台,如DSS(决策支持系统)、EI S(主管信息系统)、CI MS(计算机集成系统)、ERP(企业资源规划)等。然而,各种信息资源可能在地理上分布在世界各地,随时间动态地变化,而涉及相应的应用系统之间缺乏关联,信息编码不唯一,往往形成了企业内部一个个“信息孤岛”,这已成为信息化建设进程中的瓶颈问题。

因此,如何将分散、孤立的各种信息资源数据变成网络化共享的信息资源数据,将众多“孤岛式”的信息系统进行整合,实现信息的畅通和共享,是信息化建设中亟待解决的问题。

通过分析可以发现,形成“信息孤岛”的原因很多,有硬件、软件方面的原因,也有管理上的原因。而其中最重要的原因是信息资源缺少统一的数据标准和规范,尤其是在应用系统软件的设计上对一些需统一的公共数据项的设计和编码基本是各自独立,系统之间互不兼容,增加了信息交换的难度,从而无法实现信息资源共享。因此,迫切需要将企业网络各个结点上的独立信息资源集成为一个整体,通过网络互连、数据共享和应用程序共享,实现企业信息资源的综合利用,从而提高整个社会的劳动生产效率和管理水平,以满足企业业务发展的需求。这种需求反映到技术层面上,其首要解决的问题就是对企业的信息资源进行统一的信息分类与编码。

1 信息分类与编码概述

信息分类与编码(Information Classification and coding)是根据信息内容或特征,将信息按照一定的原则和方法进行区分和归类,建立一定的分类系统和排列顺序,并用一种易于被计算机和人识别的符号体系表示出来的过程,也是合理地将信息对象数字化、符号化的过程。信息分类、编码的目的是促进各个异构数据源之间的数据共享和交换,从而有效地利用信息资源,提高整个应用系统的性能。企业级信息分类编码是在企业信息系统环境下,统一对整个企业范围内的信息进行分类与编码,而这种统一目标不是单一的,更多的是多个目标的综合。在企业信息化进程中,只有当企业基础信息按照一定的规律进行分类和编码,将其合理有序地存入计算机,才能快速、有效地对它们进行存储、管理、检索分析、输出和交换。信息分类编码已经成为企业基础数据标准化建设与基础数据库数据组织、存储、管理和交换的共同基础,也是实现数据共享与互操作的必然。

信息分类与编码是标准化的一个领域,目前已经发展成为了一门学科,有自身的研究对象、研究内容和研究方法,也已经成为信息科学的一个重要分支。在工业社会中,信息分类与编码是提高劳动生产率和科学管理水平的重要手段。正如美国新兴管理学的开创者莫里斯L·库克(MorrisL·Cooker)所说:“只有当我们学会了分类和编码,做好简化和标准化工作,才会出现任何真正的科学的管理”。在信息化时代,信息的标准化工作越来越重要,没有标准化就没有信息化,信息分类编码标准是信息标准中最基础的标准。

1.1 信息分类与编码的原则

(1)信息分类与分类原则

信息分类应根据信息内容的属性或特征,将信息按一定的原则与方法进行区分和归类,形成一定的分类系统和排列顺序,以便管理和使用信息。如设备分类:通用设备、专用设备、其他设备等。

信息分类是否科学、合理直接影响到信息的处理和传递,信息代码是否规范和标准直接影响到信息的交流与共享。因此,信息分类应遵循系统性、实用性、可扩展性、兼容性、综合实用性等基本原则。

(1)系统性原则:企业信息资源存在着密切的联系和广泛的交叉,因此信息资源分类应坚持系统性原则,即在满足学科领域相对独立的基础上,以数据属性一致性为基本内容,简化分类体系,减少信息冗余,优化分类结构。

(2)实用性原则(可操作性):信息资源分类的终点是有相同属性的数据集,也是用户的最终应用层。因此在信息分类的终点处要充分考虑可操作性,使最后的分类体系既能满足用户对信息使用的简洁易懂需求,也有利于信息提供者设计和编制代码集。

(3)可扩展性原则:考虑到企业信息资源的内容会随着时间推移、业务的发展而不断扩展,因此信息分类体系应具有充分的可扩展性。

(4)兼容性原则:信息分类应与相关标准(包括国际、国内、行业标准)协调一致,满足系统间的信息交换的要求。

(5)综合实用性:分类要从系统工程角度出发,将局部问题放在系统整体中处理,达到系统最优。即在满足系统总任务和总要求的前提下,尽量满足系统内部和相关单位的实际需要。

(2)信息编码与编码原则

信息编码是将某一类信息赋予一定的符号。

信息代码结构直接影响信息系统的运行性能,因此,信息编码应遵循唯一性、扩充性、简明性、合理性、适用性、规范性、完整性、不可重用性和可操作性等原则。

(1)唯一性:一个代码只能唯一地标识一个分类对象。

(2)扩充性:必须留有备用代码,允许新数据的加入。

(3)简明性:代码结构应尽量简短明确,占有最少的字符量,以便节省机器存储空间。

(4)合理性:代码结构应与分类系统相适应。

(5)适用性:代码应尽可能反映编码对象的特点,适用于不同的相关应用领域,支持系统集成。

(6)规范性:同一层级代码的类型、结构以及代码的编写格式必须统一。

(7)完整性:所设计的代码必须是完整,不足位数要进行补位。

(8)不可重用性:出现人事、机构、物资等编码对象发生变动时,其代码要保留,但不得再分配给其他人员、机构等编码对象使用(即一个代码给一个对象,任何情况下,不得再给另一个对象使用)。

(9)可操作性:代码应尽可能方便事务员和操作员的工作,减少机器处理时间。

1.2 信息分类与编码的作用

信息分类与编码是信息系统信息化建设的基础性工作,是各信息系统之间信息一致性传输交换的基石,是实现信息系统共享和系统之间互操作的前提和基础。

总结信息分类与编码的作用,可归结为如下:

(1)提高系统间信息沟通的效率,提高系统运行效率

通过信息分类与编码,有利于简化信息的采集工作。由于有统一的信息采集语言,综合信息便可直接取自相应的信息系统,系统内所需的通用信息可由主管部门采集,提供相关的部门单位使用,使原始信息保持一致,这样既充分利用了各部门各类分散的信息,又简化了信息的采集过程;其次,通过统一信息的表示法,可以减少数据变换、转移所需的成本和时间;第三,通过信息分类编码,提高了信息的有序化程度,降低数据的冗余度,从而提高信息的存贮效率。

(2)减少信息的重复录入,减少无用的工时投入

信息分类与编码形成标准统一,最大程度地消除因对信息的命名、描述、分类和编码不一致所造成的误解和分歧;减少一名多物、一物多名,对同一名称的分类和描述的不同,以及同一信息内容具有不同代码等现象;做到事物或概念的名称和术语统一化、规范化;并确立代码与事物或概念之间的一一对应,以改善数据的准确性和相容性,消除定义的冗余和不一致现象。

(3)减少系统重复投资,避免专项的系统接口开发

实现信息交换与共享的前提和基础是各信息系统之间传输和交换的信息语义具有一致性,即当使用一个代码或术语时,所指的是同一信息内容。这种一致性是建立在各信息系统对每一信息的名称、描述、分类和代码共同约定的基础上,信息分类与代码标准作为信息交换和资源共享的统一语言,不仅为信息系统间资源共享创造必要的条件,而且还使各类信息系统的互通、互连、互操作成为可能,从而避免为数据交换与共享开发各系统接口。

(4)指导信息化建设,促进企业信息化的跨越发展

通过对构建完整的企业进行信息分类编码体系的建设,形成企业统一信息分类编码标准;通过建立企业级编码管理系统,能够动态管理企业信息编码,实现信息编码系统与应用信息系统之间的集成。

2 信息分类与编码的实施思路

2.1 总体思路

信息分类与编码是信息化建设的基础性工作,同时又是一项涉及到整个企业信息化建设的系统工程。因此,在实施信息分类与编码的过程中,一定要以信息系统的需求为基础,以实用为出发点,采取“统一规划,明确目标,分步实施”的工作思路和多样化的手段。

在信息分类与编码实施过程中,首先要调查全企业信息资源情况,摸清各类信息的分布与处理流程。做出信息分类与编码的统一规划,明确目标,确定企业信息分类与编码的原则和方法,编制信息分类与编码的总体方案和指导性文件。

然后,在总体原则指导下,充分发挥企业各个层面和各类技术人员、管理人员、业务人员的聪明才智,对各种信息资源进行分步实施分类与编码。对容易界定、容易分类与编码的信息,可采取原型化方法进行重点突破,让参与实施的业务人员看到实效,从而推动实施工作的稳步前进;对难于界定、不好定性分类的信息,要参照国际、国家、行业做法,适度考虑企业现有分类编码的使用情况,从信息采集、信息分类、信息编码三个阶段稳步推进。

2.2 具体实施步骤

信息分类与编码是一项复杂、繁琐的工作,涉及到全企业各个部门、各个层面,参与的人员较多,所以我们提出“统一思想、制定人员分工、编码对象的采集、信息流分析、信息分类、信息编码、建立编码管理系统以及处理原有编码”的具体步骤。

(1)统一思想:由于信息分类与编码涉及企业方方面面,所以企业内部要统一思想,充分认识信息化网络建设中信息分类与编码工作在新一代信息系统中的重要地位,以及实施信息分类编码的必要性,要求大家克服困难,协助实施人员做好每一项工作。

(2)制定人员分工:在整个实施过程中,应由项目组的管理人员进行把关,编码对象的采集、分类和具体的编码由I T人员协助业务人员具体去完成,编码结构应由业务人员协助I T人员去完成。

(3)编码对象的采集:可以进行信息分类与编码的对象很多,我们不可能面面俱到,到底哪些是有用的,确实需要进行分类与编码,这需要我们对整个企业的所有业务系统进行梳理,对业务活动进行分析,把具有共性的信息抽取出来作为分类与编码的主要对象。

(4)信息流分析:在提取了编码对象后,我们要明确该编码对象在企业内部的产生、流动过程,分析各信息系统所关注该编码对象的特征属性。只有清晰的信息流动过程才能确定合理的编码结构,并明确编码的源头单位;只有分析了该编码对象的特征属性,才能确定编码结构中应该体现的核心特征。

(5)信息分类:信息分类就是根据信息内容的本质属性或特征,按分类原则和方法进行区分和归类。具体来说要根据现状调研收集到的信息特征来确定分类清单,然后进行分类论证,最后根据论证情况,还要修改分类方案,对不全的信息进行补充,最终完成信息分类过程。

(6)信息编码:信息编码就是按照编码原则和方法将编码对象赋予一定规律性的、易于计算机和人识别与处理的符号的过程。在这个过程中,重点是根据分类情况制定编码规则。

(7)建立编码管理系统:这个过程主要是开发一个软件,建立起代码系统。代码系统的建立是按照编码规则对编码对象进行编制代码的过程。而代码子系统的建立是依据信息分类编码体系来确定,一般来说一个类目就是一个子系统,而一个子项就对应着一条编码规则。

(8)原有编码的处理:在实施过程中,要对原有编码进行梳理、筛选、优化和统一。不能一票否认原有编码的不足,对暂时无需进行信息共享和交换的编码可以保留不变,对需进行信息共享和交换的编码采用对照表的形式转换,达到统一编码。这样信息分类与编码的实施才能既见成效,又不影响现有业务系统的正常运行。

3 结束语

信息的分类与编码工作是实现信息表达、交换与共享以及信息系统集成的基础,是企业系统集成的前提。而信息分类与编码又是一项很繁重的工作,涉及单位每个部门。因此,在实施过程中,既要扫除一些业务部门的障碍,又要充分发挥业务部门的智慧,一定要注重信息分类与编码的实效。

参考文献

[1]李新通,黄勇.国家资源环境数据库信息分类编码及运用模式[J].地理学报,2002,(57):11-17.

[2]高复先.信息资源规划—信息化建设基础工程[M].北京:清华大学出版社,2002.

[3]赵艳华.我国信息分类编码标准化的实践[J].中国标准化,2001,(10):7-8.

[4]规划之源——信息资源规划(I RP)系列讲座之三[EB/OL].

[5]曾三明.信息分类与编码——信息化建设实施者的“补修课”[J].科技信息,2008,(7).

[6]李锡臣.强化信息分类与编码促进信息资源标准化[J].电力信息化,2007,(5).

[7]蔡建化.国防仓库信息化管理的研究与实现[J].微计算机信息,2007.

上一篇:财务审计风险下一篇:沈阳机床