数字特征(共12篇)
数字特征 篇1
我国是一个煤炭大国,煤炭存储量和开采量都位居世界前列。但是,近年来我国的煤炭产业逐渐出现了许多危机。比如说资源危机,煤炭属于不可再生资源,经过长时间的开采,我国的煤炭资源已经逐年减少;还有安全危机,煤炭开采需要深入矿井作业,时刻会受到安全威胁,每年都会出现煤炭安全事故的报道;又例如环保危机,煤炭开采对于地质环境和周边的生态环境都会带来破坏,在很大程度上影响了我国环境保护工作的进展。面临这些煤炭产业危机,必须改革现有的煤炭开采和管理方式,在减少负面影响的前提下保持甚至提高煤炭产业的效益,这就需要结合现代科学技术对煤炭管理进行改革。因此,产生了数字矿山的概念。
数字矿山结合了采矿科学、信息科学、计算机技术、3S技术、人工智能技术,建立更加信息化的管理平台和管理方式,用更加科学的手段减少了危机发生的概率,同时还通过优化技术和管理提高了生产效率,逐渐成为我国煤炭企业发展的主流方向。
1 数字矿山的特征
1.1 信息处理时效性
数字矿山与传统的煤炭管理有非常重要的区别,即信息的传送和处理更加依赖于现代网络通信技术。在传统的煤炭工作过程中,矿山技术人员在上午去矿山考察,记录下关键的数据之后,要下午才能够将信息传达到处理中心,然后还需要处理人员经过复杂的统计和分析才能够得到有效的数据信息,最后才能够依据这些信息进行决策,这样的信息处理速度是非常慢的,并且在很大程度上影响了信息的有效性。而数字矿山则利用网络通信方式有效地解决了信息处理的时效性问题。基于企业宽带,管理人员与矿山现场的工作人员和技术人员能够进行实时的信息交换,矿山的数据信息、地质信息以及开采的实时报告等都可以迅速传到控制中心进行处理;基于一些可视化的软件,还可以将矿山现场与控制中心进行连接,管理控制人员可以直接观察开采现场的具体情况,进行实时指挥和调度,及时监测矿井的排水、通风情况,检查边坡、排土场、尾矿库的稳定情况;控制中心也可以将信息及时反馈给采矿现场,提供更加及时的天气、地震情况等信息,让现场的工作人员能够及时进行防范。
1.2 开采安全性
在煤炭开采过程中,安全性是非常重要的主题,是开采过程中的第一要素。传统的煤炭管理方式由于信息交流速度慢、缺少模拟演示,很多时候都是在危险发生之后才会收到相关的信息,这时很可能已经造成了严重的人员伤亡。数字矿山则基于强大的信息传播和处理速度能够在很大程度上进行安全预警和危机分析,减少发生安全事故的可能性。比如说,基于数字矿山的模拟技术,能够先对将要开采的部位的地质情况进行分析,掌握各种岩层的稳定情况,甚至对可能发生的地质运动情况进行模拟,以此为依据,能够对开采的顺序、位置等进行相应的调整,尽量减少开采对地质带来的不利影响,这样能够有效降低危机发生的概率;或者是在出现危机预兆时,数字矿山能够通过实时的观察和监测及时做出预警,开采人员和控制人员都能够快速做出正确的反应,这样能够在很大程度上减轻危险带来的后果,从多个方面提高开采的安全性。
1.3 生产经济性
在煤炭产业中,经济效益也是非常重要的因素,落后的开采技术和管理方式会在很大程度上降低生产效率,影响煤炭企业的收益情况。数字矿山则能够快速提高生产的经济效益。首先,数字矿山能够减少管理和技术人力,只需要主要的系统操作人员就可以实现过去需要大量技术人员和管理人员才能够取得的管理效果;其次,数字矿山能够提供更有效率的开采技术和方案,在很大程度上能够提高生产效率;数字矿山还可以对开采人员进行模拟训练,提高开采人员的技术水平,这样也能够进一步提高生产效率。通过科学的方法和技术提高了开采的效率,自然能够有效促进煤炭企业收益的提高,促进企业发展。
2 数字矿山的建设策略
2.1 建立完善的可视化模型
资源和开采环境的可视化模型是整个数据矿山的基础,其中包括了各个方面的可视化模型,最主要的有地质数据及矿床模型等。通过建立完善的可视化模型系统,才能够发挥出数字矿山的作用,实现对地质情况和开采情况的实时控制、信息的实时交换和处理、危机的实时预警等作用。数字矿山可视化的模型建立基于不同的技术支持,以地质数据模型为例,该模型主要是基于RS、GPS、GIS等实时信息采集手段以及常规测量、取样化验等快速的信息处理手段,首先,系统使用信息采集技术可以获取矿山的具体空间和属性信息等;然后对信息进行预处理,比如说将图片信息进行量化、坐标转换处理等;最后使用GIS等软件将获取的地质、岩层、矿石等数据信息利用不同的图层进行管理和表示,并最终输出易于理解和分析的数据结果,帮助管理者下达决策。
2.2 建立高效的通信系统
数字矿山包括了整个矿山与管理机构甚至企业的通信系统,高效的通信系统是信息交流的保证,矿井的通信承担着生产调度、信息传递、抢险救灾的重要任务。目前,数字矿山中的通信系统主要可以采用有线骨干网加无线WIFI的组合形式来构成,有线骨干网是整个网络通信系统的主要部分。通过假设光纤来支持矿井深处的通讯,一般采用千兆光纤,这样能够保证通讯效果,并且能够更好地阻止外界对通讯情况的干扰;除了有线网络的构建以外,还可以增加无线网络进行辅助,无线网络不需要网线接入,可以弥补有线网络对于地点和设备的限制,但是无线网络的信号容易受到干扰,因此需要通过有线+无线的方式来构建整个数字矿山的通信系统,提高通讯的效率。
2.3 建立科学的决策支持系统
数字矿山基于可视化模型和通信系统,能够为矿山的管理者提供非常多的信息,尽管这些信息已经是处理过的有效信息,但是如果不进行更加详细的分类管理,也很难起到辅助决策的作用,因此,为了发挥数字矿山辅助决策的作用,应该建立更加系统科学的决策支持系统。例如将整个决策系统分为财务管理系统、生产成本控制系统、人事管理系统、工程计算系统等,将数字矿山产生的大量数据信息进行分类,分别传送到相应的系统内部进行更加详细的分析,煤炭企业不同的管理部分负责人就可以参考更加有效的管理信息,根据这些信息处理结果进行决策分析和判断。高效的决策支持系统能够减少决策过程中的冗余过程,提高煤炭企业管理者的决策效率,进而对整个开采工程的生产、管理都能够起到积极的促进作用。
3 结束语
数字矿山基于现代信息技术和信息采集技术,能够为煤炭企业提供更好的管理效率,具有时效性、安全性、经济性等优点,煤炭企业应该提高自身的技术水平,通过建立可视化模型系统、矿山通信系统、决策支持系统来形成完整的数字矿山系统,利用该系统能够有效克服目前煤矿开采中存在的各种问题,提高生产效率,既能够提高煤炭企业本身的发展,更能够促进我国煤炭工业化、现代化的发展,加快我国煤炭技术的创新发展速度。
摘要:随着我国煤炭产业的不断发展,煤炭产业技术变得更加工业化、信息化,并逐渐产生了数字矿山的概念。数字矿山是采矿科学、信息科学、计算机技术、3S技术、人工智能等技术发展结合的产物,在煤炭产业中起到了非常重要的作用,有效提高了我国的煤炭开采效率和经济效益。本文深入分析数字矿山的特征,提出建设数字矿山的关键策略。
关键词:数字矿山,特征,建设策略
参考文献
[1]刘子成.浅析数字矿山的特征及开发[J].世界有色金属,2012,1:61-63.
数字特征 篇2
光变油墨的变色效果来自于它含有一种重要的添加材料,这是一种微小、多层、透明的光学薄膜,加入油墨中犹如成千上万个镜面,随着反射光角度的不同,使油墨的颜色发生变化。当使用这种油墨印制图文时,从不同角度观察,会呈现出不同的颜色,但需要印刷品上的墨迹堆积比较厚时,变色效果才会比较显著。第五套人民币在100元和50元券面上应用光变油墨、凹版印刷印制面额数字,具有较高的防伪性能和突出的视觉效果。
观察方式:第五套人民币100元和50元正面左下角的面额数字“100”和“50”是使用光变油墨印制的。垂直观察票面,“100”呈现绿色,“50”呈现金色;当倾斜票面观察时,“100”变为蓝色,“50”变为绿色。
中国油墨交易网
数据的数字特征解题技巧 篇3
关键词:数据;数字特征;解题技巧
中图分类号:G633.6 文献标识码: A 文章编号:1992-7711(2015)24-001-01
1.直接利用公式进行分析
数据x1,x2,…xn的平均数计算公式为:x=,方差计算公式为:s2=[(x1-x)2+(x2-x)2+…+(xn-x)2],标准差计算公式为:s==
例1 对于一组数据zi(i=1,2,3,…n),如果将它们改变为zi-c(i=1,2,3,…n)(其中c>0),那么下列结论正确的是 ( ).
A.平均数比原来的少 c,方差比原来的少c2
B.平均数比原来的少c, 方差与原来的一样
C.平均数比原来的多c,方差比原来的多c2
D.平均数比原来的多 c,方差与原来的一样
解析:设一组数据zi(i=1,2,3,…n)的平均数为Z,方差为s2,则一组数据zi-c的平均数为 =-c=z-c,
方差{[(z1-c)-(z-c)]2+[(z2-c)-(z-c)]2+…+[(zn-c)-(z-c)]2]}=[(z1-z)2+(z2-z)2+…(zn-z)2]=s2.
所以,平均数比原来的少c, 方差与原来的一样.故选B.
评注:一般地,若x1,x2,…xn的平均数是x,方差是s2,则ax1+b,ax2+b,…,axn+b的平均数是ax+b,方差是a2s2.
2. 结合所给图形进行分析
由于根据条形统计图、茎叶图均可得到具体的数据,从而有利于分析数据的数字特征.因此,我们应该熟练掌握条形统计图和茎叶图,为解题提供准确的题设条件.
例2 甲、乙两位学生参加省高中数学联赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取10次,并制作得到如下茎叶图.请根据茎叶图回答如下问题:
甲 乙
9 8 5 7 5 9
8 4 2 1 8 0 0 3 5
5 5 3 9 0 1 2 5
(Ⅰ)指出甲成绩的众数、中位数和极差;
(Ⅱ)从平均数与方差角度考虑,如果要从中选派一人参加省高中数学联赛,那么你认为选派哪位学生参加比较合适?请说明理由。
解析:(Ⅰ)由茎叶图可知甲的成绩分别为75,78,79,81,82,84,88,93,95,95,所以甲成绩的众数为95,中位数为,极差为95-75=20.
(Ⅱ)派乙参赛比较合适.理由如下:
先分别计算甲、乙成绩的平均值:
x甲=(3×70+4×80+3×90+5+8+9+1+2+4+8+3+5+5)=85,
x乙=(2×70+4×80+4×90+5+9+0+0+3+5+0+1+2+5)=85
再分别计算甲、乙成绩的方差:
s2甲=([(75-85)2+(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2+(95-85)2]=48.4
s2乙=([(75-85)2+(79-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(91-85)2+(92-85)2+(95-85)2]=40
于是,有x甲=x乙,s2甲>s2乙.故乙的成绩较稳定,派乙参赛比较合适.
评注:一般地,给出两组数据,得到的结果往往是平均数相等,方差不等,由此即得较小方差对应的人或物的稳定性就较好,从而确定选取对象.本题第二问计算量较大,需要耐心一点,认真一点,同时也要注意技巧的运用(请认真体会解析中关于“平均数”的计算).
3. 利用等价转化的策略进行分析
当一组数据x1,x2,…xn中的数据均较大时,先将每个数据都减去一个与它们的平均数接近的常数a,得到一组新数据x1'=x1-a,x2'=x2-a,…xn'=xn-a,则易知原数据的平均数为x=a+x',方差为s2=[(x1-x')2+(x2'-x')2+…+(xn'-x')2].
例3 一组数据98,103,99,104,100,97,102,105的平均数是________,方差是________.
解析:每个数据都减去100得到一组新数据:-2,3,-1,4,0,-3,2,5,可知其平均数为1.故易知所求平均数是100+1=101,方差是[(-2-1)2+(3-1)2+(-1-1)2+(4-1)2+(0-1)2+(-3-1)2+(2-1)2+(5-1)2]=7.5
评注:本题显然可以直接利用平均数和方差的计算公式加以求解,但运算较繁,这里运用等价转化的策略显得特别简单,故值得品味、深思.
探析数字电视的基本特征 篇4
“你家有了数字电视了吗?”不知不觉中, 数字电视已然成为了老百姓茶余饭后的又一谈资, 诸如“为什么看电视还要钱了?”“数字电视有啥用?”等各种问题不断的被百姓们所议论。那么数字电视产业到底是如何运营, 其优势在哪?它怎样促使观众消费呢?这些问题都蕴含在数字电视的特征之中。
二、数字电视的基本特征
1、数字电视市场化的运营方式
国家在“十一五”规划中就明确规定, 要“积极推进‘三网融合’, 建设和完善宽带通信网, 加快发展宽带用户接入网, 稳步推进新一代移动通信网络建设。建设集有线、地面、卫星传输于一体的数字电视网络。可见, 政府已加大了对数字电视的重视, 但面对市场化得今天, 不仅政府支持很重要, 数字电视拥有一套合理的运营方式也很重要。
一个简单的传播模式无非就是传者、受者、信息, 而数字电视则是将这一个传播过程中的专业分工, 更为的是细化, 让传播的内容更为优质。可见, 从数字电视所需的硬件设备的提供, 到各类节目的输出与制作, 所有产品都打着商业化的烙印, 所以要实现数字电视的盈利, 不仅这条产业链中的任何一个环节都不能缺失, 而且每一个环节的立足点都需要符合用户的需求, 这相对于模拟免费电视的广告经营模式来说, 数字付费电视产品面对的市场检验时, 产品定位需更准确、更直接、竞争也更残酷。
2、数字电视的优势
数字电视主要有清晰度高, 音频效果好, 抗干扰能力强, 频道数量大增, 可以支持500套数字频道, 可开展多功能的交互式电视服务等优势, 笔者将详细论述其多样的频道和人性化服务的优势, 以及其特有的产品价值。
(1) 花样百出的付费频道
数字电视中的节目, 尤其是付费频道的节目, 是数字电视实现盈利之根本, 要想使付费频道能被用户所接受, 其节目的内容的品质需要更为上乘。
首先, 各地所开播的付费频道具有小众化、专业化、个性化、多元化、服务性的特点。如北广传媒开办的付费频道中有《考试在线》、《四海钓鱼》、《车迷》、《爱家购物》、《动感音乐》等。上海付费频道中视频节目有24套, 音频节目10套。另外, 从这几个频道的名称就可以看出, 付费频道的针对性十分的强, 基本都固定在一个小的专业领域里, 这样就符合当今受众越来越突出个体的需要以及对快速获得所需信息的效率追求。
另外, 由于各类付费频道对于专业性的要求更高, 所以只依靠节目制作者本身是不够的, 那么就出现了与社会机构合作经营付费频道和引入海外节目的形式。如江苏《靓装频道》, 为了强化其国际性, 该频道投入大量资金, 通过法国Fashion TV在国内的版权代理唐龙国际传媒公司购买节目版权, 另外还与美国部分时尚媒体建立了合作关系。吉林电视台的《吉祥购物频道》是与上海合家购物有限公司合作推出, 全部节目在上海制作完成, 吉林电视台负责节目策划和播出, 上海合家购物公司提供完善、丰富的物流保障。
(2) 数字电视的人性化服务特质
首先, 数字电视本身存在着众多的优点, 从数字电视和模拟电视情况的比较就可以看出, 数字电视无论从技术条件, 还是内容结构, 甚至是盈利方式, 都可以促使其更加注重通过服务来赢得用户。所以, 现今条件下, 观众可以获得以下几种便利服务:
一是数字增值服务, 这类服务使电视成为了一种信息工具和娱乐工具。如电视节目指南 (EGP) , 这就类似于书本的目录一样, 它可以把现在播放的各个电视台的节目列成一份节目单, 用户可以根据自己的需求进行选择, 节省了模拟电视中通过不断调台来选择节目的时间。另外, 以上海数字付费电视和青岛模式为例, 在上海数字付费电视中的数据增值服务共有7类, 如《气象信息》、《新闻中心》、《坚果游戏》、《股票行情》等。而在青岛模式中, 它为用户提供了海量信息, 其搭建了电子政务平台、文化教育平台、生活信息平台, 电子商务平台。这些平台随时为用户提供了最新的政府建设、居民生活、股市即时行情等信息。其实, 这样的资讯平台, 也是数字电视拓展外围业务的有利手段。如英国的B-SKY-B就有一个《Open》的购物频道, 它上面销售的东西包括PC、电器、书和唱片等, 更重要的是其便捷的交易方式, 提高了“冲动型购买”的机会, 由于B-SKY-B的机顶盒本身安装时就有加密系统, 对于用户信息和地址十分清楚, 所以用户根本不用敲自己的地址甚至是信用卡号, 就可以实现交易。
二是视频点播服务 (VOD) , 主要分为两类准视频点播, 即“预先安排好节目菜单及电视节目播出时间表, 将同一节目以一定的时间间隔安排在不同的数字频道内播出。”和真视频点播, 它可以实现用户自行控制节目播放情况, 如请进和后退。
三是下载服务。如果用户想观看某个电视节目, 却在节目播出的时段没有时间, 那么就可以通过预订节目, 让运营方把该节目下载到机顶盒中, 让用户可以依据自己的时间观看该节目。
四是互联网接入。用户可以用电视浏览网站, 而且其速度比电脑更快。
(3) 有别于传统电视的产品价值
由于传统电视媒体生产的节目是一种单纯的“灌输”式的“免费便餐”, 电视上有什么节目, 观众就被动的在现有的节目中进行选择, 并且传统电视节目的价值只有拥有了广告时段, 广告商的赞助, 才会获得价值, 所以节目被卖给了广告商, 受众被卖给了广告, 并不是一种不等价交换。因而, 传统电视媒体的产品与商品从根本上违背了市场价值规律。“而数字电视媒体的产品是真正意义上的等价交换商品, 它通过市场经济‘那只无形的手’, 以付费电视收视点击次数和收视群体文化背景的统计信息, 发挥按质论价、优胜劣汰的市场调节作用, 客观地依据价值法规创造产品的增值与增量。”所以, 数字电视的节目成为了一种单纯的商品, 其价值本身就在于它所包含的信息, 是否可以满足观众的需求, 观众看电视就像是逛超级市场, 面对明码标价的商品, 自主选择各类商品。这种售出方式, 才是以受众为本位, 实现信息的有效获取。
三、结论
数字电视虽然具有众多的优势, 它不仅改变了观众传统的收视习惯, 也为观众带来了新一轮的便捷, 但是它在我国的推广施行仍旧是一个漫长的过程, 虽然国家早把它列为了“十五”计划的重点项目, 但是在具体落实过程中, 数字电视仍旧与我国的国情存在许多的冲突, 所以在了解数字电视运营特征的基础上, 扩大数字电视的优势影响力, 在实践中不断探索良性的运营模式, 才是其能长久发展的主要手段。
摘要:本文涉及了当前全国正在全国推广的数字电视, 数字电视作为一种新生的电视媒体, 存在着与传统媒体相区别的独特的运营方式及各种优势, 但又由于数字电视与中国观众以往的收视习惯存有差异, 所以在其推广与运营过程中也存在了诸多问题。因此, 本文将在结合中国数字电视推广现状的基础上, 对数字电视运营的基本特征, 即运营的基本方式、存在的优势进行论述。
关键词:数字电视,运营模式,基本特征
参考文献
[1]李岚, 著. 电视产业价值链——理论与个案[M]. 社会科学文献出版社, 2006.
[2]黄升民, 周艳, 马丽捷, 著. 广电媒介产业经营新论[M]. 复旦大学出版 社, 2005.
[3]黄升民, 周艳, 王薇, 著. 中国有线数字电视试点现状报告[M]. 中国传媒大学出版社, 2005.
数字特征 篇5
摘要:地貌是自然地域综合体中的主导因素,数字地貌强调了以数字形式将所有地貌信息集成于一起.本文在总结前人研究成果的基础上,以1∶100万标准分幅中的张家口幅(编号为k-50)为例,探讨了以遥感数据(ETM和TM)为基础的数字地貌信息集成方法,体现了分层分级的集成原则,便于信息的.数字化、定量化分析.对其特征分析表明:地貌信息的存储、应用及分类分级指标充分体现了其数字化与定量化特征;它们为生成各种专题图件、评判划分指标的合理性以及国民经济建设等提供了分析基础,这将在地貌研究、农业生产、国防建设、环境建设和生态修复等方面发挥重要作用.作 者:龙恩 程维明 刘海江 柴慧霞 李锐 LONG En CHENG Weiming LIU Haijiang CHAI Huixia LI Rui 作者单位:龙恩,LONG En(中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京,100101;中国科学院研究生院,北京,100039)
程维明,刘海江,柴慧霞,李锐,CHENG Weiming,LIU Haijiang,CHAI Huixia,LI Rui(中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京,100101)
数字插图的现代艺术特征探索 篇6
关键词:数字插图;绘画;当代;美学
艺术批评家岛子曾指出:数字艺术在中国的形成从1995年至今己有近二十年的时间,而数字化新媒体,突出了一种技术哲学的审美特性,在自身发展流变上,在独特的现代审美语境中,都具有很强的独特性和渗透性。
插图,作为传统悠久功能性图画品类,其美学韵味、创作手法、图示面貌、功能用途特征等特点,在当代数字语境下,伴随网络媒体技术的繁荣,特别是个人化数字工作软件出世而悄然转换。“数字插图”顺应而生,在原有功能性使用基础上,积极衍生到众多层面。“虚拟化”成为数字插画艺术语言的最大的特点,数字技术和艺术的不断磨合,形成以网络媒介为基础的重要形式,数字化图像成为一种视觉信息载体,引导插图创作本身从观念到方法的解构。
插图艺术的功能在数字时代的审美意识下,由说教转向娱乐,由信息转向消遣。因此,数字化的渗透,不仅是对创作样式的蜕变,还应从绘画本体论的观点审视,以多维度视角静观插图艺术的数字化语言转换。
1 手段的革新
19世纪中叶,法兰西舞美师路易·达盖尔发明照相术,拉开古典主义油画衰败的序幕。然今日数字化技术在新世纪全面渗入插图绘画,新技术再次扑面而来,在技术和审美上,是否会对绘画再次产生重大的冲击力?值得思考。现代手段下的数字插图作品,通过计算机技术,最终以程序运算法则而成。此方式的主要特征是创作者必须着力于理性运算与感性的创作的叠加,形成一种规则性的一致,由计算机使用特定秩序运算生成计算机造型图色。严格来讲,这不是“创作”,更像“制作”。工作流程也几分类似,从熟悉材料到熟悉屏幕,使用计算机技术绘图代替传统艺术创作中的构图、笔触、材料肌理。数字媒介又能轻易地处理素材,为局部休整造型,尤其在表现复杂、多层次类型的画面效果时,具有明显的预览优势。图像合成技术在手工制作上耗時耗力,而如今电脑软件轻易搞定,“修图”变为一种大众习惯;科幻是数字插图作品的主要题材之一,惯用宏大、离奇、纷杂,虚无等气氛,甚至追求超现实主义效果。1963年出生于美国南加州的插画大师Mark Ryden,是一个被誉为插画界“鬼才”与“天才”的人物,评论界给予他“当代通俗流行视觉艺术的大师”的学术定位,在他的作品中展现了“可爱童稚”和“古怪诡异”两种特质。他的插画风格充满哥特式的联想,这也让他的作品倍受争议。可见,借助技术手段,达到制造与以往感官经验和思维习惯的相悖的视觉效果,在数字插画作品中甚为突出。所以,数字技术的新特性包含刺激新奇的亮点,自然更容易被青年创作者接纳,且势必轻视传统绘画技法。创作者易不加思虑即刻开展绘制,或不受固定工作室限制来修改,只需要有计算机技术支持,绘制、修改和保存变得流程化。青年一代几乎全盘接纳了这种全新的“绘画”体验,乐此不疲地享受着技术带来的创作感观。
然而,其弊病无法回避,创作者仍难通过软件来完全实现所有在画布上实现的效果。数字化创作的“绘画”并非传统意义上的“绘画”,架上绘画的技法和质感,至今无法全盘转化到计算机中来。著名实验动画影片《The Old Man and the Sea》,模拟采用了油彩的肌理制作而成。的确,个人绘图软件给创作带来的新的便捷,大量的青年插画师专注于在计算机上绘制作品,可这几乎加速了架上绘画的边缘化。我们也须时刻警醒:“材料”作为架上绘画的载体或对象,也在逐渐消失。
2 图式的可能性
“具有一定独立审美价值的艺术形式”要求构成数字插图的,不是数字化的内容,更不是数字媒介手段本身,而是“有意味的数字形式”。数字插图具有数字性和艺术性两方面的特点,其图示语言也必具有多面性。数字性是数字艺术的媒介组合形态,是技术性的基本承担,直接影响数字插图的语言以及可视化表现方式,掺杂了技术哲学、美学、心理学、科技的数字插图,改变了传统的图示观念和审美趣味,呈现出一种无机的虚拟景观。
毫无疑问,数字插图的优势不应是只作为摹拟绘画质感,尤其是西方绘画的视觉语言进行的绘画实践,而在于高精度的计算机技术和新兴媒介赋予它广泛的再现领域。美国动画电影《谁陷害了兔子罗杰》是动画应用的里程碑作品,手绘与实拍完整恰当的构成整个电影的叙事性。所以,在动漫游戏和数码影像高度繁荣的今天,数字插图创作与角色设计、场景设计、漫画设计、影像特效等门类创作不分彼此,许多当代插画师同时又是游戏美术师或概念设计师,其类作品有强烈的动漫文学色彩和时代表征。例如,在游戏制作的前期,设计师通常需要创作大量的人物草图,寻求与游戏文案描述中,最为贴合的视觉形象或动态,而这种创作习惯依然是延续插图的创作方法。在动漫人物或角色设计中,也是同样的流程。无论人物的表情,或是服饰与道具,甚至是场景的设计,包括现代影视制作过程中的抠像或数字绘景,都频繁采用数字化绘图的模式。在中期和后期制作中,数字化技术更是统统将插画的传统图示概念弱化,模糊其品类差异,直至彻底抹掉。
媒介的更替引导了插图图示的变革,如今的数字插图不但需要承载传统印刷类的纸媒,更需要在电脑、电视、电影的屏幕上发挥其旁大的图像可能性,这些也是看不见的数字信息,以文化产品的名称出现在社会化艺术生产中。文化载体从传统纸媒介攀升到现在数字化电子设备,以及公认为“第五大媒体”的“互联网媒体”,数字插图的表现形式也从原始的平面,转换为立体、扩展到三维,从传统的水墨和线描,到如今的数位板绘图,甚至伴随网络出现的四维空间插图的服务方向,也因载体的不同而相应的变化。数字技术无疑为创作者带来良好的制作流程,易于媒介传播,符合现代商业需求,插图的数字化模式激活了无限可能。
由此,图示的可能性,在繁荣的媒介商业化娱乐中,变成一种时尚性、互动性很强的融合模,突破了以往大众对于插图的概念,逐步在其他艺术形式的创作中变成有效方法,这给插图的发展带来了巨大的体量。数字插图以多样化传播方式,以插图作为基础的动漫美学,以“卡通一代”为代表的新生代青年群体,促成数字插图在当代领域大展身手的无穷乐土。
3 观念上的批评
从绘画本体上看,数字插画完成了从“绘画的拟像”到“拟像的绘画”的语言转换。计算机图形技术条件下,数字插画的拟像建构了观众视觉经验上的独立存在,为艺术可能提供多元的判别。从绘画现象学上来看,这是图像文本的演变发展,但是数字图像并不能作为“数字绘画”而存在,数字插图也从来不是替代架上绘画的继承者。作为艺术和技术综合表现的新兴媒介,数字插图具有当代美学、互动(下转第页)(上接第页)性、大众化等时代个性,甚至可以通过时间的延续升华出动态的生动视觉体验,也能以更为迅捷奇妙的速率现身数字化媒介,并同观者多样互动,数字插图其实早已成为艺术生产的便捷手段。图1为艺术家潘公凯作品《弥散与生成》,综合采用计算机绘制、图形動画、水墨、投影等综合手段完成的当代艺术作品。作者感知当下社会随着全球一体化与信息网络的迅猛发展,传统视觉文化的成就与体系性知识快速扩展弥散到世界各个角落。在弥散的过程中,历时性的思潮流派演进转变为共时性的多元因素杂存,且与地域性的文化环境互动。体系性的知识积累进一步解构混融,形成碎片化、拼贴化、扁平化、通俗化的全球性弥散景观。
21世纪以来,现代信息技术蓬勃发展,但计算机技术依旧不可能替代“人”的创作。例如,构思,素材的抽象提炼,情绪调动等,其理性的技术再现,始终作为一种初级的模仿行为,仅仅可以给人类的猎奇审美诉求带来些许便捷,无法代替创作者的情感表达和经验思考,它是新媒介的附庸。数字插图的种种美学特征愈发的显现出当代的灵光,不确定的碎片化文本与消费快感,机械的商业性与视觉同质化,在这些意义上,数字插图作品有世俗或者后现实主义的成份。当然,“被浏览”的艺术取代了传统“被鉴赏”的艺术,“广场艺术”取代了“博物馆艺术”。人们在网络化的社会结构里,在网络化、现代化的世界“冰冷”外壳中,不可回避地盲从追求被价值观过分放大的“意义”。马克思讲的一句话“一切坚固的东西都烟消云散了”。
读图,是当代社会重要的审美特征,数字插图的出现不是偶然,它是插图发展史上一个必经的转折点。以插图艺术为基础的数字绘画为传统插图带来了广阔的存在意义,以多元形态的数字艺术和网络媒介服务,提供基础的美学范体,以满足当下社会的人文和商业诉求。数字化引导下的插图创作图示趋于网格化与个人化,映照了青年一代的审美喜好,与后现代艺术一样,数字插图的品类界限更加日渐模糊,在数字时代下,插图创作将以消费和重构现有文本材料的创作方式,更替了传统的插图创作过程,并以交互与体验的态度,转换着传统插图欣赏的审美静观。
参考文献:
[1] 潘公凯.艺术场域中的弥散与生成[N].中国艺术报,2013-03-13.
[2] 朱其.中国新媒体艺术的兴起和演变[D].中国艺术研究院,2006.
数字图像轮廓特征提取过程研究 篇7
数字图像处理泛指从图像获取到图像信息输出的全过程, 包括对已有图像信息的处理, 它具有精度高、成本低、速度快及灵活性好等特点, 使得其在诸多领域得到了广泛的应用。作为数字图像处理的常用技术, 图像增强、图像分割、边缘检测等已经发展的较为成熟【1】, 并经常被结合起来用以处理图像。
轮廓特征提取作为数字图像处理中的一个重要方面, 更是许多有关图像研究的重要中间环节, 目前已有很多相关工作完成【2】。提取出图像中物体的大致轮廓等特征可以用来模式识别【3】、物体判断、数学特征值 (如分形维数【4】) 等的计算。
本文对图像轮廓提取过程及应用到的关键技术进行了研究, 给出照片中河流轮廓提取实例。
2 图像轮廓特征提取的流程分析
对于给定的原始图像, 为了提取出轮廓特征, 需要消除图像中的无用噪声, 同时考虑增强消噪后可能变模糊的图像中对提取有利的特定信息, 在此基础上把图像分割成有意义的区域, 再使用特定算子勾勒出图像的轮廓。下图为图像轮廓特征提取的流程示意:
本文对已有的数字图像, 采用目前常用的空间域和频率域的平滑算法 (如理想低通滤波器) 滤波去噪增强, 然后选择适当的阈值分割法 (如OTSU算法) 分割得到二值化黑白图, 再采用适当的边缘检测算子 (如log算子) 提取图像的轮廓特征, 并对所用技术进行描述。
2.1 图像增强
图像经过增强处理后效果会得到改善, 它的某些特定信息将得到增强。在增强过程中, 不分析图像降质的原因, 处理后的图像不一定逼近原始图像, 即可以是一个失真的过程, 且不能增加原图像得信息。其目的是要增强视觉效果, 针对给定图像的应用场合, 有目的地强调图像的整体或局部特性, 扩大图像中不同物体特征之间的差别, 强调某些感兴趣的特征, 抑制不感兴趣的特征, 满足某些特殊分析的需要。将原来不清晰的图像变得清晰或改善图像质量、丰富信息量, 加强图像判读和识别效果。
根据图像增强处理过程所在的空间不同, 可分成基于频率域的方法和基于空间域的方法。前者是一种间接增强的算法, 把图像看成一种二维信号, 经傅里叶变换将图像从空间域变换到频率域, 然后在频率域对频谱进行操作和处理, 再将其反变换到空间域, 从而得到增强后的图像;后者直接在图像所在的二维空间进行处理, 即直接对每一个像素的灰度值进行处理。基于空域的算法分为点运算算法和邻域去噪算法:点运算算法即灰度级校正、灰度变换和直方图修正等, 目的或使图像成像均匀, 或扩大图像动态范围, 扩展对比度;邻域增强算法分为图像平滑和锐化两种:平滑一般用于消除图像噪声, 但是也容易引起边缘的模糊, 常用算法有均值滤波、中值滤波。锐化的目的在于突出物体的边缘轮廓, 便于目标识别, 常用算法有梯度法、算子、高通滤波、掩模匹配法、统计差值法等。
2.1.1 理想低通滤波增强
一般图像的能量主要集中在其低频部分, 噪声和系统中所要提取的边缘信息主要集中在其高频部分, 图像增强的目的是去掉高频干扰又同时保持边缘信息。可以采用低通滤波的方法去除高频干扰来平滑图像。低通滤波是频域滤波增强的一种, 是在变换域空间对图像进行滤波。如上所述, 一般通过某种变换 (如傅里叶变换、小波变换) 将图像从空间域变换到频率域, 然后在频率域对频谱进行操作处理, 再将其反变换到空间域, 从而得到增强后的图像。图像从空间域变换到频率域后, 其低频分量对应了图像中灰度值变化比较缓慢的区域。
以傅里叶变换为例, 频域滤波的主要步骤为:
(1) 对原始图像f (x, y) 进行傅里叶变换得到F (u, v) :假设图想以undefined存储, 则离散傅里叶变换undefined可由如下公式得到
undefinedundefined
(2) 将F (u, v) 与传递函数H (u, v) 进行卷积运算得到G (u, v) :
undefined
(3) 将G (u, v) 进行傅里叶逆变换得到增强图像g (x, y) :
undefinedundefined
故频域滤波的核心在于如何确定传递函数H (u, v) , 一个二维的理想低通滤波器的传递函数如下:
undefined
式中, D0是一个非负整数;D是从点 (u, v) 到频率平面原点的距离, 即:
undefined
理想低通滤波器的含义是指小于D0的频率, 即以D0为半径的圆内所有频率分量可以完全无损地通过, 而圆外的频率, 即大于D0的频率分量则完全被除掉。
2.1.2 Roberts算子锐化
图像滤波平滑往往使图像中的边界、轮廓变的模糊, 为了减少这类不利效果的影响, 这就需要利用图像鋭化技术, 使滤波增强后图像的边缘、轮廓线以及图像的细节变的清晰。经过平滑的图像变得模糊的根本原因是因为图像受到了平均或积分运算, 因此可以对其进行逆运算 (如微分运算) 就可以使图像变的清晰。
Roberts算子又称为梯度交叉算子, 是一种利用局部差分算子寻找边缘的算子。梯度幅值计算近似方法如图2:
(i, j) 为当前像素的位置, f (i, j) 为该点的灰度值, 由如下锐化公式得到表示增强后的图像 (i, j) 位置处灰度值g (i, j) :
undefined
2.2 图像分割与OTSU法
图像分割的目的是把图像空间分成一些有意义的区域, 可以逐个像素为基础去研究图像分割, 也可以利用在规定邻域中的某些图像信息去分割。图像分割比较正式的定义如下:
令集合R代表整个图像区域, 对R的图像分割可以看作是将R分成N个满足以下条件的非空子集R1, R2, …, RN:
(1) undefined;
(2) 对i=1, 2, …, N, P (Ri) =TRUE;
(3) 对∀i, j, i≠j, 有Ri∩Rj=φ;
(4) 对∀i, j, i≠j, P (Ri∪Rj) =FALSE;
(5) 对i=1, 2, …, N, Ri是连通的区域。
对于此定义需要补充的是, 实际的图像处理和分析都是面向某种特定应用的, 所以条件中的各种关系也是需要和实际要求结合而设定的。图像分隔的依据可以建立在图像像素间的“相似性”和“非连续性”两个基本概念之上。像素的“相似性”是指图像中在某个区域内像素具有某种相似的特性, 如像素灰度相等或相近, 像素排列所形成的纹理相同或相近。“不连续性”是指像素灰度的不连续, 形成调变的阶跃, 或是指像素排列形成的纹理结构的突变。故相似性分割就是将具有同一灰度级或相同组织结构的像素聚集在一起, 形成图像的不同区域;非连续性分割就是首先检测局部不连续性, 然后将它们连接在一起形成边界, 这些边界将图像分成不同的区域。图像分割方法又可以分为结构分割方法和非结构分割方法两大类。结构分割方法是根据图像的局部区域像素的特征来实现图像分割, 如阈值分割、区域生长、边缘检测、纹理分析等, 这些方法是假定事先知道这些区域的特性, 或者在处理过程中能够求得这些特性, 从而能够寻找各种形态或研究各像素群。非结构分割法包括统计模式识别、神经网格方法或其他利用景物的先验知识实现的方法等。
图像的黑白二值图像转化是指通过设定某个临界阈值, 大于该临界值时为白, 存储时用1表示, 小于该临界值时为黑, 存储时用0表示, 这样就可以将任意的彩色或者灰度图像转换成黑白二值图像。根据峰值个数以及处理过程的不同, 可以用不同的方法完成灰度图像转换为黑白二值图像的过程, 对于灰度峰值的多少, 可以设定多个不同的临界值。
常用的黑白二值化处理方法有:
1) 单阈值法。对于具有单灰度峰值的图像, 将灰度最大峰值作为临界值F, 并将图像点阵点上的颜色值小于等于某临界值F的像素undefined转换为黑色;大于F的像素值转换为白色。
2) 双阈值法。对于具有两个灰度峰值的图像, 将这两个最大峰值设定为两个不同的临界值F1和F2。当某个像素undefined的像素值介于F1和F2之间时设为白色, 其他情况设为黑色。
大津法 (又称OTSU法或最大类间方差法) 于1979年提出, 它是在灰度直方图基础上用最小二乘法原理推导出来的, 具有统计意义上的最佳分割阈值。Otsu法算法简单, 对光线等具有很强的自适应能力, 在灰度图像目标和背景的自动分割上具有广泛的应用。具体算法如下:
对图像A, 记t为前景与背景的分割阈值, 前景点数占图像比例为w0, 平均灰度为u0;背景点数占图像比例为w1, 平均灰度为u1。
图像的总平均灰度为:
u=w0×u0+w1×u1
从最小灰度值到最大灰度值遍历t, 当t使得值
g=w0× (u0-u) 2+w1× (u1-u) 2
最大时t即为分割的最佳阈值。
对大津法可作如下理解:g实际上就是类间方差值, 阈值t分割出的前景和背景两部分构成了整幅图像, 而前景取值u0, 概率为 w0, 背景取值u1, 概率为w1, 总均值为u, 根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量, 方差值越大, 说明构成图像的两部分差别越大, 当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小, 因此使类间方差最大的分割意味着错分概率最小。
2.3 边缘检测
图像的边缘是图像的最基本特征, 集中了图像大部分的信息, 图像边缘的确定与提取对于整个图像场景的识别与理解是非常重要的。物体的边缘是以图像局部特征不连续的形式出现的, 也就是指图像局部亮度变化最显著的部分, 例如灰度值的突变、颜色的突变、纹理结构的突变等, 同时物体的边缘也是不同区域的分界处。图像边缘有方向和幅度两个特征, 通常沿边缘的走向灰度变化平缓, 垂直于边缘走向的像素灰度变化剧烈。根据灰度变化的特点, 常见的边缘可分维阶跃型、房顶型和凸缘型。
当使用一阶倒数的边缘检测算子时, 如果所求的一阶导数高于某一阈值, 则确定该点为边缘点, 这样做会导致检测的边缘点太多。一种更好的方法就是求梯度局部最大值对应的点, 并认定它们是边缘点。通过去除一阶导数中的非局部最大值, 可以检测出更精确的边缘。一阶导数的局部最大值对应着二阶导数的零交叉点, 通过找图像强度的二阶导数的零交叉点就能确定精确的边缘点。通常将Gaussian滤波器和Laplacian边缘检测结合在一起, 形成LOG算法。即先用高斯函数对图像进行平滑, 然后再用拉普拉斯算子进行运算, 得到Laplacian-Gauss算法, 它使用一个墨西哥草帽函数形式:
undefined
这种方法在边缘检测时仅考虑那些具有局部梯度最大值的点为边缘点, 这一点可以用拉普拉斯算子将边缘点转换成零交叉点, 然后通过零交叉点的检测来实现边缘检测。所谓的零交叉点就是:如果一个像素出的值小于一θ0, 而此像素连通的各个像素都是大于θ0 (θ0为一个正数) , 那么这个像素就是零交叉点。
与其他边缘检测算子一样, LOG算子也是先对边缘做出假设, 然后再这个假设下寻找边缘像素。但Log算子对边缘的假设条件最少, 因此它的应用范围更广。另外, 其他边缘检测算子检测得到的边缘时不连续的, 不规则的, 还需要连接这些边缘, 而LOG算子的结果没有这个缺点, 对于Log 算子边缘检测的结果可以通过高斯函数标准偏差σ来进行调整。
3 基于MATLAB环境的实验分析
在MATLAB环境下定义函数并编写代码, 对一副照片上的河流轮廓进行提取, 过程如图:
图二是原始彩色照片灰度转化后的图像, 经过低通滤波去噪后得到图三所示图像, 去除了图像的高频噪声, 但略显模糊。对其进行Robert算子锐化调整后可以得到图四所示的增强图像, 图像特征明显变得清晰。大津法 (OTSU) 阈值分割后得到的图五可以看出特征区域和非关注区域的明显对比, 然后由log算子边缘检测提取河流的轮廓, 由图二和图六比较可见提取的效果较为理想。
4 结束语
本文首先介绍了数字图像轮廓特征提取的一般过程, 给出了流程图, 然后详细讨论了数字图像处理的中间环节技术, 并给出了这些技术的部分具体算法, 最后在MATLAB环境下编写代码, 从一副照片中提取出了河流的轮廓, 实验分析结果较为理想。数字图像处理技术应用于图像轮廓的提取, 能够简化一些实验研究工作, 缩短时间提高效率, 如提取的河流可以用于识别和地图绘制, 提取岩石断面轮廓可以用于分形维数计算等等。为了满足不同的需求, 研究者可以对提取过程中用到的技术加以改进或提出新的算法, 如采用不同的边缘检测模型和技术[5], 以达到自己研究所需要的特征和精度。
参考文献
[1]龚声蓉, 刘纯平, 王强等.数字图像处理与分析.北京:清华大学出版社, 2006, 1-84, 168-234
[2]邹柏贤, 林京壤.图像轮廓提取方法研究.北京:计算机工程与应用, 2008, 161-165
[3]魏冬冬, 聂铁铸等.人脸特征提取与识别技术研究.计算机与现代化, 2007, 3:69-76
[4]彭瑞东, 谢和平, 鞠杨.二位数字图像分形维数的计算方法.中国矿业大学学报.2004, 33 (1) :19-24
谈数字媒体的碎片化传播特征 篇8
碎片化一词是Fragmentation, 意为零散、碎片, 也指信息以部分和碎片的方式进行传递, 既是传播形式的碎片化, 也是传播思维的碎片化, 更代表传播理念、接受方式、阅读习惯甚至营销策略的碎片化或多元化。本文从以下五个方面谈碎片化传播在数字传媒时代的特点。
一、碎片化的思维特点
受众从各种媒介各种渠道能够获取数以千万计的信息, 在选择和获取信息的时候, 由于其有限的阅读时间和无限的信息产生矛盾, 导致传播者力图以最简短通俗的形式, 传递给受众最多的信息内容。在这样的传播环境中, 数字媒体的传播内容显然不能像传统媒介那样悠长平静, 而是以一种更为剪短碎片的方式进行传递。有时是以截取所传递信息中最重要的内容为形式, 有时是以传播过程中的传播符号为方式, 进行信息的传递。
碎片化的传播思维, 不单是以媒介为出发点, 从受众对信息的接受方式和自主选择性上, 目前的数字媒体碎片化传播特征也得以体现。数字媒体时代, 受众对信息的选择性更大, 主动性更强, 受众在选择性接受数字媒体信息的时候, 往往选择在费力程度上最低, 接受信息的时间最短, 而信息含量上最大的信息。受众自主选择能力的强化, 决定了数字媒体在传播过程中, 从信息的发布开始就使用碎片化的传播方式, 这也形成了碎片化的思维特点。
二、碎片化的语言形式
网络媒介和手机媒介的语言, 与传统媒介有巨大的区别。
网络媒介诞生之初, 网络语言就有碎片化的特点, 网络作者更常用短句, 更频繁地进行分段, 目前在网络新闻的传递过程中, 网络新闻工作者也更加注重使用短句, 频繁分段, 使用倒金字塔式的新闻结构, 在内容提要中简短但是扼要地说清新闻内容。目前, 网民由于可以主动进行信息的发布和传递, 他们所使用的语言, 也更加的通俗和易懂, 甚至创立出许多网络用语, 如“雷”、“囧”等, 这些用语使得语言的内容产生了变化, 甚至用语的习惯也产生了变化, 导致了网络传递语言结构的碎片化。
在手机传播信息的过程中, 手机新闻和微博微信内容的发布, 甚至是有字数限制的。微博就以140字为限制, 要求发布信息的时候不能超出以上字数, 这就形成了一个传播信息量的界定, 要求发布者必须从最短最通俗的语言进行信息的传递, 也是导致碎片化的一个原因。
三、碎片化的阅读习惯
中国互联网络信息中心发布的调查结果现实, 目前我国百分之七十五以上的网民在阅读网络新闻的时候, 着重阅读的是网络新闻的标题, 而阅读网络新闻正文的网民, 一般也只能对正文的四分之三内容进行完成和有效的阅读。这样的阅读习惯显然和以往传统媒介时代的阅读习惯相差很远。目前的受众已经不适合长篇累牍地进行阅读, 他们需要的是在最短时间内获得最多的信息。
手机媒体的受众在接受如微博、微信等信息时, 阅读习惯要求这些信息的发布有一定的容量限制, 也导致了这些信息中最核心和重要的内容才能被受众所接纳。其他数字媒体, 如车载电视等, 由于受众的接受信息时间有限, 在阅读和接受的过程中, 也是以一种碎片化的方式呈现出来的。
四、碎片化的媒介传播
数字媒介在传播特点上, 也体现出碎片化的特点。
网络信息的发布, 越来越多进行信息的分类和分段。新闻发布时, 重要内容都有分栏的消息内容提要, 其他信息发布时, 不同类别的信息使用的分类越来越细致。这使得媒介从传播的源头就体现出碎片化的传播特点。另外, 碎片化的含义也包括多元化, 网络信息在发布时也有多元化的特点, 满足受众个性化的需求。
手机等媒介在传播上, 体现出信息量限制的特点。如微博传播有字数限制, 微信发布有图片数量限制, 这就导致使用这些媒介进行传播的传者必须在限定容量之内进行信息的发布, 受众也只能在这样的容量之中进行信息的接收。
五、碎片化的营销方式
克里斯·安德森的“长尾理论”认为在主流商品的巨大头部之外, 还存在着海量、无序、零散的尾巴, 这种尾巴的社会需求, 也成为目前数字媒体传播的碎片化营销方式。这种营销方式导致目前在数字媒体碎片化传播的时代, 凸显产品某一特征的宣传成为主流宣传途径, 而非对产品的全部进行宣传和介绍。在微信和微博中的宣传, 在网站和车载电视中的推销, 都是以这样的碎片化营销方式进行的, 并且取得了巨大的经济收益。目前的网络购物和数字购物在营销策略上, 也进行了碎片化的宣传方式。
从思维特点的碎片化, 到语言形式、阅读习惯、媒介传播以及营销方式的碎片化, 形成了数字时代传媒的碎片化传播特点。这一传播特点正在越来越多地影响数字媒介。
参考文献
[1]彭兰著:网络传播学.中国人民大学出版社.2009
[2]杰克·特劳特著:定位.机械工业出版社.2010
基于投影特征的简谱数字识别方法 篇9
光学文字识别[1](Optical Character Recogniton,OCR)是模式识别学科的一个传统研究领域。在音乐界,相对应于光学文字识别,有一个重要分支———光学乐谱识别[2](Optical Music Recognition,OMR)。有了OMR技术,只需将纸质教材上的乐谱作一个清晰的扫描,由计算机进行演奏或者生成格式化的乐谱文件(MusicXML文件等),这无疑大大简化了录入乐谱的步骤,大幅提高了乐谱录入效率。
最为经典的OMR技术莫过于模板匹配法。该方法的基本思想是通过为每个待识别字符定义一个典型的标准模板,然后采用直方图法[3]、轮廓矩[4,5]、欧氏距离[6]、曼哈顿距离[7]等度量方法比较待识别的样本与标准模板,根据度量方法得出的相似度来决定样本与模板是否属于同一类别[8]。
由于标准模板的存在,常规模板匹配方法识别与数字模板数字字体一致时的识别率很高,但是它对噪声敏感,并且对数字的不同字体也不具有适应性,鲁棒性不强[9]———当数字的字体字形变化、识别图片的分辨率较低或噪点较多时,该方法的识别率下降。另外,由于常规模板匹配直接涉及到两个图像矩阵级别的运算,其计算量通常较大,时间开销较多[10]。
考虑到简谱中的数字识别规模较小,只有0~7八个数字,可通过分析简谱数字对噪声较为稳定的几何特征和水平或垂直投影特征,避开常规模板匹配法在鲁棒性上的劣势,应用一种改进的投影特征匹配法对简谱数字进行快速识别匹配,并给出具体的算法流程,分析了算法的时间复杂度。理论分析和实验结果表明,改进的投影特征匹配法与传统的模板匹配法相比,识别精度和速度有所提高,鲁棒性也更强。
1 算法原理
1.1 预处理
相机获取的信息多为32位真彩色信息,但乐谱只有黑白两色,人眼分辨乐谱不需要其它任何颜色信息。因此,在开始数字识别之前,可先采用加权平均值法转换三通道彩色乐谱到单通道灰度图,将彩色图像转换为8位灰度图,将图像的RGB三维信息转换为一维,可大幅度减小计算量,公式如下[11]:
上式中,红绿蓝三通道的权值是根据人眼对颜色的敏感度测定的,所以,运用式(1)可以得到较为理想的灰度图像。
为进一步减少计算量,还需要做二值化处理。将乐谱背景置为黑色(值为0),音符置为白色(值为255),在方便人眼观察的同时,可以为后续的图像处理技术带来操作上的便利。
式(2)直接采用阈值T对图像作全局阈值分割,变换为二值黑底白字图像。
1.2 投影特征匹配
由于待识别的目标结果只有0~7八种数字,采用水平投影法和垂直投影法[12]将图像从二维矩阵降维到一维向量以进行快速匹配。
设图像宽度和高度分别为w和h,现对其做水平投影,得到后的向量除以255 w,所得到的向量下标对应图片坐标系中的纵坐标,而指定下标的值对应某一像素水平方向所有非零(白色)像素占该图片宽度的百分比。同理再对其做垂直投影,得到后的向量除以255h,则所得到的向量下标对应图片坐标系中的横坐标,而指定下标的值对应某一像素垂直方向所有非零(白色)像素占该图片高度的百分比。其它数字依此类推,所有数字的水平、垂直投影向量如图1所示。
观察8个数字及其水平、垂直投影向量的特征,这一步需要选取相对比较稳定,即能够直接从图像上体现出的不怎么受噪声影响、鲁棒性较强的特征来区分它们。可利用大部分图像中都存在的接近于100%的峰值区间,它们的水平位置特征比较具有唯一性。具体区分方法如下:
图1 0~7八个数字的水平与垂直投影
(1)8个数字中,只有2和4的水平投影接近于100%的峰值区间存在于向量后半段(反映到图2中2的灰色部分),但2的垂直投影不存在接近于100%的峰值区间(反映到图2中不存在竖直基本全部贯穿图像的白色连通域),而4的垂直投影存在接近于100%的峰值区间且位置同样在向量后半段(反映到图2中4的灰色部分)。
(2)剩下的6个数字中,只有1、5、7的水平投影的接近于100%的峰值区间存在于向量前1/3段(反映到图3中的水平灰色矩形)。其中,1的垂直投影存在接近于100%的峰值区间且位置在向量后2/3段(反映到图3中1的竖直灰色矩形,该特征在6个数字中具有唯一性,可直接筛选出),5和7的垂直投影都不存在接近于100%的峰值区间(反映到图3中,5和7的图像不存在竖直基本全部贯穿图像的白色连通域),但5的垂直投影的局部峰值存在于向量的前1/3段和后1/3段,而7的垂直投影的局部峰值只存在于向量的中部附近(反映到图3中5和7的竖直灰色部分)。
(3)剩下3、6、0三个数字,可以通过比较其垂直投影在前半段的峰值与后半段的峰值差来筛选出3———一般对于0和6,前后峰值差超过10%,而3的前后峰值差则会小于10%(反映在图4中3图像的灰色部分)。最后可利用6的水平投影在前半段存在的跳变(反映在图4中6图像的灰色部分)区分出6和0。
图4 3、6、0的特征区分
进一步总结,上述3步也即是说,仅需要提取水平和垂直向量的峰值区间的位置作为特征,即可区分出0~7八个数字。
算法1投影特征匹配算法
输入:二值化后的矩形图片矩阵I。
输出:该符号的类型type(0~7为数字,-1为识别错误)。
Step 1:初始化type=-1,计算I的宽度w与高度h。
Step 2:对I作水平和垂直投影,得到水平投影向量lh和垂直投影向量lv,则其向量长度分别为h与w,并变换纵坐标到0~100%之间,如式(3)所示:
Step 3:遍历一遍水平与垂直投影向量,同时计算其最大值、平均值、最大值横坐标、垂直投影向量前半段峰值、垂直投影向量后半段峰值,设水平与垂直投影向量的最大值分别为Ylhm与Ylvm,平均值分别为最大值横坐标分别为Xlhm与Xlvm,垂直投影向量的前半段峰值与后半段峰值为Alvm与blvm。
Step 4:若Ylhm≥0.8,且且Ylvm≥0.8,且则type=4,转Step12。
Step 5:若Ylhm≥0.8,且则type=2,转Step12。
Step 6:若Ylhm≥0.8,且转Step7;否则转Step10。
Step 7:若Ylvm≥0.8,且则type=1,转Step12。
Step 8:若0.4≤Ylvm≤0.8,且则type=7,转Step12。
Step 9:type=5,转Step12。
Step 10:若Alvm-Blvm-0.10,则type=3,转Step12。
Step 11:重新遍历水平投影向量lh,取出使的连续区间长度l,若l≥0.05h,则type=6,转Step12;否则type=0,转Step12。
Step 12:算法结束,输出type值。
1.3 时间复杂度
设图像的宽和高分别为w与h,则Step 2中求水平投影与垂直投影向量并对其缩放各只需要遍历一遍图像,时间频度为T(w,h)=2 wh;Step 3中,只需各自遍历一遍水平和垂直投影向量即可计算出最大值横纵坐标、平均值以及前后半段的峰值,时间频度T(w,h)=w+h;Step 4~Step 10中,只用到了基本乘除运算和比较操作,时间频度为T(w,h)=C(常数);Step 11中,还需再遍历一遍水平投影向量,时间频度为T(w,h)=h。
综上所述,该算法的总时间频度为T(w,h)=2 wh+w+2h+C,时间复杂度为O(wh)。
2 实验结果与分析
为了比较传统模版匹配方法与投影特征匹配方法在识别精度、识别速度与识别鲁棒性上的区别,本文对《天空之城》和《铃儿响叮当》两首乐曲的简谱进行识别测试。两种方法采用相同算法预处理和提取简谱中的数字,只在匹配阶段,传统模板匹配采用欧氏距离作为度量方法,而投影特征匹配采用本文方法,其识别结果如表1、表2所示。
表1《铃儿响叮当》的识别结果
表2《天空之城》的识别结果
从以上识别结果可以看出,在识别精度方面,2种方法都可取得较为理想的识别准确率,但投影特征匹配法的精度要略高一些;在识别速度方面,投影特征匹配法虽然增加了提取特征的过程,但由于信息量减少,还是缩短了10%左右的识别时间;在识别鲁棒性方面,欧氏距离法受模板的影响明显较大,例如表2中识别2和表1中识别6时,由于图片所用简谱数字与模板稍有变化(数字的平移或字体的变换),带来识别精度的下降,而投影特征匹配法则由于比较的是数字的几何特征,而它反映了不同数字之间的根本区别,相对于数字整体而言,抗噪性大大增强。
3 结语
通过分析简谱数字的几何特征,提出了投影特征匹配法,即一种将图像从二维矩阵降维到一维向量的快速匹配方法。在给出具体的算法思想之后,计算了算法的时间复杂度,并用不同的实验结果证实了算法的识别精度、识别速度和鲁棒性都要优于传统的欧氏距离模板匹配法。而对于如何将数字识别扩展到字符甚至汉字的快速识别、如何进一步提高识别精度等,相关工作有待进一步展开。
摘要:简谱数字识别是光学乐谱识别中的一个重要分支,传统的识别方法是模板匹配,该方法计算量大,且对模板的依赖性很强,导致其鲁棒性较弱,对图像的噪声和位移敏感。考虑到简谱数字识别规模较小,通过分析数字对噪声较为稳定的几何特征,提出一种改进的投影特征匹配法对简谱数字进行快速识别匹配。理论分析和实验结果表明,改进的投影特征匹配法与传统的模板匹配法相比,识别精度和速度有所提高,鲁棒性也更强。
关键词:投影,数字识别,模板匹配,欧氏距离
参考文献
[1]姚超,卢朝阳,李静,等.用于手写文字识别的MQDF替代参数选择方法[J].华中科技大学学报:自然科学版,2014(12):65-69.
[2]何欢.光学乐谱识别技术研究[D].北京:北方工业大学,2011.
[3]李小伟.基于FPGA的灰度图像模板匹配并行处理研究[D].武汉:华中科技大学,2013.
[4]王慧.基于模板匹配的手写体字符识别算法研究[D].北京:北京交通大学,2012.
[5]孔金生,张小凤,王璇.基于轮廓特征的模板匹配方法及其应用[J].计算机工程与应用,2008(22):201-203.
[6]黄琛.基于Hausdorff距离模板匹配的行人检测算法研究与应用[D].北京:清华大学,2006.
[7]CHING Y SUEN,JINNA TAN.Analysis of errors of handwritten digits made by a multitude of classifiers[J].Pattern Recognition Letters archive,2005.
[8]G LOULOUDIS,B GATOS,I PRATIKAKIS,et al.Text line detection in handwritten documents[J].Pattern Recognition archive,2008,41(12):758-772.
[9]唐琎,李青.一种快速的模板匹配算法[J].计算机应用,2010(6):1559-1561,1564.
[10]邵平,杨路明,黄海滨,等.基于积分图像的快速模板匹配[J].计算机科学,2006(12):225-229.
[11]ALEX ZELINSKY.Learning OpenCV-computer vision with the OpenCV library[J].IEEE robotics and automation magazine,2009,16(3):100-110.
关于数字电视画面艺术特征研究 篇10
1 数字电视画面概论
数字电视又可称之为数码电视,具体指从演播室到发射、传输、接收的所有环节都是使用数字电视信号来进行信息传播的电视类型,而数字电视画面即囊括了数字技术元素参与生成制作的电视画面。从数字电视画面的类型来看,主要包含数字特效处理的实拍画面,合成数字影像以及全数字虚拟影像等三种类型。随着人们审美要求的不断提升以及信息技术的快速发展,数字电视画面也得到了更为广泛的应用,它不仅成为片头、标识的专用,还逐渐挑起了广告、宣传片的大梁,发展前景十分广阔。
2 数字电视画面的艺术特征分析
2.1 数字电视画面的基础结构
视觉是人们认识客观世界的主要途径,是人们获取信息的重要方式,在整个感觉器官中占据着举足轻重的重要地位。而数字电视作为一种视听综合艺术,以画面和声音作为自己的基本元素,运用新材料(数字高清晰度摄像机、计算机控制的摄影机、灯光、道具)和奇观因素(光线、色彩变化、线条)创造出视觉冲击力极强的电视画面[1]。与此同时,结合数字时代观众的心理需要,运用数字电视画面的期待效应,将电视画面的创造性、想象性与敏锐性进行提升,进而推动我国数字电视向轻松化、奇观化的方向发展。
2.2 数字电视画面的虚拟现实
简单来讲,数字电视画面与现实的本质关系即虚拟现实主义与虚拟非现实主义。其中,前者指在现实主义手法的领域内描绘现实、再造历史,来对“现实”进行虚拟。该种在方法的应用在当前尤为广泛,且成效显著。而后者指的是描绘展示一种人们不可能看到或不可能发生的现实,即创造现实中不能完成或看不到的视觉效果。另外,不难发现,数字技术在电视艺术中正逐渐由从属者转变为主宰者,它使得虚拟的东西更趋于真实,重构了电视的逼真性与假定性。
2.3 数字电视画面的时空结构
首先,就是数字电视画面新鲜的时间质感。电视是一种时间的艺术,这其中既包括物理时间,又包含心理时间。物理时间是一部作品所有镜头画面时间长度的总和,它是客观的;心理时间是人们对物理时间的能动反作用,它是变化的。数字电视画面对于心理时间的营造更具有自由性,它不仅能够再现时间,还可以再造时间,并对时间进行扩展、压缩甚至倒流。其次就是数字电视画面变化的空间结构[2]。所有电视画面都有一定的存在结构,数字技术使电视画面的平面千变万化,不仅增加了电视画面的平面构成要素,还改变了电视平面构成的结构,以“瞬息万变”的节奏冲击着观众的视觉经验。
2.4 数字电视画面的构图语言
通常情况下,电视画面构图的形态是以摄像机和拍摄对象的运动状态来进行划分的,主要包括静态性构图、动态性构图以及综合性构图。数字电视画面静态构图的两极景都得到了不断的扩张,其构图画面中的图表、字幕、地图以及图形等单一背景形式也因数字技术的出现而变得更具吸引力[3]。数字电视画面的动态性构图使节奏感加强,运动速度变快。最后,数字电视画面的综合构图由于技术的成熟带来的动势效果极为强烈,拍摄方法也灵活、多变。
3 结语
科技的发展,让电视产业的得到了前所未有的进步与发展。然而,需要强调的是,纵然高科技能够给人们带来更为强烈的感官体验与视觉冲击,却不能代替人的思考。电视的本质是要完成叙事达意,给观众传递导演的构思与创造的故事,因此,除了要重视数字技术及其带来的视觉效果之外,还要将数字技术与内容进行有机融合,让数字技术为任务为剧情服务,进而真正将我国电视产业的发展推向一个新的高度。
摘要:随着科学技术的不断发展,信息技术在社会的多个行业领域中都得到了广泛而有效的应用,尤其是在文化产业,发挥着不可替代的重要作用。而电视作为文化产业的重要组成部分,在信息化与数字化浪潮的席卷下,在全球范围内也发生着一场深刻的数字化变革。本文首先就数字电视画面进行了简要概述,然后就数字电视画面的艺术特征作了进一步的分析与探讨,希望能为实际工作起到一定的指导作用。
关键词:数字技术,电视画面,艺术特征
参考文献
[1]郭蔓蔓.数字媒体艺术与中国电视包装[J].电视字幕(特技与动画),2013,(7).
[2]侯杰.中国数字电视发展的外部阻碍和内部困惑[J].中国传媒科技,2014,(2).
论图书馆数字化的特征和功能 篇11
关键词:数字图书馆;特征;功能
图书馆是目前一种重要的社会资源,其集科学文化教育和社会信息为一体,在我国现代信息化建设中,图书馆有不可替代的作用,因此大力发展图书馆建设,实现图书馆由传统向现代数字图书馆转变,是当今中国图书馆面临的紧急任务。
图书馆数字化是在现代科技信息技术的环境下应运而生的一种新型的图书馆。它是现代信息社会中高度数字化信息资源,是与信息应用相结合的信息集合体,它收集了各种有高度价值的多媒体的信息,如图像、文本、影像、影视、语言、软件、科学数据等,并把这些收集来的信息进行加工、保存和管理,达到知识增值的目的。数字化图书馆提供了在高速网络上的跨地域连接的电子存取服务和数据安全管理等。它就是一个电子网络,把世界上的各种各样的不同类型的图书馆通过电子网络技术连接起来,强调一个资源共享的“虚拟图书馆”,就是除了本地图书馆之外,还有许许多多的其他图书馆,甚至是国外的图书馆都可以被联机访问,其资源和服务在很大程度上超过了原本的“馆藏”,是一个真正连接了各地、全国甚至全世界的信息资源的网络传递系统。
一、数字图书馆的特征
(一)高效的计算机管理。数字图书馆是通过计算机管理各种文献信息资料的,这与当今的自动化的图书馆相类似。
(二)新型的存储技术。数字图书馆的信息资源有除了文字以外的很多表现形式,如图形、图像、声音、视频、动画等,图书馆利用先进的计算机技术把各种图、文、声信息转换成信息代码,与现代多媒体技术的相结合,更好的进行了统一存储和管理,这就给存储空间的压缩,组织形式的改进,检索速度的提高,用户远程检索的便利,更新升级的加快,维护费用的降低奠定了基础。这是数字图书馆的最基本特征。
(三)组织形式不断网络化。信息的组织形式由线性的方式转变为网状的组织形式。由传统的顺序排列,利用数字化的技术将其变成代码,使得信息可按自身的逻辑关系组成相互联系的网络结构,连接了全世界不同数据库的信息,从而使用户能较以前更快速、更灵活、更直观的查找相关信息。
(四)网络化传输信息。数字图书馆的重要基础是网络通讯系统,通过此基础提供了广泛用户接口,而用户又可以通过这些接口利用计算机终端的人机界面,随时随地的访问数字图书馆上的信息资源。
(五)以人为本的模式。通过计算机网络,利用文献没有时间和空间的限制,用户可以在任何时间任何地点检索或者获取自己想要的信息,并且获取的信息范围不像传统图书馆那样局限在一两个图书馆,而是扩大到本地区、本国甚至全球。查询获取的方法也极为便利,不用来回办理各种手续,在办公室或家里就可以轻松地在信息的海洋里遨游。
(六)高效的服务活动。能否为用户提供满意的服务是现代数字图书馆工作好坏的标准。当用户在进入数字图书馆的过程中遇到问题时,图书管理员可以通过数字图书馆向用户提供各种方便灵活的帮助,使用户能够真正体会到数字图书馆相对于传统图书馆的优势,而用户可以把自己在使用过程的种种信息反馈回来,这样不仅可以提高图书管理员的服务质量而且还可以体现双方的合作性和交流性,从而进一步的推进图书馆的信息化、数字化过程。
二、数字图书馆与传统图书馆优势互补
数字图书馆是在传统图书馆的基础上发展起来的,而传统图书馆与数字图书馆的技术融合又是现代图书馆的发展方向。传统图书馆是一个物理实体,由藏书、馆员、读者、设备、技术、方法及管理等要素组成的。它的出现已有数千年的历史,它是对文献资料进行收集、组织、加工、存储、开发、传播与利用,绝大多数是印刷图书和报刊。其优点:一是手写。印刷等状态收藏较系统,保存时间长,内容不失真;二是非盈利性。免费服务于全社会的文化教育和科学研究;三是入馆或借阅手续简单。文献利用方便不受网络故障等因素干扰。但传统图书馆也有不足:一是体积都比较大,占用空间多,借阅数量受到限制;二是传递信息的速度慢,不能及时更新内容。
数字图书馆是一个虚拟的信息空间,是由现代科学信息技术、信息资源、计算机技术、通信网络、专业人员、网络渠道和连接网络的用户组成的。它是利用现在先进的信息技术将实体和虚拟的馆藏文献信息资源为用户提供快速利用的現代方式。其优点:一是不受时间、空间的限制,利用计算机网络技术可以随时随地自由的存取、检索、查询自己需要的信息和知识;二是信息载体的存储空间大,体积小,不受物理空间的限制;三是信息传播速度快,不分国家、区域可达到资源共享,同时内容更新及时。其不足主要表现为:一是知识信息存储的载体有寿命的限制,时间一长,容易造成知识信息的失真与丢失,同时也受计算机病毒的威胁;二是利用计算机阅读时间长,视力承受能力有限;三是容易受网络故障等因素的影响;四是不能直接阅读以数字化方式存储的信息,只能通过计算机等设备才能阅读,使用方式范围受到一定的限制。
可见,数字图书馆的优点也是传统图书馆的不足,而传统图书馆的优点正是数字图书馆的不足。传统图书馆是数字图书馆产生与发展的基础,数字图书馆是传统图书馆的必然发展方向,二者相辅相成、优势互补。
结语
数字特征 篇12
所谓数字水印(Digital Watermark)技术是指用信号处理的方法在数字化的多媒体数据中嵌入隐蔽的标记。数字信息隐藏(Steganography) 技术是指信号处理的方法将隐秘信息隐藏在载体文件中,通常载体文件是多媒体文件,上述两种技术具有较大的相似性。本文中,将从数字信息隐藏的角度进行讨论。从隐藏域的角度分类,数字信息隐藏以非压缩文件格式为载体例如WAV,BMP等,变换域数字图像隐藏用于压缩格式的载体文件,大多数多媒体文件采用了DCT变换[1,2,3,4,5] 作为其压缩的变换算法。数字隐藏信息检测[6,7]是一种区分含有隐藏信息的文件和正常文件的方法。DCT 域数字隐藏信息检测包括需要对隐藏信息信号所隐藏使用的算法有较多了解的针对性算法[8,9],而盲算法[10,11,12,13,14,15,16,17,18] 期望通过分析待检测对象的一组对信息隐藏敏感的特征 ,利用基于该特征组的分类器将含有隐藏信息的文件从不含有隐藏信息的文件中分离筛选出来。
现有的DCT 域隐藏算法分析和研究已经提供了对我们具有较多了解的信息隐藏算法的针对性检测方法。但盲检测由于其不能仅着眼于个别隐藏算法引入的特殊特征,而需要区分任何由已知或未知算法引入的通用修改和由数字图像处理、增强或任何与信息隐藏、水印无关的处理过程造成的特征变化,故具有比针对性检测方法高得多的理论难度。Tomáš Pevný 和Jessica Fridrich[17] 提出了一种使用多维SVM (Support Vector Machines,即支持向量机) 和Gaussian kernel(高斯核)对23组函数在原图像和边远切割并重新压缩后构建的向量特征进行分类的算法。该算法提供了一种具有不错性能的盲检测方法,但是其准确率取决于其训练集和待检测目标对象的相似程度,且该算法必须对一次压缩和两次压缩的图像文件进行区分处理,并使用不同的SVM进行处理。
在本文中将提到的新检测算法是一种针对JPEG格式的DCT域隐藏的盲检测算法。“DCT频率特征分析”是指一种对JPEG图像文件在其DCT变换域上对DCT系数类似于“频率分析”的方法,它同时也是在下文中将要介绍的数字隐藏信息检测算法,该方法对几乎所有类型的常用的和互联网JPEG图像均具有广泛的适用性,并不需任何类型的训练参与。
2 JPEG图像中的DCT频率特征
DCT变换被广泛的用于数字图像与数字视频的压缩。在 JPEG 标准文档中[19] ,在每个8*8 的块上作DCT变换:
接着DCT系数被除以量化表中对应位置的数字,这一过程被称作“量化”。8*8 的量化表包括64个整数,每个整数的值与DCT变换对应位置的系数对应。在下文中,我们将涉及更多JPEG压缩过程的细节并假设读者已经完全了解这些内容。
2.1 压缩块边缘的频率特征
设Dc(u,v)表示DCT载体图像在隐藏信息以前其DCT系数的每个值,Ds(u,v)是被隐藏在图像文件中的信息, 隐藏信息后图像的DCT系数可表示为:
D(u,v)=Dc(u,v)+Ds(u,v)
考虑8*8DCT 块的四个边缘中之一在IDCT过程中的情况,以在块中第一行(y=0) 的像素为例,设P(x,y)为该行中每个像素的灰度值:
在隐藏信息后的图像各DCT块中的绝大多数行中,不会有超过一个的系数由于隐藏过程而被修改。上述断言的原因是,在大多数 JPEG 文件中,每个DCT块中都有大量的系数“0”,系数“0”不能隐藏任何的有效信息,所以超过一半的DCT系数事实上是无法适用的。另一方面,隐藏算法为了保证自己的统计不可发现性,仅会使用非0 DCT系数中的部分。所以我们仅对非0 DCT系数进行分析。假设:
Ds(u,v)=ds≠0 (u=u0,v=v0)
Ds(u,v)=0 else
在上文中提到的,设P(x,y) 表示在图像中位于(x,y) 位置的像素灰度值,采用与前述DCT系数相似的假设, Pc(x,y) 表示该图像文件在隐藏信息前的像素灰度值, Ps(x,y) 表示隐藏过程对像素灰度值造成的变化,仍然以DCT块中第一行为例,
y=0 :
由上式可以看出,隐藏过程本身会造成一加性的“单一频率信号”在DCT块的边缘像素上。在上述等式中,增益取决于Ds(u0,v0)和这一系数的垂直位置v0,其频率取决于该系数的水平位置u0。也就是说,在该系数中,若该块中不存在隐藏信息比特,Ps的值应该为0,若该块中存在隐藏信息比特,非0的增益系数对应了含有隐藏信息的DCT系数的垂直位置,非0的频率值对应了含有隐藏信息的DCT系数的水平位置。也就是说,我们可以通过这一差值确定该块中是否含有隐藏信息比特,并通过边缘像素差值的频率和增益的分析确定含有隐藏信息的DCT系数的位置。
2.2 量化影响
为了简化上述的讨论,我们没有将量化整数对上述分析的影响引入。事实上,在JPEG压缩的过程中,所有的DCT系数都会被一个对应的量化整数所除并取整,这个量化整数值的选取通常与DCT系数对应的频率有关,频率越高的DCT系数,其对应的量化系数值越大。隐藏信息算法会在量化后的DCT系数上增加隐藏信息,令Q(u,v)表示位于(u,v)的量化表系数, dc(u,v) 是量化后的DCT 系数, ds(u,v)是在量化后DCT系数上增加的隐藏信息,Dc(u,v)是图像文件在量化前的DCT系数,再解压缩时被乘以量化表系数还原出的对应系数为
比较量化引入的噪声ΔDc(u,v) 和隐藏信息引入的噪声 ΔDs(u,v),我们可以得到:
ΔDs(u,v)=ds(u,v)Q(u,v) (|ds(u,v)|≥1)
Δdc(u,v) 是在取整过程中被抛弃的小数部分,其取值范围在-1/2 到 1/2, ds(u,v) 是一个整数,若其为非0,通常应该是±1 或绝对值比1更大。进一步的,不同DCT系数的 Δdc应该是相互独立的。所以如果将一组DCT系数的 Δdc相加,随着DCT 系数个数的增加,其统计期望|∑Δdc|应当非常接近于0;但∑ds通常与ds自己相等,这是由于绝大多数ds均等于0。
由上述分析可以得到如下结论:上述系数的增益,受到隐藏信息的引入性噪声影响远小于量化DCT系数引入的量化噪声。同时请注意2.1的分析结果仍然成立。
3 JPEG图像的隐藏信息盲检测
3.1 解压缩后图像的分析
设
考虑到:
所以:
设:
Δd′1c(u,v)=(-1)vΔd1c(u,v)
和Δd′2c(u,v)=-Δd2c(u,v)
d′s(u,v)=(-1)vd1s(u,v)-d2s(u,v)
上述的等式可变化为:
设:
我们得到:
考虑与x相关的等式
3.2 参考图像构建
由于人眼对于绿色的灵敏度高于红色和蓝色,JPEG标准中,使用了YCbCr色彩模型[19],以增加压缩的效率。Y 层使用了较小的量化表系数,甚至可能比其余两个层使用了更高的采样率。大多数的 JPEG 图像中,多于50%的非0DCT系数存在于Y 层中(典型的值约为75% ),所以隐藏信息存在于Y层中的比例也大约相同。也就是说, Y层包括了主要的隐藏信息,同样的,它有着最多的由于隐藏过程引入的噪声分量。
由于在RGB色彩模型到YCbCr色彩模型的变化中, Y层代表了整幅图像亮度的主要能量,我们可以用RGB模型中明度的值来对Y的值进行估计:
虽然
3.3 估计ΔΨ′(u)
根据3.1所作的讨论:
为了分离不同的组成波部分,我们使用了一维的一类似余弦调制过程进行处理:
其中, Γ(t) 是对ΔΨ′(u) 通过目标图像和参考图像灰度阶差值变换,所得到的可靠估计。
为了保证上述操作过程的精确性,在上述计算前,先进行一次能量均衡。取
最后的
在找出
u0=ut=ubv0=vl=vr
D(u0,v0)≠0
其中D(u,v)是位于位置 (u, v)的DCT块中的系数值。
理论上讲,一个被修改过的DCT即可判别该图像含有隐藏信息。为了避免计算或图像本身引起的误差,如果在单幅图像中,确定修改过的或含有隐藏信息的DCT系数个数超过某一预定阈值,则可确定其含有隐藏信息。在一些经验性的结论中,以上阈值被设定为80。除防止误差外,上述阈值也基于少于10字节的数据很难构成有效信息这一假设。
此外,根据被修改的DCT系数特征和分布,可以部分地判断隐藏算法的种类,例如连续分布的是Jsteg,修改值较大的是JPhide,DCT系数分布正态性较好的是OutGuess0.2等,对具体算法的确定已超出本文的范畴,故在此不再赘述。
4 实验结论
我们创建了一个图像组来测试文中讨论的算法的效率,该组图像与研究所做的图像组完全独立,没有任何联系。该组图像的数目大约在6000幅左右。
为了模拟一个足够复杂的应用环境,测试组的图像包括了来自数码相机的数码照片、网络图像、艺术创作的图像和来自扫描仪的数字图像。这组图像的量化因子分布广泛,介于25至90之间。
测试组图像的尺寸从25,600 像素到3,145,728 像素,其纵横比从3:1 到 1:3,图像的大小几乎均匀地分布在最大值最小值的范围内。
我们隐藏了不同类型的信息在约4,000 图像中,使用了不同的隐藏算法或软件包括Jteg[20], Jphide[21], OutGuess0.2[22], F5[23] 和另一程序,其随机地选择部分非0 DCT系数,并且随机地使用 0或1 替换其DCT系数的LSB(Last Significant Bit)位(我们将此程序叫做RDN程序,即Random DCT Noise,随DCT噪声程序)测试使用了2个不同的RDN程序,它们使用了不同的PRNG和参数,我们将其叫作RDN1和RDN2。
隐藏信息包括了TXT文档和WORD文件,GIF、JPEG、BMP图像文件以及一些其它格式文件,大小介于100Byte 到200k之间。
样本文件的资料罗列如表1所示,图像隐藏比率是由隐藏图像的大小和载体图像文件在该算法下最大信息承载量之比,以100% 为最大值,0% 为最小值。
通过本文算法对上述图像文件进行检测的结果列于表1,在每一隐藏算法对应的行中,第一排是样本文件数量,第二排是被检测算法测出的文件数量,最下排的百分比是其检测的测出比率。
同样还有大约2,000不含有任何隐藏信息的图像文件,他们通过检测算法得到的结果如表2所示。
根据上述罗列的结果,我们可以得到,该算法平均的隐藏信息测出率约为93.75%,不含隐藏信息文件的平均误检测率为3.85%。 在不同类型的JPEG图像中我们得到了非常好的检测性能 ,包括两次压缩的JPEG图像,由数字图像软件例如Photoshop 和ACDSee 处理过的文件和具有不同视觉特征的文件。大多数在检测中发生错误的文件都是尺寸较小或图像过于简单的图像,其含有不足的非0 DCT 系数。除此以外,发生误测的图像通常是卡通图案,可能是由于其色彩丰富程度与普通照片差距太大,以及扫描所得图像,其可能仅仅含有黑色和白色两种颜色。当然,这些图像由于其过于特殊,可以通过在检测算法前增加一简单的分类器,来保证算法的效率。
5 结 论
在本文中,我们提出了一种数字隐藏信息的检测算法,该算法针对DCT域的JPEG图像,将注意力集中于Y层上DCT变换块边缘的像素差值,通过对Y层从RGB层的估计和对不同差值序列的变换,找到发生改变的DCT系数位置及其个数。利用确认的发生DCT系数改变的比率作为门限确定是否含有隐藏信息。与之前的JPEG域盲检测相比,文中提出的算法无需任何训练参与,因而具有更广泛的应用范围,在多种不同类型JPEG 图像上应用时,具有更高的准确率。
在实验中,我们使用了6,000图像文件,其中4,000含有不同类型的隐藏信息,2,000不含任何的隐藏信息,作为测试集。在该测试集上,我们得到了对于含隐藏信息图像高于90%的测准率和对不含隐藏信息图像低于5% 的误测率。
进一步的工作还包括涉及更加有效的最佳门限估计方法,以此来提高检测率和降低误测率。