数字化修复(共8篇)
数字化修复 篇1
0引言
随着存储时间的增加,年代的久远,历史影像档案的老化也愈加严重,修复与利用已成为当今档案管理亟待解决的课题。本文所述的数字化修复,主要是指影像资料数字化后,利用其图像序列信息,针对图像中丢失或者受损部分进行填充和修正,以期实现图像复原,或接近原图像的视觉效果。
现较为成熟的视频修复工艺,多采用电影胶片后期制作与修复设备。而针对广播电视磁带所特有的损伤类型,尚且未见成熟的有效设备,往往通过手工方式进行修复,工效很低,投入的设备成本及人力成本巨大,直接制约着修复效率的提高。
随着全媒体互联网应用的飞速发展,对珍贵影像档案资料的再开发利用需求,与日俱增。如何在修复成本与价值体现之间寻找平衡点,笔者从边际分析的角度,优化产业化流程设计,以实现效益最大化。
1影像档案数字化修复工程的生产问题
影像档案数字化修复是一种长期性、持续性进行的工程项目。在进行过程中往往会遇到以下几个方面的问题:
1.使用价值先增后减
以上海音像资料馆的修复生产与再利用的实际数据为例(见表1),档案的修复量与使用量,以及最终的使用价值都具有先递增后递减的趋势(见图1、图2),当修复量刚开始增长时使用量也逐渐递增,但当修复量达到一定高度时,使用量将出现拐点,而后随着修复量的持续增长而呈现下降趋势。
2.设备成本居高不下
对于磁带损伤出现的特殊类型修复,需要投入较大的人工。拓扑费用相当于单机设备的叠加,且对于周边系统的兼容性不强。导致设备拓扑成本较高,且需要更多人工参与修复。
3.修复效率提升缓慢
修复效率提升缓慢体现在以下两个方面:
第一是手动修复的工作量较大。由目前制式产品系统的特点可知,修复设备需要投入较多手动修复的工作量。因此,简单的增加设备,并不能明显提升修复效率。
第二是成熟人才来之不易。档案数字化修复对操作人员的专业性要求较高,手动修复需要较强的绘画功底与图像质量鉴赏能力,也需要拥有一定的计算机设备操控能力。因此,专业人才稀缺。
2影像档案数字化修复工程的生产要素分析
通过实践,我们认为,影响影像档案数字化修复工程的生产要素有三个方面,包括修复内容、技术投入以及人力投入。为方便研究,我们采取“单一要素变动、其他要素不变”的方法,探究各生产要素分别变动时对生产收益的影响。影像档案修复工程的总效益有先递增后递减的趋势,这种趋势被称为边际效益递减规律。按照该规律,如果其他生产要素固定不变,则只通过增加某一种生产要素所增加的收益迟早将会出现递减的现象[1]。也就是在修复内容选择策略、修复技术设备不变的情况下,仅仅只增加人力成本,最初产量会增加,但当该生产要素的增加超过一定限度时,则增加的产量会递减。同样修复设备的增加也会对现有修复技术与设备环境提出挑战,最终到达瓶颈,同时修复后档案的使用量也并不会因此得到明显提升。因此,盲目增加人力成本或设备并不能永远提升档案修复的价值收益。
当修复的边际效益大于边际成本时,修复工程处于高价值状态;而当其边际效益小于边际成本时,修复工程处于低价值状态。由此可以确定修复生产的临界修复量,这对我们提升修复技术与形成修复策略提供了科学的依据。以下从生产要素出发,分析相互之间的影响与作用关系。
2.1修复内容分析
修复内容分析可从以下四个方面进行考虑:一是统计待修复的总量以便匹配相应的投入;二是分析损伤分类量,以便有针对性选择相应的修复技术;三是预测修复后的使用量,以合理调配生产计划;四是核实档案价值分布情况,以确定合理的待修复档案价值分布选择。
根据馆藏的价值程度可对档案分为以下三级:
1.重要级:反映社会发展现貌的影像;
2.珍贵级:反映社会变迁的影像;
3.极其珍贵级:反映历史社会的影像。
以上海音像资料馆的基本情况来看,已数字化的影像档案总量约为51万小时,待修复的总量约为12.37万小时。其中,80年代之后的重要资料约占70.5%,损伤类型为斑点、闪烁、拉条等综合型;50~80年代的珍贵资料约占29.2%,损伤类型多为磁带损伤特有的不规则拉条;50年代以前极其珍贵资料占0.3%,且存储介质多为胶片,因而胶片损伤多为竖拉条、霉斑、污渍等。
通过上述的统计数据可见,就待修复影像档案的价值分布趋势而言,在数量上是“重要级”>“珍贵级”>“极其珍贵级”,在画质上是“重要级”优于“珍贵级”优于“极其珍贵级”,当然不排除偶然损坏现象。对于修复后的被使用情况存在一定的随机性,但一般意义上,数量大的集合被使用到的几率也相应较大。故此可以推导出,在修复后的使用量上“重要级”>“珍贵级”>“极其珍贵级”。另外,显然在档案的使用价值方面,“极其珍贵级”>“珍贵级”>“重要级”。见图3。
在修复内容的选择上,应根据使用量与价值分布情况,合理安排生产计划。依照损伤类型采用相应的修复技术,提升修复效率。
2.2修复技术选择与设备投入
影像档案数字化修复工程的修复设备可以直接采购现有的制式产品,也可以根据馆藏具体的损伤类型自主研发修复技术与系统。前者主要适用于胶片载体,而对于磁带数字化后的影像档案修复,推荐自主研发修复软件系统。磁带损伤所特有的不规则拉条现象,就是由于磁粉脱落,或播放设备磁头堵塞等原因显现出的拉条现象,拉条常为水平方向出现,且多为左黑右白的粗条带,随着时序有长短之间的变化,但位置基本不变。此类损伤,可以采用一种基于感知编码的条带损伤自动检测算法[2],该算法根据条带损伤的颜色选择灰度形态学的处理方法标记极值点,最后根据感知编组中的相似性和连接性规则,将条带从极值点中识别出来。条带可以通过计算机自动检测,并采用一定的修补算法,就能够实现自动修复,从而明显提高该类损伤的修复效率。
2.3劳动力投入
影像档案数字化修复的第三个重要生产要素就是劳动力的投入。
一是个体的综合素质。影像档案数字化修复对操作人员的个体综合素质要求较高,如果没有修复操作的工艺知识引导,人才的成熟期将很长。并且在具体的修复效果和效率上,对于个人经验的依赖性较强。
二是人力投入总量。人力投入总量需要考虑对修复设备成本与修复硬件环境的影响。当然,修复设备越容易操控,对操作人员的专业技术要求越低,培训的成本也越低,人力成本也随之下降。
综上所述,修复内容总量,将影响修复技术与设备的选型,影响修复工程的计划制定,影响最终工程投入的价值体现;修复技术的选择与设备投入,应根据修复对象损伤类型,采取购置成熟设备或定制研发修复软件;劳动力则根据修复总量和技术投入适度匹配。同时,注重人才培训,尤其是修复知识的传承,以降低劳动力成本,提升生产效率。三者如何平衡选择,是海量影像档案修复所面临的重大决策性问题。
3影像档案数字化修复工程的优化实现
影像档案数字化修复工程的优化实现,建立在流程化管理的基础之上,包括制订年度修复计划、完善修复工艺流程、优化修复质量评价体系、建立影像档案修复数据库以及实施修复设备与技术革新等。即档案数字化修复,也应遵循工程化项目的管理模式,进行运营维护。从三大生产要素出发,寻找最优实现方案,实现最佳投入配比,以实现边际效益最大化。
3.1内容与修复技术的匹配优化
档案修复内容的选择与修复后的使用,存在着必然的联系。如果仅通过年代上的价值高低去选择修复内容,往往达不到最优的使用价值效益。根据2.1对修复档案等级的特质分析,盲目地选取修复内容是不可能实现边际效益最大化的。
首先应根据历年使用量分布情况,分配不同等级的修复量;其次,根据市场需求预估未来使用量分布,有计划安排生产;最后根据不同的损伤分类,采用不同的修复技术。价值重要级的,往往画质较好,可采用简单的降噪实时修复,提高修复效率与产量;价值珍贵级的,可以根据不同的损伤类型添加多种算法,综合修复画面质量,仍以实时修复为主;价值极其珍贵级且未来拥有较高使用概率的,可以采用精修模式,即逐帧修复,最大限度地还原图像原貌。因此,根据馆藏内容特质分析,建议每年的修复内容配比见表2。
3.2修复技术水平与设备优化
自主研发修复软件系统,是提升修复技术水平的最佳优化方式。上海音像资料馆根据馆藏损伤类型的特殊性,研发了数字视频修复系统,修复处理主要包括:图像褪色校正;对比度、亮度校正;降噪处理;去除闪烁;去除随机污染点;去除大斑点;提高清晰度;去除细划痕;去除不规则划痕;检测和重建丢失的图像数据等10种损伤类型。系统设计拥有任务分配与流程化作业功能,适合于大规模产业应用。自主研发系统与制式产品特点分析见表3。
通过与制式产品特点的比较,作为有能力实施技术开发的大型档案管理机构,研发一套适合本馆修复特点的技术系统是值得推崇的。特别针对Umatic 3/4磁带不规则拉条,研制的修复算法,将大大提升此类资料的修复效率与效果。
3.3修复劳动生产力优化
提升劳动生产效率,可以通过提高个体的专业技能,也可以通过加大人力投入总量。但这些都将导致人力成本直线上升。我们认为,可以从修复工艺知识管理入手,遵循一定的修复原则,降低操作人员的专业性要求,为提升修复质量进行知识化引导和培训。
3.3.1修复原则
1.最优版本保存与选择
在正式着手修复之前,必须在片库中寻找有可能更清晰的资料版本,即损伤相对较小的版本,不排除通过现有的播放设备再次进行数字化采集。或者通过比对,寻找更为清晰的片段进行合成,也为后续修复提供颜色、亮度等基础信息,提供参数调整依据。对于利用现有技术手段无法修复的档案,应保存相对较清晰版本,以备将来技术革新后再予修复。
2.影像档案修旧如旧
历史影像资料修复的主要原则是修旧如旧,保持原貌原韵。修复历史视频资料绝不能凭主观想象随意改变原状,要尽量维持原有视频的亮度与色调,恢复当年制作面貌,修复由于物理损伤、潮湿霉变和播录设备等外在原因造成的图像质量下降现象,而非刻意美化。
3.画质与降噪的最优平衡
数字化修复的过程中,往往会遇到修复噪声与降低画质的两难境遇。对于这种情况不能一味地追求噪声的修复效果,必须要在不影响正常观看,不影响画面内容正常认知的前提下,进行噪声消除。噪声消除的过程中,往往还会产生修复痕迹,对于画面产生和谐感的修复痕迹可以接受,如果产生突兀的修复痕迹,只得放弃或降低修复强度。影像资料特别是黑白的影像资料,可以通过增强纹理发现一些画面细节,有助于真实历史影像纪录的鉴别与发现。彩色影像资料也可以通过增强纹理提高画面清晰度和画质,但值得注意的是过度增强纹理,会产生不真实感,同时也会对噪声进行放大。
3.3.2修复工艺流程优化
该流程应通过反复验证、反复修正的形式,进行不断优化,我馆现在采取如下流程。
1.浏览整个视频文件,按照黑白/彩色,静止/运动,损伤单一/复合对视频进行分段;
2.记录下亮度对比度色度等基础参数,以便统一修复目标;
3.针对视频出现的缺陷使用相应的算法进行观察,调整算法中的参数以达到最佳的修复效果;
4.针对不同的分段进行相应的算法添加,记录需要进行二次修复的段落;
5.记录最佳修复效果时算法的参数设置,并在其他段落尝试使用;
6.要注意,如果在同一段有不止一个算法,那么算法的上下顺序会影响到最后的修复效果。需要多尝试几次来决定哪个算法先执行哪个后执行;
7.对相应的段落进行二次或三次修复;
8.检查并修正段落间因添加不同算法而产生画面不连贯的问题;
9.对部分帧进行细节处理,交互手动修复。
4影像档案数字化修复方案优化前后对比
遵循边际效益理论,通过对修复内容、修复技术投入和劳动力投入的深入分析,提出了上述具体的优化实现方案。现在以上海音像资料馆为例,假设设备环境拓扑3台修复设备,修复操作人员为3人,年待修复总量为150小时,进行优化前后的对比如表4。
其中表4为采购制式修复设备产品的方案,不对修复内容进行优化,三类修复内容均分;单机平均修复效率为1:40(表3),不能对所有损伤类型都取得明显的修复效果,由此计算,耗时总天数为357.2天;采用制式产品,单价及拓扑价按58万元计算;不考虑修复量和劳动力的优化,人力成本单价按6000元/月计算,得出总成本为195.6万元;使用量则根据我馆目前实际使用比例计算,修复后的档案使用价值为93.6万元。
表5为自主研发的修复设备且对生产要素进行优化后的结果,三类修复内容按表2分配比例,内容根据市场需求选择;单机平均修复效率为1:50 (表3),各类损伤类型的修复效果都较为明显,由此计算,耗时总天数为257.1天,较优化前缩短100天;采用自主研发产品,单价及拓扑价分别为60万与3万元;由于对劳动力进行了修复工艺知识的引导,劳动力成本有所下降,单价按5000元/月计算,得出的总成本为88万元,较优化前减少了110.6万元;使用量由于修复内容的定向选择预测增长为10%,修复后的档案使用价值为113.1万元,较优化前增加19.5万元。
(注:平均修复效率指待修复内容时间与实际修复耗时的比值)
(注:表中每天工作时间按7小时计算;重要级、珍贵级和极其珍贵级的价值单价按2300元/分钟,4600元/分钟,6400元/分钟计算)
延续表1可得修复使用率趋势,优化后的使用率明显提高,见表6和图4。由此可见,通过边际效益分析优化的方案取得了更低的边际成本,更高的边际效益。
5结束语
影像档案数字化修复是一个系统性工程,档案机构可以从修复内容、技术与劳动力三大生产要素之间相互作用的关系入手,遵循边际效益分析原理,形成提高产量与提升使用价值的手段与方法。合理配比档案修复内容,紧跟市场需求,通过数据分析与预测提升修复档案的使用率,从而增加影像档案的总效益;按照工程化项目管理模式实施档案修复,形成健全的管理机制,不断优化技术投入与革新;根据三项修复原则,反复修正并形成修复工艺知识积累,提高劳动生产率,提升整体修复效益。在考虑成本与效率的前提下,探索修复技术运用及规模化生产的效益最大化将是我们永远探索的目标。
摘要:本文通过边际分析法,对优化实现影像档案数字化修复工程的进行研究与探讨。基于修复工程中的内容、技术与劳动力三大生产要素之间相互影响与作用的关系,形成优化实现的解决方案,供业内借鉴与参考。
关键词:视频修复,修复原则,工艺流程,边际分析
参考文献
[1]丁涛.交通运输企业运输生产的边际效用分析[J].武汉理工大学学报,2003(2).
[2]张阳.旧视频资料中条带损伤的自动检测方法[J].电视技术,2012(7).
数字化修复 篇2
关键词:图像自动修复技术;应用
中图分类号:TP311文献标识码:A 文章编号:1009-3044(2007)15-30819-02
The Theory of Digital Image Inpainting and Application in Prepress
CHEN Hong-yan
(Institute of Jingmen Vocational Education,Jingmen 448000,china)
Abstract:The image inpainting technology is a complex work which needs the experienced engineer to process by hand operation. Now, the hot discussion of image inpainting technology in computer image process area provides the new methods and orientation. This paper introduces the inpainting technology and its development, and the application in printing industry.
Key words:image inpainting;application
1 引言
图像修复是一项起源于欧洲文艺复兴时期古老的艺术行为,起初是为了恢复美术作品中丢失或被损坏的部分,同时保持作品的整体效果,通过手工描绘来填补美术品上所出现的裂痕,使图画得到翻新。这种工艺手法叫做“Retouching(润饰)”或者“Inpainting”(修补或修复)。如图1所示。
图1 手工修复艺术作品
随着计算机技术的飞速发展,数字图像作为视觉信息获得和传播的主要载体,已经得到飞速发展,而数字图像修复技术则是数字图像处理技术的一个重要分支,图像修复是指恢复图像中破损区域的颜色信息或除去图像中的多余物体,在文物保护、影视特技制作、虚拟现实、多余物体剔除(如视频图像中删除部分户物、文字、小标题等)等方面有着重大的应用价值。其主要工作原理是利用数字图像待修复区域的邻域或前后帧信息填充数字图像待修复区。研究者们现在正在开发自动的图像修复技术,用户只需简单的选择要恢复的区域,计算机就会自动完成余下的工作。这样就能够显著地减少处理数字图像的时间和精力。虽然一些强大的数字图像处理软件(Photoshop等),也可以完成这样的处理工作,但却需要有经验的技术人员进行复杂的手工处理,用户必须区分要修复的区域,并要仔细考虑要填充什么样的颜色、格式和纹理。
2 图像修复的方法与技术
在设计Disocclusion(遮蔽物去除)修复算法之前,首先考虑一下人的视觉是如何来修复图像的。计算机视觉中有一个结论,即人是根据其生活中积累的经验来感知世界的。人们经常根据其经验对周围环境中被遮蔽物体的形状做出一个最佳猜测,如图2所示。
对于图2(b),人们的感觉是一个字母E,而对图2(a),人们的感觉可能是两个字母E,同理,人们对被遮挡物的猜测也存在这样不确定的结果,这就说明人的猜测是通过尽量延长图像中的边缘来恢复被遮蔽物体的形状,同时,遮蔽物体的大小也可能影响人的判断,因此,修复算法应该尽量模拟这种效果。
图2 被遮挡物体的猜测
计算机图像Inpainting技术正是从人的视觉心理学角度模拟这种效果,根据被遮物体的边缘信息,按照一定的方向进行延伸扩散、边界连接,填充遮蔽部分,达到视觉上的连通。当然,由图中我们也看出图像的被损信息大小(障碍物大小)也直接影响人们视觉上的连通判断,从数学的角度看,这种由于被损图像周围信息不充分情况下导致的图像修复结果不唯一的现象属于病态问题,因此,图像Inpainting技术还需根据计算机视觉理论,通过一定假设条件的限定设计修复算法,来解决这个问题。
数字图像恢复技术就是建立模拟的图像退化模型,根据被遮物体的边缘信息,按照一定的方向进行延伸扩散、边界连接,填充遮蔽部分,达到视觉上的连通,获得原始影像的估计值。
根据图像信息特征,目前,现有的图像修复技术主要可以分为基于扩散(Diffusion)的修复和基于纹理合成(Texture Synthesis)的修复两种方法。
2.1 基于扩散的修复方法
基于扩散的修复的方法己经有了很多,对去除图像中的裂缝、污点和覆盖在图像上的文字有比较好的效果。这些算法的主要思路是利用物理学中计算热流的偏微分方程来做图像修复。通过求解偏微分,计算出要填补的空洞处的线性结构(在图像修复中称作等光强线(Isophote) ),然后通过扩散把周围的颜色填入空洞中。这种基于扩散的方法的主要缺点是会使填补的部分产生一定的模糊,而且填补的空洞越大,模糊的效果越明显,不能对很大的空洞进行修复,或去除图像中比较大的物体。Bertalmio等采用偏微分方程的方法进行图像修复,取得了较好的效果。用户需指定需要修复的区域,该算法将图像分为三个独立的通道,对每个通道,算法将待修复的区域边界的等值线外部的信息沿轮廓法向扩散到中间待修复的象素上。该算法用2D拉普拉斯算子方法估计局部颜色的光滑度,利用这个光滑度沿着等值线扩散,考虑了各向异性的扩散和轮廓的几何信息,以保证边缘处的边界连续。基于扩散的修复的方法的缺点就是对大面积的破损区域修复效果还不够理想。
2.2 基于纹理的图像修复方法
基于纹理的图像修复方法可以弥补基于扩散的修复算法无法较好地修复大面积破损区域的缺陷,但是往往需要很多的人工交互,对于单一纹理结构的图像,如岩石,土地,花纹等,其核心思想是仿真并生成局部纹理进行填充。因为纹理是物质构成成分的分布或特征的反映,它的局部性状信息能够表现相同纹理的共性。对一张纹理图,任取其中两小块纹理都是相似的,所以利用纹理合成的方法修复图像;对于多种纹理并存的图象上,修复的顺序十分重要,一般不同纹理的交界处是一些线性的结构(等光强线Isophote),如果能优先修复这些地方,结构信息就能比较好的保持下来。如果考虑样本纹理的颜色信息和结构信息对纹理块相似度的影响,就能更好地保证合成图像在结构上的一致性,取得较好的修复效果。
3 图像自动修复技术的应用
图像自动修复技术的对于印前图像处理有很好的应用价值。
3.1较好的修复效果
在印前,对于存在裂纹、破损、划痕的静态图像,如破损或折叠过旧照片,有划痕或被污染的透射原稿和反射原稿,或是要复制再现一些美术作品或古玩图像等资料,这些资料往往由于年代久远,保存条件、人为或其他种种原因,遭到部分损坏,对这些资料进行修复具有非常重要的意义,这时就可以通过图像修复技术自动修复。(见图3)
图3 基于扩散的修复方法修复划痕
3.2 提高修复效率
在一些资料中,经常由于一些特效原因,需要隐藏其中的某个目标或者去除其中的多余物体,或是在图像中去掉与图像内容无关的障碍物,以达到一定目的的,都可以通过图像自动修复技术简单的修复,用户只需要简单的选择修复范围,计算机就会自动完成对划痕、空白区域的填充,或是去掉障碍物后填充背景图案,可以很大程度减少印前图像处理的时间和手工工作量,也可根据修复的结果进行更进一步的图像处理。(见图4)
图4 划痕填充、障碍物去除效果
在上面的修复的修复实例中,需要强调的是,用户只需要简单的选择要恢复的区域,图像修复软件就会自动完成填充,修复等处理的工作,这样显著地减少了人为处理图像的时间和精力。
3.3 解决远程传输问题
图像修复技术可以解决用户在向印刷企业远程传输印刷内容时,由于网络或其他原因,导致图像信息在远程无线传输中发生图像信息残缺,或是数据解压后发生损失等问题。
3.4 图像高分辨率的应用。
一般情况下,当图像从低分辨率放大到高分辨率时,会出现严重的马赛克现象,图像修复技术可以将低分辨率的图像,经过处理后得到高分辨率的图像,并且能够有效减少由于放大过程中必要的插值引起的图像模糊的方法。图5中,运用图像修复技术,将左边的小图放大4倍成为右图,图像的质量基本没发生变化。
图5 图像修复的高分辨率处理
4 结束语
总之,图像修复技术作为图像处理的一个活跃的研究领域,在考古、军事、政治、科研、印刷、影视业,广告业等领域都有着重要的应用,INPAINTING的技术优势势必能很好地改善人的视觉效果,大幅度地降低成本,减少工作量,提高经济效益。
参考文献:
[1]许威威 ,潘志庚,张学敏. 一种基于整体变分的图像修复算法. 中国图像图形学报[J]. 2002.4
[2]王毅,周世生. 图像INPAINTING自动修复技术及其应用探讨[J]. 印刷杂志. 2005.5
[3]Bertalmio, M., A.L. Bertozzi, and G. Sapiro. 2001, "Navier-Stukes, fluid dynamics, and image and video inpainting". 2001 IEEE Conference on Computer Vision and Pattern Recognition. Decemben Kauai, Hawaii.
数字化修复 篇3
1 数字化印模技术的工作原理
数字化印模作为口腔修复CAD/CAM流程的首要环节,是逆向工程(reverse engineering)技术在口腔修复领域的具体应用。所谓逆向工程,是指在已有模型实物的条件下,通过测绘和分析,重新得到该实物的几何模型和特征数据,即对其进行数字化处理[3],主要包括三维扫描、数据处理、三维重建、纹理渲染4部分。
1.1 三维扫描
主要指借助三维扫描仪按照预设的扫描间隙和扫掠路径等参数对口内相关软硬组织或其制取的印模、石膏模型表面进行采样,获取其表面离散点的几何坐标数据,将其几何形状数字化。该过程以大量的点近似代表物体表面,获取的数据以点云(point cloud)形式存在[4,5](图1)。三维扫描的方法主要有2种:接触式和非接触式[6,7]。根据其扫描原理、设备结构的不同可进一步细分[8,9](图2)。
1.1.1 接触式扫描
通常使用三坐标测量机,当测量机上的机械式探针接触到模型的表面时,由于探针受力变形触发采样开关,通过测量探针在X、Y、Z 3个方向上的位移,即可记录下该点的三维坐标,逐点移动探针即可获取模型表面轮廓的三维形态数据(图3)。三坐标测量机的测量精度很高,但逐点测量速度较慢,且探针不能用于测量柔软、易碎的物体,如测量硅橡胶阴模[10]。Nobel Biocare公司的Procera Forte接触式扫描仪即属于此种类型(图4)。
1.1.2 非接触式扫描
根据工作原理的不同,主要包括三角测量(triangulation)、共聚焦显微(confocal microscopy)、主动波前采样(active wavefront sampling)、光学相干层析成像(optical coherent tomography)、立体视觉(stereovision)、相移干涉测量(phase shifting and interferometry)等多种技术。大多数口内扫描仪包含一种以上的扫描技术,用以减少在口内扫描时因各种原因造成的噪音点和错误的产生。以下分别介绍几种最常见的光学扫描技术的工作原理[11,12]。
1.1.2. 1 三角测量法
基于此方法的有立体摄像技术、结构光扫描技术、激光三角测量技术等。其基本原理是将光源发出的光束以一定角度照射到被测物体表面上,同时使用光探测器如CCD摄像机等接收光在被测面上的反射光或散射光,由光源、被测面上的光点、光探测器组成一个三角形,光源和光探测器的位置固定,其长度已知,它们与底线(b)的夹角α、β可通过检测其视角位置确定,从而求得光点的三维坐标[13,14](图5)。Sirona公司的CEREC系列口内扫描仪(图6)和绝大多数的口外扫描仪使用的都是基于此原理的结构光扫描技术[15](图7)。
1.1.2.2共聚焦显微技术
其基本原理是光束由光源发出后通过透镜聚焦到被测物体的焦平面,其反射光由透镜重新聚积后经分光镜反射到光探测器。光探测器前方的可调节针孔可以将焦平面以外的光过滤掉,保留高清晰度的焦平面信息。通过改变透镜的位置即可获得不同焦平面上的信息,逐层扫描可获取物体的三维形貌[13](图8)。目前使用该技术的口内扫描仪主要有Align公司的i Tero扫描仪(图9),3Shape公司的Trios扫描仪[11](图10)。
1.1.2.3主动波前采样技术
基本原理是通过一个偏心孔装置绕光轴做圆周运动,使靶光点在摄像机的成像平面上做相应的旋转,其位置信息可以由各个点形成的模糊圆形的半径推算出[11]。如图像是清晰的,则物距即为焦距;如果图像较模糊,则物距可通过公式计算模糊图像的尺寸得出(图12)。使用该技术的典型代表是3M ESPE公司的True Definition口内扫描仪(图13)。临床上几种常见的口内、口外扫描仪分别见表1~2[11,15,17,18]。
1.2 数据处理
受各种因素的影响,采用扫描仪获取的点云数据,不可避免的在真实数据点中混杂有不合理的噪声点(noise points),即与被扫描目标没有任何关系的点云数据,其结果将直接影响模型重建的精度,因此需运用算法对点云数据进行平滑、滤波等处理[4,19](图14)。导致噪声点产生的原因主要有:(1)扫描仪本身因素,如仪器的测量精度、扫描分辨率等。当扫描仪的工作温度发生明显变化时,测量精度会显著下降,需重新校准[14];(2)被测物体因素,如被测表面的材质、表面粗糙度、光吸收、反射率、纹理、颜色等。由于所有的光学扫描技术都是基于测量光源的反射光,临床上为了获得较好的镜面反射,部分扫描仪需先在组织表面喷覆遮光剂,但也引入了新的误差;(3)偶然因素,如组织表面黏附的血液或唾液的遮挡、扫描时外部光源过亮、口内扫描时产生气雾等;(4)数据拼接(align)因素,当拼接精度较低时,会产生大量的误差点[14](图15)。如口内扫描仪在扫描时相对于牙弓运动幅度过大,模型在口外扫描仪扫描过程中相对夹具发生位移等。
注:“全部”包括冠、3-5单位固定桥、嵌体、高嵌体、贴面、种植基台
通过三维扫描仪获取的点云数据量是极其庞大,如果直接对其进行处理,将降低模型重建的速度,使整个过程难以控制。实际上并不是所有的点云对模型重建都有用,故可通过算法在保证一定精度的前提下进行数据精简,即在曲率大的区域保留足够的点,在曲率小的区域保留较少的点[14](图16)。如使用弓高误差(chord error)参数来精简点云,但过高的弓高误差值将过滤掉太多细节,导致重建后的模型曲面精度较低,无法用于修复体CAD;而过低的值则保留太多细节,加大计算机运算量[4](图17)。
A:有噪声点云;B:无噪声点云
A:点云1;B:点云2;C:点云1与点云2拼接
A:原始点云;B:点云精简后
此外,受扫描方向、物体形状和激光、白光等光的不可穿透性的限制,不可能一次得到扫描物体所有视角点云(图18)。每次扫描都只能获取物体某一部分的点云,需通过移动、翻转扫描仪或模型从不同角度进行扫描,随后对多个视角下获得的点云进行拼接[4,19,20](图19)。
A:低弓高误差值;B:高弓高误差值
1.3 三维重建
将处理后的点云数据进行数学建模,重建出与真实物体表面相似的数字化模型。目前口腔CAD/CAM系统中最常用的是三角网格划分,即模型表面轮廓由很多三角形面片连接而成(图20),输出的文件为STL(stereolithography)格式[4,20]。此外还有其他曲面划分算法,如B样条、Hermite插值、NURBS等(图21),后者常需花费较多的处理时间,故用得不多[4]。
1.4 纹理渲染
三维重建后的数字化模型为单一颜色,为满足可视化需要,可对其赋以颜色。通常包括2种方法,一种是扫描仪扫描时同时拍摄该区域的彩色照片,随后通过算法映射到几何模型上(图22);另一种方法则是在扫描过程中,感光元件在取得点云的三维数据的同时获取该点的色彩信息,从而生成彩色的三维模型[21]。常见的彩色光学扫描仪多属于前者,其中3ShapeTrios扫描仪可在扫描过程中同时捕捉牙列的颜色,从而精确测量牙齿不同位置的颜色,集取模和比色于一体(图23)。
2 临床操作流程
根据扫描目标、扫描设备、生成模型的不同,数字化印模技术在临床中的应用可分为4种不同的操作流程[11,15](图24)。
2.1 口内扫描-数字化模型
口内扫描仪扫描患者的上下颌牙弓,当上下颌处于最大咬合接触位时,扫描牙弓的唇颊面来获取其虚拟咬合关系,上下颌牙弓分别与该关系记录对齐后即可生成相应的数字化模型(图25)。该方法主要用于制作冠桥、嵌体、贴面、种植基台等修复体。在固定义齿方面,用该方法制作的牙支持式单冠、短跨度固定桥在冠边缘和内部适合性均略优于传统印模者,制作的种植支持式单冠、固定桥的结果与传统印模法相似,制作的全牙弓固定桥的结果则相对较差,但满足临床要求[22];在可摘义齿方面,目前仅适用于制作肯氏Ⅲ类可摘局部义齿,对于其它类型的牙列缺损或牙列缺失患者,因需制取功能性印模,目前暂不适用[23]。
A:纹理映射前;B:纹理映射后
2.2 口内扫描-实体模型
使用上述方法获取口内相关软硬组织的数字化模型后,通过相应的CAD软件进行模型修整,如分割代型、添加底座、添加简易牙合架等(图26),随后经数控切削或3D打印制作出实体模型(图27),精度与传统石膏模型相似,但表面精细度稍差,尤其是咬合面窝沟处[24];用其制作的固定局部义齿在冠边缘适合性上比通过数字化模型直接设计制作者略差,但满足临床要求[22];制作的肯氏Ⅲ类可摘局部义齿的适合性良好[25]。
2.3 印模-口外扫描
临床常规制取上下颌印模及其咬合关系记录,随后使用口外扫描仪扫描该印模及咬合关系记录,即可生成相应的数字化模型(图28),还可通过数控切削或3D打印制作出相应的实体模型。目前鲜见使用该方法进行固定修复的文献报道,国外学者研究发现,由该方法获得的尖牙、前磨牙、磨牙单冠预备体数字化模型的精度误差均小于10μm,满足临床要求[26];在可摘义齿修复方面,目前多用于获取无牙颌的数字化模型,设计制作的全口义齿的临床适合性良好[27]。
2.4 石膏模型-口外扫描
将临床制取的印模常规翻制为石膏模型,随后使用口外扫描仪进行扫描并重建为数字化模型。这是目前口腔技工室制作修复体的常规CAD/CAM流程,适用于各种常见修复体的制作。该流程的虚拟颌位关系的获取主要包括以下2种方式:(1)直接将临床制取的咬合关系记录与上下颌石膏模型固定在一起放入口外扫描仪中扫描,这是目前最常用的方式,几乎所有的的口口外外光光学学扫扫描描仪仪都都支支持持这这种种方方式式;;(2)(2)临临床床使使用用面面弓弓转移上颌模型至实体牙合架上,再通过咬合关系记录装载下颌石膏模型,随后根据不同扫描仪的工作方式,可将整个实体牙合架放入扫描仪中(如Sirona公司的in Eos X5扫描仪,先临三维公司的AutoScan-DS300扫描仪)(图29),也可将实体牙合架上的上下颌模型固定并转移到配套的转移架(如Amann Girrbach公司的Ceramill map400扫描仪)(图30)或转移板上(如3Shape公司的D2000扫描仪)放入扫描仪,扫描获取其虚拟颌位关系,CAD软件自动将上下颌数字化模型装载到虚拟牙合架上的对应位置[28,29]。
摘要:该文从逆向工程的角度阐述数字印模技术的工作原理,将该过程分为三维扫描、数据处理、三维重建、纹理渲染4部分,简要分析该过程中误差的产生来源。总结了几种常见扫描仪的技术特点,并概述该技术的临床工作流程及其在口腔修复领域的应用。
数字图像修复技术的研究与应用 篇4
数字图像修复技术是从人们的心理以及视觉的角度出发,通过对被遮物体的边缘信息进行适当地分析处理并且按照一定的方向进行延伸扩展、边界连接,从而对图像被遮蔽部分进行正确合理地填充,从而实现视觉上的连续,能够达到与人工修复类似的效果。现代的图像修复的建模过程通常依赖于Helmholtz最佳猜测原理,这一基本原理明确指出:在已经确定传感数据的前提下,人们所感觉到的一切都是在现实世界状态的基础上而做出的一种最佳推测与猜测。因此,一个具有实用价值的图像修复模型必须能够从含有噪声的图像中加以分析并提取出纯净的图像信息,同时还能够从余下的图像信息中合理推测出最佳的丢失信息。
2 数字图像修复技术的一些方法
2.1 基于BSCB的图像修复模型
图像修复过程需要依赖于专业修复人员的主观感受,这就使得图像的修复过程是一个非常主观的过程,它并不具备一套修复的标准方法。BSCB修复模型采取的是偏微分方程,它与人的手工修复过程十分相似,通过将待修复区域边界部分的等照度线进行合理地延伸来实现修复的过程。在BSCB模型的算法中,是根据等照度线将待修复的区域进行区域划分的,使得各区域能够与其边缘外的颜色严格地保持一致。然而该修复算法对于细节纹理和图像的完整性方面有一定的损害。由于BSCB模型和一般的基于各向同性的修复过程并不相同,它考虑了等照度线,不会使边缘结构发生失真现象,属于一种各向异性扩散的修复过程,因此通过这一技术恢复的数字图像的修复效果能够更接近人的视觉感受。
2.2 基于整体整体变分的图像修复模型
整体变分(TV,total variation)图像处理模型的最初引入目的是为了解决图像的去噪问题。使用整体变分模型能够充分利用自然图像内在的正则性,例如图像边缘的平滑性等。整体变分模型的算法属于一种各向异性的算法,这种算法能够对数字图像进行一定程度的去噪处理。另外,图像去噪技术与图像修复技术之间有着很大的区别,虽然它们本质上都是属于图像恢复的相关技术,但是被噪声污染过的图像像素仍然包含了图像中的有用信息,而图像的待修复区域通常情况下是图像某块信息的完全丢失,并不能能从中获取到任何有价值的图像信息。所以,面向图像去噪的图像恢复技术并不能够直接推广或应用到图像修复技术中来,经常需要经过一定程度上的变形或者融入图像的先验知识和几何模型才能行得通。
2.3 基于曲率驱动扩散的图像修复模型
在基于整体变分的图像修复模型提出之后,TV修复模型由于受到一定的修复区域大小的限制而不能够满足图像的连通原理,进而提出了基于曲率驱动扩散(curvature-driven diffusion CDD)的图像修复模型。在CDD图像修复模型中通过曲率来调整各向异性扩散的系数,使得在利用CDD模型进行图像修复的工作中,不仅能够考虑到整体图像的长度规格,还能够充分考虑到图像中曲率信息的变化,从而能够实现对图像中细长线段的合理修复与填充。
2.4 基于分形纹理合成的图像修复算法。
图像的修复和合成是两个非常相似的概念,但是它们之间仍然存在着一些区别,其区别主要体现在以下两点:一是受损图像在修复之前并不存在完整的样图,而只能够从待修复区域的边界处取样来从而对未知的图像区域进行修复;二是图像合成的输出是一幅完整的图像,而图像修复则只需要对图像的受损区域进行合理填充即可。分形纹理修复算法的基本原理是先在待修复区域边界处进行取样,计算样图的分形维度,并且按照给定的搜索路径在图像的己知区域中搜索分形维度等于或者接近于样图分形维度的图像块,再将其复制到相应的待修复区域中。进行该算法的关键是进行相似度度量以及邻域搜索,纹理相似度的度量和搜索路径的关系十分密切,在数字图像修复的整个过程中有着十分重要的作用。
3 数字图像修复技术的应用
3.1 修复古代字画
由于古代字画保管环境的不当,再加上历史人为原因等多种因素的影响,使得一些具有极高收藏价值和极高艺术价值的历史艺术作品经常会出现不同程度的损坏现象。因此,对这类文物进行必要的图像修复工作就具有十分重要的现实意义。利用现代的数字图像修复技术,只需要确定文物中需要修复的区域,使用计算机就可以方便、快捷地按照确定的算法进行图像修复工作,并且修复效果十分理想,能够避免传统手工修复工作所需要的大量时间问题,减少修复人员的修复工作。
3.2 修复照片、文字等丢失的信息
在实际的生活中,照片经常会被不小心地折叠或者被不同程度的划伤,或者照片、胶片等受到多种原因的污染,这时就需要利用数字图像修复技术。对于文字、遮挡物或者是特定图标的去除也可以利用数字图像修复技术进行修复。比如某些电影画面中加入的字幕,利用数字图像修复技术可以轻而易举地去除这些字幕,另外,由于一些实际的原因需要隐藏图像中某个特定目标时,就可以利用图像修复技术达到预期的修复效果。
3.3 对失真图像的修复以及高分辨率研究
在图像传输过程中,由于网络故障或者其他的种种原因导致传输过来的图像具有不同程度的残缺部分,利用数字图像修复技术可以完美地处理这些问题。另外,一般情况下当将图像从低分辨率放大到高分辨率时就会出现不同程度的马赛克现象,图像修复技术能够解决这一过程所产生的问题,并在不影响图片质量的前提下提高图像的分辨率。
随着电子智能产品的逐渐普及与应用,它们的广泛应用使得数字图像的数量急剧增加,人们迫切需要一种对数字图像修复以达到对图像进行改进的新型技术。因此,数字图像修复技术的应用领域也将会有更大的突破,它必定会对人们今后的生活产生更加积极的影响。
摘要:图像修复技术是图像复原领域中的一项非常重要的修复技术,它是通过对图像的现有信息进行分析处理从而推测出其所丢失的图像信息数据。伴随着计算机技术的迅速发展,数字图像修复技术又有了新的发展方向以及更加广泛的应用领域,它是图像处理技术中的一个重要组成部分,有着极其重要的研究与应用价值。
关键词:图像修复,图像处理,数字图像
参考文献
[1]孙玉刚.数字图像修复技术研究[D].南京:南京航空航天大学,2011.
数字化修复 篇5
一、房地产历史档案修复整理流程
成都市房产信息档案馆现开展的房地产历史档案修复整理工作主要按下述流程进行实施。
(1)档案的清点、交接、出库。
(2)档案的除尘:要求拆除文件上原有的钉书钉、回形针,用干净的羊毛软刷或排笔刷去档案表面的灰尘。
(3)档案的消毒杀虫:要求采用纯物理的消毒杀虫方法,不产生二次污染,不污染环境,不伤害人体、不损伤档案。
(4)档案的脱酸:要求采用纯天然产物进行脱酸,脱酸过程中不能产生化学成分的残留,不污染环境,不危害人体健康,对纸张、字迹无影响。
(5)档案的修补、托裱:存在局部残缺,有孔洞的档案,应采取补缺、接边、挖补等技术方法进行修补;对档案整体强度较差,出现霉烂、脆化、支离破碎现象的档案,必须进行整体托裱。
(6)档案的排序、编目:按照房地产历史档案整理排序规范对卷内文件资料进行清理、实体排序、编制页码。
(7)制作档案目录、卷皮和备考表。
(8)档案的整理装订。
二、房地产历史档案的数字化
(一)开展房地产历史档案数字化工作的重要性和必要性
房地产历史档案因其稀缺性和珍贵性,应该进行数字化工作。开展数字化工作以后,一方面可确保数字信息的永久保存,即使在实物档案因各种意外因素不能继续保存时,也能通过其数字信息还原档案原貌;另一方面通过数字化工作,可使档案信息资源更加准确、方便、快捷地进行检索,满足社会各方面及档案编研工作对档案利用的需求。
(二)房地产历史档案数字化工作内容及要求
房地产历史档案数字化工作应包括对档案信息进行案卷级及文件级的著录和对纸质档案进行数字化扫描。
1. 著录
案卷级著录内容应包括档案类型、房屋地址、案卷号、参考案件号、房屋面积等,文件级著录内容应包括权利人、义务人、相关责任人、文件形成时间、文件类型、房屋详细地址、房地产登记类型、房屋用途等。
2. 数字化扫描
(1)扫描仪:房地产历史档案扫描应采用冷光彩色平板扫描仪进行扫描,不得采用滚筒或其他高速扫描仪,以免对档案资料进行破坏。
(2)存储格式:存储格式既可采用TIFF格式,可采用JEPG格式保存。
(3)分辨率:分辨率可参考以下选择——文字和图纸不低于300dpi、照片不低于600dpi,也可根据卷内文件情况作适当调整,保证扫描后的影像清晰。
(4)图像:所有档案资料建议均采用彩色方式进行扫描;A3幅面以内的资料形成的图像文件大小原则上不低于3M;所有A0幅面以内(包括A0幅面)的档案资料要求按原幅面一次扫描完成,不允许分幅扫描再拼接图像。
(5)拼接:对于超大幅面(A0幅面以上档案文件),可选用大幅面图像扫描仪,也可以采用小幅面扫描后对图像进行拼接,但拼接后应与原件一致,以确保图像阅览的完整性。
三、成都市房地产历史档案修复、整理与数字化工作经验
成都市房产信息档案馆自2013年起开始实施房地产历史档案修复、整理及数字化工作以来,截至2016年6月底,已成功完成了近69万页档案(折合A4幅面95万页)的修复及数字化扫描工作、5.5万卷档案的整理装订工作和35万条档案数据的著录工作。在此项工作的调研、评审、立项、启动及具体实施过程中,为确保工作科学、顺利地开展,成都市房产信息档案馆主要把握了以下几方面工作重点。
(一)制定规范、专家评审
为开展好房地产历史档案修复和数字化工作,档案馆成立了专项工作小组,由馆长任组长,分管领导任副组长,档案保管科负责具体实施。之后,档案馆派人先后前往成都市档案馆、四川西部文献修复中心、杭州市房产档案馆、广州市房地产档案馆等全面考察调研历史档案修复及数字化工作。针对调研考察结果,结合馆内实际和国家行业标准,制定了《成都市房产信息档案馆历史档案整理及数字化规范》(下称《规范》),该《规范》对历史档案整理、修复、数字化、珍贵档案的甄别和保护、工作流程、成果验收、涉密管理等方面内容进行了详细的要求。随后,档案馆邀请了成都市档案局、成都市文化局、成都市图书馆、成都市博物馆和四川大学的多位领导和专家,对《规范》内容进行评审,确保《规范》内容详实、标准合理、流程可行。《规范》的确定,为档案馆具体开展历史档案的修复、整理及数字化工作奠定了坚实的基础。
(二)实施外包、专业实施
因房地产历史档案的修复、整理及数字化工作对专业化要求很高,特别是档案的修复,需要经过专业培训的技术人员具体实施。本着对历史负责的态度,成都市房产信息档案馆选择通过招标、以服务外包的形式,具体推进此工作。为确保每年历史档案修复、整理及数字化工作任务的顺利完成,外包公司配置了超过20人的专业团队常驻档案馆,他们提供专业化的技术及服务,档案馆负责根据《规范》要求进行成果审核及验收,日常工作推进顺利。此工作模式解决了档案馆自行开展此工作不专业、进展慢的问题,使档案馆工作人员能从繁复的整理、数字化日常工作中解放出来,着力参与档案的质检和日常管理工作。
(三)细致管理、明确责权
为加强对房地产历史档案修复、整理及数字化日常工作的细致化管理,档案馆主要做了以下几方面工作:一是每卷档案建立《修复日志》,《修复日志》主要通过对出、入库档案的清理和拍照,记录历史档案在档案馆和外包公司交接前后以及档案进行修复前后的实际情况,以确保内容的一致性和安全性,同时记录本卷档案的修复方案和修复后档案的质检情况;二是加强对外包公司的日常管理,档案馆制定了《档案数字化外包安全管理规范》,对外包场所、人员、数字加工设备、网络环境等方面的安全管理进行了详细的规定,并严格管理实施,同时档案馆还与外包公司签订《保密协议》,确保档案在外包服务工作中和完成服务后的档案及数据安全;三是加强成果验收,档案馆对外包公司完成修复、整理及数字化的档案实行100%的质检,之后再进行5%的抽检,如发现不合格档案或数据,由外包公司及时重新加工,如发现对档案造成损坏的,按《规范》内容进行扣罚。通过这些工作的开展,对房地产历史档案修复、整理及数字化工作进行细致管理,尽量做到万无一失。
(四)加强历史档案信息管理
成都市房产信息档案馆历来重视档案信息系统的建设与应用,2012年上线并正式运行的房产档案管理系统中,专门设计了“历史档案管理”版块,主要功能包括历史档案的数字化著录、扫描影像的存储和查询、著录及扫描影像的质检等。通过历史档案管理版块中的查询功能,档案利用人可以根据多条件对历史档案进行检索,比如通过档案生成的时间和档案的类型,直接查询乾隆年间的红契有哪些,为档案的多元化利用提供了便利。另外,鉴于历史档案管理的特殊性,历史档案的系统管理模块使用单独的服务器进行数据的存储和记录,只有指定权限的工作人员才能对历史档案进行管理和利用,也满足了历史档案对涉密管理方面的要求。
数字化修复 篇6
彩色胶片最容易发生退化现象。电影胶片不仅含有染料,还有一些其他的成分(如增感剂,彩色成色剂,稳定剂等),它们都会随着时间的推移而发生变化。已经证实,正是由于这些成分的化学性质上的不稳定,最终导致整部影片都会褪色。
一般情况下,电影的修复过程可以由2个方面进行:光化学和数字修复过程。如果褪色现象等不能由光化学过程来单独去除,则就需用数字作进一步的修复处理。
数字电影修复的程序是:首先是对电影底片或翻正作扫描使其成为数字格式,用数字来处理退化问题, 在图像的频率分析和运动分析等基础上进行去污除尘,去除划痕线,色彩校正等。然后,将数字电影打包(DCP)复制到移动硬盘并传送到影院放映。
数字电影修复是彩色图像处理中一个比较新的研究领域。在色彩校正处理中,可以考虑以下几个空间色彩算法(SCA): Retinex 、ACE和STRESS1,其中STRESS是较新的算法,而Retinex和ACE的算法存在计算时间长的问题。色彩校正的一个重要环节是在所有的信道中以均衡的方式增强色彩信息,并且必须在使用色彩增强模式处理退化图像前实施。这种增强功能应能够消除老胶片电影中大部分的严重偏色。另一个重要环节是,经色彩图像增强模式处理后,图像信道的平均色度、饱和度和亮度值的保存。这种保存从人眼视觉系统(HVS)的角度来讲,保持自然观是非常重要的。因此必须施加一些后处理机制以保存这些图像的基本属性。老的退化影片往往包含划痕,这个问题在色彩校正中通常独立处理。在SCA[2]的情况下,这两个问题是不能完全脱钩的,因为划痕线会同时改变局部色彩。计算时间应是电影修复的一大需要关注的方面,修复方法必须具有计算效率。此外,开发一个完全不需用户干预的系统,也是电影修复领域的一个课题。
为了实现色彩还原全过程的自动化,我们提出了以下的想法:首先,提出了一种预处理技术,以均衡的方式在所有信道中加强色彩信息。该预处理技术的输出图像由STRESS算法处理,以在一定的程度上减少计算时间。由于STRESS算法使用非常少的采样点,计算时间预计将显著减少。其次,提出并实施了后处理机制,以保持预处理后图像的亮度和饱和度,并由STRESS模型作进一步处理。
此外,还需测试去除退化电影的划痕线的现有的算法。这里选择其中一个算法,并在预处理步骤之前应用于退化电影,这样做虽然能观察到饱和度提高了但划痕线也更明显了,图像质量也随之下降了。然而对去除划痕及对于色彩还原的效果进行分析,令人惊讶的是:当在相同的材料上测试所选的算法时,发现有无划痕缺陷对色彩校正算法的性能只有非常微弱的影响。
2 基本技术
2.1 数字电影修复
由Land 和McCann所开发的 Retinex是最早运用色彩校正的模式之一。许多应用和分析都是在这个模型的基础上开展的。Retinex(RSR)是近期的发展[3,4,5],该模式通过变换的路径(即整个图像上二维点的分布),调查不同的空间抽样的影响。 Rizzi等人开发的自动色彩均衡(ACE)是另一个保持数字图像局部和全局影响的技术,其最大限度地提高图像的动态效果。 ACE具有潜在的模拟人类视觉系统(HVS)的特点,如色彩和亮度恒定,对比度控制等。
虽然这些算法提供了不错的结果,但计算时间长一直是这类算法的薄弱点。另一个图像增强应用领域的最新发展是由Kolas等人所开发的STRESS算法。这个算法的特点是使用的采样点量很少。STRESS在模仿局部对比度拉伸的不同属性,自动色彩校正,高动态范围的图像呈现等领域显示了相当的优势,已成功应用于空间域映射和彩色到灰度的转换。
Chambah等提出了一种两阶段的色彩校正算法6。首先将退化图像在饱和水平上非均匀地增强,然后应用Retinex色彩平衡方法。其主要缺点是需大量的计算时间。它是一个基于LUT的ACE算法,但得到的图像不如原始ACE可靠。
Rizzi等人提出了另一种相对较新的数字电影修复方法7。他们把电影划分成不同的镜头,然后实施ACE色彩校正算法。其结果在一定的水平上似乎令人满意,但它仍需较长的计算时间。Khriji等人在老电影修复中使用功能过滤器的概念,提出了一个空间合理的内插方案重建丢失的数据。他们把重点放在块效应和锯齿退化上。虽然随机缺陷去除令人满意,但固定缺陷去除方法计算过于复杂。
最近,Maddalena等提出了基于融合方法的数字电影修复8。他们提出了一个新的数字划痕修复算法,其结果是准确度高于现有的算法,且更适应于高性能计算环境。他们的意图是对问题实施多种相对完善的算法,并结合适当的图像融合技术,目的是尽量利用算法的长处,同时限制它们的不足之处。
2.2 STRESS算法
使用STRESS模型以提高图像质量。选择STRESS模型的理由是:STRESS相对快速和有效,它保留了每个信道中色彩直方图的基本形状。就计算时间而言,STRESS优于一些现有的算法,如ACE。因此选择STRESS作为提高图像质量模式主要是为了计算的速度和良好的图像质量。
STRESS是一种图像质量增强技术,它仅需少量的采样点,使用2个包络线来描述局部的视觉背景。STRESS算法的核心部分是对每个像素计算在每个色彩信道中较亮和较暗的局部参考点。这是通过计算2个包络函数,即包含图像信号的最大和最小的包络线来实现。包络线缓慢变化使得图像信号总是在2条包络线之间或位于其中之一[1]。
对于每个像素P0,以迭代的方式用Ni迭代计算最大和最小包络Emax和Emin。在每次迭代中,以概率为1/d 随机取样Ns个像素undefined,这里d是图像中从采样像素到疑问像素的欧几里德距离。样本的范围r,中心像素相对值undefined和Emin由下面的方程计算。
undefined
一个像素的STRESS最终值Pstress,通过从方程(4)中的Emax和Emin代入方程(5)计算。公式(6)算出最终Pstress 值。
undefined
此技术应用于彩色图像所有的三个信道以得到所需的图像色彩的增强,也用于修复退化电影的色彩信息。从公式(3)中,可以得到一个时间域STRESS实施的总体思路。公式(3)建议使用运行平均值undefined和undefined,这样局部参考黑白色将不仅依赖于影片的当前帧,还依赖于先前帧。由于undefined和undefined是迭代方法计算的,它为连续帧序列进行迭代提供一个更好更快的动态影像解决方案。其迭代方法方程是:
undefined
这里,undefined和undefined是undefined和undefined上一次迭代所得的值。每帧参数α的选择和迭代的次数将影响局部参考黑白色如何快速地在图像中变化。本文将在后面章节以不同的方式实施时间域处理。
3处理方法
3.1 预处理:色彩平衡
我们已经介绍了作为预处理步骤中的色彩平衡处理。彩色平衡过程涉及如何在只有较少色彩信息的信道中提高色彩信息量。在退化图像的情况下,几乎所有的色彩信息都驻留在一个单一的信道中,其他信道只有很少的色彩信息。由于这种色彩信息在3个信道中的不平衡分布,退化图像通常会偏色。不过经过下面一些技术处理后在一定程度上可消除这种偏色。
为了提高色彩信息,首先可将图像的色彩空间从RGB转换到CIELAB。这里选择CIELAB空间是因为它更均匀,从而可以独立和有效地控制亮度和色度参数。执行转换之后,从原始的退化RGB图像得到了相应的L*a* b*值。
为了增强饱和度,可使用PCA改变其基础。具体由以下步骤来提升色彩信息:设Id为独立的色彩信道轴。方程(9)计算参数m,d1和d2为本征值。
undefined
方程(10)计算第1个独立轴,方程(11)计算第2个独立轴:
I′d2=Id2×mx (10)
I′d2=Id2×mx (11)
为了提高第2个独立轴的值,把第一个独立轴乘2x倍,第2个独立轴乘mx倍,(mx〉2x,这里m≥2.5),x的最高估计是0.65。于是色彩信息以一种平衡的方式沿2个轴增强。在CIELAB空间增强色彩信息后,色彩增强的图像被再次带回RGB空间作进一步的处理。
x的值从试验和误差基准获得。x中定义了5种不同的饱和度参数,X={0.35,0.45,0.50,0.60,0.65},可以从中选择一个最满意的参数值,这将在第4章讨论。
可以观察到色彩增强后的图像的强度直方图和色彩直方图比退化图像覆盖有更大的动态范围。综合上述生成的图像,可以说预处理方法有效地平衡图像所有信道中的色彩信息。由此产生的图像与退化图像相比,偏色显著减少,不同的物体的色彩更为突出。
3.2 后处理:空间域
原始的退化图像含有严重的偏色,称之为褪色影响。预处理技术所产生的图像与原来的退化图像相比偏色显著减少。接下来的任务是还原所得到的图像色彩信息,为了修复色彩信息,应用STRESS算法并将后处理技术用于STRESS算法所产生的图像。其目的主要是为了保存STRESS算法的最终输出图像的亮度和饱和度水平。
如同任何其他图像增强模式,当应用STRESS于图像时,其输出并不保存图像的某些基本属性,如平均色度通道值,平均亮度或平均饱和度等[9]。因此,从STRESS算法产生的图像与预处理图像相比较其图像似乎过于饱和低亮度[4]。故需应用后处理技术来保存预处理图像的平均亮度和平均饱和度,并将它们传递到实施STRESS后的图像。
在第1阶段中,图像的平均亮度和平均饱和度属性被提取和存储,随后作STRESS算法处理。在第2阶段中,所得到的图像用第1阶段存储的图像属性作进一步处理。由此得到的图像是经色彩校正的最终图像,因此需要保存最终输出图像的平均亮度和饱和度,并把RGB色彩值转换到色调-饱和度-亮度(HSL),提取并存储饱和度和亮度的值,在此过程中不考虑色度。随后再将其转换回到RGB并再次实施STRESS算法,还需将所得图像的RGB值转换成HSL值并应用后处理技术。最后将图像转换回RGB空间。
3.3时间域计算和后处理
至目前为止,所有的工作一直是在空间域实施STRESS算法和后处理。现在要对每一帧实施上述的方法。但是在电影中帧的数量是很大的,每次剪接都含有相当数目的帧。因此,校正整部电影的色彩,每一个帧都应该加以考虑。这里提出时间域方法,该方法适用于每个剪接后的帧。
与剪接的第一帧比较,连续帧的计算时间可减少80%,一个剪接可能包含相当数目的帧,但其背景中的对象变化不大。对于剪接后的帧,先应用预处理方法增强色彩信息,然后再运用时间域STRESS和后处理方法。在公式(3)中,最终的STRESS值Pstress是通过公式(6)计算而得到的。而对时域法,使用公式(5),而不是公式(6)来计算Pstress值。现在,计算每个信道中每个像素的最小和最大包络线。按照以下方法可节约很多计算时间。
对于剪接的第一帧,应用前面的方法计算在每个信道中的每个像素的最小和最大包络。我们把这些包络存储在全局变量中以便在下一帧时使用。对于下一帧,首先计算出它自己在信道中每个像素的最小和最大包络。然后将第一帧的最小和最大包络线与当前帧的最小和最大包络线相关联。下面的一组方程用于计算包络线和像素值Pstress:
Gundefined=αEundefined+(1-α)Gundefined (12)
Gundefined=αEundefined+(1-α)Gundefined (13)
undefined
这里,Gundefined和Gundefined是第n个帧的最终包络线,α是权重因子。
从方程(12)和方程(13)可以看到,计算当前帧的最终包络线,其最初的包络线与权重因子α相乘,然后它以乘法系数(1-α)与前1帧的包络线Gundefined和Gundefined相加。计算每个信道中每个像素的Pstress值后,将第2帧的包络线存储起来以便第3帧使用,以此类推。
以这个方法,节省了大量的计算时间。因为该方法仅对图像的第1帧有较高的迭代次数以获得无噪音图像。对于下一帧,则迭代很少。一般来说,迭代少,所得到的图像噪音就多。但是因为后面的帧与前面第1帧包络线相关联,于是可得到与第1帧的图像相似但效果更好的图像。
4 测试
4.1 预处理测试
为了选取方程(10)和(11)中饱和度参数x的最佳值,需做一个实验。在这个实验中,从5幅饱和度不同的相同图像中选择最好的一幅,再从21幅图像里得到了210个观察结果。用统计分析方法对实验结果进行分析,发现所有5幅图像都可以用相同的概率选择其中任何一幅。
取显著性水平为0.05,即5%。从实验中得到了21个P值。使用二项分布双侧计算及公式P=1-CDF(x,n,p)计算P值,其中CDF是二项分布的累积分布函数。如果同时对所有的图像计算饱和度为3的P值,可得到P =0,它小于显著性水平0.05。这里,x= 99,n=210和p= 0.2,因此可以拒绝零假设。
使用预处理方法提高信道的色彩信息以减少偏色。该方法的效果也可以从强度直方图和散点图测量。
4.2 后处理测试
使用STRESS和后处理算法修复色彩信息,与ACE的算法比较, STRESS和后处理算法可更好地提高图像质量。
除了ACE色彩直方图中红色信道隔断外,还发现强度直方图上部区域中强度的下降了(由红色矩形标记)。其结果是最终图像在某些区域中图像变暗。此外,后处理和STRESS算法在计算时间上也优于ACE。一个尺寸为720×576的图像,后处理和STRESS算法需要31秒,而ACE需要15509秒。在有局部线性查找表(LLL)的情况下,ACE仍需要51秒。
综合所有因素可以得出,与ACE和现有的其它算法比较,STRESS算法在提高质量、计算时间和实验的统计结果各方面都相当优异。
5 总结
本文中提出了一个自动色彩校正技术以实现褪色修复过程的自动化,并且试图解决色彩还原过程中存在的一些基本问题。首先,提出了一种预处理方法,它有助于将老胶片电影的严重偏色减少到非常低的水平。而后又提供了一个非常有效的后处理技术,以保存预处理图像的平均亮度及饱和程度。还分析了老胶片电影中去除划痕线的效果。
此外,本文还提出了一个时间域的后处理方法,在处理大量电影帧时减少计算时间,例如能够显著减少(80%以上)电影连续帧的处理时间,除了做预处理阶段实验外,还进行了其他实验来比较所用的方法与ACE方法所得图像的质量。实验结果是相当令人满意的。另外从HVS的角度来看其产生的影像效果从视觉上也是令人满意的。
参考文献
[1]Oyvind Kolas,I.F.and Rizzi,A.,Stress:A new hu-man visual system inspired image processing method,(in-vited paper)(2010).
[2]Rizzi,A.and McCann,J.,On the behavior of spatialmodels of color,In Proc.of Electronic Imaging,S.Jo-se,California,USA(invited paper)(2007).
[3]Huck, S. and Fales, C., Visual communication with retinex coding[C], Applied Optics (2000),39(11), 1711-1730.
[4]D.J.Jobson,Z.R.and Woodel,G.,A multi-scale ret-inex for bridging the gap between color images and thehuman observation of scenes[C],IEEE Transaction onImage Processing:Special Issue on Color Processing(1997),6(7),965-985.
[5]E. Provenzi, M. Fierro, A. R. L. D. C. D. G. and Marini, D., Random spray retinex: a new retinex imple-mentation to investigate the local properties of the model[C], IEEE Transactions on Image Processing (2007),16(1), 162-172.
[6]Majed Chambah,B.B.and Courtellemont,P.,Recent progress in automatic digital restoration of color motion pictures[C],SPIE Electronic Imaging,San Jose,Cali-fornia,USA(2002),4663:98-108.
[7]Rizzi, A. Gatta, C. S. C. C. and G. Schettini, R., Unsupervised color _lm restoration using adaptive color equalization[J], LECTURE NOTES IN COMPUTER SCIENCE , (2006),3736:1-20.
[8]Lucia Maddalena, A. P. and Laccetti, G., A fusion-based approach to digital movie restoration[C], Pattern Recognition (2009),42(7), 1485-1495.
数字化修复 篇7
中国自古便有“纸寿千年,绢寿八百”的说法。作为有机质的档案文物相较于近现代档案,经历了无数岁月洗礼而变得更加脆弱。人们无法阻止这类文物的老化消亡,而仅能通过技术手段尽可能延缓这一过程。因此对这类文物最有效的保护方式之一就是在其尚完好时进行高精度的仿真复制,复制出的副本可与原件一起流传后世。这种方法古已有之,最著名的例子就是北宋皇帝徽宗主持的宋代画院对唐代绘画进行了大量的临摹复制。有赖于此我们今日依然有机会一睹唐人绘画的风采。
随着数字技术的发展,我们今日有更好的技术手段将珍贵的档案文物进行复制,使其不但能够流传后世,同时也让更多人有机会去利用这些档案,发挥其更大的价值。
一、数字复制技术在档案文物复制中的应用与不足
上文所说的数字复制技术,具体来说主要是指高精度的数字图像采集技术、图像在计算机中的处理技术以及大幅面数字图像输出技术。这三方面的技术分别对应着档案文物复制中的输入、处理、输出三个主要步骤。首先针对档案文物的图像采集主要使用平台式的大幅面扫描仪。这种设备具有光学分辨率高,扫描光源稳定,非接触式扫描等特点。例如故宫博物院文物复制部门所使用的CRUSE185ST-1100REPRO-DéCORPROFESSIONAL固定式文物扫描系统,光学分辨率可达14000X26640像素,设备的扫描光源以双向45度角照射文物从而确保文物表面不出现影响复制效果的阴影。扫描全过程扫描部件不与文物产生直接接触从而确保扫描过程中档案文物的安全。扫描获得的数字图像会转移到图形工作站中进行包括图像修正、拼接、色彩调整等一系列处理。最后,处理过的数字文件将使用大幅面喷绘机进行输出。根据档案文物材质的不同,可以将图像输出到各类型纸张或是丝绢上从而完成复制件的复制输出。输出过程需要使用到EFI、GMG或colorgate等色彩管理软件,其目的是使复制件的输出处于严格的色彩管理当中,以确保复制件的色彩视觉感受与文物原件保持高度一致。以这种方法制作的复制品具有精度高、色彩还原准确、适用范围广泛、复制速度快等诸多优点。起初这种复制方式主要用于各类古代绘画、书法、碑帖的复制。如在边寿民《苇间主人泼墨图卷》、唐代《阿斯塔纳出土伏羲女娲像》、《四明本西岳华山庙碑拓片》、《张宗苍云岚剑阁图》多件文物复制中,均取得了令人满意的成果。
随后进一步将其应用到更加典型的档案文物的复制中。如古籍《帝鉴图说》《大清宣统元年时宪书》《禹贡》《良言》,清宫旧藏戏本《金山寺》《翠屏山》《芝眉介寿》《贾家楼》,溥仪《摹写孝经》《英文单话》等。与传统的书画文物不同,上述的档案文物大多以中式线装书籍形式为主。因其装订成册无法在扫描平台上展平,为避免对珍贵古籍产生伤害,扫描时仅能使用磁铁压条进行固定,对于书脊处产生的变形需在数字文件处理时进行相应的调整处理。对于内页对折装订的古籍需要使用柔软的宣纸插入两页间的缝隙,以免因纸张过薄背面的字迹透到前面影响扫描效果。
很多古籍使用竹纸作为内页材料,还有一些档案文物使用桑皮、楮皮纸甚至清代晚期还有使用机加工纸的。为确保复制件与原件在质感上尽可能接近,需要选择相似质地的材料进行复制。无论选择何种材料,在复制之前都需要在相应的材料表面进行涂层涂布处理,以确保该材料在喷绘输出时拥有广阔的色域和稳定的色彩还原能力。
凭借着数字复制技术的诸多优势,在档案文物的复制中取得了一定的成果。但随着复制档案文物的增加,数字复制技术本身的一些局限也渐渐暴露出来。一方面受技术条件限制数字图像技术在表现蓝、绿色相时有较大不足。这种问题无论是在输入还是输出阶段均表现明显,以至于造成特定色域色彩表现的先天不足。另一方面,目前主流的大幅面喷绘设备大多使用9色或11色墨盒进行输出,通过不同色彩微小墨滴的组合完成丰富的色彩输出。正是受限于这一工作原理,现有喷绘设备对于金、银等非色彩或一些特殊质感的输出往往无能为力。在某些档案文物的复制中金、银和质感的再现又是格外重要的,解决这些问题既现实又迫切。传统的人工临摹为解决上述问题提供了可能性。
二、人工临摹与数字技术相结合的优势
人工临摹是自古流传下来的书画复制方法。南齐谢赫在《古画品录》中将“传移模写”列为绘画六法之一。这里所说的“传移模写”其实就是将书画进行临摹复制的手法。这也是如今传统中国绘画学习的重要手段之一。自北宋中后期开始历史上出现过多次书画作伪高潮,人工临摹正是作伪的主要手段,即便是如今很多历史上的伪作依旧让今人真假难辨。这恰好从一个侧面证明人工临摹这一书画复制手段的高超与复制效果的逼真。新中国建立以后,故宫博物院开始聘请全国各地的书画临摹高手建立起书画临摹复制队伍,临摹的作品包括张择端《清明上河图》、张萱《虢国夫人游春图》、赵佶《听琴图》、郭熙《窠石平远图》、崔白《寒雀图》、顾闳中《韩熙载夜宴图》、胡環《卓歇图》、西汉马王堆出土帛画等一大批珍贵的文物。如今故宫的古书画临摹复制技艺已经作为国家级非物质文化遗产被保护和传承下来。这一技艺的保护与传承恰好为弥补数字复制技术的不足提供了良好的条件。
这二者相结合复制档案类文物最典型的案例,就要算故宫博物院为山东即墨博物馆复制的《宋代金银书妙法莲华经》了。这件文物是北宋庆历四年(1044)书写的,全部经书共七卷,全部以金银磨粉加胶作为颜料,书写于藏蓝色的磁青纸上。因其制作精良保存完好,作为佛教在北宋传播的重要文献文物,在1987年被以启功先生为首的一众专家鉴定为国家一级文物[2]44。
使用数字复制技术,经过图像采集、数字图像处理、复制材料制作与特征化以及复制件喷绘输出等几个工序,便可以获得与文物原件极为相似的经卷复制品。包括文物原件上的明代补纸、水渍、虫蛀、折痕、霉斑等诸多历史信息也一并逼真地再现到复制件上。唯有以金银写就的文字,因数字输出设备的限制,无法显现出原本的金属质感,只能代之以青白与棕黄两色。这使得复制件完全无法达到原件既庄严肃穆又华丽耀眼的视觉效果。
为弥补这一缺憾,故宫的复制人员将人工临摹的技法用于已经喷绘输出的复制件上。具体手法是使用与文物原件相同的金银材料研磨成粉后再加胶制作成泥金、泥银两种颜料,然后在复制件上进行描摹。传统的人工临摹技法在复制文字时主要使用的是双钩填色的方法。就是以墨线将需要复制的文字轮廓勾描到复制件上然后再填上墨。最广为人知的冯承素摹《兰亭序》使用的就是这种方法。但这种方法摹制出的文字容易显得僵硬,失去了原本自然流畅的书写气息。在这个案例中因数字复制的经文与原件在文字结体上并无分别,摹画师便可以直接以复制件为底稿直接摹制文字,就类似于书法练习中的描红一样。这样一来不但省略了繁复的勾描过稿环节,而且摹出的文字可以更加准确,达到与原件的高度一致。通过以上人工临摹与数字技术相结合的方法最终成功地复制出了金银书妙法莲华经这一珍贵文物,同时也为同类型档案文物的复制积累了宝贵的经验。
人工临摹与数字技术相结合除了以高仿真的方式复制档案类文物之外,对于很多档案类文物的修复也可以大有助益。档案类文物因年代久远普遍存在着破损的情况,如不及时进行修复保护,文物信息会损失得越来越多,特别是有档案价值的文物,如果放任不管最终会因关键信息的缺损失去原本的档案价值。下面以《乾隆御笔符望阁口号贴落》(以下简称“乾隆御笔贴落”)的修复为例证明以上的观点。
“贴落”一词最早出现于乾隆朝内务府档案当中,取“贴上落下”之意;后转为名词专指一种用于宫廷建筑装饰的简易装裱样式。“贴落”包含内容十分丰富,既有各种题材的绘画又有各类题咏诗词。这件“乾隆御笔贴落”原文为“五载军机日夜图,果诚偃武奏功肤,廿年高阁来娱老,此望未知符也无。”落款“口号一首。丙申清和下瀚御笔”[3]93。另盖有“所宝唯贤”、“乾隆御笔”朱白文印各一枚。这段文字纪录了乾隆皇帝第二次平定大小金川时的所思所感。是一件十分难得的档案类文物。可惜经过两百多年的岁月沧桑,贴落右上角已缺,第一个“五”字也残缺不全。如果不尽快进行修复,待文物继续残损便无法完整辨识全文了。
但这件文物的修复障碍在于修复材料的缺失,这件贴落书写于一种宫廷御制的青地撒金蜡笺纸上。这种蜡笺纸质地莹润,触感光滑,迎光会显现一种蜡制的光泽。因只是供宫廷御用产量很小,制作方法并没有流传下来。为解决这个问题复制人员尝试使用数字复制技术,先将“贴落”原件进行数字化扫描。然后使用图像处理软件从“贴落”上截取没有文字的部分制作出补纸。接下来通过精心的调整将制作好的补纸喷绘输出到宣纸上,并确保补纸颜色与“贴落”原件相一致。最后使用数字复制的补纸作为修复材料补全文物缺失的部分。待修补完成后,使用川蜡将补纸上蜡砑光;用泥金颜料模拟出洒金的质感。经过以上的工序,数字复制的补纸已经与原本的蜡笺纸极为接近难以区分了。
有些观点认为修补后的区域应保持原样,这样才算是“修旧如旧”。试想如果修复后的区域任其空白不但会影响作品的艺术效果,更重要的是影响文物信息的完整性。这些信息如果任其缺失,最终的结果必然是信息的不可识别。基于中国传统的书画修复理念,在缺损内容不存争议的情况下,需要对文字的缺损部分进行“接笔”。这件文物中“五”稍损但并不影响辨识,因此并不存在识别上的争议。参考乾隆书法的特点,按照相应的风格由摹画师用墨将文字补全,最终完成了整件文物的修复工作并取得了很好的修复效果。
伴随着计算机图形图像技术和印刷输出技术的发展,数字复制技术已经成为文物复制行业发展的新趋势。凭借着其所具有的诸多优势越来越多的博物馆和档案馆开始使用这一技术复制保护馆藏档案文物。但面对种类繁多材料各异的档案文物,单一的数字复制技术并不能解决所有的问题。在应用新技术的同时也应当充分挖掘如人工临摹这类传统工艺技术的潜力,使现代技术与传统工艺相互结合相互补充,进而更好地完成各类档案文物的保护与复制工作。
摘要:档案类文物与普通档案相比更加脆弱,复制与修复是对其进行保护的重要手段。作为故宫博物院院级科研课题(课题号KT-200810),本文以故宫各类档案文物的保护与修复为例,论述了数字复制技术的特点,以及使用数字复制与人工临摹相结合复制和保护档案文物的实践。
关键词:档案文物,数字复制技术,人工临摹,故宫博物院
参考文献
[1]王赫.数字技术助力古籍复制保护[J].丝网印刷,2014(9).
[2]王赫.宋金银书《妙法莲华经》复制工艺探索[J].文物春秋,2012(3).
数字化修复 篇8
1.1 图书数字处理的基本要求
“数字图书馆”的建设与发展等都与图书的数字化处理这一关键技术难以分开。虽然网络媒介与纸质媒介这两种媒介文献的表达方式不一样, 但都是呈现的相同的内容, 图书数字化的基本要求是经过处理之后, 电子图书能够对纸质图书的原有真实内容客观的再现。
1.2 传统修复过程中存在的问题
图书的数学化目前采用的是VC.#系统, 但是, 在进行处理的过程当中常常会出现原来图像中的少部分字符变得暗淡或是更加的模糊, 处理之后反而不能准确的进行识别。这对图书资料的数字化工作和进程起到了严重的影响作用。
由于图像采集系统对图像的摄入通常是用BMP格式存放到计算机当中, 在各种因素的影响下, 造成图像模糊、粗细不均匀或比划断开等现象, 直接影响着字符识别的准确性。针对其存在的问题, 引入了局部二值化的方法, 以期实现对图书资料进行数字化处理。
2 模式识别技术的原理及方法分析
模式识别指的是对表征现象或事物的各种形式的信息进行分析和处理, 以达到对现象或事物进行描述、辨认、分类及解释的一系列过程。
2.1 局部二值化的原理
局部二值化就是将大块图像分割为若干个小块图像, 分别对各个小图像进行二值化, 进而形成完整的二值化图像。讲二值化的问题分解为“分割”、“块副二值化”及“合并”三个步骤来进行, 以达到对图像进行二值化处理的目的。
2.2 图像分块的确定
在图像分割时, 将图像分割成正方形和矩形, 首先将图像进行若干正方形的分割, 其余的部分也就形成了若干的小矩形, 阈值选取方法的普适性与时间开销是息息相关的。
3 数字图书资料的修复过程和方法
3.1 图像预处理
在对图书馆或档案进行数字化过程中, 由于光电敏感元件载荷电子随机运动会产生噪声及来自传输通道的干扰等原因, 经数码化后的灰度图像会含有一定的噪声, 因此, 在对档案或图书图像进行二值化前, 就先要对图像进行预处理。
3.2 图像中字符信息的提取
采集系统摄入的图像为24位的灰度值, 也就是说有224个灰度等级, 此灰度图像的二值化也就是将图像转换为只含有两个等级的二值图像。依据图像区域的不连续性和相似相, 取图像灰度的平均值为阈值N, P (x, y) 为二值化结果, f (x, y) 为灰度值, 二值化的处理方式可以表示为:
3.3 二值化图像的再处理
图像经过局部的二值化之后, 产生一个新问题, 这样处理后的二值化图像中会含有比较多的噪音, 平滑化处理可以达到去除噪音的目的, 因此, 采用滤波方法来对之进行平滑化处理。
3.3.1 图像重构
通过前面的一系列处理之后, 已经得到了完整的原始数字图书资料的经二值化后的图像, 这样就构造出字符信息得到增强的图像文件, 还原的图像比原来数字图书资料效果好, 来便于对数字图书资料的阅读和处理。
3.3.2 模式识别
除了采用对数字图书资料的图像进行重建的方法之外, 还可以依据时间问题的需要来进行后继的处理, 使用模式识别方法对字符进行分割、对识别字符进行归类、手工修正和对原图书资料的内容重新输出, 并对表格字符识别和进行图像的重构。
4 实例验证
4.1 对不同处理方法的选择, 分别进行试验, 在试验中, 一般采用以下方法进行对比
方法一:传统的二值化方法法。此技术的研究目前已经较为成熟, 成果也较多, 在此就不做阐述。
方法二:改进的二值化法即局部的二值化方法。方法一采用的二值化方法是把整个图像亮点的平均值N当做阈值, 在此我们进行相应的改进, 将相关的代码进行转换, 选取阈值作为各个块亮度的均值, 经过这样处理所产生的噪音, 可用滤波方法进行平滑的去除。
4.2 不同二值化算法实验结果及对比分析
对原始图像分别采用不同的二值化法来进行二值化处理, 针对结果可以得到以下结论:
第一, 经过传统的二值化法处理之后, 图像资料中的大部分会比原来图像的对比度要高, 便于识别与阅读, 但是, 原图像中字符暗淡的部分, 二值化后反而不能准确的识别, 往往会有较大背景噪音的产生, 并且当图像中有较大的阴影存在时, 采用这种方法通常会把阴影当成是物体, 导致对物体其他部分的忽略, 这显然是与要求不相符的。
第二, 采用改进的方法进行二值化之后, 其要比前的效果好, 原图像中暗淡部分虽然图像其他部分的字符相对要模糊一些, 但是与传统的二值化方法相比, 明显能够准确进行识别和阅读, 达到了对数字图书资料的再现和修复的目的。
第三, 本文所提出的对二值化进行改进的方得到的结果是最理想的, 这说明在对一些图像的进行修复的细节方面, 改进二值化方法自身有很强的优越性。
摘要:在本文对模式识别技术在数字图书馆资料自动修复和整理中的应用进行阐述, 该方法通过对图书资料进行扫描、二值化及图像重建等进行处理, 来达到对不清晰的图书资料实现自动修复的目的, 以期实现数字图书资料数字化的处理。最后, 对该方法的有效性和实用性进行验证。
关键词:模式识别,数字图书,资料修复,应用
参考文献
[1]孙建飞.图像二值化算法研究及其实现[J].微计算机信息.2008 (10) .
[2]吴思天.二值化修正发在繁体字写字库构建中的应用[J].计算机工程与应用.2006 (5) .
[3]高齐.一种有效的文本图像二值化方法[J].北方交通大学出版社.2009 (1) .
[4]张萌.VC++图像处理程序设计[J].计算机工程.2006 (8) .
[5]李晓华.脉冲噪声污染图像的迭代二值化分割[J].计算机工程与设计.2005 (6) .