进阶媒资系统设计论文

2024-06-23

进阶媒资系统设计论文(共5篇)

进阶媒资系统设计论文 篇1

0 引言

随着科技的发展, 音频工作站和自动播出系统已经成为电台的主要节目制作和播出设备, 需要大量的数字化素材进行支撑, 同时又产生了大量的优秀节目需要进行保存。这些素材和节目以及各种长年积累的媒体资料对电台来说是无穷的财富, 有效地利用这些资料, 不仅能给电台带来物质财富, 更是文化的传承。

新疆人民广播电台 (以下简称“我台”) 在2001年就上线了一套音频资料库系统, 已经经历了九年的高负荷工作, 不能满足种类日益丰富和庞大的音频资料高效快速存储调用的需求。经过综合比较, 2010年, 我们最终选择DAV POWER媒体资料库系统对原有媒资系统进行了升级和改造, 架设了一套全功能的媒体资料库系统。升级后的系统不仅满足了长期的资料积累和永久保存, 还更好地满足了目前大容量媒体资料库的应用要求, 是电台数字化资料存储和科学管理较为完善的解决方案。

1 媒资系统中节目的检索调用设计

我台的媒体资料库系统要求拥有强大和完善的功能, 不仅能实现精品资料的科学归档、管理, 还包括录制播出系统在内的各种应用对其的调用。其检索调用设计主要包括:三级存储和访问架构, 独特的检索功能设计等, 做到了性能与安全的最佳结合, 使得媒资的调用高效便利。具体表现在以下几个方面。

1.1 三级存储架构

我们知道, 媒体资料在实际被使用过程中, 海量存储的数据在一个时间段内只有很少部分被经常访问, 因此在媒资系统设计的时候, 首先就要考虑如何使经常被访问的资料能被快速检索调用。我台的媒资系统采用三级存储架构很好地解决了这个问题, 其分为一级在线存储、二级近线存储和三级离线存储, 如图1。系统把被频繁访问的数据放到一级存储设备中, 一级存储在系统中其实承担了数据缓冲池的作用, 同时二级存储设备中的数据能同样在需要的时候被高效访问而不影响系统的响应。

在三级存储架构中, 所有的应用客户端对资料的调用都通过一级存储完成, 系统自动把常用资料存储在一级存储阵列柜上, 同时, 所有的数据均保存在大容量的二级存储设备上。数据从二级存储到一级存储的迁移, 由系统自动完成。

整个数据访问对客户端来说都是直接从一级存储中获取, 客户端请求入库的数据也是通过一级存储迁移到二级存储中, 保证了最后存档的数据是完全封闭的, 用户无法对存档的数据进行直接访问和修改。

1.2 三层访问架构

对于客户端对媒体资料的访问和调用, DAV Power采用了三层架构, 客户端通过web服务和ftp以及http服务来完成对数据的访问调用。通过数据与客户端应用服务分开的方式有效地确保了数据的独立和安全。

如图2所示, 我台把数据库服务器与文件管理服务器独立设置的目的就在于把系统的数据操作分为三层, 最里面的为数据层, 中间为应用层, 最外面为客户端。这样做的好处就在于客户端请求或者下发的资源都需要经过应用层的处理, 也就是通过web和ftp的服务请求, 数据库服务器接收请求后进行数据处理, 通过数据库服务器对数据的管理, 客户端才能访问数据层的资料或者下发资料给数据层。避免了客户端直接对数据层进行修改, 确保数据层的资料有序和完整, 防止客户端的不可控操作造成数据混乱和丢失。

1.3 独立节目检索调用服务器

媒体资料库是整个电台精品资料的中心, 台内不同的系统都有需求对该资料库进行访问和资料下载。因此, 媒体资料库系统应该具备开放的系统接口, 通过接口协议实现有条件的数据互联。例如音频网录制系统可以直接调用媒体资料库的节目资源, 播出系统也可以直接对其调用和下载。但为了安全设计, 外部系统的资源调用都是单向的, 不允许对媒体资料库进行任何更改等操作。

新疆电台的DAVPower系统专门设计了独立节目检索调用服务器, 为用户提供使用媒体资料的安全通道。通过独立的检索调用服务器, 其他系统的客户端同样可以实现对媒体资料库精品资料的检索和调用下载。独立节目检索调用服务器采用开放性接口, 不仅能够满足J2EE开发性的要求, 同时提供VC/VB/Delphi的开发接口, 前端系统无论是采用B/S结构还是C/S结构, 均能在遵从接口协议的条件下和媒资系统连接。系统采用XML作为数据交流格式, 适应任何的外部系统应用。图3表示了媒体资料库和独立节目检索调用服务器利用开放性接口的连接方式。

目前, 针对音频播出网 (内网) 和办公网 (外网) 的安全隔离要求, 分别部署了独立节目检索调用服务器。其中播出系统节目检索调用服务器负责音频播出系统用户对媒体资料库的节目查询和下载, 而在办公网, 则把独立节目检索调用服务器集成到多媒体信息共享服务器负责办公网用户的节目查询和下载。

音频播出网的用户主要是录制系统和播出系统的用户, 为了制作出更好的精品节目, 录制人员可以通过录制软件独立节目检索调用服务器的接口直接检索所需的节目资料, 从媒体资料库直接下载到录制站中, 但不允许录制站发送节目到媒体资料库中, 保证了数据的单向性, 确保媒体资料库的完整性。同时播出站也具备与独立节目检索调用服务器的接口, 主持人可以随时查询调用媒体资料库的精品节目下载到本地, 通过快捷播放或者直接拖入栏目中进行播出, 使得精品资料的利用率大大提高, 也体现了精品资料库的价值。办公网用户 (包括互联网用户) 也可以通过办公网多媒体信息共享服务器查询和下载精品节目用于其他系统, 例如网上广播、网上点播等。

通过这些独立节目检索调用服务器, 实现客户端主动检索调用媒体资料库的资料, 使得最终的客户端使用媒体资料的方式更为主动, 突破了原来需要专门发送资料才能调用的限制。同时独立节目检索调用服务器的设立也增加了系统接口的灵活性, 任何需要调用媒体资料的系统都可以通过增加节目检索调用服务器实现对媒资系统节目的调用和下载, 而且不影响系统的安全性能。

1.4 其他独特的检索功能设计

媒体资料库系统采用独特的多重检索功能, 不仅能完成模糊和全文检索, 精确检索到单个节目, 而且能进行索引组合检索, 通过对对象基本编目索引的组合查询, 快速定位到指定的资源范围, 还可以通过二级检索进一步缩小检索结果范围, 精确定位到所需资源。

另外系统还提供了独特的关联检索和水印检索。系统能够根据关键字延伸出来的相关信息自动把与被检索的资料有关的信息一同检索出来, 形成一个成套的检索功能。而水印检索则是一种对特定版权资料的快速检索方法。系统在数字化的时候对资料加入了数字版权水印。由于水印技术的鲁棒性, 植入的水印不会因为资料的格式转换、压缩等操作丢失。而且水印是唯一的, 已经加入水印的资料不能重复植入水印。因此, 通过对水印的检索我们就可以查找出所需的特定版权的媒体资料。

2 结束语

媒资系统作为全台资料的管理和储存中心, 除了媒资编目和大容量存储外, 还必须考虑媒资的合理利用, 充分发挥媒资的价值。因此一个好的媒资系统需要有合理的存储架构设计以及开放的系统接口, 方便电台各个业务环节充分的利用媒资。在我台的媒资系统中, 通过三级存储架构和三层访问架构以及独特的检索功能设计, 在高效访问、线性扩容、安全备份三个本身互斥的问题之间做到了性能与安全的最佳结合。该系统自2010年10月建成投入使用以来, 达到了设计目标, 现已使用2年多, 系统各方面可靠、稳定。

参考文献

[1]刘强.媒体资产管理系统的发展趋势[J].广播与电视技术, 2008, (2) :36-39.

[2]阮海红.媒资内容管理实验研究[J].现代情报, 2008, (05) :70-72.

[3]崔俊杰.媒体资产管理系统的结构与设计[J].中国有线电视, 2011, (08) :976-978.

智能媒资检索系统设计与实现 篇2

现有的媒资管理系统采用关系数据库管理系统如Oracle、SQL Server、MySQL等对媒资文件进行存储管理,使用结构化查询语言(Structured Query Language,SQL)对媒资编目信息进行查找,实现对媒资文件的检索,主要存在以下3个瓶颈:1)编目信息需要人工标注,随着媒资数据的爆炸式增长,所耗费的时间成本和人力成本将难以负担;2)编目项难以涵盖媒资数据内容的所有维度,而且不具有通用性和扩展性,难以在不同应用系统之间实现信息共享及自身升级换代;3)不同标注人员对同一媒资数据的标注存在主观上的偏差,导致检索词与编目信息之间存在语义误差。其根本原因在于:1)多媒体数据的非结构化,视频文件的语义内容信息来源于视频字幕、视频关键帧、语音内容,难以用结构化的方法将其全部描述;2)大脑的认知误差,对于同一幅图像,不同人的关注点不同,标注的信息也不同;3)多媒体数据将呈指数级增长。

针对产生问题的根本原因,本文提出一种基于内容结构化分析的智能媒资检索系统。该系统的工作原理是首先采用视频内容分析、图像处理、语音识别、光学字符识别等多种信息处理手段将非结构化的文本、图像、音频、视频转化为结构化的特征数据[2];然后采用特征倒排表的方式生成媒资索引;最后采用特征模式匹配的方法进行检索和相似度排序。整个系统具备媒资上传下载、存储管理、多媒体数据检索输入、跨媒体检索、在线播放预览等功能[3]。

1 总体架构

针对媒资检索系统的应用需求,本文提出的智能媒资检索系统采用如图1所示的体系架构。

整个系统分为如下5个子系统:

1)上传下载子系统:实现所有媒体数据文件的上传和下载,并进行转码后形成标准的媒资数据。

2)存储管理子系统:实现对媒资数据文件的存储管理,包括媒资记录的增加、删除、修改、查找、在线预览等功能。

3)交互子系统:提供用户输入检索数据的人机交互接口,包括文本关键字和检索图片两种接口。

4)检索子系统:一方面对系统中存储的媒资数据进行自动分析和索引,另一方面根据交互子系统提供的检索输入数据对索引进行查找并按照相似度给出排序结果。

5)播控子系统:对于需要进行播出媒资数据文件进行控制和再利用,同时也可以将结果输送到其他系统。

这5个子系统之间的关系如图1所示,上传下载子系统是整个系统数据采集和输出端口;存储管理子系统对所有的媒资数据进行记录管理;交互子系统是用户检索的输入端口;检索子系统是整个系统的核心模块;播控子系统是整个系统的对外输出端口。

2 系统方案设计

本文的工作重心为检索子系统的算法设计与实现,具体包含:媒资内容分析、媒资内容索引、媒资内容检索匹配。

2.1 媒资内容分析

本系统主要针对广播电视中出现的新闻文本、音频、图片、视频等媒体类型进行分析。

1)文本内容分析

文本内容分析采用自然语言处理的方法[4],将全文本数据切分为一组有意义的字词的集合。如图2所示,具体处理过程包括如下3个步骤:

(1)建立词典:预先根据应用背景建立一个包含单字和单词的词典。

(2)中文分词:将全文本按照分解为单字和单词,本系统中采用开源软件算法库ICTCLAS进行中文分词。

(3)数据清洗:去除无意义的单字和单词,将剩余的集合作为该全文数据的特征,并得到每个单子和单词的出现频率,作为最终的文本特征量。

2)音频内容分析

音频内容主要指音频中的说话人语音内容,因此,音频内容分析的思路是将音频语音内容转化为文本信息,然后再采用文本内容分析的方法实现音频内容分析。如图3所示,具体处理过程包括如下3个步骤:

(1)语音内容提取:从音频文件中将含有语音内容的部分检测提取出来,本系统中采用静音点检测与场景切换检测融合判定的方法检测语音内容的起止时间。

(2)语音内容识别:使用语音识别技术将语音内容转换为文本,本系统中采用商用软件库PATTEK作为语音识别引擎。

(3)文本内容分析:通过文本内容分析得到音频中的文本特征量。

3)图像内容分析

图像数据比文本数据和音频数据包含更多更直观的信息,而且由于认知偏差,不同的人对于同样的图像数据会给出不同的内容描述。因此,除了要考虑高层语义内容(如物体、事件、地点等)外,还要考虑底层视觉特征(颜色、形状、纹理等),需要采用不同的方法分别进行分析[5]。图像内容分析设计图如图4所示,具体处理过程包括2个方面。

(1)高层语义内容分析

高层语义内容是指在图像中可以获取的人物、物体、地点、时间、事件等具有特定意义的信息。目前,较为成熟的是对人物和部分特定物体进行自动检测和识别。本系统中主要采用人脸检测识别技术实现对图像中人物的识别分析,得到图片中的人脸特征量。

(2)底层视觉特征分析

不同于高层语义特征,底层视觉特征是对图像中形状、颜色、纹理等基本图像元素的描述,是图像表达的最基本特征。尽管底层视觉特征没有给出图像内容的具体语义信息,但它是对图像的客观描述,避免了主观认知偏差。本系统中采用颜色直方图、梯度直方图(Histogram of Gradient,HOG)、尺度不变特征(Scale Invariant Feature Transform,SIFT)等得到底层视觉特征量。

4)视频内容分析

视频数据比文本数据、图像数据、音频数据的结构更为复杂,但视频数据又可以看作是由前三者构成的。例如,视频数据的每一帧可以看作是一幅图像、视频数据中的声道是音频数据、视频画面上出现的文字可以看作是文本数据。因此,只需要采用特定的方法将以上数据提取出来,然后采用文本内容分析、音频内容分析、图像内容分析的方法即可实现视频内容分析[6]。基于此思想,视频内容分析的关键是提取音频数据、文本数据、图像数据。视频内容分析设计图如图5所示,其具体过程如下。

(1)文本数据提取

视频数据中的文本数据主要是指在视频中出现的字幕。由于字幕的位置较为固定,可以直接分割出来,得到包含字幕的区域。之后采用光学字符识别(Optical Character Recognition,OCR)的方法提取字幕内容。

(2)音频数据提取

音频数据提取的关键在于音频数据的检测。本系统中采用静音点检测与场景切换检测融合判定的方法,确定出音频数据的起止时间,从而截取含有语音内容的音频数据。

(3)图像数据提取

理论上每一帧视频数据都是一幅图像,但是由于帧间冗余,只有少部分视频帧可以作为有用的图像数据,一般称之为关键内容帧,简称关键帧。对于关键帧的提取可以根据帧中的内容信息和帧间变化作为检测的依据。本系统中将包含有特定人物和物体及帧间变化较大的视频帧作为关键帧,提取出来的关键帧集合为该视频的图像数据。

得到文本数据、音频数据和图像数据之后,分别采用上文提到的文本内容分析、音频内容分析、图像内容分析的方法实现视频内容分析,得到视频内容的文本特征量、人脸特征量、底层视觉特征量。

2.2 媒资内容索引

媒资内容索引是对媒资内容分析后得到的文本特征量、人脸特征量、底层视觉特征量等建立索引,以便于检索。本系统直接采用目前最为成熟而且有效的倒排索引法对以上特征量进行索引,形成媒资特征量索引文件。以文本特征量倒排索引为例,整个索引包含两个部分:单词项记录词典中的每个单词,文件列表记录包含该单词的所有文件序号及其他信息。如图6所示,其中N为文本词典中的单词总数,mi(i从1到N)为包含“单词i”的文件总数。

2.3 媒资内容检索

媒资内容检索基于输入媒资检索数据,对媒资内容索引进行查找,并对所有查找结果进行相似度排序。媒资内容检索设计图如图7所示,包含如下3个过程。

1)输入媒资内容分析:对输入的文本或图片进行内容分析,得到文本特征量或人脸特征量、底层视觉特征量;

2)索引查找:对于3种特征量分别进行索引查找,找到包含3种特征量关键元素的所有文件;

3)匹配排序:将找到的文件的文本特征量或人脸特征量、底层视觉特征量分别与输入的3种特征量进行相似度匹配,并根据匹配结果进行排序。

3 系统实现及验证

3.1 基于B/S架构的系统实现

本系统采用浏览器/服务器(Browser/Server,B/S)系统架构,可同时支持多个客户端同时访问系统。如图8所示,整个系统由检索客户端、Web服务器、检索分析服务器集群、磁盘阵列、存储管理服务器、播出控制工作站、上传下载工作站等通过以太网连接组成。

整个系统实现遵循J2EE体系,采用Spring+Structs+Hibernate(SSH)框架进行开发,核心检索模块搭建在检索分析服务器集群上,所有算法封装成独立的软件包在服务器上独立运行,Web服务器通过任务调度的形式将任务分配给相应的算法软件包。

3.2 系统结果验证

采用如表1所示的测试环境对本系统的检索性能进行验证。得到以下结果:

1)文本检索可以达到很好的效果,查准率可以达到95%以上,与开源文本检索引擎Lucence的实验结果相吻合,完全能够满足应用需求。

2)音频检索效果稍逊于文本检索,但是能够满足应用需求。通过分析结果,原因在于音频转文本的性能有损失,即语音识别的精度。尽管语音识别引擎对标准中文的精度在90%以上,但在实际应用中,由于受背景噪声、专业领域词汇等的影响,精度会有所下降。

3)图像检索的效果差强人意,距离期望还有一定距离。对于人物的检索,侧面人脸大大降低了人脸检测精度,导致出现图像漏检;另外,简单的底层视觉特征还没有达到需要的效果。

4)视频内容检索的效果与前三者直接相关,基于关键字的视频内容检索效果与文本检索、音频检索相当;基于图像输入的视频内容检索效果与图像检索效果相当。

4 小结

本文介绍了一种基于数字媒体内容自动分析的智能媒资检索系统的原理设计和技术实现,并进行了试验验证。目前,该系统已被多家单位用于电子档案管理、多媒体情报管理,其功能和性能指标得到用户的认可。今后,为进一步提高系统的适用性和检索准确率,满足不同行业的应用需求,将从以下方面进行改进:

1)优化媒资内容分析关键技术

本文提出的媒资检索系统的核心是媒资内容分析,其中各项关键技术的性能直接影响整个系统的使用性能。目前,图像内容分析技术和视频内容分析技术都采用的是最基本的方法,还具有较大的提升空间,需要更加深入的优化和完善。

2)采用云计算体系架构

随着数据量的爆炸式增长,本系统采用的架构难以满足需求。目前,基于云计算的海量存储和计算技术已经相当成熟[7],可考虑在云计算体系架构下搭建本系统。

摘要:针对目前媒资管理系统依赖编目信息进行检索而出现的编目信息难以覆盖媒资数据的所有语义内容、由于人的理解不同而导致的编目信息不一致、媒资编目费力费时等问题,设计了不依赖编目信息的基于全文检索、语音识别、人脸识别、关键帧提取等的智能媒资检索系统,对媒资内容自动分析、媒资特征索引、媒资特征检索进行了阐述,并采用基于B/S的分布式架构进行了实现。结果证明,该方案设计具有较高的可靠性和稳定性,在媒资管理中得到了良好的应用。

关键词:媒资管理,智能检索,内容分析

参考文献

[1]吴迎春.媒体资产管理系统的应用解析[J].电视技术,2010,34(6):64-66.

[2]LEW M S.Multimedia information retrieval:best papers and expanding frontiers[J].International Journal of Multimedia Information Retrieval,2014,3(2):67-68.

[3]蒙诺,孟放.浅析媒体资产管理系统在广电系统的应用[J].电视技术,2012,36(14):66-68.

[4]MANNING C D.Foundations of statistical natural language processing[M].Cambrige,Massachusetts,USA:MIT Press,1999.

[5]SONKA M,HLAVAC V,BOYLE R.Image processing,analysis,and machine vision[M].Boston,Massachusetts,USA:Cengage Learning,2014.

[6]DIMITROVA N.ZHANG H J,SHAHRARAY B,et al.Applications of video-content analysis and retrieval[J].IEEE Multimedia,2002,9(3):42-55.

媒资管理与分发系统的设计与实现 篇3

1 系统总体架构

1.1 对象定义

由于我们管理的目标对象为媒资, 因此, 为了对该类信息进行管理, 需要对其进行抽象细化。在整个系统中, 需要管理的对象主要为两类, 一类是媒资对象, 另一类是媒体资产对象。媒资对象为节目的抽象对象, 其属性有供应商、导演、主演、简介、描述等。而资产对象则是对应于具体的数据文件, 如某种码率的数据媒体文件、某种规格的海报文件等, 而资产对象的的属性则有码率或尺寸、制式、PID等。媒资对象和资产对象的关系为一对多的关系, 对应关系如图1所示。

举例来说, 一部《蝙蝠侠3》的电影可以看成为一个媒资对象, 其元数据信息组成该媒资对象的属性, 而该对象将包含3个资产对象:一个10Mbps码率的数码媒体文件、一个6Mbps码率的数据媒体文件和一个大尺寸的海报文件。

媒资和资产这两种对象的概念以及关系定义, 为整个系统的开发和建设建立了良好的基础, 因为对于内容提供商来说, 一是关注节目的管理, 这部分的管理主要基于文中所说的媒资对象管理;另一方面, 是关注于内容的分发管理, 它着重于具体的数据文件管理, 而这部分主要通过资产对象来进行管理。这两方面的管理是有密切关联的, 可以通过媒资对象与资产对象的关联进行统一管理。

1.2 系统组成

整个系统平台由媒资管理、资产管理、系统管理以及分发管理组成。其系统组成如图2所示。

媒资管理主要针对媒资对象进行管理, 可以对媒资对象进行检索、新增、删除、更新以及统计。资产管理则主要针对资产对象进行管理, 可以维护媒资对象与资产对象的对应关系, 并提供资产对象的检索、新增、删除、更新以及统计。另外一个重要的功能模块为分发管理。分发管理对于内容提供商的节目分发具有极其重要的作用。运营商对于内容提供商不仅仅需要提供特定格式码率的数据媒体文件, 还需要按照其规格提供该节目的元数据文件以及对应的海报片花等, 而各个运营商的标准定义各有不同。基于此, 本系统提供对各分发商所需的元数据信息提供个性化的分发, 其分发的承载格式有Excel文件和ADI标准的XML文件。除了以上三个重要功能模块, 系统还提供了数据导入、用户管理以及分发商管理等系统管理功能。下面对设计中的重点进行细节介绍。

2 设计与实现

2.1 ADI接口分发

ADI (Asset Distribution Interface) 全称为媒资分发接口, 是由Cable Labs的VOD Metadata标准所定义的, 被世界上广大运营商广泛用于VOD节目的传送。ADI标准所定义的资产传送接口是一种逻辑接口, 与底层的物理接口无关。底层的物理接口可以是磁带、卫星传输通道和IP传输网络。资产传送接口规范了系统运营商的资产管理系统与节目制作商所使用的资产传送系统的连接。它极大地方便了有线电视系统运营商接收来自不同的VOD节目制作商的节目, 以及VOD节目制作商向不同的有线电视系统运营商传送节目。它的承载文件为XML文件, 采用这种半结构化的数据格式, 极大地方便了异构系统中的信息交换以及传递, 从而得到业界的广泛应用。

2.2 实现的用户界面

图3、图4、图5为系统实现后的若干用户界面。经测试后, 该系统已投入实际的运营, 并取得了不错的效果。

3 小结

处于信息化时代的二十一世纪, 一个企业管理水平的高低与企业信息化的程度息息相关。企业信息化程度越高, 处理危机的能力越强, 反应速度越快, 生产效率也就越高。内容运营公司最重要的资产在于自身拥有的媒资, 如何有效地对媒资进行管控以及分发无疑是一项核心的竞争力。

本系统从开发设计到应用实施其过程即是企业信息化建设的一次成功实践, 实践表明, 该系统完全能对内容运营商的媒资进行科学有效的管理和分发, 从而有效地提高企业效率。下一步, 我们将考虑本系统与内容分发网络以及数字版权保护系统结合, 构建快速安全分发网络体系。

参考文献

[1]杨安萍, 胡冰.有线电视业务运营支撑平台的开发与应用.2009国际传输与覆盖研讨会论文集, 2009.

[2]卢英锁, 杨建英, 徐志军.数字电视中心媒体资产管理平台简介——媒资管理对象及范围[J].有线电视技术, 2007, (11) .

进阶媒资系统设计论文 篇4

媒资系统为广电系统媒体资产管理、版权控制提供了一个统一的管理平台。它整合了所有的音频资源, 实现了媒体资源的有效管理与配置, 为节目的制作提供了丰富的素材, 为版权管理提供了有力保障, 也为新媒体业务的发展提供了有效支持, 对广电系统的建设具有十分重要的意义[1]。

传统媒资系统的建设往往需要巨大的资金投入[2], 令很多一般中小型机构甚至大型机构难以承受。如果将云计算应用到媒资系统中, 则可以在提高性能的同时降低投入成本。媒资系统可部署在云中的业务应用[3]:

(1) 高密度的数据计算应用, 如转码、新媒体内容服务等;

(2) 高频度信息处理应用, 如数据库、应用服务器等;

(3) 海量数据存储应用, 如基于云架构的云存储;

(4) 普通工作站应用, 如媒资编目、音视频简单编辑等。

其中, 海量数据存储应用对企业而言是极为重要的, 一旦重要的数据被破坏或丢失, 将对企业日常生产造成重大的影响, 甚至带来难以弥补的损失[4]。如何保障云媒资系统存储的数据安全成为研究的热点[5]。

因此, 本文提出一个基于密文云存储的媒资系统的设计与实现, 该云媒资系统支持文件断点续传、文件流程化管理、文件自动归档, 文件一进入系统即被加密, 不论在本地终端、传输过程和云端都以密文形式保存, 全方位保障数据的安全性。

2 背景与相关工作

云存储[6,7]可分为三类:公共云存储、私有云存储、混合云存储。公有云存储通常指第三方提供商为用户提供的云存储, 核心属性是共享资源服务, 具有成本费用低、灵活性强、扩展性强、服务好等特点;而私有云存储的应用局限在一个区域、一个企业, 甚至是一个家庭内部;混合云存储一般以传统存储系统或私有云存储为主, 公有云存储作为补充, 既向公众提供服务, 又向内部提供服务。

基于云存储架构建设的媒资系统[8]也可以分为三类:公有云媒资、私有云媒资、混合云媒资。公有云媒资是指广电媒体将云媒资服务托管在公有云平台, 使用户可以通过广域网随时随地存取内容。私有云媒资是指广电媒体在内部建立私有云, 媒资服务托管在自行建设的云计算平台, 一般用户只能通过内部局域网访问媒资服务。混合云媒资是指由私有云媒资和公有云媒资构建而成的多片区域性云媒资, 通过标准协议使区域性云媒资互联互通, 形成的云媒资系统, 一般规模较大。

已经投入使用的云媒资系统有中央人民广播电台的广播云、扬州广电传媒集团的云媒资系统、冠勇科技的智能云媒资管理系统等。这些云媒资多基于私有云, 而基于公有云、混合云的较少。很多广电媒体认为公有云服务意味着失去了对数据的掌控权, 因此不愿使用公有云搭建媒资系统, 而耗费巨资建立私有云媒资系统。其实质原因是因为现有的大多数公有云媒资系统在安全性方面的考虑有所欠缺[9], 对数据泄露没有做到很好的防护[10,11]。

3 系统设计

3.1 设计目标

基于密文云存储的媒资系统的设计目标是为广电媒体企业提供一款能够提供文件流程化管理功能的安全云媒资系统, 其具体设计目标为

(1) 对存放到系统中的文件进行加密保护, 保障文件在终端、传输、云端的安全;

(2) 由用户掌握文件加解密密钥, 服务器端管理员也无法获取用户明文文件;

(3) 使用自动同步技术, 减少用户操作, 提升用户体验;

(4) 提供文件流程管理功能, 文件从上传端上传, 只有经过审批端审批后, 才可被播出端下载;

(5) 提供文件自动归档功能, 对于审批过后的节目, 以节目播出日期作为根据, 按年份、月份进行归档。

3.2 系统架构设计

图1为密文云存储系统框架图。图1可看出系统包含三个部分:客户端、服务器端、存储平台, 服务器端是整个系统的控制中心, 它集用户管理、身份认证、密钥管理、流程管理、自动归档管理等功能为一体, 通过同步模块控制客户端与存储平台之间数据的一致性;客户端提供用户交互界面, 用户进行身份认证后, 利用透明加解密技术, 对用户的文件进行保护;存储平台端提供本地存储、HDFS、Dropbox、S3等供用户选择, 用户可在注册时进行选择。

图2和图3为系统运行示意图。设定:存储平台选择Drop Box。图2运行示意图表示的是:制作端要把节目1提交给审批端审批, 将节目1传入系统后, 节目1会被自动加密成密文文件, 密文文件被放入同步文件夹中, 先被同步到Drop Box云存储服务器, 再被同步到审批端。图2可以看出, 不论在用户终端、传输过程、云端, 用户的文件均是以密文形式存在, 而文件密钥由用户自己掌握 (在3.3.1中说明) 。这样可以有效避免一系列安全隐患, 如防止终端丢失、传输过程中被窃听、服务器端窃取用户文件、第三方云存储平台窃取用户文件等导致的数据泄露。若图2审批通过节目1, 节目1将被自动同步到播出端, 审批后系统状态如图3所示。

3.3 主要功能模块

3.3.1 密钥管理

密钥管理模块提供管理用户密钥的相关功能, 包括了密钥生成、验证、存储、更新、重置以及加密算法保存。为了保证密钥的安全性, 本文采用二级密钥管理框架来管理用户密钥, 一级密钥为主密钥, 二级密钥为文件加密密钥。采用对称加密算法AES256, 以一级密钥作为密钥, 对二级密钥进行加密, 来保护二级密钥的安全性, 假设加密结果为E (文件加密密钥) , 服务器端存储E (文件加密密钥) 和SHA256 (主密钥+盐) 。其中, 保存SHA256 (主密钥+盐) 作用为验证主密钥, 而不是真正的保存用户主密钥。用户需要获取文件加密密钥时, 向服务器请求E (文件加密密钥) , 再用自己的主密钥进行解密。由于主密钥只有用户持有, 他人无法解密E (文件加密密钥) , 可以说文件加密密钥由用户自己掌握。

3.3.2 透明加解密

透明加解密是指在保护过程中, 相对用户终端是透明的、不改变用户习惯的一种文档加密技术[12]。本文中, 透明加解密模块与密钥管理模块相辅相成, 下面以“打开”操作为例, 介绍文本中用到的透明加解密技术。

算法1.透明加解密算法。

/*类key Manager管理文件密钥, 变量file Key由“文件相对路径+文件名”组成, 变量key Spect表示文件加密算法, 变量data Key表示文件加密密钥, 线程decrypt Thread进行解密操作, 变量source表示密文文件路径, 变量target表示明文文件路径, 线程watch Thread监控文件是否关闭, 函数hash (target) 返回target文件的hash值, 函数get Hash From DB从数据库获取文件对应hash值, 线程encrypt Thread表示加密线程*/

(1) 解密文件:

(2) 解密完成, 调用:

(3) watch Thread捕获到文件关闭, 自动调用:

(4) 若加密写回完成, 调用:

3.3.3 自动同步

自动同步[13]通过每隔一段时间从服务器请求所有文件hash值, 对比本地存储的hash值来判断是否需要进行文件同步操作:若hash值都相同, 则不进行同步操作;若存在不同, 则进行同步操作。

算法2.文件同步协议的算法。

/*函数get Server File List将username、password发送给服务器请求文件列表, 变量SFL表示从服务器端获取的文件信息列表, 函数get Client File List从数据库中获取文件信息列表, 变量CFL表示从数据库读取到的文件信息列表, 函数get Disk File List扫描磁盘同步目录返回文件信息列表, 变量DFL表示本地磁盘 (同步目录) 文件列表信息, 函数get Distinct File List计算并返回不重复文件信息列表, 变量download表示下载队列, 变量upload表示上传队列*/

3.3.4 自动归档

自动归档是将审批通过的老节目 (播出日期为1个月以前的节目) 从同步文件夹移除, 按照年份、月份进行归档整理。自动归档技术的应用不仅减少文件整理的人工投入, 而且减少需要自动同步文件的数量, 提升文件自动同步的效率。

算法3.自动归档算法。

/*函数get Approve And Not Archived File List是从数据库获取审批通过且未归档文件列表, 需要进行归档的文件列表, 变量FL表示文件列表, 类File Bean是文件信息的基本单元, 函数compute Time Diff计算播出日期与当前系统时间差, 函数addRecord To Archived File Table是添加一条归档文件记录到归档文件表中, 函数remove From Sync Table是删除同步文件表记录*/

4 系统测试

4.1 运行效果

密文云存储系统运行的环境:客户端:WIN7/WIN8/WIN10系统, 服务器端:Ubuntu 14/Centos6.5。

运行效果如图4所示, 图4左为审批端PC端, 图4右为审批端手机端, 可以看出在不同终端提供了统一的数据视图。

密文云存储系统对系统中的文件进行加密保护, 保护数据在终端、传输过程、云端的安全性。为了加密效果更好地展现, 见图5系统加密效果图, 测试文件使用txt文件, 将txt文件拉入系统后, 在系统中打开txt文件如图5 (a) 所示, 直接打开本地文件如图5 (b) 所示, 在服务器打开文件如图5 (c) 所示。因此, 可以看出除了使用系统终端打开之外, 都是以密文的形式存储, 从而有效保障用户数据的安全性。

4.2 性能测试

测试上传文件时, 加密时间占总上传时间的比值, 以此来评估密文在云存储系统中保护数据安全的操作对性能的影响。由于广电媒体的节目主要是音频或者视频, 文件比较大, 故测试文件采用50M-200M大小的文件。

网络环境:100Mbit/s以太网, 测试环境

(1) 客户端:

处理器:英特尔第四代酷睿i7-4790@3.60GHz四核;

内存:16 GB (三星DDR3 1600MHz) ;

主硬盘:西数WDC WD10EZEX-08M2NA0 (1 TB/7200转/分) ;

系统:WIN8.1专业版X64。

(2) 服务器:

处理器:英特尔第四代酷睿i7-4790@3.60GHz四核;

内存:16 GB (三星DDR3 1600MHz)

主硬盘:西数WDC WD10EZEX-08M2NA0 (1 TB/7200转/分) ;

系统:Ubuntu14.04;

存储:HDFS (由服务器 (Master) 与另外两次内存为4G的计算机 (Slave) 组成) 。

性能测试实验结果如图6所示, 图6测试表明加密时间占总上传时间的4%-5%, 对密文云存储系统的实际运行影响不大。

5 总结与展望

进阶媒资系统设计论文 篇5

1 移动学习环境下的进阶式学习系统设计原则

(1)在对进阶式学习系统进行设计的过程中,一定要注意综合的考虑各个方面的问题,尤其是终端设备的应用特点以及系统设计的需求等,利用安卓系统进行后台的操作,保障安卓系统可以正常的运行,将具备安卓系统的移动手机设置为终端,应用移动手机展开移动教学,搭建B/S架构,形成移动教学的基础平台,从而保障进阶式学习系统设计的合理性。

(2)设计的进阶式学习系统一定要能够满足教学的具体要求,虽然应用具有安卓系统的移动手机作为终端,所花费的成本相对较多,但是其所具有的功能也相对较为强大,能够通过无线网络实现网络的连接,可以从网络上获取相应的资源,从而实现移动平台教学。在3G逐渐普及以及4G发展的今天,应用移动手机作为终端设备,可以保障资源的获取更加的快速,数据的传播也更加的迅速和高效。此外,智能手机具有清晰的分辨率,具有较为强大的媒体性能,能够为学习者提供各种学习资源,使学习者可以及时有效地获取到相关的学习资源,从而为学习提供了极大的便利。

(3)进阶式学习系统的设计,需要对数据库和服务端进行合理的选择,使服务端与数据库能够适应互联网教学平台的需求,使移动教学的开展更加具有安全性和实用性。

2 移动终端开发的相关技术

2.1 开发工具

利用安卓系统作为移动终端,在对其进行开发的过程中,需要应用到各种开发工具,而其中最主要的两种工具就是安卓模拟器以及安卓开发工具插件。在计算机的虚拟移动设备上,安置相应的安卓模拟器,利用该模拟器可以实现对计算机中应用程度的测试以及调试,从而可以保障安卓系统运行环境的安全。

而安卓开发工具插件的主要功能就是能够对Eclipse集成环境进行有效的拓展,可以对其他的各种类型的安卓开发工具进行调节和控制;同时,能够实现对Eclipse IDE的直接访问。而在Eclipse IDE安卓开发工具插件中,还包含了安卓代码编辑器,该编辑器可以为相关的文件进行代码的编写,实现资源文件的合理应用。

2.2 开发语言

一般来说,安卓应用程序的主要编写语言就是Java,但是也存在其他的编写语言,如各种资源文件包等。在对Java程序进行有效的编译后,就会使得相关的资源最终形成一个有效的APK包。通常而言,在安卓应用程序中,包含的构件主要有Activity、Broadcast Intent Receiver、service及Content Provider。从本质上来讲,Java就是一种程度设计语言,其也是一个平台的总称,利用Java语言可以实现对动态语言的编写,而所编写的动态语言形式则主要为分布式、可移植以及多线程式等。

2.3 运行环境

运行环境主要是就是指代的安卓运行环境,而安卓运行环境其本意上就是一种虚拟机技术,该虚拟机技术就是Dalvik。这项技术与既有的Java虚拟机技术有着明显的不同,其在运行的过程中,并不是运用标准的Java字节进行的程序文件的执行,而是采用的一种Dalvik可以进行操作的格式文件,在对该文件进行执行的过程中,一个应用程序就可以被看作是一个执行的进程。

栈的虚拟机衍生出了Java VM,而寄存器的虚拟机则衍生出了Dalvik。从这点可以看出,Dalvik能够依据硬件的具体情况,来最大限度的实现对安卓运行环境的优化,从而使得移动设备能够更好地运作。

3 移动学习环境下的进阶式学习系统总体设计模型

通过分析学习者以及手机设备的特性、手机操作系统的特点,移动学习系统需要实现以下功能:系统的设计基于B/S的架构,采用Android操作系统作为移动终端设备的操作系统,并在设备中创造了可执行环境以便离线运行这些程序;移动终端基于Linux手机操作系统,实现对学习资源的开发和管理服务等。

4 移动学习环境下的进阶式学习系统的功能设计

在移动学习的环境下,进行进阶式学习系统设计的过程中,需要结合大量的学习资源,而主要的学习资源可以被分为两种:一种是学习者在学习的过程中,需要通过服务端在教育平台上所找寻的学习资源,从而直接在网上进行学习;另一种是学习人员在教学平台上对所需要的文献进行下载操作的学习资源,随时都可以携带进行学习。

就资源模块来说,其具有的主要功能有如下几点:用于文本阅读的学习资源;练习自测的资源;教师指导学习的教学视频和音频资源。这3 类功能在移动学习系统中主要表现为以下形式:阅读库、练习库、视频库。

5 结语

通过上述的分析可以了解到,基于移动学习环境下的进阶式学习系统的设计,应该遵循一定的设计原则,在设计原则的基础上,应用相关的技术,并结合系统设计的总体模型,来实现对移动学习环境下进阶式学习系统功能的设计,从而使学习系统具备较强的优势,能够在实际的应用中满足人们的需要,真正实现移动教学。

摘要:本文就主要针对移动学习环境下的进阶式学习系统设计进行了简要的探究。就系统教学设计的角度来对进阶式学习系统进行设计,以期得到更为合理的学习系统,更好地推动学习的开展。希望通过本文的探究能够为相关的人员提供一定的参考和借鉴。

上一篇:毕业生党员教育管理论文下一篇:曲线建筑