大数据服务模型研究

2024-07-22

大数据服务模型研究（共12篇）

大数据服务模型研究篇1

文献[1,2]概述了数据挖掘在军用指挥控制系统中的应用;郑向阳[3]将数据仓库运用于消防信息化建设;薛超等[4]进一步结合数据挖掘及OLAP, 倡导建立基于数据仓库的作战指挥决策支持系统。但大数据分析呈现出数据量更大、查询分析更加复杂等特点[5], 而传统的数据仓库应用中, ETL过程复杂、耗时, 无法满足即席分析的需求, 且面向主题构建的数据仓库灵活性不佳。因此, 以计算为中心向以数据处理为中心的思维转变成为必然[6]。

本文针对大数据的物理特征, 提出基于Hadoop的指挥决策系统模型, 旨在通过构建面向多源异构数据的大数据分析架构, 结合数据挖掘技术, 以解决RDBMS在大数据分析扩展性方面的瓶颈, 最终实现通过较低成本投入而达到较高效的深度分析的目的。

1 大数据

大数据是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。”业界通常用4个V来概括大数据的特征[6], 即:

1.1 规模性 (Volume)

大数据所显现出的最直接特性即为该集合数据量的巨大。理论上, 这种规模性也在一定程度上使得大数据具有特殊的领域性, 即某1GB的数据集也许在Web挖掘中不算大规模数据, 而在科学计算中却可谓货真价实的Big Data。

1.2 多样性 (Variety)

相较以文本为主的关系数据, 结构化、半结构化以及非结构化数据共同构成了大数据集合, 且半结构化及非结构化数据占有相对较大的比重。大量的多源异构甚至非结构化数据增加了深度分析的复杂度, 使得并行数据库技术难以突破扩展性这一瓶颈。

1.3 快速性 (Velocity)

区别于传统的数据挖掘, 大数据体量及增量的爆炸式增长要求数据产生后可以及时的被分析、消费并呈现, 即数据的实时性需求决定了即席分析与决策的必要性。

1.4 价值性 (Value)

大数据的根本意义在于发掘数据内部具有指导性价值的模式或知识。而相对于海量的多源异构数据, 大数据价值表现出一定的稀缺性及不确定性。因此, 如何高效、准确的进行大数据的挖掘成为了亟待解决的问题。

2 云计算

所谓云计算, 即围绕低成本、高可靠、高可用、规模可伸缩等研究目标[7], 向用户提供按需的、透明的服务的虚拟化分布式自治性计算架构[8,9,10], 其体系架构如图1示。

为应对数据洪流, 云计算提供了支持大数据存储、管理以及数据分析等的解决方案[6], 具体表现为:

1) 数据存储

为保证海量数据的高可用、高可靠和经济性, 并考虑到存储系统的I/O性能, 云计算环境中采用分布式存储的方式来存储数据。采用数据分块及冗余存储, 通过增加副本拷贝开销以保证存储数据的可靠性;构建廉价服务器集群, 达到较高的经济性;利用容错技术解决存储节点时效, 实现系统的高可用性。

具有代表性的数据存储实现为Ghemawat等人为Google设计的GFS (Google File System) [11]其执行流程如图2。

如图2示, GFS中共包含三种节点:总控服务器节点 (GFS Master) , 数据块服务器节点 (GFS Chunkserver) 以及客户端节点 (GFS Client) 。其中, 在GFS中, 文件被划分为大小一定的数据块, 由Master节点创建并分配其全局句柄 (Chunk handle) , 并由Chunkserver节点以副本的形式冗余存储于各计算节点, 统一由元数据管理节点管理。当Client节点请求访问数据时, 由Master节点获取其句柄Chunk并返回与之映射的Chunkserver, 最终完成数据的存取。

2) 数据管理

云系统的数据管理往往采用数据库领域中列存储的数据管理模式。将表按列划分后存储。以Big Table为例, 其以行、列、记录板及时间戳为基本元素, 采用“根表-元数据表-用户表”三级存储模式来存储位置信息, 利用主服务器、记录板服务器及客户端等组件的相互调用来实现数据管理。

3) 数据分析

海量数据的存储与管理是数据分析的基础, 而云计算最终要实现的是大数据分析。为此, 云计算需提供简单有效的编程模型以服务于大数据的处理与分析, 并支持规模扩展且向下透明。

在现有云计算研究中, Map-Reduce被广泛应用。其执行过程如图3示。

在大数据分析与处理过程中, Map实现对各分块数据的处理并产生中间结果, Reduce完成对中间结果的归约。即Map-Reduce极大的简化了分布式编程, 将程序开发者从繁杂的并行程序设计及高可靠性与可扩展性解决方案的构建中解放出来, 为其专注于应用本身的开发提供了可能。

3 基于Hadoop的指挥决策系统模型

针对指挥决策系统所表现出的大数据特性, 本文结合云计算及数据挖掘技术, 利用Hadoop平台, 期望搭建面向指挥作战的大数据分析生态系统, 其模型架构如图4示。

由图4知, 海量的多源异构数据经过抽取与转换操作, 作为资源存储到分布式计算平台;通过构建关联分析、聚类、分类、偏差检测、序列及回归等挖掘模型, 将数据处理进一步抽象为MapReduce编程模型;当请求地形分析、气候分析、兵力火力分析及风险预测等业务时, 调用MapReduce层之上的Hive、Datameer及Pig等高级数据处理服务, 以期提供面向大数据的深层分析。

借鉴Facebook的数据分析案例, 系统包含用于生产的核心Hive与备份Hive, 分别提供系统数据的分析与即席查询功能, 从而隔离不同业务之间的交互对核心Hive的性能影响, 以保证系统数据分析的性能。

4 总结与展望

在数据爆炸的今天, 人们仍处于数据匮乏的窘境。尤其在作战指挥中, 决策者无时无刻不面临着来自各种途径的海量情报信息, 且这些数据却是常规的手工或脑力活动所不能解决的, 而常规的数据处理方式也无法高效、准确的进行数据流的处理与分析。本文构建的基于Hadoop的指挥决策系统模型, 旨在应对多源异构大数据的即席分析需求, 通过云计算及数据挖掘技术, 辅助决策者完成对参战人员的协同管理, 最终实现信息优势向决策优势的转变。

参考文献

[1]郑海涛, 钱朴慧.指挥控制系统中的数据挖掘[J].火力与指挥控制, 2004 (z1) :59-61.

[2]唐晓萍.数据挖掘技术及其在指挥控制系统中的应用[J].火力与指挥控制, 2002, 27 (2) :35-38.

[3]郑向阳.数据仓库与消防信息化建设[J].科技信息, 2010 (22) :10191-10192.

[4]薛超, 朱庆生, 刘昌志, 等.基于数据仓库的作战指挥决策支持系统研究[J].价值工程, 2011, 30 (11) :186-187.

[5]王珊, 王会举, 覃雄派, 等.架构大数据:挑战, 现状与展望[J].计算机学报, 2011, 34 (10) :1741-1752.

[6]孟小峰, 慈祥.大数据管理:概念, 技术与挑战[J].计算机研究与发展, 2013, 50 (1) :146-169.

[7]罗军舟, 金嘉晖, 宋爱波.云计算-体系架构与关键技术[J].通信学报, 2011, 32 (7) :3-21.

[8]陈康, 郑纬民.云计算:系统实例与研究现状[J].软件学报, 2009, 20 (5) :1337-1348.

[9]李乔, 郑啸.云计算研究现状综述[J].计算机科学, 2011, 38 (4) :32-37.

[10]张建勋, 古志民, 郑超.云计算研究进展综述[J].计算机应用研究, 2010, 27 (2) :429-433.

[11]GHEMAWAT S, GOBIOFF H, LEUNG S.The Google file system[A].SOSP'03[C].Bolton Landing, NY, USA:ACM, 2003:29-43.

大数据服务模型研究篇2

在大数据时代的背景下，物联网、云计算等新一代信息技术的飞速发展，对“智慧图书馆”的构建产生了深远的影响。本文具体详细地分析了当下的前沿信息技术以及它们在“智慧图书馆”中的应用。基于“智慧图书馆”“以人为本”的本质理念，探讨“智慧图书馆”的现状与所面临的问题，并给出相关的对策与建议。随着科技的进步，人工智能在“智慧图书馆”中的应用会带动图书馆向更加智能的方向发展，人性化的水平也会不断提高。

研究背景及意义

研究背景

基于大数据的时代背景，信息的爆炸式增长，导致用户无法从海量的数据中及时获取有用信息，使信息的实际利用率降低，出现数据过载但信息匮乏的局面。而“智慧图书馆”的本质理念强调“以人为本”，所以围绕服务于人的核心，满足读者多样化的新需求，帮助读者迅速、高效、准确地找到理想的图书信息资源，是实现智慧化服务的关键。李婴巧妙地用人的神经系统与大脑之间的关系来阐述物联网、云计算、大数据、移动互联网与智慧图书馆的关系。所以，利用新一代信息技术完善智慧图书馆系统，满足用户多样性需求，顺应大数据时代的发展趋势，是一项重大的时代课题。

研究意义

图书馆的服务模式伴随着大数据时代的到来正在经历一场深刻的变革，资源形态由纸质书籍向数字资源转变，借阅方式由传统借阅向智慧服务转变、服务方式由“人找信息”向“信息找人”转变，核心竞争力由文献资源的竞争向多源数据的采集、融合与挖掘转变，逐渐体现出智慧图书馆“以人为本”、“以服务为宗旨”的本质理念。

在信息资源日益丰富的条件下，信息服务主要面临着，信息爆炸式增长与用户学习能力之间的矛盾。如何化解这一矛盾，是当下探讨智慧服务首先要解决的问题。首先，信息的爆炸式增长导致元数据的散佚和混淆，这就要求图书馆加大对元数据的收集、整理。顾立平提出可以从数据获取、数据共享、数据重用和数据加值这四个角度来开展数据治理工作。其次，我们要通过数据挖掘、信息过滤、资源检索、数据分析等多种手段锁定读者需求，为用户提供有针对性的个性化服务。最后，物联网、云计算的蓬勃发展也为“智慧图书馆”的构建注入新的活力，探讨基于大数据时代下的“智慧图书馆”服务模式具有现实意义。

物联网与智慧图书馆

物联网技术。物联网指利用最新传感技术把任何物体与互联网连接起来，实现人类社会与物理系统的整合，提高社会的智能化水平。

将物联网技术用于智慧图书馆的构建中，旨在以用户体验为核心，将读者、图书馆员、信息资源、环境与设备有机互联，人员流、信息流及设备流有机融合，挖掘主体内部的相关关系，以此满足读者需求。

物联网在“智慧图书馆”中的应用。第一，物联网技术被应用于实时监测图书馆内部环境变化。图书馆的照明系统，可以根据光线的传感信息对灯光进行自动调节；安防系统可以自动识别火情传感信息并采取相应的措施予以应对，实现控制节点对各个终端传感节点的控制。第二，物联网中RFID、传感器等技术地广泛应用，可以全面感知文献书籍的动态信息。将馆内文献贴上电子标识，既方便读者的快速查找又可以减少图书馆员文献编目与整理的工作量，大大节约读者的时间成本。李静从智能查找、分拣系统等多个子系统的角度，阐述物联网RFID技术在图书馆中的应用。第三，利用物联网技术能够为读者提供个性化服务。比如，根据读者日常所浏览的该网页频率，确定用户的感兴趣主题及价值取向，从而为读者推送相关书籍。根据近期搜集的所有读者借阅量的有关数据，为读者提供处在借阅排行榜前几位的图书，拓宽读者的知识面。

云计算与智慧图书馆

云计算的含义。自“云计算”的概念首次被提出以来，“云计算”便迅速席卷全球。[云计算最重要的两个特征是大存储和快计算。云端提供虚拟、超大的数据存储空间，可作为数据备份的途径；云计算融合分布式计算等多种计算方式，具有超强的信息处理能力。

云计算在“智慧图书馆”中的应用研究。基于云计算超强的存储能力与计算能力，可以对通过传感器所采集的感知信息进行快速处理，比如，当读者无法准确地表述想要检索的内容时，系统可以自动地根据相关表述提供自动信息检索代理服务等。此外，每一个用户都可以申请到属于自己的云存储空间，解决用户内存不足的问题。比如，若手机内存有限，可以将下载的电子书资源传到虚拟云端进行存储。

智慧图书馆建设存在的问题

第一，推荐服务智慧化程度低。以高校“智慧图书馆”为例，其提供的推荐服务的核心是书籍而不是读者，对读者的需求没有精准定位。

第二，信息安全问题突出。邱庆东指出，智慧图书馆内部运行数据、用户资料的泄露等会使网络安全问题更加突出。

第三，技术难度加大。“智慧图书馆”的构建需要依托强有力的技术手段，随着智能化水平的不断提高，人工智能技术也将逐渐地融入到智慧图书馆的构建中，所需要攻克的技术难关也会越来越多。赵继海所提到的运用VR技术可以为为读者带来全新的阅读感受与体验。文中所提到的AI及机器学习等智能技术无疑是未来图书馆领域的发展趋势。

第四，图书馆员专业化水平良莠不齐。目前图书馆员主动服务的意识比较缺乏，运用信息技术的能力还有待提高。勾丹指出，尚未建立图书馆员准入制度，馆员的学历整体偏低，且对馆员的考核制度有待完善。

智慧图书馆构建的相关建议

第一，健全信息安全的法律机制。大数据时代信息爆炸式增长的同时，个人信息的泄露屡见不鲜，国家应完善网络安全的立法工作，使信息安全有法可依。同时，智能图书馆系统需要不断提高防范信息安全的技术水平，保护用户的个人信息免被窃取。

第二，积极推进智慧平台建设。利用物联网技术收集感知信息，加强馆内环境建设，为读者提供舒适的阅读环境。利用数据挖掘技术，对用户行为需求及兴趣进行深度挖掘和分析，从而给用户提供符合兴趣爱好的相关推荐。

第三，社交媒体助力“智慧图书馆”的建设。微博、微信等社交网络的快速发展推动着“智慧图书馆”向更加快速、便捷的方向发展。比如，各大图书馆可以利用微信服务平台为读者提供实时的服务，包括图书馆座位查询、书籍查询等。基于智慧图书馆，还需要提供更加“智慧”的推荐服务，更精准地定位读者需求，提供差异化推荐。此外，提供在线信息咨询服务、回复微信用户留言的服务，增强与读者的互动与交流。

第四，不断完善移动图书馆的建设。以“超星”移动图书馆为例，可以实现电子资源一站式检索、纸质馆藏文献的移动检索等功能。但是检索功能仍处于初级阶段，需要不断完善检索的功能，提供更加复杂的查询，另外，学术资源需要各大图书馆之间进行合作与共享，从而使用户更容易获取所需的电子资源。

第五，提高智慧馆员专业化程度。储节旺提出，智慧馆员应该树立智慧意识，培养创新能力，定期给予相关的培训，提高运用信息技术的能力。李凯旋从人文的角度阐述人对图书馆建设的重要作用，不断丰富“智慧图书馆”的内涵。

大数据服务模型研究篇3

关键词科学数据共享国际科学数据服务平台共享研究

分类号 G250.73

Abstract This paper introduces the scientific data sharing status at home and abroad， analyzes the basic elements of the scientific data sharing， including the resource elements， the protection of intellectual property rights elements， the shared schema elements， sharing and management mechanism elements. Further more， it presents the International Scientific Data Service Platform， analyzes its data resources， protection of the intellectual property rights， sharing mode， service contents， and browsing method.

Keywords Scientific data sharing. International scientific data service platform. Research of the Sharing.

科学数据是指在科技活动（实验、观测、检测、调查、研究等）中或通过其它的方式所获取的反映客观世界的本质、特征、变化规律等的原始基本数据，以及根据不同科技活动需要，进行系统加工整理的各类数据集[1]。科学数据集科学价值和使用价值于一体，并对于科技创新的发展产生了深远的意义。科学数据资源具有准确性、可靠性、非排它性、可无限复制等特点。这些特点和其重要性使科学数据的共享成为必然，只有让科学数据得到共享，才能实现其价值的最大化，同时，又通过科学数据的共享这一过程，发展出更高层次的科学数据，这是一个逐级递进的过程，最终为社会的发展贡献力量。

1 国内外科学数据共享现状

1.1 国外科学数据共享现状

20世纪40年代，国外的科学数据共享方面的研究开始起步，在20世纪80年代得到发展，在欧洲、英国、法国、德国、荷兰和瑞典等国家非常重视数据管理与共享，美国是科学数据共享的倡导者。1975年，美国开发了177个大型数据库，主要服务目标是政府决策和政府启动的重大科研项目[2]。欧盟数据库法律保护指令、英国布加勒斯特宣言和《信息自由法》等，在科学数据的产权归属、共享管理和开发利用等方面均有明确的规定，以保障科学数据共享活动的有序开展。

国际科学数据委员会（CODATA）于1966年成立，是全球最大的科技数据国际学术组织，其宗旨是推动科技数据应用、发展数据科学、促进科学研究、造福人类社会[3]。美国建立了美国航空航天局（NASA）分布式最活跃数据档案中心群（DAACs）；日本产业技术综合研究所（AIST）科学数据公开数据库拥有70个主题数据库，全部数据库通过网络提供免费服务，服务于科研机构，也服务于一般工业企业[4]。2007 年3 月，英国发布了研究报告《发展英国科研与创新信息化基础设施》，提出数据资源数字化长期保存与共享建设规划，重点要建立大规模的国家科学数据中心[5]。

1.2 国内科学数据共享现状

我国的科学数据共享工作起步比较晚，2001年底我国科学数据共享工程启动气象科学数据共享试点，在资源环境、农业、人口与健康、基础与前沿等领域共24个部门开展了科学数据共享工作，已经启动了9个科学数据共享试点，开展了科学数据共享政策法规和技术标准体系的调研工作。先后完成了23项具体标准的编制以及一批管理办法；整合共享了跨部门跨领域超过250亿元国家投入产生的数据资源，建立了若干数据库；积极开展数据共享服务，为科学研究、政府决策提供了坚实的支撑，成效显著[6]。但是与发达国家比起来存在很大的差距，主要有：科学数据共享意识不强，目前科学数据共享工程试点的共享数据多为国家经费资助下科技活动形成的数据，各科研单位主动积极共享意识不强；相关的科学数据共享标准及技术规范没有统一的规定；科学数据类型集中于海洋、地理等少数学科领域。

2 科学数据共享基本要素分析

美国国家卫生研究院（NIH）要求申请资金超过50万美元的项目必须提供数据共享计划或者说明不共享的理由。并且，NIH通过分级方式共享数据，包括可公开获取的数据、通过协议获取的数据和限制使用的“冷冻数据”[7]。据调查显示，科研人员共享电子数据和使用他人数据的意愿都不高，主要因素有：没时间、没资金、没权利、缺标准以及资助者无要求等[8]。科学数据的共享最基本的是要有相关的科学数据，也即资源的来源，而共享工作的开展必然要面对科学数据的知识产权保护问题，其次要根据不同的情况选择不同的共享模式来开展共享活动，共享活动的有序、稳定的开展需要相对应的共享管理机制的保障，所以资源来源、知识产权保护、共享模式以及共享管理机制这四大要素构成了科学数据共享活动的基本要素，它们之间相互联系，缺一不可。

2.1 资源来源

科学数据指在科技活动过程中产生的原始数据，所以资源的来源就是科研活动过程，资源的内容主要有两种：一种是本单位或机构内科研活动过程中产生的数据，二是收集其他单位或研究机构的科研数据。本机构的科学数据，主要是来自于本机构研究人员的自愿自主提交以及数据服务人员提供咨询帮助，如中国气象科学数据共享服务网的科学数据来自于国内卫星通讯系统、全球通信系统收集的全球和国内各类实时和非实时的气象观探测资料[9]；第二种主要是与政府机构、科研机构、高校等部门合作，提供途径鼓励这些机构的研究人员同意将他们的相关数据整合到数据中心共享.如基础科学数据共享工程整合中国科学院在物理、化学、天文、空间与生物领域20多个研究所长期以来的基础数据，同时，重点整合国防科工委下属的中国工程物理研究院、中国原子能科学研究院在核物理与原子分子物理方面基础数据，整合国家林业局所属青海湖国家级自然保护区多年来在青海湖区域监测与观测数据[10]。

nlc202309040905

2.2 知识产权保护

数据的共享首先要考虑的就是其所涉及到的知识产权问题。科学数据共享中的知识产权主要体现为科学数据的版权，版权就是著作权，是指文学、艺术、科学作品的作者对其作品享有的权利，包括财产权、人身权[11]。科学数据凝聚了数据开发人的智力劳动，是创造性的劳动成果，同样受版权法保护，具有重大的价值。实施科学数据共享是我国面对全球信息化和知识经济的发展，开展自主创新、建设创新型国家的必然要求[12]。刘闯认为通过数据库共享服务平台进行有偿数据服务而获得的收益，在数据库制作者和相关数据创造者之间按照合同约定进行分配，如无合同约定的自行协商解决[13]。

《全球变化研究数据管理政策声明》提出“联邦政府资助的科学数据，即公共性、基础性的国有数据，必须在没有歧视的基础上以不超过复制和发行成本的费用无限制地使用”[14]。科学数据的开发与获得需要责任人付出巨大的努力，包括精力、时间、金钱上的，不仅仅是数据开发人，还有相关的单位等等，他们对于科学数据做出了巨大的贡献，这些科学数据自然地成为各个单位的财产，受知识产权保护，另一方面这也在一定程度上限制了科学数据的自由共享。所以笔者认为，科学数据的共享需要国家相关法律的许可和一定的限制，对于那些在国家或是地方政府经费等非营利性机构支持下开发的科学数据，采用一定的奖金或是其它奖励的方式来鼓励开发人，如果不危及国家安全和个人隐私，则完全向公众开放或是使用时加以标注，以尊重劳动者的成果，但不能用于商业用途；对于那些由单位自筹经费或是个人、企业自行开发研究的不危及国家安全和个人隐私的科学数据，则要协调好利益的平衡，一般是采用收取一定的费用的方式来保护他们的权利；对于那些对科学数据进行了一定程度的加工的更深一层次的数据及提供的相关服务活动，收取一定的成本。

2.3 共享模式

科学数据共享为科学数据的使用提供了一条更为畅通的道路。科学数据具有无法估量的潜在价值，前人为科学数据的探索与创造做出了巨大的努力和贡献，传承与共享这些科学数据是对于他们的努力的最大尊重与认可。目前国内外采用的科学数据共享的模式主要有四种，分别是国际组织协作共建共享模式、政策驱动型共建共享模式、主题合作共建共享模式和地域协作共建共享模式。

2.3.1 国际组织协作共建共享模式

顾名思义，国际组织协作共建共享模式是指在某种约定或是条约的约束下，国际组织就某一研究方向或是研究主题，共同制定相关的共享策略的一种共享模式，该共享策略包括共享的范围、方式及相关的政策，可以促进同一领域内数据的交流与共享。国际组织协作方式包括国际政府间的合作和国际非政府间的合作，不管是哪种方式，都必须遵循共享的宗旨，为共同的约定所约束，以促进数据在全球的共享，提高各成员国的科技水平。经济合作与发展组织（Organation for Economic Cooperation and Development，OECD）是由30个市场经济国际组成的政府间国际经济组织，旨在共同应对全球化带来的经济、社会和政府治理等方面的挑战，把握全球化带来的机遇[15]。

2.3.2 政策驱动共建共享模式

这种模式是指在国家法律法规政策的强制驱动下推进科学数据的共建共享。美国是这一模式的最早试验者。美国的《信息自由法》和《版权法》是这一模式的法律基础。并在1991年发布了以“完全与开放”科学数据共享政策为核心的“全球变化研究数据管理政策”，通过这一政策来促进科学数据共享，从而为美国的科学研究提供强有力的保障条件，确保其在21世纪国家发展和科技发展战略目标的实现。

2.3.3 主题合作共建共享模式

该模式是根据主题的不同来进行共建共享科学数据，建立专题科学数据库。如印度科学和产业研究中心（Center for Scientific and Industrial Research，CSIR）及肯尼亚的医学信息共享。肯尼亚医学研究机构（Kenya Medical Research Institute，KEMR I）通过编制肯尼亚医学机构研究和使用的数据和目录来实现彼此联系，共享资源[16]。我国的地球系统科学数据共享平台承担单位是中国科学院地理科学与资源研究所，中科院资源、环境领域的研究所，国内地学领域的知名高校共40多家单位，世界数据中心（WDC）和国际山地中心（ICIMOD），美国马里兰大学等国际组织和机构参与本平台建设与运行服务[17]。

2.3.4 地域协作共建共享模式

该模式把那些参与到共建共享科学数据的单位限定在某一个地理范围内，与国际间组织协调共建共享模式相似，前者范围相对小一些，一般限定在某个地区或是某国内，将共享资源集中存储在某一特定的地点，并在相关单位的共同管理和共同资助下运转共同建设。2004年，科学技术部和财政部整合“国家科技基础条件平台专项经费”“中央级科研院所科技基础性工作专项经费”“科技文献信息专项经费”三个专项经费，统一用于国家科技基础条件平台建设[18]。

2.4 共享管理机制

科学数据具有科学价值、经济价值和社会价值，并且易于复制传播和共享等特点，不同的科学数据由于其属性或是归属性的不同，需要采取不同的管理机制来开展共享工作。目前，国际上采用的共享管理机制有三种：保密性管理机制、公益性共享机制和商业化管理机制。

2.4.1 保密性管理机制

顾名思义，该机制对于科学数据的共享采取不公开的方式。一般这种机制设计到的科学数据是有关国家安全、个人隐私的数据信息，公开这些信息对于国家的安全、人民的生活都会产生很大的影响。同时，参与这些数据信息的开发和管理人员都必须与单位签订保密协议，以进一步确保信息的不泄露，国家情报部门与各个单位安全主管负责检查科学数据和信息的安全性执行情况，同时严格和明确地规定这些数据信息的保密管理。

nlc202309040905

2.4.2 公益性共享机制

此种机制是采用完全开放的方式来共享科学数据，其中的数据是指除了上述属于保密性管理机制数据之外的政府所拥有的信息和科学数据，包括标准数据库、科技成果数据库等。这些数据都应该依法“公之于众”，采用网站或是其它的方式来向社会完全开放，让公众获取，用户无需支付相关费用或是仅仅支付低廉的复制成本费用。像美国的海洋大气局、国立卫生研究院等联邦政府拥有和生产的数据，中国科学院地理科学与资源研究所产生的地球科学数据，整合、集成科研院所、高等院校和科学家个人通过科研活动所产生的分散科学数据。

2.4.3 商业化管理机制

对于那些完全是为了盈利而投资生产的科学数据，则采用商业化管理机制，对于此类科学数据的共享收取一定的费用。例如，美国政府批准了空间影像和数字地球两家企业从事高分辨率遥感数据的获取和发布业务，然后采取鼓励平等竞争的政策，通过市场竞争的方式降低数据价格，达到促进数据应用的目的，并同时通过税收进行调节和控制[19]。

3 国际科学数据服务平台分析

“国际科学数据服务平台”（见图1）（以下简称“平台”）启建于2008年，由中国科学院计算机网络信息中心科学数据中心建设并运行维护，面向中国科学院及国家的科学研究需求，逐渐引进当今国际上不同领域内的国际数据资源，并对其进行加工、整理、集成，最终实现数据的集中式公开服务。在保护国家安全，尊重知识产权的前提下，秉承完全开放的共享理念，尽可能为用户提供全方位的数据服务，包括在线数据浏览、数据搜索、数据访问与下载、软件工具及文档资料共享等通用数据服务，以及数据预定、委托查询、数据传递通道、在线模型计算、数据使用咨询等特色数据服务。

3.1 数据资源

国际科学数据服务平台收集的数据资源主要集中于地学、遥感、大气海洋等领域，引进了LANDSAT数据、MODIS数据、MODIS_L1B 数据、EO_1数据、DEM数据、NCAR数据等国际原始数据资源，采用国内外权威的数据处理方法或科学数据中心自行研发的数据处理方法对于上述数据开展了深度加工和数据模型的开发，形成了它们独具特色的一系列全国甚至全球领域的特色数据产品，面向多领域科研需求，基于通用的数据模型，充分利用本站超级计算资源，为用户提供可定制的数据产品加工，用户通过在线定制便可以得到自己需要的数据产品。

该平台期望能满足多领域的科研需求，但是资源集中在少数学科领域，深度加工的数据模型目前只限于少数几个，对于平台的宗旨来说有待发展。

3.2 知识产权保护

知识产权保护问题在共享工作的开展中被首先考虑到，国际科学数据服务平台的数据资源在进行镜像之前都和数据所有者进行了充分的沟通，并通过协议、合作或其他方式取得了对应数据的镜像权限，用户可以放心使用。用户复制使用平台中的数据，平台都做了详细的规定，在“完全与开放”的服务宗旨下，一方面尊重知识产权、保障数据作者和数据服务提供者的权益，要求数据使用者在发表成果时注明数据生产者及数据来源（国际科学数据共享平台http：//datamirror.csdb.cn/），未经网站允许，用户不能有偿或无偿转让在该平台获取的数据；另一方面，为了更好地推动数据共享，凡使用“国际科学数据服务平台”数据的用户，需要在一定期限内将数据所支撑的项目或论文产生的相关成果材料提交到“中国科学院计算机网络信息中心科学数据中心”，并允许平台发布部分可公开成果。通过这样的“交换”方式来提供更深层次的科学数据给用户，一方面也减少了不必要的重复劳动，提高了用户的使用效率。

3.3 服务内容

科学数据的共享离不开数据的再利用，该平台充分考虑到不同用户在不同情况下的各种服务需求，除了提供通用的数据服务，像在线数据浏览、数据搜索等外，还提供数据预定、数据传递通道、数据申请等人性化的特色服务，切实地提高用户使用满意度。

3.3.1 数据预订

用户通过网站对应入口预定可以查询，但是不能在线下载数据，数据服务人员将会根据用户的数据预定清单提供服务。目前，该平台开放“数据预定”功能的只有Landsat数据，用户可以通过数据列表或者数据搜索功能，产生数据预定清单，并直接通过网站入口提交给系统。用户数据预定的所有历史记录以及当前预定的处理状态和下载链接都可以从“用户空间”内查询。

3.3.2 数据申请

这种服务是针对用户不能通过网站直接查询、下载数据，或因数据量巨大，用户不方便通过网站查询、下载的情况，该平台支持用户提出相应申请，数据服务人员进行处理并将结果反馈给用户，一般用户可以根据自己的情况以及数据的需求选择在线数据申请或离线数据申请。

3.3.3 数据传递通道

该服务属于高级数据服务方式，是该平台为大宗数据用户或特殊数据用户开通的，指对于因为各种原因不方便通过网站直接下载数据的用户（比如网络连接受限，数据量过大，或者用户有其他特殊要求等），可以直接通过网站提供的联系方式提出“数据传递通道”的需求，审核通过后将会为用户开通特殊数据传递通道（比如用户特殊授权，光盘邮寄、硬盘直接拷贝等），以便用户及时获取所需数据。

3.4 共享方式

该平台将数据分成一级到四级不等，用户也分成四级到一级不等，虽然倡导“完全与开放”的数据共享服务方式，但还是根据用户级别的不同以及所需数据所属级别的不同，采用不同的共享方式。大部分镜像数据集数据产品向用户完全开放，无偿共享；少部分数据需要用户申请并达成协议后共享；属于三级的数据，则面对不同级别的用户，需要付费获取某些数据；另外，针对院内科研人员或高级用户，该平台还推出了特色定制服务，根据用户具体需求，通过项目合作的形式进行定制共享。

3.5 浏览方式

nlc202309040905

由于国际科学数据服务平台收集的数据主要集中于地学、遥感、大气海洋等领域，这些数据采用地图的方式来检索查询更为方便和精确，所以提供的数据检索以地图查询为主，目前只有LANDSAT数据还提供文字查询，地图检索方式比较简单，无须知道所查地区的具体地理位置，只要在地图上找出即可，操作简单直观，非专业人员使用也很方便，而文字查询方式则对于专业知识要求比较高，并且对于所查地区的详细位置信息要有清晰的把握。

4 结语

科学数据的共享关系到人类智慧的传承，有益于提高资源的利用率，减少不必要的重复劳动。科学数据的共享工作也是一个大工程，需要国家和政府的宏观管理，制定统一的标准和规范，也需要提高公民的共享意识，促进共享工作的开展。

参考文献：

[ 1 ] 中国科学数据共享工程技术标准[S/OL].[2013-05-10].http：//www.sciencedata.cn/pdf/2.pdf.

[ 2 ] 美国国有科学数据的“完全与开放”共享国策[EB/OL].[2013-07-01].http：//www.qiji.cn/scinews/detailed/838.html.

[ 3 ] 国际科学数据委员会[EB/OL].[2013-07-01].http：//baike.baidu.com/view/4640252.htm？subLemmaId=4640252&fromenter=%B9%FA%BC%CA%BF%C6%D1%A7%CA%FD%BE%DD%CE%AF%D4%B1%BB%E1.

[ 4 ] National Institute of Advanced Industrial Scienceand Technology[EB/OL].[2013-07-01].http：//www. aist.go.jp/index-en.htm.

[ 5 ] science and innovation investment framework 2004-2014：next steps[EB/OL].[2013-07-01].http：//www.hm-treasury.gov.uk./media/7/8/bud06-science-332v1.pdf.

[ 6 ] 科学数据共享工程[EB/OL].[2013-07-01].http：//www.most.gov.cn/ztzl/kjzg60/kjzg60hhcj/kjzg60jcyj/200909/t20090911_72832.htm.

[ 7 ] NIH.Final NIH statement on sharing research data release date[EB/OL].[2013-06- 29].http：//grants.nih.gov/grants/guide/notice files/NOT-OD-03-032.html

[ 8 ] Tenopir C，Allard S，Douglass K，et al. Data sharing by scientists：practices and perceptions[J/OL].PLoS ONE，2011，6（6）.

[ 9 ] 国家科技基础条件平台-中国气象科学数据共享服务网[EB/OL].[2013-06-30].http：//cdc.cma.gov.cn/gywm.do？method=getContent.

[10] 基础科学数据共享网[EB/OL].[2013-06-30].http：//www.nsdc.cn/pronsdchtml/1.aboutus.introduction/pages/3014.html.

[11] 韦之.著作权法原理[M].北京：北京大学出版社，1998.

[12] 朱雪忠，徐先东.浅析我国科学数据共享与知识产权保护的冲突与协调[J].管理学报，2007（7）：477-487.

[13] 刘闯.美国国有科学数据共享管理机制及对我国的启示[J].中国基础科学，2003（1）：34-39.

[14] Policy statements on data management for global change research[EB/OL].[2013-06-29].http：//www. gcrio.org/USGCRP/DataPolicy.html.

[15] 关于OECD [EB/OL].[2013-06-29].http：//www.oecdchina.org/about/index.html.

[16] 袁曦临. 信息资源共建共享模式及其理论基础研究[J].图书情报工作，2008，52（9）：102-105.

[17] 国家科技基础条件平台-地球系统科学数据共享平台[EB/OL].[2013-06-29].http：//www.geodata.cn/Portal/aboutWebsite/aboutus.jsp

[18] 国家科学数据共享工程-海洋科学数据共享中心[EB/OL].[2013-06-29].http：//mds.coi.gov.cn/bzjj.asp.

[19] 刘细文，熊瑞.国外科学数控开放获取政策特点分析[J].情报理论与实践，2009（9）：5-7.

杨友清南京大学信息管理学院2010级硕士研究生。江苏南京，210093。

陈雅南京大学信息管理学院教授。江苏南京，210093。（收稿日期：2013-08-15 编校：方玮）

大数据服务模型研究篇4

关键词：大数据,安全库存,库存预测,向量机

0 引言

库存是企业经营活动的基础。如何均衡库存管理成本、提高顾客服务水平,是库存管理的一个重要内容。传统的库存控制系统通常采用经济订货批量模型(Economic Order Quantity,EOQ)来决定每次的订货量[1],然而该模型建立在一系列的前提假设之下,忽略了需求、订货周期或供应的不确定性,所以得到的只能是一个近似的结果。国外主流的库存预测模型包括康兰蒙扎德模型[2]和皮普拉尼模型[3]等。国内学者和专家在认识到库存需求预测模型是解决库存管理问题较为实用的工具[4]后,提出库存预测模型是至关重要的一种实用性管理模型[5]。目前,在电力公司部门物资库存管理中,通常采用经验法,结合当年公司项目投资的规模安排物料库存,并安排相应的物资采购计划。但上述库存管理方法易造成物料库存虚高,大量物资长期无人领用,大量资金被占用的问题。为此,电力公司需要提高库存优化管理能力,按照公司对物料的需求,合理安排库存物料类别和库存水平,减少物资闲置,提升公司的资源配置能力,达到降本增效的目的。

随着计算机技术和信息处理技术的发展,各地电力管理部门建设了各种各样的信息化管理系统, 并积累了大量宝贵的数据资源。随着云计算、大数据、移动终端等现代信息技术的广泛应用,利用这些海量数据资源,从中挖掘出表征库存物资动态特征历史数据分布的原因及分布概率的内在有用信息, 提升电力公司在信息资源价值挖掘的整体水平,促进电力公司业务管理向更精细、更协同、更敏捷、更高效的方向发展已成必然。

针对传统库存预测方法的不足及库存自身特点, 本文引入支持向量机和相关向量机这一数据挖掘的新方法,建立物资消耗库存预测模型,引入机会约束规划方法进行安全库存决策,实现库存物资的动态预测。

1 安全库存预估模型

1.1 物资消耗情况预测模型

预估库存物资的需求是进行仓储优化的基础, 预测的基本架构如图1所示。其中SVM表示支持向量机(Support Vector Machine),SBL表示稀疏贝叶斯学习方法(Sparse Bayesian Learning)。本文采用基于SVM-SBL的联合概率式预测方法对各个周转库辖区的物资需求进行概率预测。图1中:训练数据集合1包括历史记录中中转站所辖区域内电网规模指标、健康度指标及其对应的物资需求记录等; 训练数据集合2包括SVM预测误差历史数据;预测输入数据1包括中转库所辖区域内电网规模指标、健康度指标等;预测输入数据2包括SVM预测误差历史数据;单点值预测结果为中转库所辖区域物资需求预测值。

本文基于SVM+SBL模型构建预测模型,基本原理如下。

1)SVM。SVM是一种基于核函数的机器学习方法,建立在统计学习理论的VC维(VapnikChervonenkis Dimension)理论和结构风险最小原理的基础上,被广泛应用于预测领域。SVM将低维空间的向量映射到更高维空间,这种映射可使复杂问题简单化(见图2)。在高维空间里建立最大间隔超平面进行数据拟合。在分开数据的超平面的两边建有2个互相平行的超平面,分隔超平面使2个平行超平面的距离最大化。最大间隔超平面如图3所示。图3中:2个支撑着中间间隔的超平面到中间纯红线的距离相等,此距离即本文能得到的最大间隔;“支撑”这2个超平面的点为支持向量,分析支持向量相关的数据即可进行函数拟合。

图 3 最大间隔超平面 Fig.3 Hyper plane of maximum margin

SVM的数学模型可表述为

式中:xi为训练集中的第i个输入向量;xin是输入向量;yout是根据输入向量xin预测得到的输出变量; Ki(?) 为核函数(一般采用高斯核函数);N是训练样本数;ωi是权值系数;ε是扰动分量。

预测过程为:利用给定的训练样本集 (xin,yin)={(x1, y1),… ,(xn, yn)} 优化求解模型的参数ω,建立输入向量与输出向量之间的映射关系,进而给定一个新的输入样本xi,能够得到对应输出变量的一个估计值yout,即预测单点值。

SVM模型预测有以下优点:1将问题转化为二次规划问题,理论上可以得到全局最优解;2建立在统计学习理论的VC维理论和结构化风险最小化原则的基础上,有效地避免了维数灾;3可以较好地解决小样本问题;4对非平稳时间序列具有稳定的预测能力;5模型具有较高的稀疏特性,大大提高了计算效率。

2)SBL。SBL也是一种基于核函数的机器学习方法,模型具有很好的稀疏性,其预测结果既包括期望值,又包括预测对象的概率分布。

SBL的回归模型形式与式(1)类似,但是其中的权重因子ωi被看做是均值为0且方差为αi的正态分布的随机变量,通过贝叶斯架构学习得到。所求的超参数αi多数趋于无穷大,则相应的权值系数ωi趋于0,剩余少数非零权值系数ωi的核函数所对应的样本向量即为相关向量,找到相关向量是本模型具有稀疏性的根本原因。

学习机的训练过程则是根据贝叶斯原则对参数w=[w0,w1,… ,wM]T、超参数α=[α0,α1,… ,αM]T进行推断,得到SBL预测模型公式。而实际上,由于yout仍然服从正态分布,参数训练结束后,根据模型可推断出其均值与方差,从而得到其概率分布函数。多个误差的高斯分布概率密度函数如图4所示。

SBL模型预测有如下优点:1能够提供概率密度预测结果;2模型训练简单,参数设置少;3模型稀疏程度与支持向量机相当或更好;4对非平稳时间序列进行预测,期望值预测精度和分布预测精度均较高。

1.2 安全库存决策模型

根据需求预测结果,建立物资安全库存决策模型。该模型是在机会约束规划方法基础上建立的。该方法用随机参数来刻画问题中的随机现象,属于随机规划的一个重要分支,适于求解不确定性问题, 是解决带有随机参数的优化问题的有力工具。

机会约束规划主要针对约束条件中含有随机变量且必须在观测到随机变量实现前作出决策的情况。考虑到所做决策在不利情况发生时可能不满足约束条件,上述模型采取了一种原则,即允许所做决策在一定程度上不满足约束条件,但该决策应该使约束条件成立的概率不小于某一置信水平。

机会约束规划可表示如下:

式中:是目标函数f(x,ξ) 在置信水平为β时所取的最小值;x是n维决策向量;ξ是随机向量, gj(x,ξ) 是随机约束函数,Pr{·} 表示 {·} 中事件成立的概率;α和β分别是事先给定的约束条件和目标函数的置信水平。

根据机会约束规划,原来建立的仓储优化模型如下:决策目标为计及时段内(如月、季度、年)的库存成本最小化,即

式中:T表示时段数;N表示仓库数;M表示物资种类;Ct,n,m和Rt,n,m分别表示时段t下仓库n存储物资m的单位成本和存储量。

约束条件包括库存物资满足需求的概率大于给定概率下限、各库库存容量约束和供货周期约束。上述约束分别为

式中:Dt,n,m和αt,n,m分别表示时段t下仓库n存储物资m的库存需求量和库存不足概率;Rt,n,mmax 表示时段t下仓库n存储物资m的最大允许库存。

求解时,将根据事先给定的置信水平,把机会约束转化为各自的确定等价类,然后用传统方法求解其等价的确定性模型。

2 安全库存预估模型在库存物料管理中的应用

为稳妥推进电力大数据应用试点研究与应用, 国网湖北省电力公司启动了物资库存物料动态特征分析工作(见图5)。基于ERP、电子商务平台 (Enterprise Commerce Platform,ECP)、电力生产管理系统(Power Production Management System, PPMS)、基建管控、仓储3D展示系统、营销业务等系统数据整合,利用数据关联分析技术,建立安全库存预估模型和多准则评价模型,构建库存物资在线监测和分析,实时发现库存物资在管理过程中存在的异动和问题,实现现有库存物资的优化。

基于安全库存预估模型预测的应用分以下3个阶段。

1)数据收集阶段,即基于对业务现状、系统现状、数据现状的梳理与分析,识别出项目实现过程中核心的业务问题,并将问题分类,理清上述问题是技术手段可解决的问题还是需人工分析可解决的问题。

图 5 物资库存物料动态特征分析平台 Fig.5 Dynamic characteristics analysis platform of the safety inventory

2)数据整合阶段,即通过对基础数据集进行数据抽取、清洗,对源数据开展关联、拆分、转换分析、特征分析、逆反工程等,确保业务数据集的准确性。

3)模型应用阶段,即根据出库信息、电网设备现状、项目规划等信息,建立物资消耗情况预测模型, 并应用于安全库存决策模型中。

国家电网公司采用安全库存预估模型进行集中采购6年来,年平均节约资金70多亿元,物资管控能力显著提升。2007年以来,采购总金额为10 620亿元,通过集中采购共节约资金830亿元,年均节约资金120亿元,节约占采购支出比高达7.3%。

3 结语

随着国家电网公司推进大数据研究与应用的要求以及技术变革的不断加速,在高标准的现代企业仓储管理要求下,电网公司应用大数据技术,缩短了库存物资存储周期,加速了库存物资周转,降低了仓储成本,提升了仓储管理效率和效益,具体价值体现在以下几方面:1实现了跨专业、跨系统、跨部门的海量信息共享;2通过汇聚、整体分析单独存在的海量数据,有效提高了物资仓储决策能力;3创新库存物资管理模式,提高了库存优化管理潜力;4有效整合数据,构建了系统化仓储数据体系。

大数据服务模型研究篇5

一要不断完善反腐败法律制度体系。制度问题带有根本性、全局性、稳定性，要通过废、改、立不断完善社会主义反腐败法律制度体系。要善于将党的反腐败主张和决策转化为人民的共同意志，通过国家立法将反腐败工作纳入制度化、法律化、程序化轨道。在十二届人大已将反腐败法列入未来五年立法规划的基础上，要就尽早着手、科学论证、开门立法、广聚民意，加快制定出台反腐败法、重大事项决策程序法、公共信息公开法、预防和处理公职人员利益冲突法、举报人和证人保护法等法律。要在罪刑相适应的原则下，进一步加大对腐败犯罪的惩罚力度。要做到预防与惩治、治标与治本，监督与查处、实体与程序、运作规则与一般程序并重。要加强党内立法与国家立法的协调配合。要对现行的法律法规和党内法规进行清理，过时的及时废止，不完善的要尽快制定实施细则，需要制定配套制度的要抓紧制定，切实提高法律制度的可行性、有效性，为制度刚性运行夯实基础。

二要大力培养反腐败的法治思维。人的因素是最重要、最具变化性的因素，只有大部分社会成员具备了法治思维，反腐败法律制度才能落到实处。因此要加强法治文化宣传和教育，在全社会涵养制度为要、法律至上的法治精神，努力提升法治理念。使全社会成员尤其是党员领导干部想问题、作决策、办事情都能体现法治精神，让“合不合法、合不合程序”成为一种惯性思维。要加强党员干部的党纪政纪法纪教育，组织干部学习法律，引导党员干部做到一切立身行事都以法律为准绳，自觉忠于法律、遵守法律，增强公务人员执法、守法自觉性。要旗帜鲜明地反对特权思想和特权现象，切实解决好侵害人民群众切身利益的现实问题，保障社会公平正义，使领导干部真正敬畏法律、敬畏民意、敬畏岗位。

三要依法监督保证法律制度刚性。木受绳则直，金就砺则利。法律制度的生命力在于执行，要通过不断深化反腐败体制机制创新，强化纪委的监督责任和监督的相对独立性、权威性，来确保制度执行到位、刚性运行。推进反腐败治理体系现代化。要加强对权力运行的制约和监督，盯紧领导干部手中的权力，使各级领导干部习惯在监督下工作，在法治轨道上用权，做到有权必有责、用权受监督。要深化改革，完善各领域办事公开制度，进一步畅通监督渠道，通过治方式引导和规范群众有序参与监督。鼓励实名举报，善于运用法治方式处理涉腐网络舆情，做到积极应对，正确引导。要进一步加强“三转”，依法加强监督检查，做到不错位、不越位、不缺位。要建立健全责任追究机制，对权力失控、决策失误、行为失范、以权谋私等行为，加大责任追究力度，切实维护法律制度刚性。

四要坚持使用法治方式惩治腐败。坚持有贪必肃、有腐必惩，把查处违纪违法案件作为纪检监察机关的基本职能，以零容忍态度惩治腐败，坚持“老虎”“苍蝇”一起打，做到党纪国法面前没有例外。同时必须要坚持用法治方式查办案件，坚守依纪依法安全文明办案这一原则。要坚持实体正义和程序合法的统一，健全办案制度、切实规范自由裁量权的运用，尊重和保障公民权利，保障被调查人的合法权益。要规范办案流程，正确使用“两规”“两指”措施，绝不能随意性执纪、选择性查处和越权违规办案。要充分发挥反腐败协调小组的作用，加强职能部门间协同办案、信息沟通、案件移送，做到“快查快结”。要严格遵守案件线索规范管理、办案安全事故相关人员的责任追究等工作制度。要细化办案标准，做到事实清楚、证据确凿、定性准确、量纪恰当、手续完备，使查办的每一个案件都经得起历史的检验。

五要打造过硬队伍提高法治能力。要按照打铁先要自身硬的要求加强纪检监察队伍建设，切实防止“灯下黑”，提高纪检监察干部运用法治思维和法治方式开展工作的能力，推进反腐败治理能力现代化。要强化教育，进一步增强纪检干部的法纪意识，夯实以法治思维和法治方式反对腐败的自觉性和坚定性。要建立健全考评制度，定期对纪检监察干部进行法律知识考核，并运用好教育考核结果，重视提拔使用法治思维意识强、善于用法治方式开展工作的干部。要强化管理，促使纪检监察干部进一步树立“没有安全就没有办案，违反审查纪律就是违反政治纪律”的底线思维，严格执行和落实各项制度和规定。要强化监督问责，对苗头性、倾向性问题及时提醒、坚决制止，对不适合纪检监察工作的人员坚决调离，以零容忍态度坚决查处纪检监察干部违纪违法问题，发现一起、查处一起，决不姑息、决不袒护、决不手软，用铁的纪律打造过硬的纪检监察干部队伍。

“明者因时而变，知者随事而制”。腐败是人类社会发展历史上最大的毒瘤，而法治是人类目前为止发现的最好的社会治理方式，是治疗社会弊病的良药。纪检监察机关只有坚持用法治思维和法治方式来谋划工作，才能在依法治国的时代背景下，融入到推动国家治理体系和治理能力现代化的时代旋律中去，为国家富强、民族复兴作出应有的贡献。

大数据作为时下最火热的IT行业的词汇，随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。

对于大数据的整理和分析能够为企业的发展提供有效的帮助 1）使国有企业产品更符合消费者需求

消费者对于大部分产品是基于自身需求去消费买单，而不是被动的去消费企业生产的产品，如果通过大数据来分析并设计消费者的需求的产品，那生产的产品更符合市场的需求，从而更贴切消费者的对于产品的体验。

2）帮国有企业锁定目标客户

通过大数据技术，可以帮助企业对客户资源进行精准锁定。在企业正常的运营过程中，客户资源的挖掘方式、具体情况和分布情况等，企业都可以进行搜集分析，形成基于企业的资源分布可视图。3）帮国有企业提供更好的推广方案，提高有效转化率

大数据分析提供不同品牌市场数据之间的交叉对比，确定客户上网的习惯、信息的主要话题，以及相关媒体平台曝光量，使企业的运营方向将会变得直观且容易识别，在品牌推广、区位选择、战略规划方面更有把握，从而选择更适合企业的营销活动平台、推广方向，提升企业运营效果。

4）帮国有企业危机预警

在国有企业的发展过程中，有可能会出现一些关于安全问题、经济问题、市场问题等问题，大数据分析可以通过数据挖掘和语义分析等技术，对敏感信息数据源进行判断，并对危及企业品牌的信息通过电话、短信、APP、微信、邮件等方式第一时间通知给用户。分析预测危机爆发的可能性和危机传播的烈度、趋势和走向，为企业的危机解决方案提供了决策的依据。

在大数据时代，国有企业通过网络技术创新，让国有企业通过互联网平台获取有效的大数据及其分析功能，让国有企业有效把握市场变化，借助互联网技术拓宽发展渠道，提高企业利润，增加收益。世纪是一个快速发展、充满变革的伟大时代，它带给了我们很多便捷和惊喜，尤其是随着移动互联信息传播方式的突飞猛进，以互联网、手机、微信、微博等为代表的新媒体时代，已经“扑面而来”。新媒体作为具有时代创新标志性意义的传播载体，给人们生产、生活带来了极大方便，拓宽了人们的视野和信息渠道，丰富了人们的精神文化生活，也成为思想文化的新阵地以及宣传思想工作的新渠道和新手段。在这一新形势下，如何应用好新媒体，创新企业新闻宣传工作是当前企业宣传工作的一项重要课题。

近年来，中国电科x所顺应网络新媒体的发展规律，开放思维、潜心摸索，开通“天奥微视点”公众微信订阅号、创建企业QQ群、微信群，通过创新企业宣传新理念，与订阅用户的互动沟通，不断提升了新媒体影响力和感染力，主动探索利用新媒体做好基层宣传思想工作的做法，取得了一定效果。

一、利用新媒体做好国有企业宣传工作的意义

当前，媒体格局和舆论环境较为复杂，企业员工及社会大众思想认识高度多元化，企业宣传工作任务艰巨。只有充分运用新技术新媒体，才能迅速占领信息传播制高点，使其更好地为企业生产经营发展服务，为企业思想工作服务。在市场经济高度发达的今天，国有企业宣传工作早已从单一的发挥舆论导向作用，向着展示企业形象、宣传企业品牌、营销企业产品关注舆情动向、凝聚企业文化及员工向心力等方向立体扩展。基于这种思路，新媒体作为企业面向外界的窗口，可将其定位归纳为面向对上、对外、对内三个方向的受众群体。对于国有企业而言，对上是指中央企业总部、国家及省市政府机关、行业主管部门等，企业自身经营的微信公众号成向上级机关报送信息的重要途径，有利于企业加强与上级机关的沟通交流，争取政策、资金、项目等资源的支持。对外指可利用新媒体进行企业的品牌及产品营销，方便用户了解公司实力及产品，提高公司的知名度和辨识度，为公司开拓外部市场提供助力。三是对内凝聚人心，塑造企业向心力。报纸等纸媒体出版周期较长，由于保密要求或地域限制，企业员工并非每个人都能随时登陆内部网站，导致企业的文件精神、重大事项不能即时传递到每位员工。智能手机的普及及企业新媒体的运营，则极大地解决了这一问题，更加有助于企业文化的传播。

二、利用新媒体做好国有企业宣传工作的具体做法

（一）内容为王，增强用户粘度

新媒体具有十分显著的特征，比如分散化、草根化、个性化、即时性、互动性、族群化等。用户主体地位大大提升，可以根据自己的喜好或需要选择、定制信息，可以在任何时候、任何地点接受或发布信息，可以通过“社区”、“群组”、“圈子”等非正式群体进行群聊、评论和话题分享。新媒体植根于互联网，用户可随时关注、随时取消，来去自由，并且以朋友圈、转发等二次传播方式为主要信息传播手段，这就决定了以有特色，有深度、能聚焦的主题内容吸引用户是新媒体经营的主要方法。在内容选题上，可总结梳理如下：企业本身简要介绍；高级别领导、用户来企参观访问的新闻报道；企业重大投资、改组、市场合作、管理改革等经营进展情况；企业在技术专业及产业化领域获得的最新科研突破、基金项目申请立项、企业资质认证情况等成果；企业对外签订的大额订单，或与重要用户或合作方签订的战略合作协议；企业研发的新产品发布会，参加或举办的大型展览会等市场推介活动；企业需要向外界宣传并提高知名度的，在技术或市场领域有突出贡献的技术专家、先锋团队等典型人物；企业有助于提升自身对外形象，增强外界好感度的大型企业文化建设活动，社会责任活动等。

（二）把控话题，对外做好品牌营销

新媒体既然面向社会大众，在选题时应紧跟社会热点，把公众当前关注的舆论话题尽量与企业自身的研发领域、产品相结合，达到聚焦并吸引关注度的目的。比如可结合国家领导人出访时的着装、手机、国礼赠品，从而把舆论焦点导向企业品牌；结合国家嫦娥、神州系列载人航天工程、北斗产业发展取得的阶段性成就，有相关配套设备及系统的企业则可深入挖掘，借势开展有关本所企业的深度报道。此外，在报道时间节点上也有潜力可挖，比如在春节、五

一、国庆等把目光聚焦于外场出差人员，在七一建党节前夕开展党员先锋团队报道，在每年岁末集中开展“年终回顾”系列主题稿件梳理企业一年来取得的成就，企业的周年庆典等都可以收到良好效果。

（三）传递行业资讯，对内成为员工学习之窗

除了外部宣传、打造品牌的作用之外，对于军工科研院所，新媒体还有一个独特的作用不容忽视——这就是成为员工了解社会有用资讯的信息之窗。军工科研院所员工长时间只能登陆内部保密局域网，要登陆互联网查阅国家企事业改革、国家科技创新扶持及基金政策、北斗应用、智慧城市等行业信息需要经过繁琐的审批手续，信息相对封闭。而社会上各类信息五花八门、浩如烟海，很难有为高科技科研院所量身定做的此类信息专刊；如果将其逐一经过保密审批导入到局域网，工作量则相当繁重。此时可将企业信息按涉密程度做有效区分，对于非密类的政策、行业、专题类资讯则可借助企业建设的QQ群、微信群、微博、公众订阅号等新媒体向企业员工定期推送转发，天长日久，则可开拓企业员工视野，拓宽思路，提高工作技能，成为员工学习提高的有益工具。

（四）精耕细作，总结实操技巧

此外，在具体经营新媒体时，还有一些实战操作小技巧：鉴于手机屏幕较小，因此内容须简洁，篇幅不宜过长；鉴于手机用户注意力集中时间短暂，甚至有人只看标题，因此题目务必抓人眼球，导语应以“一句话新闻”的形势精炼全稿内容；为了充分发挥新媒体优于纸媒的优势，微信号可以“一图看懂„„”的形式多发图片新闻，或结合音诗画效果发视频类动画类新闻；为了保持用户的持续关注，必须保持一定的发送频度，一周保持2-3次为佳；一般而言单条发送的关注度比多条发送的效果好；稿件要以情动人，以人物、故事、新闻等“软文”形式“润物细无声”地侧面反映企业文化、精神风貌，比直接用“硬广告”形式推广企业生产的系统产品和设备效果要好„„等等。

（五）把控底线，避开敏感“雷区”

新媒体作为植根于互联网的新型宣传形式，如果题材敏感或获得关注度，会以雪崩式速度在网络上发酵或被无数次转发，一旦发布后续状态基本不可控。因此中央企业在开展新媒体宣传时有两条底线不能触碰：一是保密原则，在涉及到国家敏感项目时必须经过保密部门批准，把握宣传的口径和界限；二是作为国有央企必须承担社会责任，保持一定的舆情敏感度，与党和政府的的舆论主基调保持一致。同时，互联网容量无限，“人过留形，雁过留声”，十年前的帖子和宣传材料都有可能被翻出来“算旧账”，因此最忌夸大其词、虚假宣传、前后矛盾，必须本着严谨求实的态度进行客观报道。对于没有确实把握的题材，宁缺勿滥。

(六)创新机制，培育新媒体宣传人才

新媒体作为一种新生事物，目前仍在蓬勃发展和快速变化之中，其运作经验也仍在不断的梳理、归纳和总结。因此，企业在组建和培养新媒体宣传人才队伍时，同样具有一些新特点：一是用新媒体手段培育新媒体人员。可组建责任编辑群，大家把各自收集比较好的公众号、文章、媒体形式等进行汇总讨论，开阔视野，增长见闻，总结得失；二是鼓励创新，建立容错机制：企业主管领导和部门应抱容耐心和宽容的心态对待这一新生事物，在把握“三条底线”的前提下，对于形式、行文风格、表现手段等应等多鼓励创新，即使一时效果不佳，也不要一棍子打死。三是具有足够的激励机制。除了专业宣传人员外，可以以一定的激励机制多吸收企业其他部门内思想比较活跃的年轻员工参与新媒体宣传工作，使新媒体宣传的内容更加丰富、形式更加活泼。

近年来，据国家统计局数据公报，手机移动端客户群体已经达到40161万户，互联网上网人数达到6.18亿人，其中手机上网人数5.0亿人。微信作为重要的交流信息的平台软件，已经越来越普及，甚至在功能上更加优越于qq、论坛、微博，具有传播速度快、覆盖面广、关注度高、影响大等特点，面对如此强大的功能特点，国企纪检监察工作的创新手段可以充分利用微信公众平台，搭建企业微信服务号，打破传统媒体的信息发布弊端，全面提升国企纪检监察工作的效率。

一、使用微信公众平台的重要作用

微信是2011年兴起的通讯服务手机端免费应用软件，可以通过网络快速的进行发送免费语音短信、视频、图片和文字，由于微信具有较强的互动性和开发性，在人们日常交际生活中被广泛的应用。国企纪检监察警示公众在微时代的背景影响下，进行了深化改革，在国企与职工之间的沟通上，通过微信公众服务平台进行纪检监察方面的工作开展，有利于拓宽沟通渠道，改善教育引导手段，促进决策科学化、民主化。

（一）加快了信息传递的速度

纪检监察工作者通过微信公众平台可以实时推送纪检监察警示方面的信息，打通更多的信息渠道，将信息及时有效的发送到职工手机微信客户端，便于职工阅读。同时对于国企突发性事件，国企还可以通过微信公众平台将最权威的信息第一时间发布给职工，提高了国企应对应急事件的效率性。

（二）丰富了思想政治工作的宣传手段

微信公众平台的功能非常强大，不仅可以通过文字和图片进行发送纪检监察方面的信息，还可以通过语音、视频的形式进行沟通，将企业动态、文化信息更加生动有效的推送给职工，使纪检监察工作开展的更为丰富多彩。

（三）有利于增强企业与职工的互动性

微信公众平台是一个较为开发的交流平台，国企纪检监察工作者积极与职工通过微信公众平台继续交流，主动了解职工工作、生活中遇到的问题和困难，职工也可以通过微信公众平台匿名提出自己的意见和建议，为国企发展建言献策。

二、利用微信公众平台做好国企思想政治改革的举措

（一）高度重视微信公众平台的影响力

国企纪检监察工作者要有较强的时代认知度，要紧随时代的发展步伐，对纪检监察工作进行不断的改革创新，丰富纪检监察工作的传播工具。从微信在人们手机端的普及率来看，5亿多的微信客群是不可多的信息传播平台，国企纪检监察工作者要高度重视微信公众平台的影响力，摒弃传统媒体的传播弊端，利用微信公众平台，加强信息发布的及时性，坚持以人为本的原则，在纪检监察宣传内容上要紧贴职工的工作实际，如可以在微信平台上发布高品质的、能够引起职工共鸣的服务信息，转发与职工切身利益密切相关的专业信息。

（二）微信宣传内容编辑短信精悍、涉及面广

国企纪检监察工作是企业文化宣传的重要阵地，其宣传的内容极具指导性，传统的纪检监察工作内容过于枯燥，文章繁冗过长，不利于职工阅读。对此，国企纪检监察工作者可以利用微信公众平台编辑短小精悍的思想政治宣传内容，如可以编辑一些预防腐败，安全工作等方面的警示内容，短小精悍的微信内容可以实时发送到每位职工的手机上，对于身处一线的职工而言，在阅读方面更为便捷，大家随时都可以查阅学习，对广大职工廉洁从业，重视安全起到了潜移默化的作用。

（三）建立微信国企服务号，增加互动性

国企纪检监察工作者可以建立微信国企服务号，制定纪检监察方面的宣传栏目，摒弃传统的黑板报画廊、橱窗等传统媒体的传播手段，在微信服务号中可以坚持“每周一报”的形式覆盖传达所有国企职工的进行纪检监察的警示宣传，通过文字、图片、视频、动画等丰富多彩的形式第一时间传达公司声音、重大生产经营动态、公司方针政策等，扩大和拓展思想政治工作的广度和深度，提高思想纪检监察的针对性和实效性；还可以在微信服务号成立“微社区”，鼓励职工积极踊跃的在“微社区”中留言，“微社区”为国企职工提供更为宽松、畅所欲言的交流互动场所，职工可以匿名留言，提出自己的意见和建议，达到凝聚人心、激发斗志的良好效果，进而在全公司营造出团结、紧张、活泼的企业文化氛围。

三、结语

大数据服务模型研究篇6

关键词大数据信息服务模式高校图书馆

分类号 G252

DOI 10.16810/j.cnki.1672-514x.2016.02.003

Research on the Development of University Library Information Service Model in the Era of Big Data

Wang Hao， Liu Bing， Zhang Linlin

Abstract In view of big data and information service mode， from the perspective of "four elements"， this paper expounds the evolution of the mode of information service under the environment of big data， discusses the ideas and Strategies of the construction of the new information service mode.

Keywords Big data. Information service mode. University library.

2012年美国奥巴马政府宣布推出的“大数据研究和发展计划”，对全球知识的创新和信息服务的形式产生了重要的影响。2013年被称为“大数据元年”，IT 业界从新的视角将“大数据”视为重要的战略资源，提出了发掘“大数据”资源、开发“大数据”技术、应用“大数据”技术引领时代转型等的重大时代命题。面对“大数据”时代的新机遇与挑战，图书馆界已经感受到了信息环境的转变和信息服务工作的巨大压力，应当如何适应环境、借势而上、立足潮头？本文以大数据和信息服务模式为视角，从信息服务模式的“四要素”入手，深入研究大数据给高校图书馆信息服务模式带来的影响和发展方向，初步探讨了如何构建基于大数据的新的信息服务模式。

1 大数据与信息服务模式的内涵

1.1 大数据的内涵

随着计算机、网络技术全面融入现代社会生活，信息的积累由量变引发了质变，最先经历信息爆炸的学科——天文学和基因学，率先提出了“大数据”的概念[1]。事实上，“大数据”并不仅仅包含技术和数据，而是由于不断增长的数据量和数据种类而逐渐衍生出来的一种现象，因此，目前“大数据”在业内并没有统一的定义，但对大数据的描述和特性在学术界存在着这样的共识：大数据是数据来源多种多样的体量巨大的结构化、半结构化、非结构化的需要专业人士利用新的技术去实时感知、获取、管理，获取价值，以服务的庞大的数据集合。具有种类（Variety）多、速度（Velocity）快、容量（volume）大、价值（value）大的“4V”特征。舍恩伯格认为，大数据的核心价值是预测，是把数学算法运用到海量的数据上来预期事情发生的可能性。他在著作《大数据时代》中认为，大数据既是一种技术，更是一种思维，并重点讨论了关于大数据的3个思维变化：（1）不是随机样本，而是全体数据。（2）不是精确性，而是混杂性，尤其是大数据的简单算法比小数据的复杂算法有效。（3）不是因果关系，而是相互关系。大数据思维可以初步概括为规律性、无偏性、关联性和开放性4个特征[2]。

1.2 信息服务模式的内涵

信息服务是以信息为内容的服务业务，它从社会现实出发，以充分发挥信息的社会作用、沟通用户的信息联系和有效组织用户信息活动为目标，以“信息运动”各环节为内容的一种社会服务。其服务对象是对服务具有客观需求的社会组织和社会成员。通过对信息服务定义的分析，我们可以得出，信息服务的构成要素有四个：服务主体（信息服务的提供者）、服务客体（信息服务的需求者）、服务方式（信息加工、组织、服务的方式）、服务内容（所需求的知识信息）。关于模式的定义，《汉典》中给出的解释是：事物的标准样式。百度百科中指出，模式就是解决某一类问题的方法论，每个模式都描述了一个在的环境中不断出现的问题，然后描述了该问题的解决方案的核心，通过这种方式，可以无数次地使用那些已有的解决方案，无需再重复相同的工作，并且模式具有领域性。综合分析前述关于信息服务、模式的定义，笔者认为，研究信息服务模式的关键就是要研究信息服务的组成要素，及抽象、总结、概括这些要素之间的相互关系。

2 大数据环境下高校图书馆信息服务模式的演变

2.1 大数据对信息服务模式要素的影响分析

2.1.1 提高服务主体的服务技能

大数据时代，高校图书馆员需要具有较高的信息服务技能，除了要具备图书馆专业知识外，还要具有敏锐的信息意识，一定的学科背景，较强的信息加工处理能力，以便为读者提供更为准确的信息服务。目前高校图书馆界的信息服务，大多是根据信息服务人员的经验进行主观判断，也就是定向性预测。而大数据时代，将催生信息数据预测分析师这类新的专业技术岗位，预测分析是通过建立数学模型，发现数据与实物之间的相互关系，准确客观的预测事物的发展方向，以提供解决方案。总之，高校图书馆员的总体信息服务能力会随着大数据时代的要求而不断提高。

2.1.2 细化服务客体的信息需求

在信息急剧增长的今天，读者的信息需求越来越具有个性化特征，大数据技术的应用，使得图书馆可以通过分析用户的注册信息、实时操作、过程数据、群组讨论内容、信息利用行为等实时、动态非结构化的数据，更加精确地了解读者个性化信息需求的动机和偏好，以实现对读者信息需求的精准定位和预判。

nlc202309042115

2.1.3 扩宽服务方式

大数据环境下，信息数据已经成为社会的核心资产，数据传递、信息共享，已经成为信息服务的重要组成形式，由于大数据的动态配置和应用，图书馆的信息服务方式也呈现出多元化的合作方式。主要表现在：

（1）业务的外包与众包。信息社会，信息资源正在向着虚拟化方向发展，资源获取和利用更加倾向选择合作与分享，以实现信息资源和服务的柔性配置，发挥规模效益。因此，信息服务的外包与众包已经成为新的、重要的服务方式。外包和众包的不同之处在于，前者是外派给确定的个体，而后者的任务和问题是外派给不确定的群体。但它们的好处都在于：企业或者机构可以充分利用网络资源，借助外部的智慧，节约大量的研发成本与管理费用。例如，数据库的管理与服务的外包、系统管理软件的开发外包等；著名的网络免费百科全书“维基百科（Wikipedia）”是德国国家图书馆运用众包的理念招募志愿者，志愿者的主要任务是校对百科全书中的人物姓名和提供权威文件记录，与全世界的志愿者的合作，使得维基百科不仅仅是一部传统意义上的百科全书，更重要的是使其成为记录人类历史的、革命性的团队协作行动[3]。

（2）协同创新。“协同创新”是指创新资源和要素有效汇聚，通过突破创新主体间的壁垒，充分释放彼此间“人才、资本、信息、技术”等创新要素活力而实现深度合作。协同创新的特点主要有两点：一是创新生态系统中的各种要素是有机集合而不是简单相加，其存在的方式目标功能都表现出统一的整体性；二是创新主体之间要发挥各自的能力，优势整合，互补资源，实现各方的优势互补，创新生态系统必须不断动态变化[4]。当前，信息服务产业正处于互相渗透、互相融合、根据各自优势重新组合、重新分工的阶段。图书馆应认清社会化分工，联合其他信息服务的提供者（包括图书情报机构、信息提供与服务商、任何发布信息的机构及个人等）遵循协同创新的理念，为读者提供智能化、范在化、一体化、云状化、个性化为特征的信息服务。

2.1.4 创新服务内容

高校图书馆的传统信息服务内容，一般可分为三大部分，一是书刊借阅、文献传递、事务性咨询等；二是通过检索性、参考性文献或者系统向读者提供课题检索、学科导航、用户教育等在内的科技信息咨询为主的服务；三是根据用户需求，社会特点，提供参考性咨询等专题情报服务。

大数据时代的到来，催生出了一些新的信息服务内容，如：（1）对信息知识的新编，即图书馆通过新的载体方式，与服务手段，使读者去发现新的知识。例如：浙江大学医学院图书馆通过人体的骨架，让读者点击不同器官，来调阅与器官相关的书和文章。（2）数据信息的管理。数据密集型学科领域里面的科学研究，必须要对海量的数据进行信息分类、抽取要点和发现关系，来揭示隐性的知识结构，图书馆可以充分利用大数据技术，帮助科研人员进行相关数据、信息和知识的关联、回溯、保存等，以减轻科技人员的负担，使之能够集中精力进行科学研究。（3）对事件进行预测，人工智能、数据挖掘、分析等大数据技术使得信息能够快速的转变为知识，来指导决策和行动。

笔者认为，根据对信息虚拟化程度、挖掘程度、知识创新程度的不同，由低到高，可以把高校图书馆当前的信息服务分为四个层次，依次为第一层（基本层）即对用户最基本的信息需求的满足；第二层（延伸层）即图书馆形成自身服务特色的关键业务工作；第三层（期望层）即用户选择服务后，期望能够得到的服务；第四层（潜在层）即图书馆需要进一步实现的知识信息服务（如图1所示）。

2.2 大数据时代高校图书馆信息服务模式发展方向

由前述大数据对信息服务模式“四要素”的影响看，我们不难发现，大数据时代的信息服务模式具有以下特点：信息服务功能强大，服务方式多样，服务内容丰富，强调资源共享，协同创新，强调对读者个性需求的满足等。根据这些特点，其发展导向主要有以下几个方面。

2.2.1 个性化服务

大数据时代，图书馆有更多的方式和机会去了解读者和读者的信息需求。要想为读者提供理想的个性化服务，必须掌握两点：一是通过对新型资源（博客、社交网站等动态、非结构化数据）、休眠数据（系统内未被使用和发现的数据）、高价值数据的分析与挖掘，充分了解读者的个性，为读者提供他们想要的信息和服务；二是合理地掌控和设计服务的个性，把数据表现相同的读者分为一类，个性化分散的单位可大可小，大到一个有同样需求的读者群体，小到每一个读者。但过于分散的个性化服务，会增加图书馆的服务成本和管理的复杂程度，所以要合理掌控和设计个性化服务。

2.2.2 集成服务

互联网、大数据技术的发展，使得信息服务与资源建设加快了向开放、互助、资源共享的方向发展，开展集成服务有利于图书馆围绕用户的信息需求，借助于网络信息技术以及信息服务联盟，在各图书馆与文献保障系统之间对文献信息资源进行统筹规划，使可获取利用的信息资源能够最大程度的涵盖学校的各个学科专业，并可以重点保障学校重点学科、博士点学科的信息资源需求，以实现馆藏信息资源的“投入—产出”比率最优。

2.2.3 知识服务

大数据知识服务是一种基于网络（包括电信网、广播电视网、互联网、移动互联网等）的智能化、泛在化发展趋势而衍生的，用以解决结构化、半结构化及非结构化数据多维度处理的现代信息服务新模式，是嵌入式协作化知识服务模式的一种新发展[5]。大数据知识服务模式强调读者的参与、强调知识、能力、资源和过程以服务的形式进行有机融合，并基于网络自由流通，以实现大数据知识服务体系中的知识动态协调构建、能力智慧管理、资源按需使用、过程智能控制，满足读者急剧扩张的知识服务需求。

2.2.4 智能化服务

百度百科对智慧的定义是：智慧是指对事物能迅速、灵活、正确的理解和处理的能力。图书馆智慧化服务是指利用大数据相关技术，进行快速的、自动的对复杂动态数据的收集与处理，分析判断用户的信息需求趋势，了解需求动态，研究需求规律，将用户潜在的信息需求转化为现实的信息需求，将隐性的知识显化，使信息的价值得以实现。并从管理与运营系统全局层面，保证管理决策、资源分配、硬件与软件建设、技术选择的科学性，确保信息服务的高效、灵活。

nlc202309042115

3 基于“四要素”的大数据信息服务模式构建思路与对策

3.1 思路

思想是行动的指南，正确的理念是高校图书馆提供优质信息服务的保障。图书馆要针对大数据对信息服务模式要素的影响，遵循信息服务的新特点和发展方向，全面审视、更新办馆思路和观念，用大数据的思维去重新定位信息服务工作。要在遵循“以信息安全为前提、以满足读者需求为目标、以实践探索为途径、以人才培养为保障”的思路下，对管理体制、组织结构、工作流程和激励机制等方面进行全面改进，使之有助于在关键技术、平台开发、标准规范等方面实现应用创新，建立信息服务的新模式，即馆员的工作要变“被动”为“主动”、对读者的服务要变“整体”为“分散”、服务方式要变“自足”为“共享”、服务内容要变“静态”为“动态”。

3.2 对策

3.2.1 多途径提高馆员的信息服务水平

高校图书馆员业务素质在很大程度上决定着信息服务的水平和质量。目前与大数据密切相关的信息链接技术、智能推送技术、数据仓储技术、数据挖掘技术、数据分析技术等正在快速发展，信息服务体现出的交互、智能、个性化等特点，都对馆员的知识结构和综合素质提出了更高的要求。图书馆员要能将大量原始、初级、杂乱无章的“数据”，转化为清晰地表达出一定含义的“信息”，继而根据读者的信息需要提取出有价值的“情报”并应用于实践[6]。所以，图书馆必须加强馆员的培训力度，扩展培训途径，通过学习、探讨、考核、外引、内培等多种方式，让馆员普遍接受以数据应用为核心的工作方式。建立一支业务素质过硬、创新能力强的高素质信息服务队伍。并要在服务的过程中，加强与读者的互动交流、重视反馈信息，深入开展对读者心理、行为、习惯、干扰因素等问题的研究，进行换位思考，站在读者的立场去认识、感受、体验、评价所开展的信息服务。

3.2.2 通过素质教育培养读者的信息素质

信息素质教育包括信息意识、信息能力和信息道德三个方面，信息素质教育有助于提高读者的信息意识，唤起读者尚未表达出来以及未意识到的潜在信息需求和潜在读者应该利用而实际上未利用的信息服务；其次，有助于促进读者与图书馆之间的互动，密切联系，使读者对图书馆的服务有更深层次的认识，从而及时得到相应的服务；最后，信息素质教育将大大提高读者的信息处理能力，优化知识结构和提高决策能力，并能够使读者增强信息安全意识、遵循信息使用的伦理道德。

3.2.3 建立以大数据为核心的信息服务方式

大数据的4V特征，决定了要开展以大数据为核心的信息服务，必须打造先进的基础设施，构建良好的数据处理和知识共享环境，开发关键业务和规范服务流程。主要措施包括：（1）建立高效的分布式信息网络，数据存储、数据管理平台，提供硬件基础设施保障。（2）根据应用实际，开发科学的数据分析挖掘软件系统，提高数据的收集、挖掘、分析、决策的能力。（3）将“大数据”看作关键资源，开展新的服务形式。（4）从“大数据”的价值出发，去寻找新的合作伙伴，强化信息集成服务，开辟数据交流与共享的渠道。（5）利用“大数据”进行服务流程优化，缩短服务响应时间，提高服务效率。

3.2.4 利用大数据创新信息服务内容

图书馆要利用大数据之间的相关关系，核心价值（预测），调整思维、关注新的重点服务领域，不断深入与创新信息服务的内容，主要有：（1）加强读者研究，对交互数据进行分析，通过建立数学模型，开展精准服务、知识关联服务，提供预测性信息服务产品。（2）重视对新型资源的收集，通过对读者行为习惯的数据挖掘、分析，判断预测可能发生的信息行为与需求。（3）利用大数据的时效性，监控大数据动向、动态定位、收集、分析处理高质量信息，为客户提供问题解决的方案。（4）关注和融入社交网站，扩大图书馆的受众面，实时了解读者的需求，围绕读者喜好，收集整理信息资源，并提供专项服务，提升图书馆在读者个人文化生活中的作用和影响。

参考文献：

[ 1 ] 维克多·迈尔·舍恩伯格，肯尼斯·库克耶.大数据时代：生活、工作与思维的大变革[M].盛杨燕，周涛，译.杭州：浙江人民出版社，2013.

[ 2 ] 和婷.大数据思维对图书馆信息服务工作的启示[J].图书馆建设，2014（1）：64-68.

[ 3 ] ANDERSO M. Four crowd-sour cing lessons from tie Guardian's （spectacular）expenses-scandal experiment[EB/OL].[2012-06-10].http：//www.niemanlab.org/2009/06/four-crow dsour cing-lessons-from-the-guardians-spectacularexpenses-scandal-ex perim ent/.

[ 4 ] 陈劲，阳银娟.协同创新的理论基础与内涵[J].科学学研究，2012（2）：161-164.

[ 5 ] 秦晓珠，李晨晖，麦范金.大数据知识服务的内涵、典型特征及概念模型[J].情报资料工作，2013（2）18-22.

[ 6 ] 邓爱华.大数据时代来临，你准备好了吗？[J].科技潮，2012（9）：55-57.

王浩黑龙江八一农垦大学图书馆副研究馆员。黑龙江大庆，163319。

刘冰黑龙江八一农垦大学图书馆馆员。黑龙江大庆，163319。

张淋淋黑龙江八一农垦大学图书馆馆员。黑龙江大庆，163319。

（收稿日期：2015-07-08 编校：邹婉芬）

大数据服务模型研究篇7

关键词：NOSQL,融合,存储模型,Mysql

1 引言

随着互联网的不断发展, 各种类型的应用层出不穷, 尤其在云计算时代, 对数据存储提出了更新、更多的要求。关系数据库长期以来在数据存储方面占据了不可动摇的地位, 但关系数据库有其扩展困难、读写慢、成本高、有限的支撑容量等天生的限制, 在解决新的海量数据存储需求时, 显得力不从心, 于是推出了新类型的“No SQL”数据类型, NOSQL可以弥补关系数据库在数据高并发地读写和海量数据存储的要求。

2 NOSQL与关系数据库融合的研究现状

在大数据迅猛发展的今天, 从关系数据库到NOSQL数据库, 有一个必不可少的环节, 那就是数据的过度和迁移[1]。在数据迁移过程, 需要对历史数据清洗、转换、并装载到新系统, 在这过程中面临着人工、数据安全、运维等潜在的危险, 在数据迁移后还面临着操作方式的转换等难题。NOSQL和关系数据库能融合的存储数据, 企业和数据管理者就可以免去这一风险。

目前关于NOSQL与关系数据融合的研究已经有了一些成功, 2011年Mysql关系数据库5.6.2版本推出了memcached功能, 他可以使得开发人员更加方便使用NOSQL和关系数据库, 可以直接在Inno DB之上提供NOSQL功能和Mysql共存。随后的第二年, Mysql又推出了Handler Socket的出现, 性能是Memcached的两倍时, 速率居然可以达到750000qps。接着Handler Socket成为No SQL领域谈论的焦点之一, 大量的人开始想要尝试, 并做过一些自己的性能测试。

Handler Socket可以直接提供No SQL的功能, 但是他没有和MYSQL一起发布, 可以通过Percona-Server来使用。My SQL关系数据库目前很关注NOSQL领域的应用, 在My SQL5.6.2版本中增加了Memcached协议, 同时也支持文本和二进制协议, 能更好处理Cache模式, 省去开发过程中使用Memcached来缓存数据, 并能更好的数据的可靠性和一致性。在开发过程中, 程序员既可以高效的使用Memcashed协议来操作数据, 同时也可以使用sql语句进行复制的查询操作, 使得No SQL和My SQL能有效的灵活的存储、查询数据。

3 No SQL与My SQL融合的优势

No SQL与关系数据库的融合, 在大数据环境下对数据存储带来很大的优势。以Mysql的Handler Socket为实例来说明。

支持大量的查询模式:Handler Socket支持主键/唯一性查询, 非唯一性索引查询, 范围扫描, LIMIT和INSERT/UPDATE/DELETE, 不支持未使用任何索引的操作, multi_get操作 (类似于in (1, 2, 3) ) -通过单一网络往返获取多行数据-也是支持的。

可以处理大量并发连接:Handler Socket连接是轻量级的, 采用了epoll () 和工作线程/线程池架构, 因此你可以建立上千或上万的网络连接, 稳定性不会受到任何影响等。

极好的性能:Handler Socket相对于其它No SQL阵容性能表现一点也不逊色, Handler Socket能在一台普通服务器上可以执行750000+次查询。

更小的网络数据包:Handler Socket协议和传统My SQL协议相比更简单, 更小, 因此整个网络的流量也更小。

没有重复的缓存:采用Handler Socket插件访问Inno DB存储引擎, 记录可以缓存在Inno DB缓冲池中, 这样其它SQL语句就可以重复使用它。

保证数据一致:由于数据只存储在一个地方 (Inno DB内) , 不需要在Memcached和My SQL之间检查数据一致性。

崩溃安全:后端存储是Inno DB, 它是事务性和崩溃安全的, 即使你设置innodb-flush-log-at-trx-commit!=1, 在服务器崩溃时也只会丢掉<1秒内的数据。

可以从My SQL客户端使用SQL:在许多情况下, 人们仍然希望使用SQL, Handler Socket仅仅是一个My SQL插件, 你可以从My S QL客户端发送S Q L语句, 当你需要高吞吐量时最好使用Handler Socket协议。

My SQL所有操作都将受益:Handler Socket在My SQL内部运行, 因此所有My SQL操作, 如SQL、在线备份、复制、通过Nagios/Enterprise Monitor监控都是支持的, Handler Socket可以使用普通的My SQL命令监控, 如SHOW GLOBAL STAUTS, SHOW EN-GINE INNODB STATUS和SHOW PROCESSLIST等。

不需要修改/重建My SQL:因为Handler Socket是一个插件, 它支持My SQL社区版和企业服务器版, 无需对My SQL做出任何修改就可以使用。

独立于存储引擎:Handler Socket可以和任何存储引擎交互。

4 结语

随着互联网与移动的流量呈现出爆发性的增长以及开源软件日趋成熟, No SQL数据库的得到了企业青睐, 登上了数据库的舞台。它虽可弥补关系数据库在扩展困难、读写慢、成本高等天生的限制, 但它绝不可能完全替代关系数据库在应用方面的优势。No SQL与关系数据结构融合就是未来数据库发展的趋势。

参考文献

[1]菜金花.浅谈NoSQL的应用.电脑知识与技术, 2011 (4) :35-36.

[2]沈姝.NoSQL数据库技术及其应用研究.南京信息科技大学, 2012 (6) :78-80.

[3]申德荣, 于戈.支持大数据管理的NoSQL系统研究综述.软件学报, 2013 (5) :42-44.

[4]姚林, 张永库.NoSQL的分布式存储与扩展解决方法.计算机工程, 2012 (3) :163-166.

日本大数据技术服务现状研究篇8

日本对ICT(Information and Communication Technolo-gy)产业的发展一直非常重视。早在1999年日本就颁布了被称为“IT基本法”的《高度情报通信网络社会形成基本法》(高度情報通信ネットワーク社会形成基本法),并在法律中确定将ICT作为日本未来发展的重心,赋予了ICT产业极高的战略发展地位。大数据技术的发展作为ICT发展的重要一环,同时也是需要高度发达的ICT产业基础支撑的行业,同样也作为发展重点而被日本政府高度重视。

日本在大数据技术服务方面的研究应该说着手早、起点高、保障充分,总体来说其水平的确走在了世界的前列。根据日本情报通信综合研究所研究报告中的数据[1],日本国内大数据流通量(流通量=企业数*每个企业产生的大数据元数据量)在从2005年的1 556PB上升到2013年的13 516PB。同时,大数据的市场需求也呈现着高速增长态势。对于未来的发展趋势,失野研究所[2]给出了市场规模预测。从预测结果来看,在未来的五年内,大数据技术服务产业的产业规模还将维持目前的高速增长态势。同样,在日本政府《ICT白皮书》(平成24年版)中,也对大数据技术服务在日本不同领域应用所产生的提升管理效率、创造附加价值等经济效果进行了预测,其结果如表1所示[3]。

数据来源:《ICT白书(平成24年版)》第一部-第一节,作者整理。

从以上数据可以看出,无论是日本政府的智库还是民间智库对未来大数据技术服务市场都抱有一个比较积极的预测,这些预测结果导致日本国内对于大数据技术服务产业投入了高度的重视。

2 日本对于大数据技术服务的主要类型

为了提高信息通信领域的国际竞争力、培育新产业, 同时应用信息通信技术应对抗灾救灾和核电站事故等社会性问题,日本总务省于2012年7月新发布“活跃ICT日本”新综合战略。根据同时发表的《ICT白皮书》中公布的数据,日本的大数据技术服务业目前主要包括大数据技术在以下几方面的具体应用(表2)。

大数据技术的主要应用(部分)

大数据技术服务在不同的领域会用到不同类型的数据。在某些行业如旅游、公共交通业还有可能会利用到两类以上的数据。例如在赴日旅游外国人动向的研究[5]中,相关部门就利用了GPS信息、社交网站信息、会员信息和网页信息等综合考察了赴日外国人的旅游习惯和旅游动机。

根据日本文部科学省的战略统筹安排,日本在接下来的一段时期主要会拓展大数据技术在实际中的应用。跨领域、跨学科的大数据应用将是日本未来ICT战略的至关重要一环。

通过对日本大数据应用领域的观察不难发现,目前日本大数据技术的发展主要有两条路径:一条路径是对于盈利前景比较大的商业咨询、物流网、消费者行为报告等业务通过企业自发完成。从收集信息到建立平台的整个过程,由政府对关键课题的研发进行资助,打通技术瓶颈,并由企业独享开发成果;另外一条路径是由政府提供的数据源,建立“OPEN DATA JAPAN”等数据平台并资助科研院所对于该数据进行合理的广泛的应用。通过开展产、学、研的广泛合作,最终使全社会共享大数据技术带来的经济效益和社会效益。

3 日本大数据技术服务产业未来的发展趋势

目前,大数据技术服务产业在日本正在处于一个高速的发展期。日本社会各界对于大数据技术服务产业未来的发展充满了期望。但是,对于产业的未来仍然有很多潜在的不确定性。具体来说,日本大数据技术服务产业发展主要面临以下的难题:

3.1在大数据提供的过程中对个人隐私的保护不足

大数据技术服务产业相关的法律目前仍然是空白。现存法律中,对于“无个体特征的数据”的收集和使用并没有明确的限定,但是,在日本就曾经有“コネクトフリ” 公司在提供免费的无线热点的同时在后台未经许可采集使用者社交网络账号的行为。大数据技术服务产业本身确实重要利用个人生活和履历,但有可能会侵犯个人隐私。如果不能对大数据产业的数据利用做出合理的限制,不能考虑作为数据源的“人”的意见,无疑是不道德的甚至是不合法的。

3.2 大数据产业相关人才的培养和选拔机制缺失

虽然早在1997年,大数据概念就被提出来,但在技术上真正实现还是在2010年前后,大规模的应用更是在近三年才正式开始。由于大数据技术服务需要涉及信息技术、网络技术、数据处理等多种技能,对于大数据人才的培养短期之内难以满足日益增长的需求。培养、选拔机制的缺失导致日本大数据技术服务产业人才严重不足,显著影响大数据相关产业的发展。

3.3 大数据技术服务的质量监督机制及监管缺位

传统数据分析要求数据源统计标准统一、统计方法可靠、数据来源可信,大数据技术作为传统数据分析技术的继承和发展自然也对元数据有着较高的要求。但是, 由于整个行业才刚刚起步,尚不存在行业协会或者统一的监管机构,这就使得大数据产业监管缺位,服务提供商的服务水平参差不齐。对于这类中小型大数据技术服务提供商服务水平的监督及经营过程的监管缺位将影响整个行业在社会上的信誉。在这些方面,日本未来的改进方向主要是:结合大数据的特征完善现有法律;多手段多渠道发展大数据技术、促进数据处理人才培养;明确大数据技术服务监管主体、细化大数据技术服务标准等。

4 日本大数据应用经验对我国的启示

根据《国家中长期科学和技术发展规划纲要(2006年-2020年)》的精神,大数据技术服务产业作为“以应用需求为导向,促进传统产业的改造和技术升级。”的关键产业应该得到优先发展。根据《中国大数据技术与服务市场2012-2016年预测与分析》[6]中的预测,中国大数据技术服务市场规模将增加至6.17亿美元。整个行业发展空间巨大。与之形成对比的是,目前在我国大数据技术服务商的综合服务水平百强排行榜[7]中,前15名都是国外企业,即使在五十强里面也仅有10家中国企业。不断发展壮大的国内大数据技术服务市场既对政府监管部门提出了新的要求,也对行业内的中国企业提出了新的挑战。为了保障我国大数据技术服务产业健康发展,加快培育我国大数据技术服务产业企业的核心竞争力,我们可以针对日本在大数据技术服务提供产业中所遇到的问题及早布局,减少某些尚未暴露出的行业发展问题对行业发展潜在的威胁。具体来说,我国可以在以下几个方面建立健全产业发展政策,促进大数据技术服务产业健康有序发展。

4.1 完善相关法律,建立健全元数据的采集监管体系

在元数据的采集上要考虑数据产生者与数据采集者双方的利益诉求,通过对数据采集者“推广普及大数据知识、确保元数据采集手段的透明性、确保元数据提供者可以使用全部数据、用正确的手段获取元数据、承诺合理利用数据、承诺数据安全性”等的强制执行消除元数据提供者的不满情绪。提供一元化的监管模式,由一个部门直接对口负责监管,减少行业从业者的负担。在提高元数据公信力方面,由国家科技管理部门建立健全全国性的数据统计标准并推广,由地方政府和行业协会确定各个地区、行业的数据统计标准并在辖区内推广,并由国家建立权威数据实时发布平台,确保社会创新主体能够及时、低成本地获得高质量的、权威的元数据。

4.2 通过多种渠道培养、吸引大数据人才

在大数据人才全球性短缺的大背景下,为了保障行业发展所需人才,应该采取培养加引进两手抓的模式。在解决短期人才不足问题方面,可以在政策上鼓励大数据技术服务提供商开设面向社会的大数据培训课程,建立公共培训平台和人才交流平台,促进大数据人才有针对性地进行自我教育;在解决长期结构性人才缺失方面, 可以在国内高校中设立相关科目甚至相关专业,培养一支基础扎实、素质过硬、既能够了解大数据理论又有实践能力的大数据人才队伍。

4.3 积极开展国际、国内交流,及时了解全球最新大数据技术服务动向

大数据服务模型研究篇9

关键词：大数据,数字出版,服务模式

大数据、云计算、物联网、移动互联等一系列新兴技术的广泛应用,使得全球数据量呈现前所未有的爆炸性增长,也让海量、复杂、多结构数据的即时获取、精确分析、深度挖掘成为现实,为数字出版行业的服务模式带来重大变革。

一、大数据的定义与特征

大数据(Big Data)描述的是随着数据量和数据类型激增而逐渐衍生出来的一种现象,不仅包括大规模的体量、多样化种类的数据集,还包括对这种数据集进行高速采集、处理与分析以提取价值的技术架构与技术过程。

麦肯锡全球研究所(Mc Kinsey’s Global Institute)将大数据定义为大小超出常规的数据库工具获取、存储、管理和分析能力的数据集[1]。这个定义得到普遍的认同。具体来讲,大数据具有4V的特征———Volume(数据体量巨大)、Variety(数据类型繁多)、Velocity(处理速度快)、Value(价值密度低,商业价值高)。

大数据之所以可能成为一个时代,在很大程度上是因为这是一个可以由社会各界广泛参与的社会运动,而不仅仅是少数专家学者的研究对象。种种迹象表明,大数据时代已经到来,数字出版产业已经深受大数据技术发展的影响。

二、大数据为数字出版服务模式带来的变化

1.准确的推送服务。目前,数字出版的选题策划和推送服务往往没有考虑到读者需求,而是根据出版机构所提供的内容资源进行推送。在数字阅读领域,通过对用户行为大数据的全面分析,数字出版机构可以掌握读者的阅读行为趋势和偏好。数字出版凭借大数据技术,将各类数据进行有效处理、精准编辑后,形成为不同阅读目的服务的个性化、多样态的出版物,并可以准确地将图书推送到真正需要它的读者手中。甚至可以设想,在开放共享的大数据分析服务基础上逐渐形成具有系统自组织性的数字内容主题策划。

2.多介质的资源服务。目前的数字出版所提供的资源形态相对较为单一,一般是文字或者图片,且资源之间的关联没有很好地建立起来。大数据环境下,需要聚合优质资源提供给用户。优质资源也可能不是正式出版物,可能是来自很多渠道的各种介质的由“草根”创作的有瑕疵的东西,这就需要编辑加工将其提纯,把这些内容从一般性资源变成优质资源。根据用户的阅读需求,将传统的编、印、发模式变为利用数字出版技术、信息技术、知识挖掘技术、大数据分析技术,快速完成资源的进化,实现知识的提纯,内容的关联,资料的拓展和链接,综合文字、图片、音视频、动画、软件模拟、数值模拟等多种形式的多媒体学习与研究产品,为用户提供多介质、立体化、动态化的资源服务。

3.深层次的知识服务。在大数据的影响下,数字出版将改变以往以书、文献等为单位的粗放型生产模式,转而形成以知识要素为单位的数据化生产模式,强调科研全过程发表,新知识传播,跨学科、跨行业、多角度应用,以及多媒体展现。数字出版2.0 模式应该是大数据出版,数字出版机构将从出版图书变为出版数据,并提供深入的知识服务,帮助读者解决从数据到知识的转变。大数据时代,大数据帮助出版社解决问题,为读者提供更专业的服务。若出版者非研究者,在面对很多需要回答的专业问题时,往往难以确定选题,甚至不知道该怎么出版。对于传统出版方式下出版者和作者都无法解决的问题,需要通过大数据的方式将海量资料提供给人们作为研究的素材,为深入的研究提供工具。

4.细粒度的个性化服务。大数据时代,数字出版机构利用大数据技术,基于系统通过分析读者阅读行为、喜好,从而获得对用户需求的感知,为读者建立灵活的个性化档案。灵活性表现在大数据技术能够自动监控读者行为的变化情况进行分析,自动调用不同层次、类别的数据智能式推送给读者,为实现细粒度个性化服务提供了可能。大数据对读者最大的好处是个性化需求得到满足,参与感、互动感得到增强,这些显然会大幅度提升读者阅读体验。

三、数字出版行业的大数据应用对策

1.树立基于大数据的出版理念。数字出版行业必须从战略的高度认识到大数据时代已经到来,未来数字出版只有融入时代发展大势才能随之成长。数字出版企业应重视各类数据的搜集、整理、分析和应用,数据驱动型决策比重将不断加大。大数据时代出版的商业模式必须真正从消费者的角度来思考问题[2],消费者需求被置于前所未有的高度,数字出版产业内的业务流程和企业组织结构均会围绕积极而灵敏地响应消费者需求进行相应调整。数字出版需要放弃以往单纯以内容增值为目标的二次出版模式,强调在真正理解内容的基础上,修订、补充、追加知识,深入挖掘各类用户的需求,把出版看成是对用户提供知识服务的过程。

2.组建掌握大数据技术和分析能力的团队。大数据并不是一个充斥着运算法则和机器的冰冷世界,仍需要人类扮演重要角色[3]。身处大数据时代的数字出版企业一方面需要对自身已有的数字产品、运营数据库进行相应调整,另一方面需要实现企业内部现有网络运营平台和社交媒体的对接,这就要求从业人员应具备较高的技术素养。较高的技术素养、强大的数据分析能力、深谙数字出版业务和市场运作成为这一时代对数字出版人的要求。因此,需要现有从业人员更新知识结构,同时还要培养新型人才,才能推动出版产业的创新升级。

3.调整数字出版业务流程。大数据时代的数字出版业务流程也将发生变化。“用户需求导向”将成为数字出版业务流程设计的指导思想。数字出版业务流程将在新技术的支撑下更加贴近、深刻理解并及时响应消费者需求。数据分析在数字内容创意之前就成为整个业务流程中的首要环节,而且以数据分析结果为依据进行决策贯穿整个业务流程的始终。数字出版企业的业务流程平台均可直接与互联网联结,通过与消费者的互动、协作、创新来实现数字内容产品的个性化定制[4]。

大数据服务模型研究篇10

关键词：中间件,Web服务器,数据库

基于中间件的Web数据库服务作为一种基于HTTP协议标准的多层Client/Server数据库服务模型模式, 其基本框架如图所示。

中间件负责管理Web服务器和数据库服务器之间的通信并提供应用程序服务 (功能层) , 它能够直接或间接调用外部程序或脚本代码来访问数据库, 因此可以提供与数据库相关的动态HTML页面, 或执行用户查询并将查询结果格式化成HTML页面, 通过Web服务器返回给用户浏览器。

根据中间件的功能和结构以及数据库连接技术的不同, 目前存在着多种Web数据库服务模型。最基本的中间件技术有通用网关接口 (CGI) 、应用程序编程接口 (API) 接口以及Web_DB技术产品。

一、CGI技术

通用网关接口CGI, 及其改进产品Fast CGI, 可以作为上图中的中间件, 允许Web服务器执行外部程序, 通过外部程序来访为数据库等外部资源, 以产生HTML文档并返回Web服务器。这一方案的优点是易于实现, 用户可以明用浏览器, 暗用数据库。用户在Web页面上交互式填查询表, 即可通过Web进行异地数据库存取, 并在浏览器上显示结果。缺点是当中间件为CGI时, 每次访问都需要重新启动一个CGI程序实例, 它以进程形式运行, 占用资源较多, 效率较低, 且难于解决连续事务处理。

二、API技术

为了克服CGI局限, 一些Web服务器厂商开发出专用的API, 允许开发人员编写程序来扩充服务器的功能, 如Microsoft的ISAPI、Netscape的NSAPI等。与CGI相比, API应用程序与Web服务器结合更紧密, 占用的系统资源也少得多, 而其运行效率却大大得到提高, 同时还能提供更好的保护和安全性。

然而, 如果纯粹依赖于API实现数据库访问, 开发API应用程序也要比开发CGI程序要复杂的多, 而且, 由于各种API之间兼容性很差, 缺乏一个统一的业界标准, 因此应用程序往往还只能工作在专用的Web服务器甚至操作系统上。

三、Web_DB技术产品

如上所述, CGI和API有一系列缺点, 这些缺点造就了Web数据库的商业机会, 各公司竞相出台Web_DB技术产品。根据实现技术不同, 又可以分为以下几种:

1. 提供数据库产品的CGI接口

这类技术通常为数据库产品及其开发工具提供专用的CGI程序接口, 将开发人员从繁重的CGI编码中解放出来, 从而提高开发效率。如用于Microsoft Visual Fox Pro的Fox Web。这类技术并未克服CGI的局限。

2. 提供支持数据库访问的API接口

这类产品在Web服务器的API基础上, 提供数据库的访问接口, 在客户端采用VBScript、Java Script、Java Applet、Plug-in等技术实现动态Web应用。目前这类产品最丰富, 应用也比较成熟。如Microsoft的IDC、Borland的Web Broker、Sybase的Web.SQL和Web.PB等。

3. 提供专用的Web服务器, 捆绑数据库服务

如Oracle的Web Server能和Oracle7/8数据库系统无缝结合, 使应用程序具有较高的运行效率。但难以连接其它数据库系统。

这些技术和产品各有特色, 其中很多中间件产品在充分兼容CGI标准和利用API技术的基础上, 还引入了扩充的HTML标集合服务器端的程序或脚本, 并允许建立包含扩充标记和脚本的HTML页面模板;而在响应用户的请求的同时, 则通过转换这些特殊的标记和执行相应的程序或脚本来完成数据库的访问, 同时生成动态的HTML页面返回给用户。

但我们也注意到, 大多数的Web_DB技术产品是由Web服务器或数据库厂商开发的, 很少能够做到同时兼容不同的操作系统、Web服务器和数据库系统, 并且又具有较好的开发和运行效率。

在实现基于Web的医学影像数据库检索服务时可采用Allaire公司的Cold Fusion, Cold Fusion也属于Web_DB技术产品, 但是由于Allaire属于第三方开发商, 使得Cold Fusion能够很好地独立于操作系统、Web服务器和数据库系统。

参考文献

[1]王继成等编著:Web应用开发原理与技术[M].　机械工业出版社, 　2003年4月

[2]刘伟等编著:CGI技术全面接触[M].　清华大学出版社, 2001年8月

大数据服务模型研究篇11

关键词：大数据；数字档案资源；微服务

随着大数据时代的到来，无论对个人还是企事业单位以及社会乃至整个国家和世界，数据都已成为一种资产、一种宝贵的财富。而数字档案馆的档案资源作为人类社会最精华、最宝贵的一种资产和财富，也将在大数据时代发挥其文化传播和信息服务的作用。本文就数字档案馆应用大数据的技术和理念探讨一种新的信息服务方式——微服务。

1 大数据概述

维基百科定义大数据是：由数量巨大、结构复杂、类型众多数据构成的数据集合，是基于云计算的数据处理与应用模式，通过数据的整合共享，交叉复用形成的智力资源和知识服务能力。[1]尽管目前大数据还没有统一定义，但对其存在一个共识：大数据不是对数据量大小的定量描述，而是一种在种类繁多、数量庞大的多样数据中进行的快速信息获取和应用。

1.1 大数据的种类及特点。大数据的类型大概包括以下几种：（1）数字化数据：扫描并借助光学字符识别转化而成电子形式的传统文献数据，其主要存在于国家和地方的档案、图书等文献数据资源库中；（2）自然数据：即直接形成用于计算机和数据处理系统的数据，其主要存在于应用程序、管理平台、交易系统、数据库、电子邮件、公众网络、社交媒体及GPS定位系统中；（3）模拟数据：是从物理世界中发散出来但可以不断被转化成数字格式的，其主要存在于手机、相机、摄像设备、传感器以及可穿戴设备中。[2]以上数据以实时、迭代的方式不断产生、转化和融合。

大数据的特点从理论角度可以概括为“4V”：大量（Volume），数据从TB跃升到PB甚至是ZB；多样（Variety），数据来源多和数据类型多；价值（Value），单个有价值的数据比例越来越小，但庞大的数据量蕴含巨大价值；快速（Velocity），数据增长速度快，数据处理速度快。从实践角度可以概括为“三性”：全体性，收集和分析更多的数据去分析和解决问题；混杂性，从大量混杂的数据中判断某种大的方向；相关性，利用大数据背后的相关性分析现状和预测未来。

1.2 数字档案馆已具备大数据的基本特征

（1）数字档案馆的信息资源总量庞大且增长迅速。2013年6月8日，江苏省档案局副局长张姬雯介绍江苏省截至2012年底共存储数字档案资源总量为33TB，[3]如果推算到全国大概接近1PB，所以，全国数字档案馆的信息资源总量已经是一个庞大的数据集。2013年3月3日，国家档案局局长杨冬权在提交的《关于随馆藏数量增加而相应增加各级国家档案馆人员编制的提案》中提到：2011年省、地、县三级国家档案馆馆藏总量比1987年馆藏量增长了5倍，而到2020年将比1987年增加近10倍，[4]可见数字档案馆的信息资源总量增长速度也比较快。

（2）数字档案馆的信息资源与大数据在内容价值上是相互交叉的。一方面，数字档案馆的信息资源是大数据的重要组成部分。因为数字档案资源最重要的特点是有机联系，而大数据的主要特点也是相关性，因此，本身即存在有机联系或存在潜在联系的数字档案资源是大数据极其精华的一部分。另一方面，大数据又可以划归为数字档案资源的理论范畴内。因为大数据也是国家机构、社会组织或个人在社会活动中直接形成的各种形式的信息记录。如：手机运营商掌握的人们实时通信记录，金融行业掌握的国家、机构和个人资金交易记录，网络服务商掌握的人们各种社会交往、交流记录，监视器留下的人们行动的信息记录……这些都是大数据内容，而从“大档案”观的角度看，这些大数据又是数字档案资源的组成部分。

（3）数字档案馆的信息资源在形式类型上像大数据一样更加复杂多样。过去的数字档案资源类型主要是档案数字化后形成以数据库为载体的结构化数据；而大数据时代非结构化数据大量产生，如：各种格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息，等等，这就使得数字档案资源的类型越来越复杂多样且难以管理。

2 大数据时代数字档案馆微服务的基本范畴

笔者所提的数字档案馆微服务是相对于传统档案服务在大数据时代的一种全新服务方式，其内涵可以概括为：借助于全媒体信息、高速网络和移动通信等技术充分挖掘数字档案馆特有的文献资源，为用户提供细微化、个体化、差异化的利用服务。微服务与传统服务的区别在于：传统服务是“我提供什么，你就接受什么”的以档案部门为主体的服务，微服务则是“你需要什么，我就提供什么”的以用户为主体的服务。数字档案馆微服务的基本范畴包括：

2.1 个性化服务。传统档案服务侧重于宏观层面的整体服务，服务模式是普适的、大众的，对微观层面的个性化需求考虑较少。微服务是将档案用户细分为每个个体，通过短信提醒、信息推送等方式为个体用户提供满足个人工作、学习、生活等多种个性化需求的功能性服务。个性化服务体现在三个方面：一是实现数字档案信息服务时空的个性化，即用户可以随时随地获取其所需的档案信息；二是实现服务方式的个性化，即根据用户个人的利用习惯和利用方式来开展数字档案信息服务；三是提供个性化的服务内容，即根据不同用户的需求，结合用户的个人背景和需求特点，有针对性地使用户能获其所需，得其所要。[5]

2.2 专题化服务。专题化服务是档案信息的主要服务方式，如针对重大活动、重大事件、重要文化宣传、重要民生问题等，通过有针对性的收集、整理和编研形成专题成果来提供服务。微服务中的专题化是对传统档案专题服务的有益补充，它是针对当前数字信息越来越繁杂和多元，用户难以从浩如烟海的信息中完全获取有用的信息，尤其是散状分布、稍纵即逝的微内容。因此，档案人员根据某一专题对数字档案资源进行检索、挖掘、整序、定制和筛选，形成相对集中有序、细化的专题知识数据，方便用户随时获取。

2.3 特殊化服务。传统档案服务主要是借助纸质档案和老照片的借阅和展示以及对档案数字化后的数据库进行脱机或联机检索。而现今如平板电脑、电子阅读器、手机等逐渐成为主流利用载体，因其易用性、便携性、多样性等优点，深受广大青年用户喜爱。因此，开发针对新型载体的服务平台，提供独具档案馆特点的内容服务，实现与平板电脑、手机等利用载体的无缝对接，这将对数字档案馆服务产生创新性的改革。目前，国内已经有档案馆利用WAP网站或APP实现丰富灵活的档案信息服务，这些服务可以向移动终端用户提供馆藏资源查询、珍品推荐、历史探究、在线展厅、利用案例、档案信息动态等服务内容。

2.4 差异化服务。不同年龄、不同职业、不同教育背景的用户，对档案信息的需求有着较大差异。因此，面对这些水平各异的用户如何满足其差异化的需求既是档案馆服务的重点也正符合微服务的初衷，微服务本身的特殊性决定了它能够为各种类型的用户提供不同的服务。例如，针对普通民众的民生问题提供婚姻档案、房产档案服务，针对涉案人员关于知情权和证据凭证问题提供政策信息和档案凭证服务，针对学者、研究人员关于历史研究和文化传承问题提供历史档案、档案文化服务，针对科技人员、工程人员关于经济建设和城市发展问题提供科技档案和城建档案服务，等等。而且不同的人针对同一问题会有不同的需求，所以，为不同需求的目标用户群提供差异化服务也是今后数字档案信息服务的主要方向。[6]

3 大数据时代数字档案馆微服务的实现途径

2011年9月27日，国家档案局局长杨冬权在全国档案宣传工作会议上强调：“注重发挥各种新兴媒体的宣传作用，比如动漫的形式、网络视频的形式、手机短信的形式、电视滚动字幕的形式、户外电子屏信息的形式、电子书的形式、微博的形式等，从而拓展宣传形式、手段和载体，占领新兴媒体阵地，进一步丰富和创新传播渠道，吸引更多的宣传受众。”[7]

由此可见，微博、微信、短信、电子书、社交网络等新媒体形式既是档案宣传的新途径，也将是数字档案馆微服务的新途径。

3.1 微博服务。微博作为一种网络上分享、传播和交流信息的平台，其在信息发布、网络营销、政府管理以及个人交流等诸多方面都得到广泛应用和发展，而且微博在泛内容、大众化内容的基础上，开始涌现出一些垂直化、精细化的内容，对于用户个性化需求满意度逐步提升。2014年7月21日，第34次《中国互联网络发展状况统计报告》显示：截至2014年6月底，我国微博用户规模为2.75亿；其中手机微博用户数为1.89亿，占所有微博用户的68.7%。[8]目前，越来越多的档案馆通过开通官方微博向社会公众提供方便快捷的档案服务，微博服务已逐渐成为数字档案馆微服务的主要途径之一。

通过开通微博，数字档案馆可以将档案馆的使命、目标、愿景等传达给用户，也可以将档案馆的活动动态、馆藏信息、文化教育、服务项目等发送给用户，拉近档案馆与广大公众的距离，提高档案信息服务的范围和质量，进而提高社会的档案意识；另外，通过微博，档案馆人员之间可以就工作中的问题进行交流，共享信息，增强协作，共建信任，为更好地服务社会创造条件。目前，较有影响和特色的档案馆微博有：“苏州档案”、“银川档案”、“抚顺档案”等。

3.2 微信服务。微信是腾讯公司于2011年推出的一个为智能终端提供即时通讯服务的应用程序，它支持跨通信运营商、跨操作系统平台通过网络快速发送语音、视频、图片和文字等功能，目前国内用户已超5亿。基于庞大的用户群体，在数字档案馆服务中应用微信这类新兴的信息传播和共享平台，既可以改善档案服务过程中的弱互动性，还可以提高档案信息服务的共享性和智能化水平，微信服务也将成为未来数字档案馆微服务的重要途径。

档案馆通过建立微信公共平台，有利于提高档案信息服务的关注度，通过对进出档案馆或附近的目标人群定位，即可“一对一”式主动致以问候；利用微信公共平台可以较大范围地绑定用户群，从而更好地掌握用户需求；通过微信公共平台的自助服务，用户可以随时了解所需信息，有利于提高用户的自主性和自发性活动，从而从根本上提高档案服务的个性化水平。[9]目前，山东省档案馆、天津泰达图书馆档案馆、海盐档案馆等已开通了微信公共平台。

3.3 手机短信服务。短信作为手机最传统、最基本的功能之一，至今一直是人们进行信息交流的有效工具，而这一服务也正好迎合大数据时代人们对档案信息“短、平、快”的需要特点。手机短信服务主要内容包括：档案信息咨询、档案信息发布以及个性化短信服务。档案信息咨询是用户将自己所要查阅或咨询的问题以短信方式发送到档案部门，档案人员首先根据系统预先设定的常见问题提供解答，然后对未能解答问题进行分析和整理，最后将相关信息发送给用户；档案信息发布是将档案方面的新闻动态、政策法规、重要活动等以短信形式发送给用户；个性化短信服务是用户根据需求定制自己感兴趣的档案信息，档案人员可以定期或不定期将这些信息发送给用户。

3.4 在线咨询服务。在线咨询（又称“在线客服”）是新一代的网络商务即时通讯系统，它以网页为载体，为网站访客提供方便快捷的交流方式。在线咨询已经在消费、服务、医疗、通信、金融等行业有了较为成熟和普遍应用。尽管目前国内很多档案部门已经在网站首页设置了档案咨询功能，但绝大多数都是静态和滞后的。而微服务的理念即是倡导用户参与，只有用户积极响应才可以反馈档案馆所提供的服务是否令人满意，才能真正了解用户的需求。因此，档案馆可以借鉴商业客服的在线咨询服务方式，当用户查找信息遇到困难时，自动弹出档案馆在线客服的即时对话框，使档案信息服务人员随时“守候”在用户身边，及时解决用户在档案利用过程中的问题。

3.5 个性化定制服务。传统的档案利用系统是为所有专业、层次、地域的用户提供统一的资源和服务，而大数据时代提倡个性化、差异化的微服务，就需要开发新型的数字档案资源利用系统，为用户量身定做专门的数字档案资源和服务。该系统可以设计三大模块：一是数据资源模块，其中设置“我的专题档案资料”、“我的个人数据资料”、“我的参考资料”等选项，将用户最常用的数字档案资源作为首层列出，便于检索和利用；二是网络资源模块，其中设置“我的收藏夹”、“我的个人链接”、“我的搜索引擎”等选项，将用户经常查找的网络档案资源有效组织起来，满足其多元化的信息组合需求；三是服务功能模块，通过设置“我的档案馆员”、“我的档案新闻”、“我的检索界面”、“我的帮助”等选项，使用户与相应的档案馆员建立直接联系，为其提供档案咨询服务，并使用户及时获取有针对性的与档案相关的动态信息内容。[10]

4 结束语

《大数据时代》一书中提到：“数据价值的关键在于其无限的再利用，即它的潜在价值。收集信息固然至关重要，但还远远不够，因为大部分的数据价值在于它的使用，而不是占有本身。”[11]因此，数字档案馆的档案资源作为大数据最重要的一部分，要充分发挥其价值，也需要从以“藏”为主向以“用”为主转变，从“被动服务”向“主动服务”转变，将宏观、大众化服务与微观、个性化服务有机结合。而微服务作为一种“短、平、快”的服务方式，它将成为传统档案服务的有益补充和有效改进，将会更加贴近用户并为其提供更加细微、专业的服务。

参考文献：

[1]大数据[EB/OL].[2013-08-02].http：//zh.wikipedia.org/zh/%E5%A4%A7%E6%95%B0%E6%8D%AE.

[2]Presidents Council of Advisors on Science & Technology.Big Data and Privacy： A Technological Perspective[R].The White House，2014：18～22.

[3]江苏档案资源总量居全国前列，“死”档案变为“活”资源[EB/OL].[2013-06-08].http：//news.jschina.com.cn/system/2013/06/08/017577171.shtml.

[4]杨冬权.关于随馆藏数量增加而相应增加各级国家档案馆人员编制的提案[N].中国档案报，2013：3～7.

[5][10]李漫，李红梅.基于数字档案馆的档案信息个性化服务研究[J].湖北档案，2010（2）：25～26.

[6]张英.微服务：开创图书馆服务的“蓝海”[J].图书馆建设，2011（7）：51～52.

[7]杨冬权在全国档案宣传工作会议上的讲话[EB/OL].[2011-10-03].http：//www.zgdazxw.com.cn/NewsView.asp？ID=16066.

[8]第34次中国互联网络发展状况统计报告[EB/OL].[2014-07-21]. http：//www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/201407/P020140721507223212132.pdf.

[9]李明玉，周耀林.档案网络化社会服务探微[J].湖北档案，2014（3）：15～16.

[11][英]维克托·迈尔-舍恩伯格，等.大数据时代[M].盛杨燕，周涛译.杭州：浙江人民出版社，2012：165.

大数据服务模型研究篇12

1 高校图书馆大数据的内涵

1.1 高校图书馆大数据的概念

目前,大数据还处于发展的初期阶段,没有公认的、明确的定义。世界知名研究机构Gartner认为:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。[2]随着大数据的广泛应用,其内涵也在逐步拓展。大数据是一种应用技术,也是一种应用能力,即从海量数据中寻找意义关联,挖掘事物隐藏的变化规律,预测事物发展趋势的能力。高校图书馆大数据是大数据的一个子集,是指在文献信息服务过程中产生的,和根据服务需求采集到的,且能在服务过程中创造新价值的数据集合。图书馆大数据也同样具备普通大数据的数据量大、数据多样性、价值密度低和输入和处理速度快等四个显著特点。

1.2 高校图书馆大数据的来源

1.2.1 高校图书馆的数字资源

据调查,全球新产出的信息量每3年翻一番,大约90%的信息都是以数据形式储存。[3]随着现代信息技术的急速发展,图书馆的数字资源成倍激增,形成了主要包括数据库、电子期刊、电子图书、网页、多媒体资料等类型的海量数字资源,部分图书馆的数字资源的种类和数量已经超过纸质资源。以国家图书馆为例,截至2014年年底,国家图书馆数字资源总量达1024.45TB(较2013年总量增加195.45 TB),主要来源为电子报纸5.28TB,外购数据库71TB,馆藏特色资源数字化856.92TB,网络导航和网络资源采集62.4TB。[4]

1.2.2 高校图书馆在文献信息服务过程中直接产生的数据

高校图书馆是学校的文献信息中心,为读者提供多样化的文献信息服务,无论是到馆读者,还是利用平板、手机等移动设备在馆外查询和使用图书馆资源的读者数量都非常多,以笔者所在的河北经贸大学图书馆为例,日均接待到馆读者上万人次,日均数字资源访问量上千次,日均图书流通量600多册,日均读者微服务站使用上百人次,微信公众号关注1.8万人。在此服务过程中,产生了大量的以移动互联数据和社交网络交互数据为主的读者使用数据,比如位置信息、借阅信息、账号绑定和登录信息、浏览信息、下载信息等读者数据。

1.2.3 高校图书馆在文献管理过程中产生的数据

除传统的馆藏书目数据和读者一卡通等数据外,近年来,越来越多的高校图书馆应用了RFID技术,这一智能管理系统包含海量的各类数据信息,如图书定位与跟踪数据、新书转换和门禁系统等数据。

2 高校图书馆大数据的价值潜能

2.1 高校图书馆大数据是一种战略资产

2015年8月,国务院发布的《促进大数据发展行动纲要》中指出,“数据已成为国家基础性战略资源”,并在启动的“公共服务大数据工程”中提出要建设教育文化大数据。[1]图书馆大数据作为教育文化大数据的重要组成部分,理应引起高度重视。图书馆大数据不再是作为用于统计的“数字”,而是一种无形资产,数据挖掘与利用是实现其增值的有效方式。部分西方国家的图书馆已将大数据作为新型战略资源,我国图书馆界也应该强化图书馆大数据的战略资产意识,尽快制定大数据战略,让每个读者都成为图书馆大数据的生产者和收益者,使图书馆数据资产实现不断有效增值。

2.2 高校图书馆大数据为科学管理提供决策依据

从以往的实际情况看,图书馆各项政策的制定和实施,一般是以自上而下的次序进行,这样虽然有利于管理的权威性与政策实施的有效性,但是忽视读者体验、读者参与度不高的弊端也一直客观存在,造成了图书馆管理与服务同实际工作的脱节。在大数据时代,图书馆大数据汇聚了大量以前意识不到或重视不够的数据,通过对图书馆大数据的挖掘,从中寻找意义关联并进行分析,使图书馆的读者服务过程从“非量化”到“量化”,使图书馆的文献信息服务决策不再像以前,从通过简单经验和统计结果的方式,转向基于数据分析的科学决策。通过数据统计、横向对比、指数分析、趋势分析等工作,为图书馆各级管理者进行科学决策提供依据,做到有的放矢,科学、精准、有序、有效的推动图书馆管理效能的全面提升。

2.3 高校图书馆大数据驱动服务方式的变革与创新

传统图书馆服务的基本模式是被动的、单向的、程序化的服务,即图书馆向读者提供某种服务,或读者因某种需求求助于图书馆,图书馆与读者之间基本没有互动,千人一面。在大数据时代,通过对在文献信息服务过程中所产生的,以及根据服务需求采集到的所有数据进行分析与预测,将改变传统的图书馆服务模式,有利于真正实现量体裁衣的个性化服务。在大数据的支持下,图书馆能够更好地了解读者需求,不断改进其服务方式和方法,并且在为读者提供文献信息服务的互动过程中,真正变成读者获取知识的促进者与协作者。利用大数据技术可以跟踪服务过程,对图书馆服务进行评估,还可以运用回归分析、关联规则挖掘等方法,帮助图书馆分析各类服务的实际效果,使图书馆可以做出及时调整,提高服务质量和水平。

3 大数据与高校图书馆服务创新

3.1 转变服务方式,开展个性化服务

大数据时代,文献资源的种类和内容越来越丰富,获取途径越来越多,读者需求也越来越个性化。因此,图书馆服务重心应该从注重资源建设转向注重服务能力建设,服务方式应该从满足大多数读者基本需求的普遍性服务,转向满足每一个读者不同需求的个性化服务。长期以来,图书馆对读者的个性化需求重视不够,从今后的发展趋势看,个性化服务水平将成为检验图书馆服务实际效果的重要指标。大数据时代,图书馆可以通过对读者数据的分析,获取有价值的信息,建立读者模型,主动开展宣传推广服务、跟踪服务、知识关联服务和精确服务,改进读者体验,提升个性化服务水平[6]。

3.2 拓展服务渠道,强调读者参与

在传统图书馆服务过程中,读者基本处于被动地位,图书馆能提供哪些服务,读者才能享受到哪些服务。尽管一些图书馆成立了图书工作委员会,但由于各方面原因,这种依靠少数读者参与图书管理与服务的程度不高、效果不好,所发挥的实际作用极为有限。大数据背景下,图书馆强调的读者参与,不仅包含传统的读者使用需求或读者评价,而是嵌入文献信息服务过程中的每一个具体环节。图书馆大数据生态系统,是力争构建一个大数据制造者、管理者和处理者等各方参与,都可以进行大数据存储、组织、获取、分析和决策的公共服务环境。在读者参与过程中,注重读者参与实际效果和对服务的支撑能力,形成图书馆与读者的自发性互动,使两者形成一个紧密结合的互动合作式联合体。

3.3 创新服务手段,利用大数据分析

当下,无论是人们的学习、工作还是日常生活,都会在各类信息系统中留下信息行为数据,对这些数据进行分析整合,就能呈现出个体的活动轨迹和发展趋势全景,这就是大数据分析。图书馆的大数据分析,就像是图书馆的GPS,将整个信息服务活动的过程和发展趋势等情况全部呈现出来,主要表现在两个方面:一方面是以图书馆现有数据为对象进行挖掘与分析,如由读者借阅信息、登录信息、下载信息、位置信息等,通过图书借阅信息和电子资源浏览及下载信息,进行读者阅读行为分析,为创新阅读推广活动方式和手段;另一方面是读者所需的大数据分析,这类分析类似目前高校图书馆为企业、政府和研究机构等客户群体所做的信息情报参考和竞争情报分析等。

3.4 优化服务过程,融合资源与服务

在大数据时代,云计算机、移动通讯、传感器、可信计算等新技术越来越多的融入图书馆服务的全过程,在大数据服务模式下,各类资源能够通过各种传感器、适配器、RFID和人机交互等实现资源半自动或全自动感知,然后借助网络等传输信息,可以在不影响服务活动的情况下,实时并持续地采集更多微观的服务过程性数据,使图书馆可以在对各类数据进行管理和处理的基础上,提供一站式、一体化的图书馆融合服务。

4 结语

大数据和云计算的确让互联网时代上了一个新台阶,使信息、数据渗透到各个行业和人们的日常生活。展望未来,大数据必然会对图书馆的文献信息服务和知识服务产生极大的影响,高校图书馆今后的工作开展必将是以“数据驱动”来进行。因此,在大数据发展和应用的背景下,高校图书馆能否认识到大数据对图书馆发展的重要性,能否不断加强“数据”意识,创新图书馆服务,满足读者的个性化需求,提高图书馆核心竞争力,非常值得高校图书馆界持续关注和研究。

摘要：本文阐述了高校图书馆大数据内涵,分析了高校图书馆大数据的价值潜能,论述了高校图书馆应从转变服务方式,开展个性化服务、拓展服务渠道,强调读者参与、创新服务手段,利用大数据分析、优化服务过程,融合资源与服务等方面进行服务创新。

关键词：大数据,高校图书馆,服务创新

参考文献

[1][5]杨现民,唐斯年,李冀红.发展教育大数据“内涵、价值和挑战[J].现代远程教育研究,2016(1):50-59.

[2]姜山,王刚.大数据对图书馆的启示[J].图书馆工作与研究,2013(4):50-52.

[3]朱静薇,李红艳.大数据时代下图书馆的挑战和及其应对策略[J].现代情报,2013(5):9-13.

[4]国家图书馆.数字资源建设[EB/OL].[2016-05-07].

【大数据服务模型研究】推荐阅读：

家庭大数据服务平台项目可行性研究报告08-24

大数据技术服务07-29

社区服务拥抱大数据07-22

电网企业数据服务研究07-02