产业发展数据库

2024-08-22

产业发展数据库(精选12篇)

产业发展数据库 篇1

摘要:培育和发展国产数据库软件产业, 对于发展数据产业、保障国家信息安全至关重要。首先介绍国产数据库软件产业发展情况, 然后指出国产数据库与国外数据库的差距, 最后提出一些国产数据库软件产业发展对策。

关键词:数据库,软件产业,大数据

数据库软件是一种非常重要的基础软件, 是中国信息化建设中需求量最大、应用最广泛的软件之一。经过三十多年的发展, 国产数据库软件产业已经初具规模, 国产数据库软件已经成功应用于政府、军队、教育、电力、金融、农业、卫生、交通、科技等许多行业。然而, 中国数据库软件与国外主流数据库软件产品相比还存在很多差距。近年来, 随着大数据的兴起, 国产数据库软件企业面临诸多机遇。

一、国产数据库软件产业发展情况

近年来, 在国家软件扶持政策、“核高基”重大专项以及政府采购等的支持下, 国产数据库软件市场规模以20%以上的速度快速增长, 国产数据库软件在中国数据库软件市场中的份额占比逐年提高。2012年, 国产数据库软件市场整体规模达3.4亿元, 比2010年增长32%。国产数据库软件在中国数据库软件市场的占比约为8%, 比2007年翻了一番。

人大金仓、达梦、神舟通用、南大通用等企业的国产数据库软件产品的功能和性能都有长足的进步, 已经成功应用于政府、军工、电信、电力、金融、教育等行业, 并在政府、电信、电力等局部领域击败国外竞争对手。在电子政务领域, 由于信息安全有保障、售后服务贴近用户, 国产数据库软件逐渐替代Oracle、DB2、Sybase、SQL Server等国外数据库软件, 加快了政府部门软硬件全国产化进程。

国产数据库软件在越来越多的行业得到应用。在军工行业, 神通数据库已成功应用于长征火箭、神舟飞船等型号设计。在电力行业, 国家电网调度通信中心采用了达梦数据库作为基础平台。在电信行业, 中国联通统一综合结算系统采用了神通海量数据管理整体解决方案。在金融行业, 中国农业银行、民族证券采用了人大金仓数据库。

二、国产数据库与国外数据库的差距

虽然国产数据库产业发展取得了长足的进步, 但与欧美发达国家相比, 在市场、技术、应用等方面还存在较大的差距。

从市场角度看, 国产数据库在市场宣传方面做得还不够, 成功应用案例少。国内许多单位的CIO们对国产数据库认知、认可程度低, 采用国产数据库的单位还很少。

从技术角度看, 国产数据库软件企业研发投入少, 核心技术人员少。Oracle每年研发投入10多亿美元, 而国产数据库软件企业的研发投入一般只有几千万元人民币。Oracle公司的核心技术人员有五六百人, 而国产数据库软件企业一般只有七八十人。在技术方面, 国产数据库比国外数据库落后五至八年。

从应用角度看, 在简单应用方面, 国产数据库与国外数据库没有差别。两者差距主要体现在高端应用领域, 如电信、金融、社保等。这些高端应用的特点是“大用户、大数据”。用户特别多, 并发量很大, 数据海量。国产数据库在关键技术、产品稳定性等方面与国外数据库还有一定差距。

三、国产数据库软件产业发展对策

建议有关政府部门加强对数据库软件在软件产业中的基础性作用的认识, 进一步加大对国产数据库软件研发的资金支持力度。在电子党务、电子政务、军队信息化建设中, 同等条件下优先采购国产数据库软件。对国产数据库产品使用过程中出现的问题, 应适度宽容。加强协调, 注重引导, 为国产数据库软件发展创造良好的环境。严格落实软件知识产权保护制度, 依法打击盗版等各类侵权行为。鼓励、支持国产数据库软件企业通过并购等方式进行产业链整合。支持符合条件的国产数据库软件企业上市融资。支持国产数据库软件企业开展面向“云计算”、“大数据”的数据库产品研发和应用推广。支持数据加工、联机分析、数据挖掘等数据服务业发展, 以带动国产数据库软件产业的发展。国产数据库软件起步晚, 但近年来发展速度较快, 政府部门对国产数据库软件要有信心和耐心, 要下定决心支持国产数据库软件产业的发展。 (下转271页) (上接223页)

对于国产数据库软件企业, 对产品研发、市场开拓等要有恒心, 要用足、用好国家现有政策, 努力争取新的国家政策支持, 积极申报“核高基”项目、电子信息产业基金项目等。一方面要努力突破数据库核心技术, 提高产品的稳定性;另一方面, 加大宣传推广力度, 提高产品的知名度。例如, 与大专院校合作, 将国产数据库应用纳入相关专业教学内容, 让学生免费试用国产数据库软件产品, 培育未来的用户群;与信息化主管部门、软件产业主管部门合作, 通过举办会议、展览以及开展试点示范等多种形式, 提高国产数据库软件产品在政府部门中的知名度, 消除政府用户的顾虑。与国产计算机芯片、操作系统、中间件、应用软件、应用电子等企业合作, 以产业联盟等方式推出全国产的信息化解决方案, 以便与强大的国外IT厂商相抗衡。以优质的本地化服务来弥补技术、产品等方面的不足, 为用户提供贴心服务。

经过多年的信息化建设, 许多政府部门和企事业单位积累了海量数据, 迫切需要利用大数据技术对这些海量数据进行分析、处理和挖掘。越来越多的企业和政府部门意识到大数据蕴藏的巨大价值。国产数据库软件企业应抓住这一历史机遇, 研发大数据产品和解决方案, 实现企业的转型升级。

产业发展数据库 篇2

3.1.1优秀教师发展的概念分析和理论构思研究

通过查阅文献,并采用访谈调查法和问卷调查法,对有关优秀教师发展的有关概念进行分析和界定,并提出符合实际的优秀教师发展的理论架构,为进一步构建优秀教师发展的指标评价体系提供理论基础。主要的研究手段是文献分析法,访谈法、问卷法、德尔菲法。主要研究内容包括优秀教师的界定、评价标准、优秀教师的素质成分分析、优秀教师评价的理论和实际意义,优秀教师核心素质的指标体系等。

3.1.2优秀教师的指标体系的结构与类别研究

采用文献分析法、调查法和访谈法,收集有关优秀教师评价内容,使用因素分析等统计分析技术,鉴别出优秀教师指标的结构模型和类别,从而制定优秀教师发展的指标体系。例如,在一个优秀教师的发展过程中,哪些属于核心指标,哪些属于一般指标,哪些属于通用指标,哪些属于特殊指标,等等。

3.1.3优秀教师发展的指标测评工具研究

在建立优秀教师发展的指标体系后,通过哪些研究工具对优秀教师发展的各种指标进行测评,研制信度和效度较好的测量工具(优秀教师综合素质问卷、优秀教师行为评定量表),为进一步的数据库建立提供基础。研究的内容包括指标内涵和外延分析,指标的测量策略,指标的测量工具确定,测量工具技术性能的分析与评价等。

3.1.4优秀教师发展数据库的建设和维护研究

以心理测量学和信息技术学理论为指导,在优秀教师发展评估指标体系的基础上,建立优秀教师发展的信息数据库,包括数据库的结构、内容和维护措施,为教师发展、管理和培训提供数字化手段和资源。

3.1.5优秀教师发展数据库的共享机制和有效利用研究

该子课题的研究目标内容是,探索已经建立的优秀教师发展数据库的共享机制,以及如何有效地利用数据库服务于教师的评价、管理、教育和培训。包括研究数据库的后续建设,如何在师范生、教师和教育管理部门间共享,以提高使用用途和效率等。

3.2建构过程设计

第一个阶段的任务是确定指标,建立模型,提出相应的理论构架;第二个阶段是初步建立优秀教师的数据库;第三个阶段是追踪评价,定期测量,更新和添加新数据。

3.3技术支持设想

在数据库的设计与实现方面,本数据库利用XML元数据标准作为描述数据资源的数据,可以实现不同计算机系统对同一数据的一致性处理。利用webservices技术,建立跨平台的网络数据资源发布,共享与交互机制。

产业发展数据库 篇3

关于XML技术

20世纪70年代,数据库系统的发展进入了“关系型数据库系统(relational database)”时期。随着信息技术和市场的发展,人们发现关系型数据库系统虽然技术很成熟,但其局限性也是显而易见的:它能很好地处理所谓的“表格型数据”,却对技术界出现的越来越多的复杂类型的数据无能为力。九十年代以后,数据库业界一直在研究和寻求所谓的“后关系型数据库系统(post-relational database)”。XML技术的诞生就是为了统一不同格式的数据,实现不同系统之间的信息共享,增加系统价值。

XML是一种标记语言,以文本为基础,具有易读性和平台无关性,它以其结构化、可扩展性及灵活性的特点引起了业界的普遍关注。XML技术的诞生就是为了统一不同格式的数据,实现不同系统之间的信息共享,增加系统价值。XML是处理非结构化数据和半结构化数据的桥梁。由于XML是一种可自我描述定义的元语言,所以它将大量用于制定行业内及行业间数据交换的标准。围绕着XML已经形成了一大批新的技术及标准。工业界也在加紧制定自己行业的XML标准。目前,XML 数据已被广泛地用于实际应用。在企业内部,80%的信息都是除结构化数据以外的文档、邮件、音频视频等类型的非结构化数据,而这些数据的管理用XML形式描述是最好的。更多的例子包括办公文档(DOC, XLS),网页(HTML),PDF,图像(JPG, GIF),音频(MP3),视频(MPG, AVI),文本等主流非结构化数据。可以预见,在以互联网为基础的企业及商务应用中,XML数据将呈爆炸性地递增。

XML数据库的优势

江苏倍多科技前身Ipedo成立于美国硅谷,是原生XML数据库行业奠基者及标杆企业,同时也是行业标准的发起人之一。目前,江苏倍多的XML数据库已是相对成熟的产品,并在国内国外有大规模应用的客户,如英国电信,法国电信,美国海军,惠普,路透社,北京地税局,江苏电科院等。从产品的成熟化角度,江苏倍多的XML数据库同IBM和甲骨文等企业站在同一条起跑线上,而从产品的性能上则具有一定优势。

大量资料和数字显示XML数据库的应用已经成为数据库产业新一轮的热点。业界最大的企业软件公司,如:IBM,甲骨文和泰瑞数据都已正式推出各自的XML数据库解决方 案。电子病历,电子商务和信息整合市场都将给该市场带来数以万亿的市场机会。

相对IBM和甲骨文的以关系数据库起家的企业相比,XML数据库有天生的性能方面的优势。IBM和甲骨文是在原有关系数据库基础上扩展了XML支持模块,完成XML数据和数据库之间的格式转换和传输。即把XML数据本身的树形结构转换成关系模型中的二维表结构,从存储粒度上,可以把整个XML文档作为RDBMS表中一行,或把XML文档进行解析后,存储到相应的表格中。为了支持W3C的一些XML操作标准,如XPath,XED提供一些新的原语(如Oracle9iR2开始增加了一些数据包来操作XML数据等),并优化了XML处理模块。将XML树状结构翻译成关系二维表,再从二维表翻译回树状结构,会造成性能方面的很大问题。

XML数据的实现方式是原生态XML结构,即从底层就支持树状结构,采用层次数据存储模型,保持XML文档的树形结构,省掉了XML文档和传统数据库的数据转换过程。原生态XML数据结构是专门为存储XML文档设计,也兼有一般数据库的特性,例如支持事务,并发控制,查询语言,安全机制,二次开发接口等。唯一的不同之处在于其内部存储模型是基于XML文档树形结构,而非关系模型。 下图可以明确地反映出两种实现方式的根本区别。

在XML数据库行业组织的XML数据库基准程序XMark的测试中,倍多的产品性能明显胜出。而在最近国防某个项目的测试中,XML数据库与甲骨文同台比测,结果表明,XML数据库在若干重要指标上有明显优势,尤其是在优化和查询方面,一扫国内数据库在高性能和稳定性方面普遍存在的颓气。下图表明了XMark测试的结果。

前景美好 道路曲折

近年来我国发布的电子政务标准和文档标准,如UOF,UOML等,均基于XML。我国的证券交易市场(如上海证券交易所)已开始采用基于XML的财务报表标准XBRL。而最近才发布的电子病历标准征求意见稿及健康档案标准更是为XML的应用提供了一个广阔的前景。要把XML数据库产业做大,任何公司都知道离不开中国市场。中国有13亿人,单“全民健康档案”一个项目就足以撑起整个产业。

但是,就目前而言,甲骨文、微软、IBM、Sybase等巨头在中国数据库市场上继续占据着97%以上的绝对垄断份额,这一形势没有大的改变。长期垄断导致许多重点用户依附于国外产品,不易接受新的替代品,这反过来促进了垄断趋于极端。后来者面临的市场进入壁垒越来越高,是国产数据库面临的主要困难之一。

此外,国内用户使用盗版数据库的情况十分普遍,不亚于操作系统和办公软件,而且更为隐蔽;加上近年来国际开放源码产品的兴起也为国内用户提供了更多的选择,MySQL、PostGreSQL等提供了比较完整的数据库功能,能够满足大多数中低端应用需要,这些很大程度上削弱了国产数据库的价格优势。

数据库技术发展综述 篇4

1 数据库技术发展现状

在信息技术、计算机技术飞速发展的今天, 与之相关联的数据库技术也在不断变化发展中。关系型数据库的发展曾受到面向对象型数据库技术的挑战。但在当时, 世界上的几大家软件公司, 始终支持关系型数据库技术。随着国际互联网技术的快速发展, 出现了XML格式的数据存在形式, 但就发展势头, 市场占有额, 关系型数据库技术仍是主要领导力量。

2 数据库技术发展的趋势

由于关系型数据库的发展具有一定的技术基础和使用经验, 但由于它的使用中存在局限性, 因此下一代数据库技术的发展主流可能是面向对象型数据库技术, 也可能是两者的结合, 就此, 业界研究人员有以下观点。

2.1 支持面向对象的数据库技术成为下一代数据库技术的主导力量

在数据库的研究内部, 有一些学者认为, 面向对象型数据库技术要比关系型数据库技术更加完备, 更加符合人们认识世界的看法。原因是, 面向对象型数据库技术, 吸收了面向对象程序设计法学的核心概念和基本思想, 很多学者对这种看法表示赞同, 有学者甚至认为, 下一代数据库技术的主导力量, 是面向对象型数据库技术。

2.2 将面向对象型数据库技术引入关系数据库中

在数据库技术发展的今天, 关系数据库的发展技术的成熟度, 可以说是没有哪种数据库技术可以与之相比较。但是, 由于关系数据库技术自身内部有不可解决的局限性, 比如说, 只能对比较简单的模型进行建模, 数据的类型也有限, 程序设计的结构受到制约, 等等, 都是制约关系型数据库发展的因素。对于面向对象型数据库, 由于其开发的源泉就是起源于程序设计语言, 通过对现实世界的实体对象描述, 作为基本元素, 来阐述客观世界, 符合人们认识世界的基本规律。同时, 面向对象型数据库技术, 具有关系型数据库不具备的技术, 因此, 有学者认为, 应该将面向对象型数据库技术, 引入关系型数据库, 取长补短, 符合关系型数据库技术的发展方向。

2.3 演绎面向对象数据库技术

由于面向对象数据库是较为先进的数据库技术, 同时也是新兴的数据库技术, 因此, 相应的技术设施还不够完善, 没有统一的数据模型和形式化理论, 缺乏对数据的逻辑性处理基础。因此, 不能独当一面, 妥善处理数据管理中的相应问题。而演绎数据库, 恰恰具有面向对象数据库所没有的技术能力———对数据进行严格的逻辑关系处理, 弥补了面向对象型数据库的缺点。有学者认为, 应将两者结合在一起, 组成新的数据库技术, 应对今天的发展需要。

3 数据库技术发展的新方向———非结构化数据库

由于计算机信息系统的快速发展, 要求更加完善的符合实际生产需要的数据库技术, 来适应信息系统的发展需要。基于关系型数据库模型过于简单, 不能满足对复杂数据形式进行快速的表达, 同时又由于支持数据的类型有限, 因此研究人员设计出了非结构化数据库技术。这种数据库技术, 是本着全面适用于因特网应用技术的新型数据库技术, 这种数据库技术的根本优越性, 主要是突破了关系型数据库结构定义不易改变、数据定长的限制, 围绕支持重复字段, 实现了对数据可以任意变长的突破, 具备处理连续信息和非结构信息的优越功能, 是关系型数据库无法比及的。但很多学者还是认为, 它不能取代关系型数据库技术, 只适合作为它的辅助性配套软件。

4 数据挖掘知识发现与数据仓库是未来数据库技术发展目标

数据库技术是计算机信息系统发展的配套软件系统, 为了配合计算机技术快速发展的需要, 数据库技术就要不断更新, 不断研发新技术。在数据库技术中, 数据挖掘技术的出现, 成为数据库技术的核心。数据挖掘技术就是在数据库中, 根据不同信息, 进行分析, 同时找出信息中隐藏的规律, 为程序的编程提供一定的帮助。数据挖掘技术是如今发展较快的技术, 它综合了机器结构学、统计分析学、数据库技术等相关的技术, 为数据库整理信息分析信息后, 为编程决策提供帮助。数据仓库的作用就是从外部数据源、历史业务数据中, 提取有用的数据, 进行编排后, 为数据的处理分析做准备。有学者认为, 数据挖掘技术和数据仓库是数据库技术发展的目标, 通过对数据仓库数据的分析研究, 发现数据中的潜规则, 为数据的编程提供应用作用。另一方面, 数据挖掘技术逐渐成为独立的重要工具, 成为数据库技术发展必不可少的辅助工具, 成为新一轮数据库技术研究的主推力量。

5 结论

在计算机信息系统发展过程中, 数据库技术逐渐成为其运行顺利的辅助性重要软件, 数据库技术的发展过程中, 出现了新旧技术的更新和技术间的相互补充、相互配合, 共同为数据库技术的新发展做出贡献。虽然我国是计算机应用大国, 但是由于我国对相关技术的研发较晚, 对于相应技术核心掌握的还不够成熟, 因此, 在信息技术发展飞快的背景下, 我们要努力研究数据库技术, 顺应信息时代的发展。

摘要:文章通过对国家学术期刊网全文期刊库、维普中文数据库、SCI数据库的发展状况、发展趋势及方向的研究, 提出看法:数据库技术的发展必须与文化信息量的存储相持平, 保证数据库技术的发展能够满足信息存储量的实际要求。

关键词:数据库技术,趋势,方向,数据仓库技术

参考文献

[1]薛微.数据挖掘系列讲座之二[J].中国计算机用户, 2003, (2) :82.

[2]赵民德.数据挖掘系列讲座之一[J].中国计算机用户, 2003, (2) :29.

[3]胡天平.新一代数据库技术面向对象数据库系统[J].中国计算机报, 2003, (1) :68.

产业发展数据库 篇5

二、论文综述

1、数据库技术发展历程:许多年以来在数据库技术领域很少有重大的技术创新能够引起人们对整个数据库发展历程的回顾与反思。DB2 9中推出的pureXML技术,对过去数十年来关系型数据库的最基本的数据组织方式进行了重大的创新,第一次让我们对数据库的历史,以及过去支撑其发展壮大的理论基础和外部挑战从新的角度进行审视。 今天我们很少去回顾数据库的历史,对于绝大多数IT技术人员,数据库等同于关系型数据库,数据则和表紧密联系。E-R模型几乎是我们描述世界的唯一方式,SQL语言是数据库信息访问处理的唯一手段。关系型数据库已经成为了一种宗教式的信仰,数据相关的所有理论问题似乎都已经解决。

然而历史的发展总是在我们不经意间产生转折,所有重大技术的产生及发展都有其生存的土壤。40年前数据库的诞生并不是关系型数据库,第一代的数据库第一次实现了数据管理与应用逻辑的分离,采用层次结构来描述数据,是层次型数据库(IMS)。第二代数据库奠基于上世纪70年代E.F Codd博士提出的关系型理论以及SQL语言的发明。实现了数据建模和数据操作处理的标准化,关系型数据库在其后的20多年的时间取得了长足的发展,得到了广泛的应用。技术的演进主要集中在性能、扩展性和安全性等方面的提升,其基本的理论框架和技术理念并没有大的变化。

与之相反,在过去的20多年里,IT产业发生了重大的变化和一系列技术及理念的创新。数据库所生存的外部土壤随着Internet以及在网络环境下IT系统互联互通相互协作的趋势,对信息管理技术提出了新的挑战。

2、国内研究的综述:《移动数据库技术研究综述》《Web数据库技术综述》《Web与数据库技术》《数据库技术发展趋势》

三、论文提纲

(一)数据库技术概论

1、数据库技术概念及类型

2、数据库技术发展历程

3、数据库技术应用

(二)数据库技术发展现状------关系数据库技术仍然是主流

1、发展现状概述

2、Oracle概念及应用

3、Access概念及应用

4、SQL概念及应用

5、DB2概念及应用

6、发展现状总结

(三)数据库技术发展的趋势

1、下一代数据库技术的发展主流面向对象的数据库技术与关系数据库技术

2、演绎面向对象数据库技术

3、数据库技术发展的新方向非结构化数据库

4、数据库技术发展的又一趋势数据库技术与多学科技术的有机结合

5、未来数据库技术及市场发展的两大方向数据仓库和电子商务

6、数据库技术的实践性发展面向专门应用领域的数据库技术

(四)当代与未来数据库研究的热点数据挖掘、知识发现与数据仓库

1、数据挖掘技术

2、数据仓库技术

3、知识发现技术

4、小结

5、结论

四、论文写作进度安排

(一)开题报告:论文题目、系别、专业、年级、姓名、导师

(二)目的意义和国内研究概况

(三)论文的理论依据、研究方法、研究内容

(四)研究结论

(五)预期的结果

(六)进度安排

油田数据库建设的现状和发展前景 篇6

关键词:数字化油田 数据库系统 遥测技术 集成管理体系

中图分类号:TE42 文献标识码:A 文章编号:1674-098X(2013)01(a)-00-01

数字油田的基本概念和发展方向就是将涉及油气经营的各种资产,通过数据采集、数据解释与模拟、提出并评价各种选项、执行等。数字油田的发展过程大致为20世纪90年代前,油田企业向电气化、自动化、机械化、智能化、信息化、可视化、数字化和集成化方向发展。20世纪90年代至世纪之交,ERP和电子商务的应用进入石油业,勘探开发可视化、一体化和智能井技术日趋成熟。从2005年开始,以美国达拉斯举行的石油工程师协会为标志,数字油田进入了发展阶段。

构建一个以数据库系统为核心的综合数据中心、并提供统一的数据服务能极大提升油田应用的信息化水平。该文从数字油田整体考虑,结合最新的信息技术的发展,提出了构建数字油田统一软件系统平台架构方法,以期对解决数字油田这样既庞大又复杂的应用系统环境下的软件架构问题起到一个抛砖引玉的作用。

1 油田数据库系统的特点及设计思路

1.1 油田数据库系统的特点

油田数据库系统需具备统一性、敏捷性、实时性和协同性等基本理念。因此,油田数据库系统应具有以下特性。

(1)油田数据库系统具有统一的规则(如标准、接口等),这是建设油田软件系统平台的基础,在此基础上方可支撑敏捷性、可扩展性等其他基本要求。

(2)油田数据库系统还应具备良好的敏捷性和可扩展性,以快速企业经营环境的变化做出反应,并适应企业新的应用开发与部署。

(3)油田数据库系统将油气整个勘探与开发过程设计为实时处理,并满足不同专业的工程师均能动态、快速地获取及共享数据信息,并及时掌握和控制油田全部生产过程和经济活动。

(4)油田数据库系统需具有协同性,其所创建的资源共享环境,应满足企业管理专家和专业技术专家方便灵活的协同工作。

1.2 油田数据库的设计思路

构建油田数据库涉及包括勘探开发生产及经营管理等专业的动态数据,应支持油田包括地质勘探、油藏分析、油气生产、经营管理等生产经营的各个方面,这些数据存储在不同区域、不同部门的异构数据库中。数据库要管理所有这些源数据层的收集、统计和转化,并明确各数据库数据的具体用途,进行数据来源信息的登记、抽取和净化等。因此,油田数据库整体设计思路首先是建立包括勘探地质库、勘探动态库、油田地质库、岩心图像库、采油工程库、油田动态库、油田开发库、实验数据库等在内的基础数据库,在此基础之上建立项目库,从而实现整个油田的数据管理。

2 油田数据库系统的关键技术

数字油田综合数据库的开发中,关键技术主要包括。

(1)可视化技术。包括油田综合勘探与生产数据的三维可视技术、虚拟现实技术等。采用可视化技术,利用空间分析能力对油田设备之间的逻辑关系进行分析,可对整个油田系统进行统一管理,使整个油田信息形成一个实时、动态、高效、互动、数据统一的系统。

(2)遥测技术。主要包括重力测量、地震监测、永久型地面检波器网络、电磁监测和永久型光纤井下检波器等。

(3)自動化技术。自动化系统大多以单项工程或单项生产过程的自动化为主,根据工艺技术和运行管理的要求,从满足生产工艺过程安全、经济运行的角度对仪表和自控系统进行设置,从而建立全油田自动化系统。

(4)数据管理、集成与挖掘技术。数据就是生命,对与油田数据库而言,这些数据经过层层质检后集中管理,研究人员提取数据并加载到研究系统中,就可进行后续研究工作。数据库体系运作包括多维数据的优选、集成、在线分析处理以及基于分层聚类分析的方法实现数据挖掘等。

(5)智能钻井与完井技术。随着地球上油田储量的减少,难动用油藏如隐蔽油藏、边际油藏等的开发日趋重要。目前,国内外的智能完井技术已经在大位移井、分枝井、水平井、边远井和水下采油树井及多层采油井和注水井等中。

(6)集成管理体系等。一个立足自主创新的科技管理体系,对油田的科技决策、组织实施、知识管理和环境支持四个系统均具有裨益。

3 油田数据库系统的前景

石油企业是一个多学科、多专业相互配合、相互渗透、协同攻关的知识、技术密集型企业,通过数字油藏、动态性、实时性、虚拟化油田和协同工作环境等方面展望,油田数据库的应用前景广阔。数字油田在未来的发展主要有以下应用前景。

(1)随着石油勘探开发逐渐进入二次创业时期,普遍存在于复杂地质环境中的剩余油气藏具有埋藏更深、更隐蔽、更难开采等特点。而数字油田具有全新的数字化作业方式,与传统的手工或半手工的工作方式相比,更能提高勘探开发能力并降低开发风险。

(2)创建油田数据库可以优化生产流程,大幅提升油田生产运行质量。油田数据库可以把复杂的地质情况和三维地形转换成可视、动态和可交互的三维图像。从而实现对监测油藏和井下动态可持续监测,并对混合产量进行分配,以保证油藏模拟最优化。对油田的设计井位和开发方案进行选择,确定钻井的轨迹,并发现剩余油藏和隐蔽油藏。

(3)油田数据库还可以促进油田改革的进一步深化,进一步提高油田经营管理水平。通过优化步骤,油田管理的规范化、处理一体化、经营管理的科学化、领导决策智能化均能实现,使油田管理水平、管理层次显著提高,增加了油田的整体效益,也提高了油田核心竞争力。

4 结语

该文对数字油田的数据库建设的特点进行概述,并重点对油田数据库的设计思路和关键技术进行了介绍,最后展望了其发展前景。数字油田是一个全新的理论体系,是信息化发展的高级阶段,其中数据库的建设是关键。推动油田数据库建设,必将为企业带来巨大的经济效益和社会效益。

参考文献

[1]何生厚,毛峰.数字油田-理论、设计与实践[M].科学出版社,2001.

[2]张军华.数字油田要素分析、建设现状及发展展望[J].勘探地球物理进展,2007,30(1).

[3]王宏琳.石油勘探开发信息化—从数据处理到数字油藏[M].石油工业出版社,2001.

数据库技术发展方向 篇7

数据库的定义是计算机的辅助管理数据技术, 其总体方向是探究存储数据、组织数据的高效率获得方式, 以及对于获得数据的处理。其是通过存储和管理数据的结构设计的应用理论基础和实现方法, 基于理论以实现数据的分析和理解。数据库本身的自带功能, 某种方式上解决了大量数据的组织与存储问题, 降低了复杂化难度高的核算数据处理问题, 另外, 也提升了处理能力的准确度和精密性。数据库对于信息数据的处理更具安全性、有效性, 保证了数据处理过程高效率、快速、安全及精密。从根本上解决了部分数据的共享难题, 使共享技术更好地为人类社会的发展进步服务, 让人类利用更快捷简便的方法完成需要解决的工作问题。数据库的发展分为几个不同的阶段, 分别是第一代数据库系统, 第二代数据库系统, 第三代数据库系统。这三个阶段互相合并, 相互结合, 呈现出现下的数据库系统。第一代系统是层次与网络结构状的系统, 网络数据库的主要代表就是层次数据库系统, 是系统发展的开源, 数据库系统同时成为技术发展进步的奠定基石。IBM公司提出的网络数据库系统的一系列概念成为技术发展进步的理论依据, 也为发展打下了良好的根基。关系数据库是第二代数据库。发展成形的关系数据库成为非传统应用技术和传统应用技术的机器数据库体系的合并, 这种系统发展逐渐完善, 拥有的使用者范围相对已经十分广泛, 很多用户至今仍旧在使用这种关系系统。第三代数据库技术融合了前两代的优点, 在此良好的基础上开阔了自身的时代优点。其拥有三方面的特征:数据管理技术支持, 对象和知识管理技术, 集成和保持第二段数据库系统技术, 保证对其他系统的开放性。

2 数据库技术发展方向

2.1 联邦数据库系统

2.1.1 查询优化方法

部分企业的很多资源都发散性地分布在不同的分散系统上, 面对未来的发展, 更多的客户端系统将访问几百万甚至几千万个数据库系统。集成分布不同分散系统上的数据处理信息, 建立几百万甚至几千万信息系统合并而成的大规模联邦信息库将是必然的发展方向, 其应针对不同的方面进行深入研究。未来的数据库所推行的系统优化查询方法首先要保证不同的局部内系统数据库的自我控制, 可以及时准确地进行数百万个内部系统库的数据查询。

2.1.2 查询的语义和执行

以往的查询系统是通过系统数据库分析给出准确的回复, 但是未来的用户量可能达到远远超出现有数量的端点数据系统, 当不同数量庞大的用户群向系统进行提问查询时, 以往的查询运行办法运行的时间将会增加。联邦数据库可以将这种多方向的查询转化成为不同的迭代计算, 即系统变换以往的准确答案提供方式, 给出粗略答案, 进一步反复迭代求精, 通过这个过程, 完善结果直到查询到满意的结果。为了实现这种查询, 必须改变优化传统的执行器和查询优化器, 把优化和执行与估算技术结合。

2.1.3 支持多数据库系统集成工具

其目的是保证管理人员更加快捷方便地嵌入局部的数据库系统, 使其进入到大规模的数据库系统中, 以保证整体数据库系统集成的自动化。

2.2 嵌入式数据库系统

2.2.1 数据库系统的自我调节能力

微型信息设备需要配备自身的数据库系统, 这种类型的数据库称之为嵌入数据库系统。系统的数据管理中没有具体的相关专业操作人员, 用户也无法详尽地了解专业知识。因此, 嵌入式系统必须在外界的应用环境发生改变时候, 自身进行改变调整以适应外部条件, 不能依靠客户进行参数的系统设置。这种自我进行变更的调节功能是以后专业工作者面对的另一个难题, 其核心内容是系统总体参数的改变和自我适应控制调节能力。

2.2.2 快速准确的链接能力

嵌入式数据库必须有高效准确的链接能力, 保证存储数据库与WEB数据库的链接和发现。这种WEB信息源的发现需要系统丰富自身的元数据, 需要利用新的手段进行相关链接。

2.3 数据库系统的体系结构

现今多种计算机集群并行计算系统, 包括共享磁盘计算机集群系统, 共享主存储计算机集群系统, 无共享硬件资源计算机集群系统, 具有非一致性主存储器的计算机集群系统。这些系统性能价格比和并行性是统一并行大规模数据应用的重要支撑, 这些系统的研究已经获得成功。但是, 面对并行数据库系统的其他计算机系统研究相对薄弱, 伴随社会经济的不断进步和高科技信息技术的不断革新, 在商业智能、电子商务、在线交易结算处理中, 都需要数据库技术, 未来的信息技术手段中, 计算机的应用范围将更加广泛, 工作时间将不断延长, 主存储器的需求不断大幅度升高, 科技人员必须考虑数据库的总体信息缓冲, 结构的存储等多方面的变革。近年, 科学的不断发展进步, 新型的方法和技术不断推广应用, 数据库面对这种形式, 必须进行不断完善和改革创新。现今数据库在行业应用中发展势头良好, 不断应用存储数据的物理管理功能和其他更多功能, 数据库技术问世至今, 相关科学工作者不断加深研究, 保证了其实际的应用性和广泛性, 在理论应用、实际生产过程、商业范围智能管理方面都逐渐形成了完善的工作系统。未来的系统工作中, 大型数据库的内存将进行变革, 部分数据进行主存储, 保证磁盘存储, 大部分数据将转化到各级存储器上。三级存储器的处理速度相对较慢, 必须降低查询优化器进行指向计划时数据频繁介质之间的传递, 加大对三级存储器上记录的优化处理, 尽量减少选择时间, 采用高效缓冲的存储处理手段。

2.4 无线网络的数据库技术

新近的研究领域是无线网络数据库技术, 此技术的链接运用了无线网络, 其节点具有移动性, 其MANET的节点可以是单股工作, 也可以和大型数据网络相链接, 保证了不同工作点的自由结合通信。工作过程中, 需要以数据库系统作为基础, 该技术目前需要面对的公共难题, 使以往数据库技术不能很好地满足MANET技术需要和能源消耗问题。今后MANET技术的研究应保证两个层次, 包括正确的理论基础和工程技术, 具体可以进行相关的模型研究, 能源数据操作, 合理进行相关专业的数据分析, 优化处理查询问题、数据挖掘问题。许多专业领域需要的数据库技术应进行专项研究, 可以提出使用的数据库, 如统计数据库、空间库、工程数据库及地理数据库等等, 其根本原理未产生变化, 知识进一步与实际应用进行融合, 巩固了数据系统的总体适合性, 强化了系统的支持力。很多专业研究人员认为, 未来的发展趋势将是专业化领域的深入和完善。MANET技术将在国家安全监控, 医疗公共事业, 环境保护, 道路规划交通管理等方面广泛应用实施。

3 结语

现代化社会的发展进步离不开数据库技术, 未来数据库技术的应用将更加广泛。应提高相关专业人员的培养, 加大对于计算机技术的重视度, 运用现代化的科学手段不断创新发展, 保障我国数据库技术发展跟上国际化水准, 为社会发展做出更大贡献。

摘要:现代社会已经演变成为高科技信息技术发达的文明社会, 数据早已变成了一种可利用的高效化资源, 其应用将是相关同类竞争的核心技术。同时, 成为决策的关键因素之一。数据库技术俨然占据了重要的地位, 广泛地受到各行各业的重视和关注。本文针对未来数据库技术的应用和整体发展方向进行分析。

关键词:数据库技术,数据库系统,发展方向

参考文献

[1]李慧, 颜显森.数据库技术发展的新方向——非结构化数据库[J].情报理论与实践, 2001 (7) .

现代数据库技术发展探究 篇8

1.1扩展型关系数据库技术

关系型数据库仍然是当今最为流行的数据库类型, 无论是多媒体内容管理、XML数据支持、还是复杂对象支持等都是在关系系统内核技术基础上的扩展。许多机构都成功地应用了关系型数据库管理系统, 并且正在寻求充分利用这一技术的途径, 对大型对象和外部文件的支持、扩展语言的支持、预定义的可扩展性的研究正如火如荼地展开, 而对象关系型的关键是增加RDBMS的应用支持能力。为达到这一目的, 数据库管理系统必须在四个主要方面可扩展:数据类型、索引结构、查询优化以及函数或方法。

1.2继续支持各种互联网应用

互联网的出现, 极大地改变了数据库的应用环境, 向数据库领域提出了前所未有的技术挑战。数据库管理系统是网络经济的重要基础设施之一。支持Internet (甚至于移动互联网) 数据库应用已经成为数据库系统的重要方面。对于互联网应用, 由于用户数量是无法事先预测的, 这就要求数据库拥有能处理更大量的数据, 以及为更多的用户提供服务的能力, 也就是要拥有良好的可伸缩性及高可用性, 由此出现了一批新的数据库技术, 如Web数据库技术、并行数据库技术、数据仓库与联机分析技术、数据挖掘与商务智能技术、内容管理技术、海量数据管理技术等。此外, 互联网提供大量以XML格式数据为特征的半结构化数据, 支持这种类型的数据的存储、共享、管理、检索等也是各数据库厂商的发展方向, 这些因素的变化推动着数据库技术的进步。

1.3向智能化集成化方向扩展

数据库技术的广泛使用为企业和组织收集并积累了大量的数据, 数据规模越来越大, 导致了联机分析处理、数据仓库和数据挖掘等技术的出现, 促使数据库向智能化方向发展。实际数据库应用中, 要求在一定时间或一定时期内自外部环境获取数据, 对已存储数据和新采集数据进行综合处理, 能及时对外部环境做出反应;现代商务管理型应用要求数据库具有主动服务能力, 进行实时监测、过程控制、协调合作计算、应急处理, 时刻做好准备具有主动服务的数据库等。企业的应用越来越复杂, 对于上述一些与时俱进的要求会涉及到应用服务器、Web服务器、其它数据库、旧系统中的应用以及第三方软件等, 数据库产品与这些软件是否具有良好集成性往往关系到整个系统的性能。Oracle、IBM等公司都将智能化与集成化作为自家产品研究和推广的重点, 微软则认为商务智能将是其下一代主要的利润点。

2现代数据库技术

在这个数字化信息爆炸的社会里, 新的过程与工程型、主动规则型、高性能与非规范超大型等现代应用不断涌现, 而且随着现代化建设的发展, 它们还会继续、快速地扩大, 这些应用已经并将继续对数据库技术提出新的要求和挑战, 从而促使了现代数据库技术的产生与发展, 出现了面向对象数据模型、实时数据库、内存数据库、主动数据库、时态数据库、信息集成等现代数据库技术。

2.1实时数据库

实时数据库兴起与美国的20世纪80年代的工业控制, 诞生了以工业监控为目的的实时数据库。到了上20世纪90年代, 实时数据库在流程工业界借助以太网的逐步普及, 主要应用于工业监控、控制和公用工程。到了2000年之后, 国内的实时数据库才逐渐崭露头角。

现实世界中, 面对大量共享数据和维护控制知识, 且具有较强的定时限制, 实时数据库的出现可以应对这一需求, 对已经存储的数据和新采集的数据进行综合处理, 再及时对外部环境做出反应。实时系统直接自现实世界采集数据、接受并执行各种处理请求, 强调系统定时性, 其设计目标是满足各种时间限制。

实时数据库的技术原理是从数据存储、数据压缩、数据实时处理技术以及数据安全技术方面出发考虑的。实时数据库一般采用缓存来增加读实时数据的及时性, 实时数据库采取了“实时”“缓存”, 从而使整体更加实时掌控。因此实时数据库核心中都有高速缓存, 通过实时的核心部件, 完成数据的采集、实时计算、报警计算、其它处理, 实时数据被不断加入磁盘历时存储, 形成可追溯的历时信息, 同时通过向应用层提供各种适配接口, 支持各种开发语言和各种应用需求的访问。

2.2主动数据库

主动数据库是相对传统数据库的被动性而言的, 所谓主动数据库就是除了完成一切传统数据库的服务外, 还具有各种主动服务功能的数据库系统。在许多实际应用领域中常常希望数据库系统在紧急情况下能够根据数据库的当前状态, 主动、适时地做出反应, 例如管理信息系统, 办公自动化系统;执行某些操作时, 向用户提供某些信息, 例如, 仓库管理系统。这类应用的特点是事件驱动数据库操作以及要求数据库系统支持涉及时间方面的约束条件。为此, 人们在传统数据库的基础上, 结合人工智能技术研制和开发了主动数据库。

主动数据库管理系统的体系结构应该具有高度的模块性和灵活性, 其主要由以下部件构成:事件检测器、条件评估器、调度器、查询执行器。以上每一部分的功能极大地依赖主动数据库所支持的知识模型和执行模型, 也受主动数据库所在开发环境的影响。总体上说, 可确定两种主动数据库的基本范畴:层次型数据库和集成型数据库。

由于目前大部分主动数据库是在传统的DBMS或面向对象数据库管理系统上研制的, 其体系结构大多是扩充数据库管理系统的事务管理部分、对象管理部件以支持知识模型和执行模型。此外, 另增加事件监测部件、条件评估部件及规则。

2.3时态数据库

传统的数据库是固定“当前视图”的, 即在数据库中的数据始终是相关时变的现实世界在一个非特定时刻的瞬像。时态数据库主要用于记录那些随着时间而变化的数据, 而这些数据对应用领域而言又是重要的, 这类应用有:金融、保险、决策支持系统等, 主要在数据库与知识库、人工智能等领域的应用较为突出。

研究时态数据库主要是为了支持时态数据管理, 或者数据与时间的关系管理, 因此时态数据库理论提出了三种基本时间:用户自定义时间、有效时间和事务时间。同时把数据库分为四种类型:瞬像数据库、回滚数据库、历史数据库和时态数据库。

目前时态数据库还没有像如Oracle、SQL Server等大型关系数据库那样的产品。在当前时态数据库技术尚未完全成熟的现状下, DBMS提供商不会轻易把时态处理功能引入现有的DBMS中, 因此, 利用成熟的RDBMS, 建立时态数据库的中间件, 是现阶段一个较好的选择。

2.4多媒体数据库

多媒体数据库是数据库技术与多媒体技术结合的产物, 是将多媒体技术引入数据库系统而产生的一种新型数据库, 将图形、声音、图像、影视等多媒体数据结合在一起, 以数据库技术、方法与机制来实现多媒体数据的共享。多媒体数据引入到数据库中之后需要考虑的几个难题:①信息媒体种类繁多, 数值数据和字符数据, 还需扩大到多媒体数据的存储、组织、使用和管理;②要解决多媒体数据集成或表现集成, 实现多媒体数据之间的交叉调用和融合;③多媒体数据与人之间的交互性。

多媒体数据类型种类繁多, 随着多媒体技术的发展及其应用, 不同的媒体类型其数据表现方式也有不同, 而且同一种媒体数据还有不同的格式, 例如有JPEG, BMP图像, 有MP3, WMA音频等。由于其特征的复杂性, 多媒体数据库应该具备支持超大数据对象的组织与存取、能表示和管理复制多媒体的数据特征、具备网络与分布式处理能力等特点, 除此之外, 还必须保证其数据连续性、实时性、同步性和真实性, 这对计算机计算处理能力、I/O吞吐量、网络带宽等提出了更高的要求。

3结束语

现代数据库应用是一个综合系统, 难以用单一的数据库技术实现, 往往需要综合应用多种数据库技术, 还需要应用其他相关技术, 本文介绍的只是现代数据库系统应用中较为典型的数据库技术。现代数据库以其多维性、智能化、网络化以及协同性为特点, 广泛应用在各行各业, 并正发挥着举足轻重的作用。尽管现代数据库的发展道路坎坷, 某些方面还存有一些不足, 如技术不够成熟、数据库性能有待提升等, 但是随着数据库体系结构的变革, 更多组织、学者的参与和关注, 相信这些不足会逐渐得到改善, 促使其得到新的发展。

参考文献

[1]刘云生.数据库系统分析与实现[M].北京:清华大学出版社, 2009.

[2]汤庸.高级数据库技术及应用[M].北京:高等教育出版社, 2008.

[3]孟小峰.Web信息集成技术研究[J].计算机应用与软件, 2003 (2) .

数据库系统的创新发展 篇9

1 数据库系统的发展

数据库系统的发展可以从时间上来讲, 大致可分为三个阶段:

第一个阶段是20世纪70年代RDBMS系统的开发应用。它是一种仅支持关系数据结构和基本的关系操作, 如选择、投影和连接等。RDBMS系统对关系操作的支持相对较低, 对数据完整性的支持也较差。运行的RDBMS一般为多用户系统, 用户通过终端并发地存取、共享数据资源, 而且联机速度并不高。数据库系统的发展还处在初期阶段。

第二个阶段是20世纪80年代SQL语言系统的开发应用。以20世纪70年代的探索发展为基石与铺垫, 80年代的SQL语言对关系操作的支持已相对比较完善, 这一时期的数据库系统以数据管理的基本功能为核心, 着眼于外围软件系统的开发, 已向高可移植性与数据库联网两个主要方向发展。SQL语言是数据关系的标准, 但是它对数据完整性的支持仍然较差。

第三个阶段是20世纪90年代以来数据库系统全面繁荣发展的全盛时期。这一时期的数据库系统研究开发的热点是联机分析处理数据。而且数据库系统的开发与应用追求开放性, 满足可移植性、可连接性、可伸缩性等。随着不断的探索, 20世纪90年代以来, 数据库系统已逐步加强了数据完整性和安全性等性能, 数据库核心层已经能实现完整性的控制。

而由于不同的应用领域对数据库的需求越来越多, 要求也越来越高, 数据库技术开始水涨船高地向非传统应用方面发展, 随着时代探索的不断进步, 新的智能数据库、知识数据库、图像数据库、面向对象数据库和可扩充数据库等开始被开发并广泛应用。据统计, 20世纪70年代以来新发展的DBMS系统中, 就有近百分之九十是关系数据模型, 其中还涌现出了许多性能优良的商品化关系数据库管理系统。大型系统如DB2, INGRES, ORACLE, INFORMIX, SYBASE, SQL SERVER等, 小型系统如Fox Pro、ACCESS、PARA-DOX等。20世纪80年代和90年代是RDBMS产品发展和竞争的时代, 在此期间发展的各种产品经历了从集中到分布, 从单机环境到网络环境, 从支持信息管理到联机事务处理 (OLTP) , 再到联机分析处理 (OLAP) 的发展过程;关系数据模型的系统功能正在不断完善, 应用也相当广泛。

2 数据库信息管理系统的类型

数据库系统随着时代的不断进步与发展也正日渐高速地更新换代。数据库信息管理系统的类型比较常见的有以下几种:

1) DB2数据库系统DB2既能够在主机上以主、从方式独立运行, 也能够在客户、服务器环境中运行。它是IBM公司开发出来的, 支持从PC到UNIX, 从中小型到大型机;从IBM到非IBM HP及SUN UNIX系统等操作平台。它以多进程多线索体系结构为核心, 具备支持面向对象的编程、多媒体应用程序、具有备份和恢复功能、支持贮存过程和触发器、支持异结构分布式数据库访问、支持数据复制的特点, 性能较好。

2) Sybase和SQL Serve数据库系统Sybase系统支持组件创建和快速应用开发, 集成了原有的服务器系列, 如SQL Server, SQL Anywhere, Sybase MPP等, 具有处理多种数据源的能力, 可为用户提供良好的开发工具和开发环境。如单一的编程模型、优化的数据存储与访问方法等。SQL Server具有单进程与多线索的体系结构, 它只有一个服务器进程, 而这个多进程连接着所有的客户, 多进程中多个并发的线索使他们共享数据缓冲区和CPU时间。但庞大繁杂的业务处理并不影响SQL Server的速度, 它的核心层实现了对数据完整性的控制, 并支持分布式查询与更新, 具有较高的性能。

3) Oracle数据库系统Oracle系统经过美国国家标准技术所 (NIST) 测试, 采用标准SQL, 能与IBM, SQL/DS, DB2, INGRES, IDMS/R等兼容, 具有兼容性;它可适用的操作系统平台很广泛, 许多不同的大、中、小型机上都可以安装, 具有很强的移植性;它能连接多种通讯网络, 支持各种协议, 如TCP/EP, net, DEC等, 具有可联结性;另外, 它所具备的四性及其高生产率又使其具有良好的开放性。Oracle具有这些优良性能使得其有开发应用以来一直在数据库领域处于领先地位。目前, Oracle产品覆盖了覆盖了大、中、小型机等几十种机型, 成为了世界上使用最广泛的关系数据系统之一。

4) XML的探索与发展应用XML于1996年向全球信息网联盟提案发迹, 前身是SGML (The Standard Generalized Markup Language) , 是IBM自60年代开始发展的GML (Generalized Markup Language) 标准化后的称呼。它与Access, Oracle和SQL Server等数据库相比, 最大的优点就是能提供更完善成熟的数据存储和分析能力, 而且其数据的表现形式极其简单, 易于掌握和方便使用。它能在处理数据时过滤掉格式转换这一步骤, 从而拥有更高的处理效率。但传统数据库存储XML数据存在一个很大的问题是XML以文本文档的方式存储, 对复杂高效的查询难以支持, 模式映射带来效率下降和语义丢失。在数据库领域, 对XML的理论研究和应用开发也一直是业内瞩目的焦点。近年来, 推出的可行性方案也不少, 如XDM类型处理系统的设计与实现, 发展前景很广阔。

3 创新的数据库技术

数据库技术的创新点主要集中在对信息资源的集成化管理以及为信息用户提供智能化、个性化的信息资源利用环境等方面。举两个例子来说, 一是VB6+Access实现企业技术创新能力评价计算机系统。此系统运行于WIN98或WIN2000系统环境, 采用的是Access2000数据库的单机模式。它是用来对企业在一段时间内在技术创新能力方面的综合能力评价的计算机系统。它具有直观、系统整洁、大局感较强的特点, 而且窗体较多。它的数据管理模块要求对数据的操作必须完整, 如当删除一个企业基本信息时, 会同时将其在各个表中的相关信息一并删除。二是以信息资源的整合为手段创建对学术信息资源的集成化管理系统。如在国外数据库生产商中颇具代表性的ISI。ISI运用WWW的链接技术, 以ISI体系内的不同数据库为核心进行以数据库的跨库检索为操作目标的资源整合, 它追求的整合方式是开放式的。它能够通过在不同类型的多种信息源之间建立相互链接, 整体提高数据库对分布式信息源的管理能力, 解决了基于Web的数据库无缝链接与跨库检索问题。

另外, 国外高速发展的现代通讯网络技术的创新点之一是一直致力于开发具有智能化、个性化的信息服务系统。如今, 以信息推送和信息拉取服务已成为个性化、智能化信息服务的重要手段。新一代的智能化、个性化代理服务系统可满足此条件下要求的依靠不同用户进行定制和细分。如文献被引用情况的追踪服务等。而且个性化、智能化的信息服务还能为信息用户提供如指南链接、加载本地资源的馆藏数据、添加机构标识等便利的实时服务。

实时、动态的数据库在线管理系统也是数据库技术的创新点之一。这种数据库系统的产生的直接因素是数据库生产商充分利用网络技术带来的便利。它的进行方式主要是提供使用统计报告、事项通知及在线服务热线等。

随着我国加入世界贸易组织, 社会经济、政治、文化包括网络技术在内都提高了国际化的程度, 加快了国际化的步伐。在我国信息基础设施建设有了数量与规模上的快速发展以后, 信息产业发展的趋势与规律要求我国信息化建设重心转移到信息服务业上来, 我国信息产业的发展的战略重点也将转为信息资源建设。随着国际互动的加深, 我国数据库系统的发展也将逐渐与国际接轨。

4 数据库与数据仓库

4.1 数据库

数据库是以一定的数据模型组织和长期存储在计算机内的大量的共享数据的集合。数据库是数据库系统的一部分, 不是独立存在的。数据库中的数据按照一定的数据模型进行组织、描述和储存, 具有冗余度小、独立性高和易扩展性的特点, 而且数据能为各种信息用户所共享。

随着网络技术在日常生活中的渗透, 数据库已成为现代信息系统不可或缺的重要组成部分。数据库的应用相当广泛, 常见的如服务业、银行业、航空业、电信业、政府等行业与部门。

4.2 数据仓库

数据仓库是在数据库的基础上发展起来的, 它的定义目前还没有统一, 而业内公认的数据仓库概念是采用的W.H.Inmon的定义:数据仓库是面向主题的、集成的、不可更新的、随时间不断变化的数据集合, 用以支持经营管理中的决策制定过程。

数据仓库有以下四个特点:1) 面向主题。数据仓库中的主题是一种数据的集合, 是一种逻辑概念, 是对分析对象进行比较完整的、一致的数据描述。每个主题在数据仓库中都是由一组关系表来实现的, 而一个主题可以划分为多个表。面向主题是指数据仓库中的所有的数据都是按照主题进行组织, 创建与使用都是围绕主题实现。比如顾客、产品、供应商等都可作为主题。2) 数据集成。数据仓库中的数据具有一致与统一的数据结构, 但这些数据的数据源存在许多矛盾如同名异义、数据类型不一致、单位与字长不一致等等。所以, 在进入数据仓库之前, 必须要进行统一与综合。3) 相对稳定。数据仓库中的数据是不易丢失, 不可更新的。一般情况下只定期添加数据而不进行修改操作。4) 反映历史变化。数据仓库中的数据从装入数据仓库到最终被删除的整个期间是不断变化的。一是随着时间的变化不断增加新的数据内容;二是数据仓库中的数据有存储时限, 逾期会自动删除;三是数据仓库中有大量的综合数据, 而这些数据会随时间的变化而不断进行重新综合。5) 支持决策。数据仓库中的大量数据是为决策分析所用的。数据仓库理论中的一个核心理念就是事务型数据和决策支持型数据的处理性能不同。

5 结束语

本文从数据库技术的发展, 数据库信息管理系统的几种类型, 创新的数据库系统及理念, 通过对数据库与数据仓库的分析, 阐述了数据库国内外数据库系统的大致发展历程与创新思想。虽然经济全球化, 市场竞争机制的引入, 使得国内的网络技术获益甚大, 但在技术与创新上仍明显存在与国外的较大差距。信息产业的竞争, 数据库管理系统的开发与创新是关键之一。缺乏信息技术的创新理念与实力, 整个信息产业裹足不前, 导致的直接后果是落后挨打。我们应该放宽眼界, 避免局限于所做的东西, 努力拓宽数据库研究领域, 不断将新技术与新应用相融合。这是必要的挑战, 也是时代必需的进步与发展。

参考文献

[1]孟小峰, 周龙骧, 王珊.数据库技术发展趋势[J].软件学报, 2004, 15 (12) .

[2]赵莉莉, 王引斌.浅谈数据库系统的发展[J].科技情报开发与经济, 2005 (14) .

[3]刘丹.XML数据库系统研究[D].武汉:华中科技大学, 2004 (1) .

[4]刘玉香.基于VB6+Access实现企业技术创新能力评价系统[J].辽宁经济职业技术学院学报, 2008 (2) .

[5]凌美秀.国外数据库的技术创新点研究[J].高校图书馆工作, 2004, 24 (6) .

浅谈数据库技术发展趋势 篇10

从数据库技术的诞生到现在不到五十年的时间里, 数据库技术经历了几个阶段的发展。到如今已经具备了相当扎实的理论基础, 同时也出现了很多成熟的商业数据产品。这些理论和产品都已被应用到各个应用领域。数据库技术作为计算机技术的一个重要研究方向, 正吸引着国内外众多的研究人员和学者的关注和重视。随着信息管理内容的不断丰富和延伸, 人们提出了许多新的数据库理论和数据库的研究范畴, 同时也出现了许多新的数据库技术。

基于对当前数据库技术的热点情况, 本文结合国内外数据库研究的研究现状和动向, 对目前数据库研究领域的一些新的研究问题和数据库技术发展的趋势方向进行了探讨与分析, 旨在起个抛砖引玉的作用。

二、国内外数据库技术的发展的驱动力

其实每隔一定的时间, 国内外的许多资深的数据库专家和学者就会聚集一堂, 通过举办定期的数据库国际会议及其他形式的活动来探讨数据库的研究现状及在发展过程中出现的问题和未来需要关注的新的技术, 同时会提出一些重要的新观点, 这些观点和想法都有可能成为数据库技术发展的风向标。

在当前应用领域里, Internet是目前主要的数据库技术发展的重要驱动力, 特别是在支持“跨企业”的应用上, 很多的企业需要与供应商和客户进行必要的信息的交流, 从而为用户提供更好支持服务。但是由于这类应用基本上都是跨企业的, 在信息传递和交流过程中, 通常要有安全和信息集成工具。由此产生的新问题需要数据库研究人员去解决, 在一定程度上促使数据库的发展。

随着自然科学的发展, 现在促使数据库技术发展的另一个重要的驱动力就是数据库在自然科学领域的应用, 特别是对于物理科学、生物科学、保健科学和工程等, 这些领域中会产生海量且结构复杂的数据集, 这些数据集的使用, 必须要有更好级别的数据库技术来支持。因此, 作为数据库研究人员必须要不断挖掘和研究新的数据库技术来满足实际的运用[1]。

数据挖掘是数据库技术的一个重要的研究领域和组成部分。近年来, 它逐渐成为推动数据库研究发展的新动力。伴随着网络和通信技术的飞速发展, 在网络上存在大量的结构复杂的数据信息, 如何在最短时间挖掘出有用的信息, 就成了数据人员面临的研究问题, 这也就是数据库中数据挖掘技术急需解决的问题。

三、当前数据库研究发展动向与趋势

为了更好的对当前数据库研究方向有个更好的了解, 笔者就信息集成、XML数据管理、微小型数据库等方面, 进行探讨目前数据库领域研究方向的发展现状、面临的问题和未来趋势。

1. 信息集成

但目前为止, 信息系统集成技术已经历了二十多年的发展历程。专家和学者针对这个研究问题, 也相继提出了许多信息集成的思想、技术体系结构和实现方法。在这些方法中, 主要研究的集成对象是传统的异构数据库系统。但随着网络技术和通信技术的快速发展, 在网络上出现了大量的、复杂的半结构化和非结构化的Web数据。如何获取网络上的这些有用数据并加以综合利用, 是目前数据库研究人员和专家学者所面临的一个问题。因此, 如何构建合适的Web信息集成系统, 就成为一个引起广泛关注的研究领域.

从目前研究的现状和研究趋势看来, 信息集成系统的采用的主要方法可以分为[2]:仓库方法和Wrapper/Mediator方法。前者处理的思路是利用全局模式对各数据源进行抽取并进行转换。这种方法比较适合在中小型的单个企业用户使用。但由于现在数据的应用主要出现在跨企业的应用中, 由于企业结构的不同, 导致了数据源的数据抽取和转化要复杂的多, 因而数据仓库的方面在实际集成数据时不适合的。目前比较流行的做法, 就是利用Wrapper/Mediator方法技术来处理信息集成操作。这种方法的核心是采用中介模式。各类异构的数据源是通过中介模式进行集成并且存储在局部的数据源中, 然后通过各数据源的包装器对数据进行转换和抽取, 最后将查询的结果反馈给用户。这类方法比较适合数据的更新操作, 因而较好满足当前网络数据的日益更新的需要。不过, 这种框架结构正受到来自三个个方面的挑战[3]: (1) 如何支持异构数据源之间的互操作性的问题; (2) 如何模型化源数据内容和用户查询的问题; (3) 由于当前数据源的查询能力受限时, 如何处理查询和进行优化的问题。

2. XML数据管理

目前在网络上存在着大量的异构数据, 这些数据大部分是以半结构化和非结构化的形式存在, 传统的数据库技术和查询技术, 已经不能满足当前数据查询的需求。当前的数据查询方式也难以支持复杂高效的查询。而且在查询过程中, 由于关系数据在与非结构化数据进行转换过程中, 容易导致丢失语义信息。

因此急需开发新的数据查询技术来解决当前面临的问题。XML作为网络上一种信息交流和转换的标准形式, 在解决异构数据方面具有不可替代的作用。

建立高效的数据查询操作, 可以通过建立合理的索引技术来实现。目前, 根据数据索引的用途的角度来划分, 可以讲XML数据索引分为三类:简单索引、路径索引和连接索引。通过建立索引可以借助索引的辅跳过不可能发生的连接结点, 从而避免对无关结点的处理, 这样可以节省访问时间, 从而达到高效查询的母的, 通过能够用来作为基本的索引组织结构有:倒排表、B+树和R树等。

目前, XML数据处理方面还存在很多未解决的问题, 其中包括: (1) 查询处理上, 是导航处理还是基于代数的一次一集合的处理问题。 (2) 实例化视图未能在查询优化过程中得到充分的利用; (3) Native XML这样原生态数据库在解决XML数据处理方面是否适合?这些问题都是有待于进一步分析与研究。

3. 微小型数据库技术

随着移动计算和嵌入式操作系统的出现与发展, 对微小型数据库系统的需求变得日益的迫切。这也使得数据库的微型化、小型化的研究得到了需求。微小型数据库技术研究, 已经从实验室研究领域逐步走向商业化的应用领域。伴随着智能移动终端 (手机、IPAD等) 的普及应用, 要求对移动数据实时处理和管理能力也在不断的提高和进步。因此近年来, 微小型数据库技术, 迎来了一个空前发展的好机遇。

通常, 微小型数据库系统可以把它看成一个只需很小的内存来支持的数据库系统内核。一般说来, 对于便携式设备来说, 占用微小型数据库系统的内存大约为2MB左右, 而针对于更为小型的掌上或其它移动设备来说, 它占用的内存将是更小, 大约为50K左右。随着电子商务和电子银行等对数据应用的增加, 面临要处理的移动数据也在不断的增大增多, 对移动数据的管理要求也越来越高。

四、小结

文中从目前数据库研究的热点问题出发, 首先分析了数据库发展驱动力, 紧接着着重对数据库研究领域研究的几个热点方向:信息集成、XML数据管理、微小型数据库技术等进行了介绍研究, 同时指出了这些领域目前还存在的问题和未来发展的方向与趋势。我们有理由相信, 数据库技术是一个值得继续深入研究的领域, 在数据库技术中始终存在很多的研究内容等待着数据研究人员和专家学者去探索。

摘要:本文就目前数据库研究的现状进行了讨论, 结合当前数据库技术发展的驱动力, 着重对数据库研究领域研究的几个热点方向:信息集成、XML数据管理、微小型数据库技术等进行了介绍, 最后其进行了总结与展望。

关键词:数据库,信息集成,XML数据,数据管理

参考文献

[1]孟小峰, 周龙骧, 王珊.数据库技术发展趋势[J].软件学报, 2004, 1 (512) :1823-1835.

[2]Meng XF.Research on the technology of Web information integration.Computer Applications and Software, 2003, 20 (11) :32-36.

大数据产业发展现状和未来趋势 篇11

在大数据时代,数据量呈几何级增长,数据类型多样化以及用户对于数据访问、分析与应用的苛刻需求,让传统的数据存储与管理难以应对。大数据时代的到来对国内客户的存储技术升级与革新提出了更高的要求。

一、中国大数据产业市场规模

随着各行业对海量数据存储和应用的需求日益迫切,信息科技特别是大数据应用技术在加速发展。中国政府已经颁布了面向未来十年的国家信息化发展战略纲要,立足于全面打造国际先进、安全可控的核心技术体系,带动集成电路、基础软件、核心元器件等薄弱环节实现根本性突破,着力构筑移动互联网、云计算、大数据、物联网等领域发展优势。

“互联网+”时代下,人类所产生的数据量呈爆炸性增长,大约每两年就翻一番。据中国产业信息网发布的报告显示,从2011年至2015年,中国大数据市场规模以30.1%的复合增长率高速增长。预计未来3年,中国大数据市场规模仍将以36%以上的速度增长(见图1)。其中,在大数据市场中,增长率最高的是存储市场,将以50%以上的速度增长,远远高于其他非大数据产品相关的市场。

二、中国大数据市场发展趋势

中国在大数据领域具有巨大的市场潜力,越来越多的IT供应商将中国大数据业务作为发展的热点。总的来看,未来大数据市场将呈现以下发展趋势:

一是开源软件为大数据市场带来更多机会。大数据市场开源软件的盛行不会抑制市场的商业机会,相反将会给基础架构硬件、应用程序开发工具、应用、服务等各个方面的相关领域带来更多的机会。

二是大数据推动软件公司间的并购。大数据概念覆盖范围非常广,包括非结构化数据从存储、处理到应用的各个环节,与大数据相关的软件厂商也非常多,但是又没有哪一家厂商可以覆盖大数据的各个方面,因此大型IT厂商将为了完善自己的大数据产品线进行并购。

三是针对大数据的一体化设备市场迅速增长。自云计算和大数据概念被提出后,针对该市场推出的软硬件一体化设备就层出不穷。我们认为,在未来几年里,数据仓库一体机、NoSQL一体机以及其他一些将多种技术结合的一体化设备将进一步快速发展。

四是出现打包的大数据行业分析应用。随着大数据逐渐走向各个行业,基于行业的大数据分析应用需求也日益增长。未来几年中针对特定行业和业务流程的分析应用将会以预打包的形式出现,这将为大数据技术供应商打开新的市场。

五是大数据推动基础架构横向拓展。为了支持大数据非结构化、不断刷新的特点,大数据的基础架构层面也会在未来发生变化。大数据的基础架构支撑已经不仅限于高性能计算层面,而且需要硬件产品更好的支持虚拟化和分布式架构的软件。同时,基于固态存储的分层存储解决方案、智能化的负载均衡网络结构也都会得到更多应用。

六是中国成为全球最重要的大数据市场之一。中国的互联网用户和移动互联网用户数量全球最多,这些终端设备每时每刻都在互联网上创造数据。同时,近年来中国企业级存储的出货量也达到全球第二位。庞大的数据容量不但令众多国际厂商重视中国市场,也使得中国的大数据应用具备了不同于国外的特点,我们有理由期待中国的大数据市场将会出现本土化的创新型解决方案。

三、大数据发展面临的挑战

中桥国际调研咨询针对中国455家企业所做的一项研究表明,当前企业在大数据存储方面面临诸多挑战。首先,巨大的数据量将给企业的存储容量带来压力,现有存储容量往往不能满足需求。其次,传统存储资源配置不合理和传统IT分层管理的方式,导致系统IT资源配置和管理的复杂性较高。购买新存储虽然可以满足海量数据和应用多元化对存储容量和性能的需求,但造成了企业存储采购和运营成本高的问题。企业在实现应用多元化的同时还要保证业务处理速度,因而对系统的并行处理能力也提出了更高要求。此外,大数据数据类型的多样化和复杂性,增加了企业非结构化数据分析的难度(见图2)。

四、大数据相关企业案例分析

2016年9月8日,紫光集团旗下紫光股份与美国西部数据举行紫光西部数据有限公司成立庆典活动。紫光西部数据有限公司(以下简称紫光西部数据),是由紫光股份持股比例为51%,西部数据持股比例为49%共同成立,其总部及研发中心位于南京,市场及销售总部位于北京。紫光西部数据将通过本地研发团队,结合西部数据和紫光集团在技术研发、设计生产、市场推广等方面的领先优势,为各行业客户提供更加符合中国市场需求的大数据存储解决方案及服务。

紫光西部数据的价值观

一个企业的价值观是决定一个企业能否长期生存的关键因素。紫光西部数据首席执行官缪刚先生表示,紫光西部数据的价值观在于,注重自主研发,在遵循标准化的基础上,致力于对行业进行深化创新和优化,提供真正适合于中国本土情况的全面的数据解决方案。

紫光西部数据未来发展方向

软件定义一切的最明显的特征就是硬件的标准化,同时高可移植性。缪刚先生表示,紫光西部数据未来将从封闭架构转向开放架构,拥抱先进技术。在未来的路线图上承诺将无厂家限制,希望通过这样的方式还给市场一个自由的未来。具体来说,紫光西部数据将从以下四个方向深入着手:

一是行业优化。由于每个行业都有自己的特点,以互联网为例,互联网今天的发展已经脱离了最早的美国模式,而迅速地进入了一个自主创新的新商业模式,所以深入理解行业的应用,针对具体行业进行开发、推广的应用方案是其未来的发展方向。

二是加强数据安全。相当一部分中国客户的数据是具有商业敏感性的,甚至一些客户的数据具有国家机密性,对这些数据使用基本的存储功能和服务是远远不够的,紫光西部数据将立足于本土,致力于为客户提供安全、可控的加密技术,真正做到让客户的数据自主、安全、可控。

三是提升数据质量。由于大数据数量巨大、来源多样化、处理要求及时(基本上30%客户的数据被用于实时处理),这要求整个IT技术架构由堆站式向扁平和融合方向发展,这样才能更好的对大数据进行存储、分析。紫光西部数据将在此基础上提供进一步的融合,从而提高数据的质量。

四是协同合作。展望未来,为更好的服务好本土市场,紫光西部数据将秉持一种开放的态度,以更加灵活、更加长远的策略,在技术研发、市场推广、客户服务等方面和各类合作伙伴一起合作,共同打造双赢的局面。

紫光西部数据未来发展举措

对于紫光西部数据未来发展举措,紫光西部数据董事长章雷先生、紫光西部数据首席执行官缪刚先生、紫光集团联席总裁齐联先生、西部数据全球高级副总裁Dave Tang给出以下答案。

一是打造集合所有知识产权的优秀平台。首先,紫光西部数据和秦淮区签署了在南京成立数据和存储研发中心的协议,这是一项重要举措。其次,加强与大学的合作。南京有很多优秀的大学,紫光西部数据将充分加强和大学的合作,希望将更多的优秀技术转化成产品。此外,加强中美合作是另一项重要举措。紫光西部数据有计划在硅谷设立分支机构,把世界的先进技术通过这个平台引进到中国。

二是协同发展。紫光股份拥有国内很好的各类客户关系,和遍布全国的分销系统网络,这个系统将对紫光西部数据的产品、服务的推广和应用都有很好的促进和帮助作用。紫光股份对紫光西部数据的支持作用,实际上体现在协同效应上,这是一个最大的支持。而西部数据在存储领域的优秀能力,提升了紫光的整体竞争能力,这对紫光西部数据又是一个最有利的支持。未来,紫光西部数据、紫光股份、西部数据三者将协同发展,共创辉煌。

三是实现创新。紫光西部数据将使用西部数据的系统,针对中国市场做一些定制和增强。中国市场有很多软件开发的工作和机会,比如在媒体和娱乐业,对于这些视频播出公司、电视台,他们需要有更多的资源来管理他们的数字媒体、素材,它们的核心是由西部数据来设计的。这其中需要很多的软件来过渡,而且非常复杂,这正是紫光西部数据的机遇所在。因为中国的解决方案和世界上其他地方还是非常不一样的。此外,在数据安全方面,要给中国客户提供数据保护,需要很强的软件开发能力,这也是紫光西部数据需要创新的领域。

产业发展数据库 篇12

2011年10月18日Gartner公司发布2012年十大战略技术报告, 将大数据列为一项需要突破的战略技术。此后, 大数据概念开始在业界和学术界中引起广泛关注。出现大数据这一主题的原因可归结为以下几个方面:数据存储费用急剧下降, 移动互联网设备的普及, 社交网络应用程序的崛起以及激增的消费数据的可用性。大数据的规模大、类型复杂、来源多样以及数据产生速度快等特性均给传统的数据管理技术带来了新的挑战, 同时也给数据库领域标准带来了机遇与挑战。

2 大数据特点及技术现状

大数据的特点首先表现在数据规模上, 数据量非常大, 从TB级上升至PB级, 并仍在爆炸性增长;其次表现在数据类型上, 数据类型多样, 包括结构化数据、半结构化数据和非结构化数据;再次表现在速度上, 数据产生速度非常快, 需要快速、实时的分析处理;最后表现在数据的价值和准确性上, 大数据被用于企业决策, 因此对大数据的真实性和正确性提出了更高要求。

在大数据时代背景下, 传统的关系数据库技术难以满足大数据分析的要求, 2004年Google公司提出的Map Reduce技术作为面向大数据分析和处理的并行计算模型, 引起了业界和学术界的广泛关注。Map Reduce是进行大规模数据分析处理的灵活而有效的工具, 相对于关系数据库, Map Reduce具有高度的扩展性、容错性、快速装载和易于使用等优点;但是, 在性能上还有待提高, 且目前基本不兼容现有的商务智能工具。关系数据库技术和Map Reduce各有优缺点, 如何融合关系数据库和Map Reduce技术, 设计同时具备两者优点的技术架构, 也是大数据分析技术的一个研究方向。

3 现有数据管理标准对大数据的支持

数据库领域标准主要分为国际标准和国家标准两类。

国际标准主要是ISO/IEC JTC1/SC32 (数据管理与交换) 分委会制定和发布的ISO/IEC 9075《信息技术数据库语言SQL》 (简称SQL) 系列标准和ISO/IEC 13249《信息技术数据库语言SQL多媒体和应用包》 (简称SQL/MM) 系列标准。

国内标准主要有四项, 2012年发布的GB/T28821-2012《关系数据管理系统技术要求》 (简称技术要求) 和2012年批准立项的三项非结构化数据管理国家标准。

3.1 SQL标准

ISO/IEC 9075《信息技术数据库语言SQL》系列标准由ISO/IEC JTC1/SC32/WG3工作组制定, 提供了广泛的支持关系表的结构化数据、用户自定义对象和XML数据的存储和检索功能。SQL标准现有9部分:

—第1部分:框架 (ISO/IEC 9075-1:2011) ;

—第2部分:基础 (ISO/IEC 9075-2:2011) ;

—第3部分:调用层接口 (ISO/IEC 9075-3:2008) ;

—第4部分:持久存储模块 (ISO/IEC 9075-4:2011) ;

—第9部分:外部数据管理 (ISO/IEC 9075-9:2008) ;

—第10部分:对象语言绑定 (ISO/IEC 9075-10:2008) ;

—第11部分:信息和定义模式 (ISO/IEC 9075-11:2011) ;

—第13部分:使用Java程序设计语言的SQL例程和类型 (ISO/IEC 9075-13:2008) ;

—第14部分:与XML有关的规范 (ISO/IEC9075-14:2011) 。

SQL标准在存储和检索结构化数据管理方面给大数据技术提供了支持。

3.2 SQL/MM标准

ISO/IEC 13249《信息技术数据库语言SQL多媒体和应用包》系列标准由ISO/IEC JTC1/SC32/WG4工作组制定, 支持文本、空间、图像等复杂数据类型的存储和检索。SQL/MM标准现有六部分:

—第1部分:框架 (ISO/IEC 13249-1:2007) ;

—第2部分:全文 (ISO/IEC 13249-2:2003) ;

—第3部分:空间 (ISO/IEC 13249-3:2011) ;

—第5部分:静态图像 (ISO/IEC 13249-5:2005) ;

—第6部分:数据挖掘 (ISO/IEC 13249-1:2006) ;

—第7部分:历史 (ISO/IEC 13249-7:2013) 。

大数据的一大特点是数据类型多样, SQL/MM标准提供了文本、空间、图像、历史数据等类型的支持。其中“空间”提供了地理信息数据处理所需的多种函数, 为处理GPS数据和地理信息的大数据应用提供了标准支持。“数据挖掘”则为在大数据基础上进行分析决策提供了支持。

3.3 技术要求

2012年发布的国家标准GB/T 28821-2012《关系数据管理系统技术要求》是我国自主制定的数据库产品类标准。该标准规定了作为大型通用的关系数据库管理系统产品, 应满足的所有功能, 这些功能按照功能性、可靠性、易用性、维护性等特性进行分类。

该标准在ETL组件、存储管理、OLAP、数据挖掘、数据集成等商务智能工具及表容量、大对象存储等方面对关系数据库如何处理大数据提供了支持。

3.4 非结构化数据管理标准

(1) 《非结构化数据表示》

该标准目前处于制定阶段, 内容包括数据模型和特征列表两个方面内容。数据模型规定非结构化数据的基础值类型范围, 数据与特征之间的层次关系;特征列表则分类型地列举出非结构化数据可以实现、提取和抽象的特征元素, 为非结构化数据管理提供交换依据。

(2) 《非结构化数据访问接口规范》

该标准目前处于制定阶段, 内容包括集群配置管理接口、任务管理接口、存储组件接口、分析组件接口、索引组件接口和搜索组件接口定义等。

(3) 《非结构化数据管理系统技术要求》

该标准目前处于制定阶段, 内容包括非结构化数据处理要求、系统功能要求、兼容性要求、接口要求和性能要求等。

大数据时代处理的数据有大量非结构化数据, 上述三项国家标准建立了非结构化数据的统一表达机制、统一了非结构化数据访问接口、规定了非结构化数据管理系统技术要求, 在非结构化数据管理方面给大数据技术提供了支持。

4 数据库领域标准的机遇与挑战

Map Reduce目前被国际广泛应用于海量数据分析, 然而, 大量数据仍然存储在SQL数据库中, 并且许多应用也离不开SQL数据库, SQL数据库进行大规模数据挖掘是必需的。这给SQL标准的发展带来了机遇, 同时由于目前没有海量数据处理框架标准和基于该框架的数据挖掘标准, 如何利用SQL机制处理大数据挖掘存在一定难度。可以考虑从以下几方面对SQL标准进行扩展:

(1) 数据存储和检索。现有的数据库语言SQL标准支持结构化数据、用户自定义对象和XML数据的存储和检索, 为支持大数据, 需要进一步支持多种新的对象类型, 制定与Map Reduce处理方式类似的新特征。此外, 还需对调用层接口进行扩展以支持分布式访问。

(2) 对复杂数据类型的支持。现有的SQL/MM标准定义的复杂数据类型包括文本、空间和静态图像, 在大数据环境下, 还需增加对多种非结构化数据的支持, 如音视频、时态数据等, 还需增加内容解决大规模数据挖掘问题。

此外, 现有的数据库相关标准中的部分内容也适用于大数据的管理, 需要识别出这些内容, 对现有管理标准进行整合, 使其能与新制定的标准一起更好地为大数据及数据分析服务。

随着大数据技术的逐渐成熟, 将会给更多的数据库相关标准制定带来机遇, 例如:术语标准、体系结构标准、接口标准和检测规范类标准等, 以满足大数据分析处理的需求。

参考文献

[1]Orlando Fla.Gartner Identifies the Top 10Strategic Technologies for 2012[EB/OL]. (2011-10-18) [2013-10-11].http://www.gartner.com/it/page.jsp?id=1826214.

[2]覃雄派, 王会举, 杜小勇, 等.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报, 2012, 23 (01) :32-45.

[3]王珊, 王会举, 覃雄派, 等.架构大数据:挑战, 现状与展望[J].计算机学报, 2011, 34 (10) :1741-1752.

上一篇:玄武岩纤维沥青混合料下一篇:中学体育教学点滴谈