数据库发展趋势论文

2024-09-23

数据库发展趋势论文(精选12篇)

数据库发展趋势论文 篇1

摘要:数据库技术在计算机科学中已经发展了30多年, 应用范围迅速扩张, 席卷了整个信息技术体, 成为在全球大数据时代到来的背景下, 发展最快, 支撑作用最大的科学技术。快发展下必然会存在一些问题, 对数据库技术进一步发展与应用形成挑战。

关键词:数据库,发展趋势,技术发展

随着其他科学技术的发展, 数据库技术的发展特征也发生了变化, 数据库技术与多科学技术结合越紧密, 才能继续扩大应用范围。从而形成新一代数据库系统, 传统的数据库只是数据库系统较为重要的一员, 另外还包括:公布数据库系统、知识库系统、多媒体数据库系统、演绎数据库系统、面向对象发展的数据库系统。本文就目前数据库技术飞速发展过程中存在的问题以及未来发展趋势进行了研究。

1 数据库技术发展过程中存在的问题

1.1 数据库的存储

在这个信息爆炸的时代, 信息来源范围越来越广, 数据量也越来越大, 各种庞杂的信息堆集在一起, 存储这些数据对传统数据库的硬件设备造成严重挑战, 对处理存储数据的运行、分析及整理的计算机算法的复杂化也提出了更高的要求。由此还引发了用户对于数据源的查询, 也遭遇严重挑战。

1.2 数据库的应用领域

计算机科学技术的发展主要依托于Internet应用环境的发展与完善。Internet的应用环境已经在改变, 逐渐由企业内部向跨企业间转型, 最终发展成万物互联时代, 为了应对大形势的变化, 对DBMS团队提出了新的要求, 如何保障与支持数据库信息安全和信息集成, 扩宽数据库技术的应用领域, 成为DBMS研究的热点。

1.3 数据库的数据流管理

数据流是由于对远程通信、金融事务、大气情况、电子商务、能源利用等测量和监管复杂的动态现象而产生的。作为数据库研究的活跃领域, 已经造成了对数据库、算法、网络以及其他计算机技术的挑战。如何优化数据流管理, 支持数据库不同流量需求, 面临众多的问题。

2 数据库技术主流的发展趋势

2.1 信息集成系统的变革

信息集成技术虽然发展了20多年, 伴随云计算和云存储技术的发展, 以及信息集成技术仅仅是针对传统异构的数据库, 必然不能满足数据库技术发展的新需求。所以, 信息集成系统的变革迫在眉睫, 充分利用云计算与云存储技术优势, 在对大量信息来源进行信息集成时, 要针对不同的数据功能和使用价值, 建立不同的信息集成算法和存储。建立数据仓库, 将各数据库的数据分门别类, 通过对全局模式的数据发掘, 实现对不同数据库的抽取和转换, 并分别存储到数据仓库中, 建立数据库搜索平台, 依据用户查询频次, 将信息集成的主次顺序整理归纳, 以实现数据库信息集成系统运行最高效。建立分布式信息集成系统, 数据库, 减少对存储数据对硬件设备带来的压力。不管采取什么样的信息技术集成, 变革高效化, 智能化, 人性化是发展的主要趋势。

2.2 移动数据专业化管理

随着无线网络和智能手机的迅速普及, 卫星数据服务的便利, 让每个人都成为了信息制造者和信息传播者, 即自媒体人。实现了随时随地对信息的访问愿景。移动数据的专业分析和管理, 并由此带来的经济增长点, 在电子商务方面, 马云、马化腾、刘强东将其演绎的淋漓尽致。在不久的将来, 移动数据量将持续保持高速的增长, 移动数据的专业化管理显得越来越重要。建立移动计算, 支持移动数据库的在互联网环境下都能够访问所需要的数据, 发展分布式客户/服务器数据技术, 有效的完成数据查询和事物处理。此外, 建立人们衣食住行的大数据移动算法, 发掘人们参与一切社会化活动的规律和需求, 为国家和政府提供移动数据支持, 提高政府工作能效。加强配套的数据传送与接收技术, 作为移动数据技术的基础, 硬件基础设施的完善也对移动数据专业化管理影响深远。

2.3 应用领域专业化

许多从事数据库技术研究的工作者, 提出了应对不同应用领域而建立专业化的数据库, 如:地理数据库, 环境状况数据库, 工程数据库, 科学数据库, 生命医学文化健康数据库等。虽然业内人士都清楚, 这在数据库技术上并不存在很大的技术瓶颈, 在数据库的搭建原理上也没有新颖的变化, 但它们一旦在一个专业领域与实际应用相结合, 此时专业化的数据库必将对数据库系统提供强有力的应用支撑作用, 尤其是在语言、需求分析、数据虚拟模型、信息查询与传递方面。随着经济的发展, 人们生活水平的提高, 使得对自己的生活品质要求越来越高。文化健康, 作为数据库的庞大空白, 必将会有越来越多的数据库开发技术研究者参与其中。建立人们健康信息的数据库, 不管是精神健康还是身体健康, 也是现在人们越来越重视的方面。部分研究者同样预言, 应用领域专业化是数据库技术发展的趋势之一。

3 结论

总而言之, 在众多计算机技术中, 数据库技术的研究是最具竞争力和应用价值的, 也将进一步推动Internet的发展, Internet的日臻完善也要求数据库技术的革新, 新的应用专业领域和管理高效需求必将成为自我颠覆式的引爆点。需要说明的是, 本文由于篇幅有限, 有一些数据库技术发展趋势未能提及, 不代表它们不重要。

参考文献

[1]孟小峰.数据库技术发展趋势[J].软件学报, 2014.

[2]明智勇.数据库技术的现状与发展趋势的探索[J].产业与科技论坛, 2013.

数据库发展趋势论文 篇2

Argo数据研究应用现状与发展趋势

海洋在调节大气环流和气候变化中起着非常重要的作用,但是受到技术条件和观测资料的限制,人们对广阔海洋垂直剖面上的温、盐度和海流资料则获之很少,不能满足气候预测的.需求.国际Argo计划的实施,提供了大量、密集的和准同步、准实时的海洋要素资料.有助于准确、全面地了解全球气候的变化;对分析大洋渔场的形成、渔业资源的分布有重大意义.目前,Argo数据已经被广泛地应用于很多领域,取得了不少研究和应用的成果.

作 者:杨胜龙 周d芳 崔雪森 伍玉梅 张晶 YANG Sheng-long ZHOU Su-fang CUI Xue-sen WU Yu-mei ZHANG Jing  作者单位:中国水产科学研究院东海水产研究所,渔业资源与遥感信息技术重点开放实验室,上海,90 刊 名:海洋渔业  ISTIC PKU英文刊名:MARINE FISHERIES 年,卷(期): 29(4) 分类号:P731 关键词:Argo浮标数据   温度场   流场   海洋资料同化   业务化预报  

浅谈大数据技术发展趋势 篇3

关键词:大数据;云计算;大数据技术;数据挖掘

中图分类号:TP311.13

随着互联网技术和应用模式的快速发展,人们生活方式在不断改变的同时也产生了巨大的数据资源。预计到2020年,全球的数据总量将远远超过人类有史以来所有印刷材料的数据总量,大数据时代即将到来。现阶段关于大数据有多种不同的定义,研究机构Gartner认为大数据是指需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;维基百科上大数据指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策目的的资讯;而麦肯锡则认为大数据是指无法在一定时间内用传统数据库软件工具对其内容进行采集、存储、管理和分析的数据集合。无论哪种定义,我们可以看出,大数据并不是一种新的产品也不是一种新的技术,就如同本世纪初提出的“海量数据”概念一样,大数据只是数字化时代出现的一种现象。

数据量的剧增、国家和企业间竞争的加剧,要求政府和企业能更准确、快速、个性化的为客户和公众提供产品和公共服务。通过大规模掌握用户的细节数据,政府和企业可以分析出通过传统数据分析手段无法获知的价值和模式,做出更为迅速、科学、准确的决策和预测。由此可见,大数据技术是预测分析、数据挖掘、统计分析、人工智能、自然语言处理、并行计算、数据存储等技术的综合运用。

1 大数据特点

从计算科学发展历程来看,物联网的兴起对数据存储和分析产生了更高层次的需求,云计算则进一步拓展了计算机的计算能力。在以上二者的共同推动之下,大数据的概念应运而生,同时也标志着计算科学进入到一个崭新的时代。大数据有着不同于传统数据对象的特点。目前的研究认为,大数据具有以下主要特征:数据规模大、数据种类多、数据要求处理速度快、数据价值密度低以及数据真实性。数据规模大体现在大数据的数据量是以PB,EB和ZB来进行衡量的;数据种类多体现在大数据的数据类型不仅是结构化数据,还包括物联网数据、社交网络数据和位置数据等数据,更多的是半结构和异构数据,数据的复杂性高;数据处理速度快体现在对静态数据和动态实时数据处理的速度与时效要求高;数据价值密度低主要体现在大数据数据量巨大但由于数据结构分散导致数据价值密度低,需要进行数据分析和推理实现价值提纯;数据真实性体现在只有真实而准确的数据才能使大数据的分析、推理和管理有意义。

2 大数据技术发展趋势

2.1 人工智能技术的结合

大数据分析的目的是挖掘大数据中有价值的信息,是从大数据中获取更准确、更深层次的知识,而不是对数据的简单统计分析。要达到这一目标,需要提高计算机的智能计算能力,让系统具备对数据的分析、推理和决策,人工智能是实现以上能力的核心技术。近年来,人工智能的研究成为学术界和企业界的研究熱点,一方面得益于计算机硬件性能的提升,另一方面得益于以云计算、大数据为代表的计算技术的快速发展,使得信息处理的速度和质量大为提高,能够快速、并行地处理海量数据。

2.2 基于数据科学的多学科融合

在大数据时代,许多学科的研究内容从表面上看存在很大的区别,但是从数据研究的视角来看,其实是有共通点的。随着数字化时代的到来,越来越多的学科在数据层面趋于一致,可以采用相似的思想来进行统一的研究。但数据科学的基础问题体系尚不明朗,其自身的发展尚未形成体系成为制约多学科融合的关键问题。

2.3 与网络技术领域的交叉融合

未来大数据将与物联网、移动互联网、云计算等热点技术领域相互交叉融合,产生更多融合不同行业数据的综合性应用。近年来计算机和信息技术发展的趋势是:前端更加简单丰富,后端更加智能快速。物联网与移动互联网促进了物理世界和人的融合,大数据和云计算提升了后端的数据存储管理和计算能力。今后,这几个热点技术领域将相互交叉融合,产生很多跨行业和跨领域的综合性应用。

2.4 大数据安全与隐私

过去几年大数据安全和隐私问题是国内外的研究热点,未来大数据的安全和隐私问题依然将是学术界和企业界研究与探讨的热点。大数据及其相关核心资源涉及企业商业机密和国家主权,引发了社会各界人士的广泛关注,因此如何保护大数据的安全以及用户的隐私成为一个亟待解决的社会热点问题。但大数据应用所产生的隐私问题、大数据系统和体系存在的安全防范方面还没有实质性的进展和突破。毫无疑问,未来大数据安全和隐私问题依然是热点趋势。

2.5 基于大数据的深度学习和众包计算

最近几年深度学习大热,在很多领域发挥了巨大的作用,成为人工智能和大数据领域研究的热门学科,未来基于大数据的深度学习还将是各大研究机构和企业的研究重点。

基于物理资源分散式的应用场景,比如以前常用的P2P技术等对于深度学习这种需要物理资源相对集中的计算方式则会有局限,而众包计算这种物理资源分散式的分布式计算平台则可以有效避免这个问题。因此基于大数据的众包计算也是未来大数据分析与应用领域的研究热点和发展趋势。

2.6 大数据技术课程体系建设和人才培养

大数据技术的快速发展和行业应用需求的快速增长,使得目前技术市场上高素质大数据技术人才严重短缺。因此,政府、高等院校和科研院所将加快建立大数据技术人才教育和培养体系,发展数据科学和工程专业,梳理和构建跨学科和领域交叉的大数据课程体系,融合计算机、数学分析统计、应用相关的学科,推动交叉学科数据分析技术的发展以及人才的培养。只有在体系建设和人才培养方面与市场需求同步,大数据技术才有不断向前发展的基石和动力,因此这也是未来大数据技术行业的发展趋势。

3 结束语

大数据技术是我们利用计算技术对大数据进行分析和推理并挖掘其潜在价值的技术,具有重要的研究意义和实际价值。本文从大数据的概念展开讨论,详细分析了大数据技术研究目前面临的一些问题以及未来的研究热点和发展趋势。尽管目前大数据技术研究已经取得了一些研究成果,但在学科基础、应用广泛性、系统支撑基础、生态环境、人才底蕴等方面仍然存在一些亟需解决的问题,需要政府、企业高等院校和研究机构等共同努力,推动国家在该领域的技术水平走到世界前沿。

参考文献:

[1]王元卓,靳小龙,程学旗.网络大数据:现状与挑战[J].计算机学报,2013(06):1-15.

[2]陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013(25):142-146.

[3]Thomas H.Davenport,Paul Barth,Randy Bean.How'BigData'is Different[J].MIT Sloan Management Review, 2012,54(01):22-24.

[4]Victor Mayer-Schonberger,Kenneth Cukier.大数据时代[M].杭州:浙江人民出版社,2013:193-232.

作者简介:刘琳(1981-),女,四川泸州人,讲师,本科,研究方向:计算机网络、多媒体技术。

浅谈数据库技术发展趋势 篇4

从数据库技术的诞生到现在不到五十年的时间里, 数据库技术经历了几个阶段的发展。到如今已经具备了相当扎实的理论基础, 同时也出现了很多成熟的商业数据产品。这些理论和产品都已被应用到各个应用领域。数据库技术作为计算机技术的一个重要研究方向, 正吸引着国内外众多的研究人员和学者的关注和重视。随着信息管理内容的不断丰富和延伸, 人们提出了许多新的数据库理论和数据库的研究范畴, 同时也出现了许多新的数据库技术。

基于对当前数据库技术的热点情况, 本文结合国内外数据库研究的研究现状和动向, 对目前数据库研究领域的一些新的研究问题和数据库技术发展的趋势方向进行了探讨与分析, 旨在起个抛砖引玉的作用。

二、国内外数据库技术的发展的驱动力

其实每隔一定的时间, 国内外的许多资深的数据库专家和学者就会聚集一堂, 通过举办定期的数据库国际会议及其他形式的活动来探讨数据库的研究现状及在发展过程中出现的问题和未来需要关注的新的技术, 同时会提出一些重要的新观点, 这些观点和想法都有可能成为数据库技术发展的风向标。

在当前应用领域里, Internet是目前主要的数据库技术发展的重要驱动力, 特别是在支持“跨企业”的应用上, 很多的企业需要与供应商和客户进行必要的信息的交流, 从而为用户提供更好支持服务。但是由于这类应用基本上都是跨企业的, 在信息传递和交流过程中, 通常要有安全和信息集成工具。由此产生的新问题需要数据库研究人员去解决, 在一定程度上促使数据库的发展。

随着自然科学的发展, 现在促使数据库技术发展的另一个重要的驱动力就是数据库在自然科学领域的应用, 特别是对于物理科学、生物科学、保健科学和工程等, 这些领域中会产生海量且结构复杂的数据集, 这些数据集的使用, 必须要有更好级别的数据库技术来支持。因此, 作为数据库研究人员必须要不断挖掘和研究新的数据库技术来满足实际的运用[1]。

数据挖掘是数据库技术的一个重要的研究领域和组成部分。近年来, 它逐渐成为推动数据库研究发展的新动力。伴随着网络和通信技术的飞速发展, 在网络上存在大量的结构复杂的数据信息, 如何在最短时间挖掘出有用的信息, 就成了数据人员面临的研究问题, 这也就是数据库中数据挖掘技术急需解决的问题。

三、当前数据库研究发展动向与趋势

为了更好的对当前数据库研究方向有个更好的了解, 笔者就信息集成、XML数据管理、微小型数据库等方面, 进行探讨目前数据库领域研究方向的发展现状、面临的问题和未来趋势。

1. 信息集成

但目前为止, 信息系统集成技术已经历了二十多年的发展历程。专家和学者针对这个研究问题, 也相继提出了许多信息集成的思想、技术体系结构和实现方法。在这些方法中, 主要研究的集成对象是传统的异构数据库系统。但随着网络技术和通信技术的快速发展, 在网络上出现了大量的、复杂的半结构化和非结构化的Web数据。如何获取网络上的这些有用数据并加以综合利用, 是目前数据库研究人员和专家学者所面临的一个问题。因此, 如何构建合适的Web信息集成系统, 就成为一个引起广泛关注的研究领域.

从目前研究的现状和研究趋势看来, 信息集成系统的采用的主要方法可以分为[2]:仓库方法和Wrapper/Mediator方法。前者处理的思路是利用全局模式对各数据源进行抽取并进行转换。这种方法比较适合在中小型的单个企业用户使用。但由于现在数据的应用主要出现在跨企业的应用中, 由于企业结构的不同, 导致了数据源的数据抽取和转化要复杂的多, 因而数据仓库的方面在实际集成数据时不适合的。目前比较流行的做法, 就是利用Wrapper/Mediator方法技术来处理信息集成操作。这种方法的核心是采用中介模式。各类异构的数据源是通过中介模式进行集成并且存储在局部的数据源中, 然后通过各数据源的包装器对数据进行转换和抽取, 最后将查询的结果反馈给用户。这类方法比较适合数据的更新操作, 因而较好满足当前网络数据的日益更新的需要。不过, 这种框架结构正受到来自三个个方面的挑战[3]: (1) 如何支持异构数据源之间的互操作性的问题; (2) 如何模型化源数据内容和用户查询的问题; (3) 由于当前数据源的查询能力受限时, 如何处理查询和进行优化的问题。

2. XML数据管理

目前在网络上存在着大量的异构数据, 这些数据大部分是以半结构化和非结构化的形式存在, 传统的数据库技术和查询技术, 已经不能满足当前数据查询的需求。当前的数据查询方式也难以支持复杂高效的查询。而且在查询过程中, 由于关系数据在与非结构化数据进行转换过程中, 容易导致丢失语义信息。

因此急需开发新的数据查询技术来解决当前面临的问题。XML作为网络上一种信息交流和转换的标准形式, 在解决异构数据方面具有不可替代的作用。

建立高效的数据查询操作, 可以通过建立合理的索引技术来实现。目前, 根据数据索引的用途的角度来划分, 可以讲XML数据索引分为三类:简单索引、路径索引和连接索引。通过建立索引可以借助索引的辅跳过不可能发生的连接结点, 从而避免对无关结点的处理, 这样可以节省访问时间, 从而达到高效查询的母的, 通过能够用来作为基本的索引组织结构有:倒排表、B+树和R树等。

目前, XML数据处理方面还存在很多未解决的问题, 其中包括: (1) 查询处理上, 是导航处理还是基于代数的一次一集合的处理问题。 (2) 实例化视图未能在查询优化过程中得到充分的利用; (3) Native XML这样原生态数据库在解决XML数据处理方面是否适合?这些问题都是有待于进一步分析与研究。

3. 微小型数据库技术

随着移动计算和嵌入式操作系统的出现与发展, 对微小型数据库系统的需求变得日益的迫切。这也使得数据库的微型化、小型化的研究得到了需求。微小型数据库技术研究, 已经从实验室研究领域逐步走向商业化的应用领域。伴随着智能移动终端 (手机、IPAD等) 的普及应用, 要求对移动数据实时处理和管理能力也在不断的提高和进步。因此近年来, 微小型数据库技术, 迎来了一个空前发展的好机遇。

通常, 微小型数据库系统可以把它看成一个只需很小的内存来支持的数据库系统内核。一般说来, 对于便携式设备来说, 占用微小型数据库系统的内存大约为2MB左右, 而针对于更为小型的掌上或其它移动设备来说, 它占用的内存将是更小, 大约为50K左右。随着电子商务和电子银行等对数据应用的增加, 面临要处理的移动数据也在不断的增大增多, 对移动数据的管理要求也越来越高。

四、小结

文中从目前数据库研究的热点问题出发, 首先分析了数据库发展驱动力, 紧接着着重对数据库研究领域研究的几个热点方向:信息集成、XML数据管理、微小型数据库技术等进行了介绍研究, 同时指出了这些领域目前还存在的问题和未来发展的方向与趋势。我们有理由相信, 数据库技术是一个值得继续深入研究的领域, 在数据库技术中始终存在很多的研究内容等待着数据研究人员和专家学者去探索。

摘要:本文就目前数据库研究的现状进行了讨论, 结合当前数据库技术发展的驱动力, 着重对数据库研究领域研究的几个热点方向:信息集成、XML数据管理、微小型数据库技术等进行了介绍, 最后其进行了总结与展望。

关键词:数据库,信息集成,XML数据,数据管理

参考文献

[1]孟小峰, 周龙骧, 王珊.数据库技术发展趋势[J].软件学报, 2004, 1 (512) :1823-1835.

[2]Meng XF.Research on the technology of Web information integration.Computer Applications and Software, 2003, 20 (11) :32-36.

数据库发展趋势论文 篇5

1.业务需求方面,企业将关注点越来越多地从“CRM前台”的建设转向“CRM后台”。众所周知,CRM系统主要涉及企业在销售、营销和客户服务等三个关键方面。其中,客户服务/销售流程的管理可以称之为CRM的“前台”系统,而客户营销则可以看作为“后台”系统。在前几年,国内企业CRM系统的建设主要从客户服务和销售方面入手,大力建设企业的客户服务系统、销售自动化系统等,来规范企业内部的服务/销售流程,提高效率,

之所以选取这两个方面,主要是由于这两个方面是企业急需改善的环节,实施起来相对容易,而且见效快。经过几年的建设,企业越来越多地关注客户个性化体验,主动的“一对一”营销等功能。

2.从采用的技术而言,操作型CRM系统建设高潮逐渐回落,企业对分析型CRM系统的实施日趋重视,尤其在电信、银行业。前几年,国内企业CRM系统建设以采用CTI、Web等核心技术为主来建设Call Center、Web门户系统。随着呼叫中心、网上自助服务系统的建立和完善,企业与客户之间沟通的渠道得到了极大的扩展,但如何利用业务系统以及渠道系统收集的客户信息进行深层次的分析和挖掘,提升操作型CRM系统的业务价值,以便更好地服务于企业业务发展目标,成为企业的当务之急。以数据仓库技术、数据挖掘等为基础的分析型CRM技术越来越多地被企业所采用。

数据库发展趋势论文 篇6

【摘要】大数据时代,是互联网时代发展到一定程度的一个阶段。从数字出版的角度来说,大数据包含了用户的题材喜好,阅读习惯,阅读频率,出版物消费行为特点等等多维、立体的信息。通过对大数据的获取和分析,我们可以更准确地把握从内容制作到发行的数字出版价值链,从而使生产、管理及营销模式做出相应调整变化,最终实现经济效益最大化。

【关键词】大数据时代;数字出版;专属定制;精准推送;知识性服务

最近一年来,各行各业的人都在谈论大数据,并探讨如何利用大数据来变革所在行业的生产、管理以及营销模式,大有一种大数据时代来临后的紧迫感和使命感。作为一个在出版行业浸淫多年的从业者,我想在此浅谈一下数字出版在大数据时代会有哪些变化以及出现哪些新的趋势。

首先我们要了解一下,何为大数据。大数据这个名词,其实主要是基于互联网上的数据的一个概念。简单一点说,大数据就是互联网公司在日常运营中生成、累计的用户网络行为数据,并且这个数据规模非常庞大。专业一点说,它是一种立体信息获取的能力,包括结构性数据,半结构性数据,以及非结构性数据。

大数据时代,是互联网时代发展到一定程度的一个阶段。如果说互联网的兴起,导致了数字出版形式的出现,那么大数据时代,必将使数字出版升级到一个更高级的阶段。从数字出版的角度来说,大数据包含了用户的题材喜好,阅读习惯,阅读频率,出版物消费行为特点等等多维、立体的信息。通过对大数据的获取和分析,我们可以更准确地把握从内容制作到发行的数字出版价值链,从而实现最大的经济效益。

笔者认为,随着大数据时代的来临,数字出版业将会出现以下几个方面的变化。

趋势一,出版社从出版图书转向数据内容服务,并且组织形态发生变化。在数字出版的第一阶段,出版社只是在图书的出版形式和发行形式方面进行了数字化的变革。那么在大数据时代,出版社将不再只是出版图书产品,而是向提供数据内容服务方向转变。从读者的角度来讲,通过互联网获取数据作为学习、研究或者解决各种问题的时候,面对网络上海量的数据,难以分辨和无从下手,此时便需要有专业的机构或研究者整理这些数据,并做成大数据产品以供其使用。面对这样的情况,出版社就需要在大数据系统的支持下,以自身专业的能力,满足读者研究和学习的需求,从而使出版成为对读者提供知识服务的过程。出版社这种角色的转变,也将会导致自身组织形态的变化。那种“小、快、专、灵”专业内容工作室将成为主要的出版组织形态。未来的出版社可能由流程化职能为核心转向基于专业能力的工作室群体。

趋势二,读者行为影响内容走向,专属内容智能定制。在大数据时代,网络上海量的数据,有很多来自于读者自身的原创。读者不仅仅是内容的接收者,也是内容的生产者。比如,我们在网络上看到的大量的原创微博,微信,照片,视频,音频,这些内容虽然在一定程度上存在瑕疵,但是却被很多读者关注和喜爱。这些原创的内容,如果经过出版社的专业整理加工,制作出优质的内容产品,那么也一定会有不错的市场。这也解决了我们很多出版社不知道如何选题,如何策划读者喜爱的内容产品的难题。另外,在传统出版时代,出版社出版什么,读者看什么。数字出版时代,大众喜欢什么,出版社出版什么。大数据时代,即使是原来被忽略小众读者的需求,也具备商业价值。基于对大数据的分析,出版社能够将读者进行更精细和准确地进行分类,并为其策划和制作需求的内容产品,做到“读者有专属自己的书”。一旦读者的个性化需求得到了很好的满足,他一定会为这样的产品买单。

趋势三,数字发行实现精准推送,发行成本大大降低。大数据的核心功能之一就是预测。在大数据时代,我们能够掌握读者在数字阅读领域所有阅读终端的行为,包括在什么时间,在哪儿看了哪本书的哪一页,甚至每一页停留的時间等信息。根据这些信息,我们能够掌握读者的阅读行为偏好和趋势。同时,我们也能利用大数据将读者需要的图书产品信息精准地推送。信息精准推送,降低了广告成本,同时也使得发行成本大大降低。

趋势四,数字阅读升级为知识解决方案。在大数据的影响下,生产模式上,数字出版将改变以往以书、文献等为单位的粗放型生产模式,转而形成以知识要素为单位的细粒度、数据化生产模式,强调科研全过程发表,新知识传播,跨学科、跨行业、多角度应用,以及多媒体展现。在形式上,综合文字、图片、音视频、动画、软件模拟、数值模拟等多种形式的多媒体学习与研究产品,将为读者展现一幅幅立体化、可视化、动态化的知识地图,把读者的思维带进无限的知识空间和想象空间。在内容上,未来数字阅读将实现从书本、文献阅读向知识要素阅读的重要转变。通过对出版内容、读者多元需求的深入了解和把握,一个个高度浓缩的知识要素将与互联网读者的知识需求紧密结合起来,形成一个大数据研究与学习的国际平台,实现读者、作者的直接交流,推动整个数字出版产业向知识服务型转变。

在大数据时代,数字出版面临的更多是一种新的发展机遇。出版社也好,我们从业人员也好,都应该以一种积极的心态去面对,尽快适应新技术变革带来的行业变化,并努力探索一条能够更好地满足广大读者的数字出版道路!

参考文献

[1]中国网传媒经济http://media.china.com.cn.

数据库技术的发展现状与趋势 篇7

随着计算机技术的出现, 20世纪六十年代, 产生了数据库技术, 其从60年代中期至今只有不到40年的历史, 但其发展速度之快是其它技术所不及的。第一代数据库 (20世纪70年代) 的层次型、网状数据库系统发展到第二代 (20世纪80年代) 的关系型数据库, 在很多领域都取得了巨大的成功, 随着应用领域的不断扩展, 关系数据库的限制和不足日益显现出来, 随着面向对象技术的出现, 面向对象数据库系统成为数据库系统领域研究和发展的新方向。21世纪初, 数据库技术与人工智能技术、网络技术、并行计算技术、面向对象技术和多媒体技术等的相互融合, 成为数据库新的发展趋势, 为人们日常生活中使用数据库开拓了更广阔的空间, 本文详细的介绍了数据库新的发展趋势。

2. 传统数据库简介

随着科学技术的发展, 海量数据涌入人们的日常生活之中, 为了便于使用和自动化管理, 数据库技术的产生是必然的, 它作为数据管理的最新技术方法, 被人们广泛的用于管理各种文件。在数据文件管理方法的发展的过程中, 最初的人工管理阶段使用人工管理数据文件, 但是随着数据量的增大, 到了20世纪六十年代, 产生了数据库管理方法, 每一个管理方法都是对前一个管理方法的补充和完善。数据库管理方法使用数据库管理系统 (DBMS) 对数据进行自动化管理, 大大的提高了人们日常工作的效率, 自从数据库管理系统诞生以来, 人们基于各种数据库管理系统又产生了各种数据库系统。在数据库系统阶段, 由于计算机技术发展迅速, 信息化管理广泛应用于企业决策, 数据处理规模急剧膨大, 此时的数据库系统要求更高的数据独立性和共享性, 这也是引起数据库技术发展的根本原因。随着数据库理论的逐渐完善, 数据库管理技术为满足用户和企业的各种需求, 基于数据共享和独立于应用程序, 提出了层次数据库、网状数据库和关系数据库, 提供了更广泛的数据管理方法。

2.1 层次数据库系统

在数据库管理发展历程中, 最早出现的数据库管理系统就是层次数据库管理系统, 该系统基于层次模型, 层次模型按层次结构来组织事物, 模拟现实世界而构造的一种模型, 该模型实际上采用的是一种树状结构, 具体的说, 其整体数据模型就是由若干基本的层次结构即树的集合而成。层次结构模型比较符合人们的思维习惯, 因此该种结构具有层次清晰, 易于理解等优势, 而且与文件系统相比, 大大的提高了现实数据管理的效率。层次结构模型具有以下特点:有且只有一个结点无双亲节点, 其它结点有且仅有一个双亲节点。该特点使得所有基于层次模型的数据库管理系统局限于只能处理1:n的实体关系, 但是现实世界的关系是复杂的, 该特点就大大的约束了层次数据库的发展。IBM公司为Apollo工程而设计的大型数据库管理系统MS就是基于层次结构模型的典型代表, 该数据库管理系统已经发展到到IMSV6。

2.2 网络数据库系统

众多的数据库研究者为了满足人们的现实需要, 克服层次数据模型的缺点, 而提出了网状数据库管理系统。网状数据库系统使用的模型是网状结构, 改数据库模型的结构图是一有向图。网状数据模型的结构特点是:允许存在一个以上的结点没有双亲节点;至少存在一个结点拥有多于一个的双亲节点。网状结构使得采取该结构的数据库管理系统能够处理m:n的实体联系, 这就意味着它能解决实体之间的各种复杂联系, 具体的办法是将网状结构分解成称为系的集合, 即用系统来刻画每一个实体之间的联系, 用系值来表示各个字段记录值之间的联系。数据库系统史上采取网状数据库管理系统方案的是CODASYL是DBTG。

2.3 关系数据库系统

在三中传统的数据库模型中, 影响最为深远、应用最为广泛的数据结构模型就是关系数据库模型。关系数据库的基本理论是关系数学, 有着严格的数据基础, 这是层次模型和网状模型无法比拟的, 关系模型简单明了, 方便使用, 数据的逻辑独立性高, 对于关系数据库来讲, 我们只需要维护一张二维表即可。关系数据库的雏型起源于20世纪60年代初期, 在此之后, 许多数据库方面的专家学者对这种数据库进行了深入的研究探讨, 其中以美国的IBM公司的研究员EFCod贡献最为卓越, 其对系统且严格的对数据的关系模型作了深入的分析研究。自1970年开始以来, 他连续发表多篇文章用以证明关系模型, 为关系数据库的发展奠定了理论基础, 其中在1976年发表的“R关系:数据库关系理论”更被数据库界视为一篇里程碑式的论文, 此篇论文中他提出了关系规范化的理论, 并第一个提出数据库的操作语言可以用关系代数和关系演算来完成。在关系数据库发展的过程中, 众多的数据库专家对关系模型理论做出了深入的研究, 不但取得了丰富的理论成果, 同时也开发出了一系列的数据库模型, 其中最早、最有名的数据库管理系统有美国加州大学伯克莱分校研制的INGERS, IBM公司开发的System R。由于关系数据库理论的不断发展与完善, 数据库理论逐渐成熟, 数据管理量不断增大的需求, 使得数据库管理公司发现这一领域所蕴藏的巨大商机, 于是造就了一批著名的数据库管理软件开发商, 除了早期的IBM公司外, 随后成立的Informix公司、Oracle公司和Sysbase公司等, 各个公司都试图在数据库管理商场上分一杯羹, 因此由于开发商的介于, 对数据库理论和应用的发展起到了积极的推动作用。

3. 现代数据库的特点

随着21世纪的到来, 网络技术、软件工程和人工智能等计算机技术迅速发展, 这些技术和数据库技术的实现了完美的结合, 使其不断完善和进步。对于新的数据库, 面向具体的领域产生了不同的数据库管理方法, 在新的数据管理情况下, 随着各种新技术方法的引入, 数据库技术呈现出如下特点。

3.1 数据库中融入了面向对象的方法和技术

关系数据库管理系统采用关系代数作为理论基础, 是非常严格的, 其已经可以满足许多现实生活中的应用, 随着软件工程技术的发展, 原来结构化的软件工程方法迈入到了面向对象时代, 同时也推动着数据库的应用由传统领域向面向对象领域扩展, 近年来在这些领域中, 人们对数据库的要求越来越高, 由于数据本身的结构和存储形式各不相同, 并且不同领域对数据的处理技术的要求也比一般的事物管理环境繁琐复杂, 于是就要求数据库设计技术必须要有相应的提高, 主要包括一下方面:新的数据类型的定义和处理;系统模式的定义和修改;复杂对象的定义;定义新的存储方法;对大型对象的存储和操作等。这些现实需求仅仅依靠传统的数据库技术是不能够解决的, 因此众多的数据库研究者将面向对象的软件工程方法引入数据库领域, 从而产生了面向对象数据库管理系统 (OODBMS) 。该方法的目标是把面向对象技术和数据库技术集成在同一个系统中, 首先使得OODBMS是一个数据库系统, 必须具备相应的数据库系统的功能和各种操作处理能力, 其次有要求该系统是一个面向对象的数据库系统, 其中包含了面向对象的各种软件设计方法、概念和技术, OODBMS与传统的数据库系统相比, OODBMS在应用于更加复杂系统的模拟、表达和处理能力等方面具有明显的优势, 当然, 由于面向对象数据库理论的不是很成熟, 不够完善, 但随着数据库技术和面向对象技术的不断发展和改进, OODBMS必将得到广泛应用。

3.2 网络技术的发展使得分布式数据库诞生

随着网络技术的发展, 人们希望共享所有有用信息, 原来的集中式数据库将数据存储于单个计算机上, 其设计模式基于单个的计算机, 难以实现这个目标, 于是众多的数据库研究者提出了分布式数据库的概念, 该技术把数据库技术与计算机网络技术相结合, 对于应用的人们来讲, 每一个计算机网络内部的计算机都是数据库的一部分, 网络内的每个节点都具有独立的处理能力, 并且能够执行局部应用, 对于访问数据库的应用程序来讲是透明的。分布式数据库具有以下特点:数据具有独立性且分布透明;各个数据库节点既能自主管理本节点的数据, 又能整合数据进行全局管理;提高了数据的可靠性与可用度;增大了数据库的容量;改善了系统的性能和并行处理能力。当前应用最广泛的分布式系统之一是Sysbase数据库。

3.3 多媒体技术应用于数据库领域

随着Internet的发展, 人们越来越依赖于从网上多媒体数据源中获取自己需要的信息。多媒体技术是计算机技术、通信技术和影像技术相互结合的产物, 多媒体数据的类型非常复杂, 包含的信息量大, 分布性、实时性和交互性等要求较强, 因此多媒体数据的特性就要求必须创建合适的数据库, 以便能够保证多媒体信息的应用。随着数据库和多媒体技术的深入研究, 众多学者将数据库技术与多媒体技术有机结合, 形成了便于人们使用的多媒体数据库管理系统。多媒体数据库最重要的一个特点就是将大量的数据压缩表示, 将数据对象中包含的固有特性映射成相应的数据库表示形式, 以便能够使用数据库管理系统处理数据对象, 一般来讲, 多媒体数据库包括数据对象、数据对象的说明以及与对象相关联的方法等三个基本组成成分。现代网络上使用的多媒体视频等都是基于多媒体数据库创建的。

3.4 数据库技术与人工智能的有机结合

在计算机的发展史上, 人工智能作为计算机领域的一个重要的分支, 其应用和理论研究一直使人们关注的热点。人工智能和数据库相结合, 使数据库更加智能化, 也就是通常意义上所说的数据挖掘和知识工程, 能够在大量的数据中发现所蕴含的知识, 以满足人们的需要。人工智能是研究计算机模拟人的大脑思维和模拟人的活动的一门科学, 因此逻辑推理和判断是其最主要的特征, 但对于信息检索则效率很低。数据库技术是数据处理方面的技术, 对于数据的存储、管理、检索有其独特的优势, 但对于逻辑推理却无能为力。造成这种局面的原因是过去这两方面的研究视野均局限于本领域, 人工智能只追求逻辑推理正确无误, 不注意空间和时间的限制, 因而研制的语言和专家系统效率低是必然的。而数据库开发者拼命争取时间和空间, 但他们只考虑数据库实际存放的数据, 而不考虑库中虽无但通过推理可得出的数据。智能数据库系统是人工智能与数据库技术相结合的产物。它具有两种技术的优点而避免了他们的缺点, 是一种新型的数据库系统。

4. 现代数据库的发展趋势

上面讲述了现代数据库与面向对象、分布式网络应用系统、并行计算、人工智能和多媒体技术相互结合之后, 产生了相应的数据库系统, 下面我们就这些数据库系统一一加以介绍。

4.1 对象—关系数据库 (ORDB)

目前, 相当一部分数据库是以关系数据库为基础和标准的, 以关系操作为基础的数据库操作语言与普通的编程语言相结合, 几乎可完成任意的数据库操作, 对于应用系统来讲, 是极其方便的, 但是关系数据库也有其缺陷, 那就是仅仅依靠一张二维表的数据结构过于简单, 数据类型有限, 制约程序设计中的数据结构, 因此面对现实生活中的需求, 很难达到最优的效果, 因此面对不同的使用状况, 关系数据库的优点反而成为制约关系型数据库发挥作用的瓶颈。面向对象方法原本是一种程序设计思想, 以现实世界中的实体对象为基本元素进行描述复杂的客观世界, 近年来一直被推崇, 将面向对象思想引入到数据库设计中, 可以大大的提高数据库设计过程中实体的描述, 将关系数据库的简介功能与面向对象思想有机结合, 就产生了对象—关系数据库, 该数据库时数据库技术的一个热门的研究方向, 但是就目前来讲, 由于面向对象数据库和对象—关系数据库各有其所长, 面向对象数据库的理论尚在初级阶段, 因此河南把面向对象的优势充分的发挥出来, 并且理论界和工业界对对象—关系数据库一直持有不同观点, 所以市场上成熟产品还不多, 不过我们坚信, 随着数据库和面向对象的研究发展, 其将来一定会有很好的前景。

4.2 数据仓库技术

随着数据库规模的壮大, 人工智能的发展, 数据市场上已经出现了数据仓库 (DW) 一语, 就数据仓库来讲, 其是当今数据库讨论组及商业出版社的热门话题。数据仓库的提出人Bill Inmon对数据仓库定义如下:数据仓库是面向主题的、稳定的、综合的、随时间变化的大规模数据集合。人们创建数据仓库的主要目的是帮助急需的人——公司高层主管、智囊公司等, 根据所有不同来源的数据使用各种数据挖掘的方法, 发现数据中隐含的知识、规则或者模式, 以帮助他们做出正确的决策, 或者学习现实世界的知识生产新的知识。与数据库相比, 数据仓库不仅仅是一个产品, 而且是一系列综合性的解决方案的实施过程, 支持高层决策系统。数据仓库最主要的工具是数据挖掘, 该方法可以对数据库中存储的海量数据进行分析处理, 从散乱无规律的数据中提取对人们有用的信息, 以便使用。创建一个数据仓库或数据市场需要以下一些基本步骤: (1) 确定数据源; (2) 明确目标数据库设计的设计; (3) 对源数据进行扩展、转换和净化操作; (4) 为用户提供并支持分析工具。数据仓库是数据管理技术和市场上一个方兴未艾的领域, 构建一个数据库不仅与数据库的技术和产品有关, 还涉及到许多相关的问题, 如企业历史数据的收集、加工、管理以及企业自身数据体系的延伸等。随着企业的发展, 企业数据容量必然会不断增加, 数据仓库技术的应用也必将越来越广泛, 这反过来又会促进数据仓库技术的进步。

4.3 实时数据库技术

实时数据库 (RTDB) [11, 12, 13]的产生有其历史背景。虽然以关系型为代表的三大经点型数据库在传统应用领域获得极大成功, 然而在一些事务信息对时间要求较高的应用领域它却存在致命的弱点。传统的实时的系统 (RTS) 虽然支持任务定时限制, 但在维护大量数据, 保证数据的完整性和一致性方面又有不足。在许多应用领域, 如电子银行、武器制导、实时仿真等, 这些领域既需要维护大量数据, 又要保证这些活动的时间性和实效性, 这时仅用数据库技术或实时系统均不能有效的处理这些事务。因此众多的数据库研究者提出了实时数据库管理系统 (RTDBMS) , 这也是数据库研究的一个重要方向。RTDBMS是RTS与传统数据库系统集成而来的, 该数据库系统涉及到许多数据库中从未使用的概念和技术, 比如说实时响应, 高响应比等概念理论, 鉴于RTDBMS本身也是一种数据库管理系统, 因此它具有一般DBMS的特点, 但它和DBMS也有极大的区别, 其最根本区别在于RTDBMS对数据和事务的定时限制上。传统的DBMS要求系统可靠性高, 数据绝对正确, 用户接口良好;RTDBMS却更优于数据和事务的定时限制方面, 必要时宁可牺牲数据的绝对正确性也要保证数据信息的定时性要求。RTDBMS集成了数据库技术与实时事务处理技术, 因此它必将对传统数据库系统起巨大的推动作用, 从而推动数据库技术在现代信息社会中更广泛的应用。

4.4 分布式数据库

分布式数据库系统是计算机技术和网络技术结合的产物, 是在集中式数据库系统的基础上发展起来的。分布式数据库系统 (DDBS) 包含分布式数据库 (DDB) 和分布式数据库管理系统 (DDBMS) 。在分布式数据库系统中, 一个应用程序可以对数据库进行透明操作, 数据库中的数据分别在不同的局部数据库中存储、在不同的机器上运行、由不同的DBMS进行管理、由不同的操作系统支持和被不同的通信网络连接在一起。分布式数据库系统适合于单位分散的部门, 允许各个部门将其常用的数据存储在本地, 实施就地存放本地使用, 从而提高响应速度, 降低通信费用。分布式数据库系统与集中式数据库系统相比具有可扩展性, 通过增加适当的数据冗余, 提高系统的可靠性。在集中式数据库中, 尽量减少冗余度是系统目标之一。其原因是冗余数据浪费存储空间, 容易造成各副本之间的不一致性。而为了保证数据的一致性, 系统要付出一定的维护代价。减少冗余度的目标是用数据共享来达到的。而在分布式数据库中却希望增加冗余数据, 在不同的场地存储同一数据的多个副本, 其原因是: (1) 提高系统的可靠性、可用性当某一场地出现故障时, 系统可以对另一场地上的相同副本进行操作, 不会因一处故障而造成整个系统的瘫痪。 (2) 提高系统性能系统可以根据距离选择离用户最近的数据副本进行操作, 减少通信代价, 改善整个系统的性能。

5. 结束语

大数据的发展趋势 篇8

大数据 (Big Data) 是指那些超过传统数据库系统处理能力的数据。它的数据规模和转输速度要求很高, 或者其结构不适合原本的数据库系统。为了获取大数据中的价值, 我们必须选择另一种方式来处理它。数据中隐藏着有价值的模式和信息, 在以往需要相当的时间和成本才能提取这些信息。如沃尔玛或谷歌这类领先企业都要付高昂的代价才能从大数据中挖掘信息。而当今的各种资源, 如硬件、云架构和开源软件使得大数据的处理更为方便和廉价。即使是在车库中创业的公司也可以用较低的价格租用云服务时间了。对于企业组织来讲, 大数据的价值体现在两个方面:分析使用和二次开发。对大数据进行分析能揭示隐藏其中的信息。例如零售业中对门店销售、地理和社会信息的分析能提升对客户的理解。对大数据的二次开发则是那些成功的网络公司的长项。例如Facebook通过结合大量用户信息, 定制出高度个性化的用户体验, 并创造出一种新的广告模式。这种通过大数据创造出新产品和服务的商业行为并非巧合, 谷歌、雅虎、亚马逊和Facebook它们都是大数据时代的创新者。

2 大数据的特点

2.1 海量性

企业面临着数据量的大规模增长。例如, IDC最近的报告预测称, 到2020年, 全球数据量将扩大50倍。目前, 大数据的规模尚是一个不断变化的指标, 单一数据集的规模范围从几十TB到数PB不等。简而言之, 存储1PB数据将需要两万台配备50GB硬盘的个人电脑。此外, 各种意想不到的来源都能产生数据。

2.2 易变性

大数据具有多层结构, 这意味着大数据会呈现出多变的形式和类型。相较传统的业务数据, 大数据存在不规则和模糊不清的特性, 造成很难甚至无法使用传统的应用软件进行分析。传统业务数据随时间演变已拥有标准的格式, 能够被标准的商务智能软件识别。目前, 企业面临的挑战是处理并从各种形式呈现的复杂数据中挖掘价值。

2.3 多样性

一个普遍观点认为, 人们使用互联网搜索是形成数据多样性的主要原因, 这一看法部分正确。然而, 数据多样性的增加主要是由于新型多结构数据, 以及包括网络日志、社交媒体、互联网搜索、手机通话记录及传感器网络等数据类型造成。其中, 部分传感器安装在火车、汽车和飞机上, 每个传感器都增加了数据的多样性。

2.4 高速性

高速描述的是数据被创建和移动的速度。在高速网络时代, 通过基于实现软件性能优化的高速电脑处理器和服务器, 创建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数据, 还必须知道如何快速处理、分析并返回给用户, 以满足他们的实时需求。根据IMS Research关于数据创建速度的调查, 据预测, 到2020年全球将拥有220亿部互联网连接设备。

3 大数据时代对生活、工作的影响

大数据, 其影响除了经济方面的, 它同时也能在政治、文化等方面产生深远的影响, 大数据可以帮助人们开启循“数”管理的模式, 也是我们当下“大社会”的集中体现, 三分技术, 七分数据, 得数据者得天下。

“大数据”的影响, 增加了对信息管理专家的需求。事实上, 大数据的影响并不仅仅限于信息通信产业, 而是正在“吞噬”和重构很多传统行业, 广泛运用数据分析手段管理和优化运营的公司其实质都是一个数据公司。麦当劳、肯德基以及苹果公司等旗舰专卖店的位置都是建立在数据分析基础之上的精准选址。而在零售业中, 数据分析的技术与手段更是得到广泛的应用, 传统企业如沃尔玛通过数据挖掘重塑并优化供应链, 新崛起的电商如卓越亚马逊、淘宝等则通过对海量数据的掌握和分析, 为用户提供更加专业化和个性化的服务。

大数据在个人隐私的方面, 大量数据经常含有一些详细的潜在的能够展示有关我们的信息, 逐渐引起了我们对个人隐私的担忧。一些处理大数据公司需要认真的对待这个问题。

4 大数据的趋势

趋势一:成为重要战略资源。在未来一段时间内, 大数据将成为企业、社会和国家层面重要的战略资源。大数据将不断成为各类机构, 尤其是企业的重要资产, 成为提升机构和公司竞争力的有力武器。企业将更加钟情于用户数据, 充分利用客户与其在线产品或服务交互产生的数据, 并从中获取价值。此外, 在市场影响方面, 大数据也将扮演重要角色———影响着广告、产品推销和消费者行为。

趋势二:数据隐私标准将出台。大数据将面临隐私保护的重大挑战, 现有的隐私保护法规和技术手段难以适应大数据环境, 个人隐私越来越难以保护, 有可能会出现有偿隐私服务, 数据“面罩”将会流行。预计各国都将会有一系列关于数据隐私的标准和条例出台。

趋势三:网络安全问题凸显。大数据的安全令人担忧, 大数据的保护越来越重要。大数据的不断增加, 对数据存储的物理安全性要求会越来越高, 从而对数据的多副本与容灾机制提出更高的要求。网络和数字化生活使得犯罪分子更容易获得关于人的信息, 也有了更多不易被追踪和防范的犯罪手段, 可能会出现更高明的骗局。

趋势四:大数据学科诞生。数据科学将作为一个与大数据相关的新兴学科出现。同大数据的时代商业模式的创新分析。

参考文献

[1]李建义.数据库原理及开发.北京:中国水利水电出版社, 2005.

[2]维克托·迈尔·舍恩伯格.大数据时代.浙江:浙江人民出版社, 2012.

[3]艾伯特-拉斯洛·巴拉巴西.爆发.北京:中国人民大学出版社, 2012.

[4]大数据时代下的大数据到底有多大?中国大数据, 2014-03-6.

数据库发展趋势论文 篇9

关键词:大数据时代,“四V”特征,税务数据

数据浪潮迎面而来,全世界每一分钟有超过六亿个电邮产生,你的每一次买卖交易、每一次就诊记录,都被巨大的数字网络记录下来,网络平台每秒包含数百万个事件。美国数据科学家维克托·迈尔·舍恩伯格专注于数据研究10年之后,提出“大数据(Big Data,BD)”的概念,认为大数据带来的信息风暴正在改变人们的生活、工作和思维,大数据带来了一次重大的时代转型。

1 我们已进入大数据时代

2014年热播美剧《纸牌屋》,是大数据运用的成功典范,美国总统奥巴马在第二季开播几小时前发Twitter呼吁:“明天《纸牌屋》回归,请大家不要剧透。”《纸牌屋》的制造商是Netflix,Netflix基于其3 000万北美用户观看视频时留下的行为数据汇入后台进行分析,由此在纸牌屋的拍摄、内容和发布方式上进行了一系列革新,果然取得了巨大的成功。在大数据时代里,谁能掌握好数据,谁就能提高洞察力,谁就能抢占先机和主动权。

通常把大数据的特征概括为“四V”。一是体量大(Volume Big)。全世界的数据量级可用海量、巨量乃至超量来描述,并且每日还在快速增长。二是多样化(Variable Type)。大数据的范畴非常广泛,网页、图片、视频、图像、声音与位置等信息都属于大数据的内容。三是快速化(Velocity Fast)。数据流往往需要快速、持续的实时处理。四是高价值和低密度(Value Highand LowDensity)。以视频安全监控为例,连续不断的监控视频中,有重大价值者可能仅为一两秒的数据流,从这一两秒的数据流,可能会挖掘出最有价值的图像信息。

2 国外先进的大数据应用借鉴

2.1 美国交通安全管理局的成功实践

美国被称为“车轮上的国家”。1966年,美国的人口数为1.96亿,有1.01亿注册驾驶员、0.94亿机动车辆,车祸死亡人数首次突破了5万,成为全美餐前饭后讨论的焦点话题。针对此现象,美国国会第一时间做出行动,在最短的时间内通过了《高速公路安全法》,要求联邦政府“立即建立一套有效的交通事故记录系统,以分析确定交通事故及伤亡的原因并采取相应措施”。交通安全管理局因此事件的触动成为美国联邦政府最早开始大规模收集、分析、应用数据的部门之一。通过对交通事故的全方位数据分析,有针对性地制定相应措施,自此,美国每年车祸死亡人数呈下降趋势,到2011年,虽然此时美国的人口和车辆的数量、密度相比1966年都成N倍增长,但交通事故死亡人数为32 310人,同比减少1.7%,创下了自1949年以来的最低水平。

2.2 澳大利亚税务局的大数据应用

澳大利亚税务局利用大数据,着力让税务机关更为精确地打击“不遵从”行为。2006年,澳大利亚税务局投资5000万澳元,建立大数据分析平台,着力于提升海量数据分析和评估技术,把握偷税趋势和特征,对纳税人进行分类管理,对不同纳税人制定了不同的风险监控指标,并采取多种措施予以重点监管,取得了非常好的成效。澳大利亚税务局还通过基于大数据平台的风险评估对个人所得税、退税构建了一套行之有效的审核指标,筛选出疑点退税申请人并进行重点审查,成效显著。

3 国内税务部门大数据实践及存在问题

在大数据时代,要想占领制高点,全面应用大数据是实现税收现代化的必由之路。全国各地很多税务局都积极行动起来,在大数据潮流中勇于实践和创新。

3.1 税务系统数据应用主要做法

有的省税务局建立了云计算平台和大数据平台,广泛采集工商、海关、银行等部门数据,大量收集互联网涉税交易数据,建立涉税企业数据分析及风险预警机制。对碎片化的信息进行分析和提炼,对一些漏税的情况进行查补,作为纳税评估的依据,效果非常好。有的省通过对税收数据的深入分析,了解纳税人的特征,对纳税人加以细分,针对各种不同特征群体纳税人提供个性化服务,提高纳税服务水平。还有的税务局以发票信息为主的同时,多方位收集涉税信息,分析我国经济发展的情况,分析区域经济体治理架构和经营模式,总结出企业生产经营的周期规律,充分体现了大数据应用的价值。

3.2 税务系统数据应用存在问题

税务系统应用大数据虽取得了一些成就,但仍然存在一些问题。主要表现在以下几个方面。一是数据应用协调机制较差。业务部门和技术部门之间交流和沟通不够,缺少一个相互制约的工作流程及相应的管理监督机制。二是数据质量仍存大量问题,数据共享范围较窄。综合征管系统是系统整合的核心系统,仍然存在大量数据录入不完整、不准确等问题,导致出口退税、防伪税控、车辆购置税、货运发票以及电子申报和税银系统数据不完整。其次,数据共享范围不够。使数据分析中许多与纳税人紧密相关的银行帐面信息、企业工商信息、海关信息、相关联企业信息以及各省之间企业信息仍无法实现共享,从而制约了数据应用与分析的准确性和有效性的提高。三是数据应用在整体范围上主动性、能动性和连贯性不够。在较多情况下,基于数据应用分析可以有效筛选出可能有问题的纳税人,但在后续的流程与制度规定上,包括现有的稽查选案在内的各种后续管理都难以有效利用数据分析结果来提高工作效率和水平,后续征管流程的脱节使得数据应用无法充分体现其价值。

4 大数据时代税务数据发展趋势的思考

4.1 大数据时代优化税收征管

大数据时代为优化税收征管奠定了坚实的数据基础。通过共享丰富的第三方社会信息,集成、整合现有信息系统,并运用大数据处理技术进行分析比对,实现税务人员随时随地分析纳税人申报、缴税的真实性和准确性。通过建立功能齐全、内容丰富、便捷高效的全流程无纸化网上办税平台,纳税人打破时间和空间的局限实现7*24小时便利办税。为完成上述目标,从数据角度考虑需重点做好以下工作。

(1)全面拓宽数据共享。全面拓宽数据共享范围(如实现工商、海关、银行、公安、国地税等信息共享,实现网络涉税信息共享),打造高品质的数据共享平台,从法治层面明确信息共享的职责分工、质量标准、工作流程和绩效评价,为获取丰富的第三方信息提供了有力的保障。

(2)提高数据质量。制定数据质量管理办法、考核办法和数据变更规范等制度,在税务系统组织进行基础数据的清理。建立数据质量问责机制,对新录入的数据出现问题的严格问责,逐级追究责任。利用信息技术,建立数据安全监控机制,一旦发现有违规操作,系统自动预警,及时查处,防范数据安全风险。理清数据与数据之间的逻辑关系,做到逻辑关系明确清晰,提升数据质量。

(3)借助高效的大数据分析工具。面对海量数据,单纯依靠人工无法处理。借助先进的信息化手段,实现涉税数据间的逻辑关联、智能比对、自动验证和实时预警,才能事半功倍,把复杂问题简单化。如利用Hadoop进行大数据分析,实现对组织收入、税源管理、风险管理等各方面工作的全面监控,并大幅度降低成本。

4.2 利用大数据挖掘技术应用数据

要充分挖掘大数据价值,必须要有一套行之有效的管理机制,包括科学合理的机构、岗责、工作制度和流程,按照渐近式的建设模式,建立和完善大数据应用平台,根据不断变革的业务需求,突出重点,分步实施,重点聚集以下工作。

(1)以优化纳税评估为基础。根据我国不同时期的经济发展情况、不同地区的产业结构和行业特点、纳税人的生产经营规模、财务核算情况等信息资料,借助大数据分析手段,根据不同税种和税源情况,制定出科学合理的纳税评估指标,建立和完善科学合理的纳税评估预警系统;按照建模、分析评估、实地调查、评定处理等程序,对纳税人申报缴税的真实性和准确性进行全面系统的评估,做到有的放矢,精准管理。

(2)以实现全过程执法监控为核心。基于大数据,通过建立税收征管和执法行为监控体系,实现税收征管全过程留痕,多方位监控税务部门的执法行为,做好事前、事中和事后监控三个环节,让权力在阳光下运行,从源头上防控廉政和执法风险。

(3)以提供决策支持为重点。通过数据挖掘技术对数据分类处理,分析不同地区的经济总量、宏观税负、行业税负、税收总量等指标,分析税收收入与经济发展的关系,科学判断税收收入增减的原因,从而发现税收管理和执法中的不足之处。通过构建各种经济发展模型、税收模型,在大数据分析和挖掘的基础上,实现科学估算收入规模和准确预测税收走势,为领导决策提供有力的科学依据。

(4)以提高纳税服务水平为根本。充分运用数据分析、数据共享和数据挖掘等手段,开展以提升纳税服务水平为主要目的关联性分析,以数据的方式了解纳税人涉税事项的发生频率以及涉税事项之间的关联程度,用数据说话,对纳税人进行分类管理,不断创新纳税服务手段,优化服务方式,拓宽服务内容,从而科学安排服务流程,提高服务水平,为纳税人提供特色服务,真正实现纳税人所盼,税务人所向,提升纳税服务的满意度和税收遵从度,降低纳税成本和税收流失率,实现数据兴税。

5 结语

大数据时代,是一个大规模生产、分享和应用数据的时代,数据在税收业务中的核心价值日渐体现,从信息管税到数据管税,如何从大数据中挖掘出税收征管的价值,税务部门任重道远,大有可为。

参考文献

[1]徐子沛.大数据:正在到来的数据革命[J].当代贵州,2012(31):64.

[2]陈如明.大数据时代的挑战、价值与应对策略[J].移动通信,2012,36(17):14-15.

数据库发展趋势论文 篇10

关键词:数据库管理系统,关系数据库,结构化查询语言,信息处理

0引言

数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它诞生于距离现在60多年以前,随着信息技术和市场经济的迅猛发展,尤其是20世纪90代以后,数据管理不再单纯的对数据进行存储和管理,逐渐转变成用户所需要的不同种类数据管理模式。数据库有很多种不同的类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统,都在各个方面得到了广泛的应用。

1数据库的发展历史简述

1.1数据管理的产生

数据的产生可以追溯到60多年以前,只不过刚开始数据是非常简单的。通过大量的对比、分类和表格绘制的机器来运行大量的穿孔卡片,对数据进行处理,而处理结果就是打印或者是制成新的卡片。数据管理就是对穿孔的卡片进行保存和处理。

而数据库系统诞生于上个世纪60年代,在当时已经使用计算机对数据开始进行管理,对于数据的共享要求就随着计算机使用而提升。传统数据文件不能满足人们的实际需求,所以, 能够对数据进行统一管理和共享的数据库管理系统就因此而产生了。数据库模型是整个数据库系统的核心基础,不同种类的数据库管理系统软件,都是以这种模式作为基础的。因此,通常情况下,也根据模型的实际特点把数据库分为不同的类型, 其中包括网状、层次以及关系这三大类数据库。

1961年,美国通用电气公司开发出世界上第一个网状数据库.但是这种数据库还存在一定局限性,只能在通用电气公司的主机上运行,而这种只有单一的数据库,通过人工编码生成, 后来由古立德公司进行了重新的编写,并对其进行了重新的命名。网状数据库对层次和非层次的事物都能进行自然的模拟, 所以,网状数据库在其发展史占有非常重要的位置。

层次数据库是在网状数据产生以后而诞生的,1968年由美国的IBM公司研发的,这是一种适合主机层次的数据库。从数据库的产生到现在IMSV6都在一直提供着数据群集、数据共享、消息列队等特性支持。这个具有40多年的历史的数据库, 在商务智能以及网络应用连接上都在扮演全新的角色。

虽然,网状数据库和层次数据库已经很好的解决了数据集中和数据共享的问题,但是在处理数据的独立性和抽象上还是存在一定程度上的缺陷。而数据关系库就有效的解决了这一问题。1970,IBM的科德博士首先提供了关系模型的概念,给关系数据库奠定了良好的基础。1976年,由霍尼韦尔公司研发了第一个关系数据库。这种数据库以关系带位数理论作为基础, 随着长时间的应用和完善,技术手段也越发的成熟。

1.2结构化查询语言

1974年,IBM公司的Ray Boyce和Don Chamberlin将科德博士的关系数据库中十二条准则的数学定义,运用关键习语法进行表达,从而诞生了结构化语言查询。这种语言其中囊括了查询、操作、定义和有效控制,同时也是一个综合性强、通用关系良好的语言数据库。并且还能指出用户可以做什么,不可以做什么,是一种非常高级的语言,进而实现了对数据库周期中所有的操作,还能够和关系数据库进行交互,与编程语言一同进行工作。结构化查询语言的标准改变也指示着关系数据库的发展走向。1986年,结构化查询语言成为了美国的标准,并且在同一年公布了标准的结构化查询语言标准。

2数据库网络安全问题解决途径

随着数据库技术的发展,网络的普及化,也导致了数据库受到了来自网络安全威胁。例如,数据库被篡改数据、数据库中的数据被恶意窃取,通过假冒他人身份造成恶劣的影响。所以,在数据管理员创建完用户以后,一定要保证用户最为基本的权限,方便连接到数据库,并且能够进行查看和创建对象。 这样就能保证用户在登陆应用程序时,应用程序使用的是数据库用户登陆,杜绝了应用程序用户,使用数据库的用户,登陆数据库,对数据库造成不要的损害。所以,在日常工作中,一定要对数据库进行经常性的备份。例如,Oracle数据库,是规模较大的网络数据库,可以通过互联网和TCP/IP协议,用户就可以在网络终端上,对Oracle的数据库进行直接访问。但是, 客户端想要访问数据库,不仅要通过TCP/IP协议,还要结合Oracle公司开发研究的Net工具,并且在不同版本的数据库里名称的叫法不同,Net工具所具备的功能是越来越完善的。所以,数据库网络安全问题也得到了很多好的解决。

3数据库技术未来的发展趋势

随着科学技术的不断进步和发展,数据模型的种类也变得非常丰富,新的技术手段也在层现叠出。现阶段,每隔一段时间,国际上的数据库专家就会聚到一起,分析探讨数据库的实际情况、存在的问题、未来发展需要关注的重点。数据信息的本质和来源也是在一直变化的,而互联网、Web、自然科学、 电子商务等都是信息和信息处理的有力支撑,然而,相对低廉的传感器就可以将物体的形状和位置进行汇报,这种汇报还具有一定的实效性。在新的环境中会引出很多具有一定趣味性的数据库问题。

而数据库在实际的应用范围内,互联网是现阶段最为主要的驱动力,尤其是在一些涉及到多家企业的应用上。以往,应用都是在企业本身内部,在一个行政区域范围内对其进行优化和完善。现如今,多数企业对与物品供应方和客户之间的交流更为重视,如何能够给客户提供更好的服务。而这一应用就需要使用信息集成和信息安全的有效工具,也正是因为这样,就产生了与数据相关的新问题。另外一个使用应用的领域就是自然科学,而其中使用应用最为频繁的就是物理、生物以及保健科学等。因为这些科学领域,会产生数量庞大的数据集成,需要使用更加高级的数据对其数据进行处理。此外,还要使用数据分析器对数据进行有效的管理,并且还要对有序列的数据进行保存和检索,对世界范围的数据进行集成。

除了要面对信息管理领域给予的困难挑战外,传统的数据库管理系统中,例如,在数据模型、访问方式、查询处理代数、 控制、查询等方面上都将有一定变化,以上种种问题都得到了深入的研究。互联网在两个不同的方面上,既深度和广度,都对数据库提出了新的挑战。站在深度的角度上看,互联网环境中,部分数据管理进行的假设,都是不成立的,需要在新的背景下,对数据库技术进行调整、完善和改进;从广度的角度出发,新的问题就要使用新的手法和措施对其进行解决,从解决问题的过程中,寻找到技术上的突破和创新。

4结论

数据库发展趋势论文 篇11

【关键词】 大数据;银行业;互联网金融;发展趋势

一、大数据的概念和研究回顾

1.大数据的概念。

目前,大数据还没有一个明确的概念。维基百科以“大数据”被定义为“一个庞大而复杂的,难以使用现有的数据库管理工具来处理数据集”。美国研究公司的Gartner认为,大数据是新的处理模型有较强的决策权的需要,洞察能力和过程的大规模优化能力,高增长率和多样化的信息资产。

2.大数据的本质特征

James、Vlahos、Risenthal、Jonathan和Black等通过大数据发现,大数据的本质特征的研究,一是分析对象的相关数据,对数据的不只是部分,但数据不全;两强调数据的复杂性,即探索应力之间的关系;非因果关系。

二、大数据带给银行业的历史机遇

1.广阔的业务发展空间

目前,在大数据库的基础上,互联网金融的发展突飞猛进,对银行业造成了不小的影响。中国的传统银行过去对大数据的应用是有限的,你可以从网上银行的快速发展经验借鉴。随着多元化社交网络平台的快速发展,银行与客户之间的联系渠道也不局限于传统的网点,越来越多的人选择了便捷的移动互联网和第三大媒体平台来完成交易。导致大量的结构性和非结构性数据交织在一起,大量的,这给银行提供了更广阔的发展空间。通过对银行大数据的分析,挖掘、更全面的把握客户资源、更高效的产品营销,更大程度上拓展了其业务空间。

2.科学的信息决策判断

传统银行业在判断信息的决策上,往往更多的是基于经验的判断或相对较小的市场调研范围。然而,在信息的大数据时代,大数据的价值中所包含的信息,不能仅仅依靠历史的经验和市场调查,掌握所有的信息,必须通过挖掘大数据的处理和分析,以深入了解银行业本身和整个市场的情况,谈随着数据业务的风险程度和银行资源的评价更为科学的银行绩效评价和合理有效配置,使银行的决策更加科学、合理和有效的。

3.优秀的经营管理能力

目前,为了满足消费者多样化的需求,越来越多的项目在银行业务中,对业务流程的发展提出了更高的风险识别和监控的要求。但在大数据的视角下,通过对业务发展过程中的数据挖掘,可以有效地挖掘出潜在的风险,并及时根据客户的属性、行为和信用风险监控体系建立一个合理、有效的。

三、大数据背景下银行业的未来发展

1.打好数据基础、培养专业人才

大数据时代,大部分数据来源于各种社交平台,电子商务媒体、多种类型、数据的增长远远超过了传统的数据库技术,构建了数据仓库管理的能力。银行要处理大数据,我们必须充分考虑到各种硬件和软件成本、劳动力和材料成本、管理成本和效率和安全成本等因素,以挖掘大数据的价值。因此,第一银行推进技术创新,开发适合高效的软件程序和硬件平台,建立大数据仓库,为数据的收集、存储和分析提供支持。其次,银行可以有效地从海量数据中提取有价值的信息,你需要培养专业人才,不仅需要熟悉大数据技术人才,也需要考虑数据业务人才的能力,需要数据科学家的综合素质。

2.开展精准营销、提高客户满意度

中国的传统商业银行发展至今,日积月累的很长一段时间后,在客户的身份信息有非常丰富的数据信息,消费与收入、风险偏好、资产状况、交易习惯等。之前和之后的大数据技术营销策略差异的应用可以发现,相比之下,一方面,可以得到客户的贡献度、活动和行为的客户特征的偏好,使这些数据在许多银行客户的需求和潜在的商业机会,更好地了解客户,更好地识别客户的服务起点。根据客户的特点进行分类,通过差异化的营销设计,组织营销活动,推荐相关的产品和服务,以提高银行的精准营销能力;另一方面,数据处理是由客户服务中心进行咨询、投诉,及时的产品或服务中发现,客户意见收集的数据分析,了解不同人群的需求和偏好,做到以客户为产品和服务的设计和开发中心,提供客户提供更加个性化的服务准确,提高客户满意度。

3.推进跨界合作、创新产品业务

近年来,各国为了促进金融发展和繁荣,鼓励民间资本进入银行业,越来越多的企业开始形成网络参与金融业,建立了各种类型的第三方支付公司。金融企业通过各种代理、销售代理来涉足一般的商务活动。在大数据刺激互联网金融增长的大数据中,银行必须适应形势发展的需要,积极寻求跨界合作。银行可以通过与电子商务平台的战略合作,扩大大数据,分享对大客户数据的处理和分析的结果,得到用户行为更多的信息,更快速、准确地把握客户的行为特征。此外,微信的普及,微博客和其他社会媒体目前,银行应该根据虚拟社区服务及时的客户需求,创新产品和服务,提供更优质的金融服务,信息服务和商业服务的客户。

四、结语

通过本文的分析可以看出,在这一阶段,在大数据时代的逐步成熟,商业银行需要适应新时代的金融服务的发展,保证金融信息新业务模式的顺利进行,促进企业数据的发展。但无法照搬西方发达国家的模式,商业银行的财务信息的发展是一个渐进的探索和发展,成熟的过程中,需要政府、商业银行、信息技术服务公司的共同努力。

参考文献:

[1]阙方平.大数据时代银行业十大转型趋向[J].银行家,2013( 11) : 25.

[2]陈晓雁.基于大数据的银行业管理路径探索[J].价值工程,2014( 1) : 134.

[3]李璠,贾鸿飞.大数据时代银行业的机遇与挑战[J].中国金融电脑,2012( 12) : 25.

[4]韩耀强.金融行业大数据应用崭露头角[N].通讯产业报,2013.15.01.

作者简介:

数据库发展趋势论文 篇12

1.1 大数据的概念

随着科技的不断发展, 继云计算物联网之后, 大数据成为全球关注的焦点问题, 大数据凭借自身巨大的潜在价值, 备受社会各界的认可和关注。从2009年开始, 在互联网上开始流行大数据, 专家和学者们分别从不同的角度对大数据进行定义。由于大数据本身抽象性比较强, 进而在一定程度上增加对其定义进行统一的难度。

对于大数据, 在内涵方面, 一方面大数据包含海量数据和大规模数据, 另一方面大数据包含各种复杂的数据类型;在处理数据方面, 大数据的响应时间比较迅速, 并且由传统的周、天、小时等逐渐向分、秒转变, 借助云计算物联网技术, 数据处理成本不断降低, 同时数据处理速度不断提高。

1.2 大数据的特征

对于大数据来说, 通常情况下, 是指规模超过10TB的数据集, 规模性、多样性、高速性和价值性是大数据的主要特征。

1.2.1 规模性

随着经济的发展, 科学技术的进步, 数据信息出现爆长, 社交网络、移动网络、智能终端等逐渐成为人们掌握数据信息的来源, 据相关统计显示, 近4亿的淘宝网会员每天产生约20TB的商品交易信息;约10亿的Facebook用户每天产生超过300TB的日志信息;Google通过云计算平台每天处理超过13.4PB的数据。在数据大爆炸时代, 人们在智能算法, 数据处理平台, 以及先进的处理技术方面都提出了更高的要求, 进一步对大规模的数据进行统计分析和预测, 以便做出实时处理。

1.2.2 多样性

由于产生数据的应用系统和设备存在差异, 进而在一定程度上决定了大数据形式的多样性, 其多样性主要体现为:一是财务系统数据、信息管理系统数据、医疗系统数据等结构化数据, 这些数据的特点存在较强的因果关系;二是视频、图片、音频等非结构化数据, 该数据的特点是数据之间不存在因果关系;三是HTML文档、邮件、网页等半结构化数据, 这些数据的特点是数据之间存在比较弱的因果关系。

1.2.3 高速性

与海量数据相比, 大数据的区别, 主要体现在:一是在数据规模方面, 大数据的规模更大;二是在数据处理的响应速度方面, 大数据的要求更为严格, 并且都是对数据进行实时分析, 而不是所谓的批量分析, 对于数据来说, 输入、处理、丢弃等都是立刻见效, 根本不存在延迟现象, 对于大数据来说, 其高速性主要体现在数据的增长速度和处理速度两个方面。

1.2.4 价值性

有价值的数据在大数据中只占很小的比例。从大量不相关的数据中, 对未来趋势与模式预测分析有价值的数据进行挖掘, 这是大数据价值性的重要体现, 对这些有价值的数据, 通过机器学习方法、人工智能方法或数据挖掘方法等进行深度分析, 进而广泛运用于农业、金融、医疗等领域, 以便创造更大的价值。

2 微小型数据库技术

随着科学技术的不断进步, 在微小型数据库系统需求方面, 嵌入式操作系统为数据库技术开辟了新的空间。目前, 微小型数据库技术逐渐从研究领域延伸到应用领域。对于微小型数据库系统来说, 通常情况下, 可以将其定义为:数据库系统的内核仅需一个很小的内存就可以支持。在微小型数据库系统中, 对于便携式设备来说, 其内存空间一般只有2MB, 对于掌上设备或者其他手持设备来说, 其内存空间通常只有50KB。内存空间的大小在一定程度上影响和制约着微小型数据库系统的运行速度。根据占用内存的大小, 可以将微小型数据库系统分为:超微DBMS (pico-DBMS) 、微小DBMS (micro-DBMS) 和嵌入式DBMS。

在各种智能型嵌入设备或移动设备上, 通过将微小型数据库系统与操作系统进行集成, 进而确保设备的征程运行。目前, 微小型数据库技术逐渐从研究领域延伸到应用领域, 同时涌现出各种微小型数据库产品。在各种智能设备中, 随着移动数据处理和管理需求的不断提高, 在学术界、工业界、军事领域和民用部门等给予了嵌入式移动数据库技术高度重视, 并且不断实用化。

3 微小型数据库的发展

随着科技的发展, 对数据管理提出新的要求和挑战, 研究和开发工作出现一片繁忙的景象。研究的重点依然是更高的性能, 以及更为复杂、多样的数据。

3.1 面向云平台的数据管理技术

通过对计算、存储、网络等硬件资源进行整合, 云平台为用户提供了虚拟化技术, 进而在一定程度上为用户使用这些资源提供了便利性, 同时确保了经济性。对于云计算来说, 虚拟化和动态伸缩性是其主要的特点。在管理面向操作型应用数据、分析型应用数据的过程中, 采用云平台还需面对许多的挑战, 例如, 在具有动态伸缩性的云平台上, 如何支持事务处理, 如何在云平台上部署新的存储模型, 如何放置数据, 如何对数据进行容错, 以及如何将新的索引结构部署到云平台上等, 以及如何在云平台上将数据库当作一个服务进行部署, 随着时代的不断发展, 上述问题需要继续进行深入研究分析。节能、隐私保护和安全等关键问题还需要面向云平台的数据管理进行解决和处理, 进而赢得用户的信任, 进一步实现产业化。

3.2 大数据统一处理平台

通过对上文进行分析, 围绕RDBMS和Hadoop技术分别产生了一个分析生态系统, 以及正在产生一个分析生态系统。在某些方面这两个系统是重叠的, 在这种情况下, 能否采取相应的措施, 将两项技术和生态系统融合到一起?在理论界、工业界的共同努力下, 一定会形成一个统一的大数据处理框架以及生态系统。但是需要深入的研究某些问题, 例如, 如何在一个存储层上 (数据组织方式) 上整合多类型的数据;如何采取措施建立智能的存储层;如何改进和优化查询的调度算法, 以及执行算法等, 进而在一定程度上与多核、GPU、异构环境等相应的硬件环境相互适应, 并且在云平台上能够正常运行;如何确保服务和功能超越SQL, 对编程和应用接口进行扩展, 针对普通用户、高级用户、统计学家, 以及数学家等不同类型的用户, 进而提供个性化的数据分析环境和分析工具;如何对大数据的处理结果进行可视化。

4 结论

随着时代的不断发展, 大数据时代正在向我们走来, 数据管理技术研究逐渐进入新的阶段。本文通过对技术进步的历史思路进行分析, 同时对数据管理技术的发展进程进行阐述, 并展开当今数据管理技术新画卷。

参考文献

[1]李斌.大数据及其发展趋势研究[J].广西教育, 2013 (09) .

[2]覃雄派, 王会举, 杜小勇, 王珊.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报, 2012, 23 (1) :32.

[3]林子雨, 赖永炫, 林琛, 谢怡, 邹权.云数据库研究[J].软件学报, 2012, 23 (5) :1148.

上一篇:公允价值计量应用研究下一篇:金融建筑空间设计