数据库的发展及应用

2024-06-18

数据库的发展及应用(精选12篇)

数据库的发展及应用 篇1

近几年来, 我国通信行业加快了数据网络的建设步伐, 其中X.25网络、DDN已覆盖全国95%以上的县, ATM网络基本覆盖全国大多数地 (市) , 移动数据网络也投入了商用, 数据通信业务保持高速发展势头。

对于数据通信市场来讲, 竞争将会更加激烈。不但原有的传统运营商会进一步加大数据通信业务的投入, 而且外资也以各种形式参与进来。国内其他行业, 包括广电、电力等, 也都会适时地在数据通信市场引起一些波动。因此, 在数据通信市场中会出现传统运营商、外资形式的运营商以及国内已有或将有的新兴运营商之间的复杂竞争格局。

1 数据通信应用主要分为两种

1.1 有线数据通信的应用

1.1.1 数字数据电路 (DDN) 的应用

(1) 组建公用数字数据通信网; (2) 可为公用数据交换网、各种专用网、无线寻呼系统、可视图文系统、高速数据传输、会议电视、ISDN (2B+D信道或30B+D信道) 、邮政储汇计算机网络等提供中继或数据信道; (3) 为帧中继、虚拟专用网、LAN, 以及不同类型的网络提供网间连接; (4) 利用DDN实现大用户局域网联网;如我区各专业银行、教育、科研以及自治区公安厅与城市公安局的局域网互联等; (5) 提供租用线, 让大用户自己组建专用数字数据传输网; (6) 使用DDN作为集中操作维护的传输手段:或把全区城镇110报警服务台互联, 实现全区公安机关的统一指挥。

1.1.2 分组交换网的应用

分组交换网能提供永久虚电路 (PVC) 及交换虚电路 (SVC) 等多种业务。利用分组交换网的通信平台, 还可以开发与提供一些增值数据业务: (1) 电子信箱业务 (2) 电子数据交换业务 (3) 传真存储转发业务 (4) 可视图文业务

1.1.3 帧中继技术的应用

帧中继技术适用于对广域网进行数据访问和高速数据传输。帧中继也是一种ISDN承载业务, 主要用于局域网互联和高速主机环境下作为宽带网的数据入口, 是向未来宽带ATM交换过渡的手段之一。常用于: (1) 组建帧中继公用网, 提供帧中继业务。 (2) 在分组交换机上安装帧中继接口, 提供业务。 (3) 为用户提供低成本的虚拟宽带业务。 (4) 在专用网中, 采用复用的物理接口可以减少局域网互联时的桥接器、路由器和控制器所需的端口数量, 并减少互连设备所需通信设施的数量。帧中继的数字链路连接鉴别 (DLCI) 寻址功能可允许单个中继接入设备与上千个接入设备通信。其本地管理接口 (LMI) 可大大简化帧中继网的配置和管理。 (5) 局域网 (LAN) 与广域网 (WAN) 的高速连接;LAN与LAN的互联;远程计算机辅助设计/制造文件的传送、图像查询以及图像监视、会议电视等。

1.2 无线数据通信的应用

无线数据通信也称为移动数据通信。它的业务范围很广, 也有着广泛的应用。

1.2.1 移动数据通信在业务上的应用

移动数据通信的业务, 通常分为基本数据业务和专用数据业务两种:基本数据业务的应用有电子信箱、传真、信息广播、局域网 (LAN) 接入等。专用业务的应用有个人移动数据通信、计算机辅助调度、车、船、舰队管理、GPS汽车卫星定位、远程数据接入等。

1.2.2 移动数据通信在工业及其它领域的应用

移动数据通信在这些领域的应用可分为固定式应用、移动式应用和个人应用三种类型: (1) 固定式应用是指通过无线接入公用数据网的固定式应用系统及网络。如边远山区的计算机入网、交警部门的交通监测与控制、收费停车场、加油站以及灾害的遥测和告警系统等。 (2) 移动式应用是指野外勘探、施工、设计部门及交通运输部门的运输车、船队和快递公司为发布指示或记录实时事件, 通过无线数据网络实现业务调度、远程数据访问、报告输入、通知联络、数据收集等均需采用移动式数据终端。移动数据终端在公安部门的刑警、巡警、交警也开始应用。 (3) 个人应用是指专业性很强的业务技术人员、公安外线侦察破案人员等需要在外办公时, 通过无线数据终端进行远程打印、传真、访问主机、数据库查询、查证。股票交易商也可以通过无线数据终端随时随地跟踪查询股票信息, 即使度假也可以从远程参加股票交易。无线接入Internet可随时随地收发电子邮件, 因此无线数据通信也得到广泛的应用。作为有线数据网的补充和延伸, 在公安系统, 移动数据通信将具有更广泛的应用。

2 当前数据通信系统的发展

随着现代社会信息化的建设与发展, 数据通信在其带领下也将更快更好的发展, 其发展前景主要包括几个方面:

2.1 关于下一代互联网的研究, 包括路由协议、编址、演进和IPv6业务应用, 例如大规模点到点的多媒体通信、无线/移动应用、定位应用、计算网格和数据网格、视频会议、高清晰度电视、基于组播的多点多路视频会议、支持远程教育和远程医疗等综合应用、基于组播的高清晰度电视、流媒体业务与应用等研究。

2.2 现在我们已经进入了3G时代, 在不断的调整、完善的同时, 也要进行下一代移动通信技术的研究, 主要包括几项关键技术, 如:OFDM技术、多输入多输出 (MIMO) 技术、切换技术、IPv6协议技术、软件无线电技术。

2.3 IP相关技术的研究, 包括IPQo S的模型结构、信令机制、服务协议、监测手段、计费和互通等, 并进行相应的试验, 还有基于IP网络和MPLS网络的性能、以太网性能等方面的研究。

2.4 关于互动多媒体网络与业务、流媒体网络与业务的研究。

2.5 关于虚拟专用网技术和应用的研究, 包括L1VPN网络和业务框架、L2VPN网络和业务框架、通用VPN功能要求、MPLSVPN的Qo S技术、MPLSVPN的网络管理技术等。

2.6 关于IP视讯通信技术的研究, 包括视讯系统的技术要求、框架结构、认证、授权和计费、编号与编址、MC设备技术要求以及MP设备技术要求等。

2.7 关于MPLS传送话音 (Vo MPLS) 技术的研究。

2.8关于电子政府、企业的信息化和运营发展模式的网络化、网格技术的大量应用、集中计算以及企业的协同工作对数据网络的影响的研究等等。

数据通信现已成为当代通信发展的主导力量之一, 展望未来, 数据将以更高的速率、更广的覆盖范围向前发展, 以达到更大范围的数据资源共享。数据通信领域中的各项技术, 如无线数据通信业务、卫星数据通信业务、多媒体通信业务等也将不断的完善, 应用日渐广泛。此外, 数据通信与图像通信、话音通信的结合 (多媒体化) 将使数据通信的发展迈上一个新的台阶。

数据库的发展及应用 篇2

数据挖掘技术在水文预报中的应用及水文预报发展趋势研究

数据挖掘作为知识发现过程中的重要步骤,是从大型数据库中提取未知的`、有价值的和可操作性的关系、模式和趋势用于决策支持的过程.我国目前在防洪领域存在着大量水文数据,如何充分有效地利用各种智能算法对这些数据进行分析与挖掘,以形成相应的水文预报模型进行准确的水文预报是防洪决策支持系统完善和发展的重要方面.本文首先全面地介绍数据挖掘的功能分类及以数据挖掘为基础的水文预报体系,然后对数据挖掘技术在水文预报中的应用进行了探讨和研究.

作 者:张弛 王本德 李伟 ZHANG Chi WANG Ben-de LI Wei 作者单位:大连理工大学,土木水利学院,辽宁,大连,116024刊 名:水文 ISTIC PKU英文刊名:JOURNAL OF CHINA HYDROLOGY年,卷(期):27(2)分类号:P338+.9关键词:数据挖掘 水文预报 水信息学 聚类 神经网络 决策树 关联规则挖掘

数据库的发展及应用 篇3

关键词 网络存储;附网存储;对象存储;I/O

中图分类号 TP 文献标识码 A 文章编号 1673-9671-(2010)121-0036-01

用户把信息通过网络(LAN、WAN和Internet)存储到连接在网络上的存储设备,或通过网络从连接在网络上的存储设备中获得所需信息的过程,叫做网络存储。用户可以从企业的存储网络中获得企业的产品信息,企业可以借助存储网络进行各种商业活动。

1 网络存储技术的发展

按照存储设备与网络的连接方式,主流的网络信息存储系统有直接存储(DAS)、附网存储(NAS)和存储局域网(SAN)三种形式。传统存储结构多采用DAS,现代网络应用的快速发展对传统存储提出了极大的挑战,促进了以NAS和SAN为代表的网络存储技术的成熟和快速普及。除此之外,还出现了多种新的网络存储技术,如基于IP的SAN、对象存储技术等。

1)直接存储(DAS)。DAS是一种以服务器为中心的存储结构,各种存储设备通过IDE或SCSI等I/O总线与服务器相连。所有的客户端请求与数据传送都通过服务器,由于存储系统附属于服务器,受服务器总线技术限制,DAS的可扩展性较差,并且当客户连接数增多时,服务器将成为整个系统的瓶颈。所以,DAS存储方式难以满足现代社会对网络存储系统大容量、高性能、动态可扩展等方面的要求,解决这一问题的有效方法是将访问模式从以服务器为中心转化为以设备和网络为中心,这导致了网络存储技术(NAS和SAN)的普及与发展。

2)附网存储(NAS)。NAS是一种以设备为中心的存储结构,可以直接连接到网络向用户提供文件级服务,具有简化的实时操作系统,它可以将硬件和软件有机的集成在一起,用以提供文件服务。目前采用的协议是NFS和CIFS,其中NFS应用在Unix环境下,最早由SUN开发,而CIFS应用在NT/Windows环境下,由Microfoft开发。

3)存储局域网(SAN)。SAN是一种以网络为中心的存储结构,按照SNIA定义,SAN是一种利用Fibre Channel等互联协议连接起来的可以在服务器和存储系统之间直接传送数据的存储网络系统。SAN是一种体系结构,它是采用独特的技术(如FC)构建的、与原有LAN网络不同的一个专用的存储网络,存储设备和SAN中的应用服务器之间采用的是block I/O的方式进行数据交换。

4)基于IP的SAN。在实际应用中,基于IP的SAN以其优异的性能成为网络存储领域的研究热点。基于IP的SAN互连技术主要包括:FCIP,iFCP、iSCSI、Infiniband。

FCIP技术原理是将FC帧封装到IP数据包中,再通过IP网络传输到另外一个FC的SAN,目的SAN接收到这个IP包后,将其解包使其恢复成封装之前的FC帧,通过FICP可以方便的实现两个距离较远的SAN在Internet网络上互相通信。

iFCP是将FC协议映射到TCP协议之上,和FCIP不同,FCIP是一种隧道协议,除了将FC帧封装成IP数据包以外,不对FC帧进行任何处理,而iFCP则是一种网关协议,它对FC帧进行协议转换,重新用TCP/IP协议来表达FC帧。它必须对FC帧进行更多的处理,如读取FC帧的头部,理解其地址,并用IP地址方式来表示。

iSCSI技术原理是将SCSI协议映射到TCP/IP数据包,在IP网络上传输,到达目的节点后,再回复成封装前的SCSI命令,从而实现SCSI命令在IP网络上直接、透明传输。

Infiniband是一种可简化和加快服务器之间的连接,以及服务器与其它相关系统(诸如远程存储和网络设备)之间的全新输入/输出(I/O)技术。它的结构设计非常紧密,大大提高了系统的性能、可靠性和有效性,能缓解各硬件设备之间的数据流量拥塞。Infiniband技术目前主要被较大的数据中心采用。

5)对象存储技术。一个存储对象是存储设备上多个字节的逻辑组合,它包括访问数据的属性、属性描述、数据特征和阻止非授权用户访问的安全策略等,对象的大小可以变化,它可以存放整个数据结构,如文件、数据库表、医学图像或多媒体数据等。存储对象具有文件和块二者的优点:像数据块一样在存储设备上被直接访问;通过一个对象接口,能像文件一样,在不同的操作平台上实现数据共享。

2 数据存储应用的最新特点

1)数据成为最宝贵的财富。数据是信息的符号,数据的价值取决于信息的价值,由于越来越多有价值的信息转变为数据,数据的价值也就越来越高,数据丢失对于数据拥有者来讲,损失是无法估量的,甚至是毁灭性的,这要求数据存储系统具有卓越的系统可靠性。

2)数据总量呈爆炸性的增长。人们的信息活动中不断产生数字化信息,各种新型应用也层出不穷,如流式多媒体、数字电视、IDC、电子商务、数据仓库与数据挖掘等,因此造成数据总量呈几何级数增长,因为永远都会有新的数据产生,所以对存储容量的需求是没有止境的。

3)I/O成为新的性能瓶颈。目前,计算机的主要应用模式已经转化成数据的存储与访问,由于受机械部件的限制,磁盘数据访问时间平均每年只能提高7%-10%,数据传输率也只能以每年20%的速度发展,而同时代微处理器和内存系统正以平均每年50%-100%的速度发展,处理机与磁盘之间的性能差距已经越来越明显,数据存储系统已经成为计算机系统新的性能瓶颈,即所谓的I/0瓶颈。

4)全天候服务成大势所趋。在电子商务和大部分网络服务应用中,24小时×7天甚至24小时×365天的全天候服务已是大势所趋,这要求现代数据存储系统具备优异的高可用性。

5)存储管理和维护要求自动化、智能化。以前的存储管理和维护大部分工作由人完成,由于存储系统越来越复杂对管理维护人员的素质要求越来越高,因管理不善造成数据丢失的可能性大大增加,这要求现代存储系统具有易管理性,最后是具有智能的自动管理和维护功能。

6)实现多平台的互操作和数据共享。由于历史原因,存在着多种信息平台,这要求存储系统能够实现多平台的互操作和信息共享,从而具有高度的系统开放性。

3 结语

IT技术的发展经历过三次浪潮。第一次是以处理技术为中心,以处理器的发展为核心动力,产生了计算机工业,促进了计算机的迅速普及和应用;第二次以传输技术为中心,以网络的发展为核心动力,这两次浪潮极大地加速了信息数字化进程,进而引发了IT技术的第三次浪潮——存储技术浪潮,在新的技术浪潮中,数据存储的应用将面临一个全新的发展时期。

参考文献

[1]鲁丰玲,李朝永.浅析网络存储技术[J].计算机与网络.2007,10:221.

浅析大数据的应用及发展前景 篇4

关键词:大数据,应用现状,发展前景

大数据引起了学术界、产业界和政府部门的高度关注和极高的兴趣。美国数据管理领域的核心领导人物从学术的角度对大数据的发生、数据处理等方面进行了分析, 政府已从战略层面对大数据发展计划做出重大举措。毫无疑问, 大数据对未来科技和经济的发展将会产生不可估量的深远影响。

1 大数据的基本概念

大数据的概念比较抽象, 它不仅是数据规模庞大, 而且与先前的“海量数据”等概念有着本质的区别。虽然大数据的公认定义尚未给出, 但在一般意义上是指无法在合理的时间内通过传统IT技术和主流软件工具对其进行撷取、管理、处理并整理为能帮助企业经营决策取到更积极目的的数据集合。从某种程度上说, 从多种不同类型的数据中, 快速地获取有价值信息的能力就是大数据技术。

大数据分析比传统的数据库应用具有数据量大、查询分析复杂的特点。大数据的特点总结起来有四个层面, 也就是所谓的4个“V”。数据体量巨大 (Volume) , 数据集合的规模从TB级别升至PB级别, 甚至以EB计数。数据类型繁多 (Variety) , 包括网络日志、视频、地理位置等结构化和非结构化数据。商业价值高但利用密度低 (Value) , 基于传统思维和技术, 在实际中往往发生信息丰富但是知识匮乏的情况。比如视频, 在不断的监控过程中, 可能有用的数据仅有那么一两秒。处理速度快 (Velocity) , 这是大数据不同于传统数据挖掘技术的本质。

2 大数据的应用

早期的大数据技术主要服务于分析网站用户数据和行为等的大型互联网企业。随着社会的发展, 传统企业和一些事业机构也需要进行大量数据的处理, 于是这些行业开始积极效仿, 越来越多地利用大数据技术实现不同的功能需求。

2.1 互联网应用

互联网企业开启了大数据应用的时代, 并逐渐延伸至其它领域。由于拥有海量的数据和强大的技术平台以及持续的技术更迭等优势, 互联网企业掌握了大量用户行为数据, 也就顺利地开展了定向广告等比较成熟的大数据应用。谷歌在此基础上发布了大数据的跨界应用, 即无人驾驶汽车。国内的互联网企业推出的数据共享平台为天猫、淘宝平台上的电子商业提供了数据云服务, 并深入到金融和物流领域。阿里巴巴于2013年中期成立的“菜鸟”网络物流也是基于大数据平台分析与物流企业联手选择了高效的送达方式。

2.2 电信应用

电信行业为优化自身业务一直应用数据分析, 只是价值提升度不高。电信运营商和互联网企业的较量使得大数据应用更为广泛, 由于拥有用户的真实信息, 电信行业逐渐展开了譬如智慧城市等服务公共社会的应用, 这些新的应用为其它行业提供了有效的数据分析结果, 为营运商应用大数据开启了希望。面对自身的一些缺陷, 部分运营商与互联网企业进行合作, 获得用户的深度行为信息。Orange和Facebook联手推出的Party Call为其它行业提供了加工后的用户行为信息。

2.3 金融应用

传统行业的大数据应用之中, 金融行业排在前列。起初的金融行业就有分析客户交易行为录制的传统。在2013年, 世界最大的金融信息服务供应商涉嫌泄露用户行为的信息引起各大央行的高度重视, 彭博数据终端被各大公司广泛使用来检测用户经常浏览的信息页面, 并根据检测情况用大数据技术推测出其即将采取的行动。由此可知, 大数据的安全至关重要, 我国金融行业对国内厂商的产品需求量会上升。

2.4 政府应用

大数据应用在一些先进国家的政府机构中展开, 美国的科学基金协会、国防部等部门不惜投入巨资进行大数据的政府应用。美国国防部进行和网络安全有关的不少大数据项目用来搜集和分析情报, 以方便更加及时地对各种危机做出反应。我国政府机构的大数据应用并未提升到战略高度, 需要予以重视。

3 发展前景

3.1 推动信息产业不断创新

预计全球的数据总量于2020年将会达到35ZB, 伴随着面对大数据市场的新产品、新技术、新服务的连续不断出现, 大数据将加快信息技术产品的创新发展。对数据处理和分析速度的需求将推动商业智能、数据挖掘等软件在企业的信息系统中广泛应用, 成为业务创新的重要途径。由于物联网等的飞速发展, 数据产生的速度和规模都在上涨, 利用大数据技术分析和处理数据以得到有效信息的需求更加迫切。不过, 大数据在有效储存、高效分析等方面也存在一定的挑战, 将会推动一体化存储器等产品不断创新发展。

3.2 推动社会进步

大数据已在不同程度上深入到各个行业和机构, 作为极其重要的战略资产, 这不仅有利于企业经营活动, 也提高了劳动生产率, 推动了国民经济的发展。大数据应用已经使经济决策机构更加及时地掌控经济趋势并做出科学地政策调整, 企业经营决策的水平也得到提高, 创造了更大的价值。

数据智能决策在监狱发展中的应用 篇5

监狱数据智能决策系统的构建

五角场监狱 朱旭东、周飞、方小琦

摘要

大数据时代的来临,带来的不仅仅是数据量的剧增,更重要的是带来了数据技术、数据应用和数据价值的变革。这场变革使得数据分析技术更加智能,人工干预更少,并且由于数据量更大,数据间更多可能的相关关系被分析挖掘出来。

本文基于监狱目前信息化发展的现状,利用监狱现有的数据作为基础,利用智能分析数据与数据间的相互关联,建立智能决策系统应用的模型。通过数据智能决策模型的应用来辅助监狱进行更为有效的管理。[1]关键字:数据决策、智能预警、数据中心

大数据时代需要我们对监狱信息化建设进行再思考,目前的“问信息化要警力”,主要表现在民警借助监狱政务、安防等信息化手段对罪犯进行管理,即便是系统需要调用另外系统的数据,往往也只是单纯的数据的叠加。但在大数据时代,更多需要考虑的是数据与数据之间的互相影响和作用,更多的挖取无直接关联数据间隐藏的价值。如果说我们通过大数据“问信息化要警力”,我们需要的是数据背后的关联价值,以便为监狱提供更加智能的决策能力。

[1]大数据,维基百科[EB/OL],[2013-08-05],http://zh.wikipedia.org/wiki/大数据

一、监狱信息化数据应用现状

同大多数企事业单位一样,随着监狱信息化建设规模的不断扩大,跨条线、跨科室、业务关联、信息沟通等需求的不断提高,随之新的问题也就日益凸现。主要表现为信息系统日益增多,包括办公自动化系统(OA)、狱政管理系统、罪犯一卡通系统、人事管理系统、财务管理系统和生活卫生系统等,这些系统的上线运行使监狱的管理效率得到了大幅度的提高,有力的支撑了日常管理工作运作,促进了管理效能的提升。然而顶层统一规划的缺乏使得这些系统仍然有许多不足之处,例如这些业务管理系统各成体系,各自独立,横向却缺少沟通,形成了大量的信息孤岛,监狱决策者只能得到针对具体业务的简单分散的数据和报表,既不能从长期积累的海量历史数据中挖掘发现狱内所存在的问题,也不能通过各业务系统汇总的信息辅助决策支持[2]来完成针对性的预判。

二、监狱数据数据决策发展面临的问题

(一)数据本地策略升级和存储面临的问题

从目前来看,对端点数据的安全已经具备了成熟的本地安全防护系统,但与大数据安全的需求还存在一定的距离,需要及时调整。所以在本地策略的构建上,需要加大对内部管理的监控,用纯数据的模式来避免由于人为原因造成的数据流失和信息泄露。

[2]Gotting H W,Weimann P,Intelligen decision supprot systems[J],Decision Support Systems,1992,8(4):317332

(二)管理和应用人员专业知识更新的问题

大数据在一个新的环境运行,就必须要为信息技术专业民警定制一个专门的培训计划,培训计划应该着眼于数据库的分析和修复,因为大数据仓库将通过这些来标记和报告不寻常的活动和网络流量,这类的培训通常需要大量的资金和时间。

(三)数据分析工具发展水平的问题

目前使用中的数据仓库,其数据存储类型仍受到一定的限制,数据仓库的扩展性能还需要进一步加强;数据挖掘在标准化和通用性方面存在一系列问题,数据挖掘引擎与数据库系统还是松散耦合的;数据挖掘语言有待于向标准化方向发展等。目前,OLAP作用没有得到充分发挥,还是一种传统决策支持方法,是一种用户驱动的验证性分析,受到用户水平的制约。目前大多数智能分析系统功能集中在分析方面,对系统的智能性不够重视,决策支持功能主要还是依赖数据挖掘、OLAP 等工具的数据分析、趋势预测功能来实现,不具备专门的决策支持系统提供方案生成、方案协调,方案评估的功能[3],更不具备群体决策和智能决策的能力,也就是说数据分析的智能化水平还很低[4]。

三、监狱数据智能决策的建设目标

决策是提供统计信息的最终目的。监狱信息化使得监狱工作的效率大大提高,产生和积累了丰富的统计信息资源。科学决策的基础是 [3]危辉,潘云鹤.从知识表示到表示:人工智能认识论上的进步[J],计算机研究与发展,2000,37(7):819-825 [4]史忠植.高级人工智能[M],北京:科学出版社,1998 62-211 对数据的整合和开发利用。虽然数据本身并不直接作用于决策,但当数据转化为信息或知识时就可以用于决策分析。

对数据的搜集、管理和分析过程,使监狱各级决策者获得更多决策依据,做出更加合理的决策。数据智能分析将联机分析处理(OLAP)、数据仓库和数据挖掘等结合起来应用于监狱日常运作活动中,从不同的数据源收集的数据中提取有用的数据,对数据进行清洗以保证数据的正确性,将数据转换、重构后载入数据仓库或数据集市;然后利用合适的工具对数据进行处理,这时信息变为辅助决策的知识;最后将知识呈现于用户面前,为管理决策提供参考。

为了保证监狱各项工作的顺利运行,同时使监狱具备高效率的指挥决策能力,亟需建设一套完善的智能化决策平台,通过对现有条件的充分分析和利用,对监狱中各类应用系统及安全系统进行集成改造,减少监狱的信息安全保密风险,才能实现监狱信息资源的安全共享和利用,提高监狱的工作效率。

四、监狱数据智能决策需求分析

(一)系统需求概述

本系统需整合监狱各类信息系统:政工类包括人力资源系统,指挥中心干警调度平台(生活现场、劳动现场、押送罪犯就医,防暴队)、外来人员管理、外来车辆管理、对讲呼叫管理、气象管理,管教类狱政。罪犯管理类包括(新进、调入、保外就医、释放),会见管理(会 4 见罪犯、会见家属、会见类型、会见监复听),刑罚执行正常释放、减刑假释、立管专控、耳目情况,狱内侦查。生活卫生类罪犯就医(医务所就医、总医院就医、社会医院就医、保外就医),罪犯伙食管理,罪犯大帐管理,劳动管理(生产数量、品质控制、原料数量、外来人员配置、工伤情况)。教育改造(教育类型、教学计划、受教罪犯、教学场地、教学内容、教育成果),督察(督察类别、督察内容、督察计划、督察结果、整改意见)财务管理(干警工资、工勤工资、劳动支出、生活支出、后勤支出、车辆支出、民警伙食、外事接待支出,生产收入、财政拨款、专项拨款)外围管理局重大任务、武警工作、重特大事件处理、安全零报告等。

分别建立相应的业务数据抽取,转换清洗和加载方案,并根据处理得到的业务数据建立数据模型,整理和抽取其中必要的关键分析指标,最终以直观,生动,多样的展示方式将基于不同维度的分析结果呈现给监狱管理层。系统需分为数据源、数据仓库、应用层和展示层四个层次,分别完成数据的抽取、转换、加载、建模、整理、分析、提取、展示等功能。

(二)系统功能需求

数据源可从各应用系统自动抽取,部分因各种原因则需人工采集。承担数据采集需求的部门涉及政工部门,财务部门,指挥中心,劳动管理部门,教育改造部门,督察部门,综合管理部门,各监区等。根据需求设计了如刑罚执行年度采集表,重要决策季度采集表,规章 5 制度季度采集表,生产利润季度采集表,财务结算信息季度采集表,项目施工季度采集表,干警考核季度采集表,安全生产指标季度采集表,安全生产指标年度采集表,干警警力配置日采集表,罪犯出入监日采集表等。以满足数据访问的灵活性和效率的均衡。

(三)基本功能需求

1、浏览功能:干警可通过web页面方式查看授权的指标数据。可针对用户使用不同的系统首页。在系统首页及各主题首页中,需要提供对时间维,单位维度的选择。

2、钻取功能:干警可查看到组成某指标的基础数据或下级单位的具体数据。提供各种图表类型的转换,使干警能从多视点对同一指标进行分析。

3、查询分析:干警可以自己定义查询条件,需要的话还可以自己定义查询指标和维度信息,这样可以更有目的性地查看报表,获取信息。

4、输出功能:干警可以水晶易表等形式将查看到的指标数据输出。

(四)数据展现方式需求

为了更好的、更直观的展示多维度数据,在一个界面中展示尽可能多的信息量,系统应采用多种综合的数据展示方式,包括仪表盘、趋势图、饼图、柱状图、固定报表等等形式。根据具体指标需求,其展示方式有严格要求。

五、监狱数据智能决策系统结构

(一)监狱智能决策包含的组件

决策支持系统通过结合个人的智力资源和计算机的能力来改进决策的质量。它是一个基于计算机的支持系统,服务于处理半结构化问题的管理决策制定者。一个决策支持系统将包括如下典型的组件:

1、数据管理子系统:决策支持系统(Decision Support System,简称DSS)[5]的数据库通常包括在数据仓库中。数据仓库是集成的、面向主题的数据库集合,它是用来提供决策支持功能的,其中每个数据单元都不随时间改变。数据仓库的数据通常从内部和外部数据源中抽取。内部数据主要来自于监狱内部各处理系统。外部数据包括行业数据、相关法律文献制度规范、社会普查数据、国家经济数据等。

2、模型管理系统:一个包含有财务、统计、运筹和其它定量模型的软件包,能够提供系统的分析能力和合适的软件管理能力。在模型库中的模型可以分为战略性的、策略性的、运营性的等等。

3、知识管理系统:许多非结构化和半结构化的问题是非常复杂的,以至于除了通常的 DSS外,它们还需要特别的专业知识。这些知识可以由专家系统或者其它智能系统提供。因此,更高级的 DSS 系统[6]还应该包含成为知识管理的组件。

4、用户界面子系统:用户与 DSS 应用之间的交流。如交互式界面、报表打印。为了实现组织内的信息共享,还应包括

[5]陈文伟.决策支持系统极其开发[M],北京:清华大学出版社,2000.311-327 [6]田大岗,费奇.DSS结构的联结主义观点[J],系统工程理论与实践,2000,20(1):7-18 Intranet/Internet 的发布方式。

5、用户:用户可看作系统的一部分。DSS 的用户主要是监狱各层次的管理者和业务模型分析人员。

(二)监狱数据智能决策的架构

监狱数据智能决策的框架层级:整个框架包含多个单位,从小到大以此为,数据、事件、罪犯个体,监区,监狱。其中数据作为框架中的最低层级是预警分析中基础的输入来源,包括了各业务系统的数据以及民警各台帐数据。事件是罪犯个体的相关行为的属性,一个事件包含了罪犯各项基础数据的变化。罪犯个体的表现情况及其对应的数据和事件的集合,以此类推监区是以监区为单位的罪犯个体的集合。监狱是多个监区的集合。

监狱数据智能决策的整体思路:通过从各个业务系统抽取罪犯相关数据,打造以罪犯个体为核心的数据中心,并建立与业务系统的罪犯信息的溯源通道;建立犯情预警评估模型,对罪犯静态信息和动态改造异常信息实现智能预警和排查处置。

监狱数据智能决策的整体框架:最上层犯情综合信息系统(静态信息),包括:罪犯档案,信息检索,分析预测,汇总统计。数据智能决策系统(动态信息),包括信息采集,排查处置,预警分析,台帐管理,评估模型。在数据总线上,数据的来源于目前的监狱各信息系统:管教信息系统,综合评估系统,亲情会见系统,亲情电话系统,大帐系统,计分考核系统,监管日报系统,点名系统。

这些数据经过数据交互总线进入数据中心,通过信息的筛选和合 并可以分为以下几个板块:罪犯信息:包括罪犯信息、顽危犯,重点罪犯。狱政管理:罪犯调动,计分考核,行政奖惩。改造评估:入监评估,心理测试,出监评估。狱内侦查:坦白检举,耳目管理,信息员。刑罚执行:减刑假释,刑罚变更,监外执行。其他系统,大帐信息,会见信息,亲情电话,如图-1所示。

图-1 监狱数据智能决策的整体框架

总体架构分为三个模块,即信息汇总、职能预警、排查监督。信息汇总模块,吸收业务系统对接过来的包括管教系统,亲情会见,亲情电话,一卡通大帐等,以及信息渠道的录入包括个别谈话、民警执勤、罪犯汇报、奖惩考核、狱情分析等,将这些汇总的信息分类为外部因素例如亲情危机、家庭变故、经济纠纷。监狱环境例如劳动状况、岗位变动、同犯矛盾。犯人状况例如健康状况、情绪状况、心理状况。制度执行例如人帐制度、安检制度、清抄制度、报告制度。设施隐患例如警戒设施、监控设施、警备设施、生活设施。改造信息例如实训信息、综合评测、心理咨询、考核信息,如图-2所示。

图-2 监狱数据智能决策的总体架构

在智能预警模块中,将汇总收集来的信息,通过预警评估规则定义的运算,计算出罪犯危险的等级,对于过高等级的评估结果提出预警,与此同时,监狱不同层级的民警对系统发出的智能预警进行问题处置,通过各项有可能导致罪犯破坏监狱规范的诱导因素排查和干预,从而降低评估规则中评估要素危险程度,最终使得此次报警回归到正常值水平,如图-3所示。

图-3 智能预警

在狱情评估模型中对收集的罪犯信息采用多维度计量方法进行评估运算,其中考虑的纬度包括静态纬度,参考罪犯的年龄、学历、犯罪类型、余刑等。个性纬度包括外倾、冲动、自卑、从属、波动、焦虑、暴力、犯罪思维等。特殊技能纬度包括双特、从军、从警等。依照动态信息汇总分析,提出罪犯个体倾向性分析包括脱逃倾向,自杀倾向,行凶倾向,破坏倾向。根据倾向推测的可能性程度以及后果的严重性提出智能预警,预警等级从高到低分为一级、二级、三级,如图-4所示。

如图-4狱情评估模型

六、数据仓库技术研究

数据仓库是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,用于支持管理决策的制定。数据库是实现智能分析的数据基础,是监狱长期事务数据的准确汇总。数据仓库完成了数据的收集、集成、存储、管理等工作,数据智能分析面对的是经过加工的数据,使得数据智能分析能更专注于信息的提取和知识的发现.数据仓库为数据智能分析撷取或载入大量原始信息,归并各种数据源的数据,用于支持监狱管理和决策。

数据仓库是数据智能分析的灵魂,数据智能分析的很多工作都是以数据仓库为基础展开的。利用数据仓库,监狱可以制定准确的战略策略与预警行动;数据智能分析充分利用数据仓库的分析结果制定策略、合理调配警力,促进监狱管理平稳有序。

(一)监狱智能决策数据中心

从各个业务系统抽取罪犯个体关键数据,汇总成罪犯改造档案,提供检索、预测、类聚、分析等功能;并通过各业务提供相应接口,可对关键业务数据进行溯源查询;并为狱情系统提供罪犯个体动态信息,如图-5 所示。

图-5 监狱智能决策数据中心

数据中心将各个业务系统的数据明细进行筛选,数据中心以罪犯个体为单位对罪犯个体的数据进行类聚,将类聚后的数据存入罪犯改造档案,同时这些数据互相牵制或者影响所构成的动态数据又为狱情系统提供了素材。狱情系统通过对动态数据的分析和理解进行计算,其结果作为预警数据存入数据中心。对于狱情系统计算的结果提供溯源机制,可以查询到是哪些业务系统提供的基础数据,造成了最终的计算结果。

罪犯个人信息分类及来源:管教信息系统中入监等级表信息、收 监体检表信息作为罪犯个体信息的罪犯档案部分。

管教信息系统中罪犯调动、计分考核、等级管理、行政奖励、行政处罚、其它处理、日常管理作为罪犯个体信息的狱政管理部分。

改造质量评估系统中入监评估、出监评估作为罪犯个体信息心理测试、改造评估部分。

管教信息系统中坦白、检举、申诉、顽固犯、危险犯、耳目、信息员作为罪犯个体信息的狱内侦查部分。

监管日报信息系统中狱情日报、狱情周报、狱情月报、监狱月报、重危分子、民警值班记录、监管隐患排查作为监管日报系统部分。

管教信息系统中减刑假释、暂予监外执行、刑罚变更作为罪犯个体信息的刑罚执行部分。

大帐系统中大帐管理作为罪犯个体信息的生活卫生部分。会见系统、亲情电话系统作为罪犯个体信息中会见信息、电话信息部分。

数据智能决策中违规违纪(打架斗殴、对抗管教、自伤自残、抗拒劳动)、家庭变故、患病、债务纠纷、余罪漏罪、提回重审、心理异常、警囚矛盾、囚囚矛盾等作为罪犯个体信息中改造异常表现部分。

数据智能决策作为罪犯个体信息中的预警情况部分。

狱情动态分析思路:从收集罪犯基本信息、评估信息以及月度考核信息,通过从业务系统、各类信息渠道等获取日常动态信息,实现狱情信息收集汇总、预警智能分析预测和安全隐患排查监督,如图-6所示。

如图-6 狱情动态分析思路

七、监狱数据智能决策规则配置

在数据智能决策规则配置中,各相关科室可以联合制定多种逃脱、自杀、行凶等倾向的相关联的触发信息。例如在定义罪犯家庭因素得知家中亲人病重或将要离世;对改造缺乏信息;对入狱前未决事项牵挂;定义罪犯行为异常经常窥探周围环境、交通状况的;私自制作或存放雨衣等绝缘物的;这些因素都将作为触发罪犯逃脱倾向预警的计算因素,如图-7所示。

图-7 数据智能决策规则配置

在狱情排查监督阶段,实时采集的预警异常信息,根据配置的相关处理流程以及相应环节,实现对各类监狱安全问题的处理、跟踪、提醒等。

图-8 罪犯危险倾向性

八、监狱民警对数据智能决策影响

从层级上来划分将民警分为主管民警、监区领导、业务科室以及 16 监狱领导。

从民警在与狱情动态分析交互的过程中产生的功能来划分,可以分为民警的导入功能和排查监督功能。为罪犯个体信息的输入即数据源的导入功能,民警对依据采集的信息进行人工预判,定义倾向性模型触发信息,即预警规则配置的功能。民警根据预警提示对预警产生的溯源信息或情况进行处理、跟踪等工作,即预警提示后排查监督功能。

从具体的角色分工来看,作为罪犯的主管民警,处在第一线监管岗位,与自己所管辖范围内的罪犯了解沟通最为直接,因此主管民警的信息收集汇总的准确率对后期的预警评估起着决定性作用。因此,主管民警必须做好日常个别谈话、计分考评、录音复听等工作。对于日常工作中生成的谈话、会见、电话复听台帐务必保证详实、准确、具体、同时,针对预警信息,排查预警的溯源信息,询问核实罪犯情况,并采取有效的针对措施,降低评估因素的危险程度。

监区领导根据预警提醒对所在监区内被列为预警的罪犯情况进行确认,如果确定其确有危害监管安全隐患的,查找隐患的原因,是否符合预警的倾向性判断,如果完全复合,则在犯情分析会上讨论分析针对预警的跟踪以及解决办法,如果非完全符合,则通过信息收集入口及时调整信息源,或者提交反馈给业务科室修改预警配置规则。

业务科室具备三方面的角色职能,一方面针对自身科室的专职功能,向狱情分析提供对口的基础信息。另一方面根据预警分析结果监 督各监区对预警信息予以排查和解决。除此之外,联合各业务科室,对狱情分析的配置规则进行管理,增加新的配置规则和触发信息权重。给出处理流程的实时内容和跟踪步骤。

监狱领导根据预警提示了解监狱内可能存在的安全隐患,分析狱内罪犯危机倾向,通过召开狱情分析会议,通报监狱内罪犯动态倾向并布置业务科室和狱区预警工作重点。

九、总结

在大数据时代来临之际,为让数据智能决策更好的服务于监狱,第一步要建立自己的核心数据集,也就是要搞清楚监狱的数据需求;第二步是要找到内部的一些外围数据,通过一系列的收集和整理分析,像滚雪球般建立监狱自己的数据信息集合;第三步是收集监狱内部的数据,国外有很多成功的大数据案例,都有一个前期的挖掘过程,监狱同样需要在监狱内部找出有价值的数据;第四步就是收集外部的、社会化的或非结构化的数据,即现在所谓的社会化媒体数据,提高监狱的整体数据分析能力和数据价值水平。

数据库的发展及应用 篇6

【关键词】信息技术;数据式审计;发展;应用

一、基于信息技术的数据式审计发展

1.数据式审计概述

数据式审计是基于信息技术发展起来的,其理论基础是针对审计对象的基础数据、数据流或信息系统等,利用信息技术,在企业内部的数字化平台上进行数据审计。该理论的最大优点是不通过人工进行数据输入、记录等,而是直径对电子数据进行利用,这使得该审计方式具有传统审计及其他新型审计方式不可比拟的优势。因此,数据式审计不仅是对传统审计进行的简单拓展,而是基于信息科学、数据处理等多领域的综合学科。就数据式审计而言,其审计对象是基础数据源库和企业内部信息系统控制;审计的核心方法是构件审计的中间评估表和审计分析模型;审计的关键技术就是数据分析技术。这些数据式审计独有的信息化特征,是该审计方式具有广阔应用前景的重要原因之一。

数据式审计是随着信息技术在财会领域的大量应用而产生的一种新型审计方式。即便经过大量的审计实践,数据式审计仍处在一个不能确定的状态,专业的审计工作人员也难以对其进行合理的应用。即使如此,我们依然有理由相信,这种审计方式很可能是基于信息技术的计算机形式审计发展的重要趋势。

国外对计算机形式的审计研究时间并不久远,但却取得了一定的基础和规模。以美国为例,由于其信息技术的高速、领先、优势发展,其数据处理技术、企业信息化普及程度等都领先其他国家。国内的计算机形式的审计研究起步较晚,但发展较快。在政府的领导和帮助下,审计署先后签发颁布了多条准则,促进了数据式审计的发展。虽然,数据式审计还是审计学理论框架中较为新鲜的概念,理论基础和技术发展较为欠缺,但随着研究的深入和实践的推广,数据式审计将会更好的指导社会和企业发展。

2.基于信息技术的数据式审计发展现状

当前,数据式审计的发展现状可以通过审计方法和审计模式进行分析。

数据式审计常用的分析方法主要分为两类:一是基于现有审计知识的数据分析方法;二是应用数据挖掘技术进行未知审计知识的发掘。首先,数据分析方法主要有5种:(1)合规分析方法,该方法主要是根据会计准则,利用相关审计软件,对企业账项进行检查;(2)趋势分析方法是指专业审计人员通过近期或某段时间的相关数据进行回归和比较分析,并从中找到数据的规律或变动异常,该方法还可以帮助管理人员制定相关预算;(3)结构分析方法又叫比重分析法,主要是通过各组成部分对总体的影响来评定其相关重要程度,为企业下一步发展制定方向;(5)比率分析方法主要是通过除法运算,发现各要素之间的关系;(4)经验分析方法则主要是通过专业审计人员的长期反复审计,摸索探讨出某类问题的特点,从现象中分析实质问题或原因,并通过相关的特征转化,实现个体建模解决问题。各种分析方法虽然不同,但在实际的审计过程中,往往需要进行综合应用才能取得良好的审计效果。

数据式审计的审计模式可以从三方面进行介绍:首先是账项基础审计模式,主要是对交易金额、报表余额等基础账项进行检查,是传统审计的一种辅助工具;其次是制度基础审计模式,该模式的拓展是随着计算机技术的发展而扩大的,审计模式从对电子数据的单纯处理延伸到对计算机系统的可靠性和安全性等进行评估和检查;风险基础审计模式是制度基础审计模式的另一种拓展,通过对系统可靠性和安全性的检查,评估企业可能面临的各种风险,并进行风险预测,提出风险解决方案等。只有进行风险审计才能完成真正意义的数据式审计,这也是数据式审计发展的最终目标之一。

二、基于信息技术的数据时审计的应用

1.数据式审计应用的必要性和可行性分析

当前,企业的发展和管理都依赖于电子数据,通过计算机的辅助功能实现企业的发展和管理。因此,使用数据式审计可以提高审计效率,方便快捷的进行电子数据的处理。同时,由于我国的计算机发展较晚,审计理论基础和人员水平参差不齐,通过数据式审计的推广,可以积极督促审计人员对审计知识和会计理论的掌握,有效提高审计人员的能力。因此,基于信息技术的数据式审计的应用具有其历史必要性和可行性。

2.数据式审计应用的关键技术

数据式审计的关键技术包括:联机分析处理和数据挖掘技术。联机分析处理技术主要是针对海量电子数据采用的处理方法,其核心特征是从多角度进行数据分析。数据挖掘技术是指从海量数据中发掘最有用的数据信息,一般通过数据概化、分类分析、关联分析等完成。

两种方法最主要的区别在于联机处理属于一种验证性的分析,而数据挖掘是验证某个模型的正确性的一种手段,二者的本质区别是能否自主的进行数据处理。

三、结论

综上所述,数据式审计理论的框架也逐渐成型,设计信息化背景下基于信息技术的数据式审计在我国审计服务体系中具有不可替代的地位,通过完善其理论基础和有效的应用推广,该模式终将成为计算机形式审计发展的主流方向。

参考文献:

[1] 徐剑飞.我国数据式审计的发展现状分析[J].内蒙古财经学院学报(综合版),2008(3):108-112.

数据库的发展及应用 篇7

应用数据挖掘的历史虽然不长, 但其范围却十分广泛, 主要是以下几个方面:

1.1 针对生物医学和DNA数据分析的数据挖掘

由于数据挖掘已经有许多意义的序列模式分析和相似检索技术, 因此数据挖掘成为DNA分析中的强有力工具, 并在以下方面对DNA分析起着不小的贡献:a.异构、分布式基因数据库的语义集成;b.DNA序列间相似搜索和比较、关联分析;c.同时出现的基因序列的识别、路径分析;d.发现在疾病不同阶段的致病基因;e.可视化工具和遗传数据分析。

1.2 针对金融数据分析的数据挖掘

主要应用有:a.为多数数据分析和数据挖掘设计和构造数据仓库;b.为贷款偿还预测和客户信用政策分析;c.对目标市场客户的分类与聚类;d.洗黑钱和其他金融犯罪的侦破等。

1.3 零售业中的数据挖掘

零售业是数据挖掘的主要应用领域, 零售数据挖掘可有助于识别顾客购买行为, 发现顾客购买模式和趋势, 改进服务质量, 取得更好的顾客保持力和满意程度, 提高货品销量比率, 设计更好的货品运输与分销策略, 减少商业成本, 具体应用:a.基于数据挖掘的数据仓库的设计与构造;b.销售、顾客、产品、时间和地区的多维分析;c.促销活动的有效性分析;d.顾客保持力——顾客忠诚分析;e.购买推荐和商品参照。

1.4 电信中的数据挖掘

利用数据挖掘技术来帮助理解商业行为、确定电信模式、捕捉盗用行为、更好地利用资源和提高服务质量是非常有必要的。主要应用:a.电信数据的多维分析;b.盗用模式分析和异常模式识别:c.多维关联和序列模式分析;d.电信数据分析中可视化工具的使用。

2 数据挖掘的发展动态

鉴于数据、数据挖掘任务和数据挖掘方法的多样性, 给数据挖掘提出了许多挑战性的课题。数据挖掘语言的设计, 高效而有用的数据挖掘方法和系统的开发, 交互和集成的数据挖掘环境的建立, 以及应用数据挖掘技术解决大型应用问题都是目前数据挖掘研究人员、系统和应用开发人员所面临的主要问题。以下描述一些数据挖掘的发展趋势, 它反映了面对这些挑战的应对策略[1]。

2.1 可伸缩的数据挖掘方法

数据挖掘必须尽可能交互式地、有效地处理大量数据。由于数据量在不断地激增, 因此针对单独和集成的数据挖掘功能的可伸缩算法显得十分重要。一个重要的方向是所谓基于约束的挖掘 (Constraint-Based Mining) [2]。它致力于在增加用户交互的同时, 如何改进挖掘处理的总体效率。它提供了额外的控制方法, 允许用户说明和使用约束, 引导数据挖掘系统对感兴趣模式的搜索。

2.2 数据挖掘与数据库系统、数据仓库系统和Web数据库系统的集成

数据库系统、数据仓库系统和WWW己经成为信息处理系统的主流, 而数据挖掘系统的理想体系结构是与数据库和数据仓库的紧耦合方式。事务管理、查询处理、联机分析处理和联机分析挖掘应集成在一个统一框架中。这将保证数据的可获德性, 数据挖掘的可移植性、可伸缩性、高性能以及对多维数据分析和探查的集成信息处理[3]。

2.3 数据挖掘语言标准化

在进行数据挖掘时, 让挖掘系统自动挖掘整个大型数据库或数据仓库中隐藏的所有有价值的知识往往是不切实际的, 总是需要在用户的指导下进行有目的的挖掘。这就需要为用户提供一组与数据挖掘系统通信的语言, 可以把这组语言称为数据挖掘语言。这组语言用于说明用户感兴趣的数据集、要挖掘的知识类型、用于指导挖掘过程的背景知识、模式评估兴趣度量以及如何显示所发现的知识等等。这组语言使得用户可以在数据挖掘的过程中与数据挖掘系统进行交互, 从不同的角度和深度检查发现结果。研究专门用于知识发现的数据挖掘语言, 也许会像SQL语言一样走向形式化和标准化[4]。

2.4 可视化数据挖掘

可视化数据挖掘是从大量数据中发现知识的有效途径, 系统研究和开发可视化数据挖掘技术将有助于推进数据挖掘作为数据分析的基本工具。目前数据挖掘的可视化仅体现在结果的简单描述, 并没有达到真正意义上的可视化。数据可视化、挖掘过程可视化和结果可视化, 将揭开数据挖掘复杂和神秘的面纱, 使其变得更为生动、形象和具体, 用户可以随时了解整个过程的进展情况, 减少了行为过程的盲目性。数据和结果的图形展示可以放大、缩小、平移、旋转和变换角度, 使分析人员和用户更加容易理解, 这将大大推动数据挖掘工具在发现知识和数据分析中的应用。因此, 加强数据可视化和知识发现过程的可视化具有重要的理论意义和应用价值[5]。

2.5 复杂数据类型挖掘的新方法

复杂数据类型挖掘是数据挖掘中一项重要的前沿研究课题。虽然在地理空间挖掘、多媒体挖掘、时序挖掘、序列挖掘以及文本挖掘方面取得一些进展, 但它们与实际应用的需要仍存在很大的距离。对此需要进一步的研究, 尤其是把针对上述数据类型的现存数据分析技术与数据挖掘方法集成起来的研究。

2.6 Web挖掘

由于Web上存在大量信息, 并且Web在当今社会扮演越来越重要的角色, 有关Web内容挖掘、Web日志挖掘和因特网上的数据挖掘服务, 将成为数据挖掘中一个最为重要和繁荣的子领域。

2.7 数据挖掘中的隐私保护与信息安全

随着数据挖掘工具和电信与计算机网络的日益普及, 数据挖掘要面对的一个重要问题是隐私保护和信息安全。需要进一步开发有关方法, 以便在适当的信息访问和数据挖掘过程中确保隐私保护与信息安全[10]。

3 结论

在简要概述了数据挖掘的基本概念的基础上, 论述了它的主要应用和未来发展动态, 希望能为以后研究数据挖掘的学者和专家们提供参考。

摘要:对海量数据的深入分析和利用, 并从中发现有用的知识, 已成为信息化社会所面临的重要问题。探讨数据处理技术——数据挖掘的概念、主要应用和未来发展动态。

关键词:数据挖掘,Web挖掘,发展动态

参考文献

[1]赵群礼.关联规则数据挖掘方法的研究和实现[D].西安:西安科技大学硕士学位论文, 2005, 4.

[2]Srikant R, Yu Q, Agrawal R.Mining association rules with item con-straints[A].In:Heckman DMannila H, Pregibon D, eds.In:Proceedings ofthe 1997 International Conference on Data Mining and KnowledgeDiscovery[C].AAAI Press, 1997:67-73.

[3]黄晓霞, 萧蕴诗.数据挖掘集成技术研究[J].计算机应用研究, 2003.4:37-39.

[4]Jiawei Han Micheline Kanbei.数据挖掘概念与技术[M].北京:机械工业出版社, 2001.

数据中心的发展及模块化的应用 篇8

作为信息化发展基础的数据中心建设, 无论在数量上还是在规模上都在以迅猛的速度发展。据《2013年度中国数据中心市场发展白皮书》报道:2013年数据中心的增长率为6.5%, 从事数据中心建设的企业近3000家。该白皮书还预测数据中心建设的速度将逐年加快, 到2016年增长率将达到9.2%。如此高的增长率当然是因社会需求所致, 客观上给数据中心建设的发展提供了较好的基础, 同时也给数据中心建设提出了更多的要求, 使数据中心建设呈现出了一些新的发展趋势。

2 数据中心发展趋势

在数据中心建设大发展的浪潮中, 其技术和理念发生了很大的变化。

(1) 大型化、规模化、集中化

大型化、规模化、集中化数据中心无论在设计要求上还是在施工质量上都高于中小型数据中心, 所以大型数据中心在安全性、可靠性上远大于中小型数据中心。数据中心是一个多学科相互交叉的基础设施, 对管理人员的要求比较高, 需要有一个完善的管理体系, 其中最重要的是需要有一个知识全面、经验丰富的管理团队, 而中小型数据中心很难配备这样的队伍。所以大型数据中心的管理水平普遍高于中小型数据中心。大型数据中心在设计阶段可以统筹规划, 在管理和使用阶段可以综合考虑, 因此, 在整体使用效率上也优于中小型数据中心。在建设成本上, 同等级的中小型数据中心的性价比也低于大型数据中心。

(2) 高安全性

随着数据中心的重要性逐渐提高, 对高安全性的要求也越来越高, 但现实情况是数据中心的不安全因素却在不断增加。从最近一些事故所反映的情况来看, 损害数据中心安全性的主要因素除了传统的水、火、雷电外, 高温、极端天气、恶劣环境产生的威胁也越来越严重, 此外人为故障也在逐年增加。同时应数据中心发展的需要, 在数据中心建设中滥用节能技术、提出过高的要求或片面的追求建设和部署高密度, 都给数据中心的安全性带来隐患。

(3) 绿色化

现在数据中心的能耗越来越大, 对数据中心提出节能要求已是无法回避的问题。一个数据中心的耗电量已远超过同建筑面积的一般工业生产的耗电量。针对这种形式, 工业和信息化部发布的《工业节能“十二五”规划》中, 针对数据中心提出了明确的节能目标:“到2015年, 数据中心PUE值下降8%”。许多大型数据中心能耗的费用已占到全年维护费用的60%~70%, 如此下去我国的能源供应将不堪重负。所以节能技术和理念正在数据中心行业中深入贯彻, 比如在数据中心中采用虚拟化技术、建设中合理规划、就近制冷、采用高效能的节能设备、提高节能管理水平、综合利用能源等都能提高数据中心的节能水平, 以得到较低的PUE值。

(4) 高密度

高密度的发展一是因为硬件设备本身随着技术的发展实现了高密度, 单位体积设备的功率密度越来越大;二是因为现代数据中心的造价越来越高, 为了降低运营成本, 平摊单位造价, 用户希望在单位面积上放置更多的设备, 所以现在数据中心的密度越来越大。

(5) 模块化、机柜化

模块化便于管理和扩展, 在数据中心的建设和运行中得到广泛的运用。因为消防的规定, 一般数据中心的模块不能大于800m2, 通常在300m2~500m2/模块。模块化的最小单元可以是一组或一个机柜, 关注机柜微环境的质量也是目前数据中心建设的一个趋势。从原理上说, 如果能控制好机柜的微环境, 便可以完全不考虑机房的环境。控制机柜微环境的效果比控制机房环境的效果要好很多, 但是控制的复杂性也增加许多, 导致建设成本增加, 限制了微模块的应用。当然它对于解决机房局部热点问题是非常有效的。

(6) 智能化

现代数据中心是一个复杂的应用环境, 单靠人力管理并不够, 只有利用智能化、自动化的手段, 才能提高机房的管理水平。所以智能化是实现数据中心安全可靠运行的基本保障。

3 模块化在数据中心建设中的应用

现在数据中心建设的规模越来越大, 为了便于管理、扩展和维护, 模块化设计是数据中心的基本选择。数据中心的模块化建设包括两方面:一是数据中心在规划设计上按照标准模块进行建设;另一个是在数据中心内使用模块化的设备。

(1) 模块化数据中心建设

数据中心按照模块化的方式建设, 使大型数据中心的建设变成了多个标准模块机房 (300m2~500m2) 的生产过程, 使建设过程可以实现标准化, 无论是设计还是施工都可保证质量, 还能降低建设成本。把大型数据中心变成模块机房, 对于管理、扩展和维护来说也是十分便利的。此外, 模块化数据中心可提高机房的使用效率, 达到节能降耗、节约成本的目的。因此, 模块化应用于数据中心建设将是未来的一个趋势。

(2) 模块化UPS

为保障机房内电子信息设备的不间断供电, 通常采用UPS供电方案, 这样UPS设备和方案的安全性、可靠性便成为保障机房电子信息设备供电安全的重中之重。

为提高UPS方案的安全性、可靠性, 设计人员和运维人员在实际工作中总结出了单机系统、串联冗余系统、并联冗余系统、分布式冗余系统、容错系统等多种配置方案, 这些方案在一定程度上提高了系统和供电的可靠性, 但也带来诸多问题, 如设备投资大、占地面积大、运营成本高、维护和扩容困难、风险大等。

为解决这些问题, 模块化UPS电源系统应运而生, 它将UPS各部分功能完全以模块化的形式来实现不间断供电, 具有在线热插拔、在线扩容和在线维护的功能。任意组件拔出或发生故障均不影响系统供电, 提高了UPS系统的可靠性和可维护性。在线扩容避免了传统UPS在高可靠机房中常处于低负载运行的状况, 提高了UPS设备的使用效率, 减少了设备的一次性投资, 增加了设备运行的可靠性, 还起到了节能作用。

4 集装箱式数据中心和微模块

集装箱式数据中心曾经在机房领域引起很大的争议。当时有人认为集装箱式数据中心可以完全替代传统数据中心, 但到目前为止还没有出现这种势头, 集装箱式数据中心的发展远低于人们的预期。

集装箱式数据中心优点:

集装箱式数据中心由于是工厂化生产的产品, 所以很容易实现产品的标准化, 也容易保证产品质量, 使整体最佳效率达到很高水平。

快速部署是集装箱式数据中心的另一大优点。由于其内部已具有传统数据中心的所有内容, 且是一个相对独立的系统, 可以不受周围环境的限制, 在任意地点都能快速部署。当然集装箱式数据中心还需要周边资源的支持, 比如水、电、网络等, 否则也不能担当数据中心的角色。

可以实现真正的高密度部署, 集装箱数据中心是一个完全封闭的环境, 平时工作人员不会在里面工作, 里面环境可以只考虑电子信息设备的需要, 如有更高的风速、更适合的温度和湿度, 也无需引入新风。所以有些集装箱式数据中心厂商宣称其本身的PUE值能达到1.12。

但集装箱式数据中心存在造价高、标准缺乏等问题, 严重制约其发展。单个集装箱式数据中心的箱体PUE值也能达到1.12, 但集装箱式数据中心需要更多配套设施的支撑, 如果加上配套设施的能耗, 整体PUE值可能达到1.4左右。

集装箱式数据中心的造价比一般数据中心的建设造价加上大楼基建的造价相比是较为经济的, 这是它的优势。可是我们往往都是在建设好的建筑中安置集装箱式数据中心, 所以集装箱式数据中心的价格就显得更高。

微模块是在集装箱式数据中心的基础上发展起来的, 它克服了集装箱式数据中心的缺点, 把模块变得更小, 成本更低。目前, 模块化数据中心大规模使用还有待时日, 但对于解决局部问题还是有效的。

5 结束语

模块化数据中心的应用前景十分广阔, 相信会有更多的模块化产品相继制造并生产, 使数据中心的建设真正实现部署更快、密度更高、整体更绿、管理更便捷、运营更安全的目标。

摘要:此文阐述了数据中心的发展趋势及模块化技术在数据中心领域中的使用前景。

数据库的发展及应用 篇9

关键词:数据库管理系统,关系数据库,结构化查询语言,信息处理

0引言

数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它诞生于距离现在60多年以前,随着信息技术和市场经济的迅猛发展,尤其是20世纪90代以后,数据管理不再单纯的对数据进行存储和管理,逐渐转变成用户所需要的不同种类数据管理模式。数据库有很多种不同的类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统,都在各个方面得到了广泛的应用。

1数据库的发展历史简述

1.1数据管理的产生

数据的产生可以追溯到60多年以前,只不过刚开始数据是非常简单的。通过大量的对比、分类和表格绘制的机器来运行大量的穿孔卡片,对数据进行处理,而处理结果就是打印或者是制成新的卡片。数据管理就是对穿孔的卡片进行保存和处理。

而数据库系统诞生于上个世纪60年代,在当时已经使用计算机对数据开始进行管理,对于数据的共享要求就随着计算机使用而提升。传统数据文件不能满足人们的实际需求,所以, 能够对数据进行统一管理和共享的数据库管理系统就因此而产生了。数据库模型是整个数据库系统的核心基础,不同种类的数据库管理系统软件,都是以这种模式作为基础的。因此,通常情况下,也根据模型的实际特点把数据库分为不同的类型, 其中包括网状、层次以及关系这三大类数据库。

1961年,美国通用电气公司开发出世界上第一个网状数据库.但是这种数据库还存在一定局限性,只能在通用电气公司的主机上运行,而这种只有单一的数据库,通过人工编码生成, 后来由古立德公司进行了重新的编写,并对其进行了重新的命名。网状数据库对层次和非层次的事物都能进行自然的模拟, 所以,网状数据库在其发展史占有非常重要的位置。

层次数据库是在网状数据产生以后而诞生的,1968年由美国的IBM公司研发的,这是一种适合主机层次的数据库。从数据库的产生到现在IMSV6都在一直提供着数据群集、数据共享、消息列队等特性支持。这个具有40多年的历史的数据库, 在商务智能以及网络应用连接上都在扮演全新的角色。

虽然,网状数据库和层次数据库已经很好的解决了数据集中和数据共享的问题,但是在处理数据的独立性和抽象上还是存在一定程度上的缺陷。而数据关系库就有效的解决了这一问题。1970,IBM的科德博士首先提供了关系模型的概念,给关系数据库奠定了良好的基础。1976年,由霍尼韦尔公司研发了第一个关系数据库。这种数据库以关系带位数理论作为基础, 随着长时间的应用和完善,技术手段也越发的成熟。

1.2结构化查询语言

1974年,IBM公司的Ray Boyce和Don Chamberlin将科德博士的关系数据库中十二条准则的数学定义,运用关键习语法进行表达,从而诞生了结构化语言查询。这种语言其中囊括了查询、操作、定义和有效控制,同时也是一个综合性强、通用关系良好的语言数据库。并且还能指出用户可以做什么,不可以做什么,是一种非常高级的语言,进而实现了对数据库周期中所有的操作,还能够和关系数据库进行交互,与编程语言一同进行工作。结构化查询语言的标准改变也指示着关系数据库的发展走向。1986年,结构化查询语言成为了美国的标准,并且在同一年公布了标准的结构化查询语言标准。

2数据库网络安全问题解决途径

随着数据库技术的发展,网络的普及化,也导致了数据库受到了来自网络安全威胁。例如,数据库被篡改数据、数据库中的数据被恶意窃取,通过假冒他人身份造成恶劣的影响。所以,在数据管理员创建完用户以后,一定要保证用户最为基本的权限,方便连接到数据库,并且能够进行查看和创建对象。 这样就能保证用户在登陆应用程序时,应用程序使用的是数据库用户登陆,杜绝了应用程序用户,使用数据库的用户,登陆数据库,对数据库造成不要的损害。所以,在日常工作中,一定要对数据库进行经常性的备份。例如,Oracle数据库,是规模较大的网络数据库,可以通过互联网和TCP/IP协议,用户就可以在网络终端上,对Oracle的数据库进行直接访问。但是, 客户端想要访问数据库,不仅要通过TCP/IP协议,还要结合Oracle公司开发研究的Net工具,并且在不同版本的数据库里名称的叫法不同,Net工具所具备的功能是越来越完善的。所以,数据库网络安全问题也得到了很多好的解决。

3数据库技术未来的发展趋势

随着科学技术的不断进步和发展,数据模型的种类也变得非常丰富,新的技术手段也在层现叠出。现阶段,每隔一段时间,国际上的数据库专家就会聚到一起,分析探讨数据库的实际情况、存在的问题、未来发展需要关注的重点。数据信息的本质和来源也是在一直变化的,而互联网、Web、自然科学、 电子商务等都是信息和信息处理的有力支撑,然而,相对低廉的传感器就可以将物体的形状和位置进行汇报,这种汇报还具有一定的实效性。在新的环境中会引出很多具有一定趣味性的数据库问题。

而数据库在实际的应用范围内,互联网是现阶段最为主要的驱动力,尤其是在一些涉及到多家企业的应用上。以往,应用都是在企业本身内部,在一个行政区域范围内对其进行优化和完善。现如今,多数企业对与物品供应方和客户之间的交流更为重视,如何能够给客户提供更好的服务。而这一应用就需要使用信息集成和信息安全的有效工具,也正是因为这样,就产生了与数据相关的新问题。另外一个使用应用的领域就是自然科学,而其中使用应用最为频繁的就是物理、生物以及保健科学等。因为这些科学领域,会产生数量庞大的数据集成,需要使用更加高级的数据对其数据进行处理。此外,还要使用数据分析器对数据进行有效的管理,并且还要对有序列的数据进行保存和检索,对世界范围的数据进行集成。

除了要面对信息管理领域给予的困难挑战外,传统的数据库管理系统中,例如,在数据模型、访问方式、查询处理代数、 控制、查询等方面上都将有一定变化,以上种种问题都得到了深入的研究。互联网在两个不同的方面上,既深度和广度,都对数据库提出了新的挑战。站在深度的角度上看,互联网环境中,部分数据管理进行的假设,都是不成立的,需要在新的背景下,对数据库技术进行调整、完善和改进;从广度的角度出发,新的问题就要使用新的手法和措施对其进行解决,从解决问题的过程中,寻找到技术上的突破和创新。

4结论

数据库的发展及应用 篇10

1.1 实时数据库简介及应用背景

实时数据库作为一种特殊的数据库, 早在十多年前就已经在国外的大型流程工业企业部署应用。随着网络、存储及计算技术的飞速发展, 实时数据库广泛应用于电力、钢铁、石油、石化、交通、航空、水利、环保等重要行业和领域, 已经是工业领域信息化的核心基础软件, 在“信息化与工业化融合”过程中发挥着重要作用。

1.2 国内外主流实时数据库介绍

目前国内外市场上主流的实时数据库有:美国OSI公司的PI实时数据库, 美国GE公司的IH实时数据库和美国印步公司的e DNA实时数据库。国产的有代表性的实时数据库有:上海麦杰的open Plant, 北京中科启信的Agilor。

2 实时数据库的主要特点及架构

2.1 实时数据库的特点

实时数据库面向的应用领域有如下3个特点:

2.1.1 单位时间内响应的数据量大

如:一个的火电厂的SIS系统使用实时数据库存储数据, 同时需要处理的测点数超过了一万, 这些测点的变化周期通常在1秒钟之内, 也就是说, 需要将超过一万点的数据在1秒钟之内保存到数据库中。

2.1.2 存储数据量大

实时数据库的核心就是对大量的实时信息进行处理, 由于成年累月的数据将占据大量的硬盘空间。假设同时处理对于1万点的系统, 每1秒钟存储一次, 每次单点占用8个字节, 那么保存10年的数据量将有10000*8*10*365*86400=25228800000000字节, 接近23TGB。

2.1.3 时效性强

每个需要处理的测点的值都与时间相关, 一秒钟之后的数据与一秒钟之前的数据可能就不一样了, 因此, 在保存测点值的同时, 必须通过某种方法将其对应的时间也纪录起来。实时数据库一般由3大功能模块组成:

(1) 测点信息库。测点是实时数据库的最小元素。实时数据库的测点容量一般为几万到几十万。每个测点对应一个现实的物理数据量, 比如:某个物体的温度、某个导管的压力或者某个导体的电流。例如:测点“AI001”表示“出水管温度”。测点信息库里记录了所有测点的信息。每个测点必须有“名称”、“上限”、“下限”、“单位”、“描述”、“类型”、“是否压缩”等基本的字段。用户可以查询、删除、插入、修改测点的信息。

(2) 快照库。快照是测点最新的一个值。表示了测点的最新的状态。至少包含3个字段即VTQ:value、timestamp、quality。C语言定义结构体如下:

例如:AI001的快照值为“120, 2010-10-1 00:00:00, Good”

表示AI001测点即出水管温度的最新值为120, 最新值的时间戳为“2010-10-1 00:00:00”, 数据品质为“Good”。用户可以查询和更新某个测点的快照值。

(3) 历史库。历史库中存储了每个测点以往的历史值。在存储前, 数据一般都经过了过滤压缩, 减少了存储的数据量。每个数据库都有自己的压缩算法:旋转门、死区压缩、趋势压缩等。用户可以查询某个测点某个时刻的历史值。

2.2 实时数据库的外围模块

为了满足用户的现场需求, 实时数据库一般提供企业管理器、Excel嵌入模块、组态工具、门户发布平台等基本模块。同时为了方便系统集成商进行二次开发, 实时数据库都提供了二次开发包 (SDK) , 用户可以使用API访问数据库。

企业管理器:用户可以使用企业管理器配置管理数据库, 具体操作包括:建立测点、删除测点、修改测点属性、查看测点快照值、查看测点历史值、编辑测点历史值、维护存档文件、查看数据库日志等。

Excel嵌入模块:由于实时数据库测点多, 数据量大。用户可以使用该模块通过表格的方式, 浏览测点、查看历史数据。

API:Application Programming Interface, 应用程序编程接口。用户使用C/C++语言调用API接口可以高效的访问数据库。实时数据库为了追求效率, 没有采用传统的关系数据库的SQL语句访问方式, 因为SQL语句访问方式需要经过SQL语法解析、语义解析、查询优化等步骤, 效率远没有API方式效率高。

OPC:OPC (OLE FOR PROCESS CONTROL) 是一个开放性的工业标准。O P C以C O M/D C O M技术为基础, 采用客户/服务器模式, 为工业自动化软件面向对象的开发提供了统一的标准。采用这项标准后, 硬件开发商将取代软件开发商为自己的硬件产品开发符合标准的OPC SERVER程序, 而软件开发者不用再关心硬件驱动方面的技术问题, 只要按标准开发OPC CLIENT程序就可完成与硬件的连接, 这样不但提高了系统的开放性, 也提高了软件开发的效率。

3 实时数据库数据压缩技术

数据压缩, 就是用最少的数据来表示信息, 即将信息的一种表示方式转换为另一种表示方式, 新的表示方式包含了相同的信息量, 但是长度比原来的方式尽可能的短。

工业实时数据库中采用的数据压缩算法大多是有损的专用数据压缩算法, 如旋转门压缩算法等。部分实时数据库采用了无损压缩算法对数据进行二次压缩。

3.1 旋转门压缩算法

旋转门压缩算法 (SDT) 可以理解为一种过滤算法。将不“重要”的记录过滤掉, 只保留“重要”的关键记录。降低了其本质是通过一条由起点和终点确定的直线代替一系列连续数据点。该算法需要记录每段时间间隔长度、起点数据和终点数据, 注意到前一段的终点数据即为下一段的起点数据。

其基本原理较为简单, 参见图1。第一个数据点a上下各有一点, 它们与a点之间的距离为E, 这两个点作为“门”的两个支点。当只有第一个数据点时, 两扇门都是关闭的;随着点数越来越多, 门将逐步打开;注意到每扇门的宽度是可以伸缩的, 在一段时间间隔里面, 门一旦打开就不能闭;只要两扇门未达到平行, 或者说两个内角之和小于180°, 这种“转门”操作即可继续进行。图中第一个时间段是从a到e, 结果是用a点到e点之间的直线代替数据点 (a, b, c, d, e) ;第二个时间间隔从e点开始, 开始时两扇门关闭, 然后逐步打开, 后续操作与前一段类似。

算法步骤:

(1) 当考察当前测量值时, 计算下面三个斜率:

K1= (当前值- (上一个存储值+压缩偏差) ) /两测量值之间的时间差;

K2= (当前值- (上一个存储值-压缩偏差) ) /两测量值之间的时间差;

K= (当前值-上一个存储值) /两测量值之间的时间差。

(2) 对于新算的Kl, 当大于原有的K1时, 用新值取代旧值。

(3) 对于新算的K2, 当小于原有的K2时, 用新值取代旧值。

(4) 当K1≤S≤K2时, 当前值不用存储, 继续测试下一采样时刻得到的测量值, 否则, 系统将当前值的前一个测量值存储起来。

(5) 当新的测量值到来时, 重复以上过程。

由SDT算法进行数据压缩的结果在很大程度上取决于压缩偏差参数的大小, 压缩偏差取得越大, 数据的压缩率就越大, 解压缩的数据精度就越差;反之, 当压缩偏差取得越小, 数据的压缩率就越小, 但解压缩的数据精度就越高。

这种算法在一定的条件下, 可以跟踪实际过程趋势的变化, 获得满意的压缩结果。但是本算法具有以下缺点:

(1) 在过程数据有噪声的情况下, 压缩性能不是很令人满意。噪声会造成压缩算法对过程趋势判断错误, 降低压缩比。

(2) 本算法不具有判断和处理异常点的能力。实际上, 清除由于元器件失效或者电磁干扰造成的异常点对于大部分控制系统都是可以接受的。

(3) 压缩效果严重地依赖于记录限E的预设值。对一个实际工业过程中大量过程数据特性的测试不但费时费力, 有时候甚至是不可能的。另外, 实际过程数据的数值特性是时变的。对过程数据数值特性的先验知识的缺乏, 加上实际数值特性的时变性, 必将造成E的设定值和实际过程数据特性发生偏差, 从而影响压缩效果。

3.2 其他压缩算法

死区限值压缩算法是通过判断当前值偏离最后一个记录的范围是否大于死区限值, 决定是否记录此数据。例如:给定的限值是1.000, 则变化值低于1.000的数值将不记录到历史数据文件里。死区限值设置的越大, 实现的数据压缩率就越高, 但其数据精度越低。

为了进一步减少数据的存储量, 实时数据库会采用通用的压缩算法对数据进行二次压缩。一般的通用算法有:Huffmnan算法、LZ77算法、LZW算法等。

4 主流应用及未来发展

4.1 传统SIS应用

电厂厂级监控信息系统 (Supervisory Information System, 简称SIS) 是实时数据库目前的主要应用领域。SIS系统是一个介于DCS系统和MIS系统之间的具有独立功能的系统。其核心是实时数据库。实时数据库向下负责集成各个不同控制系统的实时数据, 并提供长期保存这些历史数据的功能。向上提供开放的实时数据库和历史数据服务, 为电厂的ERP系统所用。基于实时数据库开发的其他模块如:生产过程监控, 厂级机组性能计算, 经济指标分析, 优化运行操作指导, 设备寿命管理, 故障诊断等, 可以帮组企业提高自身的生产力和竞争力。

4.2 物联网

物联网是新一代信息技术的重要组成部分。其英文名称是“The Internet of things”。由此, 顾名思义, “物联网就是物物相连的互联网”。这有两层意思:第一, 物联网的核心和基础仍然是互联网, 是在互联网基础上的延伸和扩展的网络;第二, 其用户端延伸和扩展到了任何物品与物品之间, 进行信息交换和通信。从技术架构上来看, 物联网可分为三层:感知层、网络层和应用层。

物联网作为一个新兴行业, 同样需要强大的数据库做支撑。对于物联网来说, 仓储管理、标签管理、身份管理之类, 数据量小, 实时性要求低的数据, 关系型数据库肯定适合, 但是智能电网、水域监测、智能交通、智能医疗则应当使用实时数据库, 因为这些领域和行业面临着海量并发、实时性要求极高的情况。

参考文献

[1]张志檀.《实时数据库原理及应用》[M].北京:中国石化出版社, 2001.

[2]彭春华, 林中达.PI实时数据库及其在电厂SIS系统中的应用[J].工业.控制计算枫[J], 2003, 16 (6) :28~3l.

[3]刘云生等.实时数据库系统 (RTDBS) 及其特征[J].华中理工大学学报, 1994, 06:66~70.

[4]赵光煜, 赵平.实时数据库的现状及发展趋势.天津农学院学报, 2002, 12.

数据库的发展及应用 篇11

【摘要】油田拥有庞大的管理机构,众多的员工,全面的社会生活环境,无论是企业还是职工对各种通信方式的需求以及通信产生的费用都是可观的。油田企业领导充分意识到独立计费对油田生产经营的重要性,对网络安全管理的必要性,对油田特有通信方式便捷的掌控性,拥有自己的计费环境和计费系统也是势在必行的。下面我们就针对油田企业计费系统数据库的设计及应用研究进行分析。

【关键词】油田企业;计费系统;数据库;设计

【中图分类号】TE319 【文献标识码】A 【文章编号】1672-5158(2013)01—0150-01

引言:随着科学技术的发展,计算机和网络已经广泛应用到日常的工作中。油田企业也都建立有计费系统数据库,数据库是计费系统的核心,以稳定的计费、设备多层冗余和C/S体系构建安全为主的网络,把3层体系结构B/S作为对象,提供便捷高效的访问服务。计费服务作为一个全新的系统,它可以进行远程多点计算、综合管理、多业务计费、用户多媒体访问等多项功能,并具有很高的系统可靠性和安全性。

一、系统设计的原则

1、实用性原则:遵循实用性原则是所有软件中必须具备的最基本原则,这将直接关系到系统的有效性。数据库的结构和系统的功能都应该满足用户的要求,还应该满足用户对数据查询、共享、统计等需求。

2、可维护性原则:用户在使用系统后,能够修改系统中错误的地方,要具备改进性能和其他属性,使软件产品能够适应环境的变化,设计系统不仅要能够完成系统的功能,还应维护起来方便简洁,降低维护成本,缩减维护人员。具备可维护性是一个很重要的因素。

3、规范化原则:结合油田的实际情况,建立一个具备程序流程、技术规范、技术参数的系统,在建立时应该严格遵守国家的相关政策法规、行业标准以及石油企业的要求,要能够充分体现出计费系统的标准化和规范化。

4、可靠性原则:在系统设计的过程中,结合企业的特点,总结以往的经验,对设计方案仔细的分析,选择最适合的,能够可靠、稳定运行的系统。如果系统出现异常情况时,要有及时合理的应对措施,避免长时间计费的终断近而影响了油田的生产。

5、安全性原则:在设计计费系统时,必须设置严格的防护措施和安全等级,以确保系统安全和数据库的安全。在保证网络环境的条件下,要防止非法用户访问、恶意破坏数据、病毒入侵等情况,保护数据的准确性,实行备份管理。

6、可扩充性和兼容性原则:为了满足系统扩充和发展的需要,系统的功能模块和数据库应具备扩充性。同时也要保证系统能够与石油新旧设备的可兼容性,能够实现实时计费,而且能够与石油计算机局域网络融合,从而满足业务的需求。

二、系统的设计

1、系统体系架构

传统的单机型计费系统,只对与单套交换计费有效,而无法应用到多交换机大系统的统一计费,也不具备业务功能和多媒体、智能化的管理。如果继续使用以往的计费系统,这样就会加大投资和成本,也无法实现数据和业务的统一管理,对新业务的开发非常不利。

新系统的设计必须要实现各子系统相互之间能够实现共享数据库中的数据资源,要集计算机电话集成技术、通信技术、数据库技术、语音技术和计算机网络技术于一体,使它能够支持多种业务、多种交换机和电话、电子邮件、短信、传真等多媒体接入的智能计费系统。用户访问采用的三层分布式结构模型,也就是面向用户使用的Web服务器、浏览器和数据库服务器,用户查询访问是建立在Web浏览器上的一个开放系统。

2、系统软件架构和网络拓展

综合计费管理系统采用模块化的设计思路,开发出各种相对独立的应用功能模块和核心的应用平台软件。核心平台软件和若干相关子模块文件组成应用子系统,每一个模块文件都是一个独立的功能资源软件。管理员可以根据子系统的要求选择子系统。在灵活的子系统下,模块化的结构都能够适应改变的业务流程、资费政策的变化和服务功能扩展,适应性很强。Web服务器、数据库服务器和财务话费营收工作站需要划分到不同的VLAN中,从而使网络的安全得到保障。服务器的安全必须要满足两个条件,一是安装软件防火墙;二是在各种服务器之间加密,并设立对点通信设置的独立密码,从而保证数据通信的安全。

3、软件系统与功能

新的软件系统主要的软件模块分为:核心平台程序、话单采集及分拣程序、计算管理及账务处理系统、话费管理及账务处理系统、话费营收子系统、用户查询子系统和其他的系统。综合计费管理系统中的子系统应有一个核心的平台软件,方便管理员的操作管理。在话单进行处理后,要把数据存储到数据库的服务器中,并且使用可以监测违例话单以及其他的辅助功能。把子系统的计费模块分为计费参数管理、统计分析、用户资料管理等。话费营收子系统主要的功能是向财务部门提供收费结账。用户查询子系统可以使用户进行查询和下载。

三、软件系统的应用

目前,大港油田已经使用了较新的计费系统,具备比较完善的数据通信网络和语音系统,采用高性能的小型机作为系统的主机设备,实现了灵活的账务处理、客户关系管理、呼叫中心等功能,对于油田特有的大客户管理、复杂的费用结算方式等功能也都很好的实现了。部门间也建立了高带宽的数据链路,可以在局域网内实现互联互通。数据库服务器、Web服务器、CTI服务器和网络交换机等都按照规范安装架构,除了有防火墙和数据备份来确保数据的安全性外,在机房为了保证系统具有较高的可靠性,设备都使用大容量的UPS供电方式确保安全。大港油田很好的应用了计费系统管理软件,实现了油田人自己管理通信、网络,实现了专门为油区人民提供便捷服务的目标。

四、结语

随着信息时代的发展,单机计费方式及FoxPro数据库,已经不适合发展的需求,它自身的缺点使它必将会被淘汰,因此要设计一个全新的、先进的综合计费管理系统来满足石油企业自身的发展需要,该系统能够面向客户提供全面、动态、实时的运营服务支撑,对企业内部服务进行监控和管理,成为企业进行运营、业务分析、决策的方向标。

参考文献

[1]邹永平、毛蔚,在线计费系统中内存数据库的研究与应用[J].科技视界,2012,9(27),189-236

[2]张隽,计费系统ORACLE数据库结构及空间管理[J].中国新通信,2012,6(22),28

[3]朱颖辉,OCS在线计费系统解决方案[J].电信技术,2010,12(1),9294

[4]许杰、宁芳露,校园网认证计费系统的设计与实现[J].辽东学院学报(自然科学版),2009,16(1),58-60

大数据时代事项会计的应用与发展 篇12

关键词:大数据,云计算,事项会计,应用与发展

一、事项会计

事项会计理论是由美国学者George·H·Sorter在上世纪60年代率先提出的。自这一理论被提起之后,学者们进行了后续相关研究。尽管这一概念已在相关的文献经常出现,但至今尚未形成统一概念[1]。1970年,Johson将事项会计理论定义为,为了更好地让利益相关者了解并预测各组织机构的未来,企业需要将与企业相关的内部的、环境的和交易的事项以及相关属性或特征进行定期发布,且保证客观和公允。与事项会计理论相对应的是传统会计理论,即以价值法为基础的会计理论。价值法会计理论主要以记录影响资产负债表、利润表等相关报表内要素的变动为主,并且只反映可以用货币化来计量的这一方面属性的变化,是对过去历史情况的反应和记录,是履行受托责任的表现[2]。与传统的价值法会计相比,事项会计的具备的特点如下:

(一)主张多维度反应事项的信息而不仅仅只包括货币信息

传统的价值法会计主要以历史成本计量属性为主,记录的主要是各要素可以以用货币计量变化的这一子集,而事项会计,强调对同一个事项可以有多个计量属性,不同的属性恰好可以反应事项各个维度的特征。另外,事项会计对事项的反映也不只拘泥于用货币计量的方式,还包括那些非货币计量的属性,从各个属性来反映事项的真实情况。

(二)强调提供的信息是未经加工的原始信息

价值法会计下提供的会计信息,是会计人员经过一系列账务处理程序最后列报出来的结果,是按照会计准则的相关要求,对原始数据进行深加工后呈现出来的结果,其处理过程不可避免的受到了会计人员价值观念、个人偏好甚至管理层意识的影响,从而不是企业最原始情况的列示。而事项会计,要求提供的信息是反应事项多维度的原始的数据,是未经过任何加工的信息列示,信息使用者可以根据自己的目的,再对企业提供的原始数据进行加工,满足自己决策的需求。

(三)信息的提供与决策的独立性

对于传统会计而言,企业提供的信息是按照相关会计准则和制度,结合职业判断所处理的结果。信息的使用者只能根据企业提供的相关信息,进行相应的决策。此时,我们是假定企业提供的信息与企业决策之间是密切相关的。而对于事项会计,他们只提供相关经济活动的多维度的原始信息,并不对原始信息进行进一步加工。信息使用者需要根据自身决策的需求,对信息进行加工,从而得到结论。二者之间是相互独立的。

(四)事项法是会计目标受托责任观与决策有用观二者的统一

对于现代财务会计的目标,国内外学者的观点主要分成了两派,一个是受托责任观,另一个是决策有用观。传统的以价值法为基础的会计重点强调的是货币计量和报表披露,反应的是企业的财务状况、经营成果和现金流量等信息,其他的对决策有用的信息并无法纳入到会计报表体系当中。所以,传统会计只能履行受托责任观,其缺点也就显现出来。而事项会计除了能够反应受托责任外,还强调提供信息对决策的帮助,即决策有用性。这也要求了事项会计需要提供事项的多角度信息,使用者再根据自身的需求对信息进行加工辅助使用者做出正确的决策,从而实现受托责任和决策有用二者的统一。

事项会计提出后,国外学者也进行了后续的研究,但总体来看,事项会计的影响力还很有限,处于非主流的尴尬境地。而事项会计首次在中国介绍是在2000年,与首次提出间隔长达30年,提出后国内学者对于事项会计的研究也只停留在理论的简单介绍和比较,并没有做更深入的研究。究其根本原因来看,缺乏事项会计运行的物质基础以及技术支持是导致事项会计研究发展举步维艰的根源所在。而当前,在大数据时代背景下其所能提供的基础数据,与事项会计发展所需要的基础数据,二者之间存在天然的契合性,这就为事项会计的发展提供了物质上的支持,也为事项会计的继续深入研究提供了新的可能。

二、大数据时代为事项会计提供基础数据支持

(一)大数据时代的产生

随着信息技术特别是信息通讯技术的发展,互联网、社交网络、移动互联网、云计算、智能终端、手机应用商店等相继进入人们的日常工作和生活中,信息呈现出爆炸式增长。每分每秒都不停地有数据产生,而且数据会进一步被收集和加工,成为经济要素的重要组成部分。数据逐渐演变成与企业的原材料、固定资产、人力资源等相同的生产要素。所有的这一切昭示着我们已经进入大数据时代[3]。

(二)大数据环境为事项会计提供基础数据支持

事项会计的基本要求是需要大量的原始数据,多维度原始数据是事项会计运行的起点,大数据时代则很好地顺应了这一要求并能够提供基础的数据支持。

1. 大数据时代为事项会计提供多维度的基础数据

传统的数据库背景下,提供的信息类型主要是以结构化的数据为主,而且在数量上和规模上均有限。在大数据背景下,产生的原始数据则不只局限于结构化的数据,还包括半结构化、非结构化的数据,而且结构化数据的所占比重越来越小,半结构化和非结构化比重越来越大,数据的数量和规模与传统的相比也有巨大的增长。所有产生的这些数据都是事项会计运行的起点,是对事项的反映,可以从各个维度反映事项的基本情况,满足事项会计对多元化和个性化信息的需求。

2. 大数据时代为事项会计提供多种渠道的基础数据

大数据时代的产生与信息技术的发展,以及互联网、云计算技术、智能终端等逐渐进入用户日常生活中是密切相关的。用户通过智能手机、电脑、应用商店、GPRS等接入互联网的行为都会留下足迹,而这些终端也都是企业获取信息的渠道。而传统的信息的获取渠道主要依赖于企业内部信息系统产生的结构化的数据,获取信息的渠道有限,二者相比较,大数据时代可从多个渠道搜集事项会计运行所需的数据。

3. 大数据时代大大降低了数据的获取成本

在大数据时代背景下,只要与互联网相连接,企业即可获得大量的信息。企业既不需要投入专门的人力和物力,也不需要借助第三方力量的帮助,通过互联网或者移动互联网,企业就可以轻松搜集到大量的所需的信息,大大降低了信息的搜寻成本。而成本的降低,为事项会计的发展提供了经济上的可能。

三、云计算技术为事项会计的运行提供技术支撑

(一)云计算技术支撑事项会计运行中大量的数据,并且大大提高了数据的运行效率

传统的数据处理主要依赖于企业内部硬件的部署情况,其运行数据的数量和效率都受到主机等硬件设施的局限,要支持海量数据的运算并且保证其运算效率,则只能通过增加投资,购买新的硬件设备来实现,不可避免地增加企业成本。而云计算技术,依托于网格技术,能够实现合理地分配和调度资源,并且实现计算资源的动态化、虚拟化和可伸缩性,从而保证对海量数据的运算效率,且不需要额外的硬件投入。可以说,云计算技术的出现,不仅能够支持海量海量数据的运行,而且还能保证数据的处理效率[4]。事项会计的运行需要大量的数据作为基础,云计算技术的出现为事项会计的运行奠定相应的技术基础。

(二)云计算技术解决了事项会计运行中数据存储的问题并降低了信息储存成本

会计信息的存储经历了一下几个发展阶段。最开始的会计信息是以纸质的形式存储的,通过原始凭证、记账凭证、账簿和报表等载体而储存的。这种储存方式具有效率低、不易保存、成本低等特点。随着电算化的发展,企业的会计信息则逐渐储存于企业自己搭建的信息存储平台,信息存储的质量和效率大大地提高。但是,自建的信息存储平台,往往是独立的信息孤岛,很难实现信息的集成和共享。而目前,进入大数据时代后,企业的信息存储则可以转移到自身搭建的私有云平台或者租用公共云平台。将会计信息存储于云端,一方面可以大大提高信息的质量和存储效率,同时还能打破信息孤岛,实现信息集成和共享。此外,企业是根据所使用空间大小,按需付费,动态变化的,灵活性大大增加;而且,由于将信息存储与云端,大大降低了企业在IT设备,如存储硬盘和处理器等硬件上的投入,降低了企业固定资产投入,从而节约了整个信息的储存成本。

四、大数据时代确保事项会计应用与发展需要注意的问题

(一)确保获取信息的质量

大数据时代下,企业可以轻松地获取与事项相关的各个维度的原始数据,但是获取这些数据的质量可能存在良萎不齐的情况,质量无法保证。原始数据是整个事项会计运行的起点,因此,确保搜集信息质量的可靠性以及高水平性,才能确保事项会计呈现出来信息的高水平,才能切实为信息使用者的决策服务。

(二)健全网络安全体系,确保会计数据的安全性

避免数据的外泄,确保数据的安全性一直是互联网时代需要解决的重点问题。如果涉及到与企业商业秘密相关的信息泄露,肯定会造成巨大的经济损失,进一步影响到用户对网络安全的信任。因此,在互联网时代,尤其像当今这样的大数据时代,如何构建与新环境相适应的网络安全体系,切实保证与企业利益密切相关的数据安全性问题,已成为企业和业界学者急需解决的重要问题。

(三)权衡好信息成本与收益问题

推行事项会计后,尤其在大数据背景下,会涉及到海量数据的搜集、存储与处理,尽管云计算技术大大降低了其成本,但根据“按需使用,按需付费”的模式,总成本还是会数据处理数量的增大而增大,因此,应当衡量好成本与收益间的矛盾,做好信息成本的控制。另外,尽管事项会计要求提供的是反应事项各个维度的原始数据,是未经加工的,但在成本收益原则指导下,在不破坏信息质量的基础上,可以考虑对原始数据的进一步加工和挖掘,以最大化实现信息的价值。

(四)建立健全相应的法律法规和会计准则体系

无论是大数据时代,云计算技术、还是事项会计都是作为新兴事物出现的,所有的理论研究还处于起步阶段,甚至是空白阶段。因此,应加强相关理论问题的研究,优先解决重点和难点问题。尤其事项会计作为对传统会计的彻底颠覆,要保证事项会计的顺利推行,还需要加强相关理论研究,重建原有的会计准则体系,这将是一项工程巨大又富有挑战的工作。只有建立健全相应的法律法规体系和会计准则体系,才能为事项会计的发展提供制度保障。

五、结论

大数据时代的背景客观上促使了云计算技术的产生和发展,而云计算技术的发展与成熟也进一步助推大数据时代的发展。大数据时代背景下,事项会计运行中所需的反应事项情况的多维度数据可轻松获得。同时,云计算技术的发展与成熟,很好地解决了信息处理的效率以及信息存储的问题,既从技术上支持了事项会计的运行,又降低企业的运行成本。因此,在大数据时代背景下,在云计算技术的支持下,事项会计的应用与发展也将迎来它的春天。

参考文献

[1]胡玉明.事项会计:受托责任观与决策有用观的统一——兼论网络时代的会计发展方向[J].外国经济与管理,2002(4):36-42

[2]钟黄聪.防治会计信息失真新途径:实施事项会计[J].财会月刊,2012(22):12-15

[3]翟伟栋.事项会计、数据库会计与REA会计之比较[J].财会月刊,2015(19):98-103

上一篇:电子电工课程下一篇:雷达天线控制系统