数据信息处理

2024-05-21

数据信息处理(精选12篇)

数据信息处理 篇1

摘要:企业信息化过程是一个新系统替代旧系统的过程,从系统应用的角度讲是离散的,从企业业务和数据的角度讲是连续的,两者之间的矛盾在于如何实现新系统与业务遗留数据的兼容。本文从企业信息化建设的实践出发,阐述了企业信息化处理遗留数据的若干问题,并提出了相应的解决方法和策略

关键词:企业信息化,遗留数据处理

一、研究背最

近些年来,我国的企业信息化发展取得了重大的成果,企业范围内信息系统的应用也达到了比较高的水平。尤其在大型的企业中,各部门针对于各自的企业应用,都提出了局部开发的业务解决方案。但是,随着信息技术的不断革新和信息系统应用的不断拓展,反映在新系统中的技术和业务操作的变更使得旧的系统越来越过时并且操作和集成变得越来越困难。因此,为了实现企业信息系统应用的一致性,必须实现新系统与旧系统的技术切换和业务融合,其关键环节就是对于旧系统遗留数据的处理。

企业遗留数据的处理一直是企业信息化过程中的重要课题,究其原因可以分为以下三个方面:

1.异构数据源,信息系统的应用分立,使遗留数据构建在不同的数据库产品和平台上,这些异构平台之间缺乏直接的数据交换工具和成熟的数据共享策略;

2.数据结构不一致,新系统与旧系统间基于不同的应用构建,新系统的数据结构与旧系统的数据结构很难保持一致;

3.企业应用逻辑冲突,交替并行是信息系统应用中一个必不可少的环节,在新旧系统交替的过程中,企业应用逻辑需要覆盖两个系统的业务功能,容易出现新旧系统应用逻辑冲突的情况。

二、遗留数据规划

企业信息化过程中对遗留数据的处理.是一个复杂的系统工程。对遗留数据的处理涉及到业务整合、主键关联以及基础数据一致等多方面的问题,因此,对遗留数据的处理应该建立一定的规划,以保证新系统与遗留系统之间的顺利交接。

从数据应用的角度可以将企业遗留数据划分为基础数据和业务数据两部分。在企业信息系统领域,基础数据可以理解为支持企业应用的底层公共数据,如:ERP系统中的物料编码、BOM数据、部门信息、人员信息等;业务数据可以理解为描述企业业务流转的数据,如:ERP系统中的订单、采购单等。

(一)基础数据规划

基础数据是新旧系统间交互和通信的重要保证,确保基础数据信息项和编码的一致性、关联性对完成遗留数据的处理十分关键。因此,对遗留基础数据的规划可以分为基础数据完善和映射逻辑两部分

1.基础数据完善

基础数据完善的主要工作是比对新旧系统间基础数据的差异,构建新旧系统间基础数据的最大集。具体包含添加、更新和删除重复三种操作。

添加:增加旧系统中存在,但新系统中不存在的数据;

更新:根据表达意义的不同,更新同步新旧系统的数据;

删除重复:将两个系统间具有相同含义的数据合并。

2.数据映射逻辑

建立基础数据的映射逻辑表,通过表1所示的映射逻辑表,将相同信息项在不同系统的表达逻辑、编码对应起来,实现计算机的自动识别和匹配,为数据转换工具的下一步开发做好基础。

(二)业务数据规划

遗留业务数据代表着企业原有业务的核心,鉴于业务承接和延续的重要性,如何将企业业务完整、准确地转移到新的系统中,是处理遗留数据的重要问题。实现企业遗留业务数据的规划需要从以下三方面入手:

1.核心数据最小集

实现企业新旧系统的并行交替,并不需要实现所有遗留数据的转换,否则成本增大,风险方面也不易控制。对于业务数据而言,数据的转换需要遵循业务数据核心最小集的原则,即导入新系统中的数据,只需要保证新系统可以正常运行,企业业务持续不间断即可。

2.编码转换规则

新旧系统采用不同的开发工具和数据库平台,鉴于流程的设计和业务的拓展要求,对于编码结构和编码设计存在较大差距,新编码在旧编码的基础上,一方面可能加深了业务含义的具体化标示;另一方面考虑到业务拓展的要求,也需要对流水号位数等进行扩充。

3.业务逻辑关联

系统中业务逻辑的串联和沟通主要是通过编码的主外键关联体现的,因此,在实现编码的转换过程中,既要考虑到新旧编码的转换问题,也要兼顾原有业务数据的关联性,使替换后的新编码依然保持业务逻辑的一致性。

三、遗留数据应用

遗留数据在完成从旧系统到新系统的转换后,从原则上己经基本满足了新系统的处理要求,可以根据新系统的业务逻辑和处理规则进行相应的操作。但是,对于大多数的系统而言,遗留数据和新系统数据之间必定存在部分信息缺失或者不匹配的情况,这种问题并不是在数据的转换过程中产生,而是由于新旧系统业务流程和设计方面的变更而产生的,这个问题的存在也将直接影响企业遗留数据的应用。遗留数据的应用可以分为两个阶段:企业业务应用阶段和综合统计应用阶段。

(一)企业业务应用

企业业务应用是企业信息化的核心。基于遗留数据的企业业务应用是否顺畅是检验遗留数据处理是否准确的重要依据。遗留数据需要能够最大程度地支持企业业务应用,应该满足以下四点:1.业务流程通畅;2.业务承接性强,容错性高;3.数据实时性:4.数据准确,逻辑关系清晰明确。

(二)综合统计应用

综合统计应用是企业数据汇总和分析的基础。新旧系统的切换,遗留系统数据的转换对综合统计,尤其是统计区间报表的影响较大。因此,在运用遗留数据进行企业综合统计应用时,应建立统计数据映像(某一期初数据的统计结果,而非统计数据源),这样虽然损失了一部分统计数据分析的灵活性,但降低了遗留数据转换的复杂性和风险性,又能够保证企业综合统计应用。

四、结论

本文从企业信息化的角度出发,分析了遗留数据在企业信息化进程中转换、迁移的难点,着重从遗留数据规划和遗留数据的层次提出了如何处理企业遗留数据的方法和原则。

企业遗留数据的处理是一个复杂的系统工程,因需要切换的新旧系统差异不同而各异,本文只是提供了解决企业遗留数据处理的一般方法和原则。在进一步的研究中,作业将考虑数据导入导出效率和数据迁移的工具选择等问题,另外,设计部分数据处理脚本的编制以及脚本编制的“重复应用”也是下阶段需要研究的重要问题。

参考文献

[1]Fred A.Cummins.企业集成.机械工业出版社,2003.

数据信息处理 篇2

摘要:随着信息时代的到来,当下对信息进行有效的处理是社会快速发展的基础保证,传统信息处理方式已经无法跟上时代的发展,本文就新型计算机信息处理技术的现状、主要技术类型等方面进行论述。

关键词:大数据时代;计算机信息处理技术;影响;主要技术类型

大数据时代的到来,对信息处理技术提出了一个巨大的挑战。当前人们生活的方方面面都以数据的形式进行储存,因此对信息的有效处理是提高人们生活质量的最佳途径。

一、大数据时代与信息处理技术的概述

(一)大数据时代大数据时代即是指当今以数据为中心的时代。大数据时代主要是指数据的复杂性、数据的总量大、数据的单个珍贵性低等特性。在当代各行各业在发展时都离不开大数据的使用,大数据由其独特的优势逐渐成为了当前社会发展的核心动力。大数据在行业发展中不仅可以发展数据的优势,还可以提升数据的利用率,推动社会的发展。根据当前大数据时代的发展推断,在未来,大数据定会给世界带来巨大的变化,大数据必将成为时代发展的主要推动力。(二)计算机信息处理技术当今时代发展中,由于数据的审核方式的问题,使数据没有进行有效的分类与处理,进而无法得到设想中的结果。[1]当前计算机信息处理技术主要与电子技术、网络技术等先进技术进行结合,实现信息的`动态管控,在生产生活中最大程度提升工作的效率。计算机信息处理技术是将信息处理程序、数据传输等进行有效的结合,它可以最大程度的使程序信息简化,使工作效率增大,提升整体的效益。

二、大数据时代对信息处理技术发展的影响

随着经济的发展,当前社会上信息的类型越来越多,传统信息处理方式已经无法对信息进行有效的分析,获得答案,因此当前要想对信息进行有效的分析,并从中获得自己所需要的内容,就需要对信息实现正确、及时、有效的处理,进而最大程度的提取信息的有效资源,就需要一种新型的信息处理汇总方式。即:计算机信息处理技术,这种技术不仅可以从海量的信息中提取有效的信息,还可以对有效信息中重要的内容进行汇总,进而取得最为有效的数据。随着时代的发展,社会对信息处理技术的要求不断提升,促使计算机信息处理技术不断发展,进而使我国经济发展的更加迅速,直接推动了我国社会的发展。

三、计算机信息处理技术的主要技术类型

大数据处理技术是将数据进行合理有效的储存和正确的分析的过程,它是对数据进行分析的过程,是为后期计划提供发展信息规划的重要依据。[2]计算机处理技术是具有高效的分析能力,进而由这个特点发展出了以下几类技术类型:(一)虚拟化管理技术虚拟化管理技术是利用虚拟网络资源建设的信息传输信道对信息的传输和管理过程进行规范,进而提升信息的有效利用程度和处理速度,使得大量的数据信息可以有效的归类储存,方便后期在数据使用时进行调取使用。现今我国在社会发展中,数据的总量越来越多,且数据的类型也越来越多,这直接使数据的总量增大。传统所有信息统一处理的方式已经无法有效实现对信息的处理和管控,计算机管理技术可以将信息进行归流,提升对大规模数据的处理能力和整体的工作效率。(二)用户信息安全技术随着时代的发展,人们的衣食住用行已经离不开信息,例如淘宝、支付宝、微信等,他们不仅与人们的信息定向绑定,定还与人们的工资卡等绑定。[3]人们越来越多的信息以数据的形式进行储存。当前为了提升整体信息的安全水平,用信息安全管理技术对人们的信息进行管理,并不断提升整体的安全水平,保障人们信息安全。(三)资源合理调配技术资源的合理调配技术是一项基于大数据合理分析得到的一种方式,这种方式不仅可以优化资源,使用户得到最优质的享受,还可以根据实际情况对资源进行合理的调配,实现资源的最大化利用。例如在网络运行带宽分配时,带宽分配系统可以根据不同人此时上网情况,对带宽进行合理的分配,使带宽当前可以最大化的使用,防止带宽的浪费。这是路由交换中的一个协议,即是资源调配技术最高的体现。(四)云储存与计算技术云技术主要分为以下两个部分:1.云存储。云存储即是将信息储存在服务器上,减少用户存储信息量,进而减小PC端机器体型。随着时代的发展,数据的总量往往都很大,每台机器都储存信息的话,会直接致使每台机器的体型都变得很大,并且在数据处理时还会由于数据的总量大而增大数据处理的难度,因此在数据整体管控中出现了服务器这一结构。[4]服务器用于接受数据,将数据进行储存,直接增大数据的可利用性,它还可以使每一台用户访问机器不用储存过多的数据,只需要在需要时向服务器发送请求,服务器便会将需要的信息进行回执,进而完成信息的取用。2.云计算。云计算技术即是在整个网络架构上加入一个超级计算机,超级计算机可以对用户输入的信息进行接受和处理。这样可以使超级计算机有效地为人们提供计算功能。云计算是分布式结构优势的具体体现,它可以使信息的处理速率和信息的使用更加快速有效。

四、结束语

综合上文可知,在大数据时代的今天,数据的总量还在不断增加,当下信息的高效是中国发展的一个有效保证,因此想要使我国快速进入现代化国家,就必须更快更加有效的实现对数据的使用,因此当下发展数据处理技术是时代决定的方向。

参考文献

[1]陈明奇,姜禾,张娟,等.大数据时代的美国信息网络安全新战略分析[J]信息网络安全,,(8):32-35

[2]陈荣.“大数据”时代的计算机处理技术探究[J]湖北函授大学学报,,(16):128-129,147

[3]于蕾.大数据时代计算机信息处理技术分析[J]电脑知识与技术,,(29):216-217

[4]彭钰超.大数据时代下计算机信息处理技术的应用[J]数字技术与应用,2016,(9):255-255.

数据信息处理 篇3

关键词:大数据时代;信息处理技术;计算机系统

中图分类号: TP2 文献标识码: A 文章编号: 1673-1069(2016)111-153-2

0 引言

麦肯锡说过:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”他是最早提出大数据时代的人,而实际上,大数据时代早已来临,只是随着互联网的普及度越来越高,才会在最近越来越被人所重视和关注,在这个巨大的浪潮冲击下,发展计算机信息处理技术,才能够在大数据时代下紧跟而上,不被时代的浪潮所淘汰。

1 什么是计算机信息处理技术

现代信息处理技术基本上是指用计算机技术处理信息,因为计算机运行速度极高,而且能在自动处理大量的信息同时确保很高的精确度,计算机信息处理技术伴随着计算机的诞生而诞生,而在这些年里,它所发挥的作用也越来越巨大,越来越明显。

信息处理技术本身经历了好几个时代,从最初的手工处理,到之后的机械信息处理时期,到如今在大数据时代之中的计算机信息处理,信息的处理方式越来越迅捷和快速,甚至在很多程度上完成了信息处理的自动化。

2 计算机信息处理技术在大数据时代的作用

大数据时代有着自己明显的特点,例如数据量大,快速,复查能力,种类繁多等,数据包含的内容繁多,种类也自然是不计其数,如果没有良好的信息处理能力,必然会造成信息紊乱,甚至会产生错误信息和虚假信息等现象,在数据的传递和运输过程之中,数据还面临着各种丢失的风险,如果不能够好好的管理信息,就会造成一些不必要的损失,甚至有些会伤及根本,所以,拥有良好的计算机信息处理技术是想要站在大数据时代前列的先决条件。

2.1 信息处理技术是信息作战的重要支柱

在现代,信息处理技术的主体——计算机技术和作为信息处理工具的电子计算机已经成为了信息作战之中的重要部分,信息处理技术的提高,可以让信息的各种处理对抗实现自动化,成为协调作战的诸军,以夺取信息作战的胜利,现如今信息处理技术成为了信息作战的重要支柱,信息处理技术的应用程度,标志着信息作战程度所达到的高度。

同时,信息处理技术,如同虚拟现实技术、计算技术、显示技术、数据库技术等等方面的技术处理,推动着信息作战指挥控制方式和训练方式的变革和手段的更新,日益显示出传统的指挥控制、训练方式和手段无法比拟的先进性,它是信息作战未来的发展方向,也是必须要提前做好准备的特殊技术,想要能够在信息作战之中占得先机,就必须要在这个方面下足够的苦功夫,避免到了关键的时候产生不必要的损失。

2.2 信息处理技术是追赶大数据时代的重要工具

在进入数据时代以来,信息技术的处理就显得格外重要,在计算机和互联网快速发展的今天,大量的信息涌入了人们的日常生产生活,如果没有用一个良好的信息处理系统,很容易就会导致信息的滞怠,也会让原本就有些落后的技术更难以追赶上其他国家。

良好的信息处理技术,不仅能够加快信息处理的速度,还可以在这个基础上保证信息安全,加强计算机网络的防范,例如增强防火墙技术和加密技术等,可以让整个信息网络环境更加的安全,保护计算机和内部的信息安全。

同时,信息处理技术的优秀意味着信息的传递和交流也会变得更加的迅速,有利于彼此之间的信息沟通,加速信息的流通,可以大幅度的节约时间,增加效率,让沟通和交流变得更加快捷和安全。

2.3 信息处理技术是计算机系统的根基

信息处理技术是计算机的基础,人们对于计算机系统的管理和利用,都是通过信息系统来完成的,信息处理技术就是对信息系统的处理,在这个系统的基础上,连带的构建其他的系统和体系,当各种系统集合在一起时,才能够发挥计算机的作用,可见计算机本身就是以数据库和通信网络技术为依托,想要提高计算机的性能,就需要从根本上强化信息处理技术。

而最基本的信息在未经处理的情况下是混乱无序的,只有将这些信息进行整理和分类之后,才能够发挥出信息应有的作用,实现信息的有效储存和利用,想要发展计算机系统,就必须要做好信息处理技术。

3 大数据时代下的信息处理技术

大数据时代下的信息处理技术就是计算机处理技术,而它同样有着自己的鲜明特征,例如高效性,安全性和稳定性,而如果从功能上进行分类,大致上可以分为信息的储存技术、信息采集技术、和信息传输技术,每一个步骤都是信息处理技术之中不可缺少的,也是计算机软件发展的过程之中必然要重视的部分。

3.1 信息储存技术

互联网在大数据时代之下,内部的内容也会越来越丰富,需要保存和处理的信息也会越来越多,大量的虚拟化信息不断的溢出,对于容量的追求也就在不断的扩大,多元化的信息同样意味着更加庞大的信息容量需求,想要解决这个困境,只有提高信息处理技术,不断的增加能够处理的信息的容量,完成更多的信息保存和处理,才能避免一些重要的信息资源流失,以防造成不可估量的损失。

3.2 信息采集技术

除了信息储存的技术之外,获取信息也是非常重要的,因为在数据量不断增加的今天,海量的信息浪潮袭来,想要在这巨大的信息数量之中找到自己想要的有用的信息无异于大海捞针,计算机的处理如果不能够基于正确有用的信息来进行,那么毫无疑问是会产生负面影响的,甚至会让信息处理本身陷入一个困境当中。

另外,单纯的采集也是远远不够的,在信息采集完成之后还需要对采集到的信息进行数据上的加工,分类,将处理完成的信息提供给使用者,只有这样,才能够算是完成信息的采集处理,这是一个相当复杂的过程,如果没有一个优秀的信息处理技术,那么采集的速度必然会大幅度降低,而且,还可以提高信息采集的正确率,提供更多正确有用的信息。

3.3 信息传输技术

信息的传输技术顾名思义就是信息在不同的计算机之间通过网络连接形成信息的传输,传输的效率和传输的安全性对于计算机自身而言相当的重要,提高信息处理技术,可以有效的提高信息的传输效率和安全性,保障信息在传输过程之中不会发生意外的同时加快传输的速度,节约时间和金钱。

在现代,虚拟产业已经成为了国家经济的重要组成部分,信息的传输技术的有效发展影响着整个虚拟产业的进程,也直接关系到我国现代化和经济改革的成效,拥有良好的信息传输技术,是发展现代的信息处理技术的核心。

4 信息处理技术在大数据时代下带来的效益

在大数据时代下,信息处理技术得到了长足的进步,并且在自身的进步的同时,信息处理技术同样带来了无可比拟的效益。

首先,因为它泛用性广,节约时间,而且还能够提高信息的准确性和安全性,让企业有更多更好的时间运用到决策之中,发展了企业,带动了经济的增长,从侧面提高了我国的经济发展。其次,它还促进了我国相关行业的发展,例如计算机行业,软件行业,轻工业以及电子商务行业,越来越多的虚拟商务的研发,就意味着信息处理技术发挥着越来越重要的作用,成为我国发展过程之中的一块重要的基石。

5 总结

在未来,数据时代的浪潮必然会越来越明显,计算机信息处理技术也将会被越来越多的人所重视,研究信息处理技术在各个方面,都可以对计算机的运用和处理产生增益,并且可以节约时间,保障信息的安全,提高工作和生产生活各个方面的效率,而我国想要在大数据时代之中走上时代的前沿,计算机信息处理技术的探索和研究就是必不可少的,发展计算机处理技术,是历史的必然趋势,也是众望所归。

参 考 文 献

[1] 赵英伟,郭凯.浅谈信息处理技术的发展[J].信息通信,2014(12).

[2] 吴恩生,王桂梅.大数据时代计算机信息处理技术分析[J].江苏科技信息,2015(12).

数据信息处理 篇4

关键词:临床科研,信息共享,数据关联,数据安全

1 引言

中医学既往一直采用“从临床中来,到临床中去”的发展模式,临床实践是中医学发展的基础,个体化诊疗是中医临床实践的主体,辨证论治个体化诊疗所形成的海量临床诊疗信息和数据是中医临床研究和基础研究的源泉[1]。中医学不断从临床实践中总结经验,又不断到临床实践中验证,所获得的经验或知识常常是个别的、零散的[2]。如何记录中医临床诊疗实践中大量的中医学知识和诊疗信息,并使得这些记录的信息能够用于分析中医临床诊疗的疗效和经验知识,是中医学现代化研究和发展的重要课题[3]。在信息技术高度发展的今天,人们迫切需要将临床实践与科学研究有机结合,建立起可供临床医生与科研人员共享的信息系统。

2 临床科研信息共享系统

2.1 建设背景

根据《中医临床研究基地建设指导意见》和《中医临床研究基地业务建设要求》,构建中医临床与科研信息共享系统是中医临床研究基地业务建设的重要任务,是落实国家中医药管理局关于基地建设“一体两翼”建设任务的重要举措。江苏省中医院是重点研究脾胃病的国家中医临床研究基地。依据国家中医临床研究基地建设的指导要求和意见,江苏省中医院根据基础设施建设和管理要求,创新整合全院信息资源,围绕本院的临床研究基础和优势,合作研发高水平、开放的临床科研信息共享系统,打造具有示范效应的中医临床研究基地。该临床科研信息共享系统是基于临床科研一体化的理念,利用现代信息技术,在标准化、规范化的基础上,充分整合计算机、数理统计、数据挖掘、人工智能等方法构建的中医临床研究的技术平台。

2.2 系统架构和设计思路

该系统运用SOA的架构思想、J2EE(Java 2 platform,enterprise edition)和Microsoft WPF(Windows presentation foun dation)技术相结合的设计理念,采用C/S/S(Client/Web service/DBServer)的架构设计,遵循卫生部制订的健康档案数据集标准,同时基于数据集成交换平台[4],构建一个可靠、标准、开放、可扩展的临床和科研共用、共享的应用环境。

该系统的数据标准以卫生部《健康档案共用数据元》为基础蓝本,参照卫生部《健康档案基本数据集编制规范》中的各项规范要求对未覆盖的数据元进行扩充。严格采用数据标准生成的数据实体对象作为系统数据的载体,收集健康模型中的全部数据和院内其他信息系统中的数据,并按照不同的仓库类型分类存储各类数据。利用分类数据仓库和专病主题仓库进行相关的科学研究和分析工作,并利用研究结果进一步提高临床工作效率和质量。

2.3 系统主要内容

临床科研信息共享系统实现了门诊、住院临床相关工作的各项功能,包括:门诊病历、医嘱、检验检查申请、处方、住院病历、病程、手术、出院小结、病案首页等,同时将科研工作各项内容和要求与临床工作进行整合,实现了临床科研一体化的理念,完成的功能包括:科研管理、课题管理、临床路径、诊断分型、随症加减药物、访视病历、病历补录、数据导出等(如图1所示)。

该系统实现了业务流与信息流的有机融合,加强了现有医疗资源的整合,整体提高了临床医疗服务、疾病分析和中医研究的能力。系统既能满足当前阶段医院临床医疗活动中的各种需求,同时又能保障中医临床研究基地建设中科研教学和数据挖掘分析要求,适应中医临床研究基地信息化建设的需求。

3 临床科研信息共享系统数据处理策略

3.1 医疗业务数据导入

由于医院医疗业务系统分门别类,业务数据种类繁多,有检验报告、病理报告、影像报告等。在诊疗过程中,需要能随时查看上述医疗业务数据以及患者既往就诊信息。临床科研信息共享系统通过数据集成交换平台(DIP),整合各个异构信息系统资源。该系统可以自动实时导入医嘱、检验报告、检查报告的信息,可以在进行病历资料编辑时自动引用相关信息(如图2所示);同时支持时间范围查询,用户可自行输入日期范围,查找该范围内的门诊、住院和检验检查报告信息。

3.2 医疗及科研数据的关联引用

临床医疗与科研业务的最大矛盾在于:临床医疗过程中由于患者数量庞大,要保证高效率,就需要电子病历的操作简单,录入快捷,用最少的时间记录如主诉、现病史、诊断、医嘱等必要的医疗信息;然而临床科研却需要搜集大量详细的医疗信息,并填写复杂的科研量表,例如:体格检查表、生存质量分析表、疾病评估量表等,这些量表的填写将耗费较多的精力,增加临床医生的工作量,延长医疗时间和患者等待时间。上述矛盾在门诊业务中显得尤为突出,这也是国内诸多临床科研一体化系统难以在医院门诊部广泛使用的重要原因。

针对此矛盾,临床科研信息共享系统研发了关联并引用的采集模式,自动整合临床和科研数据,充实和完善每位患者的健康数据,临床医疗和科研量表两者间相同的信息只需一次性输入,避免重复性动作。基于标准化数据元,采用结构化病历采集模式,医务人员在填写病历时只需选择相应的结构化选项,极大地减少了打字输入的内容(如图3所示)。在临床医疗过程中已录入过的结构化信息,会自动引入科研量表中,并以红色部分显示,无需重复输入(如图4所示),明显提高了工作效率,缓解了临床医疗与科研业务之间的矛盾。

3.3 医疗及科研的数据安全

医疗数据一直被视为敏感信息,随着医院信息系统承载的医疗数据越来越多,医院信息系统是否可靠、传输环境是否安全直接关系到医疗数据的机密性和完整性,成为影响医疗活动正常开展的关键因素。临床科研信息共享系统的应用,使得医护人员从对一张纸质病历的负责转向对一段数据电文描述内容的认可,使得科研人员从对一本纸质的科研病历和量表的负责转向对电子科研病历和量表内容的认可,这样数据电文的责任归属是否明确直接关系到信息化流程能否完全取代传统的纸质流程。此外,医疗管理中临床医疗和科研病历的生成、修改及访问等的时间敏感性极高。目前,这些事件大多由信息系统服务器时间产生,很容易因在场时间的记录不准确,从而导致医疗行为时间缺乏公信力。

临床科研信息共享系统将引入数字证书认证系统,利用数字签名技术保障医疗数据的完整性,不仅能保证医疗数据的“数出有源”,还有助于规范临床路径、实现医疗过程监管,促进医疗服务质量和紧急医疗救治能力的提高。同时,在保证时间源可信的前提下,对所有关键行为操作进行时间戳处理并记录,确保提供可信的时间服务。

4 实施情况

临床科研信息共享系统经过长达1 a的调研、考察、临床需求分析征求,于2010年9月正式开始开发。选择江苏省中医院临床研究基地重点病种胃癌、溃疡性结肠炎,梳理中医服务流程,定义系统的详细功能。于2011年6月,完成了系统的设计、开发、测试、与医院其他业务系统的数据交互以及试运行工作,并在2个重点病种的门诊和病房正式使用。系统实现了门诊、住院临床相关工作的各项功能,包括:门诊病历、医嘱、检验检查申请、处方、住院病历、病程、手术、出院小结、病案首页等,同时将科研工作各项内容和要求很好地同临床工作进行整合,实现了临床科研信息共享的理念,完成的功能包括:科研管理、课题管理、临床路径、诊断分型、随症加减药物、访视病历、病历补录、数据导出等。目前,该系统通过临床的不断试用,各种功能正在不断地优化和完善。

5 总结

临床科研信息共享系统实现了全院医疗信息的整合,在录入临床、科研病历的同时,通过数据集成交换平台,与其他业务系统的医疗资源进行数据交互,达到一次性录入、信息共享的目的。基于标准化数据元,利用结构化病历,在门诊问诊的同时,进行科研病历的及时录入。本系统满足基地规范化建设的要求,可实现临床、科研的信息共享,提高中医临床数据的采集、整理和分析能力。

参考文献

[1]闰秀峰,刘保延,陈世波,等.基于临床科研一体化理念的中西医结合肿瘤结构化电子病历的研究现状[C]//2009年首届全国中西医肿瘤博士及中青年医师论坛论文集.北京:中华中医药学会,2009:99-103.

[2]刘保延,张启明.构建中医临床科研信息一体化平台需要解决的症状规范问题[J].中医杂志,2011,52(20):1 714-1 716.

[3]刘保延,周雪忠,李平,等.个体诊疗临床科研信息一体化平台[C]//中医药优秀论文选(下册).北京:中华中医药学会,2009:783-790.

数据处理教案 篇5

引言:

根据高专中专部安排,由我带10级综合班的数据处理课和Office办公自动化课,根据教学的要求,特写此教案,该教案分为5部分,第一部分介绍数据处理定义,结构,常用软件;第二部分计算机基础;第三部分介绍Excel数据处理;第四部分介绍常用数据库(access、sql语句),第四部分介绍简单的关系数据库、数据建模等;第五部分介绍简单的数据处理、报表制作等。

第一部分数据处理定义,结构 第一节 数据处理定义

教学目的:通过对数据处理的定义使学生明白,在当今的社会,数据是如何的重要,数据处理在现代社会中起到什么样的作用。

教学内容:重点是数据处理的定义,难点为如何看待数据和信息的关系,模糊数据和数字数据的区别 教学方法:口述与上机

教学进程:全面4个课时为理论口述讲解,后面4个课时上机介绍数据处理常用软件。

1.1.1数据处理定义

数据处理是对数据的采集、存储、检索、加工、变换和传输。数据是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据的形式可以是数字、文字、图形或声音等。数据经过解释并赋予一定的意义之后,便成为信息。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节。数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度,极大地影响着人类社会发展的进程

1.1.2数据处理软件

数据处理离不开软件的支持,数据处理软件包括:用以书写处理程序的各种程序设计语言及其编译程序,管理数据的文件系统和数据库系统,以及各种数据处理方法的应用软件包。为了保证数据安全可靠,还有一整套数据安全保密的技术。1.1.3 数据处理方式

根据处理设备的结构方式、工作方式,以及数据的时间空间分布方式的不同,数据处理有不同的方式。不同的处理方式要求不同的硬件和软件支持。每种处理方式都有自己的特点,应当根据应用问题的实际环境选择合适的处理方式。数据处理主要有四种分类方式①根据处理设备的结构方式区分,有联机处理方式和脱机处理方式。②根据数据处理时间的分配方式区分,有批处理方式、分时处理方式和实时处理方式。③根据数据处理空间的分布方式区分,有集中式处理方式和分布处理方式。④根据计算机中央处理器的工作方式区分,有单道作业处理方式、多道作业处理方式和交互式处理方式。

1.1.4 数据处理加工

数据处理对数据(包括数值的和非数值的)进行分析和加工的技术过程。包括对各种原始数据的分析、整理、计算、编辑等的加工和处理。比数据分析含义广。随着计算机的日益普及,在计算机应用领域中,数值计算所占比重很小,通过计算机数据处理进行信息管理已成为主要的应用。如侧绘制图管理、仓库管理、财会管理、交通运输管理,技术情报管理、办公室自动化等。在地理数据方面既有大量自然环境数据(土地、水、气候、生物等各类资源数据),也有大量社会经济数据(人口、交通、工农业等),常要求进行综合性数据处理。故需建立地理数据库,系统地整理和存储地理数据减少冗余,发展数据处理软件,充分利用数据库技术进行数据管理和处理。1.1.5 数据清洗

有关商务网站的数据处理:由于网站的访问量非常大,在进行一些专业的数据分析时,往往要有针对性的数据清洗,即把无关的数据、不重要的数据等处理掉。接着对数据进行相关分分类,进行分类划分之后,就可以根据具体的分析需求选择模式分析的技术,如路径分析、兴趣关联规则、聚类等。通过模式分析,找到有用的信息,再通过联机分析(OLAP)的验证,结合客户登记信息,找出有价值的市场信息,或发现潜在的市场。

第二节数据处理结构

教学目的:通过对数据处理结构的介绍使学生明白数据仓库、数据集市与数据挖掘的关系。

教学内容:重点是数据仓库的图像理解,难点也是数据仓库整体结构的理解。教学方法:口述与上机 教学进程:全面4个课时为理论口述讲解,后面4个课时上机介绍数据仓库案例。

1.2.1商业智能在中国的发展机会(数据处理)

商业智能就像几年前的ERP(企业资源管理)一样,正成为企业首席技术官们关注的焦点,呈现如火如荼的发展态势。众所周知,在ERP等基础信息系统部署完之后,企业能够对其业务数据进行更为有效的管理,于是如何利用这些数据创造价值成为企业下一步思考的问题。

商业智能系统已经作为一种含金量极高的管理工具,融合在部分大型企业管理文化的血脉之中了。商业智能在帮助企业管理层发现市场机会、创造竞争新优势的作用显而易见,因此成为企业信息化的新宠也是必然的。

商业智能软件市场稳步增长

从全球范围来看,商业智能领域并购不断,商业智能市场已经超过ERP和CRM(客户关系管理)成为最具增长潜力的领域。从中国市场来看,商业智能已经 被电信、金融、零售、保险、制造等行业越来越广泛地应用,操作型商业智能逐步在大企业普及,商业智能不局限于高层管理者的决策之用,也日益成为普通员工日 常操作的工具。

不过,尽管这个市场潜力巨大,但仍有不少的现实情况导致这一市场的发育没有大家预期中的那么好。首先一点,国内的成熟、专业的商业智能实施顾问较少,不但上游厂商的相关人才少,下游负责实施的渠道合作伙伴更是缺乏相关人才,很多时候用户要启用商业智能工具,但是不太明确自己的需求,负责实施的人很多时 候也是一知半解,不能给用户很好的解决方案;其次,目前多数商业智能厂商,尤其是国外厂商都是通过分公司或办事处来销售的,而未来国内制造业企业多数需要 本地化服务,这种模式必将改变。同时,商业智能系统的销售、服务要求代理商要有很强的能力,如何选择、培养、发展这些代理商将是商业智能大发展面临的一个很重要问题。

SaaS将成为重要交付模式

同时,商业智能系统的核心不是平台,而是模型。目前,由于国内应用商业智能的企业并不多,应用深入的更少,应用基础也比较薄弱,即使拿来国外先进的商 业模型也不一定能运转起来,所以尽快建立各种适合国内企业特色的模型是各服务商未来要加大投入着力解决的。当然,对企业而言,商业智能的有效应用,离不开 数据的支持。如果没有准确的数据,那么所要分析产生的报表、决策都与事实存在差距,将会导致整个决策的错误,因此,必须要求前期的数据准确。

最后,随着云计算的大规模普及,下一代商业智能的精细分析系统很可能会建设在动态的基础架构上,而虚拟化、云计算等技术的发展也会带动商业智能系统的建设和应用,这就是“云智能”。我国企业需要抓住“云智能”机遇,加快发展、迎头赶上,才能从容应对下一阶段的全球化竞争。

1.2.2数据仓库技术的发展及体系结构 数据仓库技术的发展及概念

传统的数据库技术是以单一的数据资源,即数据库为中心,进行事务处理工作的。然而,不同类型的数据有着不同的处理特点,以单一的数据组织方式进行组织的数据库并不能反映这种差异,满足不了现代商业企业数据处理多样化的要求。总结起来,当前的商、世企业数据处理可以大致地划分为2大类:操作型处理和分析型处理。操作型处理也叫事务型处理,主要是为企业的特定应用服务的(这是目前最为常用的),分析型处理则用于商业企业管理人员的决策分析,这种需求既要求联机服务,又涉及大量用于决策的数据,传统的数据库系统已经无法满足,具体体现在:

1)历史数据量大;

2)辅助决策信息涉及许多部门的数据,而不同系统的数据难以集成;

3)由于访问数据的能力不足,它对大量数据的访问能力明显下降。

数据仓库技术的出现为解决上述问题提供了新的思路。数据仓库的创始人Inmon指出:“数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持经营管理中的决策制定过程”。它从大量的事务型数据中抽取数据,并将其清理、转换为新的存储格式,即为决策目标把数据聚合在一种特殊的格式中,作为决策分析的数据基础,从而在理论上解决了从不同系统的数据库中提取数据的难题。同时,利用联机分析处理(OLAP)技术可以对数据仓库提供的数据进行深入加工。

企业数据仓库的体系结构

一个典型的企业数据仓库系统通常包含数据源、数据存储与管理、OLAP服务器以及前端工具与应用4个部分。

1)数据源。

数据源是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于企业操作型数据库中(通常存放在RD-BMS中)的各种业务数据,外部信息包括各类法律法规、市场信息、竞争对手的信息以及各类外部统计数据及各类文档等。

2)数据的存储与管理。

数据的存储与管理是整个数据仓库系统的核心。在现有各业务系统的基础上,对数据进行抽取、清理,并有效集成,按照主题进行重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据(具体包括数据仓库的数据字典、记录系统定义、数据转换规则、数据加载频率以及业务规则等信息)。按照数据的覆盖范围,数据仓库存储可以分为企业级数据仓库和部门级数据仓库(通常称为“数据集市”,Data Mart)。数据仓库的管理包括数据的安全、归档、备份、维护、恢复等工作。这些功能与目前的DBMS基本一致。

3)OLAP服务器。

对分析需要的数据按照多维数据模型进行再次重组,以支持用户多角度、多层次的分析,发现数据趋势。

4)前端工具与应用。

前端工具主要包括各种数据分析工具、报表工具、查询工具、数据挖掘工具以及各种基于数据仓库或数据集市开发的应用。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具既针对数据仓库,同时也针对OLAP服务器。

1.2.3商业智能(BI)落地需要的三大工具

商业智能(后面简称BI)的各类角色用户必须借助和使用工具实现其需求。BI角色分为业务、业务融合技术、技术这三类,对于其相应的应用需求(含演绎型和归纳型)和管控开发需求,需要借演绎型需求支撑工具和归纳型需求支撑工具,及管控开发型工具来予以实现。本篇先讲述演绎型需求支撑的7种工具,其可分为描述统计工具、经营技术与方法、经济预测方法与模型、OLAP分析、知识发现工具、专家系统以及决策方法与模型。管控开发支持型工具一般包括系统管理工具、开发工具;

笔者认为BI以认识论和组织理论为基本原理,采取相适宜的“工具”,旨在帮助 “相关角色”对职责范围内的“有关内容”做出最佳决定的整体解决方案。它由“三维模式”和“三层漏斗”组成,是辅助整个企业集理念,组织,流程,技术为一体的整体决策支持方案三维模式由角色维、内容维和工具维构成,体现了BI的主体、客体和工具等一般性原理。根据BI的定义,只有清晰划分相关角色并据以确定需求,并借助工具才能实现BI辅助主体对职责范围的有关事项做出最佳决定的宗旨。

BI的业务类角色、技术类角色以及业务融合技术类角色对应存在着业务应用需求(指业务类的演绎型需求和业务融合技术类的归纳型需求)和技术应用需求,即管控开发型需求。这种需求能否得以有效实现和提升,必须借助工具。针对三大类角色的两种需求,BI的工具分为应用型支撑型工具和管控开发支持型工具。鉴于文章的范围,硬件支撑工具的内容请参见相关书籍。

应用支撑工具可以分为描述统计工具、经营技术与方法、经济预测方法与模型、OLAP分析、知识发现工具、专家系统以及决策方法与模型。管控开发支持型工具一般包括系统管理工具、开发工具。一般来说,这些工具以软件包的形式形成产品。鉴于BI对于业务应用的重要作用及业务应用成功对BI的重要意义,本文着重分析BI的应用型支撑工具,并对有关产品作简单介绍。

一、实现演绎型需求的7种工具

BI的演绎型内容可以分为三个层次:报表查询、综合分析、决策选择讨。如下图所示,BI的演绎型需求通过描述性统计工具、报表与展示工具、经济预测方法与模型、经营技术与工具、OLAP分析及专家系统工具、决策方法与模型来实现。

上图中,描述性统计工具帮助用户在报表查询层次实现对事实的充分了解;综合分析以逻辑的方式帮助相关主体寻求原因或对简单问题直接获得建议,需要运用经济预测方法与模型、经营技术与工具及OLAP分析来得以实现。专家系统和决策方法与模型是实现定量和部分定性决策的有力工具。通过该类工具,用户在决策选择时通过评价各个方案的优劣来辅助主体选择最优,得出结论。BI 演绎型应用的三层次结构合理、有步骤地解决了前提、逻辑规则和结论这一演绎型思维方法的迁移应用。

(一)描述性统计工具

统计的基本意义在于利用统计指标,通过指标值的对比关系和发展变化来研究社会经济现象的数量和数量关系,表明其变化发展的过程、结果及其规律。作为统计学两大基本内容之一的描述性统计是整个统计学的基础和统计研究工作的第一步,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,而对变量的集中趋势和离中趋势的分析则是其主要内容。描述性统计工具指为实现相关主体对基本事实了解的需求而需利用基本指标。这些基本统计指标包括总量指标、相对指标、平均指标和变异指标。

总量指标:表明具体社会经济现象总体的规模、水平或工作总量的数值,是计算各种派生指标的基础。如某集团公司年销量即是总量指标。它可分为总体单位总量、总体标志总量和时期总量(如某个事业部门的总销量)、时点总量(如月末库存)。总量指标可通过直接计算和间接计算求出。

相对指标:表明两个互有联系的社会、经济现象之间数量对比关系的统计指标。如竞争企业之间库存周转率的对比,或行业内某企业销量与行业总销量的对比等等;常用的同比和环比也是相对指标的运用。相对指标反映了社会经济现象的实质及其数量的对比关系,从现象间数量对比关系中清晰地认识事物。其次,可使原来无法直接比较的现象,找到共同的基础进行科学地对比分析。相对指标又包括:计划完成程度指标、结构相对指标(高中低档产品利润在全部利润中的各自占比)、比例相对指标(产品A与产品B的对比)、比较相对指标(某企业销量增长率与竞争企业销量增长率的对比)、强度相对指标(如烟草行业销售情况中条/人指标的对比)、动态相对指标(如历年的销售额的比较)。运用时,要正确选择对比的基数、确定可比的对比指标、相对指标要与对比基数结合使用。

平均指标:反映同质总体内各单位某一数量标志的一般水平,可以对比总体的一般水平,如分公司年平均销量与总公司平均销量的对比,可以进行数量上的推算和预测。平均指标有算术平均数、调和平均数(较少用,主要用于已知标志总量而不知单位总量的情况)、几何平均数(一般用于计算平均发展速度)、众数(一组序列中出现次数最多的数)、中位数(按大小顺序排列的数据中处于中间的数)五种。使用平均数时要与变异指标结合使用,有时需要用组平均数补充总体平均数。

标志变异指标:说明总体各单位某一标志数值差异程度,通过变异指标可以揭示被平均指标掩盖了的差异情况,也可作为衡量平均指标代表性的尺度。可分为:全距、平均差、标准差、标志变异系数。全距是标志值最大值与最小值之差,如2006年某产品在全国各省中最高销量与最低销量之差;平均差是各个标志值与总体算术平均数的离差的绝对值。标准差为各个标志值与总体算术平均数的离差的平方和的正平方根,其值越大表明差异越大,平均值不能很好代表一般水平;标准差与算术平均数的比值称为标志变异系数,用以两个平均数指标不相等时的对比。

描述性统计工具在当前BI的行业应用中非常普遍。值得关注的是,当前一般BI的报表查询应用涉及更多是描述性统计的总量指标、平均指标和比较指标,而对于描述离中趋势的标志变异指标运用得相当不够。事实上,标志变异指标可以解决B I的应用主体很多实质性问题,比如在众多品牌中找到销量不稳定的品牌,在众多客户中找到交易额波动大的客户,这些信息为BI的应用有关主体在研发、生产、采购、销售、库存方面起到较为关键的作用。

(二)报表与展示工具

以报表应用类别区分,BI系统能利用报表与展示工具来生成统计报表和查询报表。查询报表较为简单,根据用户的需求可以较容易地定制。由于中国式统计报表众多的表头项以及表头中首格的一重甚至多种斜线的特征,甚至在表头项中又切分子表头的复杂情况,致使生成统计报表较为困难。国外的BI产品在生成统计报表方面和国内的某些产品相比,如水晶报表,操作过程较繁锁。对于报表的展示,一是产生表格,二是产生与表格对应的图形,如曲线图、柱形图、三维图等。一般来说,要求报表与图形连动。即当报表数据发生变动时,图形跟着变动。或者相反,图形的变动要带来报表数据的变动。这是在钻取时较容易产生的情况。如SAS的Business Intelligence和BO的图形互动功能都能实现此种需求。

报表与展示工具注重实现报表的灵活性,更强调图形展示的美观、图形色彩的模板化定,强调图形种类的多样。这是BI工具的基本功能。前两年大家谈到BI时,更容易评判到某个厂家的BI的界面制作的是否美观等等,这是当时人们对BI应用认识不够造成的。现在厂家在宣传BI时,不仅注重更深层次的综合分析功能和预测、决策功能,更扩大到数据集成与整合,数据存储和元数据管理等全套BI平台上。

(三)经济预测方法与模型 经济预测方法与模型是统计学中统计推断部分的运用,复杂且灵活。它是BI在综合分析层次上的应用。该方法满足业务类用户展望未来的需求。统计推断一般包括参数估计、假设检验以及分类与选择。经济预测方法是参数估计的应用推广,包含了点估计和参数估计,如某上时间段销量的预测值,或者预测值所处的区间。经济预测模型是在预测方法的指导下,根据行业的实际经过修正后建立的预测模型。

定量的预测方法实战中可以建立很多模式,此处以时间序列预测为主简要介绍经济预测方法与模型的运用。

时间序列预测法是动态分析法的一种运用。动态分析法是在统计研究中,把经济现象在不同时间上的数量进行对比,以了解现象变动的方向、速度、趋势和规律,并据此预测未来的方法。动态趋势分析与预测是动态分析法的重要用途。时间序列是动态分析研究的一个主要方面,其前提是编制时间序列,并形成时间序列预测法。当前时间序列有100种左右的预测方法,但其基本方法一般包括简单平均、移动平均、指数平滑、最小二乘等,可以运用到直线趋势预测和曲线趋势预测方面。时间序列影响时间序列的值变化的四种因素:趋势变动、季节变动、循环变动、不规则变动,循环变动在短期预测中通常不考虑。将这四个因素从时间序列值中分解出来的方法称为分解分析法。如2月份在某地的某品牌白酒销量为60箱,通过分解技术,可获知趋势变动(平均水平与增长势头)的影响值为40,中秋的季节变动影响值为15,但不规则变动影响值是5,所以即销量为60。时间序列预测的基本方法结合上述四种因素并运用到直线预测和曲线预测中,就形成了近100种的具体预测方法,如加权平均,加权移动平均、温特斯法等。温特斯法是以指数平滑法为基本模型,结合季节因素并运用到直线趋势中而形成的季节直线趋势和季节变动指数平滑模型。下图分别是直线趋势和曲线趋势预测的结果。

1.2.4数据仓库架构的建立

每一个数据仓库有一个架构。这架构要么是即时的或计划过的;或隐式的或形成文件的。不幸的是,许多数据仓库开发时并没有一个明确的架构,这极大的限制了它的灵活性。在没有架构的情况下,主题区域就无法契合在一起,它们之间的连接变得无目的,并且使整个数据仓库的管理和变更都难于进行。此外,虽然它可能看起来不重要,数据仓库的架构已成为选择工具时的框架。

让我们把开发一个数据仓库与建造一个真正的房屋进行比较。你如何建造一幢300万美元的大厦呢?更不用说建造一间10万美元的房子了。你要有蓝图、图纸、技术规范、和在多个层次细节上显示这个房子将如何进行建造的标准。当然,针对房子的各种子系统要有不同版本的蓝图,如管道工程、电气、暖通空调系统(HVAC)、通信、和空间。针对所有的家用的设备也有相应的标准,包括插头、灯具、卫生洁具、门的尺寸等。

对于数据仓库,架构是对数据仓库的元素和服务的一种描述,用具体细节说明各种组件如何组合在一起,和随着时间的推移系统将如何地发展。就像这房子的比喻,数据仓库架构是一套文件、计划、模型、图纸和规范,针对每个关键的组件区域有独立的分区,并且足够详细到让专业技术人员可以实施它们。

这并是一个需求文件。需求文件说明架构需要做些什么。数据仓库架构也不是一个项目计划或任务清单;它说明数据仓库是什么,而不是怎么去做或为什么去做。

一个数据仓库的开发也并不容易,因为相对于房屋的5000年建筑史,我们发展数据仓库系统只有20年的时间。因此,我们的标准还不多,工具和技术正在快速发展,关于我们已经拥有数据仓库系统的档案还很少,而且数据仓库的术语还有很大的出入。

所以,虽然开发一个架构是困难的,但它也是可能的,并且又是至关重要的。首先,最主要的是,架构应该受业务的驱动。如果你的要求是每夜进行更新,这一要求就该包含在架构内,而你必须弄清实现你目标的技术需求。下面是一些业务需求的例子,和针对每种需求的综合技术考量:

●每夜更新――充足的数据准备能力

●全球可用性—平行或分布式服务器

●顾客层次分析――大型服务器

●新数据源――带有支持元数据的灵活工具

●可靠性――工作的控制功能

关键组件区域

一个完整的数据仓库架构包括数据和技术因素。架构可以被分为三个主要区域。首先,是基于业务流程的数据架构。其次是基础设施,包括硬件、网络、操作系统和电脑。最后,是技术区域,包含用户所需的决策制定的技术以及它们的支持结构。对这些区域将在下文分小节进行详述。

●数据架构

如上所述,在整体数据仓库架构中的数据架构部分是受业务流程所驱动的。例如,在一个制造环境里,数据模型可能包括订单、装运和帐单。每一个区域都依据一套不同的维度。但是在数据模型中对相交维度的定义必须相同。所以相同数据项应该有同样的结构和内容,并有一个创建和维护的单一流程。

当你完成一个数据仓库架构并呈现数据给你的用户,就要做出对工具的选择,但随着需求的设定,选择就会变窄。例如,产品的功能开始融合,就像多维联机分析处理(M OLAP)和关系型联机分析处理(ROLAP)。如果停留在你建造的立方体,多维联机分析处理(MOLAP)便可以了。它速度快又允许灵活的查询――在立方体的范围内。它的缺点是规模(整体上和一个维度内)、设计的局限性(受立方体结构所限)、需要一个专有的数据库。关系型联机分析处理(ROLAP)是多维联机分析处理(MOLAP)的一种替代方案,它克服了多维联机分析处理(MOLAP)的这些缺点。通常,混合联机处理(HOLAP)更受欢迎,它允许一部分数据存储在维联机分析处理(MOLAP)中,另一部分数据存储在关系型联机分析处理(ROLAP)中,折衷了各自的长处。

●基础设施架构

对硬件及数据库选择的问题在于其大小、扩展性和灵活性。在大约80%的数据仓库项目中,这并不困难,大多数企业有足够的力量来应对他们的需要。

在网络、检查数据来源、数据仓库准备区、以及它们之间的任何设施方面,要确保有足够的带宽用于数据的移动。●技术架构

技术架构被元数据目录所驱动。一切都应该受元数据所驱动。服务应该依从表格所需的参数,而不是它们的硬编码。技术架构的一个重要组件是 ETL(提取、转换和加载)流程,它涵盖了五个主要区域:

●提取-数据来自多种数据源并且种类繁多。在这个区域如果有数据的应用时必须考虑对它的压缩和加密处理。

●转换-数据转换包括代理主键的管理、整合、去标准化、清洗、转换、合并和审计。

●加载-加载通常是利用加载最优化和对整个加载周期的支持对多种目标进行加载。

●安全-管理员访问和数据加密的策略。

●元件控制--它包括元件的定义、元件安排(时间和事件)、监控、登录、异常处理、错误处理和通知。

数据准备区需要能够从多种数据源提取数据,如MVS、ORACLE、VM和其它,所以当你选择产品时要具体。它必须将数据进行压缩和加密、转化、加载(可能对多个目标)和安全处理。此外,数据准备区的活动要能够自动化进行。不同的供应商的产品做不同的事情,所以大多数企业将需要使用多种产品。

一个监控数据仓库使用的系统对查询的采集、使用的跟踪是有价值的,而且也有助于性能的调整。性能优化包括通过“管理者”工具进行的成本估算,而且应包括即时查询的时间表。有工具能够提供查询管理服务。可使用工具来针对这些和其它相关任务,如对前台的基于服务器的查询管理和来自于多种数据源的数据。也有工具可用于报表、连通性和基础设施管理。最后,数据访问块应包括报表的服务(如发布和订阅),还应包括报表库,调度程序和分布管理员。

关于元数据

在数据仓库流程中数据的创建和管理要遵循以下的“步骤”:

●数据仓库模型

●数据源的定义

●表的定义

●数据源到目标的映射

●映射和转换信息

●物理信息(表格空间,等)

●提取数据

●转移数据

●加载统计

●业务描述

●查询请求

●数据本身

●查询统计

为显示元数据的重要性,上述的步骤列表中只有三步包括了“真正”的数据-

7、8和12。其他的一切都是元数据,而且整个数据仓库流程都依赖于它。元数据目录的专业技术要素包括: ●业务规则--包括定义、推导、相关项目、验证、和层次结构信息(版本、日期等。)

●转移/转换信息--源/目的地的信息,以及DDL(数据类型、名称等等。)

●操作信息--数据加载的工作时间表、依存性、通知和信息的可靠性(比如主机的重定向和加载平衡)。

●特定工具的信息--图形显示信息和特殊功能的支持。

●安全规则--认证和授权。

建立架构

在开发技术架构模型前,要先起草一份架构需求的文件。然后将每一项业务需求计划包含到它的架构中。根据架构的区域对这些内容进行分组(远程访问、数据准备、数据访问工具等)。了解它如何于其它区域相适应。采集区域的定义及其内容。最后提炼和形成模型的文件。

我们认识到开发一个数据仓库架构是困难的,因此要有一个周密细致的规划。但ZACHMAN框架又超出了大多数企业对数据仓库的需要,所以建议使用一个合理的折衷方案,它由四层流程所组成:业务需求、技术架构、标准和工具。

业务需求本质上驱动着架构,所以要对业务经理、分析师、高级用户进行访谈。从你的访谈中寻找主要的业务问题,以及企业战略、发展方向、挫折、业务流程、时间、可用性、业绩预期的指标。将它们一一妥善归档。

从IT的角度来看,跟现有的数据仓库/决策支持系统(DSS)的支持人员、联机分析处理(OLTP)应用组成员、数据库管理员们(DBA);以及网络、操作系统和桌面支持人员进行讨论。也要与架构师和专业规划人员进行探讨。你应该从这些讨论中得知他们从IT的观点考虑数据仓库的意见。从中了解是否有现存的构架文件、IT原则、标准文件、企业数据中心等。

关于数据仓库并没有太多现存的标准,但对于许多组件来说是有标准的。下面是一些需要牢记的标准:

●中间设备--开放数据库连接(ODBC)、对象链接与嵌入(OLE)、对象链接与嵌入数据库(OLE DB)、数据通信设备(DCE)、对象请求代理(ORB)和数据库编程(JDBC)

●数据库连接--ODBC, JDBC, OLE DB, 和其它。

●数据管理--ANSI SQL 和文件传输协议(FTP)

●网络访问--数据通信设备(DCE)、域名服务器(DNS)、和 轻量目标访问协议(LDAP)

无论它们支持的是哪种标准,主流的数据仓库工具都受元数据所驱动。然而,它们通常并不互相共享元数据而且在开放性上也所有不同。所以,要仔细研究和购买工具。架构师是你选择适当工具的向导。

一个数据仓库架构需要具体到怎样的程度呢?这个问题要问的是:它有足够的信息可以让一个有能力的团队来建立一个满足业务需求的数据仓库吗?至于它要花多长时间,随着更多的人加入到它的开发中来(即:它变成了“复杂的技术策略”)和生成的系统需要变得更复杂(即“复杂的功能”),架构的完成会呈指数倍的发展。

像数据仓库中几乎所有的事情一样,一个迭代进程是最好的。你不能一次做完所有的事情因为它太大了,而且业务不能等。同时,数据仓库的市场还没有完备。所以从流程中影响大、高价值部分开始,然后,利用你的成功去带动另外的阶段。

总结:

综上所述,建立一个数据仓库架构的好处如下:

●提供了一个组织结构的框架--架构对什么是单独的组件、如何将它们组装在一起、谁拥有什么部分以及优先次序的问题划出了界线。

●提高了灵活性和维护性--让你能快速加入新的数据来源,接口标准允许即插即用,模型和元数据允许影响分析和单点的变化。

●更快的开发和再利用--数据仓库开发者更能够快速了解数据仓库流程、数据库内容和业务规则。

●管理和通信的工具--定义未来方向和项目范围,确定职务和职责、对供应商传达需求。

●协调多项任务同时进行——多种、相对独立的工作有机会成功地集合。

我们建议公司对准业务需求而又要务实一些。时刻跟上数据仓库产业的进步是很重要的。最后,请记住架构总是存在的:或隐性或具体的,或无计划或计划内的。经验证明,有一个计划内和具体的架构会使数据仓库与 商业智能项目有更多的成功机会。

1.2.5如何规划数据仓库中的数据清洗

可以将数据仓库的数据清洗比做政客们募集资金的过程。几乎不存在任何一方独立存在的可能性。数据清洗往往是数据仓库项目中时间最密集的,最有争议的进程。

什么是数据清洗?

“数据清洗确保无法辨认的数据不会进入数据仓库。无法辨认的数据将影响到数据仓库中通过联机分析处理(OLAP)、数据挖掘和关键绩效指标(KPI)所产生的报表。”

在哪里会用到数据清洗的一个简单例子是,数据是如何储存在不同的应用系统中的。例如:2007年3月11号可以储存为“03/11/07”或“11/03/07”及其他格式。一个数据仓库项目将数据输入数据仓库之前需要将不同格式的日期转变成一个统一的格式标准。

为什么要进行提取,转换和加载(ETL)?

提取、转换和加载(ETL)指的是一种可以帮助确保数据在进入数据仓库之前被清洗过(即符合标准)的工具。供应商提供的提取、转换和加载(ETL)工具更加容易被用来管理持续进行的数据清洗。供应商提供的提取、转换和加载(ETL)工具坐镇在数据仓库之前,监测输入的数据。如果它遇到了程序指定转换的数据,它就会在数据载入数据仓库之前对其进行转换。

提取、转换和加载(ETL)工具也可以用来从远程数据库或者通过自动设定的事件或通过人工干预提取数据。有替代工具可以替换ETL工具,这要取决于你项目的复杂性和预算。数据库管理员们(DBA)可以编写脚本来完成提取、转换和加载(ETL)的功能,通常能满足较小的项目需要。微软的SQL服务器都有一个免费的被称为数据转换服务(DTS)的提取、转换和加载(ETL)工具。数据转换服务(DTS)是一款不错的免费工具,但它确实有其局限性,尤其是在数据清洗的持续管理上。

提取、转换和加载(ETL)的供应商有Informatica、IBM(Cognos)及Pentaho等。在对所有产品进行选择时,在接触供应商之前列出你认为对一个提取、转换和加载(ETL)供应商的需求。从咨询顾问那里获得服务还是值得的,它能在产品的选择上帮助你进行需求分析。

数据清洗和提取、转换和加载(ETL)对一个数据仓库项目的成功有多重要?

在数据仓库产生的结果符合利益相关者的期望值时,提取、转换和加载(ETL)通常被忽视和置于脑后的。结果是,提取、转换和加载(ETL)冠以数据仓库项目的“沉默的杀手”的称号。大多数数据仓库项目由于数据清洗方面的意外情况而体验到延迟和预算超支的情况。

如何规划数据清洗?

及早开始对将要进入数据仓库的数据进行筹划是很重要的,这一筹划可能会随着项目的成熟发展而改变,但当你需要获得数据拥有者在没有事先通知的情况下不会改动数据的格式的承诺时,这些文件的踪迹就变得极为有价值。

数据信息处理 篇6

关键词:地理信息公共平台;平台数据处理;方法研究

中图分类号: P208 文献标识码: A 文章编号: 1673-1069(2016)35-165-2

1 概述

信息化科技的发展促使地理信息公共平台的建设工作不断地加快。地理信息公共平台的构建是地理空间框架建设的重要体现,与现代的网络化技术相结合能够更加方便人们的出行。地理信息公共平台的建设能够使得巨大的地理信息变得可视化。但是地理信息平台的构建不论是流程还是技术都需要一定的方法。通过实践和研究,找到合适地理信息公共平台数据处理的方法,加快地理信息公共平台的建设。

2 地理信息公共平台数据处理方法的研究背景分析

2.1 定义分析

如今社会的发展,影响经济和社会进步和发展的重要因素是信息化,地理信息是人们认知世界的重要途径和手段,是社会经济发展的重要基础。如今传播的百分之八十以上的信息是和地理位置紧密相连的,通过信息的发布,成功的揭露了事物发展的规律,帮助指导了战略决策的制定。

目前我国信息化发展不断地深入化,地理信息资源的基础地位逐渐显现,给人们的生产生活带来了极大的影响。党和政府也认识到地理信息资源的重要意义,加大了对其相关建设和应用开发。地理信息资源的利用对于城市的发展有着极为重要的意义,尤其在数字城市的构建上其具有极为重要的意义,相关部门必须加强对其的重视。

2.2 研究的价值

根据相关的技术要求,我们可以看到,地理信息数据库是基础,地理信息公共平台直接面对的对象是客户,所以作为数字城市建设核心的地理信息公共平台,逐渐以数字城市的主体体现,它所包含的内容是除了详细的数据建库之外的其他所有的内容。

地理信息公共平台建设的核心内容是平台的数据库,它给大众展现出来的信息更利于进行传播,而且充分的体现;集成、可扩充和可视性。

目前我国在数字城市的建设已经取得了一定的成就,但是在数据采集和处理没有一个统一的标准,尤其是针对一些大比例尺的数据的生产处理,笔者希望通过研究之后,针对数据信息的制作方法和流程能够正确地梳理出来,这样可以给更多地方的数据平台构建工作提供指导和帮助。

2.3 数据处理

平台数据集是地理信息公共平台建设的核心内容,它所提供的信息内容更适宜网络化分布式应用,体现集成性、可视化、可扩充性的特征。包括在基础地理信息数据上通过数据提取、扩充和重组等加工过程形成的地理实体数据、影像数据、地图数据、地名地址数据和三维景观数据等面向服务的产品数据。

3 地理信息公共平台数据处理的实施

3.1 建立地理实体数据库

3.1.1 数据的处理

地理信息公共平台建设需要有个存放所有信息的数据库,这些信息都混淆在其中,需要对这些信息进行数据处理,就如同分门别类一样,将有共性的数据都提取出来,作为最核心的要素数据,将所有的数据都按照这样的分类继续分下去。

3.1.2 水系数据处理

地理信息中不免会遇到江河湖海等水系数据,面对这些数据,要将湖泊、池塘,以及水库的线和面作为提取的要素数据。当遇见完整的河流时,就直接提取河流的边和面,当河流中间被桥梁所中断时,对于数据的提取应该是边线、面以及桥梁。遇到拦水坝的粉笔水库,提取的数据信息除了提取水库的边缘线之外还需要提取堤坝等信息,这样才能保证提取信息的完整性。

3.1.3 交通数据处理

地理信息除了有水之外还会遇见铁路和公路以及城市道路等数据信息,对这些道路的要素数据提取,主要是面、边线以及中心线等。同时还需要按照一定的比例将这些信息规划好,与实际的数据信息相对应。

3.1.4 数据脱密处理

在对数据解密处理的过程中,操作人员需要依照《中华人民共和国测绘成果管理条例》的要求,绘制开发出的生产产品涉及利用国家秘密,没有经过高无缘绘制行政管理部门或者省、直辖市、自治区的人民政府绘制行政管理部门的保密技术进行处理的,那么绘制出来产品秘密等级要等于甚至高于所使用的秘密等级。所以,必须对平台数据进行解密处理,高精度进行位置定位,确保在不影响国家安全的情况,满足用户的精度要求。在解密处理数据过程中,还需要注意以下8个方面。①地图位置的公开精度不可超过50米。等高距大于50米,数字高程模型网需要大于100米。②大众使用的遥感影像空间位置颈部要控制在50米以上,影像地面分辨率要高于0.5米,对于涉密的信息、建筑物以及构筑物等固定设施不可进行标注。③只有满足《基础地理信息公开表示内容的规定(试行)》、《公开地图内容表示若干规定》、《公开地图内容表示补充规定(试行)》三项标注要求,才可在大众使用的遥感影像中注明地名、地质以及其他相关信息。④在编制公开地图时,涉及使用到秘密地理信息,需要按照国家绘制地理信息局规定的统一方法进行加密,并依法送到测绘行政管理部门进行审核。⑤如果公众使用的遥感影像需要使用到国家秘密,那么在公开致歉需要移交省级以上的测绘地理信心行政管理部门进行审核并进行加密保护处理。对于分辨率在0.5米以下的遥感影像,也需要经过国家测绘地理信息局进行审核后才能够公开使用。⑥需要得到省级以上测绘地理信息管理部门审核后,并获取地图审核号,才能够公开出版、传递、刊登遥感影像内容。⑦不论是标注的兴趣点还是新增的兴趣的都需要经过审查,满足国家审核之后,才能够进行公开展示。⑧使用到专业内容地图时,需要获取该专业保密部门的核查的证明文件。

3.2 降低空间精度

地理信息公共平台建设之后,人们就可以通过网络进行查看,对于有些需要隐蔽的信息则需要降低空间的精度来实行保密。中国测绘科学研究院开发了专业的软件,可以对数据信息进行变形处理,使得地理信息的空间坐标无规律地发生偏移。这样,将有利于达到保密的效果。

3.3 过滤敏感信息

地理信息公共平台的建设主要目的是能够给人们的生活带来方便,一些人们日常出行会运用到的地理信息出现在地理信息公共平台上就可以了,对于一些敏感的地理信息应该删除掉。例如部队、监狱和劳改所等就不应该标识出来了。同时对于一些专用公路和专用铁路的信息也应该不予以标识。

3.4 晕渲地图制作

地理信息平台建设呈现出来的地理信息需要一定的视觉效果,给人直观的道路感受。对地理信息中的地势进行晕渲地图的分级切片。在全市范围内,数据采用一比一的方式进行,而其他范围则采用一比五的数据来代替。通过叠加的方式使得数据呈现出直观感受的地势晕渲图。

3.5 三维数据制作

为了使得地理信息平台的建设的地理信息更加逼真,人们在使用的过程中能够更快速地理解,三维数据制作也是一种手段。首先需要建立三维模型数据,再根据这个模型,将地理信息有效的定位在其中,最后通过三维模型渲染的方法使得地图更加满足视觉的效果。渲染之后的模型在经过专业的软件到处成平台所接受的文件格式。

4 结束语

通过上述的研究分析我们了解到,地理信息公共平台的建设工作需要一定的数据处理方法的支持,这样才能够给大家提供一个科学、准确并且及时的地理信息服务共享平台,才能实现给人们生活出行带来便捷的想法。地理信息公共平台数据处理包括的内容很多,需要逐个去研究透彻。地理信息公共平台数据处理方法经过一定的研究之后在更大范围内推广使用,使得更多的地区能够建设地理信息公共平台,真正迎接信息化的时代。

参 考 文 献

[1] 国家测绘局.国家地理信息公共服务平台专项规划(2009-2915)[S].2012.

[2] 国家测绘局.国家地理信息公共服务平台技术指南[S].2012.

地理信息系统数据可视化处理 篇7

关键词:MapInfo,空间数据,系统,VC++

0 引言

随着社会经济的不断进步,城市建设飞速发展。与日俱增的公路交通系统的复杂性和拥挤程度,使得路径规划系统和地理信息系统显得格外的重要。目前的智能交通是以道路和车辆作为主要的研究对象,以提高道路的通行能力、利用效率与安全行为主要研究目标的新一代交通运输系统,重点是公路交通问题。

智能交通系统基本由四部分组成:管理和控制中心模块、车辆模块、道路和通信模块。车辆模块作为智能交通系统的重要组成部分,其导航技术一直是许多国家研究的重点。车辆定位导航系统的功能模块根据传感器的输出,结合GIS信息,自动地确定车辆的具体位置。本文重点介绍通过VC++6.0对利用工具软件MapInfo Professional制作的电子地图进行操作设计,实现对GIS数据可视化处理,达到人机界面友好。

1 GIS数据处理

1.1 环境配置

VC++嵌入MapX进行二次开发可分为以下几个步骤来实现:

(1)对应用工程的预设置在创建MapX控件之前,必须将MapX.h和MapX.cpp文件加入到工程中。

对于Visual C++6.0编译工具从Project菜单中选择Add To Project->Files命令,打开InsertFiles into Project对话框,选择MapX.cpp和MapX.h文件加入到工程中[1]。

(2)对MapX属性的操作对于C++程序来说,每个MapX对象(Objects)都在MapX.h和MapX.cpp中用一个类来实现,类的名字和MapX对象的名字相同,且已经在CmapX中定义了。

1.2 加载电子地图数据

1.2.1 人机界面上加载电子地图

电子地图数据加载形式[2]:

(1)GST文件由GeosetManager40.exe程序生成。在程序使用gsT文件:Map1.Geoset=Filepath+FileName。

GST文件加载后,只是默认将地图数据加载,属性数据另外需要使用单独的命令进行加载,否则对属性数据的操作全部非法。

(2)使用LayerInfo对象,这种方式下加载地图数据源的地图集和属性集均可直接使用。

(3)GST文件+LayerInfo方式。

人机界面显示加载的电子地图信息,说明VC++6.0可以驱动工具软件MapInfo Professional制作的电子地图数据。

1.2.2 漫游电子地图

人机界面上可以通过平移控件拖动地图,达到类似Google地图拖动的功能。实现过程中可以通过使用MapX对象对应的类CMapX中的成员函数SetCurrentTool(miPanTool).[3]例如:

this->m_ctrlMapX.SetCurrentTool(miPanTool);

1.2.3 放大或缩小电子地图

GIS-Driver软件中放大功能的主要用途:用户点击电子地图的某点,MapX则自动以该点为中心并以缺省的放大比例来显示电子地图。而缩小工具功能刚好与之相反,用户点击电子地图的某点,MapX则自动以该点为中心,以缺省的缩小比例来显示电子地图。放大和缩小在程序实现调用方法形式如下:

1.2.4 电子地图上的图元选定

单击GIS-Driver软件选定图元图标可以选择电子地图上的图元[3]。

选择工具的用途为:用户点击地图某点,则自动寻找地图最上面图层中可以选择的图元,并以加亮的形式显示。如果鼠标点击点击处,对应多个图层中的可选图元,则优先选择最上面图层的图元。

1.2.5 半径工具的选择

选取当前参数为:miRadiusSelectTool,即:

使用该选择功能时,用鼠标左键点击地图某点,然后拉动鼠标,则地图上出现以该点为圆心,半径不断改变的圆形。当调整到合适的半径后,放开鼠标左键,MapX自动选择该圆形的可选图元。功能实现标记所选择圆形区域的图元。

1.2.6 添加折线工具

添加折线工具的用法是设置参数为:

使用添加线条工具之前,需确保指的入图层,以便创建的线条能插入到该图层中,并且该插入图层是能够编辑。

1.2.7 设置居中工具:

设置居中工具设置参数为:miCenterTool,即:

1.2.8 添加标签工具:

添加标签工具使用户能够在鼠标左键点击的位置显示该图元的标签[3]。

要使得标签添加工具,设置参数为miLabelTool,即:

2 获取图元信息

在智能交通系统中车辆模块作为智能交通系统的重要组成部分[4]。车辆定位导航系统的功能模块结合GIS信息,自动地确定车辆的具体位置[5]。获取当前GIS图元信息在研究中具有重要意义。

函数OnMapToolInfotool实现了电子地图中选定的图元信息获取。

3 测试结果

测试方案:在电子地图上查找广州、增城的经度与纬度信息。

4 结束语

GIS-Driver软件平台实现了GIS的常用功能。VC++6.0对利用工具软件MapInfo Professional制作的电子地图进行操作设计,实现对GIS数据可视化处理,人机界面友好。

参考文献

[1]David J.Kruglinski,Scot Wingo,George Shepherd.Programming Visual C++6.0技术内幕[M]北京:希望电子出版社.2001.1

[2]MapInfo Professional Guide.New York.2003.

[3]尹旭日,张武军.Visual C++环境下MapX的开发技术[M].冶金工业出版社,2009,(1):45-63.

[4]陈建春.Visual C++开发GIS系统——开发实例剖析[M].北京:电子工业出版社,2000.

数据信息处理 篇8

“表格数据的处理”是教育科学出版社普通高中课程标准实验教科书《信息技术基础》必修模块第四章“文本和表格信息加工”第二节“表格信息加工”第一小节的内容。这节内容是在“文本信息加工”之后对信息应用的深化, 探讨如何在日常生活中运用表格处理软件对数据信息进行处理、分析, 是属于信息素养中信息加工范畴的重要内容。

二、教法设计

因为学生在初中阶段已经学习过表格数据处理软件Excel的基本操作技能, 所以在教学过程中采用以点带面、触类旁通 (启发式) 的教学方法。让学生探究完成任务;同时避免出现学生只重视操作而忽略了技术对于实际生活的意义。

三、学法设计

经过初中的学习, 学生已具备使用相关软件的基础知识, 但学生之间的差异比较大, 而教材是统一的, 为了在教学中兼顾到大部分学生, 我设计了:任务驱动和互助学习模式, 借助学习资源从而能够吸取他人的长处, 补己之短, 培养多元化思维。

四、教学过程设计

1. 导入新课 (5分钟)

创设情境, 展示一组超市菜价的图片, 同时提问:同学们感受近来就餐时有什么变化?

引导学生自行上网浏览相关菜价上涨的新闻。 (提示关键词:菜价上涨调控等)

通过极域电子教室软件将一张近日海门东洲市场菜价图及一个Word文档半成品发给学生, 要求学生完善表格数据后计算出所有物品的平均价格, 教师提出问题:通过字处理软件能否对数据进行方便、快速地处理?同学们通过实践, 发现Word并不是最佳的数据处理软件, 由此导入本课课题:选择合适的软件进行表格数据的处理。

小贴士:在学生得出用Excel进行表格数据处理的结论后, 对Excel做简单的回顾。 (2分钟)

请同学们思考一下单元格相对地址和单元格绝对地址有何区别?

2. 新课学习

(1) 数据的计算 (8分钟)

接上一情境:同学们发现利用Word处理表格不太方便, 那我们就尝试使用Excel来处理一下表格数据。

教师演示:对“东洲市场部分水产品价格表”进行计算, 求出每种物品的平均价格 (使用公式和函数两种方法计算) 。

任务一:

(1) 利用公式计算:在食堂菜单及价目表中挑选你晚上准备打的饭菜, 并计算出金额。

(2) 利用函数计算:计算食堂采购表采购物品所花费总金额, 并找出最高和最低金额菜。

练习素材 (略)

在此, 请同学们尝试一下在计算过程中把单元格相对地址换成单元格绝对地址, 通过尝试, 请学生说出二者的区别。

(2) 数据的排序 (5分钟)

教师演示:对“东洲市场部分肉、禽蛋类价格表”按照单价升序排序;

任务二:根据教师演示请学生完成以下任务。

(1) 对“东洲市场部分水产品价格表”数据按照平均价格由高到低进行降序排列;

(2) 自定义排序对“东洲市场部分水产品价格表”按笔画升序排序。

(3) 数据的筛选 (4分钟)

教师演示:在“东洲市场部分水产品价格表”中, 筛选出单价大于40的水产品。

任务三:请同学筛选出“食堂菜单及价目”表中菜价在2元与3元之间的菜。 (包含2元与3元)

3. 拓展练习 (8~10分钟)

创设情境:在任务一中, 大家都为自己选择了可口的饭菜。但是你的饮食能够提供足够的能量吗?请尽量准确估算你一天摄入的各种食物的量, 并通过网络查询相关食物所含的热量, 运用本节课所学的知识计算出你每天所摄入食物所含的热量, 完成拓展延伸部分的信息处理, 判断你的饮食是否合理, 从而倡导健康饮食。 (在本环节可以两人一组查阅资料)

请你估算一下你一天摄入食物的总量

数据信息处理 篇9

近年来, 随着计算机技术和网络技术的不断普及, QQ、微博、微信、电子商务、社交网络、物联网等概念的提出及实现在很大程度上改变了人们的日常生活, 同时也带来了海量数据, 人们进入了大数据的时代。在大数据时代, 每天都会产生海量的信息数据, 而这种海量数据会随着时间推移不断积累, 常规的计算机信息处理技术已经难以满足海量数据的处理需求, 这给计算机信息处理技术带来了新的巨大挑战, 人们需要用全新的视角和创新的理念去处理大数据问题。此外, 在网络技术迅速发展的今天, 海量数据也使得任何人都可以随时随地地从中获取自己想要的信息, 这也必然涉及到数据安全问题。因此, 只有根据发展需要, 对计算机信息处理技术不断进行创新和突破, 才能跟得上时代发展的脚步。本文将对计算机信息处理技术及大数据的概念进行界定, 进而分析大数据时代下计算机信息处理技术所面临的机遇与挑战, 最后对大数据时代下计算机信息处理技术的发展方向进行探讨。

1 计算机信息处理技术和大数据的概念

1.1 计算机信息处理技术的定义

计算机信息处理技术在现代办公与企业管理数据中扮演着极其重要的角色, 它是将数据传输, 信息分析、处理、使用等技术结合在一起, 从而更方便快捷的管理数据信息。计算机信息处理技术涉及领域很多, 它以计算机技术为核心, 还包括传感、微电子、通信工程、网络工程等先进的科学技术。在现今尤其是企业管理数据处理与现代化办公中得到了充分的利用, 逐渐成为人们日常办公生活的一部分, 员工在专业设备帮助下可以合理安排工作, 把人与硬件、软件三者相结合, 极大程度上提高了办公效率, 计算机信息处理技术在数据库与计算机技术的支持下, 通过数据处理系统, 根本上改变了传统的办公模式, 产生了非凡的影响。

1.2 大数据的概念

从字面意义来讲, 大数据即数据量极其庞大的数据, 这不仅仅局限于数据信息量的巨大, 还包括数据信息的复杂化、产生信息的多样化与数据信息的重复化。随着当代社会虚拟数据化快速且不断的发展, 大数据是现今社会的必然产物, 与传统计算相比, 大数据有很多优势, 例如大数据拥有低廉的成本, 高比率的资源利用率, 规模大, 速度快等特点。而大数据数据量庞大, 从而产生数据冗杂与各种数据之间复杂的关系。在生产与生活中, 大数据可以把所有的活动用数据记录存档, 这是其核心。分类分析、遗传算法、机器学习、遗传算法等都是大数据的关键技术。

大数据具有超前的决策能力与洞察能力, 相较传统数据软件有其可望不可即的数据处理能力, 符合了物联网与计算机发展的需求, 极大程度上对社会发展与人们生活习惯产生变革性的影响。《华尔街日报》认为大数据与智能化生产、无线网络革命并称为引领未来繁荣的3大技术变革。在大数据时代, 对于用户群体来讲, “云”是很多人再熟悉不过的系统, 蜂拥而至的各种IT云盘、云照片、云音乐等提供几乎无限的互联网资源, 利用虚拟数据, 便于用户在随时随地分享云资源, 从最早的电脑, 到普及的平板与手机, 只需要网络与大数据“云层”, 就可以告别之前原始的操作。

2 大数据时代计算机信息处理技术的机遇与挑战

2.1 面临的机遇

2.1.1 数据挖掘与应用创造出更多的产业价值

数据挖掘即通过分析每个数据, 从大量数据中寻找其规律的技术。数据挖掘一般由3个阶段组成:数据准备、规律寻找与规律表示。

数据的挖掘有利于提高决策。很多企业在把庞大的数据集中后, 碰到“数据海量、信息缺乏”的通病问题, 这就在数据准备阶段遇到难题, 大多数事物型数据库仅有数据录入、查询与统计这些比较简单但是低层次的功能, 无法从冗杂的数据中快速准确地提出有效的信息, 进而更无法通过数据总结出更有价值的信息, 这样就无法发现目标规律并且表示出这种规律。如果能及时准确地对庞大的数据进行到位的分析, 就可以获得一些隐藏在数据背后的信息, 比如目标群体在该领域的行为习惯、兴趣爱好, 通过专员来为该群体“私人订制”, 做出合理的决策与对应措施, 提高工作效率与企业核心竞争力。例如在用浏览器检索某词条时, 键入某些关键字后, 就会跳出该关键字前缀与后缀的词组选项, 甚至只打出关键字汉语拼音第一个字母都能够检索到该词条, 这就是浏览器通过大量网民的“行为轨迹”数据进行记录与挖掘分析的基础上, 总结出搜索者的共性习惯行为, 大大提高了检索速度, 从而让更多的网民不约而同地使用该检索网站。

2.1.2 带来了物联网与云计算的新形势

物联网是当今社会通信系统、信息传播、计算机技术等高新技术集中的精华。作为新兴产业的重要内容, 它普及应用在信息与网络成熟的系统工程中。大数据时代下, 物联网衍生出很多新型的产业, 信息化的养老系统完善, 人民群众基本IC一卡通的普及, 方便且多功能的电子钱包的应用, 过年取代传统的现金红包而火热流行的电子红包等等都是从以人为本为出发的核心, 切切实实地充分利用大数据与云服务的功能。新形势下, 云服务的浪潮是几乎不可避免的。云计算是通过把数据聚集起来, 在云平台与各种电子设备进行数据交换, 上传下载用户所需要的信息。在新的政策环境下, 云计算的服务能力得到了增强, 大力推进了云计算的发展;云计算自主创新能力包括自身的创新能力与计算机信息处理技术发展与云计算相结合能力也大大增强。

2.2 面临的挑战

2.2.1 信息安全的要求更高

大数据时代下, 网络越来越普及, 信息安全问题就日渐重要, 无论是大型企业的信息安全还是每个网民个人信息安全都格外重要。在进行网上冲浪与网购的时候, 就必须注意网络信息, 甄别信息的真假, 稍有不慎, 通过钓鱼网站, 个人隐私被入侵, 信息就会落入不法分子手中, 造成信息安全问题进而产生人员与财产的损失。毫不夸张地说, 在当前条件下, 谁要掌握信息供给网络, 谁就拥有整个世界。所以, 国家应该建立更完善的法律;相关机构可以通过应用来牵引相应的安全的技术发展, 充分发挥自身优势;个人也应该注意保护私人隐私, 避免不必要的损失。

2.2.2 需要专门的人才

大数据时代下, 既需要技术人才更需要管理人才。大数据时代是技术的时代, 技术型人才自然炙手可热。而人才的培养需要一定的周期, 对于这种新兴的产业, 人才缺口自然较多。相对于技术型人才, 管理型人才更为紧缺且重要, 政府和企业的领导者, 也要有意识地转变思维方式, 学习用数据思考、说话和管理。在飞速发展的社会中, 经验主义会成为大数据时代的束缚。比如, 很多管理者抱怨“90”后员工无法使用过往的激励方式来鼓励, 相对来讲, 下级与上级、同事与下属沟通不畅, 这都是各自成长环境所影响的。管理者们需要不断更新自己的数据库, 学会用大数据的方法, 随时去找到合适的解决方法, 这些都是需要漫长的演变过程。

2.2.3 数据价值分析更为重要

大数据的实现在于分析。拥有大数据并不是企业与政府的目的, 其目的是从这些数据中了解真实的信息, 决策者通过数据进行真正合理的管理、决策、检测、评价, 并在生活中产生价值。对海量数据分析早已成为企业、政府的迫切需求。大数据下数据冗杂、繁多, 数量十分巨大但是密度却较低, 这就容易出现很多无用的信息与挂羊头卖狗肉的虚假信息, 需要逐个筛选鉴别, 这是一个十分艰难且巨大的系统工程, 并不是一般的个体或者企业能胜任的任务。大数据的分析需要一个漫长原始数据的积累, 例如百度的词条检索, 是经过上亿网民不断检索积累才造就了如今的智能检索;同理, 亚马逊上拥有美国所有生活必需品, 因此它可充分掌握美国消费者的原始数据, 做出的判断就有权威性与预测性, 甚至可在某时期向特定商家订购特殊性商品, 并且能保证热卖, 这都是根据亚马逊有巨大的数据源, 常年累计分析推测出来的。

3 大数据时代计算机信息处理技术的发展方向

相对于传统小规模的单一数据形式, 大数据通常具有数据规模大、数据机构复杂等特点, 各种数据间形成的相互关联的结构, 增加了数据处理的难度, 而当前的计算机信息处理技术很难胜任大规模复杂结构数据的处理需求, 这就需要一种新的数据服务网络来提供更加高效、快捷的服务。此外, 大数据时代的到来, 带来了机遇, 也带来了更多的风险, 因此, 安全性也是未来计算机信息处理技术发展的方向之一。

3.1 计算机网络朝着云计算网络发展

云计算网络发展离不开已经成熟的计算机网络, 计算机网络是其必要的基础, 两者缺一不可。计算机网络发展离不开计算机硬件的不断更新换代, 然而就目前来讲在大数据时代, 常规的计算机硬件已经不能够满足如此巨大的数据处理需求, 常规计算机数据处理架构也存在诸多问题, 最突出的是新应用的数据需求已经超过目前计算机硬件所能提供的上限。在大数据时代背景下的今天, 与网络发展步伐相比, 计算机硬件的发展速度远远落后;与此同时, 当前传统的计算机网络技术是建立在硬件基础上的静态模式, 这种模式没有及时快速地响应当今瞬息万变的网络与应用发展的弊端显露出来, 由此应运而生出类似于数据中心这种将现有的网络转变成可编程的基础设施。随着云计算网络不断发展, 企业与政府对网络的需求, 不仅仅局限于简单的网络中心, 把目标转向类似于开放式传输这种快捷, 更符合大数据时代的网络方式。网络软件有着计算机软件缺少的灵活的编程性与回应性等重要的优势, 因此云计算也逐渐转变为互联模式, 即云计算网络。该技术拥有更多信息储存能力同时具备完整服务器运行计算与数据处理能力。避开了计算机处理数据信息速度慢、效率低的问题, 并能及时反馈。凭借着云计算网络完善与发展, 计算机信息处理技术将更加快捷、高效率, 应用也会越来越丰富、普及。

3.2 计算机安全信息技术进一步发展

在大数据时代, 整个数据系统是通过网络相互连接的, 个人电脑的数据存储将通过互联网共享到计算机网络平台。而网络本身是一个开放性的平台, 任何人都可以随时随地地从中获取自己想要的信息, 在大数据时代, 犯罪分子通过对海量数据进行分析, 能够较容易地获得商业机密或个人信息, 这就必然涉及到数据的安全问题, 因此, 安全性也将是大数据时代计算机处理信息技术发展最重要的方向之一。大数据时代计算机信息安全技术不再建立在某个单一形式的数据安全管理上, 而是对整个数据关联结构进行系统管理, 从整体上提高数据的安全水平。因此, 传统的计算机信息处理安全软件已经无法满足大数据时代安全管理工作的需求, 开发新的安全技术软件、构建新的计算机安全体系显得尤为重要, 这也在一定程度上促进了计算机安全信息技术的发展, 推进信息安全技术向前发展。

4 结语

大数据时代对于计算机信息处理技术来说既是机遇也是挑战, 越来越多的人会使用计算机技术来进行数据分析, 这将使得计算机信息处理技术得到更广泛的应用, 同时对计算机信息处理技术也提出了更高的要求, 需要不断完善目前仍存在不足的地方, 并根据海量数据处理需要建立真正适应大数据时代的网络系统及安全体系, 将计算机信息处理技术运用到更广泛的领域。

摘要:随着计算机技术和网络技术的不断发展, 出现了海量数据信息, 当今世界已经从数据时代向大数据时代转移。大数据时代的到来给计算机信息处理技术带来了非常大的冲击, 现有的计算机信息处理技术很难满足海量数据处理需求, 同时海量数据的容易获取, 也带来了一定的数据安全问题。文章对计算机信息处理技术及大数据的概念进行了界定, 进而分析了大数据时代下计算机信息处理技术所面临的机遇与挑战, 最后对大数据时代下计算机信息处理技术的发展方向进行了探讨。

关键词:计算机,信息处理技术,大数据

参考文献

[1]李春辉.“大数据”背景下的计算机信息处理技术分析[J].电子技术与软件工程, 2014 (9) :33-34.

[2]吕敬全.“大数据”时代背景下计算机信息处理技术分析[J].信息与电脑:理论版, 2013 (6) :19, 21.

[3]刘银龙.“大数据”背景下的计算机信息处理技术分析[J].电子技术与软件工程, 2015 (1) :208.

[4]冯潇婧.“大数据"时代背景下计算机信息处理技术的分析[J].计算机光盘软件与应用, 2014 (5) :22-23.

[5]孙海燕.“大数据”时代背景下计算机信息处理技术分析[J].电脑迷:数码生活, 2014 (3) :55-56.

[6]应桂芬.大数据时代计算机信息处理技术探讨[J].电脑编程技巧与维护, 2014 (20) :85-86.

数据信息处理 篇10

伴随着近年来经济和科技的快速发展, 我国气象预报工作也有相当程度的发展。但是, 在气象预报的过程中, 我们仍需面对很多问题, 气象预报工作亟需更进一步的完善。为了进一步促进我国地面气象测报的发展, 并逐步优化“观云测天”的传统测报模式, 进而将其转化为全新的探测机制, 即以高效探测与信息化数据处理为主要方向的新模式, 在国内开展了内容丰富的地面气象测报的各种技能竞赛, 覆盖了气象测报的诸多方面, 包括有云观测、地面气象观测、计算机数据综合处理和地面报告编制等。笔者在本文中就地面信息化处理技术进行了研究和简析。

1 A文件计算机审核疑误信息处理

1.1 台站参数疑误信息的处理

在进行格式审核过程中, A文件的台站参数疑误信息需要进行一定处理。其错误信息通常表现为文件首部参数与台站参数表不相符, 要正确处理这种信息, 首先要检查文件首部的参数标识, 其结果是全月数据缺测;而冻土观测项目的数据在台站参数当中已经设置完毕, 所以, 两者的数据之间存在矛盾。通过对其进行分析后我们发现, 其主要原因在于:次月初进行了例行的冻土观测, 最后月的B文件转为A文件, 倘若次月的冻土观测项目并未在台站参数中设置, 两者的数据就会出现矛盾。所以台站在任务变动时, 要做出相应提示, 在进行文件转化时, 尤其要重视观测任务的变化, 保证本站基本参数设置的正确性。

1.2 文件正点记录缺测处理

据规定:“若能有效获取非正点分钟数据, 则正点左右10min以内的记录为首选是作为有效替代的首选”。若所得非正点分钟数据在正点前10min以内, 并且该数据缺测, 那么, 我们选择正点之后10min以内与正点接近的数据作为替代。而在不能有效测取分钟数据要素, 或有分钟数据却出现缺测的状况下, 可以将平行观测值或者补测值作为分钟数据的有效替代。

1.3 降水量和降水现象不一致的情况处理

例如在文件当中出现了存在7~8h有降水量, 却无降水现象与其相对应的疑误信息, 这主要是因为传感器翻斗出现了滞后性。解决这个问题所采取的方法是:在有效判定了降水量滞后这个前提下, 且滞后时间<2h, 我们可以将该数值累加, 其目标为降水终止的时间段;若滞后时间>2h, 则将该降水量删除。

1.4 上跨日期与上月文件有差的处理

测报软件能够对跨月连续降水的开始日期进行挑取, 对上跨连续降水量也是如此。鉴于所选数值会出现错误, 所以, 预审人员要树立严谨的工作态度, 将文件数据进行比对核实, 保证无误。

2 J文件计算机审核疑误信息处理

2.1 对分钟数据的缺测处理

在对J文件的机审过程中, A文件所显示的正点值与系统所给出的提示信息不一致。这主要是因为采集器受到自然因素影响导致工作状态失常、对传感器进行标校和更换导致缺测等。此时在单位时间 (h) 内, 其正点数据和正点分钟数据有差, 且正点分钟数据被确认有误, 则可取正点值以替代。

2.2 对分钟数据异常跳动变化数值的处理

在对J文件进行机审时显示, 分钟之间的数据出现异常, 通常表现为20.52时的气压值和其前后1min都存在误差, 这个数值达到了20h Pa, 这个记录值是异常的。据规定, 通过其前后分钟数据内差可得, 这一分钟值为840.3h Pa。

3 文件人工审核疑误信息处理

3.1 对云、能见度和天气现象记录进行审核时的要点

3.1.1 在对云观测的记录里, 首先要充分了解云的定义、成因

和特征以及常伴随出现的天气现象, 以此为基础, 对云状记录的排序和云状衍变予以充分关注。

3.1.2 能见度的记录应与天气现象相结合。

当能见度小于10km时, 也要对轻雾、霾等天气现象进行记录。在能见度小于1km的状况下, 则要有相应的雾、雪暴和沙尘暴等天气现象的记录内容。

3.1.3 天气现象的记录要与其定义特征的规范保持大体一致。

若存在降水记录, 则尤其要重视降水的时间起止。另外, 进行霾、浮尘、轻雾等视野障碍现象的记录时, 要充分考虑风、降水、相对湿度等现象。

3.2 人工审核的其他要点

目前, 自动气象观测系统尚不完善, 还有某方面的功能缺陷, 它能对数据文件的合法性进行有效检测, 对于不定量的信息化资料却力不从心。因而, 人工审核是不可缺少的。

3.3 对质量控制码疑误信息的处理

我国气象文件中有非常明确的规定:在控制段中, 质量控制码是使用三位整数来表示的, 从个位、十位到百位分别对应了国家级、省级以及台站级。在日常的工作中, 记录错误会严重影响数据格式的秩序。所以, 在出现台站观测数据有修改或缺测的情况时, 要对质量控制码和更正数据段的格式予以检查, 以确定其正确性。

4 对信息化文件作出正确的备注

要想正确地对信息化文件做出备注, 首先要注意备注信息的内容, 即对测报工作中的重要事由或对有影响情况的记录的阐明。它通常包括了站址的迁移、站名变更、业务升级和设备的变动等。其次要有条理地进行记录, 并作精炼简要的描述, 要注意对同类型的备注进行归并, 且按照相关规定执行。

5 结语

以上是笔者对气象预报地面信息化处理技术的研究和浅析。在实际的信息化资料的审核处理过程中, 发现并处理疑误信息的情况更为复杂, 工作人员要对A、J文件的数据格式有清晰认识, 严格操作流程, 对疑误信息展开综合的分析和判断, 确保信息化资料处理的准确和完整性。

摘要:笔者主要对气象预报地面信息化处理技术展开了研究与分析, 就地面测报业务软件相关技术作了简述, 充分考虑了人工审核的经验, 并对云、能见度和天气现象等人工观测项目之间的配合进行了重点分析, 着重指出了地面信息化数据文件中的错误。

关键词:地面气象预报,信息化,数据处理

参考文献

人事统计中的数据处理及信息挖掘 篇11

关键词:数据处理 人事统计 信息挖掘

中图分类号: F272 文献标识码:A 文章编号1672-3791(2015)07(c)-0000-00

各个企业单位的人力资源管理是重要的管理内容,它能够从侧面对企业的软硬实力得以反映,而人事统计工作作为是人力资源管理过程中的关键构成,对其展开实质性的作业,能够将人力资源的整体管理效率和质量得到保障,并促进人事统计的健康发展。

1人事统计中数据处理挖掘功能及技术方法分析

1.1人事统计中数据处理挖掘功能分析

从实际的人事统计数据处理机信息挖掘的主要功能来看,其体现在多个层面,首先能够自动预测趋势及行为。在这一功能当中,数据的挖掘能够自动在大型数据库当中寻找预测性的信息,并能够迅速直接的通过数据本身得到结论。另外就是聚类功能以及关联分析功能的体现,前者主要是能够增强人们对客观现实的认识,在这一功能中的相关技术主要有数学分类学以及模式识别方法,这一功能能够避免传统技术的片面性;而后者主要就是来找出数据库当中所隐藏的关联网,在关联分析作用下所生成的规则带有着较强的可信度[1]。

再者就是偏差检测以及概念描述的功能,前者的功能主要是寻找观测的结果和参照值间有意义的差别;而概念描述功能则主要是对象的内涵进行的描述,同时对象的有关特征进行概括,在生成区的描述方法较多,遗传算法和决策树方法是比较常用的。

1.2人事统计中数据处理挖掘技术方法分析

以上是对人事统计中的数据挖掘的相關功能进行的分析,在其技术方法上也比较重要,同时有着多样化的方法,最为主要的就是神经网络方法和决策树方法以及粗集方法等。其中的神经网络方法主要就是对人脑神经元结构的模拟,通过MP模型以及Hebb学习规则作为基础,然后再通过神经网络连接权值表示知识,在学习的体现上主要突出的就是神经网络权值的逐步计算,当前主要的模式类型就是前馈式网络和反馈式网络、自组织网络这几种类型。

另外就是决策树技术方法,这主要是通过对信息论当中的互信息来寻找数据库当中的最大信息量字段,进而来建立决策树的结点,然后根据字段不同取值构建树的分支,在这一环节的数据库愈大就会在效果上愈好。而粗集技术方法则主要是把元素作为对象,而列元素看成是属性,对上近似建立不确定性规则,对下则近似建立确定性规则,而对无关情况不存在规则[2]。

2人事统计中的信息数据特征及功能应用分析

2.1人事统计中的信息数据特征分析

人事统计中的信息数据自身有着鲜明的特征,主要体现在连贯性以及准确性,系统性和及时性特征方面。人事统计主要是在日常中的积累,所以在连贯性及系统性的特征上有着充分体现。它不仅能够对一般的数据得以提供,也能对员工的岗位表现及工作时间等得到详细的反映,这些都为员工岗位的调动提供了重要依据,使得工作的效率大幅度提升。另外由于人事统计的结果要求,所以在准确性以及及时性方面也有着充分的体现,这对比较结果在效率上有了提升,对人事管理工作的顺利开展提供了便利条件,所以及时性和准确性在信息数据上就显得比较重要。

2.2人事统计中数据处理挖掘功能应用探究

人事统计中数据处理挖掘的功能应用在实际中有着重要的作用发挥,在统计指标分析中的应用上,通过对统计数据的纵向联系以及比较,进而来分析和判断事物的发展规律和对发展方向进行预测。还要能对各类的人员在实际的资源配置过程中的合理程度以及流动等进行分析,进而为接下来的人事政策调整做好准备[3]。在对统计数据的使用扩大化方面,人事统计当前还是采取搜集整理内部的数据为主,这对实际的统计工作发展就有着阻碍,所以要进行创新改革。在实际的管理过程中,将人事统计管理和方法两者得到有机结合,然后建立科学的人事评估以及评价体系,这样就能对人事制度和管理的相关工作起到有效的激励和诊断等作用,能最大化的对管理水平得以提升。

另外在数据的信息化处理方面,统计数据信息化的这一过程也就是对数据的有效处理和分析使用,要想将统计数据能够转化为有效的信息,这就要能够采取统计分析原理进行系统科学及时的加工。在具体的措施上主要就是保障原始资料的可靠性,然后再对其中的大量数据加以辨别,从而有效防止信息的虚假和重复以及漏报的现象发生。最后就是要对信息的整理汇总中加以严格审查,在指标上要重视其一致性,而后形成统计分析报告。

人事统计中的数据处理挖掘功能还能够对数据信息进行透视,这样就有着一种通过数据来讲述的感觉,所以在客观性上相对较强。进行统计分析的时候只在数据上得到保障没有深层次的挖掘就会造成掩盖一些实质问题,所以要对研究对象要能够由表面向着深层次的方向进行深化,深入的研究。对问题的产生根本原因详细的分析,在大量人事现象量的研究认识和本质发展变化内在联系上,加强经验的吸收从而对队伍结构进行合理化的调整[4]。在此需要重视的就是要能在人事统计过程中,对数据要能够进行正确性的使用,强化人事统计工作的重要以便于能更好的通过信息数据来开展决策,这样才能最大化的促进人事管理水平的提升。

3结语

总而言之,在当前的社会发展过程中,一些企事业单位的人事统计工作正逐渐的完善,改革也不断的深化,这对企事业单位的健康发展有着重要保障。由于本文的篇幅限制,不能进一步的深化研究,希望此次努力能起到抛砖引玉的作用,以待后来者居上,为我国的人事统计事业发展献出力量。

参考文献

[1]何燕敏.加强统计工作 服务企业发展[J].浙江统计,2014,(05).

[2]王欣.浅谈企业如何做好统计工作[J].环渤海经济瞭望,2013,(08).

[3]卢昕.在市场经济条件下如何发挥统计工作在企业中的作用[J].科技情报开发与经济,2014,(21).

数据信息处理 篇12

1 大数据时代简介

在信息化时代条件下, 计算机更加普及, 被广泛地应用在各个领域, 每天都有大量的计算机在工作运转, 生成数据信息, 这些信息千差万别, 但却密切相关, 内容以及来源均存在差异, 经由量化处理后的形成数据集群, 即大数据。用户在浏览网页、听歌及看视频时, 都会产生数据, 形成规模庞大的数据量。现阶段, 在大数据处理环节, 涌现出了各种各样的工具, 分析现存技术可知, 一些大型软件面对大量数据时也束手无策, 无法有效开展存储与管理工作, 也不能面向用户提供成熟的存储功能与健全的管理功能。对于网络而言, 其每日生成的数据均无法如实、安全统计。

2 大数据时代条件下的计算机信息处理技术

2.1 信息采集和加工

计算机信息处理技术在正式应用之前, 首先, 需要采集信息, 且计算机技术应用依托数据采集。通常数据采集就是面向目标信息源开展动态信息监督与管控, 将有用数据存储到计算机数据库, 促进软件运转, 顺利开展后续工作;然后, 加工处理数据信息, 依据用户需求, 围绕数据信息开展加工处理操作;最后, 对完成加工处理的数据信息实施分类处理, 并将其有效传送给用户, 完成数据信息采集、加工处理与传输目标。

2.2 信息存储

信息化条件下, 随着网络的高度普及, 涌现出了视频、图片等大量的信息。因数据种类日益丰富、数量迅速增加, 数据存储更加突显。大众化的存储需求, 常规计算机一般便可满足, 然而, 大数据的数量异常庞大, 要求计算机存储应具备更强的能力。

若将常规数据存储技术引入大数据存储, 则会产生资源耗费问题, 因此, 应参照大数据的基本特点, 应用最新手段来开展存储工作, 只有这样, 方可确保大数据信息真实、可靠与快捷。为满足这一需求, 云技术应运而生。

只改进电脑硬件设备是不够的, 软件发展还应紧追时代的脚步。工程师专家纷纷开始着手探究计算机软件, 为满足数据需求, 待硬件存储设备开发步入临界点时, 云技术应运而生。这一技术能够存储运行多种信息数据, 并借助功能齐全的服务器设备有效处理数据信息。原有的信息存储仅仅依托计算机来开展处理工作, 使得运行处理低下、速度迟缓。而云技术恰巧可解决该问题, 同时, 还可把计算获得的数据结果映射到使用者, 显著提升处理效率。云技术凭借这一优势, 赢得了使用者的高度认可。

2.3 信息安全

步入大数据时代后, 让人们体会技术先进性所带来的便捷后, 还让人们明确数据安全的现实意义。因此, 为增加数据信息的真实性与安全性, 一般可从下述层面着手:首先, 针对计算机信息构建安全体系, 促进技术人才培养, 加大资金投入, 全面保障安全体系构建;然后, 重视研究探索, 积极开发实用的安全技术产品。毋庸置疑, 原有的信息安全技术不再适用, 滞后于大数据时代提出的数据安全需求。因此, 应强化研究探索, 寻求有效的解决防范, 全面规避和消除数据信息面临的威胁;最后, 认真检测关键数据信息。

2.4 DEEP WEB数据感知与获取

对于DEEP WEB数据感知与获取技术来说, 是指网络深层空间技术, 其中信息数据量十分大, 并且信息动态变化较大, 具有较高的分布性及特殊性等特点, DEEP WEB技术能够充分运用其数据来实现高质量的数据集成, 对各项数据进行抽取以及整合。

2.5 数据高效索引

对于数据的高效索引来说, 主要是谷歌公司提出了BIGTABLE技术, 这是目前主流的索引技术。现今主要的研究热点便是聚簇索引以及互补式聚簇索引方式。其中前者是按照索引顺序来存储全部的数据结构。而后者互补式聚簇索引则是按照多副本索引列创建互为补充的索引表, 并且能够对结果进行查询及估算, 最终对数据进行优化处理。

2.6 基于信息内容的数据挖掘

对于基于信息内容的数据挖掘来说, 主要是为网络搜索技术及实体关联相互结合分析, 现今互联网信息搜索的热点就是排序学习算法。并且该算法主要是针对社会媒体信息量提出的。而社会媒体关注的数据特点就是文本短, 所以排序学习法的特征也是短, 主要是逐点、逐句以及逐列的模式。

3 未来发展方向

常规条件下, 计算机信息主要通过信息处理来获取相应的数据信息, 通常会从源头层面进行监控, 再将所需数据统一、汇集到数据库, 然后便可面向软件平台传递信息。在上述加工处理环节, 首先应将数据库内部的数据实施分类处理, 然后将其传送至特定用户手中, 进而完成数据传递。同时, 还可把数据信息借助存储技术汇集到数据库中, 待出现使用需求后, 用户可经由查询操作找到所需信息。由于大数据包含较多的数据, 外加信息变化十分迅速, 因此必须要灵活运用存储技术, 只有这样, 方可实现完整、安全保存。在未来, 计算机技术将朝着下述方向发展。其一, 开放式发展。大数据发展源自数据共享。在未来, 计算机发展若想实现数据共享, 单纯依赖计算机自身是不够的, 还应顺着开放式方向逐步发展。依托互联网有序发展, 进而全面满足急剧增长的使用需求与不断提升的处理需求。其二, 云计算发展。大数据时代下, 云技术得到了大力应用, 并在数据存储环节发挥着重要作用, 且凭借高效处理优势获得了企业的认可。云技术还应引入至计算机网络。它利用计算机网络充当物质基础, 存在较大的束缚性。为有效日益在增长的管理需求、迎合大数据发展, 计算机网络应顺着云计算方向大步前进。其三, 计算机与互联网的渗透整合。大数据发展依托网络, 只有借助网络方可完成信息处理, 迎合大数据发展提出的新需求。因此, 大数据时代下, 应大力渗透、逐步整合计算机与互联网, 将其转变成一体。网络作为广阔平台, 充满可能, 具有显著优势, 可促进大数据发展, 提升加工处理水平, 拓展应用范围, 提高利用率。

4 结语

大数据时代的逐步推进, 不仅会拓展其应用范围, 还会提升信息处理技术, 与此同时, 也将成为未来几年的主流发展产业。目前我们正处在信息化时代, 随着大数据管理水平的提升和应用范围的拓展, 信息处理技术也将创造更加丰厚的商业价值。因此, 我们应坚信并对信息处理技术秉承乐观态度, 积极探索, 深入研究, 全面提升信息处理技术水平。

参考文献

[1]赵春雷.“大数据”时代的计算机信息处理技术[J].世界科学, 2012 (2) :30-31.

[2]申鹏.“大数据”时代的计算机信息处理技术初探[J].计算机光盘软件与应用, 2014 (21) :109-110.

[3]孙乃弘.探究大数据时代的计算机信息处理技术[J].通讯世界, 2015 (10) :52.

上一篇:股票收益率分析下一篇:电力生产管理