信息数据处理论文(共12篇)
信息数据处理论文 篇1
摘要:企业信息化过程是一个新系统替代旧系统的过程,从系统应用的角度讲是离散的,从企业业务和数据的角度讲是连续的,两者之间的矛盾在于如何实现新系统与业务遗留数据的兼容。本文从企业信息化建设的实践出发,阐述了企业信息化处理遗留数据的若干问题,并提出了相应的解决方法和策略
关键词:企业信息化,遗留数据处理
一、研究背最
近些年来,我国的企业信息化发展取得了重大的成果,企业范围内信息系统的应用也达到了比较高的水平。尤其在大型的企业中,各部门针对于各自的企业应用,都提出了局部开发的业务解决方案。但是,随着信息技术的不断革新和信息系统应用的不断拓展,反映在新系统中的技术和业务操作的变更使得旧的系统越来越过时并且操作和集成变得越来越困难。因此,为了实现企业信息系统应用的一致性,必须实现新系统与旧系统的技术切换和业务融合,其关键环节就是对于旧系统遗留数据的处理。
企业遗留数据的处理一直是企业信息化过程中的重要课题,究其原因可以分为以下三个方面:
1.异构数据源,信息系统的应用分立,使遗留数据构建在不同的数据库产品和平台上,这些异构平台之间缺乏直接的数据交换工具和成熟的数据共享策略;
2.数据结构不一致,新系统与旧系统间基于不同的应用构建,新系统的数据结构与旧系统的数据结构很难保持一致;
3.企业应用逻辑冲突,交替并行是信息系统应用中一个必不可少的环节,在新旧系统交替的过程中,企业应用逻辑需要覆盖两个系统的业务功能,容易出现新旧系统应用逻辑冲突的情况。
二、遗留数据规划
企业信息化过程中对遗留数据的处理.是一个复杂的系统工程。对遗留数据的处理涉及到业务整合、主键关联以及基础数据一致等多方面的问题,因此,对遗留数据的处理应该建立一定的规划,以保证新系统与遗留系统之间的顺利交接。
从数据应用的角度可以将企业遗留数据划分为基础数据和业务数据两部分。在企业信息系统领域,基础数据可以理解为支持企业应用的底层公共数据,如:ERP系统中的物料编码、BOM数据、部门信息、人员信息等;业务数据可以理解为描述企业业务流转的数据,如:ERP系统中的订单、采购单等。
(一)基础数据规划
基础数据是新旧系统间交互和通信的重要保证,确保基础数据信息项和编码的一致性、关联性对完成遗留数据的处理十分关键。因此,对遗留基础数据的规划可以分为基础数据完善和映射逻辑两部分
1.基础数据完善
基础数据完善的主要工作是比对新旧系统间基础数据的差异,构建新旧系统间基础数据的最大集。具体包含添加、更新和删除重复三种操作。
添加:增加旧系统中存在,但新系统中不存在的数据;
更新:根据表达意义的不同,更新同步新旧系统的数据;
删除重复:将两个系统间具有相同含义的数据合并。
2.数据映射逻辑
建立基础数据的映射逻辑表,通过表1所示的映射逻辑表,将相同信息项在不同系统的表达逻辑、编码对应起来,实现计算机的自动识别和匹配,为数据转换工具的下一步开发做好基础。
(二)业务数据规划
遗留业务数据代表着企业原有业务的核心,鉴于业务承接和延续的重要性,如何将企业业务完整、准确地转移到新的系统中,是处理遗留数据的重要问题。实现企业遗留业务数据的规划需要从以下三方面入手:
1.核心数据最小集
实现企业新旧系统的并行交替,并不需要实现所有遗留数据的转换,否则成本增大,风险方面也不易控制。对于业务数据而言,数据的转换需要遵循业务数据核心最小集的原则,即导入新系统中的数据,只需要保证新系统可以正常运行,企业业务持续不间断即可。
2.编码转换规则
新旧系统采用不同的开发工具和数据库平台,鉴于流程的设计和业务的拓展要求,对于编码结构和编码设计存在较大差距,新编码在旧编码的基础上,一方面可能加深了业务含义的具体化标示;另一方面考虑到业务拓展的要求,也需要对流水号位数等进行扩充。
3.业务逻辑关联
系统中业务逻辑的串联和沟通主要是通过编码的主外键关联体现的,因此,在实现编码的转换过程中,既要考虑到新旧编码的转换问题,也要兼顾原有业务数据的关联性,使替换后的新编码依然保持业务逻辑的一致性。
三、遗留数据应用
遗留数据在完成从旧系统到新系统的转换后,从原则上己经基本满足了新系统的处理要求,可以根据新系统的业务逻辑和处理规则进行相应的操作。但是,对于大多数的系统而言,遗留数据和新系统数据之间必定存在部分信息缺失或者不匹配的情况,这种问题并不是在数据的转换过程中产生,而是由于新旧系统业务流程和设计方面的变更而产生的,这个问题的存在也将直接影响企业遗留数据的应用。遗留数据的应用可以分为两个阶段:企业业务应用阶段和综合统计应用阶段。
(一)企业业务应用
企业业务应用是企业信息化的核心。基于遗留数据的企业业务应用是否顺畅是检验遗留数据处理是否准确的重要依据。遗留数据需要能够最大程度地支持企业业务应用,应该满足以下四点:1.业务流程通畅;2.业务承接性强,容错性高;3.数据实时性:4.数据准确,逻辑关系清晰明确。
(二)综合统计应用
综合统计应用是企业数据汇总和分析的基础。新旧系统的切换,遗留系统数据的转换对综合统计,尤其是统计区间报表的影响较大。因此,在运用遗留数据进行企业综合统计应用时,应建立统计数据映像(某一期初数据的统计结果,而非统计数据源),这样虽然损失了一部分统计数据分析的灵活性,但降低了遗留数据转换的复杂性和风险性,又能够保证企业综合统计应用。
四、结论
本文从企业信息化的角度出发,分析了遗留数据在企业信息化进程中转换、迁移的难点,着重从遗留数据规划和遗留数据的层次提出了如何处理企业遗留数据的方法和原则。
企业遗留数据的处理是一个复杂的系统工程,因需要切换的新旧系统差异不同而各异,本文只是提供了解决企业遗留数据处理的一般方法和原则。在进一步的研究中,作业将考虑数据导入导出效率和数据迁移的工具选择等问题,另外,设计部分数据处理脚本的编制以及脚本编制的“重复应用”也是下阶段需要研究的重要问题。
参考文献
[1]Fred A.Cummins.企业集成.机械工业出版社,2003.
信息数据处理论文 篇2
概论
1、计算机应用领域: 数据处理(信息处理)
辅助技术,如CAD、CAM、CAI等 过程控制(或实时控制)人工智能(或智能模拟)网络应用
2、计算机在经济管理中应用属于哪一大类? D A)科学计算 B)过程控制 C)辅助设计 D)信息处理 E)人工智能 F)网络通信
3、办公室业务:办公自动化
生产制造业:计算机集成制造系统 商务管理:电子商务
金融业:电子金融(网络金融)政府管理:电子政务
医院、学校管理:医务/教务管理信息系统
4、计算机应用模式 1.利用现成软件工具 2.自行开发应用程序 3.信息系统集成
5、(简答题)下面的应用问题适用哪种应用模式?
(1)学生成绩分类统计;
(2)大中型企业会计帐务;
(3)银行储蓄柜台业务处理 ;
(4)投资项目经济评价;
(5)调查问卷统计;
(6)简单工程预算编制;
(7)超市收银处理;
(8)企业管理信息系统。
6、信息意识:包括信息文化内化的广度与深度; 信息获取能力:包括信息发现、采集、优选等;
信息分析能力:包括信息分类、信息综合、信息评价等;
信息加工能力:包括信息排序与检索、组织与表达、存储与变换、控制与传输等; 信息利用能力:指能否有效地利用信息来解决学习、工作和生活中的各种问题 7(简答题)辩析以下概念对:(1)经济信息与信息经济(2)管理信息与信息管理
(3)信息管理与信息处理
8、(选择题)一般而言,计算机在经济管理中应用属于_________应用范畴。A. 科学计算 B. 过程控制 C. 辅助设计 D. 信息处理
9、(判断题)没有计算机人类就无法进行信息处理
10、(简答题)信息在经济管理中有哪些作用?试举例说明。
11、(简答题)人们利用计算机进行信息处理一般有哪些途径?自编程序解题一般要经历哪些步骤?
12、利用计算机解题一般过程: 1.问题分析
2.建立模型:数据(信息)模型和处理模型 3.模型描述:形式化
4.程序化(机器化):编写程序 5.运行程序,获得结果
作业
(1)在EXCEL中,输入学号时,首位的“0”可能会丢失,为什么?输入身份证号时,显示结果可能是科学计数形式,为什么? 答:1.作为数值型数据处理时,EXCEL会默认去除首位的0;2.EXCEL对数值型的数据处理时,对超长数据往往显示为最多14位有效数字的浮点数据。(2)如何输入以“0”开头的数字符号串(如学号),使前面的“0”不丢失?又,如何输入超长数字符号串(如身份证号),使其不变成科学计数形式?有多少正确的方法? 答:1.预先将单元格设置为文本格式(多次性解决方法);2.在数字前加‘(临时一次性解决方法)
(3)从WORD或文本文档中复制学号(或身份证号)等数据到EXCEL工作表时,能否使首位的“0”不丢失(或保持原样显示)?如果能,请给出操作方法。
答:预先将单元格设置为文本格式,粘贴时,使用“选择性粘贴”,以文本方式粘贴上去。(4)如何改变单元数据显示格式?
答:1.右键需要改变的单元格,选择单元格格式;2.选择要改变的单元格->格式(O)à单元格;3.选择单元格,按下CTRL + 1
(5)先将日期数据格式改为数值格式,观察其值的变化,再将其格式还原成日期。请找出数值数据与日期数据的内在对应关系。
答:通过0与1900-1-0对应、1与1900-1-1对应,可知EXCEL对日期数据的处理是以1900-1-0(即1899-12-31,24:00)作为起始日来计算日期数据的。另外,负值的日期EXCEL一律显示为####,原因与电脑的“千年虫”问题类似。但EXCEL的这个“遗留问题”对日期数据的处理问题不大,因为除非历史研究,平时用不到1900年之前的日期数据。
(6)逻辑值“TRUE”、“FALSE”与数值型数据有内在对应关系。请你先推测它们的对应关系,然后上机验证,最后给出你的结论。
答:TRUE对应1,FALSE对应;反之,数值0对应FALSE,而非0的数值都对应TRUE(多对一)。(7)文本型、数值型(日期型)、逻辑型数据都有其默认对齐方式。请问它们各自默认的对齐方式是什么?
答:文本型数据默认左对齐,数值型(日期型)数据默认右对齐,而逻辑型数据默认中对齐。(8)在常规格式下分别输入8、8-
8、8-8-8和8-8-8-8,观察其值,并给出合理解释。答:输入“8”,EXCEL以数值型数据处理;输入“8-8”和“8-8-8”,EXCEL以日期型数据处理;输入“8-8-8-8”,EXCEL以文本型数据处理。三种不同的方式在于EXCEL试图对用户所输入数据赋予意义。当数据能解释为数值型时,EXCEL优先当作数值型数据处理;不能,则尝试把它作为日期型数据处理;(还不能则尝试作为逻辑型数据、公式处理;)最后只有前述尝试EXCEL都无法解释所输入数据的意义时,才会以文本型数据处理。** 8-8默认为当前年份的八月八日。
(9)在不同格式下输入=8-5-1,观察其值的变化,并给出合理解释。答:在数值型格式下显示为2.00(默认两位小数);在日期型格式下显示为1900-1-2;在文本型格式下显示为=8-5-1。前两种格式都对“=8-5-1”作公式处理,只是同一结果的两种表示方式而已(两种表示的关系已在第(5)题中说明);而文本型格式下,EXCEL不再认为“=8-5-1”是公式,故直接显示原文。
跨表引用:
表名!区域 例:(sheet1!D2:E3)常用函数:
最大值与最小值函数:MAX(); MIN()统计计数函数:COUNT()数字、日期、或以文本代表的数字计算在内空白单元格、逻辑
值、文字或错误值都将被忽略
COUNTA()COUNTBLANK()计算指定单元格区域中空白单元格的个数
COUNTIF()计算区域中满足给定条件的单元格的个数
平均值函数:AVERAGE();AVERAGEA()标准差函数:STDEV(): STDEVA()补充:
SUMIF函数:
A B
属性值 100,000 200,000 300,000 400,000 公式
佣金 7,000 14,000 21,000 28,000 说明(结果)1 2 3 4 5
=SUMIF(A2:A5,“>16000属性值超过 160,000的佣0”,B2:B5)金的和(63,000)
ABS函数:返回绝对值
RAND函数:返回0和1之间的一个随机数 INT函数:返回小于参数的最近的整数
MID函数:返回文本字符串中从指定位置开始的特定数目的字符
MID(text,start_num,num_chars)Text是包含要提取字符的文本字符串。
Start_num是文本中要提取的第一个字符的位置。文本中第一个字符的start_num为 1,以此类推。
Num_chars指定从文本中返回字符的个数。
举例:INT(RAND()*80)返回[0,79]的整数 MOD函数:返回余数 SQRT函数:返回正数的平方根数
ROUND函数:返回四舍五入到指定的小数位
=ROUND(12345.6789,2)返回值是 12345.68 =ROUND(12345.6789,-2)返回值是 12300 INDEX函数:
INDEX(reference,row_num,column_num,area_num)Reference 是对一个或多个单元格区域的引用。Row_num 是要从中返回引用的引用中的行编号。Column_num 是要从中返回引用的引用中的列编号。
Area_num 用于选择要从中返回 row_num和 column_num的交叉点的引用区域。选择或输入的第一个区域的编号是 1,第二个区域的编号是 2,依此类推。如果省略 area_num,则 INDEX将使用区域 1。
IF函数格式:
IF(条件表达式,表达式1,表达式2)A B C
姓名 成绩 等级 周杰伦 85 B 刘德华 78 C 2 3
单元格C2 =IF(B2>=90,“A”,IF(B2>=80,“B”,IF(B2>=70,“C”,IF(B2>=60,“D”,“E”))))单元格C3 =IF(B3>=90,“A”,IF(B3>=80,“B”,IF(B3>=70,“C”,IF(B3>=60,“D”,“E”))))注:多重IF嵌套,当输入数据不全时,将不输出工作量(输出空值)
当输入数据不全时提醒更明显 什么是数据有效性设置?
用来控制输入数据有效性的设置:数据-有效性
公式=AVERAGE(A1:B30)与公式=SUM(A1:B30)/60是否完全等价?为什么?
Average如果包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内
单引号‘ Excel强制将其后数据设置为“文本型” Excel的输入数据主要有以下三种:
标签:属于文本型对应于基本数据类型中的“C”型 数值:就是“数” 对应于基本数据类型中的“N”型
公式:以等号开头,有单元格名称、运算符号和数值组成的字符串 FV、PV、NPV、PMT及IRR等函数的计算模型
其中参数:Type表示付款类型,其值为0或1,1为期初付款,0为期末付款
Nper——该项投资的总的付款期数
FV:基于固定利率及等额分期付款方式,返回某项投资的未来值 PV:一系列未来付款的现值的累积和
PMT:基于固定利率及等额分期付款方式,返回贷款的每期付款额 IRR: IRR(value,[guess])Values 为数组或单元格的引用,包含用来计算返回的内部收益率的数字 Guess 为对函数 IRR计算结果的估计值 若忽略,则默认为0.1 Excel公式 ① &连接符
②比较运算符 A1为9 A2为8 A1>A2的值为TRUE “A1”>“A2”的值为FALSE ③引用运算符只有 区域运算符“:”和联合运算符“,” 模拟运算表法(百度懂的)VLOOKU函数
格式:VLOOKUP(查找值,表,列号,匹配方式)功能:在表的首列中查找与查找值相匹配的行,返回由列号指定的列中的数据。匹配方式有两种,精确匹配和非精确匹配,参数值为逻辑值,真值为精确匹配(默认方式),假值为非精确匹配。
注意:表必须是按首列有序排序,默认升序。参考office网站http://office2010.microsoft.com/zh-cn/excel-help/HA001056320.aspx?pid=CH001085946&CTT=1&origin=EC001022984 EVAUATE
E F 工程量 计算公式 13.4 2.3*1.6+2*3+2.3*1.6
=EVALUATE(工程量!$F$2)参见EXCEL帮助或教材P103至P106 什么是宏?如何建立宏?怎样运行宏?怎样控制宏的安全性 宏是完成特定操作的VBA程序(模块)。
简单宏可以直接用“录制宏”的命令录制,复杂的宏需要用VBA编辑器编写VBA程序 菜单法;快捷键法;按钮法;在VBA窗口运行 “工具”-“宏”-“安全性” 定义
1.定义名称:插入→名称→定义→输入名称“X”;
在引用位置信息输入框中定义计算关系:=EVALUATE(计算器!C8)添加→确定。
信息数据处理论文 篇3
关键词:地理信息公共平台;平台数据处理;方法研究
中图分类号: P208 文献标识码: A 文章编号: 1673-1069(2016)35-165-2
1 概述
信息化科技的发展促使地理信息公共平台的建设工作不断地加快。地理信息公共平台的构建是地理空间框架建设的重要体现,与现代的网络化技术相结合能够更加方便人们的出行。地理信息公共平台的建设能够使得巨大的地理信息变得可视化。但是地理信息平台的构建不论是流程还是技术都需要一定的方法。通过实践和研究,找到合适地理信息公共平台数据处理的方法,加快地理信息公共平台的建设。
2 地理信息公共平台数据处理方法的研究背景分析
2.1 定义分析
如今社会的发展,影响经济和社会进步和发展的重要因素是信息化,地理信息是人们认知世界的重要途径和手段,是社会经济发展的重要基础。如今传播的百分之八十以上的信息是和地理位置紧密相连的,通过信息的发布,成功的揭露了事物发展的规律,帮助指导了战略决策的制定。
目前我国信息化发展不断地深入化,地理信息资源的基础地位逐渐显现,给人们的生产生活带来了极大的影响。党和政府也认识到地理信息资源的重要意义,加大了对其相关建设和应用开发。地理信息资源的利用对于城市的发展有着极为重要的意义,尤其在数字城市的构建上其具有极为重要的意义,相关部门必须加强对其的重视。
2.2 研究的价值
根据相关的技术要求,我们可以看到,地理信息数据库是基础,地理信息公共平台直接面对的对象是客户,所以作为数字城市建设核心的地理信息公共平台,逐渐以数字城市的主体体现,它所包含的内容是除了详细的数据建库之外的其他所有的内容。
地理信息公共平台建设的核心内容是平台的数据库,它给大众展现出来的信息更利于进行传播,而且充分的体现;集成、可扩充和可视性。
目前我国在数字城市的建设已经取得了一定的成就,但是在数据采集和处理没有一个统一的标准,尤其是针对一些大比例尺的数据的生产处理,笔者希望通过研究之后,针对数据信息的制作方法和流程能够正确地梳理出来,这样可以给更多地方的数据平台构建工作提供指导和帮助。
2.3 数据处理
平台数据集是地理信息公共平台建设的核心内容,它所提供的信息内容更适宜网络化分布式应用,体现集成性、可视化、可扩充性的特征。包括在基础地理信息数据上通过数据提取、扩充和重组等加工过程形成的地理实体数据、影像数据、地图数据、地名地址数据和三维景观数据等面向服务的产品数据。
3 地理信息公共平台数据处理的实施
3.1 建立地理实体数据库
3.1.1 数据的处理
地理信息公共平台建设需要有个存放所有信息的数据库,这些信息都混淆在其中,需要对这些信息进行数据处理,就如同分门别类一样,将有共性的数据都提取出来,作为最核心的要素数据,将所有的数据都按照这样的分类继续分下去。
3.1.2 水系数据处理
地理信息中不免会遇到江河湖海等水系数据,面对这些数据,要将湖泊、池塘,以及水库的线和面作为提取的要素数据。当遇见完整的河流时,就直接提取河流的边和面,当河流中间被桥梁所中断时,对于数据的提取应该是边线、面以及桥梁。遇到拦水坝的粉笔水库,提取的数据信息除了提取水库的边缘线之外还需要提取堤坝等信息,这样才能保证提取信息的完整性。
3.1.3 交通数据处理
地理信息除了有水之外还会遇见铁路和公路以及城市道路等数据信息,对这些道路的要素数据提取,主要是面、边线以及中心线等。同时还需要按照一定的比例将这些信息规划好,与实际的数据信息相对应。
3.1.4 数据脱密处理
在对数据解密处理的过程中,操作人员需要依照《中华人民共和国测绘成果管理条例》的要求,绘制开发出的生产产品涉及利用国家秘密,没有经过高无缘绘制行政管理部门或者省、直辖市、自治区的人民政府绘制行政管理部门的保密技术进行处理的,那么绘制出来产品秘密等级要等于甚至高于所使用的秘密等级。所以,必须对平台数据进行解密处理,高精度进行位置定位,确保在不影响国家安全的情况,满足用户的精度要求。在解密处理数据过程中,还需要注意以下8个方面。①地图位置的公开精度不可超过50米。等高距大于50米,数字高程模型网需要大于100米。②大众使用的遥感影像空间位置颈部要控制在50米以上,影像地面分辨率要高于0.5米,对于涉密的信息、建筑物以及构筑物等固定设施不可进行标注。③只有满足《基础地理信息公开表示内容的规定(试行)》、《公开地图内容表示若干规定》、《公开地图内容表示补充规定(试行)》三项标注要求,才可在大众使用的遥感影像中注明地名、地质以及其他相关信息。④在编制公开地图时,涉及使用到秘密地理信息,需要按照国家绘制地理信息局规定的统一方法进行加密,并依法送到测绘行政管理部门进行审核。⑤如果公众使用的遥感影像需要使用到国家秘密,那么在公开致歉需要移交省级以上的测绘地理信心行政管理部门进行审核并进行加密保护处理。对于分辨率在0.5米以下的遥感影像,也需要经过国家测绘地理信息局进行审核后才能够公开使用。⑥需要得到省级以上测绘地理信息管理部门审核后,并获取地图审核号,才能够公开出版、传递、刊登遥感影像内容。⑦不论是标注的兴趣点还是新增的兴趣的都需要经过审查,满足国家审核之后,才能够进行公开展示。⑧使用到专业内容地图时,需要获取该专业保密部门的核查的证明文件。
3.2 降低空间精度
地理信息公共平台建设之后,人们就可以通过网络进行查看,对于有些需要隐蔽的信息则需要降低空间的精度来实行保密。中国测绘科学研究院开发了专业的软件,可以对数据信息进行变形处理,使得地理信息的空间坐标无规律地发生偏移。这样,将有利于达到保密的效果。
3.3 过滤敏感信息
地理信息公共平台的建设主要目的是能够给人们的生活带来方便,一些人们日常出行会运用到的地理信息出现在地理信息公共平台上就可以了,对于一些敏感的地理信息应该删除掉。例如部队、监狱和劳改所等就不应该标识出来了。同时对于一些专用公路和专用铁路的信息也应该不予以标识。
3.4 晕渲地图制作
地理信息平台建设呈现出来的地理信息需要一定的视觉效果,给人直观的道路感受。对地理信息中的地势进行晕渲地图的分级切片。在全市范围内,数据采用一比一的方式进行,而其他范围则采用一比五的数据来代替。通过叠加的方式使得数据呈现出直观感受的地势晕渲图。
3.5 三维数据制作
为了使得地理信息平台的建设的地理信息更加逼真,人们在使用的过程中能够更快速地理解,三维数据制作也是一种手段。首先需要建立三维模型数据,再根据这个模型,将地理信息有效的定位在其中,最后通过三维模型渲染的方法使得地图更加满足视觉的效果。渲染之后的模型在经过专业的软件到处成平台所接受的文件格式。
4 结束语
通过上述的研究分析我们了解到,地理信息公共平台的建设工作需要一定的数据处理方法的支持,这样才能够给大家提供一个科学、准确并且及时的地理信息服务共享平台,才能实现给人们生活出行带来便捷的想法。地理信息公共平台数据处理包括的内容很多,需要逐个去研究透彻。地理信息公共平台数据处理方法经过一定的研究之后在更大范围内推广使用,使得更多的地区能够建设地理信息公共平台,真正迎接信息化的时代。
参 考 文 献
[1] 国家测绘局.国家地理信息公共服务平台专项规划(2009-2915)[S].2012.
[2] 国家测绘局.国家地理信息公共服务平台技术指南[S].2012.
信息数据处理论文 篇4
关键词:临床科研,信息共享,数据关联,数据安全
1 引言
中医学既往一直采用“从临床中来,到临床中去”的发展模式,临床实践是中医学发展的基础,个体化诊疗是中医临床实践的主体,辨证论治个体化诊疗所形成的海量临床诊疗信息和数据是中医临床研究和基础研究的源泉[1]。中医学不断从临床实践中总结经验,又不断到临床实践中验证,所获得的经验或知识常常是个别的、零散的[2]。如何记录中医临床诊疗实践中大量的中医学知识和诊疗信息,并使得这些记录的信息能够用于分析中医临床诊疗的疗效和经验知识,是中医学现代化研究和发展的重要课题[3]。在信息技术高度发展的今天,人们迫切需要将临床实践与科学研究有机结合,建立起可供临床医生与科研人员共享的信息系统。
2 临床科研信息共享系统
2.1 建设背景
根据《中医临床研究基地建设指导意见》和《中医临床研究基地业务建设要求》,构建中医临床与科研信息共享系统是中医临床研究基地业务建设的重要任务,是落实国家中医药管理局关于基地建设“一体两翼”建设任务的重要举措。江苏省中医院是重点研究脾胃病的国家中医临床研究基地。依据国家中医临床研究基地建设的指导要求和意见,江苏省中医院根据基础设施建设和管理要求,创新整合全院信息资源,围绕本院的临床研究基础和优势,合作研发高水平、开放的临床科研信息共享系统,打造具有示范效应的中医临床研究基地。该临床科研信息共享系统是基于临床科研一体化的理念,利用现代信息技术,在标准化、规范化的基础上,充分整合计算机、数理统计、数据挖掘、人工智能等方法构建的中医临床研究的技术平台。
2.2 系统架构和设计思路
该系统运用SOA的架构思想、J2EE(Java 2 platform,enterprise edition)和Microsoft WPF(Windows presentation foun dation)技术相结合的设计理念,采用C/S/S(Client/Web service/DBServer)的架构设计,遵循卫生部制订的健康档案数据集标准,同时基于数据集成交换平台[4],构建一个可靠、标准、开放、可扩展的临床和科研共用、共享的应用环境。
该系统的数据标准以卫生部《健康档案共用数据元》为基础蓝本,参照卫生部《健康档案基本数据集编制规范》中的各项规范要求对未覆盖的数据元进行扩充。严格采用数据标准生成的数据实体对象作为系统数据的载体,收集健康模型中的全部数据和院内其他信息系统中的数据,并按照不同的仓库类型分类存储各类数据。利用分类数据仓库和专病主题仓库进行相关的科学研究和分析工作,并利用研究结果进一步提高临床工作效率和质量。
2.3 系统主要内容
临床科研信息共享系统实现了门诊、住院临床相关工作的各项功能,包括:门诊病历、医嘱、检验检查申请、处方、住院病历、病程、手术、出院小结、病案首页等,同时将科研工作各项内容和要求与临床工作进行整合,实现了临床科研一体化的理念,完成的功能包括:科研管理、课题管理、临床路径、诊断分型、随症加减药物、访视病历、病历补录、数据导出等(如图1所示)。
该系统实现了业务流与信息流的有机融合,加强了现有医疗资源的整合,整体提高了临床医疗服务、疾病分析和中医研究的能力。系统既能满足当前阶段医院临床医疗活动中的各种需求,同时又能保障中医临床研究基地建设中科研教学和数据挖掘分析要求,适应中医临床研究基地信息化建设的需求。
3 临床科研信息共享系统数据处理策略
3.1 医疗业务数据导入
由于医院医疗业务系统分门别类,业务数据种类繁多,有检验报告、病理报告、影像报告等。在诊疗过程中,需要能随时查看上述医疗业务数据以及患者既往就诊信息。临床科研信息共享系统通过数据集成交换平台(DIP),整合各个异构信息系统资源。该系统可以自动实时导入医嘱、检验报告、检查报告的信息,可以在进行病历资料编辑时自动引用相关信息(如图2所示);同时支持时间范围查询,用户可自行输入日期范围,查找该范围内的门诊、住院和检验检查报告信息。
3.2 医疗及科研数据的关联引用
临床医疗与科研业务的最大矛盾在于:临床医疗过程中由于患者数量庞大,要保证高效率,就需要电子病历的操作简单,录入快捷,用最少的时间记录如主诉、现病史、诊断、医嘱等必要的医疗信息;然而临床科研却需要搜集大量详细的医疗信息,并填写复杂的科研量表,例如:体格检查表、生存质量分析表、疾病评估量表等,这些量表的填写将耗费较多的精力,增加临床医生的工作量,延长医疗时间和患者等待时间。上述矛盾在门诊业务中显得尤为突出,这也是国内诸多临床科研一体化系统难以在医院门诊部广泛使用的重要原因。
针对此矛盾,临床科研信息共享系统研发了关联并引用的采集模式,自动整合临床和科研数据,充实和完善每位患者的健康数据,临床医疗和科研量表两者间相同的信息只需一次性输入,避免重复性动作。基于标准化数据元,采用结构化病历采集模式,医务人员在填写病历时只需选择相应的结构化选项,极大地减少了打字输入的内容(如图3所示)。在临床医疗过程中已录入过的结构化信息,会自动引入科研量表中,并以红色部分显示,无需重复输入(如图4所示),明显提高了工作效率,缓解了临床医疗与科研业务之间的矛盾。
3.3 医疗及科研的数据安全
医疗数据一直被视为敏感信息,随着医院信息系统承载的医疗数据越来越多,医院信息系统是否可靠、传输环境是否安全直接关系到医疗数据的机密性和完整性,成为影响医疗活动正常开展的关键因素。临床科研信息共享系统的应用,使得医护人员从对一张纸质病历的负责转向对一段数据电文描述内容的认可,使得科研人员从对一本纸质的科研病历和量表的负责转向对电子科研病历和量表内容的认可,这样数据电文的责任归属是否明确直接关系到信息化流程能否完全取代传统的纸质流程。此外,医疗管理中临床医疗和科研病历的生成、修改及访问等的时间敏感性极高。目前,这些事件大多由信息系统服务器时间产生,很容易因在场时间的记录不准确,从而导致医疗行为时间缺乏公信力。
临床科研信息共享系统将引入数字证书认证系统,利用数字签名技术保障医疗数据的完整性,不仅能保证医疗数据的“数出有源”,还有助于规范临床路径、实现医疗过程监管,促进医疗服务质量和紧急医疗救治能力的提高。同时,在保证时间源可信的前提下,对所有关键行为操作进行时间戳处理并记录,确保提供可信的时间服务。
4 实施情况
临床科研信息共享系统经过长达1 a的调研、考察、临床需求分析征求,于2010年9月正式开始开发。选择江苏省中医院临床研究基地重点病种胃癌、溃疡性结肠炎,梳理中医服务流程,定义系统的详细功能。于2011年6月,完成了系统的设计、开发、测试、与医院其他业务系统的数据交互以及试运行工作,并在2个重点病种的门诊和病房正式使用。系统实现了门诊、住院临床相关工作的各项功能,包括:门诊病历、医嘱、检验检查申请、处方、住院病历、病程、手术、出院小结、病案首页等,同时将科研工作各项内容和要求很好地同临床工作进行整合,实现了临床科研信息共享的理念,完成的功能包括:科研管理、课题管理、临床路径、诊断分型、随症加减药物、访视病历、病历补录、数据导出等。目前,该系统通过临床的不断试用,各种功能正在不断地优化和完善。
5 总结
临床科研信息共享系统实现了全院医疗信息的整合,在录入临床、科研病历的同时,通过数据集成交换平台,与其他业务系统的医疗资源进行数据交互,达到一次性录入、信息共享的目的。基于标准化数据元,利用结构化病历,在门诊问诊的同时,进行科研病历的及时录入。本系统满足基地规范化建设的要求,可实现临床、科研的信息共享,提高中医临床数据的采集、整理和分析能力。
参考文献
[1]闰秀峰,刘保延,陈世波,等.基于临床科研一体化理念的中西医结合肿瘤结构化电子病历的研究现状[C]//2009年首届全国中西医肿瘤博士及中青年医师论坛论文集.北京:中华中医药学会,2009:99-103.
[2]刘保延,张启明.构建中医临床科研信息一体化平台需要解决的症状规范问题[J].中医杂志,2011,52(20):1 714-1 716.
[3]刘保延,周雪忠,李平,等.个体诊疗临床科研信息一体化平台[C]//中医药优秀论文选(下册).北京:中华中医药学会,2009:783-790.
顾客信息处理表 篇5
(****年**月**日)第 号 信息来源 □走访顾客
□顾客来访
□来函来电
□其它 信息类别 □质量问题
□建议和意见
□行业评价
□其它 涉及的产品
顾客名称
信息 内容
经 办 人:
****年**月**日 产品销售处意见
签
名:
****年**月**日 技术质量部 意见
签
名:
****年**月**日 公司领导 意见
签
名:
****年**月**日 处理 结果
签
名:
信息数据处理论文 篇6
随着城市经济、科技和人民生活水平的不断提高,所需的地下管线日渐增多,城区地下已经密如蛛网的各类管线还将有增无减。种类繁多的地下管线,由于缺少统一的管理系统和准确的管线资料,在城市建设中常有管线被破坏,造成通讯中断、煤气泄漏、污水漫流等,给人民生命和国家财产造成巨大威胁和无可挽回的损失。随着城市信息化进程的加速,越来越多的城市和专业管线权属单位分别建立了城市综合地下管线信息系统和专业管线信息系统。
一、工作目的
地下管线是城市的重要基础市政设施,包括给水、排水、燃气、热力、电信、电力等几大类,担负着传递信息、运输能量的工作,是城市赖以生存和发展的物质基础,也是城市规划建设的重要组成部分,被称为城市的“生命线”。它的安全运行是现代化城市高效率、高质量运转的保证。
以往市政设施建设都是以文字、图册存档,地下空间缺乏统—管理,地下管线权属单位可根据各自的需要自行埋设,既影响交通,又造成浪费。现有地下管线信息流通不畅、数据不够完善、现状资料存在缺漏和偏差、来源不明确、精度不可靠。每年因年久失修、信息不清以及施工外力损坏管线所造成的事故层出不穷,为了更好的统一管理地下管线,地下管线综合管理信息系统应运而生,以下就简单介绍该系统的数据处理工作。
二、数据现状
地下管线综合管理信息系统建设的管线数据包括燃气、热力、排水、给水、雨水、污水、电力、路灯、信息、通讯等管线数据和管线附属设施数据。这些不同格式、不同坐标系、不同比例尺的数据必须经过处理和整合,形成统一格式、统一坐标系的管线数据,实现综合管线的统一管理、统一应用。处理工作主要围绕以下两步展开:数据分析、数据处理。
以北京市为例,目前已有北信基础、燃气集团、电信集团、热力集团、路灯管理中心、电力集团、排水集团、歌华有线、自来水公司九家权属单位提交了管线数据,数据的具体情况见下表:
这些数据存在的主要问题和处理方式有:
第一类:.xls文件格式数据。
1.北信基础提供的数据为.xls文件格式,没有坐标信息,需要进一步去权属确认是否有空间数据,以实现属性和空间信息的挂接。
2.电信集团提供的.xls文件,里面有坐标信息,可以开发程序实现空间信息的标注,形成空间数据。
第二类:
1.燃气集团提供的数据是基于auto deskworld软件平台的,需要经过数据转换成可以和arcgis平台通用的数据格式。
2. 歌华有线提供的MicroStation DGN文件可以通过数据转换成与arcgis平台通用的数据格式。
第三类:Mapinfo文件格式。
热力集团和路灯管理中心提供的数据均为Mapinfo文件格式。其中,路灯管理中心数据为经纬度坐标的,需要经过坐标转换为北京本地坐标系。
第四类:Geodatabase文件格式。
排水集团和自来水公司提供的文件是arcgis平台通用的文件格式。
第五类:.xml文件格式。
电力集团提供的.xml文件可以转换成适用于arcgis平台的文件格式。
三、数据分析
按照自来水公司、歌华、排水集团、电力公司、路灯管理中心、热力集团、电信集团、燃气集团、北信基础的顺序,分析各家权属单位的各类管线数据,目标是分析清楚每家管线数据状况,得到分析结果。具体步骤为:
1.分析每家管线数据类别、格式、坐标系、比例尺、图层类别、图层划分方法、属性信息字段、属性信息是否为空等,按照建设技术规范的要求,为每家形成一个分析报告。
2.把分析报告反馈给各权属单位,并且要求权属单位根据分析报告中提出的问题进行管线数据的修正,确定其再次提交数据的时间。
3.向领导汇报数据分析报告,供领导决策。
4.为每家单位的数据制定详细的数据处理方案。
四、数据处理
按照自来水公司、歌华、排水集团、电力公司、路灯管理中心、热力集团、电信集团、燃气集团、北信基础的顺序进行数据处理。数据处理的目标是把来自各家单位的数据转换处理成北京本地坐标系下的,基于ArcGIS格式的数据。处理步骤为:
a)为每类管线制定统一的图层划分方法。
b)为每个管线图层制定标准的属性数据结构。
c)应用软件工具将权属单位提交的数据转换成统一格式的数据,同时将属性数据填入统一格式的数据中。
d)解决路灯管理中心数据坐标转换,将其目前的经纬度坐标转换成北京本地坐标。
e)应用相关软件和人工结合的方法,对转换得到的管线数据进行数量、长度、完整性和准确性的计算、检查、评估,编写数据处理报告。
f)权属单位对转换结果进行复查和确认。
g)重点地区管线空间位置和属性数据完整性和准确性保证。
h)向领导汇报处理结果,供领导决策。
五、总结
地下管线管理系统的基础是地下管线的数据,数据资料的来源、精度等需要仔细核实检查,数据处理工作就显得尤为重要。随着计算机技术在各领域发展应用的普及,未来将出现处理数据的各类软件,这将大大提高对管线数据处理的效率。
信息数据处理论文 篇7
伴随着近年来经济和科技的快速发展, 我国气象预报工作也有相当程度的发展。但是, 在气象预报的过程中, 我们仍需面对很多问题, 气象预报工作亟需更进一步的完善。为了进一步促进我国地面气象测报的发展, 并逐步优化“观云测天”的传统测报模式, 进而将其转化为全新的探测机制, 即以高效探测与信息化数据处理为主要方向的新模式, 在国内开展了内容丰富的地面气象测报的各种技能竞赛, 覆盖了气象测报的诸多方面, 包括有云观测、地面气象观测、计算机数据综合处理和地面报告编制等。笔者在本文中就地面信息化处理技术进行了研究和简析。
1 A文件计算机审核疑误信息处理
1.1 台站参数疑误信息的处理
在进行格式审核过程中, A文件的台站参数疑误信息需要进行一定处理。其错误信息通常表现为文件首部参数与台站参数表不相符, 要正确处理这种信息, 首先要检查文件首部的参数标识, 其结果是全月数据缺测;而冻土观测项目的数据在台站参数当中已经设置完毕, 所以, 两者的数据之间存在矛盾。通过对其进行分析后我们发现, 其主要原因在于:次月初进行了例行的冻土观测, 最后月的B文件转为A文件, 倘若次月的冻土观测项目并未在台站参数中设置, 两者的数据就会出现矛盾。所以台站在任务变动时, 要做出相应提示, 在进行文件转化时, 尤其要重视观测任务的变化, 保证本站基本参数设置的正确性。
1.2 文件正点记录缺测处理
据规定:“若能有效获取非正点分钟数据, 则正点左右10min以内的记录为首选是作为有效替代的首选”。若所得非正点分钟数据在正点前10min以内, 并且该数据缺测, 那么, 我们选择正点之后10min以内与正点接近的数据作为替代。而在不能有效测取分钟数据要素, 或有分钟数据却出现缺测的状况下, 可以将平行观测值或者补测值作为分钟数据的有效替代。
1.3 降水量和降水现象不一致的情况处理
例如在文件当中出现了存在7~8h有降水量, 却无降水现象与其相对应的疑误信息, 这主要是因为传感器翻斗出现了滞后性。解决这个问题所采取的方法是:在有效判定了降水量滞后这个前提下, 且滞后时间<2h, 我们可以将该数值累加, 其目标为降水终止的时间段;若滞后时间>2h, 则将该降水量删除。
1.4 上跨日期与上月文件有差的处理
测报软件能够对跨月连续降水的开始日期进行挑取, 对上跨连续降水量也是如此。鉴于所选数值会出现错误, 所以, 预审人员要树立严谨的工作态度, 将文件数据进行比对核实, 保证无误。
2 J文件计算机审核疑误信息处理
2.1 对分钟数据的缺测处理
在对J文件的机审过程中, A文件所显示的正点值与系统所给出的提示信息不一致。这主要是因为采集器受到自然因素影响导致工作状态失常、对传感器进行标校和更换导致缺测等。此时在单位时间 (h) 内, 其正点数据和正点分钟数据有差, 且正点分钟数据被确认有误, 则可取正点值以替代。
2.2 对分钟数据异常跳动变化数值的处理
在对J文件进行机审时显示, 分钟之间的数据出现异常, 通常表现为20.52时的气压值和其前后1min都存在误差, 这个数值达到了20h Pa, 这个记录值是异常的。据规定, 通过其前后分钟数据内差可得, 这一分钟值为840.3h Pa。
3 文件人工审核疑误信息处理
3.1 对云、能见度和天气现象记录进行审核时的要点
3.1.1 在对云观测的记录里, 首先要充分了解云的定义、成因
和特征以及常伴随出现的天气现象, 以此为基础, 对云状记录的排序和云状衍变予以充分关注。
3.1.2 能见度的记录应与天气现象相结合。
当能见度小于10km时, 也要对轻雾、霾等天气现象进行记录。在能见度小于1km的状况下, 则要有相应的雾、雪暴和沙尘暴等天气现象的记录内容。
3.1.3 天气现象的记录要与其定义特征的规范保持大体一致。
若存在降水记录, 则尤其要重视降水的时间起止。另外, 进行霾、浮尘、轻雾等视野障碍现象的记录时, 要充分考虑风、降水、相对湿度等现象。
3.2 人工审核的其他要点
目前, 自动气象观测系统尚不完善, 还有某方面的功能缺陷, 它能对数据文件的合法性进行有效检测, 对于不定量的信息化资料却力不从心。因而, 人工审核是不可缺少的。
3.3 对质量控制码疑误信息的处理
我国气象文件中有非常明确的规定:在控制段中, 质量控制码是使用三位整数来表示的, 从个位、十位到百位分别对应了国家级、省级以及台站级。在日常的工作中, 记录错误会严重影响数据格式的秩序。所以, 在出现台站观测数据有修改或缺测的情况时, 要对质量控制码和更正数据段的格式予以检查, 以确定其正确性。
4 对信息化文件作出正确的备注
要想正确地对信息化文件做出备注, 首先要注意备注信息的内容, 即对测报工作中的重要事由或对有影响情况的记录的阐明。它通常包括了站址的迁移、站名变更、业务升级和设备的变动等。其次要有条理地进行记录, 并作精炼简要的描述, 要注意对同类型的备注进行归并, 且按照相关规定执行。
5 结语
以上是笔者对气象预报地面信息化处理技术的研究和浅析。在实际的信息化资料的审核处理过程中, 发现并处理疑误信息的情况更为复杂, 工作人员要对A、J文件的数据格式有清晰认识, 严格操作流程, 对疑误信息展开综合的分析和判断, 确保信息化资料处理的准确和完整性。
摘要:笔者主要对气象预报地面信息化处理技术展开了研究与分析, 就地面测报业务软件相关技术作了简述, 充分考虑了人工审核的经验, 并对云、能见度和天气现象等人工观测项目之间的配合进行了重点分析, 着重指出了地面信息化数据文件中的错误。
关键词:地面气象预报,信息化,数据处理
参考文献
信息数据处理论文 篇8
1.1 记录分析处理
人工审核A文件出现的疑误信息, 多由以下原因造成:天气现象的漏记, 比如出现雷暴的方位被漏记;记载的天气现象的顺序不正确, 比如在阵雨与雷暴间记录闪电;气象表封底备注被多记、错记或漏记, 比如为备注缺测;控制质量密码不正确。关于记录云状, 常常出现未记录有多少云量或关于云状的记录加上了雷暴, 但没有配合对流性云状。
1.2 注意点
在记录云时, 要对云的概念做熟悉, 关于形成云的原因、云状特点与伴随而来的天气情况等, 云状的演变、顺序应该正确记录, 以及雷与云是否合理配合等也要准确记录;在记录能见度时, 不可忽略记录时的天气现象, 如果存在10.0km》能见度, 那么要对扬沙、雾、烟等情况做好记录, 如果存在1.0km》能见度, 那么要对烟雾、沙尘暴、雪与雾等做好记录, 要做好最小能见度的记录;记录天气现象也有相关的规范, 如果为雨天, 关于降水开始与停止时间, 自动测站与虹吸自记是否存在差异, 如果出现视线障碍天气现象, 比如浮尘、雾霾或阴霾, 降水与风的记录必不可少, 以便于判断。
1.3 人工审核的另外注意点
国内自动气象业务系统尚需完善的部分较多, 想要实现高精度的智能化自动记录还比较困难, 也存在功能缺陷, 数据文件是否合法是其常用的检查功能, 而非定量信息, 如封面信息、气象概况等, 自动气象业务系统还不能轻松的完成。为此, 人工审核是常见的主要的办法。
1.4 处置质量控制码信息疑误
参考规范, 3位整数是质量控制码的表达, 站台级为百位, 省级为十位, 国家级为个位, 正确用0代表, 未采取质量控制用9代表。工作人员在现实情况下, 要着重注意是否存在格式错误的情况。
2 计算机审核A文件, 处理疑误信息
2.1 处理台站参数信息疑误
信息化处理时常碰到台站参数信息疑误的情况, 表现为台站参数表和文件首部存在差异, 主要因自动气象站型号、文件首部观测项目所以和其要素存在方位差异的情况。可通过提示观测对象变动或早转换文件格式时注意当前时间以及将要转换到什么时间, 确保基本参数的正确。
2.2 处理缺测文件整点记录
按照规范, 如果分钟数据可在非正点获取, 那么位于前后整点10min且与整点最接近的记录替代之。即如果数据于整点前10min被观测, 那么在该时间范围内中与正点最邻近的数据为记录值。若前10min内缺失数据, 则以后10min范围内的与整点相邻的数据代替之。若分钟数据无法获取, 或时间范围内的数据也存在缺测, 可以补测值或平行人工观测值替代。如果补测与人工观测也缺失, 那可结合地表温度、气象站气压、相对湿度等要素做内插处理。
3 计算机审核J文件, 处理疑误信息
3.1 处理分钟数据的缺测
在做机审J文件时, 缺测正点气温可能出现, 进而造成不能与A文件有一致的正点值。更换传感器、校准采集器或雷击中采集器时, 就极容易出现此种情况。如果正点的分钟数据与自动站测得的整点数据不同, 在判断分钟数据的确存在不一致的情况, 则正点值即可替代。
3.2 处理分钟数据异常的跳变值
若某阶段的分钟数据记录中存在某分钟数据的跳变, 在参考人工站要素前提下, 以自动站记录的数据与自记迹线对比, 若的确存在野值, 数据内插必不可少, 但要除开降水量、风。
4 备注信息文件
在处理与修改信息化资料中存在的不正常情况之后, 备注极其重要。备注工作要做到:备注内容的选择性。内容应记载影响记录的说明或重要的气象探测事项。比如, 更改站名、迁移站址、改变海拔高度与经纬度、观测仪器、观测方法、观测项目、台站四周环境变动、安装仪器是否正确等。填写备注应该坚持内容简明扼要、条例清晰合理。比如影像数据、统计方法、不正常的数据记录时间、处理数据方法、引起状况出现的原因。例如, 若仪器更换时, 那么要记录仪器生产商、型号、号码与有效的检测日期等。如果备注内容类型相同, 要做归纳整理。备注应合乎一定的规范, 台站变动历史或常见的备注事项为记载类型。常见备注内容指的是某些可直接影响气象观测水平的缘由或台站四周出现的环境变动等。
信息数据处理论文 篇9
航空物探在地质研究、生态治理、短缺资源的探测, 有着广泛的应用。目前主流的航天探测技术主要有四种:航空磁测技术、航空电磁测量技术、航空能谱测量技术、航空重力测量技术。
1 数据挖掘技术概况
1.1 数据挖掘技术现状
重要信息的挖掘方法由以下3个环节构成: (1) 资料内容的搜集, (2) 数据信息的挖掘发现, (3) 数据挖掘的结果展示, 数据挖掘可以与用户智能交互, 数据挖掘主要是根据分析每个重要信息, 从广泛的数据中寻找其中的规律的技术, 资料的搜集是从与其相关联的数据源中筛选有价值的数据并处理成用于数据挖掘的数据集;数据信息的挖掘发现是用某种特定的算法, 将数据集所含的规律找出来;数据的规律表示是以用户可接受的方法将找出的规律呈现出来, 数据挖掘是一个多学科的交叉领域, 这些学科包括数据库技术、机器学习、统计学、模式识别、信息检索、神经网络、基于知识的系统、人工智能、高性能计算和数据可视化等, 数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、和演变分析等。
典型的数据挖掘如图1所示。
1.2 数据挖掘分析技术的应用
数据挖掘是一门交叉学科, 随着数据库和互联网路的发展, 在金融、通信、等许多领域得到广泛的应用, 其应用领域在不断拓展。
几个典型的应用, 如 (1) 预测功能:通过对大量资料中走向的分析, 对将要可能发生的事件进行预测对客户群体进行科学准确的预测。 (2) 客户群体价值判断作用:根据对客户的价值判断, 发现单位的优质客源, 提高经济运行效率, 降低成本。 (3) 智能跟踪:通过对已有的数据资料进行研究判断, 找出其中的异常点, 对可能发生的情况进行预测。 (4) 复合型营销:根据对资源和服务结合的营销策略的分析, 准确定位货物间的组合销售方案, 设计复合销售策略。例如, 在零售业进行消费者消费情况分析, 根据结果对货架重新摆放, 从而提高销售量等。 (5) 针对性服务:对个人的消费案例进行分析, 发现其特定的消费习惯, 可有针对性地设计方案销售。 (6) 数据库的直接销售:一般来说, 向客户随机发出大量直销邮件, 可能仅有不到1%的反馈信息。但是依据小规模邮件直销的结果内容, 数据挖掘能够建立一个科学的方案, 找出其中可能做出响应的个人, 将响应率提高到10%, 甚至更高从而削减了成本, 提高了销量。 (7) 提升工作效率:通过对日常工作数据判断, 找到优化解决方案, 提高效率。 (8) 创新探索:通过对丰富的无规则的科学实验数据进行分析, 发现其中规律, 发现未知现象。 (9) 对象的划分例如, 银行业将客户分成不同的群体, 向其提供不同的个性化投资产品。
综上所述, 数据挖掘能够高效的处理分析复杂数据, 并能够科学的实现智能交互, 能够很好的解决目前航空航天资料内容多、查询难度大、分析困难、利用率低的难题。
2 数据挖掘技术引入航空物探数据库系统的设计思路
2.1 航空物探数据库系统概况
航空物探数据库系统使用到的主要工具见表1。
各个部分的功能模块见表2。
以上内容为系统开发的工具组成部分。
目前航空物探的系统能够实现航空物探数据的数据入库存储、实时检查和查询三大功能。但是其查询和存储效率相对较低。比如, 系统对大字段数据的读写速度慢。当一次处理的数据量达到上百兆时, 系统处理时间达数分钟。
2.2 数据挖掘在数据库中的引入
2.2.1 数据挖掘算法
数据挖掘方法中受到认可的方法包括决策树算法、传算法、聚类算法、关联规则等。
聚类算法是一种功能强大的资料管理算法, 这种算法具有可扩展项能、分析有损数据、可处理的维度数更高、对于资料数据的记录顺序不敏感、能够被解释、兼顾约束条件、高智能交互特点, 充分利用数据之间的关联度进行分类处理, 实现良好的交互功能, 聚类算法主要包括基于密度的方法、层次聚类算法、分割聚类算法、基于网格的方法等等。
其他算法如下数据挖掘算法汇总表3。
2.2.2 数据查询推荐系统的建立
航空物探数据查询推荐系统就是通过分析用户查询的资料得出学习其中经常被查询和关注的内容并进行记录, 为每个用户建立一个档案资料库, 在以后的查询过程中为其提供智能服务, 向其推荐其可能关注或感兴趣的信息的系统。根据实验分析得出次查询推荐系统能够很好地向用户推荐所需信息数据, 在短时间内解决资料查询问题, 帮助用户方便准确查询到所要查询的信息, 提高数据查询效率, 降低查询时间。
2.3 数据挖掘算法在查询系统中的应用
由数据挖掘算法汇总表3, 可清晰看出, 各种算法都有其优缺点, 结合算法自身特点及资料的查询的实际需求, 本方案数据查询智能交互系统的设计思路将主要引入数据信息挖掘中的数据预处理技术, 关联规则挖掘, 分类分析, 聚类分析等关键技术算法, 本方案重点研究数据挖掘关联规则技术和聚类分析技术在的应用。
2.3.1 数据中挖掘关联的规则
关联规则在本系统中的应用: (1) 充分利用挖掘数据间的相关性, 同时结合用户查询的历史记录, 向用户推荐相内容, 提高了信息的使用效率, 即促进信息数据间的关联; (2) 组织相关数据进行搭配; (3) 根据用户的查询模式及查询的历史记录将用户进行合理智能划分。从而动态调整数据链接, 给各类用户提供更为满意快捷的选择, 实现了数据人性化查询交互。
下面可以根据一个3个环节对此问题进行分析介绍:
第1个环节:在进行数据查询上, 用户想查询航空物探电磁测量技术。系统可以根据对关联规则的挖掘结果电磁测量技术和重力测量技术放到一个列表, 向客户推荐, 提高数据的利用效率。根据系统进行数据挖掘得到的信息:关注电磁测量技术用户有51%关注重力测量技术。
经调查许多用户都会受到这种导向的影响, 这样就大大提升了资源的使用效率及用户的搜索难度。
第2个环节:更进一步分析, 根据对若干个例1中关联规则挖掘。这样可增加用户对于此类信息的兴趣, 帮助用户理解数据。
第3个环节:为查询的用户智能提供N种的数据相关。第一步:当用户使用本系统时进行实名登记注册, 其每次进行数据查询就会产生一系列数据记录, 根据该历史查询数据记录, 根据关联规则算法从Database中找出所有满足最小支持度threshold和最小置信度threshold的关联规则, 智能划分出用户尚未查询但可能感兴趣的数据内容的信息, 根据概率中置信度算法找出其最可能感兴趣的对信息内容题目进行整合, 向用户智能提供N种最可能感兴趣查询的。
2.3.2 聚类分析的引入
对用户的查询消息记录进行聚类计算, 将具有相似查询习惯的用户划分为一类, 将具有最相关查询记录的用户划归到同一个类中, 根据同一个类中用户的信息内容向其更好更准确到位地推荐要查询的信息内容, 也可动态地进行信息列表的调整, 从而提供更高效的服务, 对于数据资料的管理人员, 可根据不同簇中用户的特征, 制作不同的信息查询列表, 比如:消费者M去网上购物淘宝, 购买家具, 买了床和床垫两种商品, 同时可能还会浏览一些家用电器等日常生活用品, 当消费者M再次进入此查询系统时, 系统就会通过M的查询历史记录在页面下方提示其可能感兴趣的信息, 这样便于用户查询, 缩短了查询时间。同时系统可以根据用户的查询记录将其查询习惯进行归类划分成簇。
3 总结
目前数据挖掘技术在互联网领域应用较为广泛和成熟, 如网上购物等等, 其良好的使用效果得到业内人士越来越多的重视。
通过将数据挖掘算法, 对客户每次查询进行记录, 根据记录可以分析出对其有价值的部分, 当其登录时会自动有列表显示其可能感兴趣的信息列表, 进一步大大缩短了数据查询的时间, 显著提高了资料的使用效率。实现了数据在条件下的资料查询的简单化、快捷化、人性化的处理。
随着信息量的逐年不断增加, 数据挖掘技术和其算法必然会得到不断的拓展和完善, 将数据挖掘技术引入到航空物探资料管理查询当中具有良好的前瞻性和实用性。随着技术的不断完善, 定会更好的服务航空物探事业。
参考文献
[1]万建华, 熊盛青, 范正国.西方国家航空物探技术的若干进展[J].物探与化探.2000.
[2]卢俊峰.野外航空物探资料预处理问题的讨论[J].地质找矿论丛.2003.
[3].薛典军.航空物探信息服务系统需求规格定义.中国国土资源部航空物探遥感中心.2003.
[4]韩家炜, 堪博.范明, 孟小峰, 译.数据挖掘:概念与技术[M]. (2版) .北京:机械工业出版社.2007.
[5][美]Charles Petzold.C#Windows程序设计 (M) .北京大学出版社.2002.
[6]邹志文, 朱金伟.数据挖掘算法研究与综述[J].计算机工程与设计.2005.
信息数据处理论文 篇10
关键词:地面气象测报,数据记录,信息化数据处理
1 计算机审核文件的疑误信息处理
1.1 A文件信息处理方式
(1) 台站参数疑误信息处理。格式检查审核时, 数据A文件台站参数会显示“文件首部参数与台站参数表不符”等错误信息, 应对疑误信息进行有效处理, 首先检查文件首部参数标识, 发现当月数据缺测、参数与参数间的对应值无法衔接等。针对这种台站参数错误问题, 需要台站及时做出任务变动的相应提示信息, 观测人员应认真观察所有参数变化, 做好观测任务变化后的文件转化, 并记录每月观测任务变化, 确保台站参数正确, 减少月与月间气象数据疑误信息发生。
(2) 降水量与降水实况不一致。如果A文件中出现降水量与降水现象不符的疑误信息, 即“数据中出现7~8 h降水量记录, 但实际天气并未发生降水现象”, 通常雨量传感器翻斗滞后可导致这类现象出现。观测员若能对时间段内降水量做出正确判定, 且保证滞后时间在2 h内, 就可将该降水量数据进行累加处理, 降水量数据可累加在降水终止时间段;当降水量滞后时间远超出2 h, 应删除该降水量数据。
(3) 文件正点记录缺失。据相关地面观测文件规范规定, 在能够有效获取非正点分钟数据的前提下应优先选择正点前后10 min内的记录作有效替代。如果获取的正点前10 min内的非正点分钟数据, 该数据缺测, 则可选择正点后10 min内且最接近正点的数据替代[1]。如果未有效获取到分钟数据要素, 或是出现的分钟数据存在缺测现象, 应利用平行观测值或补测值进行替代, 如果有的气象观测站不具备平行观测或补测条件, 就必须按照相关规定将该观测站气温、气压、相对湿度、地温等要素结合起来进行科学内插处理。
1.2 J文件信息处理方式
(1) 分钟数据缺测。对J文件进行审核时, 可能会出现系统中提示信息某一日正点时间的气温对应A文件中所显示的正点值不一致错误, 造成这种错误的原因有以下几种:一是采集器受到雷击等外界因素影响, 致使数据记录错误。二是进行传感器标校或更换传感器导致数据记录缺测[2]。针对这类疑误信息, 应根据地面观测相关文件规定的“当自动气象站每小时正点数据与该正点分钟数据不一致时, 只要确认正点分钟数据错误, 即可采用正点值作替代”进行处理。
(2) 分钟数据异常跳变。计算机审核J文件时还会出现分钟间数据存在一定的异常现象, 如某一日20:53的气压值记录数据与该时间点前后1 min之间的差值高达20 h Pa, 这种较大误差说明该气压值为不正常记录。依照相关规范规定, 该时间点气压值可利用前后分钟数据内插求得。
2 人工审核A文件疑误信息处理
2.1 能见度、云、天气现象审核要点及疑误信息处理
(1) 能见度的记录应与天气现象有机结合, 当能见度<10 km时, 应同时记录伴随的轻雾、霾等天气现象, 若能见度<1 km, 那么能见度记录中必须包含雾、沙尘暴、雪暴等记录内容。进行能见度数据审查时, 要本着及时、准确、传达到位的原则, 能见度<10 km时, 要查看记录中是否有雾、沙尘、烟雾等现象出现, 这些均是造成能见度偏低的主要原因, 但在能见度较高时, 可不予考虑这些影响因素。
(2) 观测员首先要在充分了解云的定义、特征、成因及伴随出现的天气现象等基础上, 做好云状记录, 并加强云状排序、演变等现象的关注记录。
(3) 地面观测规范规定, 天气现象的记录须保证与规范中定义特征保持一定的一致性, 存在降水的天气现象记录中应特别关注降水的起止时间, 而轻雾、浮尘、霾等造成视程障碍的天气现象, 记录要结合相对湿度、降水、风等气象要素。
2.2 质量控制码疑误信息处理
据地面气象观测相关文件规范规定, 控制段中质量控制码通常表示为3位整数, 从大到小, 百、十、个位分别代表台站级、省级和国家级, 任何一位数据出现异常, 都会造成数据格式的秩序性错误。因此, 当台站观测数据出现修改、订正或缺测时, 应对质量控制码及更正数据段格式进行有效检查, 直至正确无误。
3 结语
为保证气象观测数据的准确性、及时性和有效性, 气象工作人员须提高观测能力, 熟练掌握地面气象测报信息化数据处理技术, 保障及时、有效获取气象数据资料的完整、准确, 并进一步加快信息化数据处理技术的完善、成熟和发展, 提升气象测报水平, 为开展现代化气象服务做好保障[3,4]。
参考文献
[1]王莉.地面气象测报信息化数据处理技术研究[J].北京农业, 2014 (36) :201-202.
[2]王昕然.气象测报地面信息化数据处理技术方法分析[J].科技风, 2013 (3) :50.
[3]唐刚, 徐正芬, 郑东齐.气象测报地面信息化数据处理技术[J].农业与技术, 2013 (4) :198-199.
信息数据处理论文 篇11
关键词:大数据时代;信息处理技术;计算机系统
中图分类号: TP2 文献标识码: A 文章编号: 1673-1069(2016)111-153-2
0 引言
麦肯锡说过:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”他是最早提出大数据时代的人,而实际上,大数据时代早已来临,只是随着互联网的普及度越来越高,才会在最近越来越被人所重视和关注,在这个巨大的浪潮冲击下,发展计算机信息处理技术,才能够在大数据时代下紧跟而上,不被时代的浪潮所淘汰。
1 什么是计算机信息处理技术
现代信息处理技术基本上是指用计算机技术处理信息,因为计算机运行速度极高,而且能在自动处理大量的信息同时确保很高的精确度,计算机信息处理技术伴随着计算机的诞生而诞生,而在这些年里,它所发挥的作用也越来越巨大,越来越明显。
信息处理技术本身经历了好几个时代,从最初的手工处理,到之后的机械信息处理时期,到如今在大数据时代之中的计算机信息处理,信息的处理方式越来越迅捷和快速,甚至在很多程度上完成了信息处理的自动化。
2 计算机信息处理技术在大数据时代的作用
大数据时代有着自己明显的特点,例如数据量大,快速,复查能力,种类繁多等,数据包含的内容繁多,种类也自然是不计其数,如果没有良好的信息处理能力,必然会造成信息紊乱,甚至会产生错误信息和虚假信息等现象,在数据的传递和运输过程之中,数据还面临着各种丢失的风险,如果不能够好好的管理信息,就会造成一些不必要的损失,甚至有些会伤及根本,所以,拥有良好的计算机信息处理技术是想要站在大数据时代前列的先决条件。
2.1 信息处理技术是信息作战的重要支柱
在现代,信息处理技术的主体——计算机技术和作为信息处理工具的电子计算机已经成为了信息作战之中的重要部分,信息处理技术的提高,可以让信息的各种处理对抗实现自动化,成为协调作战的诸军,以夺取信息作战的胜利,现如今信息处理技术成为了信息作战的重要支柱,信息处理技术的应用程度,标志着信息作战程度所达到的高度。
同时,信息处理技术,如同虚拟现实技术、计算技术、显示技术、数据库技术等等方面的技术处理,推动着信息作战指挥控制方式和训练方式的变革和手段的更新,日益显示出传统的指挥控制、训练方式和手段无法比拟的先进性,它是信息作战未来的发展方向,也是必须要提前做好准备的特殊技术,想要能够在信息作战之中占得先机,就必须要在这个方面下足够的苦功夫,避免到了关键的时候产生不必要的损失。
2.2 信息处理技术是追赶大数据时代的重要工具
在进入数据时代以来,信息技术的处理就显得格外重要,在计算机和互联网快速发展的今天,大量的信息涌入了人们的日常生产生活,如果没有用一个良好的信息处理系统,很容易就会导致信息的滞怠,也会让原本就有些落后的技术更难以追赶上其他国家。
良好的信息处理技术,不仅能够加快信息处理的速度,还可以在这个基础上保证信息安全,加强计算机网络的防范,例如增强防火墙技术和加密技术等,可以让整个信息网络环境更加的安全,保护计算机和内部的信息安全。
同时,信息处理技术的优秀意味着信息的传递和交流也会变得更加的迅速,有利于彼此之间的信息沟通,加速信息的流通,可以大幅度的节约时间,增加效率,让沟通和交流变得更加快捷和安全。
2.3 信息处理技术是计算机系统的根基
信息处理技术是计算机的基础,人们对于计算机系统的管理和利用,都是通过信息系统来完成的,信息处理技术就是对信息系统的处理,在这个系统的基础上,连带的构建其他的系统和体系,当各种系统集合在一起时,才能够发挥计算机的作用,可见计算机本身就是以数据库和通信网络技术为依托,想要提高计算机的性能,就需要从根本上强化信息处理技术。
而最基本的信息在未经处理的情况下是混乱无序的,只有将这些信息进行整理和分类之后,才能够发挥出信息应有的作用,实现信息的有效储存和利用,想要发展计算机系统,就必须要做好信息处理技术。
3 大数据时代下的信息处理技术
大数据时代下的信息处理技术就是计算机处理技术,而它同样有着自己的鲜明特征,例如高效性,安全性和稳定性,而如果从功能上进行分类,大致上可以分为信息的储存技术、信息采集技术、和信息传输技术,每一个步骤都是信息处理技术之中不可缺少的,也是计算机软件发展的过程之中必然要重视的部分。
3.1 信息储存技术
互联网在大数据时代之下,内部的内容也会越来越丰富,需要保存和处理的信息也会越来越多,大量的虚拟化信息不断的溢出,对于容量的追求也就在不断的扩大,多元化的信息同样意味着更加庞大的信息容量需求,想要解决这个困境,只有提高信息处理技术,不断的增加能够处理的信息的容量,完成更多的信息保存和处理,才能避免一些重要的信息资源流失,以防造成不可估量的损失。
3.2 信息采集技术
除了信息储存的技术之外,获取信息也是非常重要的,因为在数据量不断增加的今天,海量的信息浪潮袭来,想要在这巨大的信息数量之中找到自己想要的有用的信息无异于大海捞针,计算机的处理如果不能够基于正确有用的信息来进行,那么毫无疑问是会产生负面影响的,甚至会让信息处理本身陷入一个困境当中。
另外,单纯的采集也是远远不够的,在信息采集完成之后还需要对采集到的信息进行数据上的加工,分类,将处理完成的信息提供给使用者,只有这样,才能够算是完成信息的采集处理,这是一个相当复杂的过程,如果没有一个优秀的信息处理技术,那么采集的速度必然会大幅度降低,而且,还可以提高信息采集的正确率,提供更多正确有用的信息。
3.3 信息传输技术
信息的传输技术顾名思义就是信息在不同的计算机之间通过网络连接形成信息的传输,传输的效率和传输的安全性对于计算机自身而言相当的重要,提高信息处理技术,可以有效的提高信息的传输效率和安全性,保障信息在传输过程之中不会发生意外的同时加快传输的速度,节约时间和金钱。
在现代,虚拟产业已经成为了国家经济的重要组成部分,信息的传输技术的有效发展影响着整个虚拟产业的进程,也直接关系到我国现代化和经济改革的成效,拥有良好的信息传输技术,是发展现代的信息处理技术的核心。
4 信息处理技术在大数据时代下带来的效益
在大数据时代下,信息处理技术得到了长足的进步,并且在自身的进步的同时,信息处理技术同样带来了无可比拟的效益。
首先,因为它泛用性广,节约时间,而且还能够提高信息的准确性和安全性,让企业有更多更好的时间运用到决策之中,发展了企业,带动了经济的增长,从侧面提高了我国的经济发展。其次,它还促进了我国相关行业的发展,例如计算机行业,软件行业,轻工业以及电子商务行业,越来越多的虚拟商务的研发,就意味着信息处理技术发挥着越来越重要的作用,成为我国发展过程之中的一块重要的基石。
5 总结
在未来,数据时代的浪潮必然会越来越明显,计算机信息处理技术也将会被越来越多的人所重视,研究信息处理技术在各个方面,都可以对计算机的运用和处理产生增益,并且可以节约时间,保障信息的安全,提高工作和生产生活各个方面的效率,而我国想要在大数据时代之中走上时代的前沿,计算机信息处理技术的探索和研究就是必不可少的,发展计算机处理技术,是历史的必然趋势,也是众望所归。
参 考 文 献
[1] 赵英伟,郭凯.浅谈信息处理技术的发展[J].信息通信,2014(12).
[2] 吴恩生,王桂梅.大数据时代计算机信息处理技术分析[J].江苏科技信息,2015(12).
大数据时代计算机信息处理技术 篇12
1 大数据时代计算机信息处理技术的发展要点
1.1 计算机信息处理技术的信息采集
在计算机信息处理的工作中, 首先需要进行的是数据采集, 这是整项工作的基础, 只有准确采集数据, 才能保证后续数据的处理及传输的准确性。因此, 必须加大对数据采集工作的监督力度, 做好完善的检测机制, 合理安排所采集数据的存储位置, 以确保后续计算机对数据进行提取及处理等后续工作的顺利展开。数据采集完成后, 下一步工作就是数据的加工及分类工作, 然后再将处理完后的数据传递到用户, 最终完成数据从采集到加工再到传输的整个数据处理过程。
1.2 计算机信息处理技术的数据存储
计算机有着存储量大、存储速度快等优点, 这为用户的数据存储上提供了极大便利。在用户采集及存储信息后, 人们可以按照要求直接对数据进行调取使用。但是, 就现在的计算机水平而言, 由于计算机的存储密度及存储可靠性等方面的问题, 还不能做到完全做到按照人们的要求完成数据存储, 很多地方仍有待改进。
1.3 计算机信息处理技术的信息安全
数据的安全性是企业的命脉, 每个企业都需高度重视。计算机信息处理技术的普及, 为人们的工作及生活带来了极大的便捷, 但是同时也带来了数据处理的可靠性及安全性问题。加强计算机数据信息的安全性问题, 需要做到以下三个方面。一是加强对信息安全的重视, 建立计算机信息安全体系;二是做好人才储备, 培养更多的计算机科学专业技术人才;三是加大计算机信息安全研究的投入, 开发计算机技术安全产品。当今的时代是信息时代, 信息对企业的重要性不言而喻, 如何做好信息的安全性是每个企业都会去考虑的。面对当今社会如此多的数据, 传统的信息安全技术在信息的安全性上已显得力不从心, 慢慢跟不上时代发展的潮流, 这就急需开发一种新的更好的信息安保方法, 来应对大数据下的数据安全问题。另外, 面对规模如此庞大的数据, 想要对每个数据都进行排查是不现实的, 必须要对其重点的信息进行安全检查, 并且要保证重要信息的排查不重不漏, 这样才能最大程度保证信息的安全性。
2 大数据时代计算机信息处理技术的发展方向
2.1 大数据时代云计算网络的发展
随着万罗技术的发展, 使得云计算技术应运而生, 实现了数据的云端存储。云计算网络是在计算机的网络结构的基础上实现的, 在数据处理上具有效率高、速度快等特点, 受到很多企业的关注与青睐。高效的存储能力及计算能力, 以使得云计算技术成为了计算机技术发展趋势。
2.2 大数据时代数据信息的开放式发展
在信息时代, 人们对信息的共享程度要求不断提升, 这也就带动了数据信息的迅猛发展。在大数据时代里, 数据的传输要坚持数据的开放性, 而不是互联式, 这样才能满足人们对数据的共享需求, 避免对数据处理及利用的忽略。
2.3 大数据时代互联网技术的发展
信息的处理离不开计算机技术的发展, 而计算机信息处理技术则离不开互联网技术的发展。互联网技术是计算机信息处理技术的推动剂, 加快了数据的处理及应用。因此, 在大数据时代, 计算机信息处理技术必须与互联网技术共同发展, 共同进步, 将二者不断的结合, 最终使二者融合在一起。在互联网技术的基础上, 搭建数据处理平台, 使计算机数据处理能力不断提升, 更快更好的完成对数据的处理。
3 大数据时代计算机信息处理技术发展的机遇
3.1 促进对数据价值的深层次挖掘
大数据并不是高深莫测的, 它存在于各行各业的每一个环节里。通过对行业里面大数据的不断挖掘, 能够很大程度促进行业的发展, 了解行业所处的大环境, 了解客户需求, 为企业产品设计方向提供依据, 增强行业竞争力。对数据的挖掘需要一定的学问, 它指的并不是对所有数据进行全方位的分析, 这个工作量就太大了。也不是只针对于个别的数据进行单独分析, 这样一来数据量又太少了。数据的挖掘, 做正确的做法是对大量的重点数据进行分析, 既保证了数据量, 又保证了数据提取的准确性, 最后通过该数据总结出普遍规律。数据挖掘过程一般会分为三个步骤, 一是数据准备, 二是规律总结, 三是规律表述。而在现实情况中, 企业对数据的挖掘进限于传统的查询和统计方法, 无法通过数据挖掘出隐藏的信息, 更发挥出信息的商业价值。因此, 在企业的数据处理及挖掘中, 必须采取科学有效的挖掘方式, 将信息的价值发挥到最大, 这样才能从信息中是企业得以发展, 使企业竞争力得以提高。
3.2 促进对物联网与云计算的发展
在这个瞬息万变的信息时代, 物联网技术无疑成为了社会各界发展的重点。在成熟的网络技术及计算机技术的依托下, 物联网得到了快速的发展与进步, 一个个应用开始出现在人们的生产生活中, 并得到快速普及, 如电子红包等。这些物联网引用的背后, 离不开成熟的计算机计算能力, 最终使得大数据与云技术的全面推进与普及。大量的数据通过云计算被存储到云端, 并在云平台的作用下将输出传输到用户。
4 结语
人们对计算机的信息处理能力需求不断提高, 已出现了向大数据时代过渡的趋势。如何不断去优化、去完善计算机信息处理技术, 已经成为了未来各行各业发展的重要方向。只有不断地去提升计算机的处理能力, 才能够满足人们不断增长的需求。从目前来看, 计算机已经有了很高的信息化程度, 但是在数据的管理及分析能力上仍有很大的提升空间, 需要我们不断的对其进行完善。这就要求社会各界要提升对计算机信息处理能力的重视, 加大该领域的投资及人才培养, 最终使得在大数据背景下计算机信息处理技术得到质的飞跃。
参考文献
[1]严加琼.探析大数据时代下的计算机信息处理技术[J].信息系统工程, 2016 (10) .