信息系统数据挖掘

2024-10-26

信息系统数据挖掘(精选12篇)

信息系统数据挖掘 篇1

新的信息技术, 计算机技术, 网络技术的出现为医疗信息化带来了巨大影响和技术支持, 数据仓库和数据挖掘技术在医疗信息化进程中为医院信息系统 (HIS) 建设和使用中发挥着重要作用, 数据挖掘在医院信息系统 (HIS) 中随着大量医疗数据的出现和辅助诊断系统, 远程医疗等技术形式的出现得到大量使用。本文就数据挖掘在医院信息系统的应用进行研究探讨。

技术背景

数据挖掘

随着信息技术的发展, 数据和信息大量出现和积累, 如何从存储和出现的可能含有大量冗余信息中提取有用的, 有价值的知识成为信息技术包括计算机技术和网络技术研究的重要问题, 出现了数据挖掘技术, 及其相关理论和方法用来研究这类问题。

医院信息系统

医院信息系统就是在新的信息技术, 计算机技术, 网络技术迅速发展和普及的条件下, 利用计算机和通讯设备以及网络技术, 为医院各部门提供病人诊疗信息和行政管理部门提供管理信息的收集、存储、处理、提取和数据交换的能力, 并满足所有授权用户的功能需求的信息系统。

医院信息系统信息数据的特点

随着医院信息系统的发展, 出现了大量的“以病人为中心”医疗信息数据和以管理人、财、物为中心的管理信息数据。对于这些大量出现的医院信息系统数据, 数据的收集存储处理从数据库发展到数据仓库, 信息数据的提取以及数据信息的处理, 数据挖掘技术在医院信息系统中得到应用, 辅助诊断以及远程医疗等的发展需要对这些数据尤其医疗数据进行分析, 这里介绍以下医院信息系统信息数据的特点。

海量数据

医院信息系统的发展和普及, 出现了大量的信息数据, 这些数据不仅有医疗数据, 还有管理方面的数据。大量出现的医疗数据以及管理数据不仅要满足医疗辅助诊断的需要, 随着医疗信息化的发展还要满足远程医疗和辅助教学等的需要。大量的数据存储和交换, 提取等信息处理过程, 数据挖掘技术在医院信息系统中得到应用。

多态性

这些需要医院信息系统处理的数据不仅有文字, 数字, 文本等形式的数据, 还有图片, 动画, 音频, 视频等形式的信息数据。图片有CT, MRI图像等多种形式和各种计算机图片形式, 比如jpg, bmp, dib等。医院信息系统需要处理的信息数据形式多样, 具有多态性的特点。

不规范性

大量的具有多态的信息数据, 需要以规范的形式来表述和描述。比如对于一些医学图像有DICOM标准等, 在具体的医院信息系统也有一定的规范来约束。数字、文本形式的数据也有一定规范性要求。尽管如此, 大量的多种形式数据处理要求, 不规范性问题仍然是医院信息系统需要重视的一个问题。

不完整性

由于现实条件的有限性, 使一些医疗信息不能全面地正确反应。同时主观条件的一些约束使市医院信息系统的数据存在不完整性。

冗余性

对于具体的使用, 可能仅仅需要部分或阶段的信息数据, 一些数据变得冗余, 因而医院信息系统需要处理的一些数据具有一定冗余性的特点。

面对医院信息系统的诸多数据特点, 数据挖掘技术在医院信息系统中得到应用;医院信息系统的医疗数据的诸多特点决定了医疗数据挖掘的应用特点。

数据挖掘在医院信息系统中的应用的关键技术

数据预处理:面对医院信息系统中含有海量的、不同来源、多态的包括大量模糊的、不完整的、带有噪声和冗余的原始信息数据, 在数据挖掘之前, 对这些信息进行数据预处理, 以确保数据的一致性和确定性, 以及提高医疗数据的完整性和规范性, 将其处理成适合医疗数据挖掘的形式和方式。

规范性和完整性处理:即医疗信息数据的融合技术处理。面对诸多不同来源、多态的, 多源的必须进行相应处理, 使其在属性和表现形式上趋于一致和合理。广义地称其为医疗信息数据融合技术处理, 狭义地有比如医学图像配准融合等。

医疗数据挖掘算法:医疗数据挖掘算法具有一般数据挖掘算法的特点, 又由于医疗数据的一些特点, 因为具有医疗数据挖掘的鲜明特征, 比如因医疗数据的大小, 格式而决定的医疗数据挖掘算法的鲁棒性, 适用性和实用性。

可靠性和安全性:医疗数据挖掘的数据来源必须具有可靠性的特点, 在进行医疗数据挖掘时结合数据库以及数据仓库和医疗数据的一些技术特点具有数据挖掘的数据安全性设计考虑。

医院信息系统应用数据挖掘的主要算法

医院信息系统应用数据挖掘的主要算法有分类、聚类、关联、预测、公式发现、模糊逻辑、描述和可视化等。对疾病按照种类通过建立训练集进行分类, 常见算法有决策树、神经网络、贝叶斯算法等;把具有某些相似特征的疾病或功能部门集中到一个类别中进行聚类;通过关联规则, 我们发现医院信息系统中一些医疗数据之间的关联性, 从而找出之间的联系和规律, 为疾病诊断和辅助诊断找出途径, 提供方法和手段;通过一些统计学预测方法, 及早预测出疾病的规律, 为疾病的治疗提供信息和途径;对一些临床数据, 通过公式发现摸索出规律, 并进行模糊逻辑分类;对一些医院信息系统数据进行描述和可视化, 是一种对医院信息系统数据挖掘的表示。数据挖掘在医院信息系统中的应用根据目的和目标的不同, 采用的算法相应变化, 随着新的信息技术, 统计学, 人工智能算法的发展而不断充实发展。

数据挖掘在医院信息系统中的应用意义

医院信息系统是利用现代的信息技术, 计算机技术和网络技术, 面对大量的医疗和管理信息数据进行收集、存储、处理、数据交换和提取等信息处理过程的信息系统。随着医疗信息化的进程, 面对的诸多需要处理的医疗信息数据和相应的管理信息数据, 以及随着时间推移存储的大量需要处理的数据, 提取和数据交换工作的需要和要求, 医疗数据挖掘技术在医院信息系统中得到应用。对大量的、模糊的、不确定的、不规范的医疗数据, 结合数据挖掘技术的特点, 对这些进行医疗数据挖掘具有重要意义, 是医疗数据的特点和特征要求, 也是医院信息系统进行数据挖掘适应信息化发展的要求和结果。数据挖掘技术扩展了医院信息系统的发展空间, 推动了医院信息系统数据处理的效率和方式的发展。数据挖掘在医院信息系统的应用是随着信息技术和医疗信息化发展的而出现的。医院信息系统中数据挖掘的应用, 将医院信息系统中的大量的、模糊的、不确定的、冗余的数据进行处理, 具有使医院信息系统中的数据具有高层管理、高层智能的作用, 将需要人工的工作通过数据挖掘变得清晰、确定、简洁地提供给医院信息系统的使用者, 大大减轻了使用者的工作强度。

结束语

数据挖掘在医院信息系统的应用是随着数据挖掘技术等相关技术和医院信息系统的发展而出现的, 拓展了医院信息系统的发展空间和方式, 提高了医院信息系统数据处理的效率和效果。本文就数据挖掘在医院信息系统中的应用进行阐述, 先后从技术背景、医院信息系统信息数据的特点、数据挖掘在医院信息系统中的关键技术、应用意义等方面进行了探讨, 是数据挖掘在医院信息系统应用的一份重要参考文献。

信息系统数据挖掘 篇2

前言:

近几年,我国教育规模在不断扩大,学生对于学校也提出了更高的要求,希望学校制度能够更加灵活,并且适合学生。学校需要为学生提供机房,满足学生对于学习进度、指示导向等等学习内容的要求,提高学校为学生服务质量。但是学生的这些需求对于学校机房信息管理系统都提出了更高的要求,在这种背景下,学校应该转变管理形式,提高对于数据挖掘程度,找到更多具有价值的信心,这样才能够有效提高机房管理效率,降低学校在机房信息管理上面所投入的资金及物力。

1、数据挖掘有关知识

1.1 数据挖掘

伴随着互联网技术逐渐在人们生活工作中普及,信息和数据数量快速增加,人们对于先进科学技术和自动工具都提出了更高的要求,希望能够帮助人们从繁重的信息数据管理工作中解脱出来,发现信息数据中所存在的潜在具有价值信息,进而人们提出了数据挖掘这个观念。数据挖掘其实上是从数据库及各种文件系统内发现数据信息之间所存在的潜在关联,进而找到具有价值的数据模式,这个过程被称之为数据挖掘。通过对于信息数据的整合处理分析,能够帮助管理人员制定出更加科学的战略[1].

1.2 数据挖掘常用技术

数据挖掘在实际应用中,通过都是按照任务种类进行划分,本文在对于数据挖掘研究中,就以任务类别划分作为切入点,希望能够找到一种合适的方式。

1.2.1 关联规则

关联规则主要作用就是发现数据和信息之间所存在的关联,也可以将其理解为元素满足 A 数据库的同时还满足 B 数据库。关联规则现在已经广泛应用到交易数据上面,对于交易数据分析能够推动市场稳定健康发展建设。

1.2.2 分类和预测

分类就是对于已经存在的数据进行划分,构建一个数据模型。数据模型能够有效将数据库中所存在的数据信息体现在一个类别张,完成对于数据的预测工作。数据预测主要目的就是希望能够通过原有数据判断出给定数据,对于未来的数据进行提前分析。

1.2.3 聚类规则

聚类是数据划分中经常使用的一种工作形式,在实际应用中主要是根据一定特点对于数据进行划分,主要目的就是缩短个体之间的距离。聚类在实际应用中与分类方式之间存在的差异就是,聚类在刚开始应用中不知道划分集中,也不知道应该如何进行划分[2].

2、学校机房上机管理流程设计

学校机房信息管理最为重要管理就是上机管理机房信息管理,主要是通过使用信息管理系统解决学校在机房时间开放上面存在的问题,这样保证机房开放时间能够更加科学合理。

机房管理工作主要目的就是希望能够最大程度发挥出有限机房资源所具有的价值,提高机房使用效率,满足学生对于机房使用的.需求。传统机房管理系统在调整机房上课时间与课外使用时间上面的性能较低,造成机房在使用问题还较为突出。学校机房在一定时间段内经常出现爆满的情况,学校还需要每天在机房内开展一定教学工作,这样就造成学生难以在课外到机房内学习,同时部分时间段中机房还会出现大量空余的问题。正是由于这种情况,学校必须提高对于机房上机时间的管理水平。想要提高机房上机时间管理水平,首先学校就需要对于机房数据深度挖掘,找到具有价值的数据信息,为提高机房管理提供有力的参考信息[3].

3、数据挖掘在机房信息管理系统中的实现

3.1 均值聚类法

均值聚类法是由于 J.B.Mac Queen 提出的一种新型算法,现在已经在我国工业及科学等等领域内广泛应用,成为影响力最为广泛的一种算法。均值聚类法在实际应用中更加简单实用,主要是将已经存在的数据信息进行划分,然后是聚类。正是由于均值聚类法在实际应用中是对于现实数据聚类。该算法实际应用的基础思想就是在众多数据中随机抽取一定数据,将其作为聚类核心,将与该样本相吻合的数据全部归纳在同一类中。

3.2 聚类结果分析

笔者在对于我国学校机房信息管理数据作为研究之后发现,学校上学期机房使用人员要远远高于下学期机房使用人数,使用时间主要集中在 9 月 25 号、12 月 10 号。由于学校机房在该段时间内应用人数较多,学校可以在这两个时间段前一周全面开放机房,调节在该段时间内的需要在机房中进行的课程,这样可以有效避免学生使用机房与上课之间的冲突[4].

结论:

机房信息管理系统本身就是一种十分复杂的系统,其中包含的数据拥有很多价值可以挖掘的,但是由于时间及能力有限,本文仅仅对于数据挖掘简单分析,还存在一定不足,仅供参考。

参考文献:

[1]邵波。浅析数据挖掘在高职校教学与管理中的应用研究[J].电脑知识与技术,,26:5805-5807.

[2]胡颖。数据挖掘技术在学校管理中的应用[J].自动化技术与应用,,05:23-26.

[3]黄慧芳,俞树煜,胡艳,聂胜欣。我国特殊教育信息化建设与应用现状研究可视化分析[J].现代远距离教育,,03:70-76.

信息系统数据挖掘 篇3

【摘 要】分析高校现行信息化系统的功能模型,指出其应用的局限性,提出一种基于数据挖掘的信息化系统模型。

【关键词】数据挖掘 信息化 系统模型

【中图分类号】 G 【文献标识码】A

【文章编号】0450-9889(2014)01C-0051-02

教育信息化是指在教育领域运用计算机多媒体和网络信息技术,促进教育的全面改革,使之适应信息化社会对教育发展的新要求。教育信息化的核心内容是教学信息化。为此各级教育部门,特别是各高校在过去投入了大量的财力,构建了各种信息化设施,以校园网络系统为平台,开发了教务信息系统,学生工作管理系统,招生就业系统,工资管理系统,学籍管理系统,这些系统简洁易懂、功能实用,大大地加强学校信息化管理水平,提高了工作效率。但由于历史原因,这些系统功能相对独立,扩展能力差,大多数的应用仍然限于查询、检索的简单应用上,效率低下。

经过多年的应用,每个学校的信息系统都积累了海量的数据,存储于系统中,而这些数据并没有得到充分的利用,因为大多数的信息化系统只执行了存储、查询、检索等基本功能。数据中隐藏的丰富的知识和规律并没有得到充分开发和利用,这些积累的数据就像埋藏在大山中的金矿,必须充分开发出来,为决策人员提供帮助,才能充分发挥其价值。因此通过技术手段,改进信息系统的结构和功能,使管理和应用人员能从大量的数据中挖掘出有用的知识和规律,并把这些知识用于管理决策、教学计划制定、招生就业决策、图书馆管理等。

建设信息化公共支撑环境,提升公共服务能力和水平,如何利用现有的数据,挖掘出有用的知识,为管理部门、决策人员、学生提供帮助,是信息系统的重要任务。通过充分利用数据挖掘技术处理高校信息化系统中的海量数据,挖掘出有价值的知识和规则,并将其反馈到教学和管理决策中,提升学校服务和管理能力。

本文将在分析现在信息系统的基础上,对其局限性进行分析,并提出一种基于数据挖掘的信息化模型,并分析其有效性。

一、高校信息化系统模型

(一)传统的高校信息化系统模型

当前教育信息化系统的结构如图1,包括系统硬件平台、数据存储模块、数据库或数据仓库模块、数据分析查询模块、图型用户接口五大部分,主要的功能是收集信息,通过转换,存储数据,把数据存储到数据库中,用户通过读写分析、查询模块进行操作,系统为用户提供信息的存储、共享和检索服务。随着数据的增长,信息系统存储了海量的数据,其中隐藏着大量的知识和规律,通过简单的检索是无法得到的。

图1 传统的高校信息化系统模型

(二)数据挖掘下的高校信息化系统模型

基于传统信息系统的不足,提出基于数据挖掘的信息系统改进模型,如图2所示,它是在传统模型的基础上,加入数据挖掘模块,通过它,可以从长期积累的数据中,挖掘出隐藏的知识和规律,为系统用户解决问题、管理决策提供支持,发挥信息系统的潜力。

图2 数据挖掘下的高校信息化系统模型

(三)数据挖掘模块及技术分析

数据挖掘的任务是从现有数据进行分析,通过分析,获取事先未知的知识和规律,如数据记录集合聚类分析,异常记录和赖关系(关联规则),数据挖掘的一般过程如图3所示。

图3 数据挖掘过程

数据模块中采用的几项典型技术如下:

1.聚类分析。聚类是把一组数据对象设计成一类,以便让同一类中的对象具有最高的相似性。而类间具有最大的差异性,这种方法被用于机器学习、模式确认、图象分析、信息检索等领域。

建立的每一个聚类可以看成是一类对象,通过它导出规则。聚类在教育中的应用能帮助机构组合学生个人相似的班,把学生分成类,以便使学生在一类中相互之间更相似,或者说水平更平均。

2.决策树。决策树是一种决策支持工具,它使用树型图显示可能的结果,包括概率事件结果和源的关系,成本和用途功用,它是一种方式显示一种算法。决策树常被用于行为研究特别是决策分析,去帮助识别一种策略,主要是要达到的目标;决策树作为一种描述性工具手段用于计算条件概率;决策树还可以用于分析一个机构的准入规则。同时它对小数据样也能给出好的结论。这种方法能适用于不同数量级的编目变量。

3.关联规则。反映一个事件和其他事件之间依赖或关联的知识,如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测,可以用关联规则的形式表示规则形式。

4.分类。找出描述或识别数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象。

5.回归。通过构造函数以符合数据变化的趋势,这样可以用一个变量预测另一个变量。

二、数据挖掘在高校信息化中的应用概述

在高校信息系统中进行数据挖掘称之为教育数据挖掘,教育数据挖掘的关键领域是挖掘学生的表现行为;另一个关键区域是挖掘录取入学数据;关键应用是预测学生表现和研究其学习状况,以便推出措施用于教育实践。主要应用如下:

(一)在教学评价方面的应用分析

高校信息化系统长期运行中产生了海量数据,学籍数据、考勤纪律、招生就业、奖惩等各方面的数据累积在信息系统中,通过使用数据挖掘技术可帮助教师、学生、学校管理决策者有效地利用这些数据,建设有效的评价系统。

(二)学生特征分析

根据系统中已有学生的基本信息、成绩信息、学习过程数据、偏好、知识结构等,利用数据挖掘功能分析学生特征,从获取的知识帮助学生修正自己的行为。教师利用挖掘到的知识帮助学生修正学习行为、提高学习能力。

(三)协助合理设置课程

通过对学校积累的数据使用数据挖掘技术,如关联规则,时间序列分析等相关技术,挖掘出有用的知识,寻找到影响学生成绩的相关因素,如教师因素,课程安排因素等,教学管理者可以设置合理的课程,合理安排教师组合。

(四)就业预测分析

通过对历史中毕业生的就业数据进行数据挖掘,对毕业生就业因素的相关性进行分析,如综合成绩,英语成绩,计算机成绩,是否学生干部等,对学生能否就业的影响因素进行挖掘,得出毕业生的就业预测模型,这样可以对学生未来是否能就业,对就业作出预测,对就业好的学生类型推广,对不易就业的学生类型,修改培养方案和模式。

(五)图书馆应用

图书馆是高校的信息服务机构,馆内具有大量的信息,经过多年的运行,这些信息以海量计,可以通过数据挖掘技术对数据进行处理,为师生提供更好的服务。

数据挖掘可以对读者类型、文献类型、借阅次数等方面的信息进行挖掘研究,提高检索速度,通过改进信息检索程序来提高信息检索的速度和有效性,为不同的读者提供定制服务,拓展服务方式,提高服务质量。

教育数据挖掘已经成为热门的研究领域,因此很多为数据挖掘开发的工具也不断出现。数据挖掘技术在学校中能帮助我们去发现学生的表现,学生的学习习惯,帮肋课程设置,激励学生,挖掘出学生分组的依据,帮助就业决策;同时也发现,现行的数据挖掘工具对教育工作者来说太复杂。如何开发一种简便的算法工具,使之能应用于不同的任务,并能设置自由参数,简化应用,使非专业人士可以应用是急需解决的问题。

【参考文献】

[1] 刘琼梅.浅谈数据挖掘在高等教育信息化中的应用研究与展望[J].福建电脑,2010(4)

[2]陈洁.校园信息化建设应用的数据挖掘研究[J].科技风,2012(9)

【基金项目】新世纪广西高等教育教学改革工程立项项目(2012JGA384)

【作者简介】尧有平(1964- ),男,广西电力职业技术学院副教授,研究方向:计算机技术、数据库技术、数据挖掘技术;陈星豪(1980- ),男,CCF会员,硕士,广西电力职业技术学院讲师,研究方向:计算机技术。

基于数据挖掘的物流信息系统研究 篇4

现代物流系统是一个复杂的系统, 包括运输、仓储、配送、搬运、包装和物流再加工等诸多环节, 信息流量十分巨大。巨大的数据流, 使得企业很难对这些数据进行准确、高效的收集和及时处理, 因此决策者也就很难做出快速、准确地决策, 实现对物流过程的控制, 降低整个过程的物流成本。随着知识经济和现代信息技术的迅猛发展, 信息技术特别是网络技术的发展, 为物流发展提供了强有力的支撑。物流管理信息系统是企业信息系统和企业信息化的基础, 能够利用信息技术对物流中的各种信息进行实时、集中、统一管理。

1 数据挖掘技术

1.1 数据挖掘

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的、数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它从已知数据集合中发现各种模型、概要和导出值。数据挖掘不是统计学、机器学习以及其他方法和工具的随意应用, 它不是在分析技术空间里面乱闯, 而是一个精心策划和深思熟虑过的, 决定什么才是最有用的、最有前景的和最有启迪作用的一个过程, 是知识发现的关键步骤。

数据挖掘的对象根据信息存储格式分类有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及Internet等。

数据挖掘的主要技术有集合论法、决策树法、遗传算法、神经网络方法等。集合论法又分为粗 (糙) 集理论方法、概念树方法、覆盖正例排斥反例方法等。决策树法又分为ID3算法、CLS算法、IBLE算法等。遗传算法又分为分布并行遗传算法、进化算法等。

1.2 数据挖掘的流程

1.2.1 确定业务对象

清晰地定义出业务问题, 认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的, 但要探索的问题应是有预见的, 为了数据挖掘而数据挖掘则带有盲目性, 是不会成功的。

1.2.2 数据准备

(1) 数据的选择:搜索所有与业务对象有关的内部和外部数据信息, 并从中选择出适用于数据挖掘应用的数据。 (2) 数据的预处理:研究数据的质量, 为进一步的分析作准备, 并确定将要进行的挖掘操作的类型。 (3) 数据转换:讲数据转换成一个分析模型。这个分析模型是针对挖掘算法建立的, 建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。

1.2.3 数据挖掘

对所得到的经过转换的数据进行挖掘, 除了完善从选择合适的挖掘算法外, 其余一切工作都能自动地完成。

1.2.4 结果分析

解释并评估结果。其使用的分析方法一般应作数据挖掘操作而定, 通常会用到可视化技术。

1.2.5

将分析所得到的知识集成到业务信息系统的组织结构中去。

2 数据挖掘在物流信息系统中的应用

随着集成化物流管理信息系统的建立, 以及网络技术、EDI、人工智能、条形码与POS等各种先进技术的应用, 物流信息的商品化、物流信息收集的数据库化和代码、物流信息处理的电子化和计算机化, 把挖掘到的规则与物流管理各方面有机地结合, 就能极大地提高企业的竞争力。物流决策系统是一种结合了数据挖掘技术和人工智能的新型经营决策系统, 主要通过人工智能对原料采购、加工生产、分销配送到商品销售的各个环节的大量信息进行采集, 并利用数据仓库和数据挖掘技术对其进行分析处理, 并据此确定相应的经营策略。

2.1 数据仓库的建立

数据仓库作为数据挖掘的基础, 不同于传统的联机事务处理系统, 它具有面向主题的、集成的、不可更新以及随时间变化的特性。各个联机事务处理系统作为数据仓库的原始数据源, 以文件方式提供企业在日常活动中收集的包括定货单、存货单、应付账、交易条款、客户情况等在内的大量数据资料和报表, 同时还有大量的外部信息等数据。数据仓库通过ETL过程 (抽取、转换和加载) 处理这些接口文件, 并且按不同的主题域组织、存储和管理这些客户数据。通过数据仓库接口, 对数据仓库中的数据进行联机分析和数据挖掘。在建立完成企业级的信息数据仓库之后, 可以基于这个数据仓库平台进行数据挖掘工作。

2.2 基于数据挖掘的物流信息系统的体系结构

基于数据挖掘的物流信息的体系结构主要由以下几部分组成:

2.2.1 物流信息收集与处理:

记录物流管理活动中的各类信息, 对物流活动的各种信息进行采集、处理、传输, 并按照统一的格式存入到数据仓库。

2.2.2 数据挖掘的物流信息管理系统:

把收集得到的数据汇总到数据仓库, 再根据数据挖掘送来的数据, 为管理决策人员提供最新的和最有价值的信息或知识, 帮助其快速、正确地做出决策。

2.2.3 数据挖掘:

根据决策者提出的问题特点, 确定挖掘的任务或目的, 对数据仓库中的相关数据进行精简和预处理, 再从精简后的数据中挖掘出新的、有效的新知识, 提供给数据挖掘的物流信息管理系统, 由它给决策者提供有效的知识。

2.2.4 知识库:

包括基于部门的数据仓库的组成结构、隶属函数等知识。

2.2.5 开发人员和专家接口:

开发人员和专家通过这个接口对知识库中的知识进行定义和维护。

2.3 基于数据挖掘的物流信息系统的的功能模块

数据挖掘物流信息的体系结构主要由以下几部分组成:

2.3.1 采购进货管理系统

采购进货管理系统是数据挖掘物流信息体系的重要组成部分, 是物流管理的起始阶段, 包括向厂商发出订购信息、接收厂商的发货、采购决策、存货控制、采购价格管理等信息管理子系统。在对采购进货管理系统进行数据挖掘时应主要采用基本统计分析方法, 依据现有样本的数量接受厂商的发货, 依据样本价格估计总体价格。

2.3.2 销货出货管理系统

销货出货管理系统主要负责对客户的需求类型及爱好进行收集、整理, 记录好客户的购买情况以及各种类型的销售情况, 确定好合理的销售价格, 处理好应收货款及退款等。回归分析在销货出货管理系统中应用的最为广泛, 分析客户的需求及爱好, 根据客户的购买情况确立销货出货与收货款及退款的关系, 确立回归方程, 利用回归方程对相关内容进行分析。

2.3.3 库存储位管理系统

库存储位管理系统包括储存货管理、进货订货管理等功能子系统, 根据货存情况及时作出决策, 保证货品的供应量以及流通加工的顺利进行。

2.3.4 财务管理系统

财务管理系统主要功能是对采货、进货以及销售管理所形成的应付、应收账进行会计操作, 对整个物流中心的资金进行平衡、测算和分析, 编制财务报表, 做好银行转账工作, 保证资金周转以及整个物流管理顺利进行。

2.3.5 运输配送管理系统

运输配送管理系统主要包括出货配送管理、运输调度计划、分配计划等功能子系统。

2.3.6 物流分析系统

其主要功能是应用相关技术对整个物流运作模式进行分析, 完善物流运输方案。

2.3.7 物流决策支持系统

物流决策支持系统的功能主要是在深入了解内部各系统业务信息和外部信息的基础上编制各种报告, 提供分析图表。通过建立决策支持系统, 及时地了解和掌握商流、物流、资金流和信息流所产生的信息, 综合运用数据挖掘工具对历史数据从多角度、多方位进行分析, 实现对物流中心的资源的综合管理。物流决策支持系统应综合利用相关分析与时间序列分析两种方法, 根据内部信息和外部信息综合分析物流的运作情况, 对物流运作的历史数据进行全面分析, 根据过去预测未来, 实现物流的顺畅运作。

3 关键技术分析

基于数据挖掘的物流管理信息系统的关键技术主要包括数据仓库、数据挖掘、数据分析工具等。

3.1 数据仓库技术。

数据仓库是来自多个源的数据的存储库, 它可通过Internet将不同的数据库连接起来, 并将数据全部或部分复制到一个数据存储中心。数据仓库倾向于一个逻辑的概念, 它建立在一定数量的数据库之上, 这些数据库在物理上是可以分开的。数据仓库通过Internet打破地域界限, 将它们合成一个逻辑整体, 把一个海量的数据库展现在用户面前。数据仓库管理系统的一项重要工作是实现对传统数据库进行提取、清理和转载到数据仓库中。

3.2 数据挖掘技术。

这是整个系统的难点和重点, 主要涉及模式模型和挖掘算法。目前, 己形成了多种数据挖掘方法, 如分类知识发现、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常发现、趋势预测等。各种方法均有它一定的优点, 也有它的不足。几种技术并不是单一的使用, 而是根据实际情况综合的加以应用。现在一些流行的数据挖掘工具一般都包括了几种方法。

3.3 数据分析工具。

数据仓库虽然存有大量数据, 但提供辅助决策的信息需要利用各种分析工具, 如联机分析处理 (OLAP) 工具、统计分析和查询优化工具等。这些工具的性能对管理决策的效果有着重要的影响。目前已出现具有智能功能的强大的数据分析工具, 这些分析工具不仅能在系统运行时采集和处理数据, 同时也支持对其他业务系统的数据进行采集。

参考文献

[1]刘同明.数据挖掘技术及其应用[M].北京国防工业出版社.2009.

[2]Margaret H, Dunham.数据挖掘教程 (郭崇慧, 田凤占, 靳晓明等) [M].北京:清华大学出版社.2005.

[3]陈京民.数据仓库与数据挖掘技.北京:电子工业出版社.2007, 48-65.

地理信息系统数据字典生产研究 篇5

地理信息系统数据字典生产研究

本文以数据字典生产为研究对象,深度探讨了数据字其的概念、作用、存储方式、内客和标准,是对数据字其生产的一个较为全面的诠释,相信本文的.研究对从事相关工作的同行有着重要的参考价值和借鉴意义.

作 者:程雷  作者单位:61512部队,北京,100088 刊 名:科技资讯 英文刊名:SCIENCE & TECHNOLOGY INFORMATION 年,卷(期): “”(20) 分类号:P2 关键词:地理信息系统   数据字典   标准  

企业信息系统数据备份模式初探 篇6

关键字:信息系统;数据备份;数据同步

中图分类号:TP309.3文献标识码:A文章编号:1007-9599 (2010) 09-0000-01

Enterprise Information System Data Backup Mode

Ma Xingtao

(Automation Institute of Lanzhou Petrochemical Company,Lanzhou730060,China)

Abstract:At present,the enterprise information system has been integrated into all aspects of production,which is playing an increasingly important role.Development of information systems applications,help to improve the efficiency of enterprises in the production,on the other hand to promote the business right trandition system reform.However,no matter which side of the promotion,the data stored in information systems,enterprise-wide production activities are important,if the abnormal loss of data,then the impact on business is fatal.Based on the above issues,this article will start on the enterprise information system data backup model some of the preliminary study.

Keywords:Information systems;Data backup;Data synchronization

一、概述

信息系統的部署架构一般有两大方式,一是集中部署,二是分布式部署。本文将重点对集中式部署的信息系统的数据备份模式做一些探讨。采用集中的部署架构,一般会建立两个数据环境,即生产环境和灾备环境。

二、数据备份

在主环境内,采取如下手段以提高系统可用性:数据库群集、Web应用负载均衡、SQL Server数据库备份及专业软件备份。

(一)数据库群集

通过使用SQL Server 2008 Cluster技术,可实现数据库的双机热备,即主数据库服务器出现问题时,备用数据库服务器可自动判断出主库的出错状态,并接管数据库以提供服务,这个过程仅持续几秒钟,用户基本感觉不到,是一个全自动的过程。对于数据库群集来说,共享存储故障将是该方案的唯一单点故障。

(二)Web应用负载均衡

通过负载均衡技术可带来两个方面的好处。

1.可分担服务器压力,提高应用程序性能。

2.可提高系统的可用性,当某台服务器发生故障时,可将所有访问自动均衡至其他服务器。可采用基于软件的负载均衡技术(Micorosft NLB)或基于硬件的负载均衡技术(负载均衡交换机)。

信息系统中通过负载均衡可提供的服务包括:定制开发的系统网站、MOSS网站、各类Web Services服务。

(三)专业软件定时备份

以上两种手段都存在一个共同的缺陷,即:如果他们所依赖的统一存储设备出现重大故障,将导致提供冗余和热备的服务器同时失效,整个系统将不可避免的整体瘫痪,更严重的是,如果存储设备无法修复,则数据将彻底丢失,为企业带来重大损失。

因此采用专业备份软件(Data Protector 6.1),可实现将重要数据周期性备份至其他存储设备内。根据系统的特点,可灵活设计备份策略,这里只是一种通常的做法。

(四)SQL Server数据库备份

DP备份将数据备份到磁带上,可以保证数据在物理上的安全,但在系统发生异常,需要快速恢复数据的时候,DP由于需要从磁带上读取数据,导致恢复速度不能很快,因此一般采用DP+SQL的双备份模式,来完成数据的备份工作,以保证系统在异常情况下的数据安全和快速恢复。

三、数据同步(主备环境间)

针对主备环境,需要确保备用环境的数据、服务均与主环境保持一致,以便随时代替主环境对外提供服务。为保证两个环境的一致,设计从两个方面考虑:

1.业务数据、与部署环境无关的配置数据和定制开发的应用程序需在主备环境间进行同步。

2.与环境相关的数据和产品类应用程序需在备用环境中单独部署或生成。

(一)SQL Server数据库镜像

“数据库镜像”是用于提高数据库可用性的主要软件解决方案。数据库镜像维护一个数据库的两个副本,这两个副本必须驻留在不同的SQL Server数据库引擎服务器实例上。其中一个服务器实例使数据库服务于客户端(“主体服务器”),另一个服务器实例则根据镜像会话的配置和状态,充当热备用或温备用服务器(“镜像服务器”)。同步数据库镜像会话时,数据库镜像提供热备用服务器,可支持在已提交事务不丢失数据的情况下进行快速故障转移。

(二)定制开发的同步

主站点、各类Web服务和应用、各类自行开发的服务等,由于这些应用本身并未像数据库一样提供了自带的数据同步功能,因此需要自行开发数据同步服务,采取定时同步策略保证主备环境间的数据一致。

(三)独立部署

除需要进行同步的数据外,还有一些和环境相关的或无法进行同步的应用程序和数据,它们需要在备用环境中单独部署,具体包括:

1.应用程序:MOSS服务、索引/查询服务、报表服务、DP服务等。

2.数据库:索引数据库、MOSS配置数据库。

四、总结

数据的安全对企业信息系统而言是重中之重,但在实际工作中,难免有数据异常丢失的情况,那么科学的做好数据的备份,能及时恢复数据,就是信息系统的成败所在。希望以上一些浅显的分析,能给大家的实际工作一点点启示。

参考文献:

信息系统数据挖掘 篇7

近年来,计算机信息技术,尤其是数据库管理技术在医学领域得到了广泛应用。由于生物医学工程的发展和测量仪器技术的提高,使大量医学信息被精确记录下来,海量的数据资源涵盖了医学领域的各个方面。目前,医院信息系统已经能够比较完善地实现基本信息的生成、存储、传输和管理等基于数据库技术的操作型事务处理。不过,从医疗技术与医学发展的要求看,急切需要在复杂查询的方法和效率上进行质的提高,以发现数据中存在的关系和规则,挖掘出数据背后隐藏的有价值信息和知识,并根据现有的数据预测未来的发展趋势。数据挖掘技术为解决这些问题提供了一个良好的途径。

数据挖掘(Data Mining)也称数据库知识发现,是指从大型数据或数据仓库中存在的、大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含的、事先未知的潜在有用的信息和知识的高级处理过程。数据挖掘多处理的原始数据可以是结构化的,如关系数据库或面向对象数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至可以是分布在网络上的Web数据和异构型数据。发现知识的方法可以是数学的或非数学的,还可以是演绎或归纳的。获取的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。数据挖掘的支撑技术是数据库技术和人工智能技术。其中,数据库技术侧重于对高效数据存储处理方法的研究,并对数据进行前端的结构化处理;而人工智能技术则着重于从数据中高效、准确地提取知识的研究方法。事实数据挖掘的过程则需要完成关联规则、序列模式、分类规则、聚类规则等一系列的定义,并利用决策树、神经网络、模糊推理、统计分析等方法得到感兴趣的结果,还需要运用信息可视化技术将结果表现出来。

本文以一个在线医院信息数据采集、执行引擎、分析结果处理和查询的基础平台构建为基础,探讨了如何实施医院信息与数据挖掘相结合的在线数据挖掘的技术。

1 构建在线数据挖掘平台的技术路线

1.1 目前医院信息管理系统存在的问题

在长期的应用中,医院引入了大量的不同时期、不同技术的应用系统和软件,影响了数据挖掘平台构建时所采取的平台与技术,如:

(1)数据分散目前,国内医院已经完成了基础信息系统的建设和各类应用软件系统的使用,如HIS、PACS、OA以及质量控制系统、患者查询系统、体检信息辅助分析系统等。调查表明,多数应用系统相互独立,不能直接进行数据交换。

(2)数字鸿沟在形成新数据集的同时,数据挖掘系统的数据来源主要是大量的历史性数据,而采集这些数据时需要与诸多不同结构的数据源进行连接,这就涉及到多种甚至异类的数据类型的转换问题,需要解决如兼容性、数据格式以及字符编码等一系列问题。

数据挖掘系统的核心是对数据的综合分析与计算,其运行参数或计算分析方法需要参考业务系统中的业务逻辑来确定最佳的分析方法。因此,系统必须与各业务处理子系统交换数据并动态产生某些参数或分析逻辑,这是一个非常复杂的交互过程,需要根据实际的业务系统进行研究,并抽象出业务逻辑或规则提供给数据挖掘软件引用。当数据挖掘软件将分析结果呈现出来时则要解决多维数据的可视化表达等问题。

1.2 数据挖掘的基本框架

医疗信息系统中的数据挖掘应用模式类似于传统行业数据挖掘的通用模式,即数据的获取、处理、解释评价,最终得出海量原始数据中蕴含的规律,并利用知识和规则的过程。图1为数据挖掘系统框架。

1.3 基础支撑软件选型

在线数据挖掘技术建立在数据挖掘软件和高级程序运行平台之上。目前,实现数据挖掘的主要软件系统有Clementine、Enterprise Miner、Intelligent Miner、Mineset、Modell、ModelQuest、PRW、NeuroShell、OLPARS、S-Plus和一些开源免费的挖掘软件等。分析和比较这些系统提供的二次开发接口和整合能力,确定选择SPSS Clementine作为基础的数据挖掘软件。

目前,高级程序运行平台主要有Microsoft的.net平台和Sun的Java平台。考虑到Java平台有诸多的免费产品和良好的可移植性,选择以Java平台作为高级程序运行的支撑环境。

2 在线数据挖掘平台的结构

2.1 技术框架

在线数据挖掘技术的框架如图2所示:

框架的软件系统包括如下的3个层次:

(1)操作系统层可以是Windows或Unix系列的操作系统。

(2)基础软件层由SPSS Clementine和Java平台组成。这里,Java运行环境作为基础部件,提供各种应用程序调用接口,包括输入输出操作(I/O)、数据库访问和本地调用等。各模块统一将数据、分析方法要求、参数传递到SPSS Clementine,SPSS Clementine根据指定的要求进行计算和分析,最后由运行程序取回原始的分析结果。

(3)应用层提供用户操作界面和调用其它应用程序模块,控制完成整个数据挖掘计算分析过程。

完整的应用系统程序部署到接入Internet或局域网的服务器上,各终端用户可通过浏览器完成自己的数据计算和分析工作。

2.2 关键技术

(1)Java平台作为目前的主流技术体系之一,Java平台可用来在网络计算机系统中发布和运行高交互性、动态、安全的Java小程序和应用程序,通过虚拟机技术可将应用程序移植到支持Java虚拟机的任何一种操作系统之上。

(2)WebWork框架作为一种组件化和代码可重用的Pull式MVC模式框架,WebWork能够清晰地将Web层和业务层区分开,为B/S和C/S应用程序提供接口,且分别在系统资源消耗和容器的简单性,与C/S应用程序接口方面优于J2EE和Spring框架。

2.3 技术实现的逻辑结构

在线数据挖掘技术实现的内部组成有5个部分,如图3所示:

(1)数据采集通过上传文件方式接收用户提交的数据文件。

(2)数据处理完成对数据的过滤。

(3)执行引擎传递数据和执行参数到SPSS Clementine,执行分析计算并输出计算分析结果。

(4)执行结果处理将SPSS Clementine产生的图表或图片序列化,保存并准备输出。

(5)可视化操作环境以Web方式为用户提供一个可视化用户界面和操作环境。

3 技术实现描述

3.1 数据采集

用户通过Web界面上传Excel数据文件到服务器,由运行模块分析Excel表中的数据,约定将第一行内容读出作为变量名,在数据分析中作为输入或输出的变量。

3.2 数据处理

程序对数据文件进行分析和处理,提取出文件中的字段结构,根据用户选择的字段作为输入/输出参数或X轴/Y轴。

3.3 执行引擎

执行引擎是实现技术中的核心部分,体现在实现数据输入输出的控制、分析方法的灵活确定、数据挖掘脚本的生成等功能。

(1)数据挖掘脚本组成

运行程序实时创建一个执行的脚本,传递给SPSS Clementine,让其根据脚本中的内容来执行每一步分析结果。用户仅需要在操作界面上设定好分析的步骤即可完成简单的数据挖掘工作。一个脚本主要包括以下几个部分:

(1)数据来源,准备好要分析的数据库的基本连接信息,明确分析的数据表、视图或者是根据某个SQL语句产生的数据结果。

(2)输入/输出参数或X/Y变量的确定。

(3)分析模型,选择模型对数据进行计算分析,如神经网络、决策树、时间序列等方法。

(4)输出结果,设定好Clementine计算分析输出文件路径和格式,待计算完成后,执行引擎将分析结果取回。

(2)数据挖掘脚本生成

在完整的数据挖掘分析过程中,有多个节点类型,每种类型又有不同的实现方式和个性,需要抽象出节点的公用性和分析算法的公用接口方法,针对不同的节点实现不同的抽象方法。当用户在界面上操作时可选择不同的节点组合在一起,选择时可设置某节点的个性化参数,最后统一抽象执行该方法并将对象连接起来生成执行脚本。

3.4 SPSS Clementine

执行引擎动态生成执行脚本后即可调用SPSS Clementine进行计算分析,再将分析结果取回进行结果处理和可视化显示。

执行引擎在每次执行计算时,都从线程池(Thread pool)中取出一个管理线程,赋予新的分析请求对象,该线程启动一个新的Clementine分析进程。复杂的计算和分析数据工作由分析进程完成,同时受到管理线程的监控。分析进程计算完成后,管理线程将分析结果取回并保存到数据库。分析进程中途出错,则将详细的错误日志信息通知用户,提示用户检查数据或分析方法的参数是否正确。分析过程完成后,管理线程将分析请求对象清除,放到线程池中以达到重复使用的目的。

4 结束语

在线医院数据挖掘利用Java网络编程语言,初步整合了SPSS Clementine,实现数据采集、执行引擎、分析结果处理和分析结果查询的基础功能流程。通过一个在线医院信息数据采集、执行引擎、分析结果处理和分析结果查询的基础平台的构建,为实现医院信息与数据挖掘相结合的在线数据挖掘技术从海量医学记录中发现有价值的医学知识,对提高医院管理水平和降低医院运营成本具有重要的应用价值。

摘要:根据当前信息领域内普遍存在的“知识发现”问题的迫切需要,文章以SPSS Clementine环境提供的功能为基础,研究了构架医院信息系统中的在线数据挖掘平台的方法,并通过实际构建该系统,对基于医院信息系统现状实现在线数据挖掘进行了有益的尝试。

关键词:医院信息系统,数据挖掘,SPSSClementine

参考文献

[1]贺利坚,等.数据库技术与应用.北京:中国宇宙出版社,2002.

[2]周爱华,郑应平,王令群.医学数据挖掘综述[J].中华医学实践杂志,2005,4(2):126-128.

[3]姜代红.数据挖掘及其在HIS系统中的应用[J].电脑与信息技术,2004(2):55-57.

[4]Jiawei Han,MichelineKamber.数据挖掘概念与技术(第2版)[M].北京:机械工业出版社,2006.

信息系统数据挖掘 篇8

1 概念解释及应用分析

1.1 检验信息系统(CLIS)

检验信息系统(CLIS)是医院信息系统的一个重要组成部分,其主要功能是将检验的实验仪器传出的检验数据经分析后,生成检验报告,再通过网络存储在数据库中,使医生能够方便、及时地看到患者的检验结果。CLIS数据主要包括申请信息(病人基本信息,申请项目信息)、报告信息(结果信息)、其他信息(质控信息等)。在病人住院过程中会产生大量的检验信息和其它与病人相关的数据,整个医院的检验数据更是一个海量概念,一个拥有1500张病床的医院每年至少产生1000万条检验项目。如何充分利用这些医学数据和医生诊断经验,在计算机的帮助下,发现隐藏在这些海量数据背后的那些新的有学术价值的医学信息是CLIS系统面临的重大课题。在这里数据挖掘(Data Mining)就有了应用价值[2]。

1.2数据挖掘

数据挖掘又被称为知识发现(KDD,Knowledge Discov-ery in Database),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,发现隐含的、规律性的、人们事先未知的、但又是潜在有用的、并且最终可以理解的信息和知识的过程。

数据挖掘是对新知识的发现的一种技术手段,我们需要对数据进行挖掘。从商业需求的角度来看主要有三种原因:(1)大量数据被收集和保存在数据库中;(2)计算机已经变得越来越廉价,而功能则日益增强;(3)日益剧烈的商业竞争的压力。从技术的角度来看也有三种原因:(1)数据的存储和收集更加高速;(2)传统的技术对于这些大量的原始数据是不能胜任的;(3)数据挖掘能够帮助科学家分类和划分数据[3]。

1.3 数据挖掘过程[4]

1.3.1 确定业务对象清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。

1.3.2 数据准备(1)数据的选择搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据;(2)数据的预处理研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型;(3)数据的转换将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的,建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键;(4)数据挖掘对所得到的经过转换的数据进行挖掘,除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成;(5)结果分析解释并评估结果,其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术;(6)知识的同化将分析所得到的知识集成到业务信息系统的组织结构中去。

2 数据挖掘的实践应用

血糖(GLU)指标是医疗上重要的检验指标之一,检验科、医院,或者医疗组织、研究机构都想知道GLU的高低和人群特征的关系,以及人群的特征分布情况。

把要研究的GLU样本数据想象成地图上的城市,研究的最终结果是要在地图上面画圈,画出自己感兴趣的、具有明显特征的区域。而且由于人群的区域特征,检验参考值的设置可能需要根据数据挖掘的结论进行调整。因为人群的食物特点、体质、污染、民族、地区性等都会影响指标变化,如果用固定的框架来观察变化的人群,显然是有问题的。国家的标准不是各地都是适合的。采用数据挖掘技术进行相关研究得出相应结论,就可以将检验参考值范围设置的更加精确和科学,更加适合本地区人群的特征。

2.1 数据准备

此次应用数据范围为本院检验信息系统中2004年8月21日到2007年10月25日的非住院病人的GLU指标数据(不包括质控数据、结果为空、年龄类型小于1岁的数据)。剔除住院病人的原因是让数据样本尽量接近普通人群。通过整理,要分析的原始数据为78638行,如表1所示。

2.2建立数据结构模型

划分特征是本实践最主要的工作,在这里我们选择聚集算法。微软聚集算法是一种期望方法,它使用迭代完善技术将记录分组到附近区域(聚集),以展示相似、可预测的特征。在微软提供的算法库里(SQL server 2005Analysis Servicesr)提供了相应的工具可供使用。建立数据结构模型如图2所示。在这里,数据源来自olap_glu表。其中Id是主索引,自动唯一标识。Brxb(病人性别),brnl(病人年龄),gdbj(高低标记)是要进行聚集分析的三个字段。可以看到,图2左上角的字段图标里面有箭头和钻石标志,是输入和可预测列,意思是不仅是作为输入的数据,而且也是分析的对象。这些数据都是来自于CLIS的原始数据表,只是根据工作的需要进行筛选。

2.3利用关系挖掘模型编辑器进行数据展现分析

将筛选后的数据导入数据仓库即专门用于分析的数据库中。采用微软Analysis Services提供的管理数据仓库的工具进行管理和维护,并建立多维分析模型和数据挖掘模型。上面实例处理的结果如图3所示。

通过对数据仓库的计算,按照默认方式定义了10个簇,每个簇代表了不同的概率,得到了如图3所示的10个矩形表示的结果。其中颜色浅的区域是低特征概率,颜色深的区域是高特征概率,黑色区域为最高特征概率。该实例中黑色区域代表了GLU的检验值与病人性别的特征集。图3中,程序右下角显示的是节点路径,从节点路径我们可以看到数据的特征。这一簇中,有5214的事例,其中男性占了82.68%(比例是所在簇的粗体性别所占当前簇的比例)。对该节点路径的描述就是:病人性别为男性的,年龄在36至81岁之间,血糖偏高。

观察这一簇的其他信息,把所有的明显特征都记录下如表2所示。

通过对表2分析,我们可以初步得出:总体人群中,男性的特征比较明显,而且大于36岁的男性血糖高是明显特征;女性载21~24岁中血糖稳定性比较好。

现实中实例情况是非常复杂的,要观察的数据也不规则。上述实例也有很多特征值没有获得那,么可能需要更多的样本数据以及需要关联更多的条件进行分析。

3 应用总结

从原始数据中发掘知识,为科研、管理、决策等服务,数据挖掘技术开辟了一个非常有价值的领域。通过以上实例分析,我们认为数据挖掘在检验信息系统中有以下几方面应用:(1)对检验指标进行分析,建立专家知识库系统,建立新的疾病诊断体系;(2)将大量诊断数据进行分析发现内在联系,提高诊疗水平;(3)对工作人员工作情况进行数据分析,提高管理控制;(4)加强检验科的管理并为医院管理决策服务;(5)数据挖掘技术全方面应用将给医院管理运行、临床医学、决策支持等方面带来极大效益。

摘要:随着信息系统的发展,堆积了越来越多的数据。在介绍和分析检验科信息系统和数据挖掘的概念基础上,论述了数据挖掘技术在检验科信息中的具体应用。

关键词:数据,数据挖掘,检验信息系统

参考文献

[1]李丰森,李兵.基于医院信息系统的数据挖掘技术研究.卫生职业教育,2009(16):132.

[2]苏凯,李伟鹏等;基于分类和聚类的数据挖掘技术在CLIS中的应用研究;医疗卫生装备;2005(6):15.

[3]张大雷.浅析数据挖掘技术.电脑知识与技术,2005(6):4636.

信息系统数据挖掘 篇9

关键词:医院信息系统 (HIS) ,数据仓库,信息化,数据挖掘技术

随着数字化时代的进步, 医疗行业广泛地应用数字医疗设备, 而如今信息化社会带来的电子信息技术也推动了医疗行业的信息化建设, 其中一项表现为医院信息系统 (简称HIS) 的应用。而当下医疗机构中的计算机数据容量正在日渐增大, 对医务人员的工作效率带来一定负担。因此, 海量数据的良好储存及其高效检索必须得到妥善解决, 数据库技术的广泛应用可以处理这一问题。然而, 在这海量计算机数据中, 我们常常没办法辨认出所需的有用信息, 于是数据挖掘技术应运而生, 而且已经成长为一个必不可少的过程。

1关于数据挖掘技术的特点和功能

1.1数据挖掘的特点

数据挖掘技术包含四个主要特点, 体现为:第一, 需要处理海量的数据;第二, 可以为计算机用户提供精确的、有用的数据信息;第三, 数据挖掘的运用可以统计规律, 其中大量的规则也可以找到;第四, 通过数据挖掘技术找到的规则可以在数据库日益更新的过程中得到相应更新, 这体现了数据挖掘的进步意义。

1.2数据挖掘的功能

数据挖掘技术具有几项主要的功能, 涵括如下:第一, 数据挖掘技术可以进行信息的概念描述, 即对一类信息的内涵进行描述, 并且概括其特征, 使某一对象概念具有形象性的描述;第二, 数据挖掘技术可以进行数据的关联分析, 即对某一数据中的一些变量规律进行辨认追循;第三, 数据挖掘技术可以基于对象的属性而建立相应类别;第四, 数据挖掘技术能够通过以往的数据资料来建模, 在最新数据基础上来预测将来的数据, 得到具备可能性的属性值及其相应的范围;第五, 数据挖掘技术可以在预测基础上做出趋势分析, 找寻出一定时间内的数据规律及其代表的趋势;第六, 数据挖掘技术具有聚类分析的功能, 即将具备相同特征的对象规划为相同类别, 从而对其聚集的相关数据进行解析;第七, 数据挖掘技术具有孤立点分析功能, 可以找寻出数据库中异于一般模型或者行为的相关数据;第八, 数据挖掘技术具有偏差分析功能, 即在描述极端性或者差异性对象的情况下, 将与常规存在偏差的异常现象揭露出来。

因此, 在信息系统中, 一般通过数据挖掘软件在数据仓库中将所需有用信息提取出来, 从而在对其进行统计、综合以及推理, 找寻其中的关联性, 并且进行更精准的数据分析, 以更科学地预测某个行业的业务趋向。

2医院信息系统中的数据挖掘技术对患者应用

根据上文所述, 在医院行业中, 信息系统的数据挖掘技术可以为医院的管理决策提供更佳的策略与支持, 其应用具体体现在以下几个方面。

2.1医院患者结构分析

医院就诊患者构成具有多样性, 患者的来源、身份、年龄或者职业等相关信息数据在输入计算机信息系统后, 都可以通过数据挖掘技术来进行结构分析, 得到上述几项内容的分布信息, 有利于医务人员对患者进行针对性的服务, 可以有效提高医疗服务质量, 提高患者满意度[2]。

2.2医院患者就诊时间分析

就诊时间包括患者挂号直至离开的就医时间, 数据挖掘技术可以在信息系统中进行就诊时间分析, 形成直观的时间分布, 从而科学地安排患者的就诊, 以减少患者的排队时间, 也直接地提高了患者就诊质量。而根据行业的顾客特征, 医院就诊患者具有较强的入院季节性, 医院可以基于月份和季节等时间维度来进行患者就诊与入院的数量与规律分析, 比如对应的就诊和住院人次、入院床位的周转率等。通过医院信息系统的数据挖掘来建模, 即灰色预测模型, 对下一个月份或者下一个季节的就诊或者入院人次。医院可以针对预测信息来做好最佳医疗服务安排, 做出最合适的医疗资源配置。

2.3医院患者就诊费用结构分析

目前国内对医院开具药方的药占比提出了严格要求, 而医院信息系统数据挖掘技术可以对就诊患者的费用构成进行分析, 包括药品、医疗检查、相应治疗、医学设备化验及手术等部分, 再通过数据库的信息来对某个科室在某些时间内医生为就诊患者开具的疾病处方进行分析, 分析其中的药品比例是否符合规定的药占比, 确定为患者进行合理的药占比控制。

2.4医院患者同期就诊费用的对比分析

某些患者在某一时间在同一个医院或者同一个科室产生的各种费用, 可以通过医院信息系统的数据挖掘技术来进行对比分析。而在输入门诊量、收容量等数据后, 可以通过数据挖掘技术将其与患者同期就诊费用进行对比分析, 寻找其中蕴含的费用信息, 可以发现医院收入增减的原因, 为解决问题提供决策数据。

2.5就诊患者的单病种分析

当医院患者疾病为单病种时, 医院可以采用医院信息系统数据挖掘技术来对患者在医院支付的费用、入院天数和相关治疗方案等信息进行分析, 为医生对该单病种的信息进行系统总结, 制定当下最佳的治疗方案, 最快地对患者进行治疗, 减少其就诊时间, 同时也减少了患者的负担。长此以往, 还可以形成对于该病种的稳定经验, 并且根据当时的医疗条件和就诊患者个人特殊情况来克服其中的缺陷, 为日后该种病的病人提供更全面的治疗方案。

3医院信息系统中数据挖掘技术的综合管理作用

3.1为医院经济效益提供有效决策

不管是哪个行业, 其企业价值都不能忽略客户价值的作用, 其中客户满意度更是直接地影响着企业经营活动及其效益。而相对于客户的实际价值, 更需要重视客户的潜在价值。因此, 对于医疗行业, 医院的客户就是就诊患者, 必须对他们的潜在价值给予足够重视。医院应该了解患者的期望, 对其期望中可以得到的最理想医疗服务等信息来进行建模, 预测出日后的就诊人数, 采取合理的措施满足患者的期望, 提高患者满意度, 这不但利于医疗服务的发展, 也能够在满足患者期望基础上对医疗设备进行合理的资源配置, 最后能够为医院经济效益贡献力量。

3.2协助医院培养人才

医生要对医院的海量患者案例信息进行便捷而有效的浏览, 就需要通过医院信息系统的数据挖掘技术来进行有效信息筛选, 过滤不需要的信息。在这种情况下, 可以以患者疾病的名称及其临床表现为关键词来进行相应检索。因此, 克服了医生无法直接了解患者病历的缺点, 协助了医生能力的提高, 让即使无法通过进修提升能力的医生也可以发挥出高效力量。

3.3有效监控处方药物数据

医院信息系统数据库每天都有海量数据的输入, 这也反过来意味着医院每日大量的药品在往外输出。要遏制医务人员恶意配药等不合格行为, 可以通过数据挖掘来对医疗处方药物数据进行实时监控, 对其数据进行科学取舍, 减少患者对于药品的费用支付, 提高患者满意度[3]。

3.4对药品库存进行有效的动态监测

医院要保证对就诊患者的医疗服务, 对库存进行合理管理, 就要决定合适的药品订货量。以往都是基于药品的相关销售量来决定, 但是随着数据挖掘技术的广泛应用, 医院可以对药品库存进行有效的动态监测, 避免药品库存的过量积压, 降低成本, 也可以真正有效地提高医疗服务水平, 改善医院对药品库存的管理, 提高管理水平。

3.5实现医疗设备合理配置, 避免资金浪费

医疗设备与药品库存一样, 是医院经营活动与医疗服务的重要资源。要科学合理地购置设备, 我们可以通过数据挖掘技术来进行建模, 对医疗设备带来的收益进行预测, 以采取措施来避免采购资金的不必要浪费, 改善医院经济效益。

4结语

如今医院信息系统已经得到了广泛应用, 数据库的信息输入量在与日俱增, 数据库的规模随之日渐扩大, 也使得数据库的功能不断得到开发与改进, 数据挖掘技术就是其中一项成果。数据挖掘技术可以对医院信息系统中的海量数据进行更高层次的挖掘, 筛选所需的有用信息, 为医院决策提供有效预测数据, 促进医院的经营管理活动更高效开展。在计算机信息化日益发展的今天, 我们要认识到数据挖掘技术在医疗行业信息系统中的功能及作用, 不断推广应用, 为医院的信息管理、经营管理提供支持。

参考文献

[1]郭庆, 谷岩.数据挖掘技术在医院信息系统的统计分析与决策中的应用[J].中国医疗设备, 2010 (5) :64-67

[2]王慧.数据仓库和数据挖掘在医院信息系统中的应用[J].电脑开发与应用, 2014 (1) :76-78

数据挖掘在统计信息系统中的应用 篇10

关键词:数据挖掘技术,统计信息系统,应用

数据挖掘, 俗称为数据采矿和资料勘察, 它是用来在大量数据中发现有用数据的一种方法。该方法的一半过程为先进入大量数据的数据库, 然后开程序开始自动搜索, 发现其中的有用数据。该过程一般涉及到数据统计, 数据分析, 情报收集及相应的检索, 专家咨询系统及相应的模式识别系统来起到信息挖掘的目的。当前情况下, 该软件已经大量运用于各种行业中, 特别实在涉及到大数据的行业, 下面来详细探讨该方法的具体内容。

1 数据挖掘技术的基本功能

1.1 分析功能

数据挖掘技术曾被语言为未来信息处理骨干技术之一。主要因为数据挖掘技术采用的是

统计学、人工智能理论同现代的软件技术和计算机科技学技术的综合特性, 且数据挖掘技术还具备分析功能, 它能利用统计和人工智能的技术, 跟软件系统结合, 对输入的数据进行分析, 而且能够实现自动化, 即便用户不懂如何操作, 也能得到分析结果, 有一定的普适性。

1.2 描述功能

描述功能是数据挖掘技术的三大基本功能之一, 通常包括了数据分类、回归分析、聚类分析、改开、构造依赖模式、变化和偏差分析、模式发现等, 这个功能也在统计数据中得到实际的应用, 数据挖掘技术正是通过描述功能实现了可视化技术, 令数据更生动直观。

1.3 预测功能

数据挖掘技术可以通过预测功能来对已知字段进行检测。预测方法包括了统计分析方法、关联规则和决策树预测方法、回归预测方法等, 预测功能为用户接下来的工作提供了参考。

2 数据挖掘技术在统计信息系统中的应用分析

2.1 定位挖掘对象

顾名思义, 数据挖掘技术, 重点在于“挖”, 所谓的挖无非就是定义数据, 通过对数据对象进行清晰的定义, 才能在庞大的统计信息系统中找到你要找的数据。道理跟我们平时在搜索网站上输入关键词道理是一样的, 你输入的关键词越准备, 数据系统给你搜索到的相关内容才会更精确。现在将数据挖掘技术应用到统计信息系统, 也是为了发挥他的定位功能, 帮我们快速有效地在统计信息库里定位到我们要的目标信息。

2.2 提供数据准备

统计信息系统的主要功能就是对信息进行存储检索跟统计。往往要满足信息的统计跟检索的前提是需要有数据, 这也是数据分析的核心之一。我们需要用数据对统计信息库中的各种类型数据进行建模, 在建模的过程中可能会反复发现一些问题, 对数据需要重复利用, 而数据挖掘技术可以为我们反复提供这些数据, 供我们随时修改或者调整。

2.3 存储数据

统计信息系统说白了就是类似平时咱们常见的Excel表格那样形成的系统, 只是它具备的功能更强大全面一些, 数据是系统的核心所在, 因此这个系统必须要有一个库可以将这些数据储存起来。而数据挖掘技术在统计信息软件中也扮演着数据储藏的角色, 数据挖掘技术可以根据不同的类型分类数据, 就像了一栋大楼住着很多用户, 而数据挖掘技术就是往每一个屋子分配住户, 俗话说“不是一家人, 不进一家门”, 每个屋子里住着的人大部分都家人或者是有一定关联的人, 数据挖掘技术不是单纯的随便把数据进行无方向分配, 它的分配是有目的有归类的, 这样的数据储藏方便日后的数据检索。

2.4 数据预处理

统计信息软件里面有个预处理功能, 发挥这个功能特点主要是依赖数据挖掘。因为统计信息软件里存储的数据是各式各样的, 也许是今天, 也有是明天的, 也许有点是相关的, 也有的半点关系都没有的, 要如何让他们看起来更整天一致, 缩小数据的离散关系呢。这个时候就得用上数据预处理了, 数据挖掘技术的数据预处理功能能够改善数据的质量, 通过对数据进行调整, 提高他们的精度和性能, 简而言之就是去除这些数据的糟粕, 取其精华。通过这样的处理, 去掉数据库里不需要的数据, 并统一转换数据的名字跟定义, 对这些数据进行汇总整理, 估算转换过程中产生的缺失值。数据挖掘技术的预处理功能在统计信息软件的应用是很广泛也很关键的, 它起到承前启后的作用, 如果数据预处理做的不好, 有可能就会浪费数据输入人员的大量功能, 这些数据可能就会沦为无用数据, 不仅占用整个统计系统数据库, 还需要工作人员对其进行清理, 清理的时候还要注意不能清理到有用的数据, 所以工作会很繁重。所以数据挖掘技术在进行数据预处理的时候, 需要十分谨慎。

2.5 抽取数据

数据挖掘技术中的数据抽取功能在统计信息软件中的应用主要是根据用户主题的需要, 为用户抽取他们要的数据, 节省用户挨个查看数据的时间, 同时它还能为用户单独提供一个独立库, 存储抽取到的这些数据。

2.6 转化及净化数据

统计信息软件里的数据常常是来自不同区域的, 不同特性的, 如果数据的不一致会数据质量, 还有可能浪费数据储存空间。数据挖掘技术中的转化功能就能将这些数据同化了, 包括统一数据的名称或者是数据的定义内容。统计信息软件中的信息质量是决定了整个软件运行效率, 而只有高质量的数据才能实现这一天, 低质量的数据会让软件运行效率降低, 数据挖掘技术通过数据净化整个功能清除掉那些不需要的数据, 或者冲突数据, 或者相同数据, 大大降低存储空间, 提高软件运行效率。

2.7 汇总数据

统计信息系统中的汇总功能想必大家都很熟悉, 这个功能大大降低了我们平时统计数据的工作量, 这个重要的功能也是数据挖掘技术在实行的, 当数据进入数据库后, 数据挖掘技术会在不同层次上对输入的数据进行统计, 为用户输出统计效果图。

3 结束语

数据挖掘软件有着独特的优越性和广阔的市场, 他的组成部分很庞大, 但是原理很清晰。它在数据工作中步骤也是有条不紊。通过理论分析和实际观测, 相信数据挖掘软件一定会在数据处理方面大有作为。

参考文献

[1]韩家祎.数据挖掘:概念与技术.[M].机械工业出版社.2012

[2]赵广托.数据挖掘中的统计方法概述.[M].机械工业出版社.2012

信息系统数据智能查询功能的设计 篇11

关键词: 智能查询; 数据挖掘; 多表查询; WCF

中图分类号:TP311 文献标志码:A 文章编号:1006-8228(2015)06-32-03

Abstract: The intelligent query function of information system is particularly important to big data, and can query to the data coincide with the users' needs more effectively and quickly. The system design uses WCF technology to achieve cross platform technology, with single table query, criteria query, multi table query, view generation modules and a friendly interface. The system architecture is divided into public layer, server and client. Users can query the data required by clicking on the interface, the important query can be saved as a view so as to use for next time.

Key words: intelligent query; data mining; multi table query; WCF

0 引言

大数据时代,为了更快捷、更有效地在数据库中查询到与用户需求相吻合的数据,信息系统的查询功能显得尤其重要。在数据查询方面,不仅要关注数据库检索的有效性,而且要能够灵活、智能、自然地查到数据。而目前大部分信息系统,一旦开发完成,就把查询功能、查询视图、查询方式固定下来,这不利于数据库的扩展。如一般的企业信息系统是针对特定数据库开发数据查询功能,这样会使得系统的耦合度变高。假设该企业信息系统发展得越来越大,那么由于业务需要,需要新增一个数据库来存储数据,那原来系统的数据查询功能,就没有用了。为此,本文研究采用C#高级语言和WCF技术开发的智能化数据库查询系统,不但可以实现灵活、带有记忆功能,而且可以使用各种技术来降低系统的耦合度。

1 WCF介绍

WCF(Windows Communication Foundation)是由微软开发的一系列支持数据通信的应用程序框架,其工作原理如图1所示。服务端会有一个服务寄宿过程,因为WCF服务需要寄宿于一个运行着的进程中,服务寄宿就是为服务指定一个宿主程序,而WCF采用基于终结点的通讯手段,包括地址、绑定和契约。当服务被成功寄宿,WCF会创建分发器,通过分发器来监听客户端是否发来消息。对于客户端,通过图1的一系列流程后,可以实现如代理、创建传输通道等访问服务。

2 系统总体设计

查询系统的运行环境、运用技术、系统功能以及系统应用平台如图2所示。

2.1 模块功能设计

根据对数据智能查询系统的需求分析,系统的功能大致包括:数据查询模块和生成视图模块。在数据查询模块中,包含了三个子模块:单表查询、条件查询、多表查询模块。生成视图功能包括定义视图名称和保存视图模块。每个模块提供图形化的操作方式给用户进行数据查询,增强了用户体验性。

2.1.1 快速单表查询

单表查询主要是提供给用户能够快速地查到数据。只需在系统界面选择数据库、数据表或者手动输入操作便可,不需用户懂太多技术上的操作。该功能是系统的最基本查询功能,主要适用于简单数据查询。快速单表查询流程如图4所示。

条件查询功能主要是便于用户筛选数据,根据用户需求,把数据查询出来,如图5所示。

2.1.3 多表查询

多表查询功能主要是需要查询业务比较复杂的数据,可提供数据挖掘的功能。用户只需要选择几张要查询的表以及输入表之间的关联条件,点击确定便可查询数据。其流程如图6所示。

2.2 生成视图

生成视图功能主要是当用户查询到数据后,若用户觉得该次查询数据的方式以后会多次用到,那么用户就可点击生成视图,把该数据表关系保存下来,以便以后使用。

2.3 系统的界面设计

系统界面使用WinForm技术设计,采用IrisSkin2皮肤,整体上给熟悉windows操作系统的用户一种亲切感,且较易用。如图7所示,左上部分可选择数据库、表和视图,左下部分可选择要展示的哪列数据。右上部分是显示用户所查询到的数据,右下部分用户可直接输入Sql语句便可查询到数据。

2.4 系统的架构设计

图8展示了系统的架构,总体上分为公共层、服务端、客户端。各层之间分工协作,项目名称与各层次的对应关系如下。

⑴ 公共层(Common):主要存放一些系统公共代码,如SQLHelper数据操作代码。

⑵ 服务端:Service是系统服务,主要描述该系统提供哪些功能;Service.Interface是系统契约,即服务的定义;ServiceConsumer主要用于服务访问代理;ServiceHosting是WCF服务寄宿。

⑶ 客户端(QueryProject):系统UI层,主要是呈现给用户看的界面。

3 结束语

系统主要的亮点是为用户提供多种查询数据的方式,以及它的灵活性和可移植性。信息化产品已经不断的呈现在用户的面前,同时企业对于办公效率的追求也越来越高,而针对数据方面的需求更加无法想象,大数据、云技术的出现,满足人们需求的同时,也刺激了人们更大的需求。其中对数据的查询及分析需求显得尤为重要。所以该系统的设计符合时代的发展,传统的数据查询根本满足不了用户如今强大的需求,而该系统(如图8)正好符合用户的需求。

系统的发展方向是将每一个功能做成一个个控件,那样用户就可以随意按自己的需要拖拉控件实现相应的功能,即把界面交给用户,按用户所需进行设计。

参考文献:

[1] 刘先省,陈克坚,董淑娟等.Visual C#程序设计教程[M].机械工业出版

社,2010.

[2] 刘卫国,熊拥军.数据库技术与应用-SQL Server 2005[M].清华大学

出版社,2011.

[3] 蒋金楠.WCF全面解析[M].电子工业出版社,2012.

[4] Christian Nagel,Bill Evjen,Jay Glynn.C#高级编程[M].清华大学出版

社,2010.

[5] 黄瑶,王雷刚.结构陶瓷数据库管理系统的研究[J].陶瓷科学与艺术,

2002.36(4):6-8

[6] 袁满,郭宝祥,孙永东.元数据驱动的个性化查询工具设计与实现[J].

信息系统数据挖掘 篇12

关键词:装备使用质量信息,信息流程,数据挖掘,管理系统

在信息化飞速发展的今天,我军对装备使用质量信息的管理已经达到了一个新的阶段,且在2005年10月份实施了国军标《装备质量信息管理通用要求》。全军存在很多与质量相关的信息管理系统,但是装备管理领域内的子系统庞大、复杂、开发标准不统一等问题使系统集成和数据交换等整体配合的功能陷入困境。装备使用质量管理信息系统是由干个(就目前所掌握的情况来看,总共有12个系统)各类专业装备使用质量管理信息系统组成,而各类专业装备使用质量管理信息系统之间的数据不能交互,数据冗余情况严重,同时造成这些信息不能及时统一地反馈到研制生产单位。作为综合计划部门人员,如果分别安装各类专业装备使用质量管理信息系统,显得很笨拙,同时他们也不能全面详细的了解各类专业装备的现状,也不能对不同的装备进行比较,更不能预测分析相关的数据,造成了信息大量流失、应用效益低的状况。如果重新开发,定制标准,就意味着以前所有的子系统将重新规划,所有的努力将付之东流。

1 研究意义

装备使用质量信息是评价装备使用质量状况,进行宏观决策的重要依据,也是提高现役装备使用质量管理水平的重要依据。通过本系统的研究对装备使用质量信息效能的发挥具有重要现实意义,具体体现在以下几个主要方面:

(1) 帮助装备综合部门人员从全局角度及时、准确了解装备状况。通用装备使用质量信息系统是有关装备使用质量的信息大集合,通过这些信息,装备综合部门可以及时、准确地了解到各类专业装备的完好率、装备的使用可用度等,为部队遂行任务提供决策支持。

(2) 协助装备综合部门人员准确地制定保障计划。通过通用装备使用质量信息系统,综合部门人员可以从全局按需详细地了解各类专业装备使用质量现状,准确地制定调配保障计划、装备战备计划等;还可以掌握各类专业装备使用质量的发展趋势,快速地制定维修保障计划、年度季度管理计划,从而实现新装备成系统、成建制装备部队,老装备梯次更新。

(3) 引领部队管好、用好装备。通过质量信息管理系统综合部门人员可以全面准确掌握装备使用质量状况,发现装备技术状况的变化规律以及影响装备使用质量的因素,找出存在的主要问题和薄弱环节,使部队对装备使用质量进行控制,通过组织管理和技术手段延缓装备使用质量下降速度或及时恢复其质量特性,从而促进部队武器装备整体作战能力的提高,使旧装备发挥作战效能,新装备尽快形成战斗力。

(4) 提高武器装备的质量和可靠性。通过质量信息管理系统综合部门人员可以分析影响装备使用的质量信息,以获得对提高装备使用质量和可靠性具有评价和指导作用的信息,将这些信息向装备承研、承制单位反馈,可以使承研、承制单位分析装备存在的问题,减少或消除武器装备系统设计和制造中的错误,提高产品质量和可靠性,为搞好装备研制提供技术支撑。

2 装备使用质量信息的界定

装备使用质量信息是指武器装备在使用过程中的质量信息,按GJB3870-99《武器装备使用过程质量信息反馈管理》的有关规定,他主要包括以下内容:

(1) 接收时间、数量、质量等交付信息;

(2) 使用时间(次数)等使用信息;

(3) 维修系统、维修等级、时间、工时、费用、效果和仪器、部件更换情况等维修性信息;

(4) 储存使用环境条件等环境信息;

(5) 检测产生的数据、资料等检测信息;

(6) 加装、改装的内容、原因、地点、时间、试验报告、批准等级及其效果;

(7) 重大质量问题、严重质量问题和一般质量问题发生的现象、时机、性质、环境条件、原因分析、影响后果、纠正措施及其效果;

(8) 承制方售后服务情况;

(9) 综合技术保障情况、存在的问题及分析等。

众所周知,产品质量首先是设计出来的,在生产过程实现,在使用过程体现。这里所述的装备使用质量信息,是很好实现装备使用质量信息系统的数据支持,所以应该很好地收集、整理、存储、分析。

3 装备使用质量信息流程

3.1 军师团三级装备使用质量信息流程

为了对装备质量信息进行建模,首先应该熟悉各类专业装备质量信息流程,下图实线表示各专业分别上报数据,虚线表示综合以后再上报,主要是以军这一级为研究对象。军师团三级装备质量信息流程如图1所示。

3.2 装备使用阶段的质量信息流程

装备使用阶段对装备质量起主要作用的是部队和修理厂,他们是装备使用和维护的主体,是使用质量信息的来源。信息流程大致如图2所示。

4 基于数据挖掘的装备使用质量信息管理系统

4.1 数据挖掘的概念及特点

数据挖掘(Data Mining,DM),主要是从海量的数据中发现潜在的、可能的数据模式、内在联系、规律、发展趋势等。简单地说,就是从大量数据中提取或“挖掘”知识。有些人也称其为数据发掘、数据采掘等。

数据挖掘是一门很广义的交叉学科,他汇聚了不同领域的知识,尤其是数据库、人工智能、数理统计、可视化、并行计算等。但是他相较于其他的数据分析技术又具有自己的特点:需要处理的数据量非常大,可以达到GB,TB;分析过程是自动进行的,这也是他与其他数据分析技术最大的不同;应用周期较长;随着新数据的加入,挖掘的结果是动态的;对用户需求响应速度快,提高决策效率。

4.2 装备使用质量信息挖掘过程

当前装备质量管理方法和技术多采用数理统计原理,其作为技术来讲比较成熟。但在实际应用中,统计方法自身存在一些不足。如在质量分析过程中,进行相关性分析时,采用回归分析、方差分析等方法,需要大样本,且要求样本有较好的分布规律,这在实际操作上有较大困难。此外,通常的回归分析不能分析多因素间的时变特征,而这恰恰是随机质量问题分析所需要的。许多统计方法也同样存在预测功能较弱的问题,难以满足实际需要。在强调装备质量过程控制和监督的情况下,如何变事后检验为事先预测,发挥预测的作用,对提高质量管理效能至关重要。

从数据中进行有关装备质量控制过程中的知识发现是一个多步骤的处理过程,如图3所示。

其中数据抽取是根据要求从数据库中抽取相关的数据。数据预处理主要对前一阶段产生的数据进行再加工,检查数据的完整性及数据的一致性,对其中的“噪音”数据进行处理,对丢失的数据进行修复。数据挖掘运用选定的知识发现算法,从数据中提取出用户所需要的知识。知识描述是将所发现的知识以用户能了解的方式呈现,如自然语言描述或公式表达等。

4.3 数据挖掘解决的有关装备使用质量问题

基于数据挖掘技术装备质量信息决策技术的问题研究,主要应用于以下几个方面:

(1) 为装备管理战略层提供决策信息研究。对装备管理决策层来讲,他们更为关心的是现役装备的质量特征,如性能指标、使用效能、可靠性等宏观信息,而这些来源于研制、生产和使用过程中的质量信息是一个不断验证、提高和完善的过程。这些信息可以对未来装备研制规划和现役装备采购计划的拟订提供依据。因此,可利用数据挖掘中的数据总结任务从数据泛化的角度,采用多维数据分析方法和面向属性的归纳方法,对以上数据进行浓缩,给出他的“全面”描述。多维数据分析方法可以对决策所需的数据进行多主题、多方面、多角度的分析,从而揭示出隐藏在这些数据背后的信息,有利于决策层从整体上把握装备的质量,以便于决策支持,提高决策的科学性。

(2) 装备质量水平预测研究。在装备的研制、生产和使用过程中,经常要对装备的质量水平进行预测,检查质量特性是否符合要求,以对工序质量或产品质量进行检查与确认。在研制阶段,利用数据挖掘技术进行统计分析,利用成熟型号的历史数据,对新型号进行方案论证,能有效降低装备的设计风险、技术风险、进度风险和费用风险。运用分类技术,神经网络技术,了解、预测在研在制装备的整体质量水平,为审定价格提供科学依据。

(3) 装备质量分析研究。通过采集各阶段质量问题症候,查找产生质量问题的原因以采取有效措施,运用数据挖掘工具中的聚类、分类、统计方法以及神经网络技术,对装备质量进行深入的分析,发现影响产品质量的关键特性,判明故障部位,为装备的维修和使用提供决策意见;发现设计生产中的薄弱环节和使用管理问题,为装备的可靠性增长提供完善的质量信息。

(4) 装备质量生产过程监督重点的分析。运用数据挖掘中的关联规则挖掘技术,利用数据库中的工艺流程数据、质量状态数据等进行分析,从上一阶段的质量状态信息来推断下一阶段的质量状态,从而发现两阶段质量状态的相关性,对影响产品质量的主要因素进行重点监督。

4.4 装备使用质量信息管理系统的组成

对于装备使用质量信息管理系统来说,主要是分成5大部分,如图4所示:

数据库接口模块 该模块主要是解决不同数据库的导入问题,比如*.mdb,*.dbf,*.db等。在导入时,还可以添加各种条件,比如筛选条件、计算条件等,也可以进行数据库类型的转化。

日常业务模块 该模块主要是针对综合部门人员的日常业务进行的设计,其中对装备实力统计和装备维修实力统计,是装备管理条例明确要求的,还可以对装备完好率、装备维修率等进行统计。其统计信息对维修保障计划、人才培训计划、装备战备计划的制定将会提供帮助。

决策支持模块 该模块应用当前先进的数据挖掘技术为综合计划部门人员进行数据分析,提供决策支持。他是本系统的重点,而决策支持的有效手段是数据挖掘技术。

数据库管理模块 该模块为综合计划部门人员日常应用和决策支持模块提供数据支持。功能上主要是对导入的数据进行管理,比如对数据进行添加、修改、删除、查询等。

系统维护模块 模块维护主要是对数据库的数据进行备份、恢复、用户的管理和模块升级等。

5 结 语

使用阶段是武器装备质量的体现阶段,在这一阶段,蕴涵着大量的有用信息。本系统的设计将会大大提高他们的价值,并且为综合计划部门人员的决策提供支持和帮助。但是由于目前存在的各类专业装备系统较多,在开发过程中势必面临不少问题。

参考文献

[1]GJB 3870-99.武器装备使用过程质量信息反馈管理[S].1999.

[2][加]韩家炜,[加]坎伯.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2002.

[3]唐晓萍.数据挖掘与知识发现综述[J].电脑开发与应用,2002,15(4):31-32,35.

[4]吴昊,杨建军.数据挖掘在质量管理中的应用[J].成组技术与生产现代化,2005,22(1):28-31.

[5]吴昊,杨建军.军事装备学[M].北京:国防大学出版社,2000.

上一篇:生产状况下一篇:商业规则