数据模型与决策体会(精选10篇)
数据模型与决策体会 篇1
《数据模型与决策》课程学习体会
“数据、模型与决策”,看这个名字给人的感觉是既理论又实践还颇有些高深。所谓的数据模型与决策就是管理科学的另外一种称呼方式。管理科学(mangement science),它包含了管理和科学两门课程的内容,或者说是管理的科学。如果这个定义还是非常的模糊,那么还可以这么解释,它就是对与定量因素有关的管理问题通过应用科学的方法进行辅助管理决策制定的一门科学。再说的通俗一些,就是将管理过程中出现的定量问题,运用科学的方法,建立相应的模型进行分析,从而为管理者提供决策的依据。
我在课程学习过程中感受到其实质内容主要是线性规划模型和概率统计(检验、估计),内容主要包括统计学和数据模型决策两部分。我自己以前没有学过线性规划,所以感觉课程的这部分是成功的,通过课程的学习懂得了高级线性规划和应用。统计学主要讲授数据收集方法和数据处理方法,包括抽样方法、样本分布、参数估计、置信区间、假设检验、方差分析和回归分析。数据模型决策主要讲述线性规划内容,包括线性规划模型的建立、求解模型的软件使用。通过该课程学习我了解和掌握数据、模型和决策的基本原理、基本方法及其在管理决策中的广泛应用,提升了计算机数量分析的应用分析能力。
统计决策的思想贯穿了企业管理的始终,对各种决策方案进行科学评估,为管理决策服务,使得企业管理者更有效合理地利用有限资源。优胜劣汰,适者生存,这是自然界的生存法则,也是企业的生存法则。只有那些能够成功地应付环境挑战的企业,才是得以继续生存和发展的企业。作为企业的管理者,把握并运用好数据模型与决策的理念定会取得“运筹帷幄之中,决胜千里之外”之功效。
一、企业发展原则与战略管理
企业战略管理是企业在宏观层次通过分析、预测、规划、控制等手段,充分利用本企业的人、财、物等资源,以达到优化管理,提高经济效益的目的。随着我国经济市场化的日益加深,市场竞争日趋激烈,我国企业面临着更多的环境因素的影响与冲击。企业要求得生存与发展,必须运筹帷幄,长远谋划,根据自身的资源来制定最优的经营战略,以战略统揽全局。企业战略过程包括,明确企业战略目标,制定战略规划,作出和执行战略决策,并最后对战略作出评价。企业战略管理作为企业管理形态的一种创新,应是以市场为导向的管理、是有关企业发展方向的管理、是面向未来的管理、是寻求内资源与外资源相协调的管理、是寻找企业的长期发展为目的。也就是将企业看作一个系统,来寻求系统内外的资源合理分配与优化,这正体现了数据模型决策的思想。我国企业战略管理的内容应根据自己的国情,制定对应的战略。主要侧重规定企业使命、分析战略环境、制定战略目标。中国现在绝大部分商品已由卖方市场转为买方市场,知识经济正向我们走来,全球经济一体化的程度在加深,我国企业不仅直接参与国内市场,还将更直接面临与世界跨国公司之间的角逐,企业间竞争的档次和水平日益提高,因而企业将面临更加复杂的竞争环境。只有确定了宏伟的奋斗目标,才能使企业凝集全部的力量,众志成城,向一个共同方向努力,争取实现有限资源的最有效的利用。显然,数据模型决策理念的作用举足轻重。
二、企业人事管理与财务管理
1、人事管理。随着知识经济的到来,现代企业的竞争已经变成人才的竞争。知识经济条件下,经济发展中的知识含量高,对过去一直贯穿和渗透于农业和工业经济中的知识的作用就凸显得日益突出,知识经济时代的到来,是知识成为社会的主要财富,知识和信息逐步成为与人力、资金并列的企业第三大“战略资源”。因此,人力资源的竞争已成为企业间竞争的焦点。所以企业应根据自身的特点和发展状况,应该建立战略导向型的人力资源管理,根据客户总部与下属公司不同的架构,建立对应的人力资源管理模式,最大程度地通过战略纽带将“分割”的人力资源管理职能整合起来,带动企业文化、企业管理等的全面提升,以内部管理的完善获取市场竞争中的优势。这显然蕴涵的是数据模型决策的理念。还可以用指派问题对人员合理分配;用层次分析方法可以确定一个人才评价体系等。
2、财务管理。数据模型决策的理念在财务与会计中显得更为突出也就是说它解决企业如何最有效的利用资金资源的问题。其涉及到投资决策分析、成本核算分析、证券管理等。在投资决策分析中,企业如何利用剩余资金,如何投资往往有多种方案。而数据模型决策的作用就是要要对这些不同的投资方案进行决策,以确定最优的方案,使得企业的收益最大。通常是利用线性规划模型、决策论来进行判断。
该课程使我更好地理解与应用管理科学当中的数学与技术方面的概念。数据模型与决策还有很多实际应用的实例,例如盈亏平衡分析、资源分配、新产品定价策略、销售量预测、投资组合和供应链网络设计等方面。这些方面的内容是任何一家公司在生产经营过程当中,都是必须要考虑的内容,也是管理者必须要做出决策的内容。怎样保证管理者做出的决策都是最佳的方案,能够产生最大的经济利润呢?这些问题都是通过本门课程建立科学的模型,进行分析,从而得出最优的解决方案,知道我们管理者进行正确决策,减少因错误决策而导致的资源和利润的损失。
通过学习管理科学方法与模型来解决实际的生产管理问题,其中包括如何对问题求解的技术。改课程的学习使我了解管理科学的应用程序,而且还了解到管理科学是如何辅助决策的。教授老师还引用了很多被广泛认可的理论,引用决策分析、实践中的管理科学、案例和问题等内容,使得课程内容更加贴近管理实际。从第一节课开始教授首先从宏观上分析了管理学的本质,就管理学的科学性和艺术性在课堂上开展了讨论,并通过几个案例,例如木料的数量确定,如何决定做多少把椅子和多少把桌子可以使得收益最大等等,我不经顿悟,这门学科就是解决之前遇到的那个数学建模的学科嘛。从第一堂课开始就被教学风格所吸引,通过在教师学术造诣深厚,理论水平高超,更加让人惊喜的是他能够利用简明扼要的知识点讲述、生动丰富的案例教学和风趣幽默的语言风格,带领我们发现了看似杂乱无章的数据背后的规律和联系,向我们展示了数据模型分析的种种运用,教会了我们通过数据分析为我们的决策行为提供依据的基本方法,进而大大开拓了我们的管理视野。通过学习我发现这门课程在工作和生活中有极大的应用价值。可以不夸张的说,该课程使我提高了科学分析能力、风险和优化的决策能力和创新能力,在一定程度上影响了我工作方法和思维。
数据模型与决策体会 篇2
随着数据库、网络等技术的迅速发展, 人们积累的数据越来越多, 需要有新的、更有效的方法对各种大量的数据进行分析、提取以挖掘其潜能, 数据挖掘正是在这样的应用需求环境下产生并迅速发展起来的, 它的出现为智能地把海量的数据转化为有用的信息和知识提供了新的思路和手段。
随着电力市场的改革和发展, 供电企业越来越需要对用户侧需求、发电侧需求以及第三方需求进行科学预测决策, 以便为供电企业运营提供科学依据。
2 数据挖掘技术
数据挖掘 (Data Mining, DM) , 就是从大量的、不完全的、有噪声的、模糊的、随机的数据库中, 提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
数据挖掘也可称为数据库中的知识发现, 它是从大量数据中提取出可信的、新颖的、潜在的、有效并能被人理解的模式的一种高级处理过程。数据挖掘是按照企业既定的业务目标, 对大量的企业数据进行探索, 揭示隐藏其中的规律性, 并进一步将之模型化的先进、有效的方法。
数据挖掘是从数据中发现有用知识的整个过程, 如图1所示。整个数据挖掘过程是由若干挖掘步骤组成, 其主要步骤有:数据清洗、数据集成、数据转换、数据挖掘和知识表示。
3 预测决策模型
预测决策系统根据历史数据对未来数据进行预测, 同时根据天气因素/节假日因素等调整预测结果。任何一种方法只是数学上的一种理想的模型, 很难用一种或几种预测决策模型描述所有的变化规律。因此建立预测决策的方法库, 以尽可能多地预测决策模型, 满足事物发展规律多样性的需求, 其中既包括被企业预测人员所经常采用的常规方法, 也包括一些比较新颖的预测决策方法, 如人工神经网络法等。
提供对预测决策所用的历史序列进行不良数据的检测与辨识, 有效地提高精度。预测人员可以结合具体情况灵活选用较为合适的预测决策方法, 对多种方法的预测结果互为比较, 再进行合理的综合分析, 得出最终的预测结果。充分考虑影响预测结果的多种因素, 如气象因素、日分类 (正常日、国庆、春节等) 、星期类型 (周一至周日) 等。
预测决策系统为4库结构:数据库、算法库、模型库、综合分析库。数据库中存储有关的历史业务指标, 算法库/模型库保存了对预测决策模型的管理, 综合分析数据库保存了进行组合预测决策的相关信息。预测决策系统基本结构如图2所示。
4 基于数据挖掘的电力营销预测决策系统
电力营销管理信息系统涵盖供电企业用电营业管理的全过程业务, 包括电量电费、业扩报装、计量管理、用电检查和综合管理等。整体系统框图如图3所示。
对于一个中型地市级的供电企业, 电力营销管理信息系统一年积累电量电费、业扩报装、计量管理、用电检查数据至少2GB, 一般供电企业至少保存3年以上历史数据。预测决策层为制订营销管理目标及营销预测决策提供科学的依据, 即从这些大量的、不完全的、有噪声的、模糊的、随机的数据库中, 提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。
4.1 预测决策模型
预测决策的模型可以分为3类:初级模型、常规预测模型、专用模型, 根据电力业务分析人员的实践经验, 针对电量、电费等预测指标在年度、季度、月度等不同的时间单位上总结出一些独有的预测决策模型 (详见图4) 。
不同地区、不同时间、不同行业的负荷变化规律是不同的, 很难用一种或几种预测决策模型描述所有的变化规律。建立预测决策的模型库, 使得用户可以自定义预测决策模型中的参数, 可定义各种新增加的预测决策模型。这种开放为用户提供了充分的空间, 将人的经验与计算机有机地结合起来, 从而保证了预测决策的精度。
4.2 预测决策策略
每一种预测决策模型都代表了一种发展规律, 预测决策模型越多, 预测决策人员的选择余地越大, 预测决策结果越精确。系统提供的预测决策方法库中既包括了被电力系统预测决策人员所经常采用的常规方法, 如一元及多元线性回归、滑动平均预测、指数平滑预测, 也包括了一些比较新颖的预测决策模型, 如人工神经网络模型等, 并且对一些预测决策模型进行了改进, 如改进的Winters-dm模型。同时针对电力业务分析人员的实践经验, 总结出一些独有的预测决策模型, 如模式分解预测决策法。
预测决策人员可以结合具体情况灵活选用较为合适的预测决策方法, 对多种方法的预测决策结果互为比较, 再进行合理的综合分析, 得出最终的预测决策结果。
(1) 基于模型库的预测决策模型管理。建立预测决策的方法库和模型库, 将人的经验与计算机有机地结合起来, 从而保证了预测决策的精度。
(2) 组合模型预测决策技术。对于电量、负荷等序列量的预测决策, 预测决策人员可选择的模型是多种多样的。数学模型是理想抽象, 负荷发展的自然规律很难用单一数学模型加以描述, 任何单一的预测决策模型的精度不可能很好。无论是从预测决策人员方便地选择模型的角度, 还是为了提高预测决策的精度, 都需要研究如何将不同种模型进行有机的组合, 即综合模型, 才能形成对电量、负荷发展自然规律的更贴切或完备的描述, 提高预测决策的精度。
(3) 预测决策过程控制技术。在预测决策值未得到真实值证实之前, 由预测决策系统得到的预测决策结果是否达到了预测决策精度的要求, 是预测决策工作者迫切关心的问题。系统采用“虚拟预测决策策略”, 即通过对近期已知数据的虚拟预测决策, 考察该预测决策系统在数据条件变化下的预测决策结果稳定性、拟合精度和虚拟预测决策精度等指标, 得到预测决策模型的预测决策精度等级, 为预测决策人员提供自动选择预测决策模型的功能。
(4) 历史数据的预处理技术。为了获得较好的预测决策效果, 用于预测决策的历史数据的合理性应该得到充分保证。因此, 需要对历史数据进行合理性分析, 去伪存真。最基本的要求是:须排除由于人为因素带来的错误、由于统计口径不同带来的误差, 以及历史上的突发事件或由于某些特殊原因对统计数据带来重大的影响。
(5) 预测决策结果评价与自动参数修正技术。预测决策结束后, 随着实际数据的产生, 为了进一步提高预测决策的精度, 系统对多种预测决策方法所得结果进行全面的误差分析, 对预测决策结果作出评价, 并对预测决策模型的参数进行修正。所有误差分析结果均保存于用户指定的信息文件中, 可供随时查阅, 并对以后的预测决策数据进行校正。
(6) 预测决策结果的人工干预。在业务实践过程中, 预测决策人员积累了丰富的工作经验, 同时由于电力工作的实际情况, 有很多未来的变化并不依从历史数据规律, 而是政策性的或者是人为设置的。因此系统必须提供充分的人工调整预测决策数据的手段。
4.3 系统框架
系统整体结构由3部分组成:数据仓库的架构与管理、中间应用服务器的调优与设置、前端报表分析数据的展示与设计, 如图5所示。
(1) 数据仓库构架与管理主要包括数据仓库系统结构的构建、目标数据的生成过程 (数据抽取) 及数据仓库主题数据的管理与维护。
(2) 中间应用服务器由两部分组成:Web服务器与报表分析应用服务器。Web服务器采用Web Logic作为应用服务器。报表分析应用服务器采用先进的商业智能软件Microstrategy的Intelligence Server进行元数据管理与描述, 通过4级缓冲技术, 可及时快速实现对用户数据分析内容的提取。在主题构架与属性定制方面, 通过Microstrategy的Architect构架体系, 可实现对主题灵活定义, 对相关属性任意增删, 对在用电营销过程中新加的各种分析方法与手段可以实现自助式设计, 满足系统的不断扩充需求。
(3) 前端数据分析内容的展示以表格与图形相结合的方式, 通过对不同分析主题, 相关不同属性的多角度、多方位转换, 充分运用钻取、切片等分析手段, 并配以不同的经济分析方法, 可辅助决策者及时快捷地了解本区域电力运营的实际状况。全面掌握电力运营过程中潜在的问题及增长点。
4.4 数据抽取
数据抽取作为数据仓库数据生成的关键步骤, 在数据抽取过程中, 系统提供详细的日志功能。日志内容包括数据抽取过程中对源数据正确性校验、数据抽取相关分析主题抽取情况说明, 并能将最终抽取日志内容按不同单位转发给各部门相关人员, 对上报数据及时更正。
审核验证后的数据经汇总、聚集后可自动插入到相应的数据表中, 基础数据生成后为只读形式, 前端分析人员只有分析数据的权限, 任何人没有更改基础数据的权限。
5 总结
数据挖掘技术是一种多学科相互综合、相互渗透的技术。它以传统的数据库技术为基础, 运用多种手段分析数据, 对海量数据进行知识发现, 并进行恰当的可视化表示, 是一种高效的预测决策系统解决方案。数据挖掘技术为预测决策系统的研制和开发提供了一种有效的、可行的体系化解决方案。基于数据挖掘技术的预测决策系统, 利用挖掘技术, 通过构建预测决策模型, 对企业生产和计划的完成情况及相关环境数据进行多角度、多层次的分析, 帮助企业决策者及时掌握企业的运行情况和发展趋势, 并为制订生产计划和长远规划提供理论和现实指导, 从而提高企业的管理水平和竞争优势。
参考文献
[1]王锐, 马德涛, 陈晨.数据挖掘技术及其应用现状探析[J].电脑应用技术, 2007 (2) .
[2]李丹丹.数据挖掘技术及其发展趋势[J].电脑应用技术, 2007 (2) .
数据模型与决策体会 篇3
關键词:数据挖掘;数据仓库;教育管理;算法;VB
中图分类号:TP311.52 文献标识码:A文章编号:1007-9599 (2011) 03-0000-02
Education Management Decision Support System Based on Data Mining
Lin Lin
(Biochemical Engineering College of Union University,Beijing 10023,China)
Abstract:The paper theoretically expounds the concept of data mining,demonstrates the data mining in the education management decision support system of the core applications,introduces the education management decision support system of data collection, preprocessing,establish and maintain the DW,data mining algorithm choice,the specific content of decision tree algorithm,VB language program design,system testing,etc,discussed the system model in theory framework,rearch data mining and combining education management play a huge role,fnally,discussed the data mining technology in education management decision support system application prospect.
Keywords:Data mining;DW;Education management;Algorithm;VB
随着信息时代的快速发展,外界所带给我们的大量信息也越来越多。大量信息在给人们带来方便的同时,也带来了一大堆麻烦:信息过量难以消化,信息真假难以辩识,信息安全难以保证,信息格式难以统一。身处信息汪洋中的我们,如何才能不被信息淹没、如何从中及时发现有用的信息呢?是否存在着一种工具、一种方法或者一个手段使得身处“数据爆炸、知识匮乏”的我们,能够以一种轻松的状态来进行有效的管理决策呢?
数据挖掘技术是人们长期对数据库技术进行研究和开发的结晶,它为我们提供了一个非常优秀的工具。
一、数据挖掘技术
所谓数据挖掘就是指一个完整的过程,该过程就是从海量的随机应用数据中,提取分析隐含在其中的、人们事先并不知道的、但又具有内在联系的、有价值的信息数据,这些信息数据为决策提供必要的支持。
数据挖掘过程中详细各个步骤的大体内容如下六步:
1.确定主题:即做好需求分析,清晰地定义出问题,并对探索的问题具有可预见性。
2.数据的提炼:搜索与主题有关的数据信息,研究数据的质量,并确定将要进行挖掘操作的类型。
3.数据的转换:将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。
4.数据挖掘:对所得到的经过转换的数据进行挖掘,除了完善从选择合适的挖掘算法外,其余一切工作要都能自动地完成。
5.结果分析:解释并评估结果,其使用的分析方法一般应视数据挖掘操作而定,通常会用到可视化技术。
6.知识的同化:将分析所得到的知识集成到业务信息系统的组织结构中去。
二、数据挖掘与教育管理决策支持系统
我们使用数据挖掘技术对我们所掌握的信息进行特定的“挖掘”,能够发现:广义知识、关联知识、分类知识、预测型知识、偏差型知识,能够在数据中寻找预测性的信息,能够为我们的管理提供“做出决策”的依据,能够有力的支持我们做出恰如其分的选择。
所谓教育管理,就是在特定的社会环境下,遵循教育的客观规律,对各种教育资源进行合理配置,以实现教育方针和教育目标的行为,教育管理是社会管理的一部分。在学校教育管理中,我们引进数据挖掘技术,正是想针对教育的海量数据进行有效的发掘,以期充分利用数据挖掘的长处,来发现这些海量数据中潜在的、长久以来未被发现的规则,能够对学生潜力做出数据挖掘,这就为学校的招生工作提供了一定程度的参考,并在学生入学后还可以分析其进步或者退步的可能原因是什么,解决学生教育导向的问题;还可以对学校管理层比较关心的问题进行挖掘。例如,在所有教职工中教师的比例有多大;一般意义上讲某位教师是否达到了学校的一般标准;能够对教师执教能力和教师人力资源优化做出分析,在教师招聘中为人力资源主管提供一般性的判断依据,对所应聘的教师做出其潜力及前景分析,以便能够辅助管理层做出更好的决策,优化教育管理,促进教育管理良性发展。
三、系统架构的搭建
我们将分以下几步来进行系统模型的设计及实现:
1对数据进行分析,建立数据仓库
数据主要来源是档案室现存的档案,包括教职工和学生的,还要动态的添加一些数据。如果能够得到教育院校的支持来丰富数据,那就更好。这个数据的要求是大量、真实、准确。
对于教职工的信息,主要有以下属性:编号、姓名、性别、民族、出生年月日、
政治面貌、工作时间、是否为班主任、是否为学校管理层、毕业院校、最高学历、
最高学位、最高职称、家庭经济条件、教学评估成绩、所获荣誉、所带班级荣誉、研究成果等等,越详细对我们进行数据挖掘就越好。如下表所示。
对于学生的信息,主要有以下属性:学号、姓名、性别、民族、出生年月日、政治面貌、专业、班级、入学时间、入学成绩、毕业去向、毕业成绩单、毕业论文名称、毕业论文成绩、毕业证书、毕业后十年状况(可选)、毕业后二十年状况(可选)、毕业后四十年状况(可选)、家庭条件、在校期间所获荣誉等等。
对每一个属性进行赋值初始化,如:性别,定义为字符型变量,M代表男,F代表女;又如:对教师的研究成果,是以字符来进行赋值的,涵盖了发表的论文、编著的书籍、科研成果等等,这些分别按照级别予以打分,进行累加,最后全部总和即为该教师的研究成果的成绩,然后对该成绩进行加权求值,按照求值分别赋以A、B、C等字符。对每一位教职工和学生进行赋值,并录入到数据仓库中。创建数据仓库的工具我们可以选择Microsoft SQL Server 。需要注意的是,SQL Server “企业管理器”中控制台根目录中SQL Server组名称应与其他名字一致,例如分析服务器是LINLIN2006,它也应该是LINLIN2006。
2决策树算法
决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。如图4-1,针对学生毕业成绩影响因素进行数据挖掘后的一棵决策树,从中我们看到,决策树的基本组成:节点、分支和叶子。
图4-1决策树
圖4-1中“入学成绩=好”这个条件是树的根,即决策树的根节点。对条件的不同回答产生了“是”和“否”两个分支;而是否“学习勤奋”是根节点的子节点(子节点的个数与决策树算法有关);如果分支下无节点,则到树尾,称为叶子,图中“毕业成绩=坏”就是其中的一个叶子。从树根到每一片叶子的过程就是利用决策树进行分类的过程,通常称这个过程为“遍历”。
决策树算法是数据挖掘中常用的一种算法,常用于数据分析和预测。决策树的构造结果是一棵二叉树(即每个节点有两个分支)或多叉树(节点可以包含多于两个的子节点)。构造决策树的过程,即树的生长过程是把条件数据不断切分的过程,每次切分对应一个问题(即一个节点),二叉树的内部节点(非叶子)一般表示为一个逻辑判断,如图4-1。对每个切分的要求是分组之间的“差异”尽量最大。各种决策树算法之间的主要区别就是对这个“差异”衡量方式的区别。我们只需要把切分看成是把数据信息分成几份,每份数据信息之间尽可能不具有相同或相似的属性,而同一份内的数据尽量具有相同的属性,即属于同一类别。
对于教育管理决策者来说,决策树的构造,即在其生长过程中没有必要太“茂盛”。因为这样会大大降低树的易理解性和易用性,而且也使决策树本身对原始数据产生较大的依赖性,换句话说,这样的决策树可能对于原始数据非常准确,但当有新的数据信息加进的时候,准确性就会急剧下降,这种情况被称之为训练过渡。为了使得到的决策树所蕴含的规则具有普遍性,我们必须有效避免训练过度,同时减少训练的时间。常用的方法是限制决策树的过度成长,即预先设定决策树的最大高度(层数);此外也可以通过设定每个节点必须包含的最少记录数来限制,当节点中记录的个数小于这个数值时就停止切分。
1使用VB对算法进行编程,实现各个模块的功能
通过VB来进行图形应用界面设计及核心程序编程。菜单的设计如下:导入数据仓库、选择数据仓库、任务确立、选择因素、开始运行、查看结果、保存结果、翻译规则、保存规则、退出。主要通过表单及命令来实现各功能。样本空间指的是由教职工、学生数据仓库中的数据所构成的数据空间。
2测试
根据软件测试的要求,必须对该系统进行数据测试,即用手中所拥有的档案资料与数据挖掘的结果对比,进行测试。
首先,假定某学校教师部分档案资料如下(受篇幅限制,仅有部分):
其次,我们使用表中的数据来检测树形结构中每条枝叶的正确性。如果大部分吻合,那么该决策支持系统是成功的,软件和算法都是正确的;否则就得检查改正。这个测试以及测试结果比较的工作量是非常巨大的。
四、进行数据挖掘时应考虑的问题
1确定问题,即用数据挖掘解决什么样的问题,它是核心,偏离了这个主题,最终只能导致失败;
2海量数据的问题,一方面是源数据的挖掘,一方面是数据的提炼;另外非标准格式的数据、多媒体数据、面向对象数据处理问题;从而保证数据的质量和时效性;
3各种算法的使用;
4变化的数据和知识问题;
5枝叶——规则的易懂性问题;
6与其他系统的集成问题,如果可能的话,本系统可以嵌入到学校网络协同办公平台之中;
这些都是在具体实施时应该注意的,也关系着基于数据挖掘的教育管理决策支持系统模型成功与否。
五、展望未来
随着信息化不断向前发展,基于数据挖掘的教育管理决策支持系统也将涵盖人才培养、人力资源、教学评估、教育经济等几个大的方面,也将逐渐发展为教育管理数据挖掘应用平台。基于数据挖掘的教育管理决策支持系统也将发挥越来越重要的角色。
参考文献:
[1][加]Jiawei Han,Micheline Kamber(著)范明,孟小峰等译 《数据挖掘概念与技术》 北京机械工业出版社
[2][中国]张尧庭,谢邦昌,朱世武(编)《数据采掘入门及应用——从统计技术看数据采掘》中国统计出版社
[3][美]John W.Fronckowiak,David J.Helda(著)全刚,杨领峰,申耀军,张涛(译)高长剑(审校)《MS VB6.0 数据库编程大全》电子工业出版社
[4][中国]数据挖掘讨论组www.dmgroup.org.cn
大数据决策与合规论坛 篇4
5月20-21日,由北京大学商务智能研究中心携手腾讯公司法务部和数据平台部举办的“大数据决策与合规论坛”在深圳腾讯公司总部腾讯大厦多功能厅召开。来自北京大学光华管理学院、中国人民大学,中央财经大学等七所高校的学者和来自腾讯公司法务部、数据平台部、君合律师事务所,博雅立方科技公司,普华永道等企业的实务专家参与了此次论坛。此次论坛以大数据分析为立足点,着眼于大数据时代下如何选择、运用和创新统计理论与统计方法,从而使统计更好地满足金融、营销、管理等各个领域的不同需求。为期两天的会议上,通过会议现场与腾讯公司的内部视频平台,超过500位数据工程师参与其中,与参会的老师,同学,各位专家一起,就大数据时代背景下新的数据分析与价值挖掘问题进行了高水平的讨论。腾讯高级执行副总裁卢山,法务综合部总经理江波,北京大学光华管理学院商务统计与经济计量系系主任王汉生教授等人为会议致辞。
其中王汉生教授在致辞时简明扼要的阐述了从数据到价值的产生过程,表达了对于三类重要数据——中文文本、网络结构、移动互联网产生的地理数据、轨迹数据的关注,提出了有关于业界数据分享的隐私保护问题,倡导企业和科研单位的有机融合,创造巨大的价值。
为期两天的论坛共分为4个专题:
在数据抽样计算及互联网金融数据风险专题中,来自北京大学光华管理学院市场营销系的博士生周静指出大数据时代网络抽样的重要性,并给出基于抽样网络数据对社会间相关性进行有效估计的方法;普华永道合伙人季瑞华讲述了互联网金融的数据风险;来自腾讯公司数据平台部的数据专家李勇汇报了大数据场景下实时推荐系统的演进;中央财经大学统计学院的李丰老师基于GPU和虚拟内存技术的快速计算分析了大规模数据的Logistic回归。
下午第二场演讲是位置数据和数据版权专题。来自香港大学法律系的副系主任李亚虹副教授讨论了数据版权保护与分享的相关内容;继而腾讯公司数据平台部数据专家赵伟介绍了腾讯大数据平台的介绍和应用;来自西南财经大学统计学院的兰伟老师给提出了一种新的用于估计给定网络结构下的高维协方差矩阵的回归方法;中国人民大学统计学院的吕晓玲老师提出了POI选择行为的条件Logit模型分析;接下来是来自业界的分享,博雅立方科技有限公司的常莹基于北京三山五园游客数据,分析了基于位置数据的竞争环境和用户特征。第二天的专题由文本分析和实际应用开启。来自北京大学光华管理学院商务统计与经济计量系的王菲菲根据影评文本数据研究其背后的潜在票房价值;同样来自商务统计与经济计量系的博士生黄丹阳提出了关于社交网络标签的统计学分析模型;东北师范大学统计与数学学院的官国宇提出了可变系数的朴素贝叶斯模型并给出其应用;四川大学管理学院的方正教授讨论了基于社交数据的信用评分,并引发了现场的热烈讨论。
最后一个专题是网络数据分析的经济学和管理学视角。中央财经大学商学院的李季老师提出了基于Hazard模型的微博用户转发行为研究;北京大学光华管理学院商务统计与经济计量系的张俊妮老师给出了基于观测数据探索市场研究中的因果推断方法;分别来自北京大学光华管理学院经济系,管理科学系,市场营销系的三位博士生谭娅,丁月和姚凯从不同的角度探讨了基于社交网络数据的用户行为。
数据模型与决策体会 篇5
进入20世纪以来,随着国家信息化带动工业化战略的持续推进,信息技术的成果已渗透到国民经济的各行各业。国内石油上游勘探开发企业,不同程度地建设了物探、钻井、采油、地面工程等各种业务信息系统。这些信息系统所建立的各类专业数据模型,涉及到的数据种类及数据项远远超出20世纪国内外石油上游勘探开发企业传统数据模型所定义的范畴,涵盖了数据采集、生产运行管理、采集数据处理和分析成果等数据内容。石油上游勘探、开发和生产是相互联系、不可分割的整体,勘探开发生产各业务过程所产生的数据信息既享有独立性和特殊性,又具有关联性、统一性和一致性。在石油企业信息化建设过程中,业务信息系统因专业分工不同而采取了分开独立建设的模式,并形成了与每个系统配套的数据管理模型。从整个企业信息系统体系结构角度来观察和比较发现,在各业务信息系统中都或多或少存在重复数据,而且这些重复数据原本应该保持一致,但实际上却出现不一致的问题,从而导致企业各业务系统之间无法实现数据的共享而形成信息孤岛的局面。在系统建设初期,站在目标任务的角度,通常仅关注了勘探开发业务信息系统的独立性、特殊性特点,未充分考虑勘探开发业务信息的关联性、统一性和一致性的重要特征,在信息化建设过程中将勘探开发生产等业务活动之间的信息联系割裂开来。为了消除系统间的信息壁垒,实现勘探开发专业间信息共享,从数据管理角度,需要进一步地研究当前石油勘探开发数据模型,分析并梳理出勘探开发业务系统中影响全局业务且必须保持数据高度一致性的基本数据(如井信息),以及具有一定共享价值的专业主体数据,在原有各专业数据模型的基础上,建立统一的勘探开发主数据模型,以解决新时期下石油上游勘探开发数据建设和应用所面临的诸多问题。
2业务分析及共享数据识别
2.1勘探开发业务分析
石油上游勘探开发可分为勘探、油藏评价、油田开发三个主要阶段,涉及到资源勘查、地球物理勘探、油藏发现和认识、油田开发过程。专业涵盖地震数据采集及处理解释、地质与油藏研究、地球钻井、地质录井、地球物理测井、油井试油、油水井测试、油水井作业、油田采油、油田注水、油气集输等业务。为便于对勘探开发专业共享数据识别,从数据管理专业角度,将勘探开发业务分为区域勘探与开发研究、钻井与井筒施工、油田开发与生产维护三大业务,再按照勘探开发技术服务公司业务范围,采油单位生产活动特征,在这三大类下对勘探开发业务进行专业划分,得到勘探开发研究与生产活动的业务概念模型。
2.2勘探开发共享数据的识别原则
传统定义的勘探开发数据模型包括地球物理、地质与油藏、井信息与井操作、样品检测与实验、油田注采、油田测试六个部分,这些数据是油田公司重要的企业资产,是勘探开发各专业共享数据的基础。进入21世纪以来,特别是“十一五”期间国内石油上游勘探开发企业建立了多个大型的信息系统,这些系统主要面向钻井、油田生产管理等专业信息管理。为支持这些系统的开发和运行,各专业系统都建立了系统数据模型。这些数据模型建设以数据采集和支持专业应用为目标,整体模型分为信息系统过程管理数据、支持专业系统报表生成数据、专业系统产生成果数据、软件系统运行数据四大类。根据对国内某大型石油公司统一建设的8个上游信息系统统计,共定义了约3000个数据类、250000个数据项。由于石油勘探开发数据具有数据类型繁多、数据关系复杂、与时间的关联性较强等特点,一个大型油田公司数据中心基于现有条件下的数据处理能力,经测算,至多可以维护500个左右实体数据类,大约10000个数据项。在新的形势下,油田公司数据中心除了要管理好传统勘探开发数据资产外,还需要解决油田各专业信息系统数据共享的问题。显然,数据管理人员需要从这些勘探开发信息系统海量数据中识别出具有共享价值的数据,构建新的勘探开发数据模型,以指导石油上游勘探开发各专业信息系统数据存储和应用,从整体上提高石油上游勘探开发数据管理和应用的水平。通过对石油上游勘探开发生产业务的分析,以及各业务信息系统数据的研究,基本明确了石油上游勘探开发共享数据识别的原则,即要找出勘探开发区域及井筒勘查、测试获得一次采样数据或分析处理后的认识成果数据,描述地质和油藏构造、储层、流体、压力等数据,各类井及油气举升及输送装置信息,油田开发生产过程中得到的油水井生产状态数据及计算后生成的区块生产状态数据,其它勘探开发业务间需要共享的数据。将勘探开发业务概念模型的钻井与井筒施工的井下作业、试井类业务,与开发生产维护的简单作业、低压试井合并,得到勘探开发业务十六类专业。将十六类专业划分到传统的地球物理、地质与油藏、井信息与井操作、样品检测与实验、油田注采、油田测试六大类中,根据共享数据识别的原则来确定石油上游勘探开发十六类专业共享数据内容。
3勘探开发主数据模型的设计
3.1主数据模型逻辑结构
3.1.1主数据模型的定义主数据模型:涵盖传统的勘探开发数据模型内容,增加勘探开发各专业之间需要相互引用的共享数据,建立起的规范数据模型,称为主数据模型。基本实体:引领和构成主数据模型实体联系的的井、地质单元等顶层实体,称为主数据模型的基本实体。专业实体类:将2.2识别的钻井、测试、地质、采油等16类专业共享数据,定义为主数据模型专业实体类。
3.1.2主数据模型的逻辑结构石油上游勘探开发主数据模型由九个基本实体和十六类专业实体类构成。基本实体作为顶层或引领实体是主数据模型的核心实体。专业实体类依赖于一个基本实体而约束存在。根据专业数据的特点,专业实体类的实体,可以直接作为基本实体的子节点实体,也可以是在专业实体类内构建的多层约束关系的实体。
3.2基本实体
基本实体部分由项目、业务单位、地质单元、生产单元、物探工区、井、井筒、站库、设备九个实体构成。这九个基本实体代表了石油上游勘探开发和使用的主要对象。其中,地质单元是被发现和认识的客观存在的对象,其它对象,包括生产单元和地震工区是人为划分构建的对象。为了便于管理,将基本实体属性分为主体部分和辅助描述部分,主体部分和辅助部分之间一般是一对多的关系。基本实体辅助部分描述基本实体的自身结构,状态变化信息,如地质单元的父子关联关系、井生命周期变化等内容。项目:记录区域勘探与油藏评价、油田开发产能建设等专项投资项目。将勘探与开发地质层系划分方案作为项目管理,以区分不同层系划分的层位数据。业务单位:记录油田公司各级油气生产单位,参与油田公司勘探开发施工作业的服务公司。地震工区:地震勘探所设定的数据采集工区。地质单元:勘探开发过程中所认识的、客观存在的各级地质构造单元。生产单元:油田开发过程中所划分的生产区块或单元,可以是地质单元,也可以是地质单元部分或组合。井、井筒:井和井筒是父子关系,井筒是井的若干分支,一口井有一个地理坐标,可以有多个地下井筒目的层坐标。站库:用于油田地面油气集输的处理单元。设备:勘探开发钻井、井筒施工或测试、油田采油和注水使用的移动设备和固定设备。
3.3专业实体类
在主数据模型逻辑结构上,以基本实体为引领,对十六个专业实体类,按照各专业产生和使用数据的方式和特点,针对性地进行内部数据逻辑结构设计。以地质油藏专业实体为实例,来阐述专业实体类的设计方案。区域地质的关键实体分层方案记录了对层位的认识,层位结构记录不同分层方案层位的上下关系。构造、圈闭、断层属性数据表描述区域的形态,储层、油气藏流体、小层评价等属性表描述区域单元内部特性。单井地质实体类以井筒基本实体展开。井筒地层存储单井钻遇的地层信息,包括界、系、统、组、段。井筒层位存储单井钻遇的油层组、砂岩组、小层、沉积单元、夹层等。井筒地层与层位受区域地质中所属分层方案下的层位约束。对比联通数据用来实现井筒层位的对比,描述其联通关系。
4结语
数据模型与决策体会 篇6
聚集数据线性模型参数估计的相对效率与广义相关系数
对于聚集数据的`线性模型,本文给出了Peter-Karsten估计相对于最佳线性无偏估计的一个相对效率,得到了相对效率的下界,讨论了该相对效率与广义相关系数的关系.
作 者:周永正 ZHOU Yong-zheng 作者单位:景德镇陶瓷学院,信息工程学院,江西,333403 刊 名:大学数学 PKU英文刊名:COLLEGE MATHEMATICS 年,卷(期): 25(2) 分类号:O212.1 关键词:聚集数据 相对效率 线性模型 Peter-Karsten估计
数据模型与决策体会 篇7
关键词:数据挖掘,高校图书馆,聚类分析,决策树
0 引言
随着数据库的不断深入发展以及Internet技术和WWW技术的日益成熟,图书馆所拥有的文献资源数据正在呈几何指数上涨。但目前大多数图书馆仍然采用传统的信息服务方式,即由读者提出信息请求,图书馆工作人员进行解答,或是定期向读者提供相关书目。而现代图书馆的信息服务应该更加关注读者的根本需求,并主动向读者推送个性化服务。由于读者在图书馆借阅图书及检索文献资源的过程中会留下诸如读者基本信息、借阅历史记录、检索记录等有价值的大量信息,应用数据挖掘技术对读者的借阅数据进行分析,得出读者借阅图书分类间的潜在信息。
本文以某高校图书馆的读者借阅数据为基础依据,在聚类分析结果中抽取学习样本,建立决策树模型对借阅数据的特性进行分析,尝试着从数据中挖掘隐含信息,清晰地把握读者真实的信息需求,据此开展读者个性化信息服务,优化馆藏。
1 研究方法
1.1 聚类
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类,经常被用作衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。K-means聚类算法是一种基于划分的聚类算法,因其理论上可靠、算法简单、收敛速度快而被广泛运用。k-means算法的工作原理为首先随机选择K个初始中心,利用欧式距离计算与初始中心的距离,将n个数据分别将它们分配给与其最相似的簇,然后用同一簇中所有对象的均值替换初始中心点。通过多次迭代计算直到结果明显变化为止,使得同一簇尽可能紧凑,而不同簇间尽可能独立。
1.2 决策树
决策树是一种典型的分类方法,采用自顶向下、递归的、各个击破的方式构造决策树。首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。
ID3算法是一种经典的决策树学习算法,由Quinlan于1979年提出,是决策树分类方法中最具影响和最为典型的算法。ID3算法的基本思想是,以Shannon1948年提出的信息论为理论基础,信息熵为度量,用于决策树节点的属性选择,每次优先选取信息量最多的属性,亦即能使熵值变为最小的属性,以构造一颗熵值下降最快的决策树,到叶子节点处的熵值为0。此时,每个叶子节点对应的实例集中的实例属于同一类。
设节点N代表或存放待划分D的元组,选择具有最高信息增益的属性作为节点N的分裂属性。该属性使结果划分中的元组分类所需的信息量最小。对D中的元组分类所需的期望信息由下式给出:
其中,Pi是D中任意元组属于类Ci的概率,并用|Ci,D||D|估计。Info(D)是识别D中元组的类标号所需要的平均信息量。这里所具有的信息只是每个类的元组所占百分比,Info(D)又称为元组D的熵。
将D中的元组通过非类别属性A来进行划分,其中属性A根据训练数据的观测具有V个不同的值{a1,a2…,av}。为了使分类更加准确,需确定D中一个元素类的期望信息,可通过确定Di的加权平均值来得到,即:
其中|Dj||D|表示D中第j个划分权值。InfoA(D)是对D的元组分类按非类别属性A划分的期望信息。其中InfoA(D)值越小,则划分的准确度越高。将原来的信息需求与新的需求定义为信息增益,用Gain(A)表示,即:
通过Gain(A)能够确定以A的信息增益,Gain(A)越大,说明选择测试属性对分类提供的信息越多。因此选择具有最高信息增益的属性A作为根节点的分裂属性,使得完成元组分类还需要的信息最小。
ID3建立决策树的算法描述如下:
步骤1.决定分类属性;
步骤2.对目前的数据表,建立一个节点N;
步骤3.如果数据库中的数据都属于同一个类,N就是树叶,在树叶上标出所属的类;
步骤4.如果数据表中没有其他属性可以考虑,则N也是树叶,按照少数服从多数的原则在树叶上标出所属类别;否则,根据平均信息期望值E或GAIN值选出一个最佳属性作为节点N的测试属性;
步骤5.节点属性选定后,对于该属性中的每个值;
从N生成一个分支,并将数据表中与该分支有关的数据收集形成分支节点的数据表,在表中删除节点属性那一栏,如果分支数据表非空,则运用以上算法从该节点建立子树。
1.3 聚类下的决策树
为了保证评价模型的学习精度,学习样本的确定采用逐步尝试的方法,即根据建立的模型评价精度高低来决定学习样本的数目。首先考虑聚K个类,将数据集R划分为K个不相交的类。然后再分别从每个聚类中心附近抽取M条记录,得到K*M个样本数据,这样就可以最终获得聚类采样数据子集。
通过建立评价模型来检验评价模型的精度,满足实际情况的要求,表示该模型建立合理;如果所建立的评价模型精度不高,需要增加学习样本数目对模型进行训练,直至满足实际工作需要为止。该学习样本更具典型性和代表性,实际效果较好。文中将最为广泛的K-means聚类分析抽取训练样本,通过减少后的训练数据提高ID3决策树性能。
根据以上分析,研究方法的具体流程如图1所示。
2 实例分析
2.1 数据准备与预处理
在进行数据挖掘之前需要对提取的原始数据进行预处理,数据预处理是保证数据挖掘成功的先决条件,经过预处理后的数据可以为实现聚类分析提供标准的数据结构和数据格式,挖掘模型能够有效地调用预定的算法完成聚类分析。聚类分析的数据来源于图书馆管理系统数据库。
本实验数据来源于某高校图书馆管理系统。根据读者借阅数据分析的目的,需要从图书馆业务数据库提取的数据表包括读者借阅表、读者信息表和图书信息表。由于原始数据源中数据量非常大,本文特选取了2010年9月至2011年7月期间的读者借阅数据,通过去除残缺记录及不完整信息进行修补后,以校园卡号为识别标志,将数据表进行整合,并剔除多余的字段以简化数据表,共得到18472条有效记录。将处理后的数据导入SQL Server2005作为数据分析的数据源,通过K-means算法及ID3算法进行借阅数据的分析处理。
2.2 提取学习样本与建立决策树模型
依据图1所示流程图,首先通过K-means聚类算法来聚k个类,并且在每个聚类中心附近抽取4条记录构造训练样本,然后建立决策树模型来检验精度,若满足实际情况的要求,表示该模型建立合理。如果所建立的评价模型精度不高,需要重新增加学习样本对模型进行训练,直至满足实际指标为止,随着抽取样本个数的增加,预测精度如图2所示。
由图2可以看书,当聚32个类时,可得到128个训练样本,预测精度为72.64%,而随着训练样本的增加,发现256个样本比128个样本评价模型准确率提高了10.12个百分点。而512个和640个样本的预测精度并没有明显变化,曲线在256个样本个数处有明显的拐点,表明决策树模型的预测精度趋于稳定。因此确定256个训练样本建立的决策树模型作为读者借阅数据的预测模型,该样本所建立的模型预测精度为82.76%。
2.3 试验结果与分析
用所有样本数据检验所建立的基于K-means与决策树评价模型,测试的准确率为82.76%,而如果直接采用ID3算法进行预测,准确度为70.25%。
试验结果表明,利用聚类分析进行抽取数据,作为决策树的训练集,依据渐进原则,减少了学习样本的数量,并且能够使用典型样本数据推理出大量未知样本的类别,提高评价模型的预测精度。
在生成决策树之后可以方便地提取决策树描述的知识,沿着根节点到叶节点的每一条对应一条决策规则。抽取其中的决策规则描述如下:C915-43社会调查方法方面的图书和C819统计软件SPSS方面的图书之间存在强关联,因此可以考虑向读者进行相关图书推荐。TP39141Photoshop软件方面的图书同J534平面设计方面的图书同样存在强关联,同样进行相关图书推荐,确保学生理论联系实际等等。这些规则说明可以通过聚类算法和决策树算法的结合,得到很好的预测效果,进一步提高图书推荐的准确率,同时能够更好的主动服务于读者,提高服务质量。
3 结束语
本文运用聚类分析抽取决策树模型的学习样本,有效地减少了学习样本空间,在实验结果预测精度不高时增加抽取样本数量,所获得模型的预测精度相对于直接运用决策树进行处理有所增高,提取的规则能有效的实现个性化图书推荐。
参考文献
[1]Jiaw eiH an,M icheline K am ber.范明,孟小峰译.数据挖掘概念与技术.机械工业出版社,2001.
[2]元昌安.数据挖掘原理与SPSS Clementine应用宝典[M].电子工业出版社,2009.
[3]杨学兵,张俊.决策树算法及其核心技术[J].计算机应用与发展,2007.17:43-45.
[4]陈华月.基于加权关联规则和浏览行为的个性化推荐[D].重庆:重庆大学,2005.
一种基于线段法的多属性决策模型 篇8
一种基于线段法的多属性决策模型
研究了属性权重完全未知,属性值以模糊数给出的不确定型多属性决策问题.借鉴集值统计理论中的`线段法.给出了求解属性权重的一个简洁公式.最后通过实例说明了该方法的实用性和有效性.
作 者:孙玉真 姚炳学 作者单位:聊城大学数学科学学院,山东,聊城,252059刊 名:统计与决策 PKU CSSCI英文刊名:STATISTICS AND DECISION年,卷(期):“”(3)分类号:O159关键词:多属性决策 线段法 权重 模型 集值统计.
数据模型与决策体会 篇9
战略决策阶段首要任务是战略定位问题,重点包括市场范围S定位和产品门类P定位(就产品P而言,大处讲可以是行业选择,小处讲可以是产品选择),二者密切联系,组合形成一定的SP战略单元。本文结合Aπ(K,Q)k模型(简称“Aπ模型”)分析企业战略定位决策。
一、S或P定位决策的五种类型
在市场范围定位决策中,集合A代表当前市场范围,集合B代表目标市场范围。五种关系所代表的五种决策为:A与B等同,即目标市场范围与当前范围市场一致,维持当前市场范围不变;A包含于B,即扩大当前市场范围;A包含B,即收缩当前市场范围;A与B相交,即收缩当前部分市场范围,进入新的市场范围;A与B无关,即退出当前全部市场范围,进入新的市场范围,
在产品门类定位决策中,集合A代表当前产品门类,集合B代表目标产品门类。五种关系所代表的五种决策为:A与B等同,即目标产品门类与当前产品门类一致,维持当前产品门类不变;A包含于B,即扩大当前产品门类;A包含B,即收缩当前产品门类;A与B相交,即收缩当前部分产品门类,增加新的产品门类;A与B无关,即退出当前全部产品门类,增加新的产品门类。
二、SP战略单元定位决策
市场范围与产品门类具有组合关系,可形成SP战略单元矩阵。战略定位决策要在市场范围定位决策和产品门类定位决策基础上确定SP战略单元的定位,需要处理当前SP战略单元与目标SP战略单元关系,如下图所示。
结合前面决策类型,退出某市场范围或产品门类,常意味着要退出其涉及的多个SP战略单元,决策时要综合考虑决策影响,考虑资本处置。增加新的市场范围或产品门类,则需要确定SP战略单元规划,考虑各SP战略单元的相互影响及相互利用。
SP战略单元定位决策要考虑的重点:
刍议造林决策与数据更新系统 篇10
一、林业信息化的重要性
实现林业信息化有利于林业信息资源和森林资源的合理利用, 林业信息化是世界林业发展的必然趋势, 可以提高林业的整体技术水平, 是实现我国林业现代化的必然选择。随着信息技术在林业生产经营管理中应用, 林业信息化成为世界林业发展的潮流, 起到越来越重要的作用。
林业信息化是在林业信息政策的支持下, 以计算机及通信技术应用为标志, 通过林业信息设备的装备、林业信息技术的利用、林业信息内容的数字化、林业信息服务的完善实现林业信息产业化。随着世界范围内林业技术革命的兴起, 我国林业信息化体系的建设的现代化水平也有了很大提高。
林业信息化必将促使林业生产方式发生根本性转变, 信息技术在林业上的普遍应用是林业现代化的必然趋势, 它促进了林业实用技术的全面普及和推广, 也促进了林业科技化和产业化的不断提高, 林业信息化也是实施林业科学决策的重要手段。是多学科、多知识的综合利用, 我们应该充分利用这些知识与经验进行判断与推理, 为生产和管理者提供科学而有效的决策提供支持, 从而最大限度地保证宏观决策的合理化、经营管理的现代化和生产过程的科学化, 实现林业可持续发展。
二、造林决策与数据更新系统的重要性及特点
森林资源信息管理系统包含造林决策与数据更新子系统。通过这些系统相互协调运用, 从而达到具备支持基层数据处理和查询分析的要求, 中层管理控制和高层决策支持的功能。
如今, 造林决策与数据更新系统已经逐步达到了数据标准化、网络化、多媒体化和管理化。
数据标准化是是造林决策与数据更新系统建设的基本条件。基础数据的采集、录入、更新、处理在一整套与系统相关的规程规范下进行, 保证系统科学、有效地运转。各地自开发建设的造林决策与数据更新系统与国家级系统相统一, 提高系统兼容性。保证数据共享、资料共享、成果共享。
网络化。建立了网络环境下的公用资源数据库以及与它相应的基于Internet/Intranet环境下的管理信息系统。
多媒体化。森林资源数据本身就包含了大量的图、文、声、像等多种类型的数据, 造林决策与数据更新系统向虚拟与显示的系统仿真技术方向发展。
管理知识化。造林决策与数据更新系统运用管理职能、利用各种现代化手段和技术, 对信息进行搜集、储存、处理和使用, 实现有效地对人、财、物信息的控制, 使森林资源按预定目标发展, 实现森林资源的全程服务管理。
另外, 随着计算机技术的发展, 地理信息系统技术、全球定位技术、空间数据库和网络数据库等高新技术的不断融合, 集成性己经成为森林资源信息管理技术的发展必然。
森林营造是森林培育的重要工作环节, 它是组织林业生产的物质基础。利用现有的森林资源和物质资源, 在有限的林业土地资源上充分发挥林地潜力, 是实现森林多种效益的可持续利用的关键。提高森林营造的效率, 对森林营造进行科学化、现代化的管理成为必然。林业的信息化将带动森林营造信息化向前发展。
造林决策系统根据森林营造的各个环节要求, 应用地理信息技术、网络技术、数据库技术以及系统集成等信息技术, 具体造林地的立地条件规划出造林实施方案, 建立造林决策管理系统, 把造林技术物化在数字化的环境之中, 并对造林地进行投资概算和效益分析。为造林决策提供咨询服务。
造林决策系统的特点:以知识管理理论为依据, 以信息技术为手段, 以提高造林管理水平为目的, 实现森林营造理论与信息技术的有机结合;应用现代最新的信息技术, 实现森林营造的高效管理。根据森林营造过程各环节, 采用网络实施方案, 实现知识的共享, 建立森林营造管理一体化的实时系统;运用现代知识管理理论, 以林业信息化要求为背景, 采用决策支持系统的理论、方法, 对具体的造林地立地条件规划出造林实施方案, 建立一个现代信息技术为依托的造林决策系统。
三、造林决策与数据更新系统的相关技术
数据库技术是信息技术的一个重要领域。空间数据库系统是描述、存储和处理空间数据及其属性数据的数据库系统。它的主要内容包括:空间数据模型、空间数据查询语言、空间数据库管理系统。森林资源信息管理系统通过与GIS的结合, 已经建立一些空间数据库。主要利用航天图像数据进行存储, 提取森林资源管理基本空间信息。
地理信息系统技术。现在的地理信息系统已发展成一个独立的、充满活力的新兴学科, 通过空间数据库中的地理信息可以方便地检索、查询, 对地理数据进行有效分析, 并把分析结果或是决策咨询建议以直观、清晰的形式输出。
WEBGis是Internet与传统Gis结合的产物, 是利用现有的计算机网络技术建立开放式的地理信息系统, 它的一个重要特点是实现客户对地理数据库的远程访问。它使Gis用户通过万维网访问分散于世界各地的空间数据库和GIS开发技术, 共享地理信息。
造林决策系统主要由小班资料表、立地类型表、立地权重表、立地分值表、树种资料表、培育信息表、施工设计表、推理规则表和效益评价表等组成。
总之, 造林决策与数据更新系统为实现森林资源的知识管理和可持续发展提供一种有效的思路。随着信息技术进一步发展, 它将在森林经营管理以及信息化建设中将发挥越来越重要的作用。
摘要:造林决策分析了在造林作业过程中目标地块的选定、资料的分析、选出可选方案以及被选择方案的输出等几个关键问题, 提出了造林决策的总体解决方案, 数据更新通过经营活动数据库和生长模型库的建立, 实现森林资源的及时更新和动态预估。
关键词:造林决策,系统,数据
参考文献