数据决策力方法论

2024-07-25

数据决策力方法论（精选5篇）

数据决策力方法论篇1

在我国制造行业的快速发展下, 提升制造企业的管理水平已经成为当前需要重点解决的问题。随着信息技术的快速发展, 促进了制造企业数据分析和决策支持的发展。通过创建企业信息管理系统, 可以有效提升企业的生产效率, 使各个部门之间的工作更加协调。对分散、零碎的信息进行充分挖掘和利用。利用决策模型, 对企业生产管理中遇到的问题提供决策支持。

1 基于数据仓库的企业对集成的应用

数据仓库是一种数据集合, 能够反映历史的变化, 具有主题性、集成性与相对稳定性, 管理决策的制定可以以其为依据。根据数据仓库的含义分析, 其特点主要表现在以下几个方面:

1.1 面向主题性

完成事务型处理的任务是传统操作型数据库进行的数据组织工作, 各业务系统间存在相对独立性, 按照一定的主题组织数据仓库中的数据。对主题而言, 其概念比较抽象, 通常情况下, 一个主题同时与多个操作型数据库有关系。例如, 在确定企业的采购订单时, 需要分析供需情况、库存信息、供应商信息等多方面的数据的综合关系, 然后做出最终的决策。

1.2 集成性

一般情况下, 操作型数据库进行事务处理工作与某些特定的应用关系密切, 数据库间具有相对独立性, 通常具有异构性。抽取、清理原有分散的数据库数据, 然后对其进行系统加工、汇总和整理最终获得了数据仓库中的数据, 并保证存储在数据仓库内的信息与规范的信息相一致。例如, 在查询销售数据时, 系统会根据输入的条件要求, 进行筛选、整理后提供出最终的决策参考数据。

1.3 历史变化的反映

当前的数据是操作型数据库主要关注的, 但是数据仓库中还包括很多丰富的历史性信息, 系统将企业从过去某一时点 (如开始应用数据仓库的时点) 到现在各阶段的信息完整的记录下来, 企业可以以这些信息为依据, 定量分析企业产品未来的发展情况。例如, 企业可以通过分析产品上季度的综合销售情况以及市场反映来决策下一季度的生产量。

2 决策支持系统的概况

2.1 决策系统的含义

Decision Support System即决策支持系统, 简称DSS, 是指对大量数据和数学模型与数据处理模型等有机组合众多模型进行综合利用, 通过人机交互功能, 帮助企业各级决策者完成科学的决策的新型系统。机器学习 (ML) 兴起于80年代后期, 自动获取知识有了新方法。数据仓库 (DW) 和数据挖掘 (DM) 两项新的决策支持技术兴起于90年代中期。数据仓库的发展是以数据库为基础发展的, 支持决策是其发展目标。知识发现 (KDD) 是面向数据库的机器学习方法发展的结果;“数据挖掘”是发现知识的关键步骤。决策的支持也是数据库知识的功能。随着决策支持技术的不断发展, 决策系统逐渐完善。当前决策支持系统主要由模型库、数据库、知识库、方法库、OLAP、数据挖掘技术等构成, 其特点表现为以下几个方面:

(1) DSS的主要资源是数据与模型;

(2) DSS主要是为用户作决策提供支持并非代替用户作决策;

(3) DSS的作用是对半结构化与非结构化问题的解决;

(4) DSS以提高决策的有效性而非提高决策的效率为目的。

2.2 决策支持系统组成部分

R.H.Sprague提出DSS的构成部分为人机对话系统、数据库与模型库的两库结构。随着决策支持系统功能的增强与扩大, 对模型与方法进行分离存储, 因此, 数据库、模型库与方法库构成了DSS。近年来, DSS将人工智能技术、专家系统、知识工程的相关思想方法引进后, 以原来的结构为基础, 新增知识库, 将推理机制引入, 最终DSS的四库结构框架形成。随着决策支持技术的发展提高, 决策支持系统的体系结构不断发展健全, 传统决策支持系统中的数据库、模型库与方法库、知识库与推理机、数据仓库、OLAP、数据挖掘技术等都是其组成部分, 将引进显性知识与隐性知识同时引进到决策支持过程中是这种体系结构最关键的特点, 保证推理的结果更科学合理, 为决策层做出决策提供更高价值的参考依据。

3 实现数据分析与决策支持方法

3.1 建立制造业决策模型库

当前比较常用的决策模型系统如GIS、PDM、ERP、CRM、SCM等。在选择决策系统时, 需要根据企业的发展战略来进行选择。通过决策模型, 可以为企业的生产经营提供指导, 使企业可以更好的把握市场、顺应市场。

企业用户决策分析的存放模型是决策模型库。进行决策的模型的建立是以大型制造企业生产过程中的材料采购、库存管理、产品生产、市场营销、财务管理、人力资源管理、研发设计、质量管理、售后服务等方面的数据为依据。决策模型被授予一定程度的权限, 对数据进行访问。然后以数据仓库中获取的数据为依据, 对用户指定的目标进行决策支持。系统描述现有模型的组成元素与其组成结构的知识, 模型构造过程中的各类推理算法被获取。以模型构建推理算法为基础, 使匹配模型的框架由新问题的属性值填充, 最终决策问题模型得以建立。

3.2 实施制造业决策分析

对决策模型进行求解的过程就是决策分析的实施。通过理解决策问题获得用户需要决策的目标、意图等方面信息, 然后利用合适的决策模型分析获得的数据, 再根据规则与模型的求解算法获得有价值的决策意见, 将其提供给用户。本系统规范描述每个模型包含的求解算法利用含有通用求解算法的模型很容易求解问题。但是如果没有求解算法或者不确定利用哪种算法进行求解, 平台依据以前比较成功的相似的案例, 将范例的求解方法求解问题。平台会详细记录取得较好决策效果的案例, 并用数据层的公用数据库进行存放, 这样能够及时调用成功的相似案例进行决策分析问题的求解。

3.3 协作决策支持的多环节性

通常企业决策不会通过利用单一的决策模型得到。企业管理的决策方案案是利用了多模型的协作来实现决策的。协作决策的实施系统从两个方面着手。

(1) 为实现有效的智能理解需要利用人机智能交互接口实现, 分解复杂的问题, 最终可以得到结构有序的子问题、与决策问题有联系的事实与数据、求解方案等;

(2) 参与决策的模型可以利用平台进行调用, 与决策相关的模型的选择可以通过分解的子问题实现, 为了保证多个模型为特定的决策目标服务需要采用协调的合作机制。

3.4 实际应用价值

在公司管理中引入决策系统, 可以对产品的结构树进行查询, 并根据结构树对生产活动进行指导。在分析产品的销售趋势时, 通过决策系统可以将各个季度的销量占总销量的百分比显示出来。然后, 对各个地区所完成的销售总量进行分析。例如某企业A、B、C三个地区的产品销量图如图1所示。其中A地区完成了总销售量的10%, 在B地区完成了总销售量的15%, C地区完成了总销售量的35%, 销售人员在对客户进行调查后, 对下一季度的销售进行预估。C地区的销售量为210000件, 那么经过估算, 公司下季度只需要提供600000 (21000÷35%) 件产品就可以完成销售任务;如果A地区的销售量为54000件, 那么可以推算出此产品的预计需求量为540000 (54000÷10%) , B地区的销售量为92500件, 那么预计需求量为616667 (92500÷15%) , 通过预测上述三个地区, 取三者的平均值即可预算出下一季度订单大约为585556件。通过利用决策系统分析企业经营数据, 可以得到许多具有参考价值的信息, 充分发掘出了数据的价值, 为企业的决策提供了指导。

4 结语

当前, 国内制造普遍存在数据分析能力差, 决策能力不足等问题, 同时这也是制约企业持续、稳定发展的一个主要因素。本文首先对数据分析和决策支持的概念及构成进行了分析, 并提出了一种基于数据分析的决策支持系统方案, 为制造企业的信息化发展提供了指导。

参考文献

[1]孙长俊, 周晓峰.基于Web Services的企业应用集成模型[J].计算机技术与发展, 2006, (05) :86-87.

[2]崔耀东, 周儒荣, 廖文和.一种选择制造业信息系统应用的决策模型[J].控制与决策, 2003, 18 (l) :73-76.

[3]张立文.利用现金流量表进行企业财务状况分析[N].中央财经大学学报, 2001-5-15 (5) .

数据决策力方法论篇2

零点调查在对成年城市居民的调查结果显示，超过七成的人相信，在女性领导的手下工作变得越来越正常了

袁岳

女性进入职场本身已经丝毫惹不起人们的注意了。尽管今天还有对于女性就业和女性升迁的某种歧视，也还有对于女性与某些类别的岗位是否匹配的疑虑。但是总的来说，人们已经接受一个事实，那就是女性与男性的职业特点只是有差异，而不是简单的总体而言谁比谁强的问题。零点调查在20对成年城市居民的调查结果显示，超过七成的人相信，在女性领导的手下工作变得越来越正常了。当然我们需要留意女性作为职业人士的一些特点，而且还可以有意识地发挥到比较突出的程度，成为女性职业人士的特长。

(1)把沟通变成文化。女性较不倾向于硬性权力的使用，连语言也较不暴力。女性倾向于接受高频度的沟通模式，因此对于形成较为和谐的组织文化有帮助。不过如果女性能够认识到沟通是一种系统知识、技能，也是非常有效的工具，并注意有意识地学习，那么职业女性在团队沟通中既可以更具有说服力，同时也能够更具有带动力。

(2)将shopping 模式用于职业。大家知道，女性爱逛街购物，而且女性在逛街购物中表现了通常男性不具备的优势：充分多元的信息收集(货比三家)、伙伴商讨协作行动(结伙逛街)、行动后反思(购毕后悔)、持续不断的想像与改进(继续逛街)。如果女性把同样的模式应用于对待手头的工作，则其工作的理性水平、在反省总结中的进步水平将非常突出。

(3)将娱乐趣味与技术兴趣结合。女性对于娱乐性、情感性、艺术性的题材与事物的兴趣更突出，这本身对于职场关系的柔化与生动化有积极价值，同时由于技术因素对职场知识、工具、技能的特殊影响作用，女性对于技术兴趣的适度扩展，将使其有效地扩大职业影响力。

(4)将细节表现优势转化为可感知的积极存在。女性关注工作、生活、人际中的细节信息，这些都可以转化成为可为别人感到的、给人以正面印象的行动与表现：井井有条的案面、及时对他人的提醒、善于发现别人细小的优点、给予别人细小的可以体会到的关心和帮助，

实际上，在很多对于细节有特殊要求的工作和岗位上，女性的优势往往特别明显，但同时我们也要意识到，今天专业化和高品质化要求在几乎所有的工作岗位上提升细节管理的能力。

(5)提升关联建立的能力。很少有男性主动对女性表现敌意，女性之间的公开敌意也不多见。女性应发挥细致与周全的特性，在建立与熟人的新的关联性及和陌生人的关联点上下工夫。一个人也许与我们原本素不相识，但这个人有许多地方可供我们与他们建立关联：或者是相同的母校、家乡和经历；或者是他的爱好、专长和理想；或者是他的社交圈和人脉关系。重视关联点将使得你非常容易被别人接受、信任和重视。

(6)建立中性工作形象。现代职业越来越呈现标准化、规范化的特点，对于职业的要求往往是合乎流程要求和产出成效的综合指标。女性职员的哪些表现方式是不吻合职场的标准化要求呢？背后传闲话和讲八卦、受点批评就哭鼻子大概是两个比较突出的方面。要学习在公开场合提出评论和意见，即使受到批评和教训也要培养自己倾听的耐心，尽量克制情绪化的表现方式。职业女性应常读一点时事新闻，阅读一些时尚杂志以外的新书，这些都能帮助平衡自己的职业感受。

(7)将直觉优势转化为对策能力。女性在直觉性反应方面有非常明显的优势，但这也会导致拍脑袋、情绪化反应和无依据评断等现象，而且也比较容易演化成为缺乏独立的问题对策能力的反应样式――你总是问事情怎么做，但是比较少先提出解决问题的构想或者选择。尽管职场中并不反对职员充分发表自己的看法与感受，但更受欣赏和肯定的往往是附有细致的问题描述、有价值的参考信息及有一定论证的对策意见的说法。直觉可以作为提出问题和切入问题的动力和原因，但正式的意见应当远比直觉思考更为周全。共2页,当前第1页12

(8)在陌生人面前的友好形象。中国人的社交文化是对熟人友好而对陌生人戒惧的文化，这点在女性中表现得尤为突出。但职场发展的基本空间在于对陌生人的拓展：陌生的顾客、陌生的合作者、陌生的竞争者和陌生的新同事。女性在陌生人面前表现出得体的友好比男性更可能为他人接受――这种友好表现在：经常的微笑、简洁的主动问候语、主动递名片、比较活泼的肢体语言、在各种场合主动愿意帮助的姿态。而得体表现在：不浓妆、话语不粗放、不轻易炫耀、平视他人而能同时有所建言。

今天职业女性和职业男性成为伙伴，他们有很多的差异，在建设性的管理框架中这些差异就可以成为互补的资源。而这种建设性意味着我们意识到这种差异，并在建立基于差异的工作关系中主动、友好、充分地进行沟通和开放、持续、认真地学习。在职业女性的成长中，职业男性要积极支持，而女性要自信进取。

(作者为零点调查董事长、第一财经《头脑风暴》节目主持人)

数据决策力方法论篇3

随着社会的进步和经济的发展,社会各领域活动中会不断产生大量的数据,人们把这些按照一定的数据模型保存在数据库中。数据库中隐藏着许多可以为商业和科研等活动的决策提供所需要的知识,如何有效地获取这些知识,数据挖掘技术中的分类方法正是解决这个问题的可行而有效的方法。

分类方法是一种重要的数据挖掘技术,分类的目的是根据数据集的特点构造一个分类函数或分类模型,该模型能把未知类别的数据映射到给定类别的某一个中。该方法通常用于预测数据对象的离散类别。目前分类方法已被广泛应用于各行各业,如银行信用评估、医疗诊断、高等教育评估和市场营销等实际应用领域。本文将对数据挖掘分类方法中的决策树算法加以分析。

二、数据分类技术概述

数据分类过程主要包含两个步骤:第一步建立一个描述已知数据集类别或概念的模型;该模型是通过对数据库中各数据行内容的分析而获得的。每一数据行都可以认为是属于一个确定的数据类别,其类别值是由一个属性描述(即类别属性)。分类学习方法所使用的数据集称为训练样本集和,因此分类学习又称为监督学习,它是在已知训练样本类别情况下,通过学习建立相应模型;而无监督学习则是训练样本的类别与类别个数均未知的情况下进行的。通常分类学习所获得的模型可以表示为分类规则形式、决策树形式或数学形式。

第二步就是利用所获得的模型进行分类操作,首先对模型分类准确率进行估计,holdout方法就是一种简单的估计方法。它利用一组带有类别的样本进行分类测试(测试样本随机获得且与训练样本相互独立)。对于一个给定数据集所构造出模型的准确性可以通过由该模型所正确分类的数据样本各书所占总测试样本比例得到。

为了提高分类的准确性、效率和可扩展性,在进行分类之前,通常要对数据进行以下预处理。

1. 数据清理。主要帮助出去数据中的噪声,并妥善解决遗失数据的问题。

2. 相关性分析。其目的是删除那些与分类任务不相关的或冗余的属性。

3.数据转换。利用概念层次树,数据能够被泛化到更高的层次。例如属性“收入”的数值就可以被泛化为“低、中等、高”的离散区间。

以数据库为研究对象,数据挖掘分类模型的构造算法主要有决策树、贝叶斯、神经网络、基于关联和基于数据库技术的方法等。

三、决策树(decision tree)分类算法

所谓决策树就是一个类似流程图的树型结构,决策树是以实例为基础的归纳学习算法。它从一组无次序、无规则的元组中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较,并根据不同的属性值从该结点向下分支,其中树的每个内部节点代表对一个属性的测试,叶结点是要学习划分的类。从根节点到叶结点的一条路径就对应着一条分类规则,整个决策树就对应着一组析取表达式规则。树的最高层点就是根节点。

决策树的生成分为学习和测试两个阶段。决策树学习阶段采用自顶向下的递归方式。决策树算法分两个步骤:一是树的生成,开始时所有数据都在根节点,然后递归地进行数据划分,直至生成叶结点。二是树枝修剪,在一个决策树刚刚建立起来的时候,它其中的许多分支都是根据训练样本集合中的异常数据(由于噪声等原因)构造出来的。树枝修剪就是去掉一些可能是噪声或异常的数据。决策树停止分割的条件是一个节点上的数据都是属于同一个类别;没有属性可以再用于对数据进行分割。决策树模型可以建立得很快,并适合应用到大量的数据上。

目前已经形成的决策树算法有:I D 3、C 4.5、S L I Q、SPRINT、Rain Forest、CLS、CHAID、CART、FACT、GINT、SEE5等。其中比较有著名的是Quinlan提出的ID3算法,以及在ID3算法基础上提出的C4.5算法。

1. ID3算法原理

基本决策树构造算法就是一个贪心算法,它采用自顶向下递归的方法构造决策树。著名的决策树算法ID3算法的基本策略如下:

(1)树以代表训练样本的单个节点开始。

(2)如果样本都在同一个类中,则这个节点成为树叶结点并标记为该类别。

(3)否则算法使用信息熵(称为信息增益)作为启发知识来帮助选择合适的将样本分类的属性,以便将样本集划分为若干子集。该属性就是相应节点的“测试”或“判定”属性。同时所有属性应当是离散值。

(4)对测试属性的每个已知的离散值创建一个分支,并据此划分样本。

(5)算法使用类似的方法,递归地形成每个划分上的样本决策树。一个属性一旦出现在某个结点上,那么它就不能再出现在该结点之后所产生的子树结点中。

(6)整个递归过程在下列条件之一成立时停止。

给定结点的所有样本属于同一类。

没有剩余属性可以用来进一步划分样本,这时候该结点作为树叶,并用剩余样本中所出现最多的类型作为叶子结点的类型。

某一分枝没有样本,在这种情况下以训练样本集中占多数的类创建一个树叶。

ID3算法的核心是在决策树各级结点上选择属性时,用信息增益作为属性的选择标准,以使得在每一个非结点进行测试时,能获得关于被测试记录最大的类别信息。某属性的信息增益按下列方法计算,通过计算得到每个属性的信息增益,比较它们的大小,就可以获得最大信息增益的属性。

设S是s个数据样本的集合。假设类标号属性具有m个不同值,定义m个不同类别。设Si是类别Ci中的样本个数,那么要对一个给定数据对象进行分类所需要的信息量为:

其中是任意一个数据对象属于类别的概率。其中log函数是以2为底,其原因是信息使用二进制编码。

设属性A具有v个不同的值。利用属性A可以将集合S划分为v个子集,其中Sj包含了S集合中属性A取值的数据样本。若属性A被选为测试属性,设Sij为子集中属于Ci类别的样本数。由A划分成子集的熵或信息期望可以计算如下:

熵值越小,子集划分的纯度越高。对于给定的子集Si,其信息期望计算为,其中是Sj中样本属于类别Ci的概率。

这样利用属性A对当前分支结点进行相应样本集合划分所获得的信息增益就是:

决策树归纳算法计算每个属性的信息增益,并从中挑选出信息增益最大的属性作为给定集合的测试属性并由此产生相应的分支结点。所产生的结点被标记为相应的属性,并根据这一属性的不同取值分别产生相应的分支,每个分支代表一个被划分的样本子集。

ID3算法的优点是理论清晰,方法简单,学习能力较强。其缺点是:

只能处理值是离散的属性,不能处理连续值的属性。

计算信息增益时偏向于选择取值较多的属性,不太合理。

对训练集合众属性值或类别给错的数据(即噪声)比较敏感。

在构造树的过程中需要多次扫描数据集,因而导致算法的低效。

只适合驻留于内存中的数据集使用,对训练集合大得无法在内存容纳的数据集无法运行。

2. 树枝修剪

在一个决策刚刚建立起来的时候,由于许多分支是由训练样本集和中的异常数据(由于噪声等原因)构造出来的,决策树过于“枝繁叶茂”,这样既降低了树的可理解和可用性,同时也使决策树本身对历史数据的依赖性增大,也就是说这是这棵决策树对此历史数据可能非常准确,一旦应用到新的数据时准确性却急剧下降,这种情况被称为训练过度。为了使得到的决策树所蕴含的规则具有普遍意义,必须对决策树进行修剪。树枝修剪的任务主要是删去一个或更多的树枝,并用叶子替换这些树枝,使决策树简单化,以提高今后分类识别的速度和分类识别新数据的能力。

通常采用两种方法进行树枝的修剪,它们分别是:

(1)事前修剪方法。该方法通过提前停止分支生成过程,即通过在当前节点上就判断是否需要继续划分该节点所含训练样本寄来实现。一旦停止分支,当前节点就成为一个叶节点。该叶节点中可能包含多个不同类别的训练样本。由于该修剪是在分支之前做出的,所以称之为事前修剪。

(2)事后修剪方法。该方法是从另一个角度解决训练过度的问题。它在允许决策树得到最充分生长的基础上,再根据一定的规则,剪去决策树中的那些不具有一般代表性的叶节点或分支。修剪后,被修剪的分支节点就成为一个叶节点,并将其标记为它所包含样本中类别个数最多的类别。

3. C4.5算法

C4.5算法在ID3算法的基础上,在以下几个方面进行了改进:

(1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性不足。

(2)在树构造过程中进行剪枝。

(3)能够完成对连续属性的离散化处理。

(4)能够对不完整数据进行处理。

C4.5算法产生的分类规则易于理解,准确率较高。但是和ID3算法一样在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,导致算法低效;此外,C4.5也只适合于驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。

4. 其他决策树算法

ID3算法和C4.5算法的有效性已经通过对许多小数据集的学习归纳得到了验证。但当应用这些算法对大规模现实世界数据库进行数据挖掘时,算法的有效性和可扩展性就成为应用的关键。近年来,数据挖掘领域中又提出了许多有关决策树可扩展问题的解决方法。其中比较有代表性的算法有SLIQ方法和SPRINT方法。

SLIQ算法对C4.5决策树算法的实现方法进行了改进,在决策树的构造过程中采用了“预排序”和“广度优先策略”两种技术。所谓预排序,就是针对每个属性的取值,把所有的记录按照从小到大的顺序进行排序,以消除在决策树的每个结点对数据集进行的排序。集体实现时,需要为训练数据集的每个属性创建一个属性列表,为类别属性创建一个类别表。广度优先策略构造决策树,即在决策树的每一层只需对每个属性列表扫描一次,就可以为当前决策树中每个叶结点找到最优分裂标准。SLIQ算法由于采用了上述两种技术,使得该算法能够比C4.5大得多的训练集,在一定范围内具有良好的随记录个数和属性个数增长的可伸缩性。

SPRINT算法去掉了SLIQ中需要驻留于内存的类别列表,将其合并到每个属性列表中。这样,在寻找当前结点的最优分裂标准时,遍历每个属性列表就不必参照其他信息。但是,对非分裂属性的属性列表进行分裂变得很困难,需要用哈希表记录下每个记录属于个孩子结点。SPRINT算法具备以下优点:(1)训练样本量不受内存限制。(2)具有优秀的伸缩性、加速性和扩容性。(3)并行实现容易,效率高。SPRINT算法具备以下缺点:(1)使用属性列表,存储代价是原来的三倍。(2)节点分割要创建哈希表,加大系统负担。(3)节点分割处理相对复杂。

此外,Rain Forest也是一个基于决策树归纳的数据挖掘系统。Rain Forest可根据当前可用内存的大小,自适应地安排决策树归纳算法的具体操作过程。它保持一个AVC集合(属性—值,类别),用以描述每个属性的类别分布。Rain Forest的归纳速度要高于SPRINT方法。

四、结束语

以上是几种常用的基于决策树的分类算法,随着算法研究的进行,出现了许多其他基于决策树的算法,它们与神经网络、遗传算法等技术结合,从不同的方面对算法进行了改进和提高。我们也可以相信未来还会出现更多、更好、效率更高的分类算法。

参考文献

[1]Jiawei Han&Micheline Kambr.Data Mining:Concepts and Techniqyes[M].高等教育出版社,2001.

[2]毛国君段立娟:数据挖掘原理与算法[M].清华大学出版社,2005.7

数据决策力方法论篇4

有限资源的合理配置与利用是管理学研究的中心。美国管理学家西蒙指出：管理就是决策。尽管决策的正确性不仅依靠科学，而且凭借经验与艺术，但随着决策难度和风险的增大，即使是以往认为主要靠经验、直觉和艺术的那些非程序化的决策，也往往要先经过一系列基于科学方法的信息收集和分析，然后在进行详细的可行性研究的基础上进行科学决策，《数据模型与决策》正是为管理决策提供科学方法的一门学科。

一、课程的发展历史与特点

1、课程的发展历史

《数据模型与决策》的萌芽，可以追溯到19世纪末至20世纪初，其中以泰勒提出的科学管理理论和爱尔朗提出的排队模型、哈瑞斯提出的经济批量采购模型等为典型代表。作为一门独立的学科，《数据模型与决策》产生于20世纪40年代。由于战争的需要，英国和美国招募了一批年轻的科学家和工程师，在军队将军的领导下研究战争中的问题，例如大规模轰炸的效果、搜索和攻击敌军潜水艇的策略、兵力和军需物质的调运等等，这些研究在战争中取得了很好的效果。战后，这些研究成果逐渐公开发表，其理论和方法被相继应用到经济计划和生产管理领域，并产生了良好的效果。1952年，美国运筹学会成立。50年代以后，随着信息技术的迅速发展，线性规划、动态规划等由于能够更加方便地求解而被进一步应用于实际管理系统的优化问题中。50年代末，美国已有约半数的大公司在自己的经营管理中应用这些方法，主要用于生产计划、物资储备、资源分配、设备更新等方面的管理决策[2]。

经过长期发展，《数据模型与决策》这门学科不仅在理论上具有了相当的深度和广度，而且其方法与信息技术相结合，形成了各种商业应用软件，使其具有更广泛的应用前景。我国从开始研究这门学科以来，也取得了巨大成就。随着统计学等课程内容的不断融合，其学科体系不断完善，全国各高等院校的管理类学科均将这门学科作为主干课程列入教学计划，全国MBA教学指导委员会也将其列为MBA教学的核心课程。

2、课程的特点

《数据模型与决策》是一门利用数学方法研究各种广义的资源利用、筹划与相关决策等问题的应用学科，是管理科学和现代化管理方法的重要组成部分，它主要运用数学方法研究各种系统的优化途径和方案，为决策者提供科学依据[3]。它具有以下几方面的特点：

1、决策的导向性。

它是一门为管理决策提供科学方法的学科。管理决策中的实际问题，既是管理科学产生的源泉，又是管理科学的应用对象。此学科的研究从一开始就有着强烈的决策导向性。例如，从我国春秋战国时期的田忌赛马，到企业经营管理过程中的人力资源分配、生产计划安排、运输方案和投资方案选择、不同环境下的决策技术等等，都是为决策者的管理决策提供科学依据。

2、方法的科学性。

它是根据管理问题的环境条件和决策要求，在企业拥有的有限资源的约束情况下，通过科学理论的指导，利用科学的手段和方法建立相应的数学模型，通过对决策目标和约束条件进行分析和求解，然后通过实际问题的检验并得到解决这一问题的最优方案，它是科学管理的重要方法之一。

3、系统的最优性。

它是以系统观为指导的一门技术科学，研究的是一个系统的组织管理的优化问题，目标不是单一问题的最优化，而是追求整个组织的系统最优化。例如，在生产计划安排时，由于受到自身拥有资源的限制，在追求企业利润最大化的计划安排中，有时会出现单一利润最大的产品在最优的决策方案中恰恰是要放弃生产的情况。可以说，整个管理科学方法的核心思想就是“整体优化”，而这正是系统观的精髓之一[4]。

4、学科的交叉性。

它涵盖的内容十分广泛，既有线性规划的内容，其中包括线性规划、整数规划、动态规划、目标规划、网络与图论等；也有非线性规划的内容，其中包括排队系统分析、马尔科夫分析和随机模拟分析等，它是一门综合经济学、管理学、高等数学、线性代数、战略管理、市场营销等多个学科的应用科学，这些学科相互交叉、相互渗透，从而形成了学科的交叉特性。

二、教学过程中存在的问题与原因分析

作者从2006年至2011年期间担任苏州大学商学院MBA学员的主讲教师，先后给1000名左右的MBA学员讲授这一课程，合计54学时。笔者通过近6年该课程的教学过程和教学效果的分析，总结和归纳出以下若干方面的问题及其产生的原因：

1、学员的学习兴趣不浓，学习积极性不高。

虽然我国的MBA教育取得了长足的发展，但由于学员来自国有、外资、民营企业以及私人业主等不同性质的企业，层次从基础管理者到中层管理者以及更高层次的高层管理者，但参加MBA学习的动机则完全不同，甚至有人认为参加学习的目的不是为了学习新知识和提高管理技能，更重要的只是为了结交更多的朋友和建立广泛的社交网络，从而学习兴趣不浓，当然对此门课程学习的积极性也不高。

2、学员的知识基础不牢固，学习成绩相差悬殊。

MBA学员的学科背景多样，尤其是文科专业毕业的学生的数学基础更差，尤其对线性代数和统计学知识掌握不深的同学而言，学习该课程时就感觉非常吃力。再加上有些同学的学习态度并不端正，因而在该课程的考试中，既有获得高分甚至满分的，也有很多不及格的，学习成绩相差悬殊。。

3、学员的重视程度不够，教学效果不佳。

在教学计划安排中，工商管理专业相关的学科一般都是采用的定性分析，而该课程强调的是在建立数学模型的基础上进行定量分析，从而为管理决策提供依据。因此，仅靠简单的死记硬背则不能解决问题，如果平时没有及时掌握构建数学模型的基本思想和建模思路，则对企业管理过程中出现的实际问题更是一愁莫展。另外，学员都是在职学习，有时由于工作和家庭的原因而不能按时到课学习，课后也没有需要花费更多的精力和时间及时掌握相关内容，老师的讲课无法取得预期的效果。

4、大多采用大班化教学，教学方式有待改进。

强调案例教学与师生互动是国际上商学院MBA教育的一大特点，也是给学员提供情景模拟和管理决策的一个有效方式。但由于师资力量有限以及为降低教学成本的考量，很多课程仍然采取大班化的教学方式。教师需要花费一定量的时间在定义解释、原理推导和手工演算等内容上，为了不影响教学进度，授课讲师虽然引用了大量的案例，但还是以老师讲授为主，同学参与讨论的机会并不多。因此，为了提高学员的科学决策能力，现有的教学模式还有待进一步改进。

三、提高课程教学效果的对策建议

为了提高运筹学课程的教学效果，增强学生利用理论知识解决实际问题的能力，课程主讲教师应该从以下几个方面入手，通过教学方法和手段的改进以提高该课程的教学效果，从而不断提高MBA学员的科学决策能力：

1、从经典的案例分析与实际用途出发培养学生的学习兴趣。

兴趣是最好的老师，它是激发学员学习主动性和积极性的原动力。教师可以从获得美国管理科学奖的典型案例出发，如美国石油公司确定和评价公司产品商业化的新战略、施乐公司缩短反应时间和改进维修人员生产效率的方案选择、宝洁公司重新设计生产和分销系统以降低成本和改进市场进入速度等决策案例，从而极大地激发学员的学习兴趣。另外还要通过对本土案例的收集和详细分析，针对国内企业经营管理过程中出现的问题，进行各种方案的比较分析，使学生亲身感受到学习本课程对未来成为有效管理者的重要性。

2、从科学的系统观出发，通过构建决策模型增强系统思维和创新能力。

MBA教育的一个主要宗旨就是为了提高学员的系统思维和创新能力，尤其是未来的管理决策者，在面对不确定性和各种外部风险时，必须提高系统思考、战略决策和创新能力。企业的持续发展不仅取决于企业内部的管理与创新能力，还取决于企业与外部主体（如供应商、客户、竞争对手、政府等）之间的合作关系。因此，在授课过程中，任课教师应该从科学的系统观出发，认真解读建立数学模型的基本思想和方法，强调系统思考在企业经营管理和战略决策中的重要性，使学员能不断地通过学习而实现自我超越。

3、课堂讲授与学生讨论相结合，培育学生的创新思维。

发散思维是一种没有一定的指向、范围、规则和约束的思维形式，它以某一事物或信息为起点，充分发挥人的想象力，尽可能多地构思出多种解决方案，即是一种由一到多的思维过程；而收敛思维恰好相反，它是一种利用已有的知识、经验等传统方法来解决问题的有一定的指向、范围、规则和约束的思维方式，即由多到一的思维过程。创新思维要求人们摆脱传统思想的框框, 努力打破传统的思维定势，它是一个发散与收敛相结合的思维模式。因此，在课程的教学过程中，要充分利用学生与老师之间的互动来激发学生的求知欲望和创新思维能力，并通过学生的分组讨论来集体探讨问题的解决方案，不断培育学生的创新思维。

4、与其他专业知识相结合，理论联系实际，不断提高解决实际问题的能力。

本课程属于一个交叉学科，融合了经济学、管理学、高等数学、线性代数、战略管理、市场营销等多学科的知识体系，主要目的是为了提高资源的配置和利用效率。因此，在教学过程中，应该结合相应的经济学和管理学理论知识和概念，理论联系实际，通过对资源基础理论、影子价格、机会成本、灵敏度分析、决策技术和随机模拟分析，使学生能融会贯通，从而提高学员利用所学理论与知识解决实际问题的能力。

5、充分利用现代信息技术，不断提高教学效果。

对管理专业的学员而言，本课程的内容和方法不是简单的数学建模与复杂的运算过程，以往在教学过程中偏重手工计算的方法已不再适应学科发展的现实需要。因此，在学生掌握基本的建立数学模型的基础上应该辅以相应的软件教学和应用，如Matlab, Execl, Lingo, Lindo等其他管理运筹学的软件，这样可以克服以往教学中满堂灌的弊端，使学生在已学会建立数学模型的基础上利用各种软件来进行计算和分析，不仅省去许多复杂的计算过程，而且还提高了研究和解决问题的速度与效率，从而不断提高本课程的教学效果。

摘要：随着我国经济的不断发展, 我国的MBA教育也取得了巨大的成绩。论文从《数据模型与决策》这一课程的特点出发, 深入分析了教学过程中出现的各种问题以及产生的原因。在此基础上, 从改进教学方法入手为提高该课程的教学效果提出了相应的对策建议。

关键词：MBA,数据模型与决策,教学方法

参考文献

[1]俞雪华, 苏州大学MBA教育发展现状与发展对策报告, 苏州大学MBA发展研讨会, 2011年8月12日

[2]Frederick S.Hillier, Mark S.Hillier, 《数据、模型与决策》, , 中国财政经济出版社, 2004年1月, 第二版

[3]徐玖平, 胡知能, 运筹学—《数据、模型与决策》, 科学出版社, 2006版

数据决策力方法论篇5

目前,石油行业在生产过程中所产生的数据种类繁多,并且在可实施方案的设计中对数据有很大依赖性。在企业决策过程中要求掌握大量现实性强、真实准确的以空间信息为基础的综合性信息,并要求随时对数据快速查询、综合分析。单纯的数据报表展示方式枯燥冗长,并不利于数据有效利用,所以将数据库中可辅助决策的数据项作为单个图元元素表示,大量的数据集构成集成的数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析[1]。使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系。

目前,在空间数据集成中GIS的应用占有着重要的地位,GIS以其良好的直观性和交互性以及有效合理的空间数据组织为用户提供了获取地学及相关信息的便利手段,但现今的GIS软件的数据模型都是非时态的,难以处理复杂多变的动态数据,并且构建GIS开销较大,相应速度较慢。难以提供实质性的解决方案,对辅助决策不能提供良好的支持[2]。为此采用SVG矢量图解决空间数据的集成问题,具有系统轻便、简单、传输速度快、交互强等特点,并可对变化的数据实时相应,克服了传统GIS的缺点。

油田决策支持系统的基石是各类海量信息,这些信息包括空间地理信息,也包括大量与空间信息密不可分的属性信息。通过SVG技术可直观形象的管理和查询这些信息。通过构建灵活的图形结构以及图层,集成管理大量的多专题的空间与属性数据,将开采信息、油水井措施、产液剖面、注入剖面等属性信息与油水井地理空间位置、层段地貌特征相连,以组成完整的决策信息模型[3]。利用数值模型计算与数据挖掘技术结合,使计算的结果能更形象直观的表达,从而得出隐含的重要结论,这对于石油生产领域是至关重要的。

1基于SVG辅助决策模型架构

在空间数据集成中,大体上数据分为地理空间数据和领域属性数据两类[4]。由于油田数据组织复杂、多变、关联关系较为密切,并分布在不同的关系数据实体中,这给空间数据集成造成了一定的困难。针对以上问题,设计基于SVG辅助决策模型架构(图1),将可支持辅助决策的空间数据提取,组成完整的数据中间件,并进一步通过解释器将中间件转换为可识别的图像。模型架构分为空间数据实体、基础图形部件和显示部件三部分。

1.1 空间数据实体

空间数据实体是模型的基础,它提供了基本的数据支持,是辅助决策的根据,从大类上划分为两部分。其一为表示空间实体的位置、形状、大小、地貌特征及其分布特征诸多方面信息的空间数据,在此称为地理空间数据类;其二为描述空间实体的属性的数据,如油田中油水井的产液、含水、措施、方案等。

另外,在实际生产中,基于以上两类关系密切的数据类,针对实际生产过程,需要利用已有数据计算模型或数据挖掘方法将产生一类分析结果数据,如剩余油分布情况、采收率评估、单元统计数据等,这类数据虽然是独立存在的但是对于决策的制定提供了强大的支持,同时将此类数据反映到可视化的图形上具有着重要的意义。

1.2 基础图形部件

在实体数据到SVG图形显示过程中,单一关系数据不能充分的表达实际的图形模型,对应一种图形可能由多种关系数据实体组成的。所以需要将原有的数据抽取后重新组织,得到完整、灵活、可解释的基础图形部件。

基础图形部件的作用在于形成物理上分布而逻辑上集中的整体数据视图。从实用角度出发,建立图形部件中间件是一种行之有效的空间数据集成方法。针对地理信息的特点,参考石油领域开发规范,对每一个可提供决策支持的数据创建图形对应关系,使每个分布式关系数据节点形成一个与具体空间数据集相对应图层。根据分布式数据库系统场地自治的原则,各节点负责维护本地数据库与抽取数据项目的一致性。由基础图形部件保存相应原关系数据副本,并维持信息的交换。

建立基础图形部件层不但可是信心有效的集成,并具有较强的扩充能了,如果基础数据变化,则对应修改相应的部件或增加新的图形部件即可将问题解决,而不用将时间花费在数据与显示的对应关系上。

1.3 显示部件

显示部件主要对基础图形部件进行合理的解释以及对应SVG文件格式进行转换并显示。

对于一些关键应用尤其是一些有实时性要求的应用,用户对系统的响应速度要求较高。而对于一些交互性较强的功能,如果系统构造方式比较松散,模块内部的内聚性不强,不利于模块功能的维护。为此,SVG本身的优点,如可扩充性、动态性、强交互性、网络传输速度快等很好的解决了以上问题。

在显示部件中,利用SVG技术主要应用在以下几个方面[5]。

(1) 首先,SVG提供了丰富的图形对象,可以有效的表现空间信息。SVG提供了一下基本图形元素:直线(<line>)、圆(<circle>)、图标(<symbol>)、文字(<text>)、图像(<image>)等。这些图形对象可对油田领域中井、层、地质、采出信息等基础图形做出完整的描述。

(2) 其次,SVG提供了丰富的消息触发及事件响应函数以获取用户消息。同样,SVG也提供丰富的状态事件,如数据装载完毕,就可以触发Onload事件,作一些初始化的处理。通过SVG提供的消息触发及事件相应函数,能够很容易地实现与图像的交互及控制,如图像的放大、缩小、漫游、查询、图层的控制等操作,这些在生产分析中是必不可少的。

(3) 再次,由于SVG是基于XML格式的,因此除了内置的属性外,可以对其属性进行任意扩充,以实现自定义的功能。在SVG图形中,对象的属性ID是用来惟一标识对象的编号,可以通过SVG文档对象的getElementById()方法来获取指定的对象。属性的获取或赋值是通过调用getAttribute及set-Attribute方法。

(4) SVG支持图像的分层管理。对于实际应用,油田数据的复杂多变,并且信息量庞大,将所有信息同时以图形的形式展示较为混乱,再者不同工作人员关心的数据项目也不尽相同。SVG采用基于XML的DOM文档管理结构,很方便实现图层管理,其组<g>对象就可以将其下面的所有图形管理起来。节点中的childNodes属性可以获取所有的子节点的集合,getElementsByTagName()方法可以获取某种类型对象的列表。通过采用组对象来实现图层管理功能,不同图层的对象包含在不同的组中。通过设置组的属性,就可以实现如可见性、颜色、透明度等设置以及选中、删除所有对象等操作。

2 油田辅助决策数据的组织和提取

数据组织问题实际上是构建应用系统的重要问题,在系统设计之前,全面而深人地分析数据是必不可少的环节,同时要考虑到当前已存在的数据源和由其衍生的中间数据或统计数据。根据石油行业空间数据的特征,可以把空间数据归纳为3类。

2.1 属性数据

描述空间数据属性特征的数据;包括井(采出井、注入井、探测井等)、各类措施方案(压裂、补孔、堵水、酸化、增注方案等)、开采信息(日产液、日产油、含水率、沉没度、注水量油压等)、产液剖面、剩余油分析结果等,以及与之相关的各类专业属性数据。这类点数据属于关系数据实体,有通用的模型规范(A2数据模型、开发数据库逻辑模型),具有较强的关联,所以可以直接采用关系数据提取方法,通过井ID信息做为主键提取并形成对应图形部件。

2.2 地理数据

描述空间数据空间位置和特征的数据;地理类矢量数据包括:井位坐标、层段构造、层段连通关系解释、区域地质构造图、断层分布图和各类等值图等。地理类的矢量数据采用针对空间和类别两种方法分别组织提取,即在同一平面空间分别组织各专题数据,在每类专题图幅中以图层为单位来组织管理图元数据。采用这种组织方式,系统易于针对地图数据库管理的特殊性,易于实现对跨图幅图元进行整体查询和归并检索输出,同时保证系统的快速高效性能。

各类地理数据除特殊数据项外,同时包含基础数据项目为:{项目名称、井区、层段信息、区域范围、数据描述、数据信息}。

项目名称:图像名称,用以区分各类不同图幅;

井区:以区块为单位,描述图幅的归属;

层段信息:层段信息包含油层组、小层号和细分层号,说明图幅所代表的地理深度。

区域范围:以经纬度为基础,说描述图幅跨度的区域范围。

数据描述:对数据的描述,说明数据的可用性以及完整性或数据项目和其他属性数据的关联关系。

数据关联信息:根据图幅类型的不同,数据信息表达方式也不同,多数情况建立子表或数据流文件。例如剩余油等值线则指向对应的流文件,层段构造信息则指向新建子表,在子表中具体描述数据的类型以及数据组织方法。

地理类数据需建立新的关系数据实体,并和原有数据源相关联来保证数据的一致性。

2.3 计算结果类数据

在原有的石油领域软件中,根据数模计算或数据挖掘方法会产生一部分结果类数据文件,主要以文档形式和图幅文件形式存储。如各类已有的各种工程勘察报告、含油饱和度计算结果、开采曲线等。它们多是以一个整体位对象,采用二进制形式存储于数据库中,并采用外挂属性的形式与相关的其它属性数据相关联。利用SVG可交互的特点,调入对应的数据文件。

3 图形部件的设计与解释

SVG中是以基本的图形元素构成的,在生产中单一的图形文件不足以表达实际的图形模型,所以将多种SVG图形元素组合,形成完整的展示形式。这就要求各个图形元素中的属性要建立与关系数据的对应关系,图形元素的数量决定了构成完整信息的难易程度,在此构建一种完整的中间文件,用以更好的完成信息的集成以及增强系统的扩充能力。

图形部件选用XML文件格式,利用XML扩展性、灵活性、结构性更好的建立中间数据文件,XML定义结构形式化描述如下。

在上述结构中,对于由多图形元素构成的图像分别图像名称做以区分。图层控制表示图像所属的不同层次,并对需要提取的空间数据字段建立与关系数据的对应关系,值类型的利用类样式控制。在空间数据赋值时,出于效率考虑,将涉及数据同时提取到数据集中后再分别处理。

使用图形部件层,对于复杂多变的石油生产数据,使得空间数据的集成更加灵活,如果数据变化可对应修改图形部件的格式即可。

针对图形部件,按照部件的不同进行分组,将其解释成SVG可识别图像。并根据需要,加入图像控制脚本如图形的定量缩放、图层显示控制、图形区域事件控制等,形成SVG文件格式形式如下。

4 实例分析

研究大庆油田中A2数据模型,开发数据库逻辑模型。针对可辅助决策生产数据,提取地理类数据10余种:井位坐标、断层信息、砂体分布信息、层段信息、层段连通关系、剩余油等值线数据等。属性类信息20余种:油井开采信息、水井开采信息、单井静态信息、小层静态信息、油水井生产剖面、油水井方案措施记录、油水累计统计数据、井筒信息、功图数据等。

根据实际需要,定义了15大类图形中间件,其中重点类如下表列出(表1)。

解释成SVG格式图幅中,按照不同部件分层管理,有效的控制图层的显示。对于统计类数据,定义了一种特殊的图形统计部件,包括饼图、柱状图、曲线等多种统计形式。

除SVG图形自带放大、缩小、图像品质调整功能外,利用Java脚本提供了图像定量缩放、定位区域、图形编辑处理等功能。并利用事件触发机制,快捷的链入已有文档和图幅,增加了系统的可用性和辅助决策的能力。

5 结论

基于SVG技术,针对可用于辅助决策的实际成产数据建立数据集成模型。提取关系数据实体,并利用XML文件格式形成中间图形部件,将中间图形文件合理地解释最终形成综合信息显示图幅。工作人员可根据具体工作需要,选择针对性较强的图幅显示,辅助生产决策。数据的可视化显示可直观的表现生产状态,并可进行综合的数据分析,从而较高地提高了工作效率。

参考文献

[1]陆西宁,王红芳.基于GIS的空间决策支持系统的研究.微电子学与计算机,2009;26(4):138—140

[2]乌伦,刘瑜,张晶,等.地理信息系统原理、方法和应用.北京:科学出版社,2001

[3]刘啸,毕永年.基于XML的SVG应用指南.北京:北京科海集团公司,2001

[4]徐锋.基于SVG的空间数据的网络发布.技术与创新管理,2009;30(2):237—239

【数据决策力方法论】推荐阅读：

区间数据混合加权集成算子及在群决策中的应用06-10

基于决策力的科研管理06-15