技术关联度

2024-09-02

技术关联度（精选12篇）

技术关联度篇1

知识是技术创新的主要基础[1], 是技术创新的重要资源[2]。如国外Lynn (1999) 的9项因素[3];Leste (1998) 的15项因素[4];Pooltonand Barclay (1998) 的6项因素[5]等等, 无论哪位学者的哪一种关键因素无一例外都需要知识的支持。国内学者的实证研究也表明知识对技术创新的关键影响, 程俊瑜 (2010) 通过实证研究认为新产品研发质量策划对知识过程有显著的直接正向影响, 知识过程对新产品研发绩效有显著的直接正向影响[6];方炜 (2007) 对开拓、分析、防守、反应等4种类型企业技术创新的关键成功因素进行了实证研究[7], 从方炜的研究结果看各类型企业的关键成功因素中均需要知识的支持。

依据熊彼特创新与竞争理论, 一般而言, 产品的创新程度越高, 越有可能使企业具备抬高价格于成本之上的能力[8], 许多学者的研究表明企业创新行为可以帮助企业获得新的能力[9], 提高企业绩效[10], 但也往往伴随极高的风险。较一般的决策问题, 创新决策具有更高的不确定性和风险性[11]。

综上所述, 一方面, 技术创新的主要基础是知识, 我们可以通过研究企业知识与技术创新所需知识的关联度, 测算产品创新时间。另一方面, 根据熊彼特的创新与竞争理论, 只有当企业创新产品进入市场的时间比竞争对手同类型或可替代创新产品进入市场的时间早, 企业才有可能盈利, 而且一般而言, 产品的创新程度与企业利润有密切的关系, 据此我们可以根据产品创新时间测算创新产品盈利的可能性, 根据创新程度测算产品利润。因此, 我们可以以产品利润期望值最大为目标, 建立基于知识关联度的技术创新决策模型。

1 知识关联度

所谓知识关联度 (Knowledge connection intensity, KCI) 是指知识单元间联系的紧密程度[12]。不同的知识关联结构有不同的知识关联度测度指标和方法。本文认为反映企业原有知识与技术创新所需知识的关联度的主要指标有: (1) 相关度 (Relatedness, R) 。在知识组织与检索系统中, 相关度是指用户查询或提问表达式与系统存储文档的匹配程度。相关度越高说明查询式或提问式与存储文档越相近。在布尔检索、向量空间检索和概率检索等知识检索模型中, 给出了知识组织和检索系统中相关度的计算方法和公式[13,14]。企业原有知识与技术创新所需知识的相关度指的是两者目前知识内容的匹配程度, 可以利用知识组织和检索系统中相关度的计算方法进行计算; (2) 耦合强度 (Coupling Strength, CS) 。在知识检索系统中, 共引一篇论文的两篇或多篇论文称为耦合论文, 它们间的关系为引文耦合关系。耦合强度表示耦合论文间的联系, 耦合强度值即耦合论文共同的参考文献数[12,15]。企业原有知识与技术创新所需知识的耦合强度指的是两者知识基础的共同程度, 可以参照论文耦合强度计算后进行归一化数据处理, 耦合强度越大说明两者知识基础的共同程度越高; (3) 共引强度 (Co-citation Strength, CCS) 。在知识检索系统中, 当两篇论文同时被第三篇论文所引用, 则这两篇论文间的关系为共引或同被引关系。共引强度指两篇论文共同被引证相同文献的论文数[12,15]。企业原有知识与技术创新所需知识的共引强度指的是两者被应用到的知识领域的共同程度, 共引强度越高说明两者被应用领域的共同程度越高, 两者前向发展的联系越强, 其数值计算可以参照论文共引强度计算后进行归一化数据处理。关联度KCI= (R, CS, CCS) , 其中相关度 (R) 、耦合强度 (CS) 、共引强度 (CCS) 取值区间均可设置成[0, 1]。

相关度 (R) 、耦合强度 (CS) 、共引强度 (CCS) 分别从现在、过去、未来三个时间段定量表达了企业原有知识与技术创新所需知识的关联度 (KCI) 。相关度 (R) 反应了企业原有知识与技术创新所需知识的缺口情况, 相关度越大知识缺口越小;耦合强度 (CS) 反映了企业弥补知识缺口的难易程度, 耦合强度越大企业弥补知识缺口越容易;共引强度 (CCS) 用于反映企业寻找合作方弥补知识缺口的难易程度, 共引强度越大企业越容易通过应用本企业原有知识的领域寻找到合作方。

2 基于关联度的企业技术创新时间测算

创新时间是企业创新决策必须考虑的极其重要的关键要素, 创新产品能够早于竞争对手进入市场, 企业就能盈利;晚于竞争对手, 企业就可能亏损。就知识角度而言, 企业技术创新时间可通过企业原有知识与技术创新所需知识的关联度测算, 一般而言, 关联度高, 创新时间就短。虽然企业技术创新分为自主创新和合作创新, 但是由于篇幅有限, 本文仅测算自主创新下的创新时间, 所以不讨论共引强度 (CCS) , 将关联度简化为KCI= (R, CS) 。

我们认为企业自主技术创新时间就是弥补知识缺口的时间。一般而言, 相关度越大, 弥补知识缺口的时间越短;耦合强度越大, 弥补知识缺口的时间越短。

弥补知识缺口的时间是一个随机变量。设it0表示在耦合强度为1, 相关度R为0的情况下, 弥补知识缺口所需要的时间长度与概率平均时间长度之差的平均值;设耦合强度为0时弥补知识缺口所需的时间为耦合强度为1时的若干倍, 本文假设为e倍。

则弥补知识缺口的时间t可以假设

a, m, b分别表示在相关度R为1的情况下, 企业自主技术创新估计完成的最短时间、最有可能时间、最长时间。

a, m, b的数值与投入经费有关, 在满足最基本的研发经费基础上, 投入经费越多, a, m, b的数值越小。a, m, b的数值随经费的变化情况为:开始随着投入经费增多, a, m, b的数值加速度减少;达到一定阈值后, 随着投入经费增多, a, m, b数值减速度减少, 直至不再减少。其分布为对数正态分布或分布。

设as, ms, bs表示投入经费再多也不能减小的时间值, 设a0, m0, b0表示投入最基本经费时的时间值。设FUNDSR表示投入经费增加相对数, 即

且FUNDSR≥0

则可以假设a, m, b数值与FUNDSR的关系满足对数正态分布或分布。

其中f (x) 为对数正态分布或分布的密度函数。

3 基于时间的企业创新产品盈利可能性测算

我们根据熊彼特的创新与竞争理论, 基于只有当企业创新产品进入市场时间早, 企业才有可能盈利的基本观点, 测算创新产品盈利的可能性。假设企业竞争对手同类型或可替代创新产品在市场上估计最早出现的时间为ET、最晚出现时间为LT、最有可能出现的时间为MT。

则同类型或可替代创新产品在市场上出现的时间T服从正态分布, 即

根据熊彼特的创新与竞争理论, 可以认为t小于T的可能性就是企业创新产品盈利的可能性。

由于随机变量t与T相互独立, 所以t-T服从正态分布。

当企业自主技术创新时, t-T~N (t0+ (1-R) it0e1-CS-T0, σt2+σT2) . (8)

根据t-T的分布, 可以求出P{t-T<0}, 算出t小于T的可能性, 求得企业创新产品盈利的可能性。

可以用T的标准差σT求出在不同时间段创新产品盈利的可能性大小。由于竞争对手创新产品进入市场时间早于T0+λσT的概率为:

则t

所以t

4 创新产品各创新级别的利润测算

根据熊彼特的创新与竞争理论, 一般而言, 产品的创新程度越高, 利润越高。据此基本观点, 测算创新产品利润。

假设企业在技术创新计划期内可选择的创新产品类型有P类, 用i表示产品类型编号, 则i=1, 2, …, P.假设i类型产品计划期预期能够盈利的创新程度级数为ni, 用j表示产品级别排序的序号, 则j=1, 2, …, ni.

虽然一般而言, 产品的创新程度越高, 利润越高, 但是由于受市场的影响, 并不是创新程度愈高的产品使企业的利润愈高, 如果产品创新程度过高, 反而会使企业利润较低, 参考Pareto收入分配规则[16], 本文认为i类型产品利润与其创新级数j的关系有可能是:低级到某个较高级服从Pareto分布, 以这个较高级为拐点级, 拐点级到更高级服从另一个不同的Pareto分布。但是由于一般来讲预期拐点级与预期最高级重合, 也为了使问题简单化, 假设创新产品预期利润 (Expected profit, EP) 与其创新级数j服从同一Pareto分布。

通过市场调研预估出各类型产品的总利润, 设i类型产品预期总利润为EPi, i类j级创新产品的预期利润为EPij.

其中F (x) 为Pareto分布的分布函数。

F (x) =1-aθx-θ, x>a;F (x) =0, x≤a.这里取a=1.

由于Pareto分布的数学期望为aθ (θ-1) -1, θ>1;

方差为a2θ (θ-1) -2 (θ-2) -1, θ>2.

所以取θ>2, 并尽可能使F (ni+1) 等于1.

5 技术创新决策模型

根据关联度的计算方法, 计算出企业原有知识与i类j级产品技术创新所需知识的关联度, 设为:

根据公式 (1) ~ (9) 给出的tij、Tij的计算方法, 测算出tij、Tij的概率分布、P{tij

设xij表示i类j级产品企业自主技术创新的0-1决策变量, xij等于1表示企业自主创新i类j级产品, 等于0表示不进行创新。假定同类产品中之多只选定1个创新级别, 则有。

由对t的测算过程可见, 关联度KCI为状态量, 能够影响t值大小的企业行为变量只有FUNDSR, 从企业决策角度来看t是FUNDSR的函数, 即t=t (FUNDSR) .

设i类j级产品技术创新需要的最基本的投入经费为BFDSij, 则投入经费FDSij为:FDSij=BFDSij+BFDSij*FUNDSRij

给定总的投入经费FUNDS, 以及i类j级产品技术创新的时间保障的最小概率Pij.

建立企业技术创新决策模型如下:

xij为0-1变量

Pij为决策者确定的概率参量,

或

xij为0-1变量

Pij为决策者确定的概率参量

i=1, 2, …, P;j=1, 2, …, ni;为参数.

6 以1~9比例标度简化模型

企业在同一时期, 一般对于同类产品创新级别的选择可有高、中、低三级, 再借鉴美国运筹学家Saaty教授根据人类判断事物好坏、优劣、轻重、缓急等经验方法, 提出的1~9比例标度, 可假设企业计划自主创新产品有三类, 各类产品均有3级。假设同类产品自主创新最多只选择1个级别, 设xij (i=1, 2, 3;j=1, 2, 3) 表示i类j级产品企业自主技术创新的0-1决策变量, 则

如果给定总的投入经费FUNDS=500 (货币单位) 。预测出创新需要的最基本的投入经费BFDSij分别为BFDS11=50, BFDS12=60, BFDS13=70;BFDS21=90, BFDS22=120, BFDS23=140;BFDS31=200, BFDS32=230, BFDS33=260。根据预测, 各产品技术创新过程中最多需要追加投入经费分别为150, 195, 200;186, 260, 290;120, 130, 150。

设yij (i=1, 2, 3;j=1, 2, 3) 表示选择i类j级产品企业自主技术创新时, 追加投入经费数额。则

, 其中f (x) 为对数正态分布或Γ分布的密度函数。

可以预测出此时各类各级产品的a0ij, m0ij, b0ij以及asij, msij, bsij的数值。得到t0ij= (a0ij+4m0ij+b0ij) (1-PFUNDSRij) /6+ (asij+4msij+bsij) PFUNDSRij/6

t0ij为yij的函数, 记为t0ij (yij) 。

则P{tij-Tij<0}与P{tij

记P{tij-Tij<0}为P (0) (Rij, CSij, yij)

得到模型为:

xij为0-1变量

Pij为决策者确定的概率参量

i=1, 2, 3;j=1, 2, 3;λ为参数。

7 结束语

本文主要依据知识关联度对创新时间的影响、时间的不确定性对创新产品盈利可能性的影响、创新程度对产品利润的影响, 建立了企业创新决策模型。模型中各数据的确定如某类型创新产品市场的总利润等都需要其它知识与方法来确定。

摘要：知识是技术创新的主要基础, 通过研究企业知识与技术创新所需知识的关联度, 测算产品创新时间;根据熊彼特的创新与竞争理论, 依据产品创新时间测算创新产品盈利的可能性, 依据创新程度测算产品利润。建立以产品利润期望值最大为目标, 以知识关联度、投入经费为变量的技术创新决策模型。

关键词：知识关联度,创新时间,利润,创新程度

技术关联度篇2

灰色关联分析法在铁矿技术经济评价中的应用

矿产资源是国民经济发展的物质基础,建立科学实用的铁矿资源开发利用技术经济评价模型十分重要.通过收集1994～的.铁矿资源开发利用的数据资料,利用灰色系统理论中的灰色关联分析方法进行处理,得到了铁矿资源的采选冶技术经济指标与最优指标的关联系数,从而得到了铁矿资源1994～ 20技术经济指标的总体变化状况.

作者：许民利陈晓红作者单位：中南大学刊名：金属矿山 ISTIC PKU英文刊名：METAL MINE年，卷(期)：“”(11)分类号：关键词：灰色关联分析铁矿技术经济评价

技术关联度篇3

关键词：计算机网络原理;实践教学;关联性

一、传统计算机网络原理实践教学现状

计算机网络原理课程是计算机专业学生的重要基础专业课程之一，该门课程的学习效果会对学生后续专业课程的学习产生重要影响。由于计算机网络原理课程的理论性较强，教师在教授过程中通常采用“就理论谈理论”的方式，而计算机网络原理的实践课程，则多数依照配套辅助教材进行授课。配套教材大多只是有针对性地训练学生熟悉掌握相关网络命令，并利用常用抓取数据包软件对相关网络协议进行分析，目的是让学生理解和掌握该门课程，但是这种实践教学方式存在着诸多不足之处。

在计算机网络原理传统的实践教学中，教材相关配套实验课程的教学效果不明显。主要原因在于学生刚接触计算机网络原理课程，对该门课程很生疏，对于网络结构体系相关知识比较陌生，在没有良好的理论知识做基础的前提下，他们很难理解利用抓取数据包软件进行网络协议分析的真正含义，也会对计算机网络原理这门课程产生厌烦情绪，从而影响了教学效果和学习效率。

二、实践教学关联性创新

1.创新方案

综上所述，盲目按照教材配套实验教学方案进行授课，虽然可以指导学生在一定程度上理解和掌握计算机网络原理这门课程的相关理论知识，但是这种方法在实际的实践教学过程中很难达到良好的教学效果。因实践教学环节缺乏与其他计算机基础专业课程之间的联系，导致学生很难产生兴趣，这也直接导致学生对专业课程相关知识点的关联性的理解和掌握的不足。针对上述的不足之处，本文提出加强实践教学关联性的创新方案：实践教学不仅要与教材相对应，完成指导和锻炼学生掌握教材理论和实践能力的目标，更要考虑与其他课程知识的关联性，结合学生的学习情况，有针对性地选择和设计实践教学内容，才能加深学生对相关知识的理解，增强其对所学课程知识点的运用技巧。结合计算机网络原理课程的重要性，此次研究以计算机网络原理课程作为加强实践教学关联性创新实例。

2.加强实践教学关联性创新方案实例

实验内容：模拟实现网桥的自主学习算法。

实验目的：锻炼学生对数据结构知识的运用，加深其对自主学习算法的理解。

自主学习算法流程图以及实现的核心代码如下：

图1 自主学习算法流程图

以上的这种实践教学方法，打破了传统计算机网络原理课程实践教学环节中，抓包分析数据枯燥难懂的低效学习方式;根据自主学习算法流程图，运用程序实现自主学习算法，对于学计算机网络原理的学生，不但加深了对Mac帧结构模型的理解，对OSI体系结构模型以及在结构系统模型中数据通信过程有了更深刻的理解。学生在掌握一定的数据结构理论基础上，达到了锻炼动手编程能力以及加深对数据结构相关理论知识理解的目的，也使学生对于课程知识之间的关联性有了新的认识，对于计算机专业知识体系结构也有了更深刻的理解和掌握，为后续的计算机专业知识的学习打下了坚实的基础。

三、结束语

计算机网络原理是一门基础的专业课程，利用增强基础专业课程关联性的方法引入实践教学环节，让学生可以更好地理解和掌握专业知识的关联性，不仅提高了学生对本门课程理论基础的理解和掌握能力，也有利于学生建立计算机专业课程知识体系。培养计算机基础专业课程能力，是为了使学生能够更好地掌握构造计算机专业知识体系的有效方法，增加各个课程之间的关联性，有助于学生对专业知识系统的理解和掌握，这也是创建应用技术型大学对于学生的培养要求。只有使学生建立一个完整的知识体系结构，才能让学生真正做到学以致用，将来步入社会做一个对社会主义建设有贡献的人。

参考文献：

[1]曹利.《计算机网络》实验教学的分析和设计[J].计算机时代，2008（7）.

[2]谢希仁.计算机网络[M].北京：电子工业出版社，2003.

[3]周轶捷.浅谈《计算机网络原理》实验教学改革[J].信息系统工程，2011（4）：158-159.

技术关联度篇4

1 企业绿色技术创新能力内涵

对绿色技术创新的研究可以追溯到1962年美国学者雷切尔·卡逊的《寂静的春天》一书[16]。当前,推动绿色化产业的发展正成为多数发达国家政府政策的一部分。绿色技术创新,其核心就是保护环境,实现可持续发展。绿色技术创新自19世纪60年代提出以来,经历了“无废工艺”、“清洁生产”等概念的发展和演化过程[17]。E.Brawn等[18]提出了绿色技术的概念,从价值取向的角度相比传统技术,认为绿色技术是一种利用现代科学技术全部潜力,有利于改善环境质量的无污染技术。Samir[19]等认为绿色技术就是把保护环境作为设计制造产品的基本内容,能够实现产品质量和成本与环境相一致的系统技术。国内的董炳艳等[20]认为绿色技术创新在企业的可持续发展中至关重要,要充分考虑到经济效益与环境以及经济社会协调发展的问题。基于以上对绿色技术创新的研究,企业绿色技术创新能力是指是企业在促进经济与环境协调发展的大背景下,将绿色引入企业技术创新全过程,并在未来一定时期内绿色技术创新有可能达到某一标准的能力。

2 企业绿色技术创新能力影响因素

吕燕等[21]从绿色技术创新动因的角度,将我国企业绿色技术创新的过程模式概括为政府政策推动型、瓶颈诱导型、市场与环境双重作用型。这种分类方式,企业的技术创新活动被简单看作是线性过程,其推动力主要来自市场与环境需要。从绿色创新约束机制的角度,Sandra等[22]和杨发庭[23]认为绿色技术创新能力受制于技术机会、技术创新的组织结构、自主研发能力等多重因素的影响,强调了在高动态环境的企业和采用其他生产创新的企业更有可能采取绿色技术创新;许士春等[24]和李婉红[25]指出了环境制度对企业绿色技术创新能力具有重要影响;岳书敬[26]提出通过研发节能减排技术,用高新技术改造企业、提升设计水平,从而提高企业能源、环境和资本的利用效率,改变其高能耗、高排放、高投资的状况;田耕[27]从因子分析法和SEM模型得出企业投入、技术创新、环境管理、资源利用和社会贡献对企业绿色创新能力存在正向影响。

3 企业绿色技术创新能力评价指标体系

本文中企业绿色技术创新能力评价指标体系的设计借鉴了相关学者的技术创新能力评价指标,并结合绿色创新能力的特征设计而成。李菽林[28]引入支持向量机分析评价模型,从绿色创新的投入、管理、服务、营销能力、企业家绿色创新意识以及绿色创新的环境保护能力等6个方面构建了物流企业的绿色创新能力评价体系。苏越良等[29]从企业绿色持续创新能力的特性出发,定性与定量相结合,构建了包括绿色持续创新投入、实施、管理、销售、财务、产出、环境适应能力、企业家创新意识、环境保护能力等9个方面的评价体系。朱永跃等[30]从企业绿色创新环境的视角出发,构建了包括绿色文化、创新投入、创新管理、制度环境、资源环境、文化环境的评价指标体系。本文在借鉴上述文献中构建的企业绿色创新能力评价指标体系,从绿色技术创新投入能力、设计水平、管理能力、开发能力、市场营销、社会服务能力6个方面出发,构建了包括30个指标在内的企业绿色技术创新能力评价指标体系。评价指标的选取遵循了科学性、客观性、全面性、代表性、可操作性原则。具体如表1所示。

4 企业绿色技术创新能力多方案评价模型

企业绿色技术创新能力评价指标具有定性和定量两种指标类型,并且又有正向型指标和负向型指标之分,不同的指标可能具有不同的量纲,为此,需要对不同的评价指标进行统一标度的规范化处理,以便于评价模型的有效建立。

4.1 定性评价指标的处理

定性指标多采用定性语言进行描述,表述的结果一般具有模糊不确定性,为此需要采用统一的标准进行定性指标的衡量。本文采用0—1的比率标度对定性指标进行分析,具体形式见表2所示。

4.2 定量评价指标的处理

为了和定性指标的处理具有一致性,需要将定量指标进行类似的处理。假设存在M个企业绿色技术创新方案C,企业绿色技术创新方案Ci关于评价指标uj的量值为精确量值cij,若评价指标uj为正向型评价指标,则企业绿色技术创新方案Ci关于评价指标uJ的规范化量值vij为:

若评价指标uj为负向型评价指标,则企业绿色技术创新方案Ci关于评价指标uj的规范化量值vij为:

假设企业绿色技术创新方案Ci关于评价指标uj的量值为区间量值,若评价指标uj为正向型评价指标,则企业绿色技术创新方案Ci关于评价指标uj的规范化量值vij为:

若评价指标uj为负向型评价指标,则企业绿色技术创新方案Ci关于评价指标uj的规范化量值vij为:

通过上述的规范化处理可以看出,,使得定量评价指标和定性评价指标具有统一的标度。

4.3 企业绿色技术创新能力的可拓距

针对规范化后的评价指标量值,可以构建不同评价指标的理想域。企业绿色技术创新能力评价指标的理想域包括正向型理想域和负向型理想域。为了使得讨论的结果具有一般性,假设若规范化后的企业绿色技术创新方案Ci关于评价指标uj的量值为

,则评价指标uj的正向型理想域为:

评价指标uj的负向型理想域为:

则企业绿色技术创新方案Ci关于评价指标uj与正向型理想域之间的可拓距为:

其中:

企业绿色技术创新方案Ci关于评价指标uj与负向型理想域之间的可拓距为:

其中:

4.4 企业绿色技术创新能力的可拓关联度模型

通过上述企业绿色技术创新能力评价的可拓距计算模型,可以获得不同企业绿色技术创新方案C关于评价指标uj与正向型理想域和负向型理想域之间的可拓距,由此则可以构建相应的企业绿色技术创新方案Ci关于评价指标uj与正向型理想域和负向型理想域之间的可拓关联函数Kij。

对于正向型理想域,企业绿色技术创新方案Ci关于评价指标uj与其之间的可拓关联函数为:

对于负向型理想域,企业绿色技术创新方案Ci关于评价指标uj与其之间的可拓关联函数为:

考虑到不同评价指标uj具有不同的权重,则可以获得企业绿色技术创新方案Ci关于评价指标uj与正向型理想域和负向型理想域之间的加权可拓关联度εi。对于正向型理想域,企业绿色技术创新方案Ci关于评价指标uj与其之间的加权可拓关联度为:

其中:wj为评价指标uj的权重;n为同一准则下评价指标的个数,满足。

对于负向型理想域,企业绿色技术创新方案Ci关于评价指标uj与其之间的加权可拓关联度为:

若企业绿色技术创新方案Ci与正向型理想域之间的加权可拓关联度越大,与负向型理想域之间的加权可拓关联度越小,则说明该企业绿色技术创新方案越优;反之亦然。由此,则可以构建企业绿色技术创新方案Ci关于不同评价指标的综合可拓关联度计算模型εi:

根据系统决策分析的择优原则可知,若满足:

则称第s个企业绿色技术创新方案Cs最优。

4.5 企业绿色技术创新能力多方案评价的算法实现

根据上述论述,企业绿色技术创新能力多方案评价算法的具体实现步骤如下:

步骤1:基于企业绿色技术创新的实际情况,构建企业绿色技术创新能力评价指标体系;

步骤2:基于评价指标的类型和形式,利用相应的规范化处理模型对企业绿色技术创新能力评价指标进行规范化处理;

步骤3:利用正向型指标和负向型指标的理想域构建模型,建立不同企业绿色技术创新能力评价指标的正向型理想域和负向型理想域;

步骤4:分别利用企业绿色技术创新能力评价指标的可拓距计算模型和可拓关联函数计算模型,获得不同企业绿色技术创新方案与正向型理想域和负向型理想域之间的可拓距及可拓关联函数;

步骤5:利用可拓关联度计算模型,获得不同企业绿色技术创新方案的综合可拓关联度;

步骤6:基于综合可拓关联度的大小获得最优的企业绿色技术创新方案,并为后续的企业绿色技术创新和发展提供支持和指导。

5 实例验证与分析

本文以国家低碳工业园区———黑龙江省大庆高新技术产业开发区企业绿色技术创新能力分析为例,对本文研究提出的模型和算法进行说明和验证。通过实地调研以及征求相关专家和企业领导,获得相关企业的绿色技术创新能力评价的数据,具体结果见表3所示。

基于本文中给出的评价数据规范化处理模型对相关评价指标进行规范化处理,并基于规范化后的数据构建相应评价指标的正向型理想域和负向型理想域,之后利用本文提出的可拓距计算模型,获得不同企业绿色技术创新能力评价的可拓距,最后利用本文提出的可拓关联函数计算模型,获得不同企业绿色技术创新能力评价的可拓关联函数,具体结果见表4所示。

利用本文提出的可拓关联度计算模型,可以获得不同企业绿色技术创新能力评价的正向型可拓关联度、负向型可拓关联度以及综合可拓关联度,具体数值见表5所示。

基于表5中的数据可以看出,绿色技术创新能力最优的方案为企业A,由此,可基于该企业的绿色技术创新实施方案对后续的企业绿色持续性发展提供支持和指导。

6 结论

技术关联度篇5

基于灰色综合关联度的空中目标威胁度评估

改进灰色关联度分析的方法,并引入灰靶理论的概念,建立综合差值矩阵以提高威胁度计算时的`灵敏度和精确度;然后通过威胁隶属度确定空中目标各项指标的权重,再对空中目标的威胁度进行计算并排序.实例应用该算法,评估得到的结果与遗传神经网络模型评估的结果完全一致.

作者：徐伟智军陈亮王峰 XU Wei ZHI Jun CHEN Liang WANG Feng 作者单位：解放军理工大学,工程兵工程学院,江苏,南京,210007刊名：兵工自动化 ISTIC英文刊名：ORDNANCE INDUSTRY AUTOMATION年，卷(期)：27(8)分类号：O159 TP183关键词：空中目标灰色综合关联度威胁度

技术关联度篇6

关键词：数据挖掘；电子商务；关联分析；系统

中图分类号：TP311.13 文献标识码：A文章编号：1007-9599 (201105-0000-01

Data Mining Technology Application in E-commerce Based on Correlation Analysis

Wu Juhua

(Xinxiang University,Xinxiang453000,China)

Abstract:This paper introduces data mining application in e-commerce,focusing on data mining technique of association analysis.Associated with data mining techniques to develop effective,practical data mining system.

Keywords:Data mining;E-commerce;Correlation analysis;System

随着计算机技术，网络技术和数据库技术的成熟。商务电子平台为客户提供了便捷，商家要了解客户的购买情况，需要对大量的购买数据进行分析，主要分析客户的喜好，对产品的要求，以及购物的具体需求，这样数据挖掘技术对具有海量的购买数据进行分析，可以得出有价值的信息，这些信息为企业的决策提供了重要的参考依据。目前很少有做电子商务的企业会考虑到应用数据挖掘服务，随着硬件发展的加快，如今的服务器都可以做数据挖掘的分析，因此，在电子商务平台应用数据挖掘技术是未来发展的一种趋势，这样可以避免企业造成决策上的失误。

数据挖掘技术发展了数十年，一直停留在技术的研究，近几年数据挖掘技术被广泛的应用在各个领域，也越来越多的走近我们的生活，现在也具备实现数据挖掘技术在电子商务平台应用的条件，与电子商务销售关系最密切就是关联分析算法，选择这个算法就是为了判断客户与商品之间的关系，从大量的数据分析客户潜在的购物需求。本文结合数据挖掘技术在电子商务中的应用，以数据挖掘的关联分析这个技术角度进行分析，指出各种数据挖掘技术适用的场合，以便开发出切实可用的数据挖掘电子商务系统。

一、相关应用技术概念

关联规则的概念和模型首先是由R.Agrawal和R.Srikant于1994年提出的。目前对关联规则的研究可分为以下几类：一是按变量的类别。二是按数据的抽象层次。三是按数据的维数。

关联规则定义为：假设I是项的集合。给定一个交易数据库，其中每个事务（Transaction）t是I的非空子集，即，每一个交易都与一个唯一的标识符TID（Transaction ID）对应。关联规则在D中的支持度（support）是D中事务同时包含X、Y的百分比，即概率；置信度（confidence）是包含X的事务中同时又包含Y的百分比，即条件概率。关联规则是有趣的，如果满足最小支持度阈值和最小置信度阈值。这些阈值是根据挖掘需要人为设定。

关联规则挖掘过程主要包含两个阶段：第一阶段必须先从资料集合中找出所有的高频项目组（Frequent Itemsets），第二阶段再由这些高频项目组中产生关联规则（Association Rules）。

Apriori算法是Rakesh Agrawal和Rnamakrishnan Srikant在1998年提出的关联规则的经典算法，它利用已知的高频数据项集推导其他高频数项集，是一种宽度优先算法。

二、数据挖掘求解问题的步骤

关联规则求解问题的步骤为：

（一）预处理与采掘任务有关的数据，根据具体问题的要求对数据库进行相应的操作，从而构成规格化的数据库D。数据的格式对挖掘起着至关重要的作用，要合理有效的把原数据格式化成规范化及合理的形式，这样可以让结果更准确。

（二）针对D，求出所有满足最小支持度的项集，即大项集，此步是算法的核心。求出的项集数目非常大，要合理的筛选和分析，找出最佳条件。

（三）生成满足最小可信度的规则，形成规则集R，解释并输出R。

三、数据挖掘在电子商务的实际应用

（一）在进行数据挖掘项目之前需要对数据进行预处理，数据预处理是知识发现中很重要的一个环节，占整个项目的60%的工作，高效的算法往往依赖于高质量的或者特殊要求的数据，数据预处理主要包括三个步骤：数据清理、数据集成和数据变换。数据清理是清除一些冗余数据，消除噪声数据，把不符合要求的数据去掉。数据集成需要把多种不同的数据源集中在一起，形成统一要求和规则的格式，有时候还需要把属性值合并，集成的数据还可以降低数据的维数，减少无用的变量等。

（二）数据建立好之后，就需要建立挖掘的模型，同一数据表有很多种不同模型，建立的模型不同，那么挖掘出来的效果和准确性不一样，或者在定义的时候分析的内容也不一样，模型的建立应该建立在所要达到的目的的基础上，那么这个就是涉及到输入的列和预测的列，不同的列得到的结果不同，所以要明确项目的目的，在关联规则中，为了预测客户与商品间的关联性，可以输入全列和预测全列，得到不同的组合，主要因为关联规则主要是得出属性之间的关系，所以基本上可以把数据即当作输入列也当作预测列。模型建立好后可以随时修改模型，互相对比以期得到最有价值的信息。

（三）进行相关项目挖掘后，会得到模型挖掘结果，这时候就需要对模型的挖掘结果进行理解和评估，得到有用的信息才可以真正应用到实际需求定位。分析结果的时候首先要判断其概率，正确性，准确性等数值是不是达到标准要求，首先取概率最高的结果，然后从概率最高的结果查看正确性，正确性高也不能代表结果符合要求，另外还要查看准确性图表，准确性图表反映挖掘在实际过程应用过程的基本情况，要提高准确性可以修改模型进一步进行项目挖掘，对比每次挖掘的图表可以找到好的模型结构。

（四）对结果理解之后在应用到实际过程中，需要进行有效的分析，应用实际过程中，要跟踪分析，收集相关信息进一步做下一次挖掘的项目数据，有效的更改计划，让商品更符合客户需求的实际情况。然后根据数据挖掘对数据分析的结果，对电子商务系统不断调整，以符合最近时期的市场，在这个过程中，不断完善数据的收集和分析，使得数据挖掘系统和电子商务系统形成有机的整体。

参考文献：

[1]陈安,陈宁.数据挖掘技术及应用[M].科学出版社,2006

[2]葛志远.电子商务应用与技术[M].清华大学出版社,2005

[3]邓鲲鹏.数据挖掘与电子商务[J].商场现代化,2007(25):94

[4]Larry L.Peterson，Bruce S.Davic. Computer Netword. Morgan Kaufmann Press.New Zealand,2002

[作者简介]

技术关联度篇7

201 1年底,我国汽车保有量超过1亿辆,仅次于美国,位居世界第二,预计到2020年,我国汽车保有量将超过2亿辆,我国石油消费的快速增长将导致未来会面临严重的交通能源问题。此外,传统燃油汽车的尾气排放是全球温室气体排放的主要来源之一,我国已成为世界第二大CO2排放国。因此寻求无污染或低污染的绿色汽车,成为我国未来汽车的发展方向。我国2012年4月18日召开的国务院常务会议讨论通过了《节能与新能源汽车产业发展规划(2012—2020年)》,预示着“十二五”期间,我国新能源汽车将正式开始进入产业化发展阶段。新能源汽车是指动力来源采用非常规、非传统的车用燃料,技术先进、具有新结构的汽车。新能源汽车有很多种类,例如:纯电动汽车、混合动力汽车、燃料电池汽车、燃气汽车以及氢发动机汽车、醇醚汽车等[1]。

美国侧重研发氢燃料电池汽车和充电式混合动力汽车,并开始逐步推广乙醇燃料汽车[2]。欧洲重点研发了氢燃料电池汽车和氢内燃机汽车,其生物柴油汽车的产业化水平居于世界前列[3]。日本侧重于混合动力汽车技术的研发,已成功向市场推出了多款混合动力车型[4]。我国对于新能源汽车产业的研究与西方发达国家相比,起步较晚。国内学者主要对新能源汽车的技术发展水平和政策措施影响进行了总结和研究。其中,刘明岗、郭芙琴分别从纯电动车的驱动系统的设计、锂离子动力电池的安全性、充电设施的设计3个角度做了研究[5,6]。郝娟、谭敏等探讨了充电设施的设计、电动汽车充电站的充电模式[7,8]。王善生基于“能源碳足迹”对纯电动汽车的技术经济性进行了分析[9]。杨萍、易克传通过SWOT分析探讨了后危机时代我国发展新能源汽车的优势与劣势,威胁与机会[0]。李金津、张晓宇等分析了我国新能源汽车产业的发展现状及存在的问题,并相应地对我国新能源汽车产业的发展提出建议[11,12]。艾民等运用钻石模型理论,将我国的新能源汽车产业与发达国家相比,分析了我国新能源汽车发展的竞争优势与劣势[13]。陈学有、文明浩研究了电动汽车接入对电网运行的影响及经济效益综述[14]。此外,章道彪对各种主要类型的汽车进行对比分析,探讨了我国新能源汽车技术的发展路线[15]。

本文基于新能源汽车的技术特点,将6大类别的新能源汽车细分为10类,考查了各种新能源汽车技术的特点后,选取了5个指标,即技术成熟性、经济适用性、环境保护性、能源效用性和资源禀赋性来构建新能源汽车技术5维评价指标体系,采用了将主观与客观相结合的改进的灰色关联度法对这10类新能源汽车技术进行综合评价,对各类新能源汽车的发展优势与劣势进行了分析,从而对我国新能源汽车技术的发展路线提出建议。

1 改进的灰色关联度法

灰色关联度分析是基于邓聚龙教授1981年首次提出的灰色系统概念,主要根据空间理论的数学基础,来认识系统中各因素之间的主要关系。对2个系统或2个因素之间关联性大小的度量,称为关联度。它描述系统发展过程中因素间相对变化的情况,即变化大小、方向及速度等指标的相对性。运用灰色关联度法进行综合评价,可以在很大程度上减少由于信息不对称带来的损失,并且对数据要求较低,工作量较少,传统灰色关联度法中最后关联度的计算是对关联度系数直接加权平均得到,本文将对此做出改进,步骤如下:

(1)确定参考数列

运用灰色关联方法进行综合评价时,评价标准是各指标中的最优值。对于“效益型”指标(指标值越大越好型),取各序列中的最大值为参考;对于“成本型”指标(指标值越小越好型),取各序列中的最小值为参考。对于有m个评价指标、n个评价对象的评价体系,参考数列记为C0(j)={C0(1),C0(2),…,C0(m)}

(2)指标值的无量纲化

为减少随机因素的干扰并便于比较,按下式对最优指标集和各序列指标进行无量纲化处理:

(3)计算灰色关联系数

根据灰色系统理论,比较数列Ci对参考数列C0在指标Ci(j)上的关联系数:

其中,i=1,2,…,n;j=l,2,…,m;ρ为分辨系数,其值在0～1之间,通常取0.5。其作用在于提高关联系数之间的差异显著性。

(4)计算综合灰色关联度

记综合关联度为:

其中,权重ωk的计算采用主观的五级标度赋值法与客观的熵值法综合确定,设五级标度赋值法确定的权重为ω1k,熵值法确定的权重为ω2k,则ωk=(ω1k+ω2k)/2。

则综合灰色关联度为:

γi值越大,则说明相应方案越优。

2 我国新能源汽车技术综合评价

2.1 评价指标的构建与预处理

基于各种新能源汽车技术的特点,本文选取技术成熟性、经济适用性、环境保护性、能源效用性和资源禀赋性5个指标,从5个维度来进行分析,技术成熟性主要是考查新能源汽车技术进入产业化发展的技术水平;经济适用性主要指成本及价格,当前我国纯粹出于环保角度考虑购买新能源汽车的消费者基数还较小;环境保护性主要是指温室气体以及有害气体的排放量;能源效用性指的是从一次能源到终端使用整个过程中能源的利用效率;资源禀赋性主要考虑的是各种新能源汽车所使用的能源的可获得性。

采用比较分析法来确定各指标值,即对某一个指标在各种新能源汽车技术中进行比较,采用1-10分的打分制,针对某一评价指标,相对最好的打10分,相对最不好的打1分。通过专家打分得出其5维指标的具体数值[1],如表1所示。

本文选取的5个评价指标均属于“效益型”指标时,则取各方案中的最大值构成参考数列C0(j)=1 0,10,10,10,10,根据式(1)对最优指标集和各方案指标进行无量纲化处理的结果如表2所示。

2.2 关联度系数的计算

依据式(2)计算关联度系数的结果如表3所示。

2.3 综合关联度的计算

(1)权重的确定

权重确定方法的选择直接影响到综合评价的可行性与质量,主观赋权法是指人们基于知识和经验,由决策分析者根据各指标的主观重视程度而赋权的一类方法;客观赋权法一般根据所选指标的实际信息形成决策矩阵,在此矩阵基础上通过客观运算形成权重。本文将主观赋权法与客观赋权法相结合,选用五级标度赋值法与熵值法来确定权重。

1)五级标度赋值法确定权重的步骤如下:

指标j与k同等偏好,取djk=djk=4。

指标j比k稍微偏好,取djk=4+1,djk=4-1。

指标j比k明显偏好,取djk=4+2,dkj=4-2。

指标j比k极端偏好,取djk=4+4,djk=4-4。

从而得赋值矩阵:D=(djk)m×m

5个指标分别为技术成熟性、经济适用性、环境保护性、能源效用性和资源禀赋性。则通过主观判断可得赋值矩阵为

计算各个指标的五级标度优序数:

从而可得对指标的主观偏好权重:

计算结果如表4所示。

2)熵值法确定权重的步骤如下:

设决策矩阵为:

xij为第j个指标属性下第i个方案的指标值。则:

计算第j项指标下,第i个系统的特征比重或贡献度:

式中:pij为第j个指标属性下第i个方案的贡献度,所得结果如表5所示。

熵ej表示所有方案对第j个指标的贡献总量:

其中,常数k一般取k=l/lnn,以保证0≤ej≤1。

计算指标xj的差异性系数gj:差异性系数gj表示第j个指标下各方案的贡献度的不一致性程度,由gj=1-ej确定。gj越大,越重视该指标的作用。

权重wj为经归一化后的权重系数,由式(9)确定的计算结果如表6所示

(2)综合关联度的计算

依据式(3)先计算得权重ωk如表7所示,再计算得关联度,最后根据式(4)计算综合关联度,并按照关联度越大、方案越优的原则进行综合排名,所得结果如表8所示。

从表8可以看出,运用改进灰色关联度法对我国的10种新能源汽车技术进行综合评价后得到的综合排序为:氢燃料电池、天然气、纯电动(基于水电、煤电)、纯电动(基于太阳能、风能等)、可充电式混合动力、氢动力、油-电混合动力、二甲醚、生物燃料(粮食原料)、生物燃料(非粮食原料)—。

综上所述,能量效率高、低污染、零排放的氢燃料电池汽车,综合评分第一;天然气汽车在经济性和技术性上占据优势,且我国天然气资源相对充足,综合排名第二;纯电动汽车,不管是基于传统能源还是新能源,由于具有良好的环保性能,纯电动汽车技术综合排名比较靠前;可充电式混合动力汽车能量利用效率较高,污染和温室气体排放也相对较低;氢动力汽车技术相对成熟、成本也较低,但是能量的利用率过低,综合排名第六;油-电混合动力汽车具有广泛的适应性,但是成本相对较高,且其环保性能相对差一些,综合排名第七;此外,二甲醚汽车技术在污染和温室气体排放方面存在较大的劣势排名较靠后;生物燃料汽车的环境性能较差以及资源效率较低,综合排名在最后。

3 结论

技术关联度篇8

近年来, 美国经济复苏不强, 欧盟国家不断爆发债务危机, 对外需求降低; 我国内部则实施货币紧缩, 严控信贷, 加上人力成本快速增加, 致使企业效益下降, 经济增长缓慢, 企业营运困难, 对经济可能硬着陆和停滞性通货膨胀的预期不断。自2011年以来, 我国整体企业效益持续下滑, 企业亏损额和亏损企业数目不断增加, 导致长三角地区出现大量企业停工和半停工, 具体调查中小企业特别是小型、微型企业的经营状况可能比2008年金融危机时期更为艰难。我国一直以来提出要转变经济发展方式, 中小企业的率先转型对我国经济结构调整是个重大的突破点, 所以如何减轻中小企业的生存压力, 提高中小企业的竞争力, 扶持和鼓励企业技术创新, 通过财政与金融手段帮助中小企业转型, 让中小企业走出去、参与国际竞争, 都是当务之急。而企业要转型, 必须注重自主创新, 必须根据企业的自身环境和现阶段所拥有的技术, 制定长期的技术创新战略, 以领先创新为基础、跟随创新和模仿创新为辅, 努力提高自身的技术创新能力, 保持竞争力, 从而实现企业的顺利转型。

长期以来, 我国工业比重过高且附加值低, 服务业发展滞后, 过度依赖加工制造环节, 生产多集中于价值链低端, 缺乏自主技术和品牌, 形成经济持续性发展瓶颈; 全球高技术发展迅速, 而我国企业面临的却是缺乏核心技术、创新能力不强, 很多关键性技术依靠进口, 因此我国 “十二五” 规划强调必须改变现有经济结构, 转变经济增长方式, 促进战略性新兴产业发展, 努力提高我国企业的自主创新能力, 利用现阶段所掌握的技术力量, 采用技术突变来推动企业技术创新、迅速占领市场, 从而获得市场主动权和领先权, 为企业带来更大的生存和利润空间。技术突变下的自主创新, 主要是指基于新技术原理指导下的技术和产品开发战略, 定位于技术的率先性和市场的领先地位[1]。对企业自主创新能力所处位置的正确了解和评估对企业制定自主创新战略具有重要的意义。现有关于技术突变下企业自主创新的研究主要集中在企业自主创新的战略方面, 如张世龙等[1]研究了技术突变下企业自主创造战略定位方法, 马尚平等[2]研究了技术突变下后发大国自主技术创新战略, 而关于技术突变下企业自主创新能力的评价方法及其理论体系的研究还未见研究成果。所以本文将综合考虑技术突变下企业自主创新能力具有一定的未知性和不可知性, 提出一种灰理想熵方法, 并将其运用于技术突变下企业自主创新能力评价过程中, 充实技术突变下企业自主创新能力评价的理论体系。

2技术突变下企业自主创新能力评价指标体系

技术突变下企业自主创新能力评价是一个系统工程, 而且在整个评价过程中, 考虑到技术突变需要一定的技术基础, 但是具体会有什么样的创新还处于未知和不确定性状态, 所以在企业的创新能力评价过程中也存在一定的未知性和不确定性。一般对企业自主创新能力的评价过程主要包含四个主体部分: 第一部分就是确定创新能力评价指标体系。要评价技术突变下的企业自主创新能力, 首先要考虑从哪些方面着手评价, 只有确定了企业自主创新能力的影响因素, 才能有目的性地去调查和研究, 从而给出具体的企业创新能力评价结果。第二部分是各影响因素的重要性确定。企业自主创新能力的影响因素很多, 但是每个因素的影响程度是不一样的, 必须充分考虑各影响因素的重要性, 才能给出科学可信的评价结果, 从而为企业进行技术突变创新战略制定和实施起到可操作性的指导意见。第三部分是评价过程, 即选择科学的评价方法。对企业自主创新能力评价的过程是从各个影响因素来进行分析和数据采集的, 最终需要将所采集的数据进行融合, 从而得到一个综合的评价结果, 这就涉及到信息融合方法的选择。较好的信息融合方法不仅要求能有效地保留评价信息, 更要求能充分体现各比较目标的差异。最后一个部分则是反馈。任何评价的目的是了解现状, 并对评价结果进行反馈, 从而给决策者提出可参考性的建议, 同样的, 技术突变下企业自主创新能力评价过程也是需要对评价结果进行反馈的。通过创新能力评价结果, 首先可以了解本企业的创新能力在同行业中的位置; 其次是通过了解本企业的创新能力现状, 为企业的人力资源引进和物质资源配置及宏观创新政策的制定提供一定的决策参考意见。

作为技术突变下的企业自主创新能力评价, 评价指标的确定是一个需要解决的问题。现有关于技术突变下企业自主创新能力的评价体系的研究虽然较少, 但是关于企业自主创新能力评价还是有一定的研究成果的, 本文结合技术突变的实现需求和企业自主创新能力评价的研究现状, 选择以下几个指标作为技术突变下企业自主创新能力的评价指标:

( C1) 企业本身的技术能力。企业技术创新必须是在具有一定基础下的创新, 不可能没有任何技术能力就可以作出全新的创新, 所以企业本身的技术创新能力是一个重要的影响因素。

( C2) 新技术信息获取能力。技术突变下的创新不是 “闭门造车”的过程, 而是充分利用所获取的新技术信息, 并结合自身的技术能力, 才能提出突变性的技术革新, 所以在企业自主创新过程中必须考虑一个企业的新技术信息获取能力。

( C3) 研究开发能力。技术创新是需要消耗大量的物力和人力资源, 要获得突变下的技术创新, 必须要拥有一批梯队性的高素质研发团队和足够的研发资金支持, 所以一个企业的研究团队的素质高低与研发资金的充足量如何决定了一个企业的研究开发能力。

( C4) 激励机制。重赏之下必有勇夫, 同理, 合理的内部激励机制不仅能调动企业研发人员的自我价值实现的愿望, 也能解决研发人员的后顾之忧, 从而全心全意地为企业技术革新服务, 进而提高企业的创新能力, 缩短产品创新周期。

( C5) 管理和协调能力。企业产品的研发不仅仅是研发部门的任务, 它是需要整个企业各个部门的共同参与才能获得突变下的创新, 所以领导者的管理能力和各种资源的协调分配能力起到关键作用。好的协调不仅能让各部门顺利地完成各自工作, 还能让员工心情舒畅, 从而更好地为企业服务。

( C6) 其他相关能力。突变下的企业自主创新能力还受到企业文化, 特别是企业风险偏好的影响。一般风险偏好于冒险型的企业在获取技术突变下的创新成果机会更多, 但是其相应的成本也会很高, 因为并不是每次冒险开发都有相应的成果出现的。还有就是企业的组织能力以及产品营销和生产能力都对企业创新能力具有一定的影响。

通过以上分析可以发现, 在技术突变下企业自主创新能力的评价指标主要有6个, 分别是: ( C1) 企业本身的技术能力; ( C2) 新技术信息获取能力; ( C3) 研究开发能力; ( C4) 激励机制; ( C5) 管理和协调能力; ( C6) 其他相关能力。

3技术突变下企业自主创新能力评价指标权重确定方法

关于指标权重确定的方法, 经过学者们多年的研究, 基于不同的方法已经获得了一定的研究成果, 而层次分析法因其能综合考虑定量和定性分析从而得到广泛的应用, 所以在对技术突变下企业自主创新能力评价指标权重确定后, 可以利用层析分析法来对其进行权重确定[3], 即针对企业自主创新能力这一目标, 考虑6个评价指标的相对重要性, 通过任意两个指标的重要性进行比较, 采用1 ~ 9评价标度, 从而得到互反判断矩阵, 并由满足一致性的判断矩阵导出技术突变下企业自主创新能力评价指标的权重。

利用1 ~ 9标度法对C1 ~ C6这6个评价指标的重要性进行两两比较, 通过调查得到互反判断矩阵为:

对该互反判断矩阵利用特征值确定权重法确定6个评价指标的权重向量为:

4建立技术突变下企业自主创新能力的加权灰理想熵评价方法

灰关联分析是贫信息系统分析的有效手段, 主要是根据线的几何形状相似程度来判断因素之间的关联程度[4]。现有的灰关联方法的共同点是, 在确定关联度时都采用计算逐点关联系数平均值的方法, 这样导致关联系数值大的点决定了总体关联程度, 且采用的平均值掩盖了许多点的关联系数, 所以张岐山等提出了灰关联熵的分析法方法。本文在灰关联熵的基础上, 基于理想解 ( TOPSIS) 的原理[5], 建立一种技术突变下企业自主创新能力的加权灰理想熵评价方法。

4. 1基本理论知识

设比较列数据为x0= { x0 ( 1 ) , x0 ( 2 ) , …, x0 ( n) } , 比较数列为:

对于任意ρ∈ (0, 1) , 计算第k个指标下xi与x0的关联系数:

计算xi与x0的灰关联度:

定义1[6]:设灰色内涵数列p={p1, p2, …, pn}满足, 则定义该数列灰熵为:

为了克服灰色关联度的不足之处, 可以将计算xi与x0的灰关联度的公式修改成计算xi与x0的灰熵关联度的方法来改进灰色关联度来刻画点列xi与x0的相似程度, 即先对xi与x0的关联系数ξi={ξi (1) , ξi (2) , …, ξi (n) }进行归一化, 得到:

其中

经过归一化的pi ( k) ∈ ( 0, 1) , 可以计算出xi与x0的灰熵为:

取, 则xi与x0的灰熵关联度为:

4. 2加权灰理想熵关联度评价方法

在对技术突变下企业自主创新能力评价的过程中, 选择m个企业考察其在技术突变下的自主创新能力, 通过聘请相关专家采用百分制的形式给分, 并通过调查和数据分析, 取参加评分者的均值作为评价结果, 得到的评价矩阵为:

其中xij表示第i个企业在第j个评价指标下的评价值。

在对技术突变下企业创新能力总体评价过程中, 考虑到每个因素的重要性不同, 所以应该对评价矩阵先进行加权, 即得到加权后的评价矩阵为:

在对企业自主创新能力评价的过程中, 一般希望每个企业的评价应该与最好的评价 (记做正理想解) 最近, 而与最差的评价 (记为负理想解) 最远, 基于这样的原理, 可以利用理想解法 (TOPSIS) 来对企业自主创新能力进行排序。在确定理想解的过程中, 正理想解的选择一般可以选择评价矩阵中每项评价指标的最大值, 即;负理想解则选择每项评价指标的最小值, 即, 。基于这样的原理, 即可选择出正理想解参考列B+= (b1+, b2+, …, b6+) 和负理想解参考列B-= (b1-, b2-, …, b6-) , 并记第i个企业的加权自主创新能力评价向量为Ai= (ai1, ai2, …, ai6) , (i=1, 2, …, m) 。

在对技术突变下企业自主创新能力评价的过程中, 为了了解企业所处同行业的位置, 需要对企业自主创新能力进行排序, 而在排序的过程中应该考虑每个企业与正理想解最近, 而离负理想解最远, 所以利用灰熵关联度来刻画被评价企业与参考列即正负理想解之间的灰熵关联度, 从而实现排序。下面给出基于灰理想熵关联度的评价方法:

首先将正理想解作为参考列B+= (b1+, b2+, …, b6+) , 而每个企业的加权评价向量作为比较序列Ai= (ai1, ai2, …, ai6) , (i=1, 2, …, 6) , 依次计算第k个指标下Ai与B+的关联系数:

从而得到关联系数矩阵 ξ+, 并对该关联系数矩阵 ξ+按行归一化得到归一化后的关联系数矩阵为P+:

从而可以计算出第i个企业与最优理想解之间的灰熵为:

令, 则第i个企业与最优理想解 ( 正理想解) 之间的灰熵关联度为:

同理, 以负理想解B-= (b1-, b2-, …, b6-) 为参考列, Ai= (ai1, ai2, …, ai6) , (i=1, 2, …, 6) 为比较列, 计算第k个指标下Ai与B-的关联系数为:

对其归一化得到归一化后的关联矩阵P-= (pi (k) ) m×6, 并利用该关联矩阵计算第i个企业与最差理想解之间的灰熵为:

令) , 则第i个企业与最差理想解 (负理想解) 之间的灰熵关联度为:

通过以上计算, 即可得到各企业与正理想解的加权灰熵关联度为:

以及企业与负理想解的加权灰熵关联度为:

则根据贴近度的定义, 可以得到第i个企业与理想解的灰理想熵关联度为:

在对方案进行排序的过程中, 一般来说, 各企业的评价值与理想解的灰理想熵关联度越大, 则表示该企业在技术突变下企业自主创新能力越优, 所以最终对企业的排序依据是企业与理想解的灰理想熵关联度越大, 则其创新能力强, 该企业在同行业中自主创新能力的地位也就越靠前。

5结语

经过多年的经济高速增长, 我国出现资源过度消耗、环境破坏严重、产能过剩等负面效应, 为了保证我国经济的快速稳步增长, 必须加快我国新兴产业的发展, 注重节能环保、新信息技术、生物制药、高端装备制造、新能源、新材料与新能源汽车等七大新兴产业的发展, 而这些产业的发展必须依靠高新技术的研究和创新才能得以持续发展。企业必须依据现有的自主技术创新能力和国家 “十二五”规划的大好环境, 多利用现有的研究成果, 多开展行业合作创新, 努力实现技术突变下的自主创新, 提升企业竞争力。而实时了解企业的自主创新能力所处同行业的地位和现状, 也是对企业自主创新能力的评价和自主创新宏观政策制定的一个必须的过程。

本文在改进了以往灰色关联度和灰熵关联分析法的基础上, 引入了TOPSIS方法, 构建了加权灰理想熵关联度的技术突变下企业自主创新能力评价方法, 该方法操作简便, 计算量小, 易于程序实现。所以本文所给方法可操作性较强, 有效充实了技术突变下企业自主创新能力评价体系; 同时本文所建立的方法也适用于其他任何学科的决策过程。

摘要：技术突变下企业自主创新能力的评价是了解企业创新能力所处同行业地位并开展行业技术创新合作的一个关键问题。首先分析并构建技术突变下企业自主创新能力评价指标体系, 在利用层次分析法确定指标权重后, 着重建立技术突变下企业自主创新能力的加权灰理想熵关联度评价方法。该方法有效克服了灰关联度的不足, 且操作简便。

关键词：技术突变,自主创新能力,灰理想熵关联度,评价方法

参考文献

[1]张世龙, 崔娜, 马尚平.技术突破下企业自主创新战略定位方法研究[J].科技进步与对策, 2012, 29 (2) :72-75

[2]马尚平, 梁小红.技术突变下后发大国自主技术创新战略研究[J].科技进步与对策, 2009, 26 (22) :1-5

[3]许树柏.层次分析[M].天津:天津大学出版社, 1988

[4]邓聚龙.灰理论基础[M], 武汉:华中科技大学出版社, 2003

[5]殷春武.模糊多准则群决策方法研究[D].西安:西安理工大学, 2007

技术关联度篇9

近年来随着Internet的飞速发展, 计算机网络的资源共享进一步加强, 然而资源共享与信息安全历来都是一对矛盾, 网络的安全正面临着越来越严重的挑战。入侵检测技术的出现可以使网络管理员可以获知攻击的发生, 但传统入侵检测技术只能在一定的程度上得知攻击的发生信息, 网络管理员不能获知网络攻击的威胁程度, 不能获知相关的网络安全态势信息, 从而使网络管理员对现实的网络情况做出相应的决策具有很大的难度。

未来的网络应用需要更高的安全性, 这就要求网络管理员要及时地掌握网络安全态势信息, 并及时地做出相应的操作来消除攻击的威胁。网络安全态势评估技术就是解决上述问题的一种新型网络安全技术。

1 网络安全态势评估模型及基于模糊信息融合技术的攻击要素关联

根据waltz的网络安全态势评估总体框架, 文献[1]设计了网络化系统安全态势评估模型。系统分为两个子系统:攻击检测系统和安全态势量化评估系统 (见图1) 。

在对攻击进行评估时, 需要考虑攻击本身的强度和攻击获得成功的难易程度。单纯的入侵检测系统不能给网络管理员提供具体的态势信息, 而只是产生大量的系统信息和底层数据。系统必须将攻击数据提炼成为攻击信息, 进而提炼成为攻击知识后才能为网络管理员所理解、运用。但是由于上述三个攻击要素具有不确定性、非完整性、模糊性和多变性的特点, 因此很难对其进行界定和关联。本文主要探讨第一个子系统, 即基于模糊信息融合技术的攻击要素关联。

2 攻击要素的定义

2.1 攻击危害度C1

结合文献[2]中的不足, 本文对攻击危害度C1的定义:

网络攻击的危害度是指网络攻击对整个应用系统造成危害的程度。对于第k类网络, 第t类攻击的危害度Hkt可由公式 (1) 计算得出。

$C_{1}_{k t} = Ν_{k} (100 A_{t}) (\frac{1}{4} \sum_{r = 1}^{4} C_{t r})$ (1)

本文中假设当前有3种网络类型, 其网络类型影响因子Nk赋值如表1。

攻击类型的划分采用了以攻击侵入层次为依据的分类法, 该方法主要来自于普渡大学的Kumer S的博士论文[3]中的分类法, 将网络攻击分为如表2所示的7类, 以攻击侵入层次递增的顺序排序。At表示第t种攻击类型的影响因子, 见表2。

2.1.1 攻击源影响因子Ct1

攻击的来源。取值为“内部”和“外部”两种。来自内部的攻击一般比来自外部的攻击危害度大, 见表3。

2.1.2 攻击目标影响因子Ct2

攻击针对的目标。根据重要性分为“重要主机”和“一般主机”, 其中重要主机可以根据需要细分为各种服务器, 见表4。

2.1.3 受影响范围影响因子Ct3

表示攻击成功后目标系统受影响的范围。分为“单机单用户”、“单机所有用户”和“网段”3类。

2.1.4 可恢复程度影响因子Ct4

表示攻击成功后目标系统恢复的能力。分为“现场可恢复”、“离线可恢复”和“不可恢复”3类, 见表6。

2.2 攻击难易性

攻击难易性是指该实施某类攻击获得成功的难易程度, 也可以看成是某类攻击发动成功的概率。攻击难易性的计算是通过对被攻击系统是未免疫系统的可能性的计算来完成的。

结合文献[3]并针对其不足, 本文对攻击难易性进行了如下改进。定义如下变量:

HT—目标系统是未免疫系统的类型;

HVT—目标系统是未免疫系统类型的未免疫版本;

ST—目标系统上的服务是未免疫服务类型;

SVT—目标系统上的服务是未免疫服务类型的未免疫版本。

根据系统类型和服务类型的情况, 本文相应地给定一个0—10 之间的值 (如表7) 。将两个值相乘得到攻击难易性值。

2.3 攻击频率

攻击频率是指单位时间内, 网络化系统内某类型网络攻击A被检测出所发生的次数。

3 基于Mamdani模糊推理的攻击要素关联算法。

3.1 输入变量模糊化

本文中输入变量攻击危害度C1、攻击难易度C2、攻击频率C3模糊化均采用三角形隶属度函数[5]。

f (x;

$a, b, c, d) = {\begin{cases} 0, x \leq a; \\ \frac{x - a}{b - a} ‚ a \leq x \leq b; \\ \frac{c - x}{c - b} ‚ b \leq x \leq c; \\ 0, c \leq x 。 \end{cases}$

3.2 应用模糊算子

由于攻击要素包含三个部分, 所以我们给定的规则前有三个命题。这三个命题存在“与”的关系, 本文使用的模糊算子取与算子min (模糊交) 。

3.3 模糊蕴含

在Mamdani算法中模糊蕴涵选取的是最小运算 (Mamdani) :

A→B=min (μA (x) , μB (y) ) 。

3.4 模糊合成

在Mamdani算法中模糊合成选取的是max (模糊并) 。

3.5 反模糊化

反模糊化把输出的模糊集化为确定数值的输出, 在Mamdani算法中反模糊化使用的是中心法 (Centroid) 。

4 仿真实验验证

仿真实验过程分为攻击要素关联和层次态势融合两部分, 其中攻击要素关联实验采用MATLAB 7.0模糊工具箱 (Fuzzy ToolBox) [6], 层次态势融合 (在本文中不做描述) [1]则使用MATLAB 7.0中数值计算功能和统计计算功能, 最终结果通过MATLAB 7.0中图形处理功能展现出来。在本文中采用了2000年11月的HoneyNet数据集[7], 所选用的实验环境变量如下:

4.1 攻击危害度指数C1

根据公式 (1) , 得出

C1=0.5×At×100× (0.7+1+0.7+0.5) /4=35At。

4.2 攻击难易性指数C2

在分析报警数据后, 没有发现一些不相关的无效攻击。本文得出难易性指数C2=系统类型值H×服务类型值V=10×10=100。

4.3 攻击频率指数C3

在本仿真实验中规定攻击频率指数C3=100×攻击次数/MAX。这样就可以解决在模糊推理过程中反复调整输入数据隶属度函数参数的问题。

4.4实验结果与分析

HoneyNet 系统服务级安全威胁态势 (以107主机为例) 直观地给出三个服务的安全态势, 见图2。给管理员提供以下直观信息:相对于其他两个服务, 系统中开通的rpc服务受到频繁攻击。这说明rpc服务可能存在较多或较容易攻破的漏洞, 值得管理员对这个服务的设置情况进行检查。另一方面, 这也可能说明针对rpc服务的攻击是当时网络攻击的主要目标。

5 结论

本文首先提出了网络化系统安全态势评估模型, 进而详细定义了三个攻击要素:攻击频率、攻击难易性和攻击危害度, 使之可以更加精确的表示攻击次数、攻击成功概率和攻击造成的严重后果。然后结合模糊信息融合技术, 针对攻击信息的不确定性、不完整性、模糊性和多变性的特点, 提出了使用Mamdani模糊推理算法来实现攻击要素的关联。通过仿真实验证明该算法可以有效地将IDS产生的海量数据融合为可供网络管理员方便使用的安全态势值。

摘要：主要针对当前网络安全态势知识不易获得的问题, 提出了自己的网络化系统安全态势评估模型并定义了攻击要素。继而使用动态的方法量化了攻击频率、攻击难易性和攻击危害度, 使之可以更加精确地表示攻击次数、攻击成功的概率和攻击造成的严重后果。同时针对攻击信息的不确定性、不完整性、模糊性和多变性的特点, 提出将一种模糊信息融合方法——基于Mamdani模糊推理的算法来实现攻击要素的关联。最后, 应用Matlab7.0仿真实验工具进行了仿真, 实验结果证明, 本文提出的算法可以真实地反映安全态势情况。

关键词：网络安全态势评估,模糊信息融合,攻击要素,关联

参考文献

[1]孙宁.网络化系统安全态势评估设计及态势融合模型研究.硕士学位论文, 兰州:兰州理工大学, 2007

[2]张怡, 张拥军, 陈海涛, 等.一种新的网络攻击危害度定义方法.计算机工程, 2002;28 (8) :33—34

[3]Kumer S.Classification and detection of computer intrusions.Ph.D.Thesis, Purdue University, WestLafayette, Indiana, 1995:08

[4]王磊, 于洪奎, 谢慧, 等.针对具体主机的网络攻击危害度评估模型.计算机工程与设计, 2005;26 (6) :1519—1521

[5]郑亚林, 黄德隆, 郭健, 等.Fuzzy推理的Mamdani算法.宝鸡文理学院学报 (自然科学版) , 2001;21 (3) :168—173

[6]楼顺天, 胡昌化, 张伟.基于MATLAB的系统分析与设计——模糊系统.西安:西安电子科技大学出版社, 2001

技术关联度篇10

关联规则挖掘是数据挖掘中最活跃的研究方向之一,反映了大量数据中项目之间有趣的关联或相关联系。关联分析的目的就是为了挖掘出隐藏在数据间的相互关系。通过关联规则技术,可以发现这样一条规则:如果客户购买了某一种商品,那么他也可能会购买另一种商品。随着大量数据不停地被收集和存储,许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。

本文首先介绍了Web挖掘的一些基本概念及其当前发展的几个方向,然后将关联规则挖掘应用到Web的海量数据上,并给出了挖掘的基本算法,在此基础上挖掘出新的关联规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。

1 Web挖掘

1.1 Web挖掘概述

Web挖掘是利用数据挖掘技术从Web文档和Web服务器中发现并提取人们感兴趣的信息或知识的过程,涉及到Internet技术、人工智能、计算机语言学、信息学、统计学等多个领域。

Web包含了丰富和动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供了丰富的资源。然而,从以下的分析中可以看到,对Web进行有效的知识发现具有极大的挑战性:Web挖掘对象为数据的海量性;Web页面的复杂性;Web是一个动态性极强的信息源;Web面对的是一个形形色色的用户群体;Web上的信息只是很小一部分是相关或是有用的。这些挑战已经推动了如何有效地发现和利用因特网资源的研究工作,Web挖掘是一个极有挑战性的研究课题。

1.2 Web挖掘基本流程

Web上的信息是非结构化、半结构化的或动态的,并且是容易造成混淆,所以很难直接对Web网页上的数据进行挖掘,而必须经过必要的数据处理。典型Web挖掘的处理流程如下:

1.3 Web挖掘的分类

根据对Web数据的感兴趣程度不同,一般可以分为三类:Web内容挖掘、Web结构挖掘和Web用法挖掘。下面就这3个方面进行讨论:

Web内容挖掘即从网络的内容、数据、文档中发现有用信息的过程,Web内容挖掘的对象包括文本、图像、音频、视频和其他各种类型的数据。Web结构挖掘是从WWW的组织结构以及引用和被引用间的连接关系中推理得到知识,利用这些知识,可以对页面进行排序,发现重要的、权威的页面等。Web用法挖掘是指对互联网用户访问网络的行为进行分析挖掘,以获取描述其内在规律的模式。常用技术有:频繁项目集和关联规则。

1.4 Web挖掘的应用前景

Web挖掘的应用非常广泛,它已经广泛应用于金融业、远程通信业、制造业、医疗服务以及体育事业中,对它的应用研究正在成为一个热点。Web挖掘的应用前景主要表现在以下3个方面:电子商务,网站设计以及搜索引擎。

2 关联规则挖掘

2.1 基本概念

设I={i1,i2,…,im}是由m个不同项目组成的集合,D是交易数据库(亦称事务数据库)。其中,每一个交易或事务T是I中一组项目的集合,即X⊆I。关联规则是指形式如下的一种数据隐含关系:X→Y,其中X⊆I,Y⊆I,且X∩Y≠∅。

定义1 项目集X的支持数(支持度)。事务数据库D中支持项目集X的事务数称为项目集X的支持数,记为Count(X)。设事务数据库D中总的事务数为|D|,则项目集X的支持度为Count(X)/|D|,记为Sup(X)。

定义2 关联规则X→Y的支持数(度)。事务数据库D中支持项目集X∪Y的事务数称为关联规则X→Y的支持数,记为Count(X→Y)。关联规则X→Y的支持度为Count(X→Y)/|D|,记为Sup(X→Y)。

定义3 关联规则X→Y的置信度。关联规则X→Y的置信度定义为Count(X→Y)/Count(X),记为Conf(X→Y)。

为了挖掘出有意义的关联规则,需要给定两个阈值:最小支持度(Minsup)和最小置信度(Minconf)。关联规则挖掘的任务是在给定的交易或是事务数据库D中,发现D中所有的频繁关联规则。所谓频繁关联规则是指这些规则的支持度、置信度分别不低于用户给定的最小支持度和最小置信度。

2.2 关联规则的Apriori算法

Rakesh Agrawal等提出的Apriori算法最为著名,其基本思路将Apriori算法分成两步:

Step1:从事务数据库D中找到所有支持度不少于用户指定的最小支持度阈值的频繁项目集。在数据挖掘中,支持度不少于用户给定的最小支持度阈值的项目集简称为频繁项目集。

Step2:使用频繁项目集产生关联规则,产生关联规则的基本原则是其置信度不小于用户指定的最小置信度阈值。

Apriori算法的具体步骤:它是一种使用逐层搜索的迭代方法,首先找出所有频繁1-项目集L1;L1用于找频繁2-项目集L2;L2用于找频繁3-项目集L3,如此下去,直到不能找到频繁项目集为止。具体操作:Apriori算法的第一步是简单统计所有含1个元素的项目集出现的频率,以此决定频繁1-项目集;在第k步,分两个阶段,首先调用函数Apriori-Gen,通过第(k-1)步中生成的频繁(k-1)-项目集Lk-1来生成候选频繁k-项目集Ck,其次扫描事务数据库D计算选频繁k-项目集Ck中各元素在D中的支持数或支持度。其中,所谓候选是指候选中的项目集有可能成为频繁项目集,而不属于候选的项目集均不可能成为频繁项目集。此外,为了挖掘出事务数据库D中所有的频繁项目集,Agrawal等人还建立了项目集格理论。此理论的核心原理即为频繁项目集的所有非空子集也是频繁项目集;非频繁项目集的任何超集亦是非频繁项目集。

2.3 Apriori算法的改进

随着研究的不断深入,发现Apriori算法存在2个缺点:

(1) 必须耗费大量的时间处理规模巨大的候选项目集;

(2) 必须多次重复扫描事务数据库,对候选项目集进行模式匹配。

Agrawal等人提出了几种改进方法:

(1) 基于散列的方法。Park等人引入散列技术来改进产生频繁2-项目集的方法,当扫描事务数据库D中的每个事务时,可以产生每个事务的所有2-项目集,并将它们散列到相应的桶中,在哈希表中对应的桶计数低于min×|D|的2-项目集不可能是频繁2-项目集。

(2) 基于数据分割的方法。

(3) 基于采样的方法。

3 实际应用

由于编程的难度和硬件设施的限制,从一个介绍计算机应用基础的网站中抽取5个网页,并给定初始的实体对lnternet和娱乐,出现模式为“应用”,即娱乐是Internet的一种应用。接着产生初始2-项集,如表1所示,这里只给出其中比较重要的几个。利用这个2-项集来进行关联分析,得出的结果如表2所示。对于这个例子只需要运行2步即可,因为没有4-项集产生。对表2结果(Internet,娱乐)和(因特网,娱乐)这两项则可以进行同义词合行为一项,支持度就变为0.69。所以经过这样3个步骤,从中发现与Internet,Windows相关性较大的这些实体,也就是得出了一些新的关联规则及其应用的模式。所以利用改进的关联规则算法可以在网页中发现大量的未知信息,进而总结出一些新的知识,然后对这些新的知识进行关联分析,使其能得到一些有价值的信息。这样就能够帮助用户从大量的信息中找出隐含的内容,特别是在用户的资源搜索过程中给出用户感兴趣的信息。

同时在实践过程中发现了下一步需要进行研究的方向,即在从2-项集产生多项集的过程中,可以引入散列技术,与其结合来改进算法。值得注意的是由于Web页面是一个不断更新的信息源,所以挖掘的过程是一个长期执行的任务。

4 结语

Web挖掘是数据挖掘技术的新方向,而作为数据挖掘的重要方法——关联规则挖掘方法一直是研究的重点。本文在介绍了Web挖掘和关联规则挖掘的基础上,试图在这方面做了一些探讨,从而促使Web数据挖掘技术的发展。

参考文献

[1]毕永成.Web日志挖掘中预处理过程的具体研究[J].现代电子技术,2010,33(18):97-100.

[2]朱玉全,杨鹤标,孙蕾.数据挖掘技术[M].南京:东南大学出版社,2006.

[3]周贺来.Web挖掘中关联规则的研究与应用[D].郑州:郑州大学,2006.

[4]刘云,刘东苏.基于Web的数据仓库与数据挖掘[J].情报理论与实践,2001,24(4):289-290,320.

[5]韩家炜.数据挖掘概念与技术[M].北京:机械工业出版社,2006.

[6]王中海.基于Web挖掘研究:网络挖掘[J].图书馆学刊,2006,25(3):35-36.

[7]郭岩,白硕.Web使用信息挖掘综述[J].计算机科学,2005,32(1):1-7.

[8]方元康,胡学刚.一种改进的Web日志会话识别方法[J].计算机技术与发展,2008,18(11):214-216.

[9]潘有能.基于XML的Web日志挖掘研究[J].现代图书情报技术,2006(5):62-64.

公私合营项目目标及其关联度分析篇11

关键词工程经济学，目标关联度，灰色关联度，PPP项目，目标体系

中图分类号F224.9 文献标识码A

AbstractThe objectives system of PPP project was built by combining with the characteristics of publicprivate partnership （PPP） project. Then the gray correlation analysis method was used to analyze the correlation between the PPP project. Firstly， the PPP project target system includes quality schedule， cost， risk sharing and other eight objectives system. Secondly， the basic principle and the calculation steps of the gray relational analysis method of the gray correlation degree analysis were introduced and then used in the analysis of the PPP project objectives. Finally the specific case was selected to analyze the relationship between the PPP project objectives.

Key wordssengineering economics， target association degree， gray correlation degree analysis，

1 引言

公私合作模式（PublicPrivatePartnership，以下简称PPP）是一种多元化的项目合作模式，由政府和私人部门共同合作，双方通过合理的合同约束，以实现PPP项目目标为基准，进行公共基础设施或公用事业项目的投资、建设以及运营.随着技术经济的发展，PPP项目越来越受到投资方与公共部门的青睐，2015年，政府相关部门成立了首个国家部委层面的 PPP 项目库，大力支持PPP项目的发展.PPP模式的出现是公共项目建设过程中的的重大创新，政府在利用民间资本为人民提供优质高效服务的同时，民间资本也在享受着政府的政策支持，并获得一定的投资回报.然而由于PPP项目建设中需要投入大量资金，并且全生命周期长、涉及的主体众多、复杂等特点，增大了PPP项目目标实现的困难度，所以有必要对PPP项目目标进行深度探讨，并建立目标关联度分析模型，分析PPP项目目标之间的关系.

2PPP项目的主要目标体系

2.1一般项目的主要目标

建筑工程项目的最终目标是实现项目参与各方综合效益的最大化，这一理论不管对于一般建设项目还是PPP项目都适用.一般建设项目有目标铁三角，即质量、进度和成本三大目标，在项目目标管理的过程中三大目标处于对立统一的关系[1]，通常想要缩短工程周期就要以牺牲质量与成本为代价，而要提高工程质量，就要增加成本甚至延长工期，而要实现较低成本就要使项目质量降低或者延长项目工期.此外，工程项目的多目标性对于工程项目的投标决策[2]、建设使用以及经营管理具有重要影响.项目管理者在项目管理过程中通过动态的目标控制措施对三大目标进行合理、有效的控制，实现项目目标对立与统一的结合.

2.2PPP项目目标体系的建立

PPP项目需要的资金量大，全生命周期长、项目参与者多等特点决定PPP项目的目标体系比一般建设项目目标体系更加复杂，孙慧[3]等人通过研究PPP项目目标绩效归纳出PPP项目的目标体系，其中包括影响项目参与者利益的的价值和利润目标、项目本身的健康和安全目标、质量、进度等目标.在研读有关研究者的研究结论以及结合PPP项目特点，综合PPP项目外部与内部，短期与长期影响因素，总结出PPP项目的目标体系，除了进度、质量、成本等目标，还要注重PPP项目特有的其它目标.在查阅大量文献的基础上结合PPP项目具体情况构建PPP项目目标体系（表1）.而在PPP项目目标管理过程中，更要注重对影响各个目标的因素进行高效的控制.Belassi [4]和Tukei，Chan[5]等研究者把外部因素、内部因素以及人为因素三大因素列为影响PPP项目目标实现的影响因素.结合具体实例得出影响PPP项目目标实现主要有三大因素（表2），具体外部因素包括：稳定的自然环境、稳定的政治环境、有限的市场竞争、法律法规及政策支持.内部因素包括：采用技术的适用性、合同的有效实行、融资方案的合理性、风险的合理预测.人为因素包括：项目参与者的有效沟通、政府与公众的支持、承包商管理能力、PPP项目参与者融资能力.

3灰色关联度分析模型

3.1灰色关联度分析方法简介

灰色关联度分析是灰色系统理论应用的重要方面之一，灰色系统理论在农业[6]、生物医药[7]、城市制造业[8]、商业[9]以及企业网络舆情危机[10]等方面都有广泛应用.灰色关联度分析是在已有数据的基础上将系统中潜在的灰色信息进行白化处理，进而进行预测以及决策的一种方法[11].首先需要收集系统中关于每个因素的样本数据，在样本数据的基础上运用灰色关联度分析方法对样本数据进行分析，判断系统中各因素之间关系的强弱、大小、次序问题.而在灰色关联度分析中灰色关联度曲线也可以体现因素之间的关系，如果灰色关联度曲线在曲线变化的方向、速度、大小方面趋于接近，则说明两个因素之间存在很大的关联性，反之，则说明两因素之间不存在关联性或者关联性甚微[12].如图1所示，把参考数列（1）分别与数列（2）与数列（3）做比较，由下图可得，与数列（3）相比，数列（2）与数列（1）更具关联性.

nlc202309040807

5）计算关联度r.

r=1n∑nk=1εi（k）. （3）

6）根据关联度排序，顺序由大及小.

7）根据关联系数，形成关联度曲线，结合关联度排序分析研究对象间的关联度.

4 实例分析

4.1案例具体情况介绍

某大型体育场A 为PPP模式，工期接近四年半，总造价22.67亿元，由于此工程体型庞大、焊接工程量大等特点，施工困难，所以对工期有较高要求.在质量目标方面，由于此项工程具有较高的社会地位，所以无论在外观质量还是内在质量方面都有较高的要求.此外，由于项目属于公共项目，所以对可持续发展、环保节省资源方面以及人文施工、绿色施工等方面都有较高要求.首先根据此案例实际情况运用0-4打分法对此项目目标、因素分别进行打分（表3和表4），当两两相比较者同等重要时，得分均为2分，当前者重要程度大于后者时，前者2分后者1分，当一者和另外一者比较相当重要时，相当重要者得4分，被比较者得0分.

4.2结合具体案例运用灰色关联度进行分析

运用加权平均法对目标及影响因素的对应分值进行综合加权平均，得到表示影响因素对各个目标影响程度的分值（表5），再结合灰色关联度分析法对表5中的分值进行分析.具体步骤如下：

根据关联度以及关联度曲线可得，对于此大型体育场，在项目建设过程中，质量是其最需要注重的目标，其次为进度、安全目标，其它目标根据关联度大小依次排序.关联度越大说明此目标在此大型体育场A的目标体系管理过程中重要性更强于其它目标.

5结论与展望

灰色关联度分析方法将定性与定量相结合，解决了PPP项目目标管理中很多目标不能进行定量量化的局限性.针对具体案例运用灰色关联度对PPP项目目标关联度进行分析，得出对于某大型体育场A，其质量目标为其它目标之首，在此项目的目标管理过程中质量目标的实现对于此项目成功最具影响力，同时得出其它目标之间的关联度.该模型不需大量数据，计算方便，操作简单，因此在PPP项目的其它研究领域有一定的应用价值.此外，文中在关于PPP项目目标与影响因素赋值方面具有一定的主观性，在接下来的研究中还需改进.

参考文献

[1]周子炯.建筑工程项目设计管理手册[M].北京：中国建筑工业出版社，2013.

[2]姚道洪.基于相对熵排序的建筑工程项目投标决策[J].经济数学，2015，32（4）：106-110.

[3]孙慧.基于SEM方法的PPP项目绩效影响因素分析[J].天津大学学报：社会科学版，2012，14（6）：513-519.

[4]W Belassi，O I Tukel.A new framework for determining critical success/failure in projects[J].International Journal of Project Management，1996，14（3）：141-151.

[5]D K H Chua，Y C Kog，P K Loh.Critical success factors for different project objectives[J].Journal of Construction Engineering and Management，1999，125（3）：142-150.

[6]王庚，王敏.现代数学建模方法[M].北京：科学出版社，2008.

[7]张良桥.基于灰色关联分析的战略性新兴产业评价-以生物医药为例[J].经济数学，2010，27（3）：79-84.

[8]邬丽萍.城市群形成演化机理与发展战略：基于集聚经济三维框架的研究[M].北京：中国社会科学出版社，2012.

[9]吴雄韬，郑国详.灰色预测模型在深圳创业板股市中的应用[J].经济数学，2012，29（3）：107-110.

[10]张军玲.基于层次分析法的企业网络舆情危机应对评价研究[J].经济数学，2015，32（3）：60-63.

[11]刘六生，冯用军.高等教育研究中的数学方法[M].北京：科学出版社，2009.

[12]袁嘉祖.灰色系列理论及其应用[M].北京：科学出版社，2009.

数据挖掘技术与关联规则挖掘算法篇12

1 数据挖掘技术介绍

1.1 数据挖掘技术的概念

数据挖掘技术是一门包容性以及开放性较强的跨领域数据信息揭示学科, 这项技术能从大量含有噪声, 且模糊不确定的实际业务数据中进行计算, 在这些数据中对当前尚未发现, 或者没有被明确认知的具有一定价值的知识信息进行揭示。在进行数据挖掘中的业务数据形式不是单一固定的, 是复杂多样的, 所以数据挖掘得出的分析结果形式能以多种形式表现出来, 可以是具有较强逻辑性的数学表达式, 也可以是容易被一般用户理解的结果。且数据挖掘技术在科学研究、市场分析等领域均得到了广泛的应用。

1.2 数据挖掘技术分类

数据挖掘功能的分类主要是根据数据挖掘功能的不同进行的, 当前的数据挖掘技术主要有关联规则挖掘技术、分类挖掘技术、孤立点挖掘技术以及聚类挖掘技术等。本研究主要对关联规则挖掘算法进行详细探讨。

2 关联规则挖掘算法

2.1 关联规则种类介绍

关联规则按照不同的标准, 能用各种不同的方法分成不同类型。将关联规则分为挖掘频繁项集、闭频繁项集、被约束频繁项集、极大频繁项集, 是根据挖掘模式的完全性分类的;将关联规则分为多层和单层关联规则, 以及单位和多维关联规则是根据规则所涉及的数据进行分类的;将关联规则分为量化关联规则和挖掘布尔型规则是根据规则处理值类型分类的;将关联规则分为序列模式挖掘、频繁项集挖掘以及结构模式挖掘是根据俄关联规则挖掘模式进行分类的;将关联规则分为兴趣度约束、知识类型约束、数据约束, 是根据规则所挖掘的约束类型分类的。

2.2 关联规则挖掘算法分析

2.2.1 Apriori算法分析

关联规则算法中的挖掘完全频繁项集中, Apriori算法该类型中最具有应用价值, 影响力最大的算法。Apriori算法主要有两个步骤:

(1) 发现所有的频繁集;

(2) 生成强关联规则。

在Apriori算法中的第一步是最为重要的步骤, 该算法的核心思路是, 给定一个数据库, 在第一次数据库扫描中找出所有支持度大于等于最小支持度的项目组成频繁1—项集, 也就是L1, 1—项集C1, 由L1进行连接得到;接着进行第二次数据库扫描, 将C1中所有支持度大于等于最小支持度的项集组成频繁2—项集, 也就是L2, 候选2—项集C2由L2连接得到。以此类推, 直到找出最大项频繁集。即在进行第N次数据库扫描时, 找出CN-1中所有支持度大于等于最小支持度的项集组成频繁N—项集, 即是LN, N—项集CN要由LN连接得出, 一直到找不出新的选集为止。在这里还要用到Apriori算法性质, 即是频繁项集是频繁项集的子集, 非频繁项集是非频繁项集的超集。在Apriori算法中对数据库的扫描次数需要大于最大频繁项集的项数。

Apriori算法的操作具有两个明显的缺点。 (1) 该算法的使用需要对数据库进行多次扫描, 因此在读写操作上会花费很多的时间, 从而增加挖掘算法的时间成本, 这种成本的增加不可小觑, 因为它是有数据库存储数据的增加, 以几何级数上升的成本;

(2) Apriori算法会出现众多的候选频繁集, 频发集的产生量在每一步都很大, 这会使算法在广泛度和深入度上的适应性较差。

2.2.2 FP—growth算法分析

FP—growth算法是关联规则算法中属于深度优化的一种算法, 这种算法是深度优化算法中较新且具有较高成效的, 不同于Apriori算法本质的常用算法。FP¬—growth算法的基本基本步骤有两个:

(1) 先将频繁模式树FP—tree生成;

(2) 在生成的FP—tree频繁模式树中搜索频繁项集。

(1) 需要将项集关联信息保留住, 并采用一棵频繁模式树 (FP—tree) 用来容纳压缩后的数据库;

(2) 再将压缩后的FP—tree再分散为几个小的条件数据库, 再分别对这些数据库进行信息挖掘。FP—growth算法相较于Apriori算法, 只需要对数据库进行两次扫描, 不需要多次扫描, 大幅度减少了挖掘算法的时间成本;也不会出现大量的候选项集, 大幅度减少了频繁集的搜索空间。也就是说FP—growth算法能明显提高时间和空间效率。但是该算法也有缺点, 在对庞大且松散的数据库进行挖掘处理过程中, 不管是递归计算还是信息挖掘都需要占据大量的空间。

3 总结

综上所述, 本研究对对数据挖掘技术概念和分类进行了简单的介绍, 并对关联规则的种类进行了详细的分析, 对关联规则中常用的两种算法FP—growth算法和Apriori算法进行了详细的分析。两种算法都还存在各自需要改进缺点, 怎样在挖掘过程中提高挖掘效率, 满足人们对挖掘系统的需求, 这将是数据研究工作者仍然需要突破的重难点。

参考文献

[1]毛国君.数据挖掘技术与关联规则挖掘算法研究[D].北京:北京工业大学, 2015.

[2]张弛, 王本德, 李伟等.数据挖掘技术在水文预报中的应用及水文预报发展趋势研究[J].水文, 2015, 27 (02) :74-77, 85.

[3]魏陵博, 付先军.基于Aprio关联规则挖掘技术分析归心经中药与抗心律失常药理作用的相关因素[J].中西医结合心脑血管病杂志, 2014 (05) :517-518.

[4]付先军, 周永红, 王中琳等.基于频繁项集与关联规则挖掘技术探索王新陆临床用药及处方配伍规律的初步研究[J].中国中医药信息杂志, 2015, 17 (09) :92-94.

【技术关联度】推荐阅读：

关联技术10-14

关联规则技术07-30

数据挖掘关联技术05-19

语义关联度07-28

城乡关联度09-14

产业关联度10-04