加权灰关联度论文

2024-12-02

加权灰关联度论文(共7篇)

加权灰关联度论文 篇1

0 引言

配电网节能改造是以降低配电网线损率为目标,以设备更新、网架重构以及运行优化等为手段的系统工程。从国外案例可以看出,配电网节能改造能产生惊人的降损效益。相比之下,中国对配电网能耗的研究还很不够,普遍存在改造方式单一[3,4,5]、组合优化不成体系[6,7]等问题。其中,规划的难点在于如何优化整合多种改造措施,以及如何合理分配并充分利用有限的改造资金以制订高效的节能改造方案。文献将无功动态补偿与谐波治理组合优化用于配电网节能,具有借鉴意义。文献提出了有限投资下的配电网多个改造项目组合优化的规划方案,但规划模型不是针对配电网节能,而且受算法限制也难以应用于较大规模的电网。

考虑到配电网设备、运行参数与线损指标之间的灰关系,本文提出了基于灰关联加权的多种改造措施组合优化方案。

1 规划模型设计

1.1 规划内容

国内地区配电网的建制一般是:地级配电网(A层)管理若干个区级配电网(B层);区级配电网分为多个子区配电网或直接面向线路(C层)。对于全网规模的节能改造,改造投资按A→B→C的模式层层分配。本文沿用这一模式,并假定C层已为最小分配单位,据此制订规划。

线损率是衡量配电网能耗水平的关键指标,是多种参数共同作用的结果,多种措施的综合改造往往可以消除瓶颈,全面提升配电网能效。本文将节能运行也纳入改造的范畴,综合考虑如调整运行电压、更换导线及高损配变、无功补偿、减小供电半径、抑制负荷波动等手段,各项具体的改造规模和程度由所投入的资金量决定。

本规划要解决A层→B层各区→C层各子区的投资分配问题,同时也要解决C层各子区内部各改造项目间的投资分配问题。为高效利用资金,分配应遵循效率优先、兼顾公平的原则。

1.2 规划模型

在抽样统计并改造试算的前提下,假定已经获得C层各子区多条线路的常态参数及分项改造结果,并得到B层各区配电网相应的统计数据。现将规划模型分为2步,如下所示。

步骤1:A层面向B层,按区分配,即

式中:Vi为分配给分区i的投资额;i=1,2,…,n,表示B层分区配电网编号,n为分区配电网数;VΣ为规划的全网投资总额;Si为规模系数,表明分区i在全网所占的规模比例,一般以配电线路数为规模指向;βi为改造需求度参数,

γij为分区i中第j类指标—线损(I-L)灰关联权系数,每类系数对应一类参数指标及其改造,体现了降损对该类改造的关联程度;λij为第j类参数的指标劣度,其内涵及实现见下文。

步骤2:B层单个分区内部,面向C层按项目分配,即

{maxfi=j=1mγijEijXijs.t.j=1mXij=ViXijDijmaxXijDijmin(3)

式中:fi为分区i综合改造的预期累积降损标度;j=1,2,…,m,表示C层配电网改造的项目序号,m为项目种类数;Eij为分区i中第j类改造的降损效率参数,体现了一条馈线上单位成本能达到的降损幅度;Xij为分区i中第j类改造的规划投资金额,为待求量;DijmaxDijmin分别为单项投资的上、下限,一般根据所需的改造规模或硬性改造要求给定。

经过上述2层分配(见图1),已经能够确定改造投资在全网的分布情况,并精确到配电网最小管理单位内部的改造项目组织情况。对于实际配电网中分层更多的情况,可以重组分层并循环使用上述模型进行求解。

2 参数实现

2.1 I-L灰关联权系数

灰关联分析用于描述系统各因素间的影响程度或各因素对系统主行为的贡献测度。

首先,需要建立由网损因素序列ωj和线损率序列ω0组成的影响空间ωinf,表示如下:

式中:j=1,2,…,m,m为网损因素序列的个数,对应改造类别数;L为参与分析的样本个数。

在此基础上,需要对影响空间进行必要的初值化和极性一致化处理,形成标准化的灰关联因子空间。根据网损因素与线损率的物理相关关系,处理方法如下:

{μ0={1ω0(2)ω0(1)ω0(L)ω0(1)}μj={1ωj(2)ωj(1)ωj(L)ωj(1)}ωjω0μj={1cj-ωj(2)cj-ωj(1)cj-ωj(L)cj-ωj(1)}ωjω0(5)

式中:cj为极性校正参量,若ωj为百分比量纲,则cj通常取100%。

从而,标准化的灰关联因子空间μgrf可表示为:

据此,任一μj(k)对μ0(k)(k=1,2,…,L)的灰关联系数定义为:

式中:γjk表示分析样本k的网损因素j与该样本线损率的关联情况;ζ为分辨系数,一般取0.5。

L个分析样本取平均值,即可得网损因素j对线损率的灰关联度γj。在分区配电网i内部进行此项分析,该关联度记为γij:

2.2 指标劣度

本文将网损因素的现状参数与目标参数之间的差距定义为指标劣度,用于对比不同分区配电网间同一网损因素的非标准化程度及其改造需求。

在分区配电网抽样数据形成的网损因素序列中,新增标准化参数ωstdj,形成新的网损因素序列ω*j,ω*j={ωj(1),ωj(2),…,ωj(L),ωstdj}。分区i中网损因素j的指标劣度记为:

若已有该分区各网损因素的统计平均数据ω¯j,也可直接取

λij={|ω¯jωjstd|ωj|ωjstd-ω¯jωjstd|ωj(10)

式中:ωstdj一般根据网损因素量纲取定理想值,或根据规划导则取目标值。

2.3 改造降损效率

考虑到各类改造节约的电能难以评估,本文以改造后理论日线损率的下降幅度作为效益指数,以日线损降幅与改造成本的比值为改造降损效率参数。在此,针对中压配电线路,简述6种常用节能措施的实现方式及降损效率相关参数。

1)调整电压:借助自动电压控制(AVC)系统,逐小时进行馈线首端电压优化。效益为调压前后全线日线损降幅,成本为安装AVC系统折合的每条线路投资,以及主变、无功补偿的总调节代价。

2)更换导线:以年网损费和更换导线投资折合年费用综合最小为目标;以杆塔分段,逐段考察是否更换及更换的最优线径。效益为改造前后全线日线损降幅,成本为导线购买及安装总费用。

3)无功补偿:以年网损费和新增无功补偿投资折合年费用综合最小为目标;在负荷中心选取2个补偿点,进行最优的固定、分组投切综合无功补偿。效益为补偿前后全线日线损降幅,成本包括新建补偿点、无功设备购买及安装维护总费用。

4)更新高损配变:将全线高损配变(如S7系列)全部更换为新型节能配变。效益为配变更新前后全线日线损降幅,成本为计及旧配变残值及新配变购买、安装的总费用。

5)减小供电半径:以中压主馈线首端到最末端负荷点的线路距离为供电半径;通过在负荷中心新增变电站,代替远方变电站向负荷点就近供电,实现供电半径减小。效益为改造前后的全线日线损降幅,成本主要为新建变电站投资分摊到每条线路的投资。

6)抑制负荷波动:通过阶梯电价和峰谷电价差,引导用户错峰用电,最终实现日负荷波动度降低。效益为日负荷波动度降低后的全线日线损降幅,成本为实施峰谷电价后,相对原来统一电价机制下的全线电费亏损现值,计量跨度为其他一次性投资设备的使用寿命(一般取15 a)。

其他节能改造方式,如减小三相不平衡、抑制谐波等,限于篇幅,本文不作详细介绍。

3 算例

本文以某地区待改造的小型配电网为对象,制订节能改造投资规划。该配电网下辖B1和B2两个分区,分别管理50条和20条中压线路。经统计,主要建模参数如表1所示,样本馈线L1~L7原始参数如表2、表3所示,相关的计算过程、原则及背景数据见附录A。

现规划投资1 000万元对全网实施节能改造。假定在全网范围内对中压配电线路分别采取AVC优化电压(P1)、供电半径减半(P2)、更换导线(P3)、无功补偿(P4)、高损配变更新为S13型(P5)、负荷波动降低30%(P6)的改造方案,与对上述6种措施尽量平均投资的综合改造方案(P7)和按本文投资分配模型协调6种措施的综合方案(P8)进行对比。各方案对6项改造措施的投资额依次为X1~X6,根据各项投资额即可在所辖配电网中开展相应规模的该项改造,具体改造方案需结合实际情况专门制订,全网日线损降幅则通过投资额与改造降损效率估算并累加。

注:计算效益为该条馈线日线损率下降的百分比。

表4所示为8种规划方案的投资分配结果。P1~P6分别表示面向全网,投资Xj进行第j项专项改造,Xj的大小主要受Dmaxj和投资总额限制;P7表示在不超过各项Dmaxj的前提下,将投资总额尽量均分给6项措施,对全网进行综合改造;P8-B1和P8-B2表示按本文的分层、分区投资分配模型,对B1和B2分区第j项措施分别分配投资X1jX2j,在各自分区内进行综合改造。

本文投资分配在规划投资总额既定的前提下进行,未被分配用于改造的资金默认闲置,以闲置率衡量。此外,样本显示该配电网单条馈线平均日供电量为85.569 MW·h,电价0.6元/(kW·h),各方案投资回收期见表4。

对比显示,方案P8在诸方案中资金闲置率最低,平均日线损降幅最高,同时投资回收期不超过5 a,最接近投资目标,具有比较优势,如图2所示。

从图2可以看出,方案P1和P3节能效率高,但资金需求有限,是进行较少投资、单项改造的首选。

需要指出的是,原B1和B2两分区的统计日线损率分别为3.38%和2.94%,根据方案P8改造,二者预期可分别下降5.55%和5.46%(全网平均日线损降幅达5.53%),可见本投资规划有助于响应改造需求,减小区间线损差距。

4 结语

本文模型一方面兼顾改造资金的公平与高效分配,体现了紧凑的特点;另一方面只对基本管理单元内的改造方案提出要求,不对具体实施过多干预,体现了粗分配的特点。

本模型应用的关键点在于:必须准确提取模型参数,要求全面筛选分析样本,合理制订各项评估参数。算例对比表明,本投资规划模型对于地区配电网较大规模的节能改造和能效全面升级具有工程实用价值。

附录见本刊网络版(http://aeps.sgepri.sgcc.com.cn/aeps/ch/index.aspx)。

摘要:提出了在总投资约束下,对地区配电网制订多种节能改造措施组合的综合改造投资规划模型。通过灰关联分析、采样统计和样本改造对比等途径获取灰关联权系数、指标劣度以及改造降损效率等核心参数。在此基础上,在地区电网分层分区管理的模式下,以各项改造投资额为变量,结合投资约束及各项权系数,建立改造投资分配的粗规划模型。算例表明,借助该模型指导节能改造,能充分利用改造资金,显著降低配电网线损水平,并有助于缩小网间线损指标差距,全面提升配电能效,与现有的改造方案相比独具比较优势。

关键词:配电网,节能改造,灰关联,投资规划

加权灰关联度论文 篇2

1 加权灰关联分析法①

灰色关联分析是对一个系统发展变化态势的定量描述和比较的方法,是通过确定参考序列和若干个比较序列的几何形状相似程度来判断其联系是否紧密[3],较好地融合了距离空间与拓扑空间的特点[4]。目前常见的灰色关联计算模型主要有邓氏关联度、广义灰色关联度、灰色斜率关联度、灰色B型关联度及灰色接近关联度等[5]。

以上提出的各种关联度模型都有各自的适用范围。邓氏关联度分析法只从曲线上有限的几个点的相对位移来衡量两曲线的相似程度,没有反映行为曲线与参考曲线的相对变化率( 即曲线的变化趋势)[6]。广义灰色关联度分析法以两曲线之间的面积为基础,若两曲线有交点则对关联度的计算有较大误差,所以该方法对曲线的形状要求比较严格[7]。灰色斜率关联度分析法侧重从两曲线的相对变化率来表示两曲线的接近程度[8]。灰色B型关联度不具有整体性,得出的关联度数值明显偏小[9]。灰色接近关联度对参考序列和行为序列的量纲和意义要求完全相同,使用范围太窄[10]。

循环冷却水系统是典型的灰色系统[11],所以笔者采用加权灰关联分析法,既考虑了序列的局部相关性即相对位移,又考虑了序列的整体相关性即曲线的变化趋势。若假设参考序列X0=( x0( 1) ,x0( 2 ) ,…,x0( n ) ) ,行为序列Xi=( xi( 1) ,xi( 2) ,…,xi( n) ) ,则X0和Xi在k时刻的加权灰关联系数 γ( x0( k) ,xi( k) ) 定义为:

其中,| x0( k) - xi( k) | 为k时刻点上X0和Xi的绝对差;为X0和Xi的绝对差值中的最大值; ξ 为分辨系数,取值范围ξ∈[0,1],一般取0. 5; λ1,λ2≥0,λ1+ λ2= 1。设X'i= ( x'i( 1) ,x'i( 2) ,x'i( 3) ,…,x'i( n) ) 为序列Xi= ( xi( 1) ,xi( 2) ,…,xi( n) ) 的累减生成序列,其中x'i( 1) = xi( 1) ,x'i( k) = xi( k) - xi( k - 1) ,( k = 2,3,…,n) 。

X0和Xi的加权灰关联度R( X0,Xi) 定义为:

根据最小信息原理,分辨系数通常取0. 5,但在实际应用中 ξ 的取值需要考虑系统运行动态特性引起的序列波动性[12]。循环冷却水系统腐蚀预测参数由于实际生产原因波动性较大,笔者采取动态调整的方法来减弱序列波动性对加权灰关联度的影响。

设 Δ 为所有差值绝对值| x0( k) - xi( k) | 的均值,Δmax为所有差值绝对值| x0( k) - xi( k) | 的最大值,则:

记,则分辨系数ξ的取值范围可定义为εΔ≤ξ≤2εΔ。当Δmax>3Δ时,行为序列存在奇异值,分辨系数的取值范围为εΔ≤ξ≤1.5εΔ,取较小值,以克服奇异值的支配作用;当Δmax≤3Δ时,行为序列波动趋势平缓,分辨系数的取值范围为1.5εΔ≤ξ≤2εΔ,取较大值,以体现关联度的整体性。

2 循环冷却水腐蚀预测参数的选取

以某石化企业循环冷却水系统36 个月的运行数据为基础,设腐蚀速率为参考序列X0=( x0( 1) ,x0( 2) ,…,x0( n) ) ,采用挂片法即利用挂片失重来计算得到,采样频率为每月一次。水质参数如p H值、总磷、碱度、氯离子、电导率、浊度及钙硬等和工艺参数如总管压力、水温、水位、循环水泵电流及压力等为行为序列Xi= ( xi( 1) ,xi( 2) ,…,xi( n) ) ,采样频率为每天一次,数值按照各自的采样频率累加后取每月的平均值与参考序列对应。

参考序列和行为序列之间的关联系数为γ( X0,Xi) ,关联度为R( X0,Xi) ,循环冷却水系统与灰色系统对照见表1。

应用加权灰关联分析法进行腐蚀预测参数选取的流程如图1 所示。

由于在实际生产中数据测量方式、采集频率不同,所以数据的完善程度也不同。笔者选取了数据相对完整的3 个采样点进行分析。在实际处理结果中发现,工艺参数对循环冷却水腐蚀的影响远不如水质参数明显。因篇幅有限,现只列出水质参数的原始数据。3 个观测点的原始数据见表2。

由于各参数的单位、量纲、数量级不同,不便于分析,甚至会影响预测结果,因此,需要对所有的参数进行无量纲化处理。

通过一定的数学变换消除参数类型与量纲影响,即把性质、量纲各不相同的参数转化为可以综合比较的一个相对数即无量纲化值。经过该方法处理的各项指标数据既可以反映原始数据各指标变异程度上的差异,也包含各个指标相互影响程度差异的信息。3 个观测点无量纲化数据见表3。

对3 个观测点数据即循环冷却水腐蚀预测参数应用加权灰色关联分析法进行分析,代入式( 1) ,求出关联系数 γ,再代入式( 2) ,求出关联度R。3 个观测点的关联度R见表4。

根据表4 可以得到观测点1、2、3 的关联度大小顺序如下:

观测点1 R(X0,X1)>R(X0,X2)>R(X0,X5)>R(X0,X7)>R(X0,X4)>R(X0,X6)>R(X0,X3)>…

观测点2 R(X0,X1)>R(X0,X2)>R(X0,X5)>R(X0,X7)>R(X0,X4)>R(X0,X6)>R(X0,X3)>…

观测点3 R(X0,X1)>R(X0,X2)>R(X0,X4)>R(X0,X5)>R(X0,X7)>R(X0,X6)>R(X0,X3)>…

观测点1 p H值>总磷>电导率>钙离子>氯离子>浊度>总碱>…

观测点2 p H值>总磷>电导率>钙离子>氯离子>浊度>总碱>…

观测点3 p H值>总磷>氯离子>电导率>钙离子>浊度>总碱>…

可以看出,3 个观测点的预测参数对腐蚀速率影响的先后顺序基本一致,只有观测点3 中氯离子浓度稍有差异,在后续建模参数选取时,可以按照观测点1 或2 的顺序进行选取。由以上结论可知: 循环冷却水腐蚀预测参数对腐蚀速率的影响先后顺序基本一致。在研究后续腐蚀预测模型时可以根据建模需要在这些预测参数中适当选取。

3 结束语

针对循环冷却水腐蚀预测参数的选取仅依靠生产经验而导致预测结果不可靠的问题,笔者引入了灰色系统理论作为循环冷却水腐蚀预测参数选取的依据。研究比较了当前灰色系统理论几种模型的优点和不足,采用了加权灰关联分析法对循环冷却水腐蚀预测参数和腐蚀速率的关系进行研究,为实际生产中存在的循环冷却水腐蚀预测参数难以选取的问题提供了理论依据,为石油化工领域等流程工业同类课题的研究与应用提供了参考,具有重要的可借鉴价值。

摘要:针对循环冷却水腐蚀预测参数选取中通常采用经验法,预测参数的选取无科学理论作为依据的问题,提出应用加权灰关联分析法对循环冷却水腐蚀预测参数进行选取。对现场采集的数据进行预处理,并应用灰色关联分析法进行了多因素灰色关联度分析。结果证明:各个观测点腐蚀预测参数和腐蚀程度的关联度大小顺序基本一致。

关键词:加权灰关联分析法,循环冷却水,腐蚀,预测参数

参考文献

[1]张凌峰.工业循环冷却水智能辅助分析平台的关键技术研究[D].天津:天津理工大学,2012.

[2]董超,张凌峰,李荣,等.循环冷却水系统腐蚀速率的预测模型[J].化工自动化及仪表,2011,38(6):676~678.

[3]邓聚龙.灰预测与灰决策[M].武汉:华中科技大学出版社,2002.

[4]刘思峰,蔡华,杨英杰,等.灰色关联分析模型研究进展[J].系统工程理论与实践,2013,33(8):2041~2046.

[5]曹明霞,党耀国,张蓉,等.对灰色关联度计算方法的改进[J].统计与决策,2007,(7):29~30.

[6]田民,刘思峰,卜志坤.灰色关联度算法模型的研究综述[J].统计与决策,2008,(1):24~27.

[7]Li G D,Masuda S,Nagai M.Predictor Design Using an Improved Grey Model in Control Systems[J].International Journal of Computer Integrated Manufacturing,2015,28(3):297~306.

[8]崔立志,刘思峰,李致平,等.灰色斜率相似关联度研究及其应用[J].统计与信息论坛,2010,25(3):56~59.

[9]Omidvari M,Lashgary Z.Presenting a Model for Safety Program Performance Assessment Using Grey System Theory[J].Grey Systems:Theory and Application,2014,4(2):287~298.

[10]刘震,党耀国,周伟杰,等.新型灰色接近关联模型及其拓展[J].控制与决策,2014,29(6):1071~1075.

[11]李国峰,关庆涛,关庆生.聚合物配置浓度控制中的灰色预测控制[J].化工自动化及仪表,2007,34(3):16~18.

加权灰关联度论文 篇3

1科技金融体系有序性的定义

有序性是指系统要素间的有秩序的联系,具体表现为系统的稳定性、规则性、重复性和相互的因果关联性[3]。表征有序性的词汇有系统结构、系统秩序、系统层次、系统组织以及自组织,它们都从不同的侧面反映了系统的有序特征,都是对于系统有序性不同具体表现的描述,有序性是系统诸多特征中较为基本的特征。

由上述分析可知,科技金融体系属于耗散结构, 具有开放性、远离平衡态、涨落以及非线性的特点[4]。因此,本文将科技金融体系有序性定义为: 在产业视角下科技金融体系中,科技金融投融资、 创新、服务、组织和政策等子系统能够在科技金融活动的运行中保持动态稳定,其有序状态表现为在平衡点上下波动,始终保持远离平衡态。

2科技金融体系有序性评价指标体系的构建

科技金融体系的有序性取决于体系中序参量的协同作用,而协同作用的程度表征着科技金融体系的演化特征与规律[5]。对于科技金融体系而言,科技金融活动可以分为科技金融结构、科技金融效果和科技金融环境3个方面[6],因此,在评价科技金融体系有序性时,可以将科技金融结构、科技金融效果和科技金融环境的影响因素作为序参量。

本文有序性评价的初选指标主要理论依据来源于科技金融指数和笔者所参与的辽宁省重大科技项目 “辽宁省科技与金融深度融合战略与对策研究”。 初选指标的数据来源主要为中央和地方统计部门、 中央与地方科技金融相关部门、各高新区及相关学术研究机构权威统计数据,但是某些指标的数据难以通过上述途径获得,因此可以辅以调查问卷的方式进行数据的收集。基于上述理论依据及相关文献, 笔者选取如下35个评价指标作为初选指标( 见表1) 。在初选指标的基础上,设计调查问卷,并运用信息熵原理对调查数据进行处理,最终确定评价指标体系。

笔者针对35个初选指标设计调查问卷,将每个指标对科技金融体系的重要程度分为5个层次,分别是 “极其不重要、相对不重要、重要、比较重要、 非常重要”,通过专家打分来反映每个指标对评价对象重要性影响的高低程度,进而运用信息熵原理确定最终指标,建立有序性评价指标体系。本次调查笔者是通过电子邮件的方式向辽宁省现从事科技金融领域研究的专家共发放问卷25份,收回有效问卷20份,有效问卷回收率达80% 。其中,有效问卷的调查对象涵盖政府机关( 辽宁省科技厅、沈阳市发改委、沈阳市高技术处) 专家4人,银行机构专家2人,非银行金融机构( 创业风险投资机构、保险机构、担保机构、证券机构) 专家10人,高校专家学者4人。

采用信息熵原理筛选评价指标的基本思想为: 将所有专家针对各个评价指标的重要程度进行汇总, 并对所得结果的概率分布状态的统计特征进行分析。

( 1) 设评价指标i的状态有n级,则评价等级集合A为:。

( 2) 设评价对象j对应每种状态的概率集合P为:。

( 3) 对于评价等级集合来说,每项指标只能选择一个评价状态,且,因此,评价指标信息熵的计算公式如公式( 1) 所示。

由公式( 1) 可知,H ( Xj) 的值越大,说明专家评价的不确定性就越大,就越无序; H ( Xj) 的值越小,说明专家评价的不确定性就越小,就越有序。依据评价指标信息熵的大小,便可以确定出最终指标,从而构成有序性评价指标体系。

由表1可知,信息熵值大于0. 8的指标有16个,信息熵值小于0. 8的有19个,所以第一次筛选将0. 8定为界限值最佳,因此首先剔除信息熵值大于0. 8的16个指标。其次在剩下的19个指标中需要进行再次筛选,可以看到基金管理机构支持程度、 律师事务所支持程度这两个指标的重要程度相对较低,因此需要再次剔除这两个指标,从而确定出最终的有序性评价指标体系( 见表2) 。

3科技金融体系有序性判别模型的构建

首先,为了便于下文的评价原理和计算公式的推导,现设有m个评价指标,n个评价对象,于是组成原始数据矩阵X,即

因为评价指标之间的单位和性质不尽相同,所以需要对X进行标准化处理,得到yij。

在此,本文需要做一个说明: 由灰色关联分析法( GIA) 的基本原理可知,灰关联系数的分度密度值是一个等权的平均数[7]。但是通过表2中评价指标信息熵的计算结果可知,不同评价指标在同一时点对评价对象的影响程度是不相同的,本文暂且认为不同评价指标的权重对于连续不同的时点来说是不发生变化的。因而,本文认为各评价指标的权重高低必然会对灰关联熵的结果产生影响,在对灰关联系数进行归一化处理时采用加权方式会使得最终的计算结果更加可靠和科学。

于是,第i个评价指标的权重 ωi的计算公式如下:

根据GIA,在原始数据标准化和确定指标权重的基础上,设评价对象j对最优对象F*关于评价指标i的关联系数为 δij。具体步骤如下:

( 1) 计算虚拟理想评价对象的综合值

( 2) 计算评价对象j与虚拟理想评价对象的距离,和

( 4) 将关联系数 δij归一化,得pij

( 5) 计算评价对象j与虚拟理想评价对象的关联熵Sj

由上述相关理论分析可得,关联系数 δij越大, 关联熵Sj越小,说明科技金融体系的结构越稳定, 有序性就越强。

科技金融体系熵为一个状态函数,结合耗散结构熵变和有序性的关系,本文将科技金融体系在一定时间段内熵流的大小作为判断体系有序性的依据, 于是得出科技金融体系有序性判别模型,如公式( 9) 所示。

其中,S( t)是指科技金融体系第t时间段的初态熵; S( t + 1)是指科技金融体系第t + 1时间段的初态熵,也是第t时间段的末态熵。

因此,可以根据 ΔS与0的关系来判断科技金融体系的有序性:

( 1) 当 ΔS > 0时,系统呈现熵增状态。科技金融体系内部所产生的正熵值大于外界环境对体系所产生的负熵的绝对值,说明科技金融体系正朝着无序状态发展,逐步走向退化。

( 2) 当 ΔS < 0时,系统呈现熵减状态。科技金融体系内部所产生的正熵值小于外界环境对体系所产生的负熵的绝对值,说明科技金融体系正朝着有序状态发展,逐步趋于良性。

( 3) 当 ΔS = 0时,系统呈现特殊的 “平衡”状态。科技金融体系内部所产生的正熵值等于外界环境对体系所产生的负熵的绝对值,说明在一定时间间隔内,科技金融体系熵无变化。

4实例应用

依据表2中的17个评价指标来收集辽宁省的相关数据,并对所收集来的原始数据进行标准化处理( 见表3) 。其中指标X2、X10、X11、X12、X13、X14、 X15、X16的数据来源于辽宁科技统计信息网( www. lnsts. com) 、《辽宁统计年鉴》、 《辽宁科技统计年鉴 》 以及辽宁省人民政府官网( www. ln. gov. cn) ; 指标X1、X3、X4、X5、X6、X7、 X17的数据由关于辽宁省科技型企业融资情况的调查问卷整理而得; 指标X8的数据是由国泰君安数据库、新浪财经网( finance. sina. com. cn) 整理而得; 指标X9的数据来源参考了 《全国担保行业发展报告》中关于辽宁省的相关数据。

需要说明的是,笔者面向辽宁省14个城市符合调查条件的科技型企业发放了 “辽宁省科技型企业融资情况调查表” 的调查问卷,收回379份问卷, 其中有效问卷330份,回收率达到87. 07% ,符合统计的科学性。对于问卷中数据的处理,笔者采用加权平均的方式进行处理。

根据表2中的信息熵值,运用公式( 3) 可得17个评价指标的权重, 再运用公式( 4 )- 公式( 8) 可得辽宁省科技金融体系的加权灰熵值Sj, ( 见表3) 。最后根据加权灰熵绘制出2001 - 2011年辽宁省科技金融体系的熵变曲线图( 见图1) 。

根据图1的曲线走势和公式( 9) 科技金融体系有序性判别模型可知,2001 - 2006年,辽宁省的 ΔS一直大于0,说明2001 - 2006年辽宁省科技金融体系一直处于无序状态,其中有两次比较大的退化表现在2003年和2006年; 而从2006 - 2011年,辽宁省的 ΔS一直小于0,说明2006 - 2011年辽宁省科技金融体系逐渐趋于有序,但步伐较缓,比较平稳。

5结束语

数据挖掘中加权关联规则的研究 篇4

关键词:数据挖掘,加权关联规则,Apriori算法,改进

1、引言

针对关相互关联的规则进行挖掘的话, 研究者就会提出一整套的的挖掘算法。在所有的关联规则的挖掘算法中Apriori算法应该算是最经典的算法之一。这一算法的核心方法在于频集理论的递推。由于Apriori这个算法是基于两阶段的频集思想方法进行的, 因此可以将关联规则挖掘算法相应的设计分成两个子问题来研究:

首先:研究者必须找到一个支持度相对来说大于最小支持度的阈值的一个所谓的项集 (Itemset) , 也就是所谓的频集 (Frequent Itemset) 。

然后就是, 由第一步的频集进行相互的关联规则。

关于第一步所表现出的基本中心思想就是如何以一个长度为k的频集来根据Lk连接操作并且产生一个长度为k+1的候选频集集合Ck+1, 最后通过所有的扫描交易相关的数据库, 通过验证相关的候选频集将集合Ck+1中的所有候选频集进行相关的整合, 从而生成相应的一个长度大约为k+1的频集Lk+1。但是研究发现这一步是需要不断地反复扫描相关的交易数据库, 因此可以看出这一步是制约整个算法性能的关键因素所在。但是第二步相对来说简单易行, 只需要给定一个频集Y={I1, I2, …, Ik}就可以了, 并且将频级赋予相关的数值, k2, IjI, 根据上面的来产生一个仅仅包含集合{I1, I2, …, Ik}中的所有项的相关规则就可以了 (但最多只能是k条) , 只要生成了所有的这些规则, 那么所有的只要是比最小置信度阈值大的所有关联规则就会被相应的保留下来。

但是我们应该清楚Apriori算法并不十全十美, 也同样会存在着效率低下的相关问题, 所以, 不断有研究者进行改进, 他们往往会以Apriori挖掘算法为基础进而提出了其他的相应算法。比如研究者会利用修剪技术 (Pruning) 及其方法[1]来降低所有的候选集的内容大小, 或者是利用杂凑树 (HashTree) [41]这种先进的方法改进每个项集的支持度并且提高生成所有频集算法的速度以及相对的性能。但是无论如何改进, 由于他们的基础不变, 仍然存在着一下各种缺陷:

一是容易产生大量的候选集, 如当要生成一个很长的规则的时候, 产生的中间元素也是巨大量的。

二是由于频集使用了参数m i n s u p p, 所以就无法对小于minsupp的事件进行分析;而如果将minsupp设成一个很低的值, 那么算法的效率会降低。

2、基于Apriori算法的改进思路描述

早在1998年Brin等人就提出了有关动态项集进行计数的DIC方法。这个算法的主要思想是通过扫描不同时刻来添加相关的候选项集, 同时动态项集的计数技术又将数据库整体内容划分为所谓的标记开始点的块。这个算法不同于Apriori算法的每次仅仅在完整的数据库进行扫描前确定相关的候选项的问题, 同时这种变形也是可以在任何开始点的地方添加新的候选项集。但是该种结果算法所需要的数据库相对Apriori来说很少的。

推论1推演出来的Fp-树, 是能够删除支持度比wminsup这一项目小的的项目类型, 同时还不会影响到加权频繁集生成的过程的。因此我们在创建所谓的Fp-树的头表的过程中, 只要我们相对保留那些支持度比wminsup要大的的项目就可以了。同时还要根据它们支持度的大小, 他们各自的权值从小到大进行排列.最后才是根据这个头表进行创建Fp-树的过程。

3、基于大众标签的加权关联规则算法实现

3.1 基于大众标签的加权关联规则算法模型

大众标签系统是4种典型社会性软件之一。下面的就是表明用户是怎样应用tag的.而Free Tags则是用来标注用户发表的信息, 系统通过把所有相同的标签信息进行归类整理, 但这样做的弊端在于抹煞了信息所具有的的主观性.但对于信息提供者来说他们比其他的外来用户更加明确自己表述所具有的含义, 所以即便是Free Tags所用的一些词语可能在全文中的应用的频率不高, 但却比一些词频高的其他相关类型的关键字更加能够反映出整提的信息特征出来。

所谓的Social Tags (社会性标签) 是对Free Tags (自由标签) 的进一步延伸的结果, 但它们之间也有点差别, 体现在使用范围上。所以假如Free Tags不只是单个用户所拥有的, 而是在能够被大众群体所关注的信息关联使用, 那么Free Tags标签就会成为社会性标签从而被赋予了社会性意义。

3.2 算法实现的步骤

不同用户对同一网页使用的tag频率

3.2.1 获取数据

图2显示只是一个关于书签系统的的典型的抽象数据模型.同时在这个模型中存在着3类有关联关系的对象 (即是用户、网页和tag三个) .出现在tag T与网页P连接线上的相关的数字能够表示出所有不同用户根据P使用相关的T的一个频率.研究者根据下图做出相关的定义:

(1) w (P, T) :这主要是表示tag T与网页P之间的相关数字。

(2) bookmark (A) :我们将其定义为用户A所做的一个关于bookmark的集合。

3.2.2 如何计算用户与tag算法之间的相互关联度

所谓关联度被赋予理解是对某一关系所度量的数值。就好像某一用户John做了汽车 (car) 很多的相关的bookmark, 那么我们就可以认为John以及tag“car”之间存在很高关联度值.并且在此系统中, 如果某一tag T很小的时候, 但是关联度往往是很高水平。作如下定义:

3.2.3 计算tag之间的相似度

我们能够根据步骤2来计算出每个相关的tag中的相似度.因此应该将rel (T1, T2) 定义为T2较之T1的相似度, 这个相似度的计算公式应该为:

3.2.4 关于tag聚类的计算

之所以进行Tag聚类依赖就主要是根据步骤3来进行相应的的计算而得到的数值.研究者可以通过相关的聚类, 能够将系统中间大多数的tags进行划分, 并分为不同的主题进行相关的计算.我们还可以利用Tag的聚类来解决tag中所存在的有关数据冗余的所有问题.我们可以推算出tag聚类的整体算法:第一步要在tags中计算出最重要的tag, 就是我们所说的‘父这个概念tag’ (parenttag) ;第二步, 由系统计算出一个仅有的tag的tag聚类;第三步, 将2个相互临近的tag聚类进行整合, 这个过程通过不断的迭代直至没有完全的聚类从而使之符合续合并条件。

3.2.5 如何计算出用户与聚类tag之间所存在的关联度

根据上面的步骤2以及步骤4我们可以得出以下结论定义rel (A, C) 为用户那么A与tag聚类C之间所具有的的关联度为:

3.2.6 对每个tag聚类产生相应的推荐网页

这个步骤系统主要是为每个tag聚类来产生相关的推荐网页, 也就是每个不同主题的相关关联网页.我们应该先定义point (C, P) 为表示在网页P在tag聚类C推荐进行的分值, 那么它的计算公式应该标书为

根据以上公式所计算出得结果推荐出来的分值越高的网页就是所谓的被推荐的网页。

3.2.7 应该为每个用户都产生相关的推荐网页

我们通过步骤5可以得到用户与tag聚类之间所具有的关联度, 通过步骤6我们可以得出相关网页基于tag聚类所具有的推荐分值, 并且应该为每个用户都产生相关的推荐网页。为每个客户产生的推荐网页的计算公式为:

上面的计算结果应该被推荐为客户所用的网页。并且分值越高的网页就应该是最佳的推荐网页。

4、实验分析及讨论

4.1 实验大纲

使用改进的Apriori算法, 构建基于Fp-树的推荐系统, 可以将实验5中的不同的聚类大小表示出来, 其内容主要是:A没有任何相关聚类合并的所有情况.因此在这种情况下, 所有相关的聚类的大小都可以看做是1, 但是加权聚类的数量以及tag的数量是相同的.并且不同于上面的情况, 所以E是上面5个平均聚类大小中的一个最大的。在这里研究者同时列出了进行每种情况计算所需要花费的所有时间。

4.2 实验A

4.2.1 根据实验A来进行评估

在相关的系统中将用户随机的分为“训练组”以及“测试组”两个方面。在上面提及的第1步中, 系统虽然保存了有关“训练组”用户相关数据, 并且更新到了数据库.同时根据第二步到第六步中也是根据这些相关的数据进行计算而得到的。同时在系统中还应该针对所有的测试用户进行相关的技术处理.系统将每个测试组用户的bookmark都分为相关的“查询网页”以及“测试网页”两种。同时将查询网页当做上面的第7步来输入, 研究者可以根据评估来推算出推荐网页的准确精度。我们在这里用下面的公式来解释精确度:

4.2.2 实验A的结果

根据具体实验结果可以得出结论:用户的bookmark数目以及系统推荐的精度之间是成比例的.但是如果输入的网页数目大的话, 那么系统就可以自动的精准分析用户之间的可能性, 这是一个极为自然的结果.同时在下面的5个聚类中, 所以B的精度总体上应该是以下所有中的最好的并且始终大于A.也许是因为在B中必须进行相应的轻微聚类同时还应, 解决相应tag的冗余问题.通过相应聚合“同义tag”的, 并且还要根据用户的喜好来做一定的改动。在另一个方面, 虽然D和E相比较A来说不一定是最好的。同时我们还可以在这个实验中可看出相关的, tag聚类应该中等水平。

5、结语

为了解决标签系统中存在的“信息过载”、“搜索精度”、“垃圾标签”等问题, 本文针对网络信息推荐系统面临的主要问题, 提出了一种基于基于大众标签的加权关联规则算法, 并应用于基于大众标签的推荐系统, 进行bookmark, user, tag三元实验分析, 通过对tag的相似性来挖掘用户的喜好。实验结果表明:通过加权tag聚类在一定程度上解决了tag冗余的问题, 进一步优化了推荐结果。

参考文献

[1]李丹丹.基于混合算法的个性化电子商务推荐系统研究[D].天津财经大学, 2008.5.

[2]刘旭东, 张津铭.电子商务推荐系统研究综述[J].商场现代化, 2008, 第553期.

[3]陶启萍.基于Web数据挖掘的电子商务推荐系统研究[D].辽宁工程技术大学, 2003.

[4]盖亮.电子商务推荐系统的研究与实现[D].天津大学计算机科学与技术学院, 2006.12.

[5]曾子明, 徐小鹏.电子商务推荐系统与智能谈判技术[M].武汉大学出版社, 2008.

[6]欧立奇.协同过滤在电子商务推荐系统中的应用研究[D].西北大学, 2006.5.

加权灰关联度论文 篇5

知识作为一种要素投入, 在经济发展中的作用越来越显著, 国内外众多专家都对“知识经济”的到来做出了大胆的预测。高校科技成果是知识经济发展的介质, 高校科技成果转化效果是知识经济发展的保证[1,2,3]。高校科技成果转化实际上是一种知识的转移、转化、增值的过程, 不同的科技成果需要的知识的广度、深度和特质各不相同, 必然要求对高校科技成果转化的管理遵循知识运动的客观规律。对高校科技成果转化过程中的知识结构进行识别, 将有利于知识在转化过程中的流动, 从而促进我国高校科技成果转化的顺利进行。但是, 由于我国科研体系中各种统计数据相对缺乏, 而且高校科技成果转化知识识别的测度本身具有很明显的模糊性, 为此本文将灰关联度引入到高校科技成果转化过程中的知识结构识别之中, 对高校科技成果转化的知识进行了识别。

1 高校科技成果转化的知识结构

知识结构是指一个事物的知识状态, 以及知识状态集内各状态之间的内在关系, 知识空间为知识评估的各种实际系统提供了严格的数学分析基础, 利用知识空间理论的关键一步是构建准确的知识结构[5]。本文从科技成果转化的角度, 将高校科技成果转化过程中的知识结构分为知识的广度结构、知识的深度结构和知识的特质结构三种类型。

在高校科技成果转化的知识结构体系中, 知识的广度结构起着基础性作用, 科技成果转化主体所拥有的知识必须在范围上满足科技成果转化的需要, 也就是说必须掌握科技成果的原理、生产工艺, 同时也要掌握外观设计、质量管理、市场营销、财务管理等知识。知识的深度结构是指各转化主体对科技成果转化相关知识的运用能力, 这是科技成果能够实现成功转化的关键因素之一, 知识结构的深度在实质上决定了一个企业能够实现科技成果转化的技术水平, 知识的深度结构越深, 其产品的技术含量越高。

1.1 高校科技成果转化的知识结构广度

高校科技成果转化的知识结构广度是指原理性知识、工艺性知识和市场性知识在高校科技成果转化过程中的知识构成和应配关系。知识结构广度对于成功实现高校科技成果转化必不可少, 但并不是知识结构的广度越宽越好。首先, 组织扩展自己的知识广度是要付出成本的, 并且随着知识广度的增加, 所要付出的成本呈指数上升趋势, 这主要是由于随着组织所掌握知识的不断增加, 寻找新知识的成本会不断的增加。其次, 知识广度效用的增量随着知识广度结构的增加而减少。假设x1, x2, …, xn分别表示不同类型的知识, 则Uk=U (x1, x2, …, xn) 表示知识结构广度的效用, Ck=C (x1, x2, …, xn) 表示为知识结构广度所需的成本, 如果用价值来衡量的话可以描述为:

可见当UX=CX时知识结构广度为最大值。

1.2 高校科技成果转化的知识结构深度

高校科技成果转化的知识结构深度, 是指组织所拥有的与实现科技成果有效转化相关的知识的深度, 通常用科技成果知识的先进程度表征。不同的科技成果对知识结构深度要求是不同的, 即使是相同的科技成果如果目标市场不同, 则其要求的知识结构深度也不同。同时, 我们应当注意到, 知识结构深度是动态的, 实际上是一种比较深度而不是绝对深度, 我们可以把它划分成如下几个档次:落后水平、主流水平、国内先进、国际先进以及国际领先等几个等级。

不同的科技成果对知识结构深度的需求是不同的, 知识结构深度也不是越深越好。一方面, 对于按既定目标实现科技成果的成功转化来讲, 结构深度的效用增量会逐渐降低, 另一方面, 知识结构深化所带来的潜效用是无法估量的, 这种潜效用是指由于知识的深化而带来的超出原有科技成果水平的技术创新, 这也是众多组织不断的追求知识深化的动力所在。

1.3 高校科技成果转化的知识结构特质

高校科技成果转化的知识结构特质, 是指科技成果转化主体面对外部环境和竞争的压力而显示出来的特定的知识优势或劣势。它是对外部环境和竞争的特性反应, 一旦外部的环境发生变化或竞争消失, 这种优势或劣势也随即消失。要想实现科技成果转化知识结构特质合理化, 必须对组织目前的环境和竞争有充分的了解, 做好充分的知识储备以迎接机遇和挑战。

2 知识结构识别的指标体系

高校科技成果转化知识结构的识别是指对高校科技成果转化知识结构的合理性进行判断, 我们首先要对成功实现了科技成果转化的知识结构进行专家调查, 建立知识结构合理化标准矩阵。

2.1 高校科技成果转化知识广度识别的指标体系

通过专家调查得到与实现高校科技成果转化相关知识的分类, 利用专家的经验数据对知识广度进行0、1赋值 (需要某一类型知识时赋值为1, 否则赋值为0) , 从而可以得到合理成功状态知识结构广度的指标值矩阵。

①理论知识p1:

是由基础研究的重大突破形成的, 它对该领域的一切应用性研究提供理论指导, 其前沿理论成果可以在专门的著作或专业期刊上得到。

②关键技术知识p2:

是由原理性知识衍生出来的能够使基础科学成果转变成可实现技术成果的核心技术知识。

③工艺设计知识p3:

是为了使科技成果原理机变成成品的整个制造过程中的基础知识, 它是保证产品质量及企业技术经济效益的重要条件之一。

④现场、设备、工装管理知识p4:

主要是指实现工艺设计的条件, 也就是现场设施是否完善并布置合理;科学设备是否能满足加工的要求并有相应水平的操作人员对其进行操作;工具工装等辅助生产条件是否能够满足工艺要求。

⑤特殊资源及工艺要求知识p5:

除了一般性资源和工艺要求外, 该项科技成果的转化还需要什么样的特殊材料和工艺, 企业是否拥有这种资源或工艺或者知道从那里得到这种资源或工艺。

⑥消费者的外观、功能偏好知识p6:

主要是指该项科技成果在推向市场之前是否做了充分的市场调研, 是不是掌握了消费者对产品外观以及功能的要求。

⑦消费者支付能力的知识p7:

是指该项科技成果的目标消费群体是否拥有在现有成本条件下购买该产品的能力, 企业是否真实地掌握了这一数据。

2.2 高校科技成果转化知识结构深度识别的指标体系

高校科技成果转化知识结构深度识别, 是在对高校科技成果转化知识结构广度识别的基础上对其所达到的深度进行识别, 通常利用知识水平进行识辨, 它是一个比较的、动态的概念, 具体来说, 可以分成落后水平、主流水平、国内先进、国际先进 (国内领先) 以及国际领先等五个等级。为了方便计算, 我们可以用[0, 1]之间的数来测度科技成果转化知识结构的深度, 五个等级与数字之间的对应关系为:落后水平[0, 0.2]、主流水平[0.2, 0.4]、国内先进[0.4, 0.6]、国际先进 (国内领先) [0.6, 0.8]以及国际领先[0.8, 1]。

2.3 高校科技成果转化知识结构特质识别的指标体系

由于高校科技成果转化知识结构特质是科技成果转化主体面对外部环境和竞争压力而显示出来的特定的知识优势或劣势, 这种知识往往是在长期的生产竞争中形成的, 是不易模仿和学习的。

①行业特殊生产技术知识x1:

在科技成果转化中除了要具有与科技成果本身相关的知识外, 还必须具备科技成果所属行业的特殊生产技术知识。

②相关领域的生产管理知识x2:

在生产过程中, 不仅需要生产技术知识而且还需要生产管理知识。

③产品市场推广知识x3:

任何企业都可以通过市场中介机构来形成对市场的比较准确的了解, 但是将产品推向市场的知识是中介机构无法给予的。在其它条件相同的情况下, 产品市场推广知识往往成为决定企业成败的关键因素。

3 基于灰色关联度的知识结构识别模型

高校科技成果转化知识结构识别的测度本身具有明显的模糊性, 因此, 所得数据的灰性是不可避免的。

3.1 灰关联度[4]

灰色关联因子集:令X={xi|i∈N}, (N=1, 2, , m;m≥2) 为序列集, 如果X具有下列性质:①数值可接近性;②数量可比性;③非负因子性;则称为灰关联因子集。

灰关联度:如果X为灰关联因子集, xi (h) ∈xi, (H=1, 2, …, n, n≥3)

令x0∈X为参考列, xi∈X为比较列, x0 (h) 与xi (h) 分别为x0与xi在h点的数据。

存在非负实数:γ (x0 (h) , xi (h) 为X上在一定环境下x0 (h) 与xi (h) 的比较测度, 定义

γ (x0, xi) =1nh=1nγ (x0 (h) , xi (h) ) (2)

当满足条件:①规范性:0<|γ (x0, xi) |≤1;②整体性:γ (xi, xj) ≠γ (xj, xi) ;i≠j;③对偶性:γ (xi, xj) =γ (xj, xi) ⇔X={Xi, Xj};④接近性:|x0 (k) -xi (k) |↓⇒γ (x0 (k) , xi (k) ) ↑

则称γ (x0, xi) 为xi对x0的灰关联度。

根据上述所述, 可以给出定义:

γ (x0 (h) , xi (h) ) =

miniΝminhΗ|x0 (h) -xi (h) |+ζmaxiΝmaxhΗ|x0 (h) -xi (h) |x0 (h) -xi (h) |+ζmaxiΝmaxhΗ|x0 (h) -xi (h) | (3)

其中, ζ∈[0, 1]是灰关联的分辨系数, 其作用是调整比较环境的大小, 当ζ=0时环境消失, 当ζ=1时环境保持不动, 工程中一般令ζ=0.5;|x0 (h) -xi (h) |是距离, [|x0 (h) -xi (h) |, |x0 (h) -xi (h) |]是xi与x0的比较环境。

评价指标体系中指标pi与除pi之外的所有指标的群灰关联度:

γ (si, si¯) =1n-1j=1, jinγ (si, sj) (4)

其中, γ (si, sj) =1mh=1mγ (xh, i, xh, j) ;i, j=1, 2, …, n, 表示在某一特定环境下指标pi对指标体系中其余指标的影响程度。

3.2 高校科技成果转化知识结构识别灰关联度模型

设S为要进行知识结构识别的科技成果转化项目, 对于该项目有7个结构广度指标、7个结构深度指标以及3个结构特质指标, 高校科技成果转化知识识别的计算步骤如下:

(1) 获取由专家参与赋值的知识结构广度、深度和特质指标矩阵

委托L个专家对该项目的合理知识结构进行赋值, 考察它们各项指标值, 则可以形成分别关于知识结构广度、知识结构深度以及知识结构特质的合理状态指标矩阵。

知识结构广度的合理状态指标矩阵:

[Xl×7s]=s1s2sl[x1, 1sx1, 2sx1, 7sx2, 1sx2, 2sx2, 7sxl, 1sxl, 2sxl, 7s] (5)

同理可以得到知识深度结构和知识结构特质的合理状态矩阵

(2) 灰关联度、群灰关联度和权重

利用公式 (3) 分别计算关联度γ (s1, s2) , γ (s1, s3) , …, γ (s1, sl) ;γ (s2, s1) ;γ (s2, s3) , …, γ (s2, sl) ;…;γ (sl, sl-1) 。

利用公式 (4) 分别计算群关联度γ (s1, s1¯) γ (s2, s2¯) γ (sl, sl¯)

知识结构广度指标权重

wiw=γ (si, si¯) i=1nγ (si, si¯) (6)

同理可以求得知识结构深度指标权重wid和知识结构特质指标权重wis

(3) 计算知识结构广度、深度和特质的得分和平均得分

如果待评价项目的三项指标得分分别为Rw=[r1w, r2w, …, rnw, ]T, Rd=[r1d, r2d, …, rnd, ]T, Rs=[r1s, r2s, …, rns, ]T, 那么知识识别的模型 (识别的结果) 为:

Cw=Ww⌷Rw (7)

h (w) ={1CwC¯w (s) 1CwC¯w (s) (8)

综上所述, 根据步骤 (1) 、 (2) 和 (3) 可以求出专家认为合理状态的平均值, 完成对高校科技成果转化的知识识别。

4 实例分析

A高校是一所省属重点大学, 该校具有较强的科研能力, 我们对该高校的某项科技成果转化的知识进行识别。

(1) 通过专家评估得到该科技成果转化的知识结构广度、深度和特质的指标矩阵为:

R1=[1110101011100011011101111001]R2=[0.80.60.800.600.800.80.90.70000.50.900.80.70.900.70.50.60.900.70.6]R3=[0.80.70.60.90.80.50.60.60.70.70.50.8]

(2) 根据公式 (3) 、 (4) 和 (6) 分别计算知识结构广度、深度和特质的灰关联度、群灰关联度和权重。

(3) 根据公式 (7) 、 (8) 分别计算知识结构广度、深度和特质的得分和平均得分

通过灰度关联模型对该项科技成果转化的知识识别结果为h (w) =0.68, h (d) =0.54, h (s) =0.81, 可以看出该项科技成果知识结构广度和特质都不错, 深度要差一些。

5 结论

本文将高校科技成果转化过程中的知识结构分为知识结构广度、深度和特质;然后给出并定义了高校科技成果转化知识结构的7个知识广度识别评价指标、7个深度识别评价指标和3个特质识别评价指标;利用灰关联度的方法建立了高校科技成果转化知识识别的评价模型, 并通过实例使用本模型对A高校的某项科技成果转化的知识进行识别, 取得了比较好的效果。

同时, 我们注意到专家参与赋值的知识结构广度、深度和特质指标矩阵具有主观性, 并不能做到完全客观, 这也就要求所选的专家是该项科技成果所在行业和科技成果转化方面的权威人士, 也可以通过邀请多位专家共同参与赋值, 取其结果的平均值, 尽量将这种影响降到最低程度。

摘要:利用灰关联度的方法对高校科技成果转化过程中的知识进行识别, 建立知识识别指标体系, 并给出基于灰关联度的高校科技成果转化知识识别的模型, 通过实例对模型进行验证。

关键词:高校科技成果转化,知识识别,灰关联度,权重

参考文献

[1]邹纲明, 汤亚非.试论我国高校科技成果的潜在经济效益[J].科技管理研究, 2008 (2) :113-115.

[2]李玉清, 许朗.高校科技成果转化的问题分析和对策研究[J].科技管理研究, 2006 (4) :128-131.

[3]梅姝娥, 仲伟俊.我国高校科技成果转化障碍因素分析[J].科学学与科学技术管理, 2008 (3) :22-27.

[4]罗本成, 原魁, -凌, 等.基于灰关联度评价的投资决策模型及应用.系统工程理论与实践[J], 2002 (9) :132-136.

加权灰关联度论文 篇6

第三方物流是指由供方与需方以外的物流企业提供物流服务的业务模式,拥有先进的技术、经济的成本、集约型的规模等优点,在军事后勤保障方面越来越受到重视。但是,若第三方物流供应商选择不当,不仅不能发挥第三方物流的优势作用,还会给后勤保障带来风险。因此,如何选择最佳的军队第三方物流供应商(Military Third Party Logistics Enterprises),对于军队成功运用第三方物流具有重要的意义。

1 建立第三方物流评价体系

选择第三方物流供应商是一个决策问题,关键在于对物流供应商的评价,指标体系和评价方法则是评价第三方物流供应商的两个核心问题[1]。目前,国内外对第三方物流供应商评价指标测重不一,但总体上看,服务能力、财务稳定性、服务价格和管理质量4个因素处于最重要的位置,信息系统与技术能力、供应商声誉、信息共享和相互信任、长期关系等处于次重要的位置[2]。通过借鉴国内外研究成果,结合我军军事物流的发展现状,建立了军队第三方物流供应商评价指标体系。见图1。

2 评价体系中各指标权重的确定

为保证权重评估的准确性,在使用层次分析法时,通过构造模糊判断矩阵得到指标权重,以真实反映各指标之间的相对重要程度,弥补传统的层次分析法的缺陷———只能得到序位意义的指标权重,不能反映各指标对评价目标的贡献率。在此,采用文献[3]的思路和方法计算各指标权重,如图1所示。

3 多目标加权灰靶决策模型[4]

多目标加权灰靶决策模型充分考虑了目标效果值中靶和脱靶两种不同情形,物理含义十分清晰,而且综合效果测度的分辨率也得到了提高。

定义1:(1)设k为效益型目标,即目标效果样本值越大越好,k目标下的决策灰靶设为即u(k)i0j0为k目标效果临界值,则称为效益型目标效果测度;

(2)设k为成本型目标,即目标效果样本值越小越好,k目标下的决策灰靶设为即u(k)i0j0为k目标效果临界值,则称为成本型目标效果测度;

(3)设k为适中型目标,即目标效果样本值越接近某一适中值A越好,k目标下的决策灰靶设为即A-u(k)i0j0,A+u(k)i0j0分别为k目标的下限效果临界值和上限效果临界值。

命题:

目标效果测度rij(k)(i=1,2,…,n;j=1,2,…,m;k=1,2,…,s)满足以下条件:

(1)rij(k)无量纲;(2)效果越理想,rij(k)越大;(3)rij(k)∈[-1,1]

综合效果测度rij(k)∈[-1,0]属于脱靶情形,综合效果测度rij(k)∈[0,1]属于中靶情形;在中靶情形,可以通过比较综合效果测度rij(i=1,2,…,n;j=1,2,…,m)的大小判断事件、对策和局势的优劣。

4 应用举例

采用上述指标权重确定方法和多目标加权灰靶决策模型,对三个第三方物流供应商进行评价决策。三个第三方物流供应商定量指标信息如表1所示。

4.1 将供应商选择决策作为事件a1,事件集A={a1}选择供应商一、供应商二和供应商三分别作为对策b1,b2,b3,对策集B={b1,b2,b3}。由事件集A和对策集B构造局势集S={sij=(ai,bj)│ai∈A,bj∈B,i=1;j=1,2,3}={s11,s12,s13}。

4.2 以图1中所示指标作为决策目标U21,U22,U23,U24,U36,U37,U38,U41,U42,U43,U44为定性目标,需要通过专家打分的方法进行评价,均为效益型指标;U11,U12,U31,U32,U34,U35为定量指标,其中U11,U12,U31,U32为效益型指标,U34,U35为成本型指标;U33为适中型指标。

4.3 确定各目标的决策权WU11=0.271,WU12=0.146,WU21=0.081,WU22=0.038,WU23=0.016,WU24=0.059,WU31=0.06,WU32=0.054,WU33=0.041,WU34=0.048,WU35=0.023,WU36=0.035,WU37=0.029,WU38=0.017,WU41=0.025,WU42=0.035,WU43=0.007,WU44=0.016。

4.4 求目标的效果样本向量U(11)=[42000,35000,45000],U(12)=[6000,57000,4000],U(21)=[9.6,9.0,9.3],U(22)=[9.5,9.4,9.0],U(23)=[9.5,9.7,9.2],U(24)=[8.8,9.0,8.5],U(31)=[0.94,0.96,0.93],U(32)=[0.93,0.87,0.97],U(33)=[4],U(34)=[0.015,0.008,0.005],U(35)=[0.034,0.025,0.037],U(36)=[9.5,9.3,9.4],U(37)=[9.2,9.0,9.6],U(38)=[9.1,9.4,8.8],U(41)=[9.4,9.0,8.4],U(42)=[9.5,9.3,9.4],U(43)=[9.2,9.3,8.9],U(44)=[9.0,9.2,8.6]

4.5设定目标效果临界值u(11)i0j0=40000,u(12)i0j0=5000,u(21)i0j0=9,u(22)i0j0=9,u(23)i0j0=9,u(24)i0j0=8.5,u(31)i0j0=0.9,u(32)i0j0=0.8,u(33)i0j0=5,u(34)i0j0=0.015,u(35)i0j0=0.04,u(36)i0j0=9,u(37)i0j0=9,u(38)i0j0=8.5,u(41)i0j0=8,u(42)i0j0=9,u(43)i0j0=8.5,u(44)i0j0=8.5。其中U(33)属于适中型指标,计划时间为5天,容忍限为2天,下限效果临界值为5-2=3,上限效果临界值为5+2=7。

4.6 求一致效果测度向量对相应目标分别采用定义1中给出的效益型目标效果测度、成本型目标效果测度、适中型目标下限效果测度、适中型目标上限效果测度,即可得一致效果测度向量:

4.7由得综合效果测度R=[r11,r12,r13]=[0.6573,0.4939,0.4417]

4.8进行决策由于r11>0,r12>0,r13>0,三家供应商均中靶,说明初选这三家供应商入围是合理的。再由,说明供应商一是军队第三方物流供应商的最佳选择。

摘要:针对军队第三方物流供应商选择问题,结合军事物流特点,建立了第三方物流供应商评价指标体系,详细阐述了运用多目标加权灰靶决策模型选择第三方物流供应商的步骤,并进行了实例分析。

关键词:灰靶决策,军队第三方物流供应商,指标体系

参考文献

[1]朱丹.第三方物流服务提供商物流能力构成探讨[J].物流科技,2007(4):48-50.

[2]周愉峰,孟波,李玉凤.第三方物流供应商选择研究评述[J].重庆工商大学学报(西部论坛),2009.11:83-91.

[3]刘建华,侯红霞,吴昊.电信数据网安全评估中权重的确定方法[J].现代电子技术,2010.9:91-94.

[4]党耀国,刘思峰.多指标加权灰靶的决策模型[J].统计与决策,2004.3:29-30.

加权灰关联度论文 篇7

关键词:数据挖掘,时态数据库,生命周期,时态关联规则

1 引言

现实世界数据库中我们可以发现各种各样的时态数据, 例如超市交易记录中的交易时间, 病历中的检查和诊断时间, 天气数据日志文件中的标记?时间等。时态数据库的出现必然要求在知识发现过程中考虑时间因素, 附加上某种时态特征的规则能更好地描述实际情况, 这样的规则就称为时态关联规则, 它能有效挖掘出一些全局支持度较低, 但在某些时段却有较高支持度和信任度的规则, 如中秋节的月饼、圣诞节礼品等容易在传统关联规则挖掘中被忽略但对用户有重要价值的规则。目前国内外研究的主要内容有:序列模式挖掘, 周期关联规则挖掘, 日历关联规则挖掘等。

文献[1]中提出了生命周期的概念, 其主要思想是数据库中每一项X都有一个生命周期, 项目X的支持度等于X的生命周期内包含X的事务数与该段时间内总的事务数的比值。但该算法直接利用Apriori算法中频繁 (k-1) 项集进行连接生成候选k项集, 这种做法存在不合理之处[3]。

文献[2]在考虑关联规则成立的时间区域的同时, 对交易事务进行垂直加权, 使规则的发现体现了一种时间趋势, 但是该文提出的算法并没有对项目进行加权以区分项目的不同重要性, 而且该算法存在和文献[1]中的算法同样的不合理性。

文献[3]提出的算法该进了以上算法的不合理之处, 既考虑了项目的权重, 又考虑了项目的时态性。但在该算法中, 并没有考虑交易记录的权重, 而且该算法中每生成一个候选项集或频繁项集均需通过扫描数据库来计算其加权支持度, 且算法是基于Apriori算法思想设计而成的, 其复杂性与Apriori算法的复杂性相似。

本文对文献[3]中的算法进行了改进, 同时改进了文献[1, 2]的不合理之处, 提出一种新算法来挖掘加权时态关联规则, 算法既考虑了项目的权重, 又考虑了交易的权重, 同时还体现了数据的时态性。算法采用了树和矩阵的数据存储结构, 挖掘过程中只需扫描一次数据库, 且该算法利用向量之间的交集计算加权支持度, 通过对上三角矩阵按支持度计数升序排序, 使得数据尽可能均匀细化, 降低了树的高度, 减少了遍历候选项集树生成的候选项集数量, 提高了时态关联规则的挖掘效率。

2 相关概念

为I中每个项目ij赋以权值wj, 其中0≤wj≤1, j={1, 2, …, n}。当项目具有权重后, 数据项所属的交易也具有了相应的权重。

定义1交易记录Di的权重记为W (Di) :

其中, Di表示交易记录Di中包含的项目个数。

定义2设项集X∩I, X在D内从最初出现到最后出现的时间区域为[T1, T2] (T1<T2) , 称[T1, T2]为项集X的生命周期。|X[T1, T2]|表示时间[T1, T2]内包含项集X的事务个数, |D[T1, T2]|表示D在时间[T1, T2]内的事务总数。

如果项集X和Y成立的有效时间区域分别是[T1, T2]、[T3, T4], 则X∪Y成立的时间区域就是[T1, T2]∩[T3, T4]。

定义3项目集X在其生命周期[T1, T2]内的加权支持度WS (X[T1, T2]) 为:

τ表示时态阈值, |τ|表示τ时间区间内包含的事务个数[7]。

定义4给定一个最小支持度minsup, 时间阈值τ, 当项目集X的加权支持度WS (X[T1, T2]) ≥minsup, 且|[T1, T2]|≥τ时, 我们称项目集X在其生命周期[T1, T2]内是加权时态频繁的。

定理1若项目集X的生命周期小于时间阈值τ, 则X的所有超集都不是加权时态频繁项集。

证明假设项目集X的生命周期是[T1, T2], 所以|[T1, T2]|<τ, 项目集Y是X的超集, 其生命周期为[T3, T4], 有|[T3, T4]|≤|[T1, T2]|, 所以|[T3, T4]|<τ, 根据定义4可知, Y是非频繁项集。

3 优化算法描述

3.1 算法思想

1) 扫描时态数据库D, 得到C1, 并将D转换成布尔矩阵 (BM) 表示形式, 其中行向量表示项集, 列向量表示交易事务。计算I中各个项目的生命周期, 存放在数组L[]中;计算每条交易的权重, 将其放在数组W[]中。

2) 将C1中的各项按其支持度计数递增顺序排列, 并按该顺序生成L1。

3) 根据C1生成C2, 利用定理1对C2中的候选项集进行剪枝。然后扫描布尔矩阵BM, 计算C2中每个候选项集在其各自生命周期内的加权支持度, 得到L2。同时, 利用C1和L2生成上三角矩阵 (ATM) :若C1中的两个项目可组成2项频集, 则将ATM中相应位置填1;否则, 填0。这里, 我们约定主对角线上的元素为0。

4) 根据上三角矩阵ATM生成候选项集树CIT:

1) 创建根节点root, 依次将C1中各项添加到树中, 作为root的子节点。

2) 对第一层的每个节点i, 找到上三角矩阵ATM中该节点对应的行。扫描该行, 若存在项j使得ATMij=1, 则在i节点下建立一个儿子节点j。

3) 对每层的节点按第 (3) 步的方法进行同样的操作, 直到所有的节点都没有子节点。

最后, 从第三层开始遍历该候选项集树CIT, 得到相应的候选项集, 之后根据定理1更新候选项集, 然后计算候选项集的加权支持度, 生成加权时态频繁K (K>=3) 项集。

3.2 算法描述

输入:时态数据库D, 最小支持度minsup, 时间阈值τ, 项目集合I

输出:加权时态频繁项集L

算法说明:

1) C2=Generate_C2 (C1) :C1中的每个项目进行如下的连接:

然后根据定理1对C2进行更新。

2) ATM=Generate_ATM (C1, L2) :根据C1和L2建立上三角矩阵ATM:

1) For each item i in C1

2) For each item j in C1that after i

3) If{i, j}L2{ATMij=1;}∩

4) Else{ATMij=0;}

4 仿真实验

仿真实验的运行环境是Window XP操作系统, AMD Athlon (tm) II X2 255 Processor (3.10 GHz) CPU, 2G内存, 用Java语言编写。对比算法是文献[6]中算法 (以下简称原算法) 。实验数据来自著名的人工合成数据集T40I10D100K, 共有46873条交易记录, 63个数据项, 将记录的产生序号作为该记录的产生时间, 这样数据集就有了时态特征, 项目权值分配采用文献[5]中权值分配方式。

1) 最小支持度不变 (设为0.02) , 时态阈值变化时, 仿真结果对比如下图1。

2) 时态阈值不变 (设为60) , 支持度变化时仿真结果对比如下图2。

从图1、图2的仿真结果对比可以看出, 最小支持度不变时, 时态阈值越大, 产生的候选频繁项集越少, 算法运行所需时间越小;时态阈值不变时, 最小支持度越小, 产生的候选频繁项集越多, 算法运行时间越大。无论时态阈值或者支持度变化, 改进算法性能明显优于原算法性能, 因为改进算法在挖掘过程中只需扫描一次数据库, 并且利用集合交集来计算项集加权支持度, 提高了挖掘效率。

5 结束语

在时态数据库挖掘过程中, 以项目的生命周期作为时间特征, 根据项目不同的重要性, 引入项目权重, 提出了一种加权时态关联规则的挖掘方法。本方法采用树和矩阵的数据存储结构, 挖掘过程中只需扫描一次数据库, 利用高效的数字运算计算加权支持度, 提高了挖掘效率。采用本方法挖掘出的关联规则既体现了数据固有的时间特性, 又体现了项目和交易记录的权重, 更具有实际意义。

参考文献

[1]Ale J M, Rossi G H.An approach to discovering temporal as-sociation rules[C]//Proc.of the 2000 ACM Symposium on Ap-plied Computing[S.1.]:ACM Press, 2000:294-300

[2]朱建平, 乐燕波.数据挖掘中加权时态关联规则的构造[J].计算机工程, 2008, 34 (6) :51-53.

[3]戴月明, 李彦伟, 王金鑫.一种加权时态关联规则挖掘算法[J].计算机工程与应用, 2011, 47 (26) :156-159

[4]张令杰, 徐维祥.基于时态约束的关联规则挖掘算法[J].计算机工程, 2012, 38 (5) :50-52

上一篇:超细粉体下一篇:电力装备制造业