相似参数(共3篇)
相似参数 篇1
摘要:全球制造业竞争日趋激烈, 制造商开始越来越注重缩短生产周期和降低成本, 通过参数设计及CAD相似整合技术将探讨拓展到边界设计方法。笔者主要介绍了参数化设计的含义、核心思想、产品参数化设计构建以及系统构建相似模型。
关键词:参数化设计,边界设计,相似技术
对于产品的设计首先必须收集各方信息, 然后拟定产品设计方案, 规划其发展方向, 最后实现产品的生产, 这个过程是十分复杂的。计算机辅助设计衍生出了虚拟原型技术, 利用计算机技术对产品进行建模和模拟计算, 不用制作繁琐的实体模型, 从而节约了成本。大多数以实体几何构建虚拟原型, 几何体是几何表示法的基本构建方式。基本建模方式能够塑造出模型的外形特征, 其是通过布尔运算组合实现的。基础的点、线、面共同构成了几何形体, 模型结构处于边界条件之内, 模型大小取决于边界条件参数, 模型外形特征受布尔运算组合实体几何的控制。产品辅助设计系统就是在引入产品设计方案后, 进行系统化而得来的。
1 参数化设计的含义
几何图素简单堆叠的产品模型最开始是CAD系统构建的, 而它只能将设计的产品外形描述出来, 而设计者的设计思想却无法得到体现, 也不能改动模型, 必须重新构建产品改进模型。参数化的设计方法则可以有效解决这项问题。所谓参数化设计就是按照产品内每个部件的参数性能, 确定产品尺寸结构或几何形状。这些尺寸可以被当作设计条件的函数, 各个部件的尺寸和形状可随着设计条件的改变而改变。参数化设计有两种内涵:一方面, 整体模型会随着每个互交式尺寸的改变而改变, 意味着模型中任何一个部件的尺寸被修改, 那么整体产品以及和这个部件有联系的尺寸都会变动, 这种方法一般适用于简单结构的图形;另一方面, 针对某个领域的具体问题, 由用户或第三方开发出的应用程序, 用以参数化设计, 若一个部件的尺寸需要修改时, 则该部件尺寸与所有相关部件尺寸的变更都是由应用程序实现, 这种方法的编程量大。
2 参数化设计的核心思想
2.1 轮廓法
若干首尾相接的直线或曲线共同组成了轮廓, 这是实体模型截面形状或扫描路径的表达方式。这些直线或曲线必须是相连接的, 但可以是密封的轮廓, 也可以是不密封的。虽然轮廓与轮廓生成的原始线条很相似, 但实质上是存在差异的。轮廓上的线条不可随意移动, 而轮廓生成的原始线条则可随意变动或移除。原始线条的本质等同于二维绘图的线条。
2.2 尺寸驱动
计算机对轮廓位置、外形、大小的控制主要是通过线段的尺寸与线段间的约束。参数化技术的关键就是利用计算机, 并按照尺寸、约束正确控制轮廓。设计人员对变动轮廓尺寸大小时, 轮廓也会随之变动, 这就是尺寸驱动。
2.3 变量驱动
变量驱动也称为变量化建模技术, 设计要素中的尺寸、约束、名称等都被变量驱动看作设计变量, 这些变量间的联系和程序逻辑可以被用户定义, 很大程度上提高了设计的自动化。尺寸驱动由变量驱动技术的提升而得到拓展, 可以更加自由地修改所设计的产品。
2.4 相互联系
装配中的全部部件都不是作为个体而存在, 参数化设计系统里每个部件尺寸的确定都要考虑到其他部件尺寸的大小和位置, 这样就能确保装配后的零件尺寸自动相符。
2.5 显示提示
人工设计的传统工程技术, 常常出现尺寸不足、多余且相互矛盾的现象, 而参数化设计系统, 设计人员可以利用计算机对尺寸做出正确标记, 计算机能够及时察觉尺寸的多或少, 并在适当时间显示提示, 告知设计人员。
2.6 动态导航
参数化作图手段中的动态导航指导性强, 其和设计人员间的默契度很高, 极大提高了设计效率。用户的意图动态导航可以通过光标的位置进行推测, 把猜测的约束用直观的图标显示于相关图形的周围。
2.7 结构规划
设计产品之前, 按照产品的设计要求, 应先勾勒出整个产品的大概设计。产品的参数主要就是通过勾勒而确定的, 而产品的具体细节不包含于其中, 这种概念性设计就是结构规划。为保持设计一致, 在产品部件与装配设计中应结合结构规划中所确定的参数。
3 产品参数化的设计构建
3.1 参数化设计
参数化设计属于产品的变形设计, 事物间的联系由参数化定义, 建立的联系在参数和输出之间, 同时存在衍生关系, 其重视的并非事物本身形状, 而是事物间的联系。变形设计的基础就是参数化设计, 是明确设计对象的结构后, 用一组参数表示出产品尺寸和约束条件, 按照要求, 产品模型外形的变化根据参数的变化而改变, 以满足相关要求。
3.2 相似部件中参数化设计的应用
齿轮尺寸大小、齿数、厚度应按其使用范围进行调整, 轴承座半径、轴承高度、孔径、厚度、孔数也应按其使用范围进行调整, 三通管接头大小、管径、管壁、孔径、厚度以及孔数也是按其使用范围进行调整。门与框架的连接主要是通过平面铰链实现的, 用途十分广泛, 所需尺寸的大小是由其使用的地方、负荷等差异而决定的。产品模式的改变, 是由于其孔径参数、孔径间距参数、厚度参数、长度参数、宽度参数的改变而引起的。
3.3 结构特征设计
特征设计的设计理念不是采用抽象的点、线、面直接表现的, 而是通过产品组合特征的孔、槽、凸出、筋板、平台等改变产品造型表现出来, 且能够轻易修改产品设计图, 一般都是由系统特征库提供常用的形状特征, 特征库还可以通过用户自定义进行扩展, 对产品的设计是通过特征资料库实现的。复杂的形体由简单的几何形状体组合而来, 两个几何体间的运算方式常用布尔运算, 布尔运算可以完成不成形或不规律的形状, 产品的特征也是由布尔运算相加或相减得到的。
4 系统构建相似模型
4.1 参数化的构思
只有了解了怎样绘制出3D实体模型, 就能知道物品是如何形成参数圆形。简单来说, 用绘制的巨集来绘制长方体的动作, 长方体的参数是变化的, 数值可由使用者随意输入, 得到的长方体就不同。若挖空长方体任何一个面中的位置, 那么使用巨集方程式只能改变预定的面内, 而对于孔的位置和作用面则是不能改变的。
4.2 系统模型形似性评估
首先利用变形设计的概念建立产品特征结构目录, 其次利用巨集逐步构建产品结构特征, 最后按顺序进行选择, 把模型结构特征的巨集依次传送到CAD软件系统中成型, 把特征结构按顺序组合构建出模型, 这是本文系统的基础构架。构建出的系统既有连接CAD系统模型成型功能, 还有资料的存储和资料库系统修改的功能。完成构建系统功能, 使产品的设计更加便利, 模型的构建也更加方便, 使产品资讯更便于管理。
5 结语
参数设计及CAD相似技术的整合技术是现代设计的核心技术。在设计机械时, 整理和归类基本结构的相似部件, 将各部件的参数输入到设计系统中, 设计人员只要将相应参数输入到计算机内, 计算机便可自动进行设计, 零件图和配置图会同时生成, 节约了设计人员的设计时间, 提高了工作效率。因此, 这项技术已被广泛应用, 且社会效益和经济效益都十分可观。
参考文献
[1]郭鹏勃.参数设计及CAD相似技术的整合研究[J].新技术新工艺, 2014 (9) .
[2]唐忠.齿轮传动参数设计CAD技术研究及实现[J].机械制造与自动化, 2013 (4) .
[3]钟文仁, 丁郁宏, 李泰志, 等.知识化与参数化之自动化模具设计[A]//第十一届先进成型与材料加工技术国际研讨会[C].2014.
[4]王新华, 马永超, 吴婷.离心泵叶轮的三维CAD系统设计及仿真[J].机械设计与制造, 2009 (1) .
相似参数 篇2
循环码被广泛应用于通信、军事等领域中,但目前,据现在公开发表的文献来看,大部分文献集中在卷积码的盲识别上,较少研究循环码的盲识别。文献[4]根据实际码重与均匀码重之间的距离估计码长;文献[5]根据比特率检测法识别码长和起始点,二者均适用低误码率的环境;文献[6]根据矩阵秩信息熵识别码长及码重信息熵识别起始点,高误码条件下识别较好;文献[7]根据欧几里德算法得到最大公因式,完成对码长及生成多项式的识别;文献[8]根据码根信息差熵和码根统计识别码长和生成多项式,二者虽容错性较好,但均只适用于本原BCH码的识别;文献[9]根据秩函数和码根特征实现循环码的盲识别,虽适用于较高的误码环境,但运算量会增加;文献[10]根据码重分布不均匀的特性识别码长和起始点,虽运算量较小,但容错性一般;文献[11]根据码重分布概率方差识别码长,计算码多项式的公约式求解生成矩阵,无复杂计算,需已知起始点。
上述的识别算法,针对性较强、计算量大或容错性一般,针对这些不足,本文提出了一种基于数据挖掘中相似度的方法进行识别,本算法无复杂计算、适用于一般循环码且容错性较好。首先,在不同的先验知识下,利用码重相似性度量函数识别码长和起始点,进而对传统矩阵进行优化来获得生成矩阵,并设置判决门限进行验证。理论分析并与其他算法进行比较,仿真结果表明,该算法在不需要大量数据截取的条件下,在高误码率为0.01时能够识别码长和起始点,且效果明显,容错性较好。
1 循环码的定义及分析
定义1[12]:设X=(x1,…,xd)和Y=(y1,…,yd)是d维空间中的两个点,相似性度量函数为Hsim(X,Y),该函数表示对象之间的相似程度,函数值越小,对象之间的差异越大,即相似性越小;相反,相似性越大。其表达式如下
定义2[13]:一个n重子空间Vn,k∈Vn,若对任何一个V=(an-1,an-2,…,a0)∈Vn,k,恒有V1=(an-2,an-3,…,a0,an-1)∈Vn,k,则称Vn,k为循环子空间或循环码。GF(q)(q为素数或素数的幂)上的[n,k]循环码中,存在唯一的n-k次多项式g(x)=xn-k+gn-k-1xn-k-1+…+g1x+g0,且每一码多项式C(x)都是g(x)的倍式,这相当于
式中:m(x)=mk-1xk-1+mk-2xk-2+…+m1x+m0是信息多项式;r(x)=rn-k-1xn-k-1+…+r1x+r0是校验多项式。
定义3[13]:按照信息码元在编码后是否保持原来的形式不变,可划分为系统码和非系统码。系统码的G矩阵为G=[IK,P],左边是k×k阶单位方阵。根据生成矩阵G可以写出其校验矩阵H=[In-p,P'],其中P'是P的转置。
定义4[13]:一个码字的重量等于该码字中非零元素的个数。在二进制码中码重就是二元序列中含有“1”的个数。设Ai是[n,k,d]分组码中重量为i的码字数目,则集合{A0,A1,…,An}称为该分组码的重量分布。码重分布概率Pi是重量为i的码字个数在码字总数中出现的概率。
2 循环码的参数估计
对于循环码而言,码组内各码元之间存在较强的线性约束关系,且不同码重的码组分布是非等概率的,而对于随机序列来说,并不是任意组合的码字都会出现,根据码重分布和随机序列码重分布概率存在较大的差距进行码长和起始点的识别。
将两个码重概率分布看成是两个n维向量,采用机器学习中的相似性度量函数来衡量二者之间的差距,对(n,k)分组码来说,设码重分布概率(p0,p1,…,pn)为实际序列分布,设序列中“0”和“1”等概出现,则码重分布概率为随机序列分布,码重相似性度量函数为
经上述分析:在起始点已知时,当码重相似性度量函数值越大,说明实际序列与随机序列越相似,差异性就越小,则该码长不是真实码长或码长的整数倍。相反,该值越小,则该码长为真实码长或码长的整数倍,即可识别码长。同理,码长已知时,起始点处对应的码重相似性度量函数值越小,即可识别起始点。
2.1 起始点为先验知识下识别码长
在实际工程中,通过帧同步信息可以找到码字的起始位置q,因此,本节已知起始点来识别码长。
已知起始点时,假设接收序列长度为N,则码长识别步骤如下:
1)初始化估计的码长为n,变化范围为1~t,t的值根据实际情况选定,将接收序列按估计码长放入矩阵中,列数为n,行数为m,且行数m=[(N-q+1)/n],即码字数,其中m>4n,记为
式中:a=m,m-1,…,1。
2)将每个码字Ca中的元素进行累加计算码重,即
3)根据式(3)计算Hsim(P,C)的值。
4)n=n+1,转到步骤(1),计算不同码长估计值n对应的码重相似性度量函数Hsim(P,C)的值。
5)计算完成后,找出Hsim(P,C)最小值对应的码长估计值n即为真实码长。
2.2 码长为先验知识下识别起始点
码长n可以对接收的数据流处理得到,因此,识别起始点则为关键。
码长已知,则起始点识别步骤如下:
1)初始化估计的起始点为第q位,q的取值范围为1~n+1,将接收序列N按确定的码长n放入矩阵中,列数为n,行数为m,且行数m=[(N-q+1)/n],即码字数,记为
式中:a=m,m-1,…,1。
2)同上述码长的识别步骤2)和3)相同。
3)q=q+1,转到步骤1)继续执行,直到q=n+1,比较上述计算的结果,找出Hsim(P,C)最小值对应的q即为码字起始点。
2.3 计算生成矩阵
由码重相似性度量函数识别出码长和起始点,为达到无误码字最大化,选取在编码识别过程中出现码重概率最大的码字排列成矩阵形式,并对矩阵进行初等行变换,应采取模二运算,化简后的形式为[IkP],m-k余下行全部化为0。
求得生成矩阵G后,即可得到生成多项式,为验证其正确性,可通过式(2)来说明。当接收码字无误码时,由接收码字得到其码字多项式,并除以生成多项式,其中除法运算中减法也是模二和运算,若余式为0,则式(2)关系成立;相反,式(2)不成立。在实际噪声环境下,根据传输信道误码率设定判决门限T,当T小于式(2)成立的概率时,所得生成矩阵正确。
3 仿真验证
3.1 起始点已知,识别码长
为了验证识别方法的正确性,选取误码率Pe=0.01和Pe=0.10的(7,4)、Pe=0.01的(15,5)、Pe=0.05的(31,16)4种循环码,码元个数为104,运用MATLAB进行试验仿真,结果如图1所示。
经图1可以看出,在一定的数据量条件下,由于码组内具有完整的线性约束关系,当遍历码长为真实值或其倍数时,分组后不同码重的码字序列与随机序列码重分布概率相差较大,所以,相似性度量函数值较小,当首次出现最小值时,则为真实码长n。相反,当不是真实值或其倍数时,分组后不同码重的码字序列接近随机序列码重分布概率,所以,相似性度量函数值变化相对平稳。同时,在低误码率时,即0.001~0.010时,能正确识别码长且效果较明显,而且再次出现低值的点,可以识别2~3整数倍的码长。但随误码率的增加,虽可以明显的识别真实码长,但码长整数倍的点,识别效果不明显,可见,对于真实码长,该识别方法能适应较高的误码率,且识别效果明显。
3.2 码长已知,识别起始点
为验证识别方法的正确性,选取误码率Pe=0.05和Pe=0.1的(7,4)、Pe=0.08的(15,5)、Pe=0.03的(31,16)、Pe=0.01的(127,50)4种循环码,码元个数为104,运用MATLAB进行试验仿真,结果如图2所示。
经图2可以看出,码长已知,编码码字不同,所选误码率不同,依次对假设的起始点遍历,根据码重相似性函数值的大小可判断出起始点的位置。对于上述4种循环码,虽误码率不同,但都较明显的识别出起始点,可以看出,码重相似度最小值分别出现在6、13、16、30,则相似度较小,码组内线性约束关系较强,则该点即为起始点。对于(31,16)和(127,50)循环码,误码率较前者较低,由于选取码元个数相同,所以二者实验仿真所用的码字数相对于前者较少,即误码率选取要小一些,才能保证正确识别码字起始点,若要求在高误码条件下,可以选取较多的码字进行仿真即可,可见,该方法可在高误码率的条件下正确识别码字起始点,识别效果明显且容错性较好。
3.3 结果分析
在误码率Pe=0.01的条件下,选取码长与码率不同的码字进行100次蒙特卡洛仿真实验,得到不同码的正确识别概率如表1所示。
由表1可知:根据码重相似性度量函数值可以正确识别码长和起始点,但码长与码率的不同会直接影响到识别的性能。码长与码字个数相同时,低码率的码字识别效果较明显,容错性能较好,例如码长为15的码字;码长与码率相同时,选取较多的码字,码长和起始点的识别效果会有较明显的提升,例如码长为127的码字;码字个数相同,码率相近时,例如(63,24)与(127,50)两种码字,前者码长识别率高于后者。总体可得,该算法更适合于低码率的中短码进行识别。
4 生成矩阵求解及验证
针对有误码的情况,选取200个码字,在含有Pe=0.015的误码条件下,以(15,5)循环码为例,利用识别码长2.1节描述中的第2)步记录码重i出现的次数记为qi,则在码字中占的概率值如图3所示。
经图3可以看出,当码字的码重为7和8时所占概率较大,因此,选取这两种码重对应的码字构成m行n列(m>n)的矩阵,采用模二运算对矩阵进行化简,获得生成矩阵G
由循环码的定义可知,生成矩阵G的最后一行即为生成多项式的系数,即生成多项式为g(x)=x10+x8+x5+x4+x2+x+1。为检验G的正确性,可利用生成多项式g(x)来验证。首先,设置判决门限T,常规信道误码率设定为2×10-2,计算200个码字中共包含60个错误码元,设定不同码字中含有一个错误码元,计算出错误码字占所有码字的比例为30%,可得判决门限T=1-30%=70%,即当式(2)成立的概率大于T时,可认为G求解正确。在上述试验中,当n=15时,所有码字利用式(2)计算出余式为0的概率为87%,即大于70%,可见,生成矩阵G的求解正确,即可完成识别。
5 容错性比较分析
在误码条件下,对于不同参数的系统循环码,在误码率取值不同的条件下,选取2×104个码字进行1 000次蒙特卡洛仿真实验,得出码长和起始点识别率,如图4、图5所示:根据码重相似性度量函数识别码长和起始点,明显看出,(7,4)和(15,5)在误码率为0.20时,码长和起始点识别率高达95%;(31,16)在误码率为0.05时,识别率高达90%;(63,18)在误码率为0.01时,识别率高达90%。可以得出,随着循环码的码长与码率的增加,码字之间的线性约束关系降低,导致识别概率逐渐减小;同时,该算法能在高误码率条件下,能有效地识别码长和起始点。
循环码也是一种线性分组码,分别选取2×104个4种长度的循环码为实验对象,进行仿真,图6和图7为文献[6]识别码长和起始点的概率曲线图,比较图5和图6,在码字个数与种类相同时,选取相同的起始点识别概率,可以看出,本文的误码率在高于文献[6]时,起始点仍能够正确识别。以(7,4)典型循环码为例,当起始点识别概率达到100%时,本文算法的误码率为0.15,而文献[6]的误码率为0.08,可见本文算法在识别起始点所体现出的容错性更有优势。在起始点已知时,图8为文献[11]利用码重分布概率方差识别码长概率曲线图,选取数目种类相同的码字,对文献[6,11]和本文提出的码长识别算法进行比较,图9为不同算法的90%识别误码率上限[14]曲线图,以码长15为例,本文的误码率为23%,文献[11]的误码率为8%,文献[6]的误码率为3%,仿真结果表明,在码长取值相同的条件下,本文识别算法抗误码的能力高于之前的算法,容错性较好。
6 结论
本文依据码重分布的特点,根据数据挖掘中相似度的方法,实现对码长和起始点的识别,在此基础上,利用优化传统的矩阵化简识别生成矩阵,即得出生成多项式,并设定判决门限完成生成多项式的正确检验,进而实现对系统循环码参数的识别。最后,在不同的先验知识和不同的误码率下,对系统循环码进行大量的仿真实验,并与其他算法进行比较,结果表明,该算法无复杂的计算,对低码率的中短码在误码率为0.01时识别效果较明显,具有较好的容错性,在增加码组数量的同时,码长和起始点的识别率得到较大的提高。
摘要:针对系统循环码参数的盲识别问题,提出了一种基于数据挖掘中相似性度量函数的方法。首先,在不同的先验知识下,利用实际序列与随机序列的码重分布相似度差异最大的特性识别码长和起始点,在此基础上,通过优化传统的矩阵化简,由码字多项式与生成多项式的关系设定判定门限T的方式求解生成矩阵,实现了对系统循环码的盲识别。仿真结果表明,该算法在误码率为0.01的条件下识别效果较好。
相似参数 篇3
关键词:电力系统,可靠性原始参数,模糊聚类,相似度,贴近度,灰色关联度
0 引言
近年来,国内外范围时有大停电事故发生[1,2,3],造成了巨大的经济和社会损失,因此加强对电力系统可靠性评估显得十分重要。可靠性原始参数的获取是可靠性研究中最基础、最重要的工作,可靠性参数的可信度或者准确度直接影响到系统可靠性分析的计算结果。通常,可靠性原始参数的获取是通过大样本系统宏观统计分析得到的[4],然而,微观系统的可靠性原始参数则具有动态性和随机性,受气候因素[5]、人为因素[6]、地理条件、产品自身的质量、负荷水平、电压频率运行因素[7,8]等的影响很大。对于新投产的项目,采用全国范围统计的宏观数据作为微观、具体工程项目的可靠性原始参数,往往是不恰当的,无法反映微观工程所处的气候因素、地理环境和实际的运行情况。因此探索开发处理电力系统可靠性原始参数的方法,合理利用电力系统已有的可靠性原始参数来评估新投产的项目是非常有意义的。
文献[9-11]侧重于电力系统可靠性原始参数的预测和修正,很少涉及如何利用已有的可靠性原始参数来评估新投产的项目。本文在文献[12]的基础上提出相似度指标,引入考虑其他影响因素的修正系数,通过模糊聚类分析将所有线路进行适当分类,计及气候和地理因素的影响程度来预估微观工程的可靠性原始参数,用同类中可靠性参数确定的输电线路来求取可靠性参数未知的输电线路,为合理评估新投产的输电线路的可靠性参数提供新方法。
1 相关理论和求取方法
1.1 聚类分析
所谓聚类分析[13]就是用数学的方法对事物进行分类,本文使用传递闭包的模糊聚类方法,具体步骤如下:
首先依据各对象所拥有的属性按照某种规则求出模糊集的相似矩阵R。设X={x1,x2,…,xn}为待分类的全体,其中每一待分类对象由一组数据表征如下:xi=(xi1,xi2,…,xim),表示xi和xj之间的相似关系rij有最大最小法、数量积法、相关系数法、算术平均最小法、绝对值指数法等,本文采用绝对值减数法来求取相似矩阵R。
式中:xik和xjk为xi的分量,i=1,2,…,n,j=1,2,…,n,k=1,2,…,n;c为一指定常数。
其次,在求出相似矩阵R后,再通过逐次平方法求出R的传递闭包R*=t(R),则R*即为R所对应的模糊集等价矩阵,其λ-截集R*是等价的布尔矩阵,在R*λ中为关系为1的元素,即可认为在λ-截集水平下是一类的。聚类水平λ的大小直接影响聚类结果,当λ从1降到0时,分类由细变粗逐渐归并,形成一个动态聚类图。
最后,确定合理的分类阈值λ,对所有对象进行适当分类。设在阈值λ水平上类的个数是G,类Gk中对象的类内离差平方和为
其中,是类GK的重心。
定义
记T为所有分类对象的总离差平方和
定义R2统计量[14]为
R2统计量可用于评价聚类效果。当所有分类对象各自为一类时R2=1;当所有分类对象最后合并成一类时,R2=0。R2的值总是随着分类数目的减少而减少,可以从值的变化看分类对象分成几类最合适。比如,分为五类以前各类的R2值减小较缓慢;分成四类时,R2值减小较快,则认为分为五类较合适。
1.2 模糊集贴近度
所谓模糊集贴近度是对两个模糊集接近程度的一种度量,常用的贴近度有欧氏贴近度和模糊贴近度。
设有论域U={u1,u2,…,un},模糊集A、B∈ζ(U),则欧氏贴近度为
模糊贴近度为
欧氏贴近度反映了模糊集之间元素的相对距离,模糊贴近度反映模糊集之间的最大元素值和最小元素值的比值,它们各自反映了模糊集之间的某些性质,但是未能反映集合的变化趋势。
1.3 灰色关联度
灰色关联度[15]可用来分析和确定系统诸因素间的影响程度或各因素对系统主行为的贡献,基本思想是依据各因素数列曲线形状的相似程度做态势分析,曲线的几何形状越接近,相应序列之间的关联度就越大,反之就越小。因此模糊集之间的关系还可以用灰色关联度来度量。
设x0(t k)={x0(t1),x0(t2),…,x0(tn)}为灰色关联分析中的参考序列,xj(tk)={xj(t1),xj(t2),…,xj(tn)}为比较序列,xj(ti)对xo(ti)的灰色关联系数可表示为式(8)。
式中:j=1,2,…,m;k=1,2,…,n;m为序列个数;n为序列中因素的个数;ρ为分辨率,0<ρ<1,一般取值为0.5。
xj(i)对xo(i)的关联度为
1.4 相似度
由上可见,欧氏贴近度反映模糊集之间元素的相对距离,模糊贴近度反映模糊集之间的最大元素值和最小元素值的比值,灰色关联度反映模糊集各个元素的变化态势,将这三者结合起来综合反映模糊集间的位置接近程度和趋势变化,形成新的指标—相似度[16]。将以上三者进行无量纲化后合并得到相似度指标的表达式为式(10)。
式中,α,b,c为权重系数,满足a+b+c=1,可根据模糊集各元素之间的相对位置和趋势变化的敏感性来进行适当选取。
1.5 原始参数的求取方法
通过聚类分析,将已知各种影响可靠性参数因素的所有线路进行适当分类,计算同类别中已知故障率的线路和待求故障率的线路的相似度,按加权原则获取待求线路的故障率[12],引入考虑其他影响因素的修正系数来对计算结果进行修正,即式(11)。
式中:β为考虑其他影响因素的修正系数,可经过调查和专家系统给出;λi为线路Ai的故障率;η(Ai,B)为线路Ai和B的相似度。
2 算例分析
本文取文献[12]中已提出的影响线路可靠性参数的气候因素作为线路的模糊集元素,现有7条已有可信统计故障率数据的线路L1~L7,另有两条待求线路L8、L9及其气候统计数据,所有线路对应的环境统计年平均数据和线路的故障率如表1所示。
在进行贴近度和灰色关联度计算之前,先对特征数据进行无量纲化,取各类影响因素中的最大年平均值作为分母,各工程对应的年平均值作为分子进行量化得表2。
按式(1)进行聚类分析得到线路的相似矩阵
用平方法求出传递闭包R*,得
根据λ的不同取值可将线路集L分成不同类,按式(2)~(5)计算分成不同类别时的PG、T和R2值,可得表3。
根据表3 R2的统计量分析得,在λ的取值范围为0.775 6<λ≤0.895 2时,线路集分成三类是最合理的,即线路可分为L1={L1、L2、L5、L8},L2={L4、L6、L7、L9},L3={L3}。
根据式(6)~式(9)分别求取线路L8和L1、L2、L5,线路L9和L4、L6、L7的欧氏贴近度、模糊贴近度、关联度和相似度,在求取相似度时认为三者对模糊集贡献同等重要,取其权重系数都为1/3,于是得到表4、表5。
结合表1给出的各已知线路λ值和设β=1,根据式(11)计算可得,λ8=0.080 32,λ9=0.056 98。
3 验证
为了验证方法的可行性和准确性,按式(6)~式(9)计算同类中已有可信参数的输电线路L7和L4、L6的欧氏贴近度、模糊贴近度、关联度和相似度,权重系数取为1/3,计算结果如表6。
已知λ4=0.059,λ6=0.055,ß=1,根据式(11)计算得λ7′=0.056 88,与实际结果λ7=0.057 0基本相符。该方法能够解决仅使用单一的欧氏贴近度,模糊贴近度或关联度度量时线路选取的差异性和准确性,如采用欧式贴近度时,线路L7和L6更相似,则λ7′=0.055,和实际值误差较大;采用模糊贴近度时,线路L7和L4、L6的相似程度相同而不知如何选取。本文将所有线路进行聚类,只需计算同类中的相似度,不用像文献[12]一样计算待求线路和所有已知可靠性原始参数线路的模糊差异度。同时,本文使用同类中的已知故障率的线路来估计待求线路的故障率,避免了阈值选取的不确定性。
表7给出不同权重系数情况下线路L7和L4、L6的相似度和故障率。
可见,不同权重系数的取值对计算结果存在一定的影响,但影响不大。总体上上述结果比采用文献[11]的方法计算得出的结果λ7′=0.056 8稍好,比简单采用现有线路L1~L6的平均故障率λave=0.069 67来作为λ7的值则准确很多,这表明计及气候和地理因素后的可靠性原始参数预估能够更准确地反映该线路可靠性的实际情况。
4 结语
本文提出的基于模糊聚类和相似度的电力系统原始参数预估方法,以气候影响因素作为描述线路的模糊集,通过聚类分析将所有线路进行适当分类,避免了阈值选取的不确定性,引入β作为考虑其他影响因素的修正系数,在分析欧氏贴近度、模糊贴近度和灰色关联度反映模糊集特征的差异性和局限性的基础上提出新的指标—相似度,运用该指标能够很好地使用已知可靠性原始参数的线路预估新投产的线路的可靠性原始参数,验证算例表明采用相似度指标优于单一的欧式贴近度、模糊贴近度或灰色关联度,比单纯地使用现有线路故障率的平均值更加准确,为合理地评估新投产工程的可靠性原始参数提供新的理论方法。