偏最小二乘回归分析

2024-07-20

偏最小二乘回归分析(精选7篇)

偏最小二乘回归分析 篇1

水分含量是煤品质非常重要的检测参数之一,水分含量对煤加工、运输、销售均起到至关重要的作用。水分传统检测方法是热重分析,缺点是耗时较长。近红外光谱采集1 100 ~ 2 500 nm范围内的光,主要反映物质分子中C - H、N - H、O - H、C - O和S - H等基团振动的合频与倍频吸收[1]。因此,近红外光谱可以通过O - H基团吸收获得水分含量信息。目前已有一些科研工作者对近红外光谱技术用于煤中水分含量的检测进行了研究。武中巨等采用近红外光谱技术和偏最小二乘对褐煤品质进行了快速检测,结果表明水分检测误差较大[2]。Dong W K等从近红外光谱中提取了5个波长点用于实现煤品质的快速检测,检测误差在10% 左右[3]。Wang Y等将小波变换方法用于提高近红外光谱在煤品质检测中的应用并低降建模难度[4,5,6]。

本文针对烟煤中水分含量的近红外快速检测,采用常用的主成分分析和偏最小二乘回归建立检测模型。

1 实验

采集曲靖富源地区烟煤样品100个,将煤样粉碎研磨到0. 180 mm( 80目) 。采用热重分析检测煤样中水分含量[7]。精确称量空气干燥煤样1. 0±0. 1 g( 精确至0. 000 2g) ,将煤样平铺于干燥恒重的Φ40 mm称量瓶。打开称量瓶盖,放入预先鼓风并已加热至105 ~ 110℃的干燥箱中,在一直鼓风的条件下干燥40 min。从干燥箱中取出称量瓶,立即盖上盖,放入干燥器中冷却至室温( 约20 min) 后,称量。再进行检查性干燥,每次30min,直到连续两次干燥煤样的质量减少不超过0. 001 g或质量增加时为止。

采用Thermo AntarisⅡ光谱仪采集烟煤的近红外光谱数据,光谱范围4 000 ~ 12 000 cm- 1,分辨率8 cm- 1,扫描次数8。

2 算法

2. 1 偏最小二乘

偏最小二乘( partial least squares,PLS)[8]是一种基于因子分析的多变量校正方法,利用自变量矩阵中提取出的隐变量来建立模型,可以充分利用因变量矩阵和自变量矩阵的信息。PLS比多元线性回归、主成分回归等线性模型更稳定。

偏最小二乘法的基本数学模型为:

式中n为样本数,r为自变量数,m为因变量数,s为隐变量数。E和F分别为关于X和Y的线性模型的残差矩阵。

当E的元素服从正态分布时,根据最大熵原理,最大熵Hmax的大小取决于方差σ2:

此处eij为残差,( r - s) 为自由度。当σ2最小时,建立的数学模型具有最佳的预测效果。

PLS中的隐变量个数是十分重要的,只有确定出恰当的隐变量数,才能消除噪声、避免过度拟合、获得良好预测效果。PLS一般采用交互验证( Cross - validation) 的预测误差平方和( predictederror sum of squares,PRESS ) 确定隐变量数,当PRESS最小时,该隐变量数最佳。

2. 2 主成分分析

主成分分析 ( principal component analysis,PCA) 是一种统计分析方法,可以进行数据降维、变量提取、数据压缩、分类、聚类等处理[9]。主成分分析将数据进行特征分解,构造新变量( 称为主成分) 并保证各变量之间正交。方差越大的主成分含原变量信息量越大。提取较少几个主成分就可以包含原数据的信息,将高维数据降到低维。

3 结果与讨论

首先采用PCA将含有1557个变量的高维近红外光谱数据映射到低维空间,再根据低维特征变量建立PLS模型。为了检验建模效率,将100个样本分为校正集和预测集,其中校正集包含85个样本,预测集包含15个样本。

3. 1 PLS 隐变量数

PLS先提取数据的特征信息 ( 隐变量) 再建立预测模型,因此提取出的特征数目( 隐变量数)会直接影响模型的性能。考察了1 ~ 15个隐变量数下模型的预测性能,结果见表1。从表1中可见,随着PLS隐变量数的增加,预测误差先减小后增大。当隐变量数为3时,预测最准确,平均预测绝对百分误差为0. 0828。

3. 2 PCA 主成分数

PCA提取出的主成分包含样本有用信息并能剔除一部分无用信息,主成分个数直接决定数据压缩及滤噪效果。本文将PLS主分量数固定为3,考察了PCA主成分数3 ~ 30对建模的影响,见图1。

图1表明,随着主成分数的增加,平均预测绝对误差和平均预测绝对百分误差呈现相同的变化趋势,随着波动先下降后上升。当主成分数为16时获得最 低平均预 测绝对百 分误差,0. 0728。

3. 3 PCA - PLS 预测结果

为了进一步考察模型的预测性能,表2列出了真实结果、预测结果和预测百分误差。结果表明有5个样本预测偏差较大,超过了0. 1,其余10个样本预测效果较好。总而言之,可以通过PCA- PLS方法结合 近红外技 术实现烟 煤中水分检测。

4 结论

本文收集了100个烟煤样品,针对烟煤水分检测探讨了近红外光谱法快速检测的可行性。采用主成分分析和偏最小二乘分析近红外光谱,主成分分析用来对近红外光谱压缩、滤噪,偏最小二乘用来建立检测模型。通过对模型参数的考察和优化,最佳平均预测绝对百分误差为0. 0728。结果表明近红外光谱技术可以用于烟煤水分快速检测。

偏最小二乘回归分析 篇2

顾客满意度作为顾客满意的量化统计指标,描述了顾客对产品的认知(期望值)和感知(实际感受值)之间的差异,可以测量顾客满意的程度。当顾客的认知小于感知时,顾客的满意度就高;反之,当认知大于感知时,满意度就低。

美国的顾客满意度指数(A C SI, A m erican C ustom er Satisfaction Index)模型(如图1所示),已成为影响最为广泛的模型。

本文借鉴了国内外对于顾客满意度的研究成果和实践经验,结合我国4S店销售中的实际特点以及实际的可操作性,运用偏最小二乘法(PLS)对4S店销售中的客户满意度模型进行处理。

二、汽车4S店客户满意度数据处理及分析

本文选用2010年第四季度东风悦达起亚汽车用户满意度调研数据,用单因变量的偏最小二乘回归计算其顾客满意度二级指标数值。其中三级指标17个,如表1所示。通过软件PEW中单因变量的偏最小二乘回归计算顾客满意度,如图2所示。

1、自变量之间的相关关系

自变量之间的相关系数r的绝对值在0.5到0.8之间,说明两个变量是显著性相关,自变量之间的相关系数r的绝对值在0.8到1之间,说明两个变量是高度线性相关。经过计算,我们可以看到大部分变量间相关系数值在0.8到1之间,说明是高度线性相关。变量之间存在高度线性相关,采用偏最小二乘回归将显示出其优越性。

2、提取的主成分对变量的解释能力

在偏最小二乘回归计算过程中,所提取的自变量成分t1,一方面尽可能多地代表X中的变异信息,另一方面又尽可能与Y相关联,解释Y中的信息。主成分t1对自变量X和因变量Y的解释能力分别为:86.10%,99.74%。如表2。

3、自变量与因变量的相关关系

判断自变量集合X与因变量集合Y之间是否存在较强的相关关系是检验是否可以建立Y对X的线性回归的基本条件,如果在图3中明显观察到t1与u1之间存在线性关系,则说明X与Y有显著的相关关系,这时采用偏最小二乘回归方法建立Y对X的线性模型才会是比较合理的。自变量与因变量相关系数R 2为0.9974,自变量与因变量存在高度线性相关关系。t1与u1相关关系见表3、图3。

4、自变量在解释因变量时的作用

变量投影重要性指标V IPj值,用来测度每一个自变量在系统分析中的作用,即xj在解释Y时作用的重要性。

根据用变量投影重要性指标V IPj来测度的每一个自变量对解释因变量的作用大小依次为:x52>x43>x23>x13>x11>x41>x32>x22>x51>x21>x53>x42>x33>x34>x31>x12(如表4、图4)。根据V IPj>1即认为xj在解释因变量时具有重要作用的原则,x52、x43、x23、x13、x11、x41、x32、x22、x51在解释y具有重要作用。其中x52在解释y具有最重要的作用,x43、x23、x13在解释y也具有重要作用。

5、组间相关关系的结构分析

在r(, t1)/r(, t2)关系图上(如图5),如果xj与y两变量的位置十分接近,则认为它们的相关关系相当密切。另一方面,团聚在一起的自变量xj之间,也存在着较强的相关关系,相隔很远的自变量xj之间,由于相关系数较低,可认为是互不影响的独立变量。

6、特异点的发现及处理

如果有数据出现在椭圆图之外,一般就是特异值,我们要进行剔除。从图6中我们发现,所有数据都在椭圆图之内,所以样本数据存在着0个特异点。

7、偏最小二乘回归原始数据数学模型

偏最小二乘法的回归模型为:y=-0.5868+0.0487x11+0.0755x12+0.0771x13+0.0729x21+0.0863x22+0.0536x23+0.0703x31+0.0673x32+0.0789x33+0.0466x34+0.0758x41+0.0478x42+0.0694x43+0.0658x51+0.0601x52+0.0626x53

通过模型我们发现除了截距为负值之外,其他变量的系数都为正数,说明自变量对因变量都是正相关的。提高任何一项服务都能提高顾客的满意度。

其中0.0863(服务顾问的响应程度)>0.0789(经销商设施的干净程度)>0.0771(交接流程的及时性)>0.0755(顾客日程的灵活性)>0.0729(服务顾问的礼貌/友善)>0.0703(进出经销商的便利性)。所以我们要提高客户的满意度,这要从这几个指标重点入手。

8、偏最小二乘与普通最小二乘去一回归预测比较

回归预测比较是指将原始样本数据逐一删除样本点i,其余数据经偏最小二乘与普通最小二乘回归后再用二模型计算的yi的预测值,并与原始数据的y值进行比较(如表5)。

偏最小二乘法预测绝对误差(|偏最小二乘预测值yi-观测值yi|)平均值=0.0314<普通最小二乘法预测绝对误差(|普通最小二乘法预测值yi-观测值yi|)平均值=527.9403

偏最小二乘法预测相对误差((|偏最小二乘法预测值yi-观测值yi|)/观测值yi%)平均值=0.0036<普通最小二乘法预测相对误差((|普通最小二乘法预测值yi-观测值yi|)/观测值yi%)平均值=56.8284

偏最小二乘法预测残差平方和=0.0114<普通最小二乘法预测残差平方和=7589114.1819

回归预测结果表明,偏最小二乘回归在对新出现数据的预测方面表现出比普通最小二乘回归更精确的性能,也说明偏最小二乘回归分析更接近事物的真实,更加稳健。

三、提高4S店销售客户满意度建议和措施

根据0.0863(服务顾问的响应程度)>0.0789(经销商设施的干净程度)>0.0771(交接流程的及时性)>0.0755(顾客日程的灵活性)>0.0729(服务顾问的礼貌/友善)>0.0703(进出经销商的便利性),我们要提高客户的满意度,首先要提高服务顾问中的服务顾问的响应程度,然后要提高经销商设施中的经销商设施的干净程度、服务启动中的交接流程的及时性、顾客日程的灵活性、服务顾问中的服务顾问的礼貌/友善、经销商设施中进出经销商的便利性这几个指标。

摘要:客户满意度 (CSI) 始终是汽车销售企业最为关注的管理指标之一。采用偏最小二乘法回归分析的方法, 可以就目前顾客满意度多项指标建立数学分析模型, 从而建立良好的顾客满意度指数测评体系。通过该测评体系, 汽车4S店可以回归分析和计算相关因数, 得到顾客满意度相关指标的提升建议, 进而优化和改进相关服务。

关键词:客户满意度,偏最小二乘法,回归分析

参考文献

[1]王俊喜、马骊歌:关于汽车企业提高客户满意度的对策分析[J].汽车工业研究, 2010 (10) .

[2]陈高波:基于核偏最小二乘回归的顾客满意度指数模型[J].科教文汇 (下旬刊) , 2010 (11) .

[3]郭辉、刘贺平:基于核的偏最小二乘特征提取的最小二乘支持向量机回归方法[J].信息与控制, 2005 (4) .

偏最小二乘回归分析 篇3

在轻型舰载鱼雷发射的过程控制和参数分析中, 动力学模型往往比较复杂, 如何利用有限的实验数据, 进行鱼雷发射过程中一些主要参数的分析及快速预报是十分有意义的。在潜艇鱼雷发射装置管内运动参数设计中, 首先要弄清鱼雷管峰压的影响因素及其函数关系。文献[1]利用基于最小二乘法的回归分析方法, 建立了发射管内峰压Pm的一元线性回归方程, 并进行了显著性检验。

偏最小二乘回归是一种新的多元数据分析方法, 集多元线性回归、典型相关分析和主成分分析的基本功能为一体, 将建模预测类型的数据分析方法与非模型式的数据认识方法有机地结合起来, 使得模型精度、稳健性、实用性得到提高[2,3,4], 已广泛应用于各领域的研究中[5,6,7,8,9,10]。本文应用偏最小二乘回归方法, 进一步探索鱼雷水面发射时影响鱼雷管峰压Pm的主要因素, 建立回归方程并进行误差分析。

1偏最小二乘回归模型

1.1建模原理

设有p自变量X={x1, x2, …, xp}和q个因变量Y={y1, y2, …, yp}, 观测n个样本点, 分别在X与Y中提取出成分t1和u1 (即t1是x1, ..., xp的线性组合, u1是y1, ..., yq的线性组合) , 要求t1和u1应尽可能大地携带他们各自数据表中的变异信息, 同时t1与u1的相关程度能够达到最大使得t1和u1应尽可能好的代表数据表X和Y, 同时自变量的成分t1对因变量的成分u1又有最强的解释能力。

在第一个成分t1和u1被提取后, 分别实施X对t1的回归以及Y对u1的回归。如果回归方程已经达到满意的精度, 则算法终止;否则, 将利用X被t1解释后的残余信息以及Y被t1解释后的残余信息进行第二轮的成分提取。如此往复, 直到能达到一个较满意的精度为止。若最终对X共提取了m个成分t1, …, tm, 偏最小二乘回归将通过实施yk对t1, …, tm的回归, 然后再表达成yk关于原变量x, …, x的回归方程 (k=1, 2, …, q) 。

1.2交叉有效性检验

将所有n个样本点分成两部分:第一部分除去某个样本点i的所有样本点集合 (共含n-1个样本点) , 用这部分样本点并使用h个成分拟合一个回归方程;第二部分是把刚才被排除的样本点i代入前面拟合的回归方程, 得到yj在样本点i上的拟合值y hj (-i) 。对于每一个i=1, 2, …, n, 重复上述测试, 定义Y的预测误差平方和为PRESSh, 有PRESSh=, 显然, 如果回归方程的稳健性不好, 误差就很大, 它对样本点的变动就会十分敏感, 这种扰动误差的作用, 就会加大PRESSh的值。

1.3精度分析

在偏最小二乘回归计算过程中, 所提取的自变量成分th一方面可以尽可能多地代表X的变异信息, 另一方面又尽可能与Y相关联, 解释Y中的信息, 用r (xi, xj) 表示两个变量之间的相关关系, 定义t1, t2, …, th对各变量的解释能力。

对自变量X的累计解释能力:

对自变量X的累计解释能力:

对自变量Y的累计解释能力:

定义为变量投影重要性指标用来描述自变量对因变量的解释能力, 其中whj表示轴wh的第j个分量, VIPj的意义:由于xj对Y的解释是通过th来传递的, 如果th对Y的解释能力很强, 而xj在构造th时, 又起到了非常重要的作用, 则可以认为xj对Y具有相当大的解释能力。

2鱼雷管峰压预测

2.1建立模型

发射鱼雷时, 鱼雷从静止开始, 可以通过不同的运动规律, 进行舰艇鱼雷发射装置管内运动参数的设计。分别记发射气瓶的容积记为x1, 发射气瓶的初始压力为x2, 发射阀喉部的通径为x3, 文献[1]分析了内弹道试验实测数据表1。

建立了鱼雷管峰压的线性回归模型为

Pm=-0.078 3x1+0.035x2+0.048 9x3。

本文利用偏最小二乘法建立模型。首先进行交叉有效性检验, 可得PRESSh=[0.5136 0.21330.2062]', 当h=3时, PRESSh达到最小, 模型的预测能力最好, 因此取3个主成分t1, t2, t3建立模型, 得到鱼雷管峰压的偏最小二乘回归标准化变量模型:

Pm=0.153 7x1+0.795 9x2+0.367 6x3 (1)

转化为原始变量回归方程为:

Pm=-6.610 6+0.124 9x1+0.031 8x2+0.175 9x3 (2)

2.2模型评价

2.2.1累计解释能力分析

计算t1, t2, t3的累计解释能力数值见表2。可以看出, 当取3个主成分时, t1, t2, t3对x1、x2和x3的累计解释能力达到100%, 对全部自变量x的累计解释能力达到100%, 对因变量y的累计解释能力均超过98%, 均达到了很高的解释水平, 说明用偏最小二乘法拟合出的回归模型能概括原始数据所携带大部分的信息。

2.2.2变量投影重要性指标

经计算, 得变量投影重要性指标VIP=[0.1834 1.463 1 0.908 8]', 对鱼雷管峰压的影响程度依次为发射气瓶的初始压力、发射阀喉部的通径和发射气瓶的容积。

2.2.3相关关系分析

图1给出了三个主成分与u1的平面图。从图中可以看出, t1与u1存在明显的线性关系, 说明发射气瓶的容积、发射气瓶的初始压力、发射阀喉部的通径与鱼雷管峰压有显著的相关关系, 采用偏最小二乘回归方法建立的线性模型 (1) 、 (2) 是合理的, t2、t3与u1也存在着一定的线性关系, 但已经很弱了。

2.2.4 鱼雷管峰压拟合结果

鱼雷管峰压的实测值与拟合值的对比情况如表3所示。从中可以看出, 偏最小二乘回归拟合值好于文献[1]的回归值, 相对误差较小, 表明偏最小二乘回归模型能较好的反映鱼雷管峰压与气瓶压力、发射阀通径、气瓶容积的关系, 预测效果较好。

鱼雷管峰压实测值与拟合值对比图如图2所示。可以看出, 所有的样本点均排列在图中对角线的附近, 模型的拟合效果很好。

3 结论

本文采用偏最小二乘回归方法, 经交叉有效性检验, 建立了鱼雷管峰压与气瓶容积、气瓶压力和发射阀通径的关系模型。通过检验, 该模型对自变量和因变量的解释能力较高, 通过与实测值的对比, 该模型拟合精度较高, 具有较好的预测能力。

摘要:采用偏最小二乘回归方法, 经交叉有效性检验建立了鱼雷管峰压的回归方程。通过实验数据比较, 该模型拟合精度较强, 说明偏最小二乘回归是估算舰艇鱼雷发射内弹道特征参数的一种有效方法。

关键词:鱼雷管峰压,偏最小二乘,预测,误差

参考文献

[1] 李志华, 申志伟. 鱼雷内弹道特征参数估计的回归分析. 舰船电子工程, 2009 (12) :188—191

[2] 乔汝椿. 潜艇鱼雷发射装置内弹道特性初步设计. 水中兵器, 2003; (2) :51—55.

[3] 王惠文. 偏最小二乘回归方法及其应用. 北京:国防工业出版社, 1999

[4] 罗批, 郭继昌, 李锵, 等. 基于偏最小二乘回归建模的探讨. 天津大学学报, 2002;35 (6) :783—786

[5] 贾子英, 陈松辉, 黄华. 基于偏最小二乘的两栖突击车作战效能预测. 舰船电子工程, 2009; (1) :119—121

[6] 巴胜生. 基于偏最小二乘回归的军用飞机效能预测. 自动化技术与应用, 2006;25 (10) :40—42

[7] 钱筱丹, 黎放, 卞金露. 偏最小二乘回归在舰船维修费用预测中的应用. 舰船科学技术, 2007;29 (4) :98—100

[8] 任震, 张静伟, 张晋听. 基于偏最小二乘法的设备故障率计算. 电网技术, 2005;29 (5) :12—16

[9] 王文圣, 丁晶, 赵玉龙, 等. 基于偏最小一乘回归的年用电量预测研究. 中国电机工程学报, 2003;23 (10) :17—21

偏最小二乘回归分析 篇4

一项调研表明,在英国,客户使用一年内退货的手机产品中有63%的是因为产品的功能可用性与客户预期需求的不匹配造成的,可见,客户对产品功能的可用性是有不同需求偏好的[6]。在进行产品功能设计时,应充分考虑细分市场客户需求偏好,要针对性改进某些产品功能可用性,才能更好的提升产品的客户满意度。为了挖掘细分市场客户的产品功能可用性偏好,对产品功能可用性进行评价,进而提出产品功能改进建议,本文首次提出了基于偏最小二乘回归的产品功能可用性评价方法,并创新性的用功能可用性评价矩阵进行产品功能可用性评价分析,找出产品中可用性与客户需求不匹配的功能,重点进行可用性改进,达到与客户需求匹配。

1 基于偏最小二乘回归的产品可用性评价

1.1 偏最小二乘回归模型及其算法流程

偏最小二乘回归算法可同时实现回归建模、数据结构简化(主成分分析)及两组变量之间相关性分析(典型相关分析)[7],并使模型精度、稳定性和实用性都得到提高。偏最小二乘回归法的思路是:首先分别从自变量X和因变量Y中提取相互独立的成分th(h=1,2,…)和kh(h=1,2,…)。然后建立这些成分与自变量的回归方程,这些成分既能很好的概括自变量系统中的信息又能很好的解释因变量并排除系统中的噪声干扰,可有效解决自变量间多重相关性。

记C0(C0∈Rn)是因变量Y的标准化变量,D0是自变量集合X的标准化矩阵,对其进行偏最小二乘回归推导:

第一步:首先从C0中抽出一个成分h1,h1=C0k1,‖k1‖=1;从D0中抽取一个成分t1,t1=D0w1,‖w1‖=1。要使得抽取的成分t1对h1有较好的解释作用得:然后,实施D0在t1上的回归以及C0在t1上的回归,即有

其中,p1,r1是回归系数(而r1是标量),

第二步:以D1取代D0,以C1取代C0,重复第一步的方法,可以得到同样,D1,C1对t2的回归,有

第三步,第四步……,均以此类推,最后,可用交叉有效性确定偏最小二乘回归中成分th的提取个数,停止迭代。

最后,有偏最小二乘回归模型为:

x*j的回归系数为

模型用交叉有效性作为回归迭代终止判断依据。考虑到本研究是单因变量的偏最小二乘回归,记yi为原始数据,t1,t2,…,tm是在偏最小二乘过程中提取的成分。是使用全部样本点并取h个成分建模回归后,第i个样本的拟合数值。若为在建模时删除样本点i,取h个成分回归建模后,再用此模型计算ei的拟合值,记为:时,引进新的主成分就会对模型的预测能力有明显的改善作用。

1.2 基于偏最小二乘回归的产品可用性评价

在用户测试、访谈法和问卷法等参与可用性评价方法的基础上,分析产品每个功能的有效性、效率和功能满意度,然后采用偏最小二乘回归构建产品整体满意度和产品功能可用性之间的回归关系,利用偏最小二乘回归的变量间关系分析技术,以重要性分析指标来作为产品功能可用性的评价排序,最后,通过功能可用性评价矩阵对具体产品的可用性进行评价,提出改进建议。

第一步:选取细分市场下的研究产品对象,确定其功能的有效性,效率,功能满意度及产品的整体满意度。利用用户测试法,采用问卷调研来获得用户对这四个指标的分级打分。

有效性评价准则为:任务完成率90%以上,记为有效性很高,打分为10;任务完成率70%—90%,记为有效性高,打分为8;任务完成率50%—70%,记为有效性一般,打分为6;任务完成率30%—50%,记为有效性较低,打分为4;任务完成率30%以下,则记为有效性很低,打分为2。效率的评价准则为:依次评价为很高、高、一般、低和很低,对应的打分为10,8,6,4,2。功能满意度评价准则为:依次评价为很满意、满意、基本满意、不满意和很不满意,对应的打分为10,8,6,4,2。产品的整体满意度评价准则为:根据对产品的满意程度,选择1—100的打分值。

第二步:计算各功能的可用性水平。

可用性水平记为有效性、效率和功能满意度的乘积,即为:

式(1)中,E、E'和S分别表示有效性、效率和功能满意度。U的大小直接体现着功能可用性的高低。

第三步:样本群的E(产品整体满意度)与U(各功能维度的可用性)偏最小二乘回归,并利用其参数重要度测定,确定所选样本产品的功能可用性值的排序评价标准。

以偏最小二乘回归法的辅助分析技术———重要性指标VIP(Variable Importance in Projection)作为功能可用性排序的基础。

其表达式为:

式(3)中,ωji是轴ωj的第i个分量;Rd(E;tj)为变量tj对E的解释能力,即对E的累计解释能力,即而有Rd(el;tj)=r2(el,tj)。

第四步:利用功能可用性评价矩阵,对产品各功能的可用性进行评价分析。

构建产品功能可用性评价矩阵,其中矩阵图的右下区域称为功能待提升区,表示功能在产品中的排序落后于总的产品评价,需要企业重点改进;而中间区域称为功能匹配区,表示产品的可用性值在可容许偏差的范围内,实际可用性和对产品本身需求匹配,可不用改进;左上角区域称为功能突出区,表示产品实际功能可用性优于评价序列,即可用性设计高于客户偏好需求,在改进时可以适当降低功能性能或维持不变。

2 应用实例

为了进行产品功能可用性评价方法的有效性验证,选定智能手机市场产品作为功能可用性评价分析对象,进行第一步、第二步相关的测定和计算后得到表1所示数据。

借助于SIMCA-P软件,经过交叉有效性条件验证,实现对实例数据进行偏最小二乘回归,获得稳定的产品总体满意度和功能可用性之间的回归模型,随后通过偏最小二乘回归的VIP分析技术,获取该类产品的功能可用性排序见图1所示。

针对手机B,采用功能可用性评价矩阵进行分析,功能评价分布见图2。从图中,可以直观的看出偏离功能匹配区越远的右下区域,产品实际可用性与顾客需要偏离大,应该优先对这些功能的可用性进行改进(游戏、拍照、蓝牙和操作系统等4个功能),以满足功能与客户需求的良好匹配,进而提升手机B的整体满意度。

4 结论

为了解决产品可用性与客户对可用性偏好的不匹配问题,进而提升产品的整体用户满意度,本文在常规的可用性测度方法的基础上,提出了基于偏最小二乘回归的产品功能可用性评价分析方法,借助功能可用性评价矩阵得到亟待提升可用性的功能。最后以手机案例进一步演示了该方法,诊断出了现有产品功能中存在的不匹配,得到产品功能可用性改进方向。

摘要:现有的产品功能可用性研究仅为提升具体功能的可用性,忽视了用户对产品功能可用性的偏好问题。为解决该问题,首次提出了基于偏最小二乘回归的产品功能可用性评价方法。在常用可用性分析方法基础上,对细分市场产品整体满意度和功能可用性进行偏最小二乘回归。结合功能可用性评价矩阵分析产品功能改进方向。最后,通过手机实例进行了方法的演示,验证该方法是产品功能可用性分析的有效方法。

关键词:产品功能可用性,偏最小二乘回归,可用性评价矩阵

参考文献

[1] Dumas J S,Redish J C.A practical guide to usability testing.NJ:Albex,Norwood,1994

[2] Nielsen J.可用性工程.刘正捷,译.北京:机械工业出版社,2004:48—144

[3] Han S H,Kim J.A comparison of screening methods:selecting im-portant design variables for modeling product usability.InternationalJournal of Industrial Ergonomics,2003;32(3):189—198

[4]王继成.产品设计过程的可用性研究与应用.东华大学学报:自然科学版,2006;32(5):32—35

[5]刘胧,刘虎沉.运用FMEA的产品可用性评价方法.工业工程,2010;13(3):47—50

[6] Overton D.No fault found returns cost the mobile industry MYM4.5billion per year.WDS Global.http://www.wdsglobal.com/news/whitepapers/20060717/MediaBulletinNFF.pdf,2006

偏最小二乘回归分析 篇5

在多元线性回归模型中,如果解释变量之间存在着密切的线性相关关系,就称它们之间存在着多重共线性. 在出现多重共线性情形时,普通最小二乘估计不再适用; 回归参数的估计值方差会很大,从而影响自变量对因变量的解释;估计的精度会降低; 估计的效果也会变坏. 在实际经济问题的多元回归分析中,多重共线性的现象很多,这时我们就应该寻找另外的回归方法对参数进行估计.

二、方法介绍

如果在实际问题中出现了多重共线性的现象,我们可以选择用有偏回归方法———岭回归( RR) 和偏最小二乘回归( PLS) 来处理. 岭回归是利用岭估计( X'X + k I)- 1X' Y来替代普通最小二乘估计( X'X)- 1X' Y,从而消除了普通最小二乘估计中矩阵X'X无法求逆的问题. 偏最小二乘回归是先在自变量集和因变量集中分别提取第一潜在因子t1与u1,其中t1与u1分别是自变量与因变量的线性组合,要求t1与u1尽可能多地提取所在变量组的变异信息,且t1与u1的相关程度达最大,然后建立因变量与t1的回归方程,若回归方程不能达到满意的精度,则继续提取第二潜在因子,否则停止.

三、实例比较

根据理论及对现实情况的认识,拟建立以我国国民总收入( 单位: 亿元) 为因变量y,以就业人员数( 单位: 万人) 、财政收入( 单位: 亿元) 、能源生产总量 ( 单位: 万吨标准煤) 、国有单位工资总额( 单位: 亿元) 和城镇集体工资总额( 单位: 亿元) 分别为自变量x1,x2,x3,x4,x5的线性回归模型. 由《中国统计年鉴》查得相关数据如下:

在SAS软件上使用REG过程来建立最小二乘回归方程,所有自变量的方差膨胀因子都大于100,诊断出模型中存在非常严重的多重共线性问题. 用最小二乘法所得到的回归方程为y = - 431189 + 6. 13224x1- 0. 18088x2+0. 44051x3+ 5. 69125x4- 13. 63786x5.

可以看到方程中,自变量x2,x5的系数为负,这显然与事实不符,这正是由多重共线性所导致,因此最小二乘回归求出的回归方程不利于模型的解释,下面改用岭回归方法来建模.

用SAS软件中的REG过程,求解岭回归方程. 由岭迹图可以看出,当岭参数k≥0. 02后,岭迹曲线趋于稳定,因此,取k = 0. 02的岭回归估计来建立岭回归方程为

这时,回归系数的符号符合实际意义.

现在用偏最小二乘回归方法来进行处理,用SAS软件中的PLS过程建立偏最小二乘回归方程,用最常用的舍一交叉验证法来抽取偏最小二乘的成分,结果抽取了3个偏最小二乘成分,得到偏最小二乘回归方程为

这时,回归方程中的回归系数的符号也都符合实际意义.

根据前面得出的岭回归方程和偏最小二乘回归方程,计算出衡量模型拟合效果好坏的平均绝对百分误差和复测定系数,得到相应的数值如下:

四、总 结

从上例可以看出,在多元线性回归模型中出现共线性问题时,最小二乘回归方法已经不再适用,而用岭回归和偏最小二乘回归这两种有偏回归方法都可以处理多重共线性问题,且从表2的结果可知,两种方法建立的回归方程拟合的效果都不错,而偏最小二乘回归方法相对岭回归方法要更优.

摘要:文章介绍了处理多元线性回归模型中多重共线性问题的有偏回归方法——岭回归和偏最小二乘回归,并通过实例比较了两种方法建立的回归方程的拟合效果,而偏最小二乘回归方法相对岭回归方法要更优.

偏最小二乘回归分析 篇6

关键词:应力腐蚀敏感性指数,偏最小二乘回归模型,信息挖掘

316L奥氏体不锈钢与碳素钢相比, 具有较高的抗拉强度、较低的屈服点、极好的塑性和韧性, 而且焊接性能和冷弯成型工艺性能也很好, 所以被广泛用于制造各种储槽、塔器、反应釜等压力容器。作为不锈钢, 316L能耐多种介质的均匀腐蚀, 但在某些环境中 (特别是含Cl-介质) 的应力腐蚀开裂现象非常严重, 已成为不锈钢领域中急待解决的工程实际问题。影响316L不锈钢应力腐蚀开裂的介质因素具有特定性, 在酸性环境中主要因素有:Cl-浓度、H2S浓度、温度和p H值等。对其影响因素的关系, 已进行了广泛研究, 取得了许多研究成果[1,2,3,4,5,6]。文献[7]采用慢应变速率拉伸腐蚀试验方法, 研究Cl-浓度、H2S浓度、温度和p H值等参数单独和交互作用对316L钢应力腐蚀敏感性的影响, 并进一步对应力腐蚀敏感性指数进行统计回归分析。

偏最小二乘回归于1983年由S。Wold和C。Albano等人首次提出, 它集多元线性回归、典型相关分析和主成分分析的基本功能为一体, 将建模预测类型的数据分析方法与非模型式的数据认识方法有机地结合起来, 因此, 偏最小二乘回归较传统的回归分析、主成分分析具有更大优势, 能较好地处理基于传统最小二乘回归方法难以解决的问题, 在处理样本容量小、自变量多、变量间存在严重多重相关性问题方面具有独特的优势, 已广泛应用于诸多领域, 取得了良好的效果[8,9,10,11,12]。本文充分考虑影响316L不锈钢应力腐蚀敏感性指数的相关因素, 利用偏最小二乘回归方法建立模型, 挖掘影响因素中的信息。

一、偏最小二乘回归模型

在第一个成分t1和u1被提取后, 分别实施X对t1的回归以及Y对u1的回归。如果回归方程已经达到满意的精度, 则算法终止;否则, 将利用X被t1被解释后的残余信息以及Y被t1解释后的残余信息进行第二轮的成分提取。如此往复, 直到能达到一个较满意的精度为止。若最终对X共提取了m个成分, 偏最小二乘回归将通过实施yk对的回归, 然后再表达成yk关于原变量的回归方程 () 。

回归方程为

FAk是残差距阵FA的第k列。

二、应力腐蚀敏感性指数偏最小二乘回归分析

为了研究316L不锈钢应力腐蚀敏感性指数的影响因素, 记H2S的浓度为x1、Cl-浓度为x2、温度为x3, PH值为x4作为自变量x1 (i=1, 2, …, 8) F (A) 以应力-应变曲线下面积表示的应力腐蚀敏感性指数作为因变量y。

经交叉有效性检验, 计算得到, 因此取成分t1, t2, 模型的预测能力最好, 得到应力腐蚀敏感性指数偏最小二乘回归方程为:

图1给出了t1、t2与u1的平面图。从图1中可以看出, t1与u1存在明显的线性关系, t2与u1也存在着一定的线性关系, 但相对较弱。

为了验证模型的预测效果, 偏最小二乘回归模型验证应力腐蚀敏感性指数, 拟合结果如表2及图2所示。

从表及图中可以看出, 偏最小二乘回归模型预测较好的反映了应力腐蚀敏感性指数与影响因素的关系。

三、结论

本文应用偏最小二乘回归方法, 综合考虑影响应力腐蚀敏感性指数的各种因素, 建立了应力腐蚀敏感性指数预测的模型, 通过计算, 预测结果较好, 应用偏最小二乘回归方法, 对于探索316L不锈钢的应力腐蚀敏感性指数, 挖掘影响因素之间的信息具有重要意义。

参考文献

[1]OBERNDORFER M, KAESTENBAUER M, THAYERK.Application limit s of stainless steel s in the petroleum industry[C].USA:Soc Pet Eng (SPE) , 1999:395-403.

[2]HIBNER EDWARD L, FENDE D S.Conquer chlorides andalloy costs[J].Chemical Engineering Progress, 1999, 95 (4) :63-68.

[3]KANE R D, JOIA CJBM, SMALL ALLT, etal.Rapidscreening of stainless steels for environmental cracking[J].MaterialsPerformance, 1997, 36 (9) :71-74.

[4]BARKER JC, YU J, BROOK R, etal.Some environmental aspects of sulphide stress corrosion cracking stainless steels[C].USA:Int Soc ofOff shore and Polar Engineerns (ISOPE) , 1993:273-278.

[5]CHEN SH, YEH RT, CHENG TP, etal.Hydrogen sulphide stresscorrosion cracking of TIG and laser welded 304 stainless steel[J].CorrosionScience, 1994, 36 (12) :2029-2041.

[6]FANG Deming, LU Zhiming, GAO Zengliang.Stress corrosioncrack study of 316L stainless steel in H2S and Cl-aqueous solution[C].Spain:Spanish Council for Scientific Research, 2002:166.

[7]卢志明, 何正炎, 高增梁.316L不锈钢应力腐蚀敏感性指数计算与回归分析[J].浙江工业大学学报, 2007, 35 (2) :198-200.

[8]王惠文, 付凌晖.PLS路径模型在建立综合评价指数中的应用[J].系统工程理论与实践, 2004, 10:80-85.

[9]J.P.Gauchi.P.Chagnon, Comparison of selection methods ofexplanatory variable in PLS regression with application to manufacturingprocess data[J], Chemometrics and intelligent laboratory systems, 2001, 58:171-193.

[10]张伏生, 汪鸿, 韩悌, 等.基于偏最小二乘回归分析的短期负荷预测[J].电网技术, 2003, 27 (3) :36-40.

[11]李寿安, 张恒喜, 李东霞, 等.基于偏最小二乘回归的军用飞机采购价格预测[J].海军工程大学学报, 2005, 17 (4) :64-68.

偏最小二乘回归分析 篇7

谐波责任不明确是当前谐波管理问题的主要原因,如何定量评估谐波污染责任对治理和改善电网电能质量具有重要意义。目前,国内外研究谐波污染责任划分的文献一般通过求解系统等值谐波阻抗为出发点的。谐波阻抗求解主要是“干预式”和“非干预式”这两大类,“干预式”法主要包括注入法、开关法和负荷投切法等。“干预式”法是指在电力系统正常运行情况下注入间谐波电流或者某次谐波电流,然后通过测量相关的变化量得到谐波阻抗,该方法对系统的正常运行会有一定的影响。“非干预式”这类方法主要有波动量法、Wilsun Xu回归法、稳健回归法、二元线性回归法等。这些方法主要是是通过系统和谐波源负荷本身的扰动特性,通过可测量参数进行相关计算,不影响电力系统的安全稳定运行。

1 DEA 理论

数据包络 分析方法(DEA,DateEnvelopment Analysis)是由Charnes等在1978年提出的,主要是通过保持决策单元的输入值或者输入值不变,然后对效果进行评价。DEA方法由于其良好的评价性得到了广泛应用,但在回归方面相应的研究还是比较少的。下面就具体介绍DEA的模型。

在上述条 件变换下,可以得到,那么分式规划等价于线性规划,并且它们的最优值相等 :

2 DEA 优化的偏最小二乘回归建模

但是这两个约束条件的数学含义是不一样的,所以得到的成分是不一样的。理想情况下由于都比较大,所以最大或者较大。但是在一般的情况下,虽然的值比较小 , 但是由于的值很大从而使得很大,在这种情况下那么所选择的成分会出现一定的偏差,不能直接使用偏最小二乘回归,会影响回归结果的。主要是因为自变量中含有与因变量无相关的信息,这些不相关信息会破坏提出的成分 , 使得被提取的成分成具有大方差但是却是小相关系数,所以选取的成分虽然有着较大的协方差,但是对因变量却缺少解释能力 , 最后导致回归结果不够精确。

3 结束语

为了解决这个问题,最好在回归之前消除自变量含有的不相关信息,就是在进行偏最小二乘回归之前,对数据进行预处理,得到自变量矩阵中不存在大量包含无关信息的新的矩阵数据,从而提高了偏最小二乘回归的结果的精度。

摘要:在分析了偏最小二乘计算回归的方法原理基础上,提出了偏最小二乘计算回归的改进算法,即采用数据包络分析法(DEA)对数据进行分析处理,除去少数不相关信息数据,从而使得回归结果精度更高。

上一篇:饲料搅拌下一篇:新课改下语文阅读教学