成分数据模型

2024-07-28

成分数据模型(共7篇)

成分数据模型 篇1

引言

近年来随着中国经济的快速发展, 城市化的步伐也随之加快, 2012年国家统计局发布的《2011年国民经济和社会发展统计公报》中显示, 截至2011年, 中国城镇人口首次超过农村人口, 城市化率已达51.3%, 随着中国城市化比率的不断提高与城市规模的不断扩大, 城市用地的空间扩展日益成为土地利用空间演变的主要特征。长春市是中国著名的工业城市, 是东北老工业基地的重要组成部分, 随着东北振兴“十二五”规划的逐步落实, 长春市又迎来了新一轮的发展机遇。随着未来长春市经济发展水平的不断提高, 城市土地利用扩张的步伐也将进一步加快, 因此, 研究长春城市空间扩张历史并对其驱动因素进行分析对指导城市规划、优化城市空间布局具有重要的借鉴意义。

本文利用GIS技术, 集成改革开放以后长春市不同时期、多尺度、多来源的城市地图信息绘制长春市土地利用空间演变示意图, 结合空间分析模型考察长春市土地利用空间扩张的幅度与形态等特征, 并利用主成分分析法分析长春市城市扩张的内在驱动因素, 为长春市今后制定城市发展战略提供参考。

一、研究区概况、数据选择及处理

(一) 研究区概况

长春位于中国东北中部, 为吉林省省会, 是全国十五个副省级城市之一, 市内共辖六区。城市中心地处东经125°19′北纬43°43′, 属于温带大陆性季风气候, 受其纬度影响, 冬季气温较低, 夏季日照时间较长。长春市位于松辽平原的腹地, 地势以台地、平原为主, 地形平坦, 交通方便, 为长春市经济的发展提供了良好的地理条件。长春素有“汽车城”美誉, 坐落在长春的中国第一汽车集团公司是中国最大的汽车工业科研生产基地, 目前长春已形成了交通运输设备制造业为主的工业体系。截至2011年, 长春市人口868.72万, 全市生产总值4 003亿元。

(二) 数据选择及处理

收集整理长春市改革开放后不同时期的城市规划图、城市现状图、历史地图等城市空间数据, 主要选择1983年、1995年、2005年共三个时期的长春城市市区地图, 并利用arc GIS软件对地图数据进行定位及配准, 绘制长春市土地利用空间演变示意图。在1990—2010年的长春市统计年鉴中查找能反映长春市经济和社会发展水平的统计数据, 包括各时期的社会经济、人口、生活水平和工业发展等指标, 并选择历年长春市城市建成区面积作为反映城市空间扩张方面的主要指标。

二、土地利用空间扩张的模型分析

(一) 空间分析模型

1. 土地利用空间扩张速度模型。

其表达式为:, 其中Vi表示了在整个时期内城市土地面积的扩展速度Ub, Ua表示不同时期的城市土地面积, T表示研究的时间跨度。

2. 土地利用动态度模型。

其表达式为:其中K表示了在整个时期内城市土地面积平均变化速率, Ub, Ua表示不同时期的城市土地面积, T表示研究的时间长度, 如果以年为单位, 则K表示城市土地面积的年均变化速率。

(二) 模型分析结果

1. 土地利用空间扩张总量。

由表1和图1来看, 1990—2010年二十年间长春市建成区面积总体上呈不断上升态势, 1990年长春市建成区面积仅为114km2, 截至2010年长春市市区面积达395 km2, 二十年增长近3.46倍, 建成区面积扩张达281 km2, 从相对前期扩张面积上看, 1990—1995年建成区面积扩张最小, 仅为10 km2, 2005—2010年五年间城市建成区面积扩张最大, 达164km2。

2. 土地利用空间扩张速度。

从表1上看, 长春市建成区面积扩张速度在各个时期也不尽相同, 1990—2000年这十年间, 长春市建成区面积平均年扩张速度一直维持在年均10km2以下。2000年后, 长春市建成区面积扩张速度明显加快, 其中2005—2010年这五年间建成区扩张速度最为迅猛, 达到了年均32.8km2。

3. 土地利用动态度。

1990—2010年这二十年间长春市土地利用动态度一直保持加强态势, 其中2005—2010年强度最大, 平均每年14.2%, 1990—1995年强度最小, 仅为每年1.7%, 逐渐加强的土地利用动态度表明了长春市土地利用的强度持续加大。

4. 土地利用空间形态特征。

图2可以较为清楚地体现长春市近二十年时间的土地利用空间扩张情况。

从总体上看, 在20世纪90年代初期, 长春市城区土地利用空间扩张主要以圈层结构为主, 古典的“同心圆”理论在这一时期的长春城市空间扩张中得到了较为明显的体现。随着长春市的快速发展, 原有的城市发展空间不足, 从而导致了中心城区用地功能开始向外蔓延, 城市空间规模进一步扩大。

2000年以后, 长春市城市空间又得到了新一轮的扩张, 城市在西南、东南方向有较大的扩张, 这一时期的城市空间主要沿交通线向外蔓延, 逐渐将原有长春近郊城镇纳入到长春城市空间体系中来。这一时期的长春城市空间扩张以开发区建设为主要形式, 通过对长春市四大开发区 (长春经济技术开发区、高新技术开发区、汽车产业开发区、净月潭开发区) 的集中建设, 长春市城市空间结构逐渐向“多中心”形态发展。

2006年长春市政府正式迁往南部新城区, 也从相当程度上加速了长春市土地利用空间上向南部扩张的步伐。

三、长春市土地利用空间扩张驱动力研究

(一) 指标选取

采用主成分分析法进一步对长春市土地利用空间扩张的驱动因素进行分析, 在长春市统计年鉴中从经济发展水平、工业、商业等方面选取与长春市土地利用空间扩张密切相关的八个统计指标, 即长春市国民生产总值、工业总产值、第一产业产值占GDP比重、第二产业产值占GDP比重、第三产业产值占GDP比重、海关进出口总额、城市居民人均可支配收入、长春市城市人口。

(二) 主成分分析

对数据进行主成分分析, 采用方差最大法进行正交旋转, 9次正交旋转后选出特征值大于1的2个主成分, 命名为主成分F1和F2 (如表2所示) 。

主成分F1和F2累计解释的方差占总方差的95.05%, 即保留了原有指标95.05%的信息。旋转后的因子载荷矩阵 (如表3所示) 。

对与第一主成分F1, 其在国民生产总值、工业总产值、海关进出口总额、人均可支配收入、城市人口这五个指标上具有较高的负载, 故将F1命名为社会和经济发展因子。

对于第二主成分F2, 正负载较大的是第二产业产值占GDP比重。第三产业产值占GDP比重与第二主成分F2呈现出显著的负相关。因此第二主成分F2与第二、第三产业产值占GDP比重密切相关, 故将F2命名为产业结构调整因子。

(三) 主成分分析结果解释

1. 社会经济发展是土地利用空间扩张的直接动力。

根据主成分分析结果所示, 社会经济发展因素是长春市土地利用空间扩张的直接动力。改革开放以来, 长春市的经济水平得到了长足的发展, 全市国民生产总值从1990年的105亿元增加到2010年的3 329亿元, 经济的快速发展改变了原有的城市空间格局, 迫使城市通过扩张和重组使其空间格局更符合经济的发展需要, 城市空间格局的改变也给居民生活水平、交通条件、城市公共事业带来了根本性的变革, 又从一定程度上促进了社会经济的发展。

由于经济发展的需要, 长春市先后建立了长春经济技术开发区、高新技术开发区、汽车产业开发区、净月潭开发区共四大开发区, 对开发区的建设不但吸引了大量的资金, 技术和人口, 也带动了基础设施建设和房地产业、商业、服务业的综合发展, 并带动了周边地区的进一步开发。长春市各大开发区的经济发展对近年来长春市土地利用空间扩张起到了重要的推动作用。

2. 产业结构调整是土地利用空间扩张的重要原因。

产业结构调整直接造成了土地利用方式的转变, 从而间接的改变了土地利用的空间形态。改革开放以后, 长春市的第一产业占GDP比重不断下降, 第二、第三产业占GDP比重呈逐年上升态势, 截至2010年长春市第一、第二、第三产业占GDP比重为7.59%∶51.66%∶40.74%。第一产业向第二、第三产业的持续转移使得改革开放初期长春市的工业用地增加较为迅速, 增加的工业用地是土地利用空间扩张的重要原因之一。而近年来, “退二进三”产业结构战略调整的实 (下转267页) (上接248页) 施使长春市内工业向城市边缘扩散, 第三产业进一步向市中心聚集, 从而加强了长春市的综合服务能力。向外扩散的工业也促进了各类产业园区的发展, 使得长春市原有的“紧密团状”城市空间形态向“指状蔓延”发展, 形成了长春市“多中心”城市空间雏形。由此可见, 产业结构调整是土地利用空间扩张的重要原因, 也是土地利用结构转变的直接促进因素。

结论

本文基于GIS技术, 绘制长春市土地利用空间演变示意图, 结合土地利用扩张速度模型和土地利用动态度模型考察长春市土地利用空间扩张的幅度与形态等特征, 研究结果发现, 1990—2010年的二十年间, 长春市土地利用总量上呈现出持续的扩张态势, 2000年以后土地扩张速度明显加快, 土地利用扩张强度显著增强。从空间上看, 在20世纪90年代初期长春市土地利用空间扩张结构以圈层结构为主, 呈组团型向外扩张。2000年以后, 长春市城市空间沿交通线向周边“指状蔓延”发展, 在西南、东南方扩张较为明显, 长春市城市空间结构逐渐向“多中心”形态发展。

通过主成分分析法进一步对长春市土地利用空间扩张的驱动因素进行分析, 结果发现社会经济发展是长春市土地利用空间扩张的直接动力, 开发区的经济发展对近年来长春市土地利用的空间扩张起到了重要的推动作用。产业结构调整是土地利用空间扩张的重要原因, 也是土地利用结构转变的直接促进因素。

参考文献

[1]吕云峰.长春市城市空间结构的历史演变研究[J].长春师范学院学报, 2010, (12) .

[2]孙雁, 刘志强, 王秋兵, 刘洪彬.百年沈阳市土地利用空间扩展及其驱动力分析[J].资源科学, 2011, (11) .

[3]匡文慧, 张树文, 张养贞, 李颖.长春百变城市土地利用空间结构演变特征研究[J].哈尔滨工业大学学报, 2009, (7) .

[4]孙雁, 刘志强, 王秋兵, 刘洪彬.1910—2010年沈阳城市土地利用空间结构演变特征[J].地理科学进展, 2012, (9) .

[5]刘艳君, 李诚固, 徐一伟.城市产业结构升级与空间结构形态演变研究——以长春为例[J].人文地理, 2007, (4) .

[6]蔡安宁, 刘洋, 梁进社, 张伟.郑州城市空间结构演变与重组研究[J].城市发展研究, 2012, (6) .

[7]张新月, 张树文, 李颖, 匡文慧.近30年哈尔滨城市土地利用空间扩张及其驱动力分析[J].资源科学, 2007, (5) .

成分数据模型 篇2

关键词:原型表征,物体识别,二维高斯,成分理论,拟合

0 引言

目前计算机视觉研究领域对物体的表征主要集中于基于轮廓的形状表征,并提出了各种描述子[1,2],例如全局描述子、局部描述子、多尺度描述子和多方面描述子。全局描述子缺少细节描述,区分力较差,而局部描述子虽然能对形状进行细致刻画,但是对噪声非常敏感[3]。为了解决这一问题,出现了多尺度描述子,例如多尺度分形维数算法[4]和轮廓点控制尺度的算法[5]。另外还有形状上下文为代表的多方面描述子[6]以及基于特征统计的同心离散圆簇描述法[7]。成分识别理论(Recognition-By-Components theory)是Biederman在20世纪80年代提出的一种模式识别的理论[8]。Biederman抽象出的几何基元也许并不能全面涵盖人类所能识别的所有场景,但这并不妨害成分识别理论所提出的模型的表达能力。在识别时,这些几何基元是关键的特征,通过边缘检测,分离不依赖观察角度的特征、几何基元及其关系的激活、物体模式的激活和物体确认几个步骤,识别出主要的几何基元,相应的模式也就被识别出来。事实上,这种方法把千变万化的物体视为高度抽象的、简化的几何造型,通过对其各个部件的知识的组合获得对物体整体的知识。

1 拟合边缘信息的高斯成分模型

1.1 二维混合高斯模型

高斯成分是一种同质化参数形成的向量化表示,它可以给不同的成分以统一形式的表征,以方便计算机的存储和处理。它的二维截面是一个椭圆形,如图1所示,可以用来拟合物体被抽象之后的各种边缘“段”。

针对原型中的每个基本成分,二维图像中的每个坐标可以建立一个概率函数:

其中,指数部分e(x,y)表示为:

式(1)表示的是在X-Y平面上经过了平移和旋转变换后得到的二维高斯模型,用来表示物体中一个单一的成分。其中(x0,y0)分别是高斯成分中心位置坐标,θ表示高斯成分旋转的角度,σx和σy的取值与物体成分本身的形状相关,其取值大小取决于成分在二维横截面上呈现的长度或者宽度的大小。除了形状上形成狭长的椭圆,采用二维高斯成分,可以让这些边缘“段”有一个统一的参数化表征,这表示为由5个维度组成的描述向量(x0,y0,θ,σx,σy)。在此基础上,二维高斯混合模型则是一系列二维高斯模型在总权重值为1的情况下加权求和的产物,也就意味着一系列成分的线性叠加,从而构成多成分组合结构,二维混合高斯模型表示为:

约束条件为:

其中,gk(x,y)是用于描述第k个成分的二维高斯函数,wk是该成分对应的权重。如上所述,在混合模型中,原型中的成分最终用6个参数组成的向量(x0,y0,θ,σx,σy,w)来进行表示,由n个成分组成的混合高斯模型就能用一个n×6维的矩阵来表示。

1.2 成分训练———从样本图像到混合二维高斯模型学习方法

首先对图像中的物体进行边缘检测,成分的拟合将在物体的轮廓图像上进行。由于图像中不同的物体所对应的成分数量也不同,所以可以采用期望最大化(EM)算法对成分参数进行估计。其通用过程可以表达为:

其中,x表示所有参与计算的实例中的观察值,Z是所有的隐变量,θ表示概率模型的所有参数,L(x,Z=z|θ)表示似然概率的对数值。EM算法需要借助随机化手段对参数值进行初始化,然而初始化的值一般并非完全随机,在本文介绍的拟合高斯成分的过程中,成分中心坐标不用被随机化成平面上的任何一点,而是选择一个样本点作为初始化类中心,这样做的好处是能够让收敛更快的完成,以及更好地避免退化。

拟合时,用二值图像表示的物体轮廓可以视为一系列采样点的集合。假设:(xi,yi)表示第i个采样点;ωj(t)是第j个成分的参数组,(t表示迭代运算的次数);pji(t)表示第i个采样点上根据参数组ωj(t)计算出的后验概率,记为:。利用期望—最大化算法的通用描述可推导如下:

设参数元组,则:

其中,xi=xi-x0,yi=yi-y0。每次迭代后参数的最大似然估计为:

在式(6)中,由于ln(2π)是常数,不影响后面的求导过程,为了简化公式表示,在记对数函数时去除该常数项,则:

分别对式(8)中的5个参数求偏导数,并令偏导数为0,得到5个方程组成的方程组:

最终,导出的从第i次到第i+1次的迭代式如下:

一个比边缘信息更好的选择是利用基于生理学模型模拟的神经节细胞非经典感受野的输出图像,这种小尺寸感受野的图像表征方法能够取得更清晰的边界,而且会抑制一些无关的纹理信息[9,10,11]。测试结果如图2所示。

2 拟合实验结果

图3是从网络上随机获得的用于进行样本训练的实验图像,图4是经过高斯成分拟合后选定的标定点,图5展示了利用高斯成分拟合物体边缘的实验效果,将像素点的边缘检测信息转化为可度量的成分拟合,为有效进行图像表征奠定了重要的度量基础。

可以观察到拟合成分的不同形态与表示它的参数向量,尤其是细长条状的成分与较圆的成分之间的区别。参数向量中数字的顺序遵循前面算法描述中所给出的形式,即(成分中心x坐标,成分中心y坐标,倾斜角(弧度制),短轴σ值,长轴σ值,权重)。

此外,在实验中还发现,基于目前已经很成熟的边缘检测算法在进行成分拟合时也会根据边缘检测的成熟度来确定有效的成分数,如图6所示。

3 结束语

目前人工智能和计算机视觉技术在模拟人类视觉进行物体识别时,受制约的因素很大,识别效果也很难与人类视觉系统的识别效果相比,这需要从生理学和认知心理学对人类视觉机制的描述汇总获取灵感,结合成分识别理论和视觉拓扑理论等学说的观点,设计出更符合人类认知原理的、更具有可理解性的原型表征方式。良好的原型表征方式对于图像的后期处理具有重要的意义,对图像的高层语义处理奠定了基础,从而使得计算机“识别”图像变为可能。本文的主要工作就是从二维混合高斯函数出发,结合成分识别理论,用高斯成分来拟合物体的边缘,从而使得物体的表征由单一的像素表示变为可理解的成分表示。从目前的实验效果来看,高斯成分的拟合符合图像的绝大部分特征,是一种理想的图像表征手段。在后续的工作中,要对原型的设计继续改进,以期获得更强大的表达能力,能够处理更丰富的训练样本,让识别变得更加准确和更有效率。

参考文献

[1]周瑜,刘俊涛,白翔.形状匹配方法研究与展望[J].自动化学报,2012,38(6):889-910.

[2]郭树旭,赵静,李雪妍.基于中心-轮廓距离特征统计的形状表示方法[J].电子学报,2015,37(6):1365-1371.

[3]GLAUCO V P,MARCOS A B,CELIA A Z B.Image featuredescriptor based on shape salience points[J].Neurocomputing,2013,120(23):156-163.

[4]TORRES R S,FALC AÃO A X,COSTA L F.A graphbasedapproach for multiscale shape analysis[J].Pattern Recognition,2004,37(6):1163-1174.

[5]ALAJLAN N,KAMEL M S,FREEMAN G H.Geometrybased image retrieval in binary image databases[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,2008,30(6):1003-1013.

[6]BELONGIE S,MALIK J,PUZICHA J.Shape matching and object recognition using shape contexts[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,2002,24(4):509-522.

[7]孙景乐,唐林波,赵保军,等.改进的同心离散圆簇形状描述方法[J].电子学报,2013,35(8):1901-1906.

[8]BIEDERMAN I.Recognition-by-components:a theory of human image understanding[J].Psychological review,1987,94(2):115-117.

[9]Wei Hui,Lang Bo,Zuo Qingsong.Coutour detection model with multi-scale integration based on non-classical receptive field[J].Neurocomputing,2013,94(103):247-262.

[10]Wei Hui,Lang Bo,Zuo Qingsong.An image representation of infrastructure based on non-classical receptive field[J].Soft Computing,2014,18(1):109-123.

成分数据模型 篇3

随着信息的高速流通和科技的普及,各类常

用产品的功能逐渐趋同。同类产品中,不同公司或不同品牌间的产品功能差异越来越小。产品的外观已越来越成为消费者做出购买判断的重要心理指标。

企业在开发新产品过程中,通常会产生多个设计方案,由于资金、成本和时间等因素的客观限制,最终只有一个或少数设计方案能被产品化。大多数企业仅依靠企业家或设计主管的主观经验进行方案选择。这种缺乏科学依据的决策方式,经常会导致最优设计方案漏选。如何科学、准确地选择优秀设计方案进行产业化,是企业良好发展的重要条件。

设计决策中,最核心的问题是设计方案的综合评价。设计评价的方法比较多,各有其侧重点和优势。基于连接图[1,2]和距离图[3]的设计评价方法旨在通过考察设计师在规定时间内完成设计方案的数量和深化程度,强调对设计师思维的内在创新性进行分析评价,对于产品设计方案自身在功能、造型等方面绩效的评价涉及较少。模糊评价和层次分析[4,5,6,7]是现有的设计决策中运用较多的方法,利用模糊评价方法对各个评价指标进行赋值,再通过各指标间的层次关系和专家对各个指标重要性的模糊评价,确定各指标在整个评价体系中所占的模糊权重,从而确定综合评价值。现有的设计决策方法中,除了评价指标值的获取采用专家的主观评价外,每个评价指标在最终评价中所占的权重也是评价者主观决定的。这将导致最终评价结果的客观性不足,而且设计评价中变量太多,无疑会增加分析问题的难度与复杂性。

1 产品外观设计决策

1.1 产品外观设计

产品外观设计是以产品外观为核心目的的创造性活动,需要兼顾顾客、企业、市场、社会等众多因素。它主要关注产品造型、结构、使用方式、人机要素、材料、色彩、制造成本、加工工艺等方面的解决方案。所以,产品外观设计评价涉及的领域和指标具有多样性和交叉性。针对产品外观设计多目标决策[7,8]的复杂性,需要建立合理的产品设计方案评价指标体系。

1.2 主成分分析

从数学角度来看,主成分分析法是一种降维处理技术,常用于经济、管理等学科的综合问题评价研究。主成分法是利用相关系数矩阵分析各变量间的关系,并把原来多个变量化为少数几个综合指标的一种统计分析方法[9]。它通过各主成分的贡献率反映各个主成分综合原始变量信息的百分比,决定各主成分在最终评价值中所占的比重。本文主要利用该方法回避带有主观性的模糊权重赋值,增强决策结果的客观性和有效性。

1.3 设计决策过程

本研究基于产品评价指标的有效遴选,建立的一种面向产品外观设计方案的决策模型如图1所示。决策过程如下:根据设计专家调研和国内外相关研究论述[5,6,10,11]泛选产品设计评价指标;通过公信度、重合度和效用度三方面的分析,删减低效和重复性的评价指标,构建产品外观设计的最终评价指标体系;最后,基于客观取值和专家群体评价对各类指标赋值,建立产品外观设计方案评价矩阵,计算相应的相关系数矩阵,求解其主成分及其贡献率,构建综合评价函数。

2 产品评价指标体系的确定

2.1 评价指标泛选

评价指标选择的科学性决定了最终决策结果的准确性。本研究通过专家访谈、设计师问卷调研以及对相关研究文献[5,6,10,11]的参考,广泛收集了与产品外观设计评价相关的指标43个。

根据产品设计特征、用户需求和企业目标等因素,将这些指标分为4类,包括人机性能、形式、市场、成本,如表1所示。

本文以手机设计方案评价为案例进行具体决策研究。在实际评价过程中,根据产品种类的差异,可以微调具体的评价指标,例如,家具产品的设计评价中没有“使用成本”指标。

这些初选指标有的只是有少数专家提及,没有得到广泛的验证。有些评价指标相互间存在重叠,会导致产品的某些特性值被重复添加到最终评价结果中,影响评价的公正性。因此,在确定最终的评价指标体系前,需要对泛选的指标进行多次筛选,以增加评价指标的科学性。

2.2 公信度评价

将初选的4类指标发送给产品设计师、产品工程师和设计管理人员进行公信度测评。我们选择了180位设计师和设计管理者进行问卷调查,要求专家根据自身的设计实践经验选择产品外观设计中有重要影响的评价指标。

专家的判断也是个人主观经验,但是设计专家的经验对设计的判断有一定的准确性和合理性,通过对大量专家意见的对比分析,可以消除一定的主观性,较客观地反映评价指标的重要性。

课题组最终收回的有效问卷为97份。我们将多数专家选择的评价指标纳入评价体系,即

I=M/97 (1)

式中,I为公信度;M为选择该指标的专家人数。

我们将公信度低于0.5的16个指标删除,保留的27个评价指标进入后续的筛选。

2.3 重合度评价

经过专家筛选的27个评估指标中,一些评价指标之间很可能存在着一定的重合度。评价指标间的高度重合会导致被评价对象的某些特性被反复输入最终评价结果,导致最终评价结果无效。所以,我们需要通过重合度评价,消除高度重合指标中公信度较低的指标。

通过多个设计案例的27个指标评价,可以建立设计评价矩阵。通过求解该矩阵的相关系数矩阵,可得到各指标两两间的相关系数。相关系数大的指标即重合度高,我们将高度相关指标中公信度较低的那个指标删除,以消除评价中重叠的影响。

具体实践中我们将重合度阈值定为0.8。求解相关系数矩阵,具体步骤与4.1节相同,经分析有7对评估指标的重合度大于指定阈值,分别是便携性与体积、耐久性与可靠性、可操控性与操作简易、适当比例与整体与局部协调、可装配性与运输成本、标准化程度与配件通用性、生产周期与易加工性。

分别删除7对指标中公信度相对较低的7个评估指标(便携性、操作简易、可靠性、适当比例、运输成本、配件通用性、易加工性),剩下的20个评价指标进入后续筛选。

2.4 效用度评价

经过前面的筛选,入选的指标对产品外观设计评价具有较好的指导意义。但在具体设计方案的评价中,某些指标起不到真正的甄别效果,只是增加了评价的复杂程度。例如,对于手机产品来说,安全性指标值基本是相同的,所以,针对特定类别产品的设计评价需要剔除一些效用度过低的指标,以降低评价的复杂性。

对评价对象评分相近的指标,区别各设计方案优劣的效用较差。所以,可采用方差或变差系数来计算各指标的效用度。本研究将效用度低于0.15的指标(安全性、形态的稳定性、设计风格、标志布置适宜、标准化程度)剔除。

经过多轮筛选,最终评估指标体系中共有15个评估指标,如表2所示。其中,正向指标有12个,该类指标对综合评价结果起积极作用;逆向正指标3个,该类指标值对综合评价结果起消极作用,如体积、使用成本等。

注:*逆向指标

3 建立评价矩阵

需要对多个设计方案的各评价指标赋值,才能建立评价矩阵,进行后续的主成分分析。

3.1 评价指标赋值

指标性质不同,赋值的方式也不同。客观指标可以通过直接的测量和计算,得到具体数值,如体积、制造成本等。

创新性、操控性、舒适性等指标具有模糊性,难以直接获得。因此,本文采用专家和用户群体评价[12]对主观指标赋值。专家和用户可以通过特定的言词对产品指标的主观满意程度进行评价,基于对语言变量赋值得到产品指标的评价值。测试的模糊语句是“你对该产品某项指标的满意度”,专家和用户可以选择“很不满意、不满意、一般、满意、很满意”5种偏好语句进行评价。5种评价的赋值分别是1,2,…,5。设k个专家对第i项设计方案的第j类指标进行评价,各个专家的评分为e1,e2,…,ek,最终评价结果为xij,即

e¯=1ki=1kei(2)

xij=e¯(3)

考虑到评价值是专家的主观评价,需要验证评价结果是否值得采信。分析评价结果的可信度公式为

p=1-1ki=1k(ei-e¯)2(4)

式(4)中,p值越大说明专家的评价意见越统一,可信度越高。反之,p值太低则需要重新进行评估。

3.2 建立评价矩阵

基于各方案的指标赋值建立的评价矩阵X

X=A1A2AnC1C2Cm[JX-*2][x11x12x1mx21x22x2mxn1xn2xnm](5)

式中,xij为第i个方案第j项指标的指标值(i=1,2,…,n;j=1,2,…,m);An为需要进行决策的设计方案;Cm为测评的各项评价指标。

3.3 数据的标准化

各指标的单位和数量级都不相同,不具备可比性,所以,在主成分分析前需要对各评价指标数值进行标准化处理。

3.3.1 逆向指标处理

最终评价指标集中,包括3个逆向指标。逆向指标值越大,方案评价得分越低。评价公式可表示为

xij=xmax-xijxmax-xmin(6)

式中,xij为第i个设计方案的第j项指标的逆向处理值;xij为第i个设计方案的第j项指标的初始指标值;xmax为全部方案中第j项指标的最大值;xmin为全部方案中第j项指标的最小值。

使用式(6)对逆向指标进行标准化处理,使所有指标对测评方案的作用力同趋化。

3.3.2 可比性

各个指标值的单位不同,数量级也不同,不具有可比性,需要进行标准化处理,以解决数据间的可比性问题。

本文数据标准化处理公式可表示为

zij=xij-x¯j1ni=1n(xij-x¯j)2(7)

Ζ=A1A2AnC1C2Cm[JX-*2][z11z12z1mz21z22z2mzn1zn2znm](8)

式中,zij为指标的标准值,它等于初始指标值xij与第j项指标均值x¯j之差除以该指标变量的标准差。

标准化后,每个设计方案中各评价变量均值为0,方差为1。

式(8)是经式(7)标准化处理后,构建的标准化评价矩阵。

4 主成分分析

在实际的设计决策过程中,我们需要考虑多个方面对评价结果的综合影响,但从统计学的角度考虑,变量太多会增加问题分析的复杂度。通过主成分分析法可以将多个评价指标转换为少数几个主成分进行分析,而各主成分的贡献率就是各主成分在最终评价函数中所占的权重。

4.1 相关系数矩阵

根据标准化处理后的评价矩阵,建立相关系数矩阵和系数方程:

R=(r11r1mrm1rmm)(9)

rij=k=1n(zki-z¯i)(zkj-z¯j)k=1n(zki-z¯i)2k=1n(zkj-z¯j)2(10)

式中,rij为第ij项评价指标的相关系数,因R是实对称矩阵,所以rij=rji;z¯iz¯j分别为各方案第ij项评价指标标准值的平均值,i,j=1,2,…,m;n为方案总数。

4.2 求解主成分及其贡献率

特征值λ代表对应的主成分对各项评价指标的解释力度。根据特征方程|λE-R|=0,求解特征值λi(i=1,2,…,m),其中λ1≥λ2≥…≥λm≥0。如果某主成分特征值λi小于1,说明该主成分对评价指标的解释力度还不如初始的1个评价指标。

求解对应于特征值λi的特征向量ui(i=1,2,…,m)。根据公式

ki=zh1ui1+zh2ui2+zh3ui3+…+zhmuim (11)

可得到第h个设计方案(h=1,2,…,n)的第i个主成分值ki

贡献率ηi指对应的主成分特征值在所有特征值中所占的比率。根据公式

ηi=λij=1mλj(12)

可计算第i主成分的贡献率ηi,其中i,j=1,2,…,m

4.3 构造综合评价函数

挑选特征值较大的主成分,构建综合评价函数。该研究选择特征值大于1的主成分进入最终评价。设p个主成分的特征值大于1,则综合评价函数为

F=j=1pηjkj(13)

5 案例实验

本研究以手机产品为例进行外观设计评价实验,该实验选用了12款手机设计方案进行评价,见图2。

5.1 主成分求解

根据3.1节方法,首先为12款设计方案的各项指标赋值,进行数据的标准化处理,构建评价矩阵。然后,根据式(10)计算相关系数矩阵,分析各变量间的关系。利用spss软件进行矩阵的主成分分析。表3所示是各主成分的特征值、贡献率和累积贡献率。由表3可知,前3个主成分的特征值大于1,贡献率较大,所以选用前3个主成分描述设计方案的综合水平。前3个主成分的累积方差贡献率为83.397%,其中第一主成分和第二主成分的方差贡献率分别为58.365%和18.036%。

表4列出了前3个主成分的特征向量u1、u2、u3。主成分值ki等于15项评价指标的标准值与对应的特征向量ui的乘积。第h个设计方案的第一主成分k1的求解公式为

k1=-0.632zh1+0.918zh2-0.633zh3+

0.803zh4+0.779zh5+0.825zh6+0.791zh7+

0.840zh8+0.400zh9+0.855zh10+0.939zh11+

0.601zh12+0.531zh13-0.901zh14-0.788zh15 (14)

式中,zhi为评价指标的标准值。

5.2 综合评价

选择前三主成分进行综合评价。综合评价值Ei的求解公式为

Ei=λ1λ1+λ2+λ3k1+λ2λ1+λ2+λ3k2+λ3λ1+λ2+λ3k3(15)

式中,k1、k2、k3为前3个主成分值;λ1、λ2、λ3为其前3个主成分的特征值。

根据上式可得到12个评价方案的综合评价值Ei,i=1,2,…,12。为更直观地显示综合评价值,通过公式

Ei=Ei-EminEi,max-Emin×100(16)

将评价结果转换为百分制形式,其中Emax表示最大评价值,Emin表示最小评价值。

12个设计方案的评分分别为0、100、19.6、22.3、26.2、48.9、77.2、26.3、65.9、56.2、24.3、23.4。可见2号、7号、9号方案评价较好,1号、3号方案评价很差。经过用户访谈和企业调研,发现产品销售情况和用户使用后的反馈与该评价结果基本一致。

5.3 结果分析

前3个主成分累计贡献率达83.397%(表3)。第一主成分贡献率最大为58.365%,说明该主成分综合各评价指标的信息量最大。根据表4中第一主成分的特征向量u1可知,它主要代表的评价指标有C2(创新性)、C4(可操作性)、C5(舒适性)、C6(功能与样式的统一)、C8(细节处理)、C10(色泽品质)、C11(迎合国际审美要求),其权重系数分别为0.918、0.803、0.779、0.825、0.840、0.855、0.939。第二主成分贡献率为18.036%,它主要代表的评价指标是C1(体积)、C9(整体与局部的协调)、C13(易加工性),其权重系数分别为0.694、0.727、0.694。第三主成分贡献率为6.996%,它代表的指标信息比较少,没有突出变量。

通过设计师访谈和问卷调研,各主成分代表的意义符合专业设计师的认知。设计方案评价结果与市场销售业绩和用户群评价结果相近。可认为,该方法能对现实的设计决策起到积极作用。

6 结语

本文通过公信度、重合度和效用度评价筛选有效的评价指标。利用主成分分析对产品外观设计决策问题进行求解,避免主观评估各个评价指标在评价体系中的模糊权重,直接利用主成分贡献率反映各个主成分对设计方案评价结果的影响,确定各设计方案的综合评价值。该方法一定程度上增强了设计决策的客观性和科学性,对设计决策有积极意义。

摘要:利用主成分分析对产品外观设计方案进行多目标决策,回避了设计评价中常用的评价指标模糊权重系数求解,增强了设计决策的客观性。首先,根据设计师访谈、用户调研和国内外的设计评价研究泛选产品设计评价指标;通过评价指标的公信度评测、重合度评测和效用度评测,消减重复、低效的设计评价指标,确定产品设计评价指标体系;基于主客观指标赋值,建立评价矩阵;最后,计算评价矩阵的相关系数矩阵,求解其主成分及其贡献率,构建综合评价函数。通过具体设计方案评价实验,各主成分代表的意义符合工业设计师的认知,最终评价结果与市场和用户综合评价基本一致。该研究在一定程度上增强了设计评价的客观性和科学性,对产品外观设计决策有实际价值。

关键词:多目标决策,主成分分析,群体评价,设计评价

参考文献

[1]Goldschmidt G.Linkography:Assessing DesignProductivity[C]//World Scientific.Cyberneticsand Systems.Singapore:R.Trappl,1990:291-298.

[2]Kan J,Gero J.Acquiring Information from Linkog-raphy in Protocol Studies of Designing[J].DesignStudies,2008,29(4):315-337.

[3]Hui Cai,Ellen Yi-Luen Do,Craig M.ExtendedLinkography and Distance Graph in Design Evalua-tion:An Empirical Study of the Dual effects of In-spiration Sources in Creative Design[J].DesignStudies,2010,31(2):146-168.

[4]Saaty T L,Vargas L G.Models,Methods,Concepts&Applications of the Analytic Hierarchy Process[M].Norwell:Kluwer Academic Publishers,2005.

[5]魏晓鸣,刘晓冰,杨春立.产品配置设计评价模型研究[J].大连理工大学学报,2006,46(4):510-515.

[6]张志华,蔡克中.基于模糊数学综合评判法的信息化产品的设计评价[J].南昌大学学报:理科版,2003,27(2):128-131.

[7]苟秉宸,周宪,余隋怀.机电产品数字化工业设计多目标评价关键技术[J].计算机工程与应用,2005,41(29):107-109.

[8]Osman K,Cengiz K.Fuzzy Multi-attribute Selec-tion Among Transportation Companies Using Axio-matic Design and Analytic Hierarchy Process[J].Information Sciences,2005,170(2):191-210.

[9]IAN JOLLIFFE.Principal Component Analysis[M].New York:Springer,2002.

[10]Goldschmidt G,Smolkov M.Variances in the Im-pact of Visual Stimuli on Design Problems SolvingPerformance[J].Design Studies,2006,27(5):549-569.

[11]Goldschmidt G.Criteria for Design Evaluation:AProcess-oriented Paradigm[M]//Kalay Y E.E-valuating and Predicting Design Performance.NewYork:John Wiley and Sons Inc.,1992:67-79.

成分数据模型 篇4

一、确定财务指标

选取的财务指标包括上市公司的偿债能力、营运能力、赢利能力、发展能力4个方面企业会计信息失真的指标识别体系。

二、判别显著指标

估计样本选取失真样本的前20个和非失真样本的前20个, 选取非失真样本的后8个和失真样本的后8个作为预测组, 从偿债能力、营运能力、赢利能力、发展能力4个方面选取17个财务比率指标组成会计信息失真预测模型的主成分, 输入SPSS软件后得出自由度和伴随概率如下:

三、T统计量显著性检验 (显著性水平为0.05)

根据T值结果, 分析如下:

(1) 对于X1, 即流动比率, T检验结果为0.001, 小于0.05, P值落在拒绝域, 即失真样本和非失真样本之间存在显著性差异, X1应该得到保留。

(2) 同样对于X5, 即产权比率, T检验结果为0.82, 大于0.05, P值落在接受域, 即失真样本和非失真样本之间无显著性差异, X5应该剔除。依照这个规则, X1, X2, X3, X4, X6, X11, X12, X15, X16这九个变量得到保留。

四、主成分因子的确定

SPSS20.0软件操作:选择分析-降维-因子分析 (选取主成分分析法) , 首先进行主成分分析的适用性检验:KMO统计量值为0.592, 在0-1之间, 比较接近于1, 符合主成分分析的要求;球形假设检验的相伴概率是0.000, 小于显著性水平0.05, 球形假设被拒绝, 因此指标之间并非独立, 适合进行主成分分析.接着进行主成分的确定与解释, 进行主成分分析得到主成分特征值和贡献率。

表2中前四个主成分累积贡献率达到86.889%, 满足经验要求值85%.通过公因子方差表中的数据也可以看出, 提取的主成分基本解释了所有变量, 提取的信息比较充足, 大部分都在80%以上, 所以确定主成分因子数目为4个。

再由因子载荷矩阵得出:因子Z1主要由X1, X4, X6, X11, X12构成, 因子Z2主要由X2, X3, X15构成, 因子Z3主要有X4, X6, X16构成, 因子Z4主要由X4, X11, X12, X15构成。

五、构造预测模型并选择预测分割点

所以可以由贡献率表和因子得分系数矩阵得到预测模型为

六、结论

成分数据模型 篇5

一、主成分分析法

1、主成分分析法原理。

主成分分析法 (Principal Components Analysis) 是由K.Pearson在1901年提出, 并由H.Hotelling在1933年加以发展的, 是一种简化数据集的技术, 它是一种较为客观的多指标评价方法。该方法将多指标问题化为较少的新指标, 新指标是原来多个指标的线性组合, 它们之间彼此互不相关, 又能综合反映原来多个指标的信息, 综合后的新指标称为原来指标的主成分。

2、主成分分析法计算步骤。

假定某评价体系中有n个样本, 每个样本共有p个变量描述, 则构成一个n×p阶的初始矩阵:

Step1计算相关系数矩阵

其中为变量与的相关系数, 具体计算为:首先求得

则相关系数矩为

Step2计算特征值与特征向量

由特征方程|λI-R|=0求得p个特征值并将其按大小排列, 得λ1≥λ2≥…≥λp≥0

然后求出每个特征值λi的特征向量ξi

Step3计算主成分贡献率及累计贡献率

第个主成分贡献率和前个主成分累计贡献率分别为, 其中, 一般选取累计贡献率达85%以上的前m个特征值所对应的主成分, 这样处理损失信息较少。

Step4计算主成分载荷

第j个原有指标在第i个主成分的负荷为, 其值大小反映了主成分因子对可测变量的影响程度。

Step5计算样本综合排名

样本综合排名, 其中Ui=Z*ξi

二、实例分析

我们选取郑州、张家界、桂林、北京、苏州和西安等六个不同区域具有代表性的旅游城市作为分析对象。通过考察统计上述六个城市的生物资源、水域资源、地理资源和人文资源等相关数据, 整理得

通过主成分分析法, 求得相关系数矩阵R的特征值为λ1=2.0158;λ2=1.3367;λ3=0.3541;λ4=0.0536

它们对应的特征向量分别为

计算得特征值总和λ=3.7602,

而, 所以选取λ1, λ2作为主成分。

计算得主成分载荷为

由公式Ui=Z*ξi, 得到

利用公式求得综合排名为

因此根据主成分分析法, 郑州等六个旅游城市排名为北京、西安、苏州、郑州、张家界、桂林。通过查阅中国旅游统计公报中可知2006—2008年这6个旅游城市的排名分别为:2006年:北京、苏州、西安、桂林、郑州、张家界;2007年:北京、苏州、西安、桂林、郑州、张家界;2008年:北京、苏州、桂林、西安、郑州、张家界。比较分析可知, 由主成分分析法得到的排名结果与历史统计数据大致相近, 表明主成分分析法在分析评价旅游资源过程中具有一定的可信度。并且根据主成分载荷相关数据可知, 第一主成分z1与x3即地理资源, 有较大的正相关, 从这6个城市的旅游资源分布格局与我国悠久的历史来看, 地理资源在我国旅游资源中确实占到了举足轻重的位置;第二主成分z2与x1与x4, 即生物资源和人文资源, 有较大的正相关, 而主成分Z1和Z2关于水域资源具有负相关和较小的正相关, 因此以水域资源著称的桂林城市在城市综合排名中较为靠后。因此, 郑州若希望利用较少的投资尽快地提升旅游资源综合实力, 需要优先投资生物资源和人文资源。

三、建议

由分析结果可知, 郑州需要优先投资生物资源和人文资源。因此郑州需要切实有力、坚定不移地实施退耕还林政策, 积极培育当地生物生态环境, 努力促进环境生物的多样化, 延伸生物链条, 并积极引进外来优良物种, 促进外来物种本地化。同时郑州需要充分挖掘、整理并扩大宣传古往今来郑州的历史文化名人, 在现有嵩山风景区、黄河游览风景区和黄帝故里等著名文化遗产基础上, 向纵深发展, 成体系、成系统, 实现可持续发展。譬如少林寺不仅武功博大精深, 其佛教传统更是源远流长。郑州应借助于少林寺在中国崇高的宗教地位, 加强佛教文化在郑州的交流, 进而提升少林寺文化的品牌形象, 实现当地旅游的可持续发展。郑州加强人文资源建设, 不仅要整理、宣传古代的历史文化名人, 更要侧重于宣传郑州的社会主义现代化建设的巨大成就, 各行各业的先进标兵、典型个人, 及其先进的经营理念及优良的企业文化都是郑州的人文资源中不可或缺的组成部分。

参考文献

[1]H.Hotelling, Analysis of a complex of statistical variablesinto principal components.Journal of Educational Psychology, V24:417-441.

[2]L.I.Smith, A tutorial on Principle Components Analysis[EB/OL], http://cs.net.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf

成分数据模型 篇6

运行中的混凝土坝,由于坝体、库水和坝基的相互作用,同时受到外部环境如气温、降雨和地震等多种因素的影响,使系统 具有内在的不确定性,可视为复杂的动力系统,表现出复杂的非线性动力学特性[1,2]。研究[2,3]表明混凝土坝具有混沌特性,难以用确定性分析方法对其进行模拟分析。随着诸多混凝土坝的相继失事,人们逐渐认识到安全监测对于保证混凝土坝安全的重要作用[4]。

目前,对于混凝土坝监测数据的预测大多基于统计理论的拟合预测。而混凝土坝的行为特征十分复杂,从现场获取的监测数据大多是一个貌似随机的非线性混沌序列[3,4],对于非线性的混沌时间序列,使用普通的预测方法,预测精度和预测效果都不太理想。混凝土坝的发展演化并不是表象上的随机过程,而是有其自身的规律和特点,混沌理论恰好可以模拟其演化过程。因此,基于混凝土坝监测数据混沌性的特点,采用混沌预测的方法建立预测模型,是提高混凝土坝位移监控预测模型精度的关键问题之一。

论文针对以上问题,研究考虑混沌成分的混凝土坝监控模型进行,基本思路如下:在对混凝土坝监测资料混沌分析的基础上,利用混合模型对明显突变后的监测序列进行拟合求得残差,然后对残差进行相空间重构,利用最大Lyapunov指数理论,基于混沌理论建立了考虑混沌成分影响的混凝土坝位移混合-混沌监控预测模型;最后通过算例证明了该方法具有更高的预测精度,因此,对于混凝土坝位移的实时监测和预警都有重要意义。

1 混凝土坝混合模型

现有的大坝安全监控理论中[5], 一般利用统计模型、混合模型和确定性模型等来表征环境量对混凝土坝效应量的定量关系。其中统计模型从本质上说是一种后验模型,所表示的物理意义不明确;而确定性模型是通过仿真分析确定环境量和效应量之间关系,并根据大坝的实际性态加以调整,但是该方法在模拟温度分量及时效分量的影响时,工作量较大。而混合模型则综合了统计模型和确定性模型的优点,其中水压分量采用有限元仿真分析得到,而温度及时效分量则采用统计模型来表示。据此,混凝土坝位移混合模型可表示为下列形式:

δ=XδΗ+δΤ+δθ(1)δΗ=i=1maiΗiδΤ=j=1nb1j(sin2πjt365-sin2πjt0365)+j=1nb2j(cos2πjt365-cos2πjt0365)δθ=c1(θ-θ0)+c2(lnθ-lnθ0)}(2)

式中:δHδTδθ分别为水压分量、温度分量和时效分量;{a1ii=1,2,…,m}(重力坝m=3,拱坝m=4)为利用结构仿真分析结果得到的单位载常数;X为因坝体与坝基计算参数与实际不完全相同而引入的调整参数;b1jb2jc1、c2为回归系数;t为监测日与始测日的累计天数;t0计算时段起测日至始测日的累计天数;θ为监测日至测点始测日的累计天数除以100;θ0为建模起始日至始测日的累计天数除以100。

2 考虑混沌成分的混凝土坝位移混合-混沌监控预测模型

由前文可知,大坝的监控效应量观测序列是由确定性成分、混沌成分和噪声成分(随机成分)叠加而成的,其中确定性分量和混沌分量在一定范围内可有效预测,而随机分量则无法预测的,如何对其中可预测成分进行建模成为大家关注的问题。本文以混凝土坝监测效应量序列中最近一次位移突变后的监测资料为基础,采用混合模型对确定性成分建模的基础上,再利用残差序列建立混沌预测模型,混合模型与混沌模型组合成混合-混沌预测模型,最终的残差包含原始序列的随机分量和模型误差分量。从而,混合-混沌预测模型的表达式为:

δ=δ+δ=δΗ+δΤ+δθ+δC(3)

式中:δ确为通过混合模型求得的确定性成分;δ混为通过混沌预测模型求得的混沌成分。

2.1 残差相空间重构

混沌动力学研究表明,系统任意分量的演化由与之相互作用的其他分量决定,使用重构变换从系统的某一输出变量的时间序列提取系统的动力学特性,所得到的状态轨迹保留了原空间状态轨迹的最主要的特性。针对于混凝土坝而言,将以水压、温度和时效作为主要因子的混合模型对原始监测数据序列进行回归分析,得到残差序列{ε′(t),t=1,2,…,N},该序列为一维混沌时间序列,而混沌时间序列的预测建立在高维相空间重构的基础上。为此,需对残差序列ε′(t)进行相空间重构,将原有序列延拓成m维相空间的一个相形分布,其表达式为:

Xi={ε(ti),ε(ti+τ),,ε[ti(m-1)τ]}(i=1,2,,Μ)(4)

式中:τ=kΔt为延迟时间,k=1,2,…,n为延迟参数,Δt为观测间隔时间;m为嵌入维数;Xim维相空间中的相点;M=N-(m-1)k为相点个数。

其中,嵌入维数m的确定与关联维数D2有关,可根据Grassberger-Procaccia方法[6]进行选取;而时间延迟τ可由互信息[7,8]方法确定。据此,当嵌入维数m和时间延迟τ确定后,虚残差序列即可重构为如式(4)所示的[N-(m-1)km维的向量矩阵。

2.2 最大Lyapunov指数求解方法

在残差序列相空间重构的基础上,找相空间中每个点Xj的最近临近点X,p为时间轨道平均周期,计算dj(0)的值:

dj(0)=infXkXXj-Xk=Xj-Xj^|j-j^|<Τ(5)

式中:‖·‖表示向量2范数,inf(·)表示自变量在某特定域中取下界值,即最小值。

对相空间中的每个点Xj,计算出该邻域点对的第i个离散时间步后的距离dj(i)为:

dj(i)=Xj+1-Xj^+1i=1,2,,min(Μ-j,Μ-j^)(6)

由公式(5)和(6),前进距离dj(i)与dj(0)有以下近似关系:

dj(i)dj(0)eλiΔt(7)

式中:Δt为观测序列的采样间隔或步长;i为相点沿时间轨道的滑动步长序数;λ为最大Lyapunov指数。

对式(7)两边取对数:

lndj(i)lndj(0)+λiΔt(8)

考虑到局部计算的影响,最大Lyapunov指数的最后经验公式为:

λ=1iΔtln<dj(i)><dj(0)>(9)

式中:<·>为按相空间的点数求平均。

2.3 混沌预测的原理

在对具有混沌特性的序列进行重构的相空间{X}中,相点Xi运动到相点Xi+k状态可以由相点Xi及其以前的相点决定,因此,存在以下函数关系式:

Xi+k=F(Xi)(10)

式中:F(Xi)为相点Xi+k的预测函数。

式(10)即为混沌时间序列预测模型,由已知的数据序列就可以估计出预测函数F(Xi),根据预测时间的长短,可以分为一步预测和多步预测,它们可以表示为:

X^i+1=F(Xi)(11)X^i+k=F(Xi+k-1)(12)

其实,只要解决了一步预测,依次类推便可进行多步预测。

2.4 混沌预测模型的构建

寻求预测函数的方法有全域近似法和局域近似法。全域近似法计算工作量比较大,尤其当嵌入维数高、预测函数复杂时,预测精度下降;局域近似法预测只需部分点,计算量较小,它通常它将相空间轨迹的最后一点作为预测中心点,把离中心点最近的若干点作为相关点,然后对这些相关点进行拟合,再估计轨迹下一点的走向,最后从预测出的轨迹点的坐标中分离出所需要的预测值[9]。局域近似法中又有零阶局域法、一阶局域近似法和最大Lyapunov 指数法等,有关研究[10]证明最大Lyapunov指数法比其他两种方法具有更高的预测精度。因此,本文在寻求预测函数过程中采用局域近似法中的最大Lyapunov指数法,其计算方法如下。

(1)对最近一次位移突变后监测残差序列进行相空间重构,根据式(5)~式(9)计算该序列的最大Lyapunov指数λ;

(2)取Xi为预报中心,在满足欧式距离d的条件下,寻找Xi的近似相矢Xk,d的表达式如下:

d=minXi-Xk=min{1m-1j=0m-1(xi+jτ-xk+jτ)2}(13)

(3)利用最大Lyapunov指数预测模型进一步预测,其预测模型为:

Xi-Xi+1=Xk-Xk+1eλ(14)

其中,Xi+1中只有最后一个分量xi+1是未知数,所以,xi+1是可以预测的;

(4)利用一步预测的Xi+1作为预报中心,重复步骤(2)和(3),便可进行多步预测。

2.5 混合-混沌监控预测模型的构建流程

在混凝土坝长期监测序列中截取最近一次突变后的监测时间序列为预测检验序列,采用混合-混沌模型预测的总体流程图如图1所示。

3 工程实例

某大坝为混凝土重力拱坝,坝顶高程为126.3 m,最大坝高为76.3 m,坝顶宽8 m,最大坝底宽53.5 m,自左向右有28个坝段。为了确保安全运行,在大坝的表面和内部布置了变形、渗流、温度和应力应变等较为全面的监测项目。其中8号坝段为溢流坝段和挡水坝段的交接段,受力条件复杂,因此在8号坝段105.00 m高程处布置了两条垂线,本文以此坝段125 m高程1998年6月21日-2006年12月1日期间的位移监测数据(见图2)作为研究对象进行分析。由图2可见,该坝段变形是一个非线性的、混沌的非平稳序列。

首先用有限元结构仿真分析结果得求得水压分量的单位载常数,本文所建立的有限元图形如图3所示。有限元计算模型的范围:上下游方向取2倍左右坝高(各约150 m),左右坝肩各取约150 m。有限元节点布置,尽可能将变形测点安排在节点上。此外,在有限元划分时,根据断层走向,软弱带的分布以及地质的变化而划分,尽量使划分的单元反映实际情况。单元采用六面体8节点等参单元。模型共划分了9471个单元,11 997个节点;然后用混合模型对原始监测序列进行回归拟合,得出混合模型所有回归系数α0、α1、α2、α3、α4、b11、b21、c1、c2分别为-9.29、-1.23×10-1、5.6×10-3、1.09×10-4、1.03×10-6、1.03、-2.61、-6.94×10-2、1.16×10-1。其回归复相关系数高达0.93,表明所建立的混合模型拟合效果较好,虚残差序列如图4所示。

由残差序列可以看出,监测序列在2004年10月1日-2005年2月1日发生了突变,因此,本文利用利用2005年2月1日-2006年12月1日的相对稳定的监测数据作为子序列进行研究。用混合模型对该子序列进行回归拟合,得出混合模型所有回归系数分别为-7.71、-1.23×10-1、5.6×10-3、1.09×10-4、1.03×10-6、0.89、-1.19、-3.88×10-2、0.73×10-1,其回归复相关系数高达0.97,表明所建立的混合模型拟合效果较好。残差值见表1。

由表1可以看出,考虑混沌成分的混合监控预测模型建立在子监测序列上相对误差绝对值的平均值为2.87%,而未考虑混沌成分的混合监控预测模型建立在全监测序列上相对误差绝对值的平均值为5.07%,由此可见考虑混沌成分且建立在子监测序列上的混合监控预测模型拟合精度显著提高。

以建立在子序列上的混合模型拟合后的残差(表1)为基础数据对2007年1月1日至2007年6月1日进行最大Lyapunov指数法预测,得到包含混沌成分的预测残差,利用式(3)即可求得该混凝土坝8号坝段的变形预测值。

首先对残差序列进行相空间重构,重构参数取用,m=3,τ=2,按式(4)重构后的相空间为一个16×3的矩阵,相点为Xi,i=1,2,…,16。用Matalab编制程序计算最大Lyapunov指数为0.089 28,当预测x21时,以X16为预测中心点,在满足式(13)条件下寻找近似相矢为X7,把X16,X7及其下一步演化的X17,X10以及最大Lyapunov指数λ代入式(14)得:

X16-X17=X9-X10e0.08928(15)

上式中仅有x21为未知数,因此可求,同理,x21~x26均可求,计算结果见表2。

由表2可以看出,建立在全监测序列上的混合模型对2007年1月1日至2007年6月1日预测相对误差绝对值的平均值为7.55%,考虑混沌成分的混合监控预测模型建立在子监测序列上预测的相对误差绝对值的平均值为5.0%,而混合-混沌监控预测模型建立在子监测序列上预测的相对误差绝对值的平均值为1.61%,显而易见,考虑混沌成分的混合-混沌监控预测模型预测精度有很大提高。

4 结 语

混凝土坝作为一个复杂的非线性动力系统客观存在,本文重点研究了考虑突变影响的混凝土坝位移监控模型,取得以下成果。

(1)基于相空间重构理论和最大Lyapunov指数法混沌预测,建立了考虑混沌成分影响的混凝土坝混合-混沌位移监控模型。

(2)并利用该模型对某重力拱坝进行了分析,结果表明,通过该模型不但能够准确地获取混凝土坝监测效应量的确定性成分及混沌分量,而且提高了混凝土坝位移的预测精度,达到混凝土坝监控模型优化的效果,也为更好地实施混凝土坝安全监控奠定了基础。

(3)本方法不但可以用于混凝土坝的监控预测,而且还可以推广到其他水工建筑物的安全监控和预测中,具有较强的实时监测和预警功能。

参考文献

[1]吴中如,顾冲时.大坝安全综合分析和评价的理论、方法及其应用[J].水利水电科技进展,1998,18(3):2-6.

[2]徐洪钟.混凝土坝动力系统的安全监控非线性分析模型研究[D].南京:河海大学,2001.

[3]汪树玉,刘国华.大坝观测数据序列中的混沌现象[J].水利学报,1999(7):22-25.

[4]张我华,邱战洪.堤坝和基础非线性动力失稳灾变的分岔突变分析[J].浙江大学学报(工学版),2007,41(1):88-96.

[5]吴中如,沈长松.水工建筑物安全监控理论及其应用[M].南京:河海大学出版社,1990.

[6]Albano A M,Muench J,Schwartz C.Singular-value decomposi-tion and the Grassberger-Procaccia algorithm[J].Phys Rev A,1988,38(6):3 017-3 026.

[7]Fraser A M.Information and entropy in strange attractors[J].IEEE trans inform theory,1989,35(2):245-262.

[8]Wales D J.calculating the rate of information from chaotic timeseries by forcasting[J].Nature,1991,350(6318):485-488.

[9]Mees A I,Rapp P E,Jennings L S.Singular-value decomposi-tion and embedding dimension[J].Phys.Rev,1987,36(1):340-346.

成分数据模型 篇7

Ohlson (1980) 的研究表明, 根据企业破产后的信息建立模型会高估模型的预测能力。考虑我国的年报披露制度, 本文选取上市公司被特别处理的前两年作为研究期间。

由于我国上市公司被特别处理是从1998年开始的, 而且研究中需要使用现金流量和成长能力这两个变量, 故本文选取2001~2006年的196家被特别处理的上市公司作为财务危机公司。

按照与财务危机公司上市时间相同或相近、行业门类相同或相近的原则, 本文还选取了196家非财务危机公司作为配对样本。这样, 研究样本就由196家财务危机公司和196家非财务危机公司共同构成。

为保证建立的财务危机预警模型的预测准确性, 按照财务危机公司与非财务危机公司的配对, 将每年的财务危机公司按公司代码排列后, 随机抽取其中的1/4构成测试样本组, 作为外部数据用于对构造出来的财务危机预警模型进行检验;剩余的3/4组成构造样本组, 作为原始数据用于构建财务危机预警模型。也就是说, 构造样本组由294家公司构成, 其中财务危机公司与非财务危机公司各147家;测试样本组由98家公司构成, 其中财务危机公司与非财务危机公司各49家。

二、主成分分析

1. 财务预警变量的选取。

上市公司陷入财务危机, 可能是财务活动造成的, 也可能是非财务活动造成的。借鉴国内外学者的研究成果, 本文选取了财务变量和非财务变量, 详见表1和表2。

2. 财务预警变量的正态性及显著性检验。

本文通过单样本的柯尔莫哥洛夫-斯米诺夫检验来验证选取的37个财务预警变量在总体上是否服从联合正态分布。如果服从, 显著性检验时使用T检验法;否则, 使用非参数检验法。K-S检验结果显示, 仅X2、X3、X23、X30、X37服从正态分布, 其余32个变量不服从正态分布, 因而可以认定这37个变量总体上不服从联合正态分布, 需要使用非参数检验法。

显著性检验发现, 除公司治理方面的4个变量外, 其余变量均在5%的水平上显著, 因而在进行主成分分析时剔除公司治理方面的4个变量。

3. 主成分因子的提取。

在仅使用财务变量和既使用财务变量又使用非财务变量的情况下, KMO检验值分别为0.742、0.744, 表明这两种情况均适合进行主成分分析。

(1) 仅使用财务变量情况下的主成分因子。仅使用财务变量时提取8个主成分因子, 分别是现金流量—偿债和营运能力主成分因子F1 (主要由X19、X20、X23解释) 、市场价值主成分因子F2 (主要由X25解释) 、盈利能力—获利主成分因子F3 (主要由X9和X11解释) 、短期偿债能力主成分因子F4 (主要由X1和X2解释) 、营运能力—总资产和固定资产主成分因子F5 (主要由X7和X8解释) 、现金流量—盈利能力主成分因子F6 (主要由X22解释) 、盈利能力—主营业务主成分因子F7 (主要由X14解释) 、营运能力—存货主成分因子F8 (主要由X6解释) 。

(2) 既使用财务变量又使用非财务变量情况下的主成分因子。既使用财务变量又使用非财务变量时提取10个主成分因子, 分别是现金流量—偿债和营运能力主成分因子F1 (主要由X19、X20和X23解释) 、市场价值主成分因子F2 (主要由X25解释) 、盈利能力主成分因子F3 (主要由X9、X10、X11、X12和X13解释) 、短期偿债能力主成分因子F4 (主要由X1和X2解释) 、营运能力—总资产和固定资产主成分因子F5 (主要由X7和X8解释) 、公司规模主成分因子F6 (主要由X37解释) 、股权结构主成分因子F7 (主要由X28和X29解释) 、营运能力—存货主成分因子F8 (主要由X6解释) 、地域环境主成分因子F9 (主要由X36解释) 、现金流量—盈利能力主成分因子F10 (主要由X22解释) 。

三、MLR模型的构建及预测效果

因变量y是虚拟变量, 表示上市公司是否会出现财务危机, 出现财务危机时 (即财务危机公司) 为1, 没有出现财务危机时 (即非财务危机公司) 为0;自变量是提取的主成分因子。

由于各个主成分因子之间不存在多重共线性问题, 因而可以采用全部进入的方法。

根据仅使用财务变量时提取的8个主成分因子建立的MLR模型为:

按照既使用财务变量又使用非财务变量时提取的10个主成分因子建立的MLR模型为:

由于采用一一配对方式进行研究, 我们将MLR模型的预测分割点默认为0.5。将98个测试样本的主成分的分值分别代入模型 (1) 和模型 (2) , 得到的预测准确率见表3。

模型 (1) 和模型 (2) 对财务危机公司的预测准确率均达到了70%以上, 但模型 (2) 对财务危机公司的预测准确率比模型 (1) 的高8%左右。可见, 在MLR模型中引入非财务变量是非常有必要的。

模型 (1) 和模型 (2) 犯Ⅰ类错误 (是指实际为财务危机公司却被误测为非财务危机公司) 的次数均少于犯Ⅱ类错误 (是指实际为非财务危机公司却被误测为财务危机公司) 的次数, 说明这两个模型对财务危机公司的识别能力均强于对非财务危机公司的识别能力。

可见, 本文运用MLR模型进行财务危机预警时, 对财务危机公司的预测均取得了较好的效果, 而引入非财务变量后, 模型的预测效果更好。但MLR模型还是存在一定的局限性, 有必要使用同样的变量建立BP-ANN模型进行比较研究。

四、BP-ANN模型的构建及预测效果

设定的学习率η为0.15, 动量因子α为0.8。仅使用财务变量时, 输入点P1是8个主成分因子, 输出点P3是虚拟变量y, 隐藏层P2根据式子“ (2P1+P3) 1/2

既使用财务变量又使用非财务变量时, 输入点P1是10个主成分, 输出点P3也是虚拟变量y, 隐藏层P2仍确定为5个, 得到的模型结构是“10×5×1”, 建立的既使用财务变量又使用非财务变量的BP-ANN模型为:

对预测结果进行详细测算, 选取0为分割点。将98个测试样本的主成分的分值分别代入模型 (3) 和模型 (4) , 得到的预测准确率见表4。

模型 (3) 和模型 (4) 对财务危机公司的预测准确率均达到了75%以上, 模型 (3) 的预测准确率高于模型 (4) , 说明仅使用财务变量的BP-ANN模型的预测效果更好, 非财务变量的加入并没有使模型的预测准确率提高。

模型 (3) 和模型 (4) 犯Ⅰ类错误的次数也少于犯Ⅱ类错误的次数, 说明这两个模型对财务危机公司的识别能力均强于对非财务危机公司的识别能力。

五、四个模型的预测效果比较

以上建立的四个模型对财务危机公司的预测准确率都较高, 都在70%以上。另外, 四个模型犯Ⅰ类错误的次数都少于犯Ⅱ类错误的次数, 体现出它们对财务危机公司具有较强的识别能力, 适用于财务危机预警。模型 (1) 对财务危机公司的预测准确率最低, 为71.429%;模型 (2) 和模型 (3) 对财务危机公司的预测准确率相同, 均为79.592%。但从模型的总体预测准确率来看, 模型 (3) 的最高, 模型 (2) 的次之。具体情况见表5。

六、结论

本文以主成分分析法为基础, 分仅使用财务变量和既使用财务变量又使用非财务变量两种情况, 使用MLR模型和BP-ANN模型进行财务危机预警, 发现仅使用财务变量的BP-ANN模型的预测效果最佳。通过本文的定量分析, 我们可以得出如下结论:

第一, 财务预警变量总体上不服从联合正态分布, 所以不满足多元判别分析法的适用前提。考虑到模型的预测效果, 适宜使用MLR模型, 显著性检验适宜使用非参数检验法。

第二, 除公司治理变量外, 财务危机公司与非财务危机公司在偿债能力、营运能力、盈利能力、成长能力、现金流量、市场价值、股权结构、年报披露、地域环境、公司规模方面均存在显著差异, 从而证实本文在财务预警变量的选择上是成功的。

第三, 对于MLR模型来说, 既使用财务变量又使用非财务变量时的预测效果较好;而对于BP-ANN模型来说, 仅使用财务变量时的预测效果较好。可见, 并非引入非财务变量就能提高模型的预测准确率。

第四, 无论是MLR模型还是BP-ANN模型, 其预测准确率都不可能为100%, 这说明定量方法存在一定的缺陷, 而要想提高预测准确率, 必须辅之以定性方法。

参考文献

[1].Beaver W.H..Financial Ratios as Predictors of Failure.Journal of Accounting Research, 1966;4

[2].Ohlson J.A..Financial Ratios and the Probabilistic Predictionof Bankruptcy.JournalofAccountingResearch, 1980;1

上一篇:管理实施策略下一篇:探究目标论文