主成分投影法(精选4篇)
主成分投影法 篇1
0 引言
在消光法颗粒粒径测量中, 一般采用白光作为光源并配合光谱仪或其他分光元件, 通过对消光光谱的测量和反演, 得到颗粒系的粒径分布。在粒径反演过程中, 每个波长下的消光值都不同程度地包含被测颗粒系的粒径信息。如果选择波长时选用了对粒径影响小的波长, 而遗漏了重要的波长, 可能导致粒径分布反演结果不准确。较多的测量波长数目虽能提高系统的光谱分辨率, 但是波长数目越大, 数据处理的速度就越慢, 而且多波长消光数据本身包含了大量的冗余信息, 邻近波长之间的相关性要高于相距较远的波长之间的相关性。所以, 在选择波长时, 应对多波长消光数据进行降维, 即尽量选择包含对粒径影响比较显著的特征波长进行测量[1]。
主成分分析 (PCA) 作为一种多元数据统计分析的工具, 在去除相关、特征提取和数据压缩中被普遍使用。PCA的中心目的是将数据降维, 将原变量进行转换, 使少数几个新变量 (主成分) 是原变量的线性组合, 同时这些变量要尽可能多地表征原变量的数据特征而不丢失信息。经转换得到的新变量是互不相关的, 以消除众多信息共存中相互重叠的部分[2,3]。
本文提出一种在基于主成分分析的消光法特征波长的选择算法。该算法首先对一阶微分消光光谱进行主成分变换, 然后将每个波长下的一阶微分消光谱对主成分贡献率的大小作为波长选择的主要依据, 并且把光谱范围的边界波长也作为测量波长, 这样的选择方法保证了选出的光谱消光值具有较高的信息量。
1 测量原理
消光法粒径测量的基本原理是Lambert-Beer定律。当一束光强为I0, 波长为λi的平行单色光照射到厚度为L的悬浮被测颗粒时, 由于颗粒对入射光的吸收和散射作用, 穿过颗粒系透射光的光强I减弱[1]。由于实际颗粒系都是具有一定尺寸分布范围的多分散系, 在颗粒满足不相关单散射的前提下, 对于具有一定尺寸范围的多分散颗粒系则有[4,5]:
式中: (I/I0) i为第i个波长的消光值, N为颗粒系的粒子总数, Qext (λi, m, D) 为消光系数, 它表征每个颗粒对入射光的散射量, 是颗粒粒径D、波长λi, 以及相对介质折射率m的函数, 其值可由经典的米氏理论求得[6,7,8], f (D) 是粒径体积频度分布函数, 表示单位体积内直径在D和D+d (D) 范围内的粒子体积频度百分比。
消光粒径测量方法分为独立模式算法和非独立模式算法。在实际测量中, 若不知道被测颗粒系的粒径分布规律, 或者颗粒系的尺寸分布无法简单地用某个分布来描述, 这就使非独立模式下求得的结果不可靠。在已经提出的独立模式反演算法中, 由Phillips和Twomey提出的限制最小二乘算法应用最为广泛, 得到的反演结果也最为理想。所以本文在独立模式下对消光法的特征波长选择算法进行研究[9]。
2 主成分变换及特征波长的选择算法
在消光法粒径分布的反演过程中, 设对M个波长下的消光值重复进行p次测量, 记为X=[xij], xij=ln (I (λj) /I0 (λj) ) i表示对第j个波长下的消光值进行第i次测量, i=1, 2, …, p, j=1, 2, …, M。则X的均值向量n和协方差阵∑X为[2,3]
令γ1, γ2, , γM为∑X的特征根 (γ1≥γ2≥≥γM≥0) , t1, t2, , tM为相应的单位特征向量。主成分变换实际上就是一种线性变换, 形式为
式中:A是主成分变换矩阵, Y1, Y2, , YM之间互不相关, Y的分量Y1, Y2, , YM依次为X的第一, 第二, …, 第M个主成分。
在主成分变换中, 前z个主成分Y1, Y2, , Yz的累计方差贡献率为
累积方差贡献率越大, 表明通过所选的少数几个主成分解释原变量的差异的能力越强。如果选取的主成分太少, 将会丢失原始光谱较多的有用信息, 如果选取的主成分太多, 会将测量噪声过多的包括进来。实际应用中通常取Vz大于某一值 (一般取Vz≥90%) 的前z个主成分代替原来的光谱。
设δjj是∑X对角线上的值, 则主成分Yk与第j个波长下的消光值xj的相关系数为
可以得出, 能代表原始数据的z个主成分对于第j个波长的贡献率vj是xj分别与Y1, Y2, Yz相关系数的平方和, 即:
v的大小反映了该波长下有多少信息被映射到了前z个主成分中, 而主成分本身包含了原始数据的大部分信息。因此v本身也反映了该波长所包含的信息量。根据式 (4) 可以看出, 由累积方差贡献率选取的z个主成分Y1, Y2, Yz改变了光谱消光值的物理意义。为了保证原数据的物理意义, 本文采用v作为波长选择的主要依据。
3 仿真实验及数值模拟结果
图1为一已知待测颗粒系的消光光谱利用协方差矩阵∑X计算出的相关矩阵图。该待测颗粒系粒径服从 (D, k) = (6, 10) 单峰R-R分布, 颗粒物的相对复折射率m=1.33, 粒径范围限制在0.1~10µm。在可见光波段0.4~0.8µm内均匀选择51个波长作为测量波长, 每个波长下的消光值均重复测量10次, 即p=10, M=51。由于在测量过程中会不可避免地引入噪声, 这里对每个波长下的消光值都加入了±0.1%的随机噪声。图1中小方格的颜色越浅, 表示不同波长下消光值之间的相关性越强。从图1可以看出, 邻近波长的消光值之间的相关性是比较接近的, 但是这51个消光值之间相关性的区分不是很明显, 在这种情形下很难从51个波长中选择不相关的波长作为特征波长。在光谱学中, 光谱变化最明显的区域也应当对应光谱信息最丰富的区域, 所以为了更有效地选择有代表性的特征波长, 这里分别对消光光谱进行一阶微分和二阶微分处理。微分光谱既可以提供比原光谱更高的分辨率和更清晰的光谱轮廓变换, 很方便地把握原光谱的变化趋势, 也可以消除平缓背景干扰的影响。
图2为对图1所对应的颗粒系的消光光谱进行一阶微分和二阶微分处理后得到的相关矩阵图。对光谱微分一般有直接微分法和Savitzky-Golay微分法。对于分辨率高、波长采样点多的光谱, 直接微分法求取的微分光谱与实际相差不大, 但对于稀疏波长采样点的光谱, 该方法所求的微分则存有较大误差, 这时可采用Savitzky-Golay卷积微分法计算[10]。该方法既能克服直接微分法的弱点, 且微分谱不发生位移, 又可较好地保持光谱中的有用信息。所以本文采用五点二次多项式的Savitzky-Golay卷积微分法对原消光光谱进行一阶微分和二阶微分处理。从图1和图2可以看出, 一阶微分消光光谱的一些邻近波长之间的光谱相关性是非常接近的, 并且它的相关矩阵图出现了明显的分快现象, 而原始光谱和二阶微分光谱之间的光谱相关性区分却不是很明显, 一阶微分消光光谱最大可能地利用了原始光谱的有用信息, 从而强化谱带特征。因此本文将原始消光光谱先做一阶微分处理后再对其进行主成分变换。
图3为对消光光谱进行一阶微分处理后选取前9个主成分而得到的主成分对一阶微分可见消光光谱的贡献率。该待测颗粒系与图1的测定对象相同。由于在进行主成分变换之前首先要对原始消光光谱进行五点二次的Savitzky-Golay一阶微分, 一阶微分之后需要舍弃51个波长的前两个和后两个波长。从图3可以看出, 每个波长下的消光值对主成分的贡献率是不同的, 贡献率越大, 说明该波长的消光值所包含的信息越丰富。图4为采用四种不同波长选择方法得到的反演结果。该待测颗粒系与图1的测定对象相同。在独立模式下, 将0.1~10µm粒径范围划分100个等区间, 并从51个波长中选择42个作为反演波长。由于v的大小反映了该波长下有多少信息被映射到了选取的主成分中, 所以这里选择v较大的值所对应的波长作为反演波长。在图4中, (a) 表示对一阶微分消光光谱进行主成分变换后, 采用图3所示的v从大到小排序最靠前的42个波长作为测量波长进行反演得到的反演结果。 (b) 表示采用v最靠前的40个波长另外把第1个和第51个波长即测量波长的边界波长也作为选择波长进行反演。 (c) 表示从51个波长中随机任选42个波长作为测量波长进行反演, 但不包括第1个和第51个波长。 (d) 表示从51个波长中随机任选42个波长作为测量波长进行反演, 其中包括了第1个和第51个波长。从图4给出的结果不难看出采用第2种方法得到的反演结果是最好的, 而单独利用v的大小作为特征波长的选择依据是不够充分的, 还应当把光谱范围的边界波长也应作为测量波长。在光谱范围边界处选取波长, 主要是因为消光法的粒径测量范围与波长范围有着密切的关系。在0.1~10µm粒径范围内, 可见光边界波长包含有较为丰富的粒径信息。
图5为粒径服从 (D, k) = (0.5, 12) R-R分布的颗粒系在不同粒径间隔内的反演结果。待测颗粒物的相对复折射率m=1.33。将选择51个波长下的消光值加入±0.1%的随机噪声之后, 再对其一阶微分消光光谱进行主成分变换。采用v从大到小排序最靠前的40个波长作为测量波长, 另外把第1个和第51个波长即测量波长的边界波长也作为特征波长。反演算法仍然是独立模式下的限制最小二乘算法。 (a) 表示将0.1~10µm粒径范围内划分99个区间; (b) 表示将0.1~1µm粒径范围内划分90个区间; (c) 表示将0.1~10µm粒径范围内划分45个区间。从图5显示的反演结果可以看出, 对于粒径较小的颗粒系来说, 粒径间隔以及粒径区间的选取是非常重要的。所以本文采用移动反演窗的方法进行反演, 即设定两个反演窗, 一个是0.1:0.1:10, 一个是0.1:0.02:1, 每次反演时采用分别在这两个反演窗下进行反演, 取反演误差较小的粒径分布作为最终的反演结果。
图6为采用三种不同波长选择方法得到的反演结果。该待测颗粒系与图5的测定对象相同, 将选择51个的波长下的消光值加入±1%的随机噪声之后, 再对其一阶微分消光光谱进行主成分变换。 (a) 表示对一阶微分消光光谱进行主成分变换后, 采用v从大到小排序最靠前的42个波长作为测量波长进行反演得到的反演结果。 (b) 表示采用v最靠前的40个波长另外把第1个和第51个波长即测量波长的边界波长也作为选择波长进行反演。 (c) 表示从51个波长中随机任选42个波长作为测量波长进行反演, 其中包括了第1个和第51个波长。从图6给出的结果不难看出, 利用v的大小作为特征波长选择的主要依据, 并且把光谱范围的边界波长也作为测量波长, 采用这样的选择方法得到的反演结果好于单独将v的大小作为选择依据以及随机任选的波长选择方法。
图7为粒径服从双峰R-R分布的颗粒系采用不同波长选择方法得到的反演结果。粒径分布参数为 (D1, k1, D2, k2, n) = (3, 12, 7.3, 15, 0.2) , 颗粒物的相对复折射率m=1.235。粒径范围限制在0.1~10µm, 在可见光波段0.4~0.8µm内均匀选择51个波长作为测量波长, 并从其中选择42个特征波长作为反演波长。对于双峰分布的颗粒系来说, 仍然可以利用采用本文提出的基于主成分分析的特征波长的选择算法反演粒径分布。图8为单峰R-R分布的颗粒系在可见-红外波段内采用三种不同波长选择方法得到的反演结果。该待测颗粒系粒径服从 (D, k) = (5, 8) 单峰R-R分布, 颗粒物的相对复折射率m=1.33, 粒径范围限制在0.1~10µm。在可见光波段0.4~0.8µm内均匀选择51个波长作为测量波长, 并从其中选择42个特征波长作为反演波长。从图8给出的结果不难看出采用对一阶微分消光光谱进行主成分变换后, 采用v从大到小排序最靠前的42个波长作为测量波长进行反演得到的反演结果仍然是最好的。
4 结论
消光颗粒粒径分布的测量方法是通过测量多个波长下的消光值来获得待测颗粒系的粒径分布的。被测颗粒系的消光光谱包含有颗粒粒径、折射率等信息。本文在对单峰R-R分布的颗粒系在可见及可见-红外波段内的消光光谱、一阶微分以及二阶微分消光光谱进行主成分分析的基础上, 提出了一种基于主成分分析的特征波长的选择算法。该算法首先对一阶微分消光光谱进行主成分变换, 然后将每个波长下的一阶微分消光谱对主成分贡献率v的大小进行特征波长的选择, 将贡献率从大到小排序选择最靠前的波长作为特征波长, 同时把光谱范围的边界波长也作为特征波长。文中分别对单峰及双峰R-R分布的颗粒系采用独立模式下的限制最小二乘算法进行了仿真实验验证。仿真实验结果表明, 采用基于主成分分析的特征波长的选择方法得到的粒径分布反演结果优于单独将v的大小作为选择依据以及随机任选的波长选择方法。该方法较好地解决了消光法光谱消光测量中波长随机任选的问题, 因而具有很好的应用前景。
参考文献
[1]孙晓刚, 唐红, 原桂彬.颗粒系的可见消光光谱分析及最佳波长的选择[J].光谱学与光谱分析, 2008, 28 (9) :1968-1973.SUN Xiao-gang, TANG Hong, YUAN Gui-bin.Analysis of Visible Extinction Spectrum of Particle System and Selection of Optimal Wavelength[J].Spectroscopy and Spectral Analysis, 2008, 28 (9) :1968-1973.
[2]刘智深, 丁宁, 赵朝方, 等.主成分分析法在油荧光光谱波段选择中的应用[J].地理空间信息, 2009, 7 (3) :12-15.LIU Zhi-shen, DING Ning, ZHAO Chao-fang, et al.Application of the PCA Method to Band Selection for Oil Fluorescence Spectrums[J].Geospatial Information, 2009, 7 (3) :12-15.
[3]李遂贤, 廖宁放, 孙雨南.基于主成分分析的多光谱相机灵敏度优化[J].光电工程, 2006, 33 (3) :127-133.LI Sui-xian, LIAO Ning-fang, SUN Yu-nan.Optimal sensitivity of multispectral camera based on PCA[J].Opto-Electronic Engineering, 2006, 33 (3) :127-133.
[4]徐峰, 蔡小舒, 苏明旭, 等.光谱消光法测量高压湿蒸汽的研究[J].动力工程, 2009, 29 (3) :254-260.XU Feng, CAI Xiao-shu, SU Ming-xu, et al.Research on the Measurement of High Pressure Wet Steam by Spectral Light Extinction Method[J].Journal of Power Engineering, 2009, 29 (3) :254-260.
[5]Pahlow M, Müller D, Tesche M, et al.Retrieval of Aerosol Properties from Combined Multiwavelength Lidar and Sunphotometer Measurements[J].Appl.Opt (S1673-3487) , 2006, 45 (28) :7429-7442.
[6]Arias M L, Frontini G L.Particle Size Distribution Retrieval from Elastic Light Scattering Measurements by a Modified Regularization Method[J].Part.Part.Syst.Charact (S0934-0866) , 2006, 23 (5) :374-380.
[7]Bohrend C F, Huffman R.Absorption and Scattering of Light by Small Particles[M].John Wiley&Sons Inc, 1998:481.
[8]彭力, 杨冠玲, 何振江, 等.颗粒侧向大角度光散射信息获取研究[J].光电工程, 2004, 31 (9) :45-48.PENG Li, YANG Guan-ling, HE Zhen-jiang, et al.Study on acquisition of light scattering information of particles in large-angle side direction[J].Opto-Electronic Engineering, 2004, 31 (9) :45-48.
[9]Muller D, Wandinger U, Ansmann A.Microphysical Particle Parameters from Extinction and Backscatter Lidar Data by Inversion with Regularization:Theory[J].Appl.Opt (S1673-3487) , 1999, 38 (12) :2346-2357.
[10]褚小立, 袁洪福, 陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展, 2004, 16 (4) :528-542.CHU Xiao-li, YUAN Hong-fu, LU Wan-zhen.Progress and Application of Spectral Data Pretreatment and Wavelength Selection Methods in NIR Analytical Technique[J].Progress In Chemistry, 2004, 16 (4) :528-542.
主成分投影法 篇2
1 实验部分
1.1 主要仪器设备和试剂
XRF-1800X-射线荧光光谱仪, 日本岛津公司;HK-2型全自动熔融炉;高温马弗炉。
四硼酸锂;溴化锂;转炉渣标样 (GBW01704~GBW01708) ;高炉渣标样 (BH0127-2w, 512) 。
1.2 仪器测量条件
选择合适的样品, 对每个待测元素进行扫描, 确定2θ角和PHD范围, 仪器测量参数见表1。
1.3 样片制备
1.3.1 灼烧
取1 g左右样品于瓷坩埚中放入马弗炉700℃灼烧2 h, 在干燥器中冷却至室温后立即称量0.500 0 g, 待用, 同时计算出灼烧减量值。
1.3.2 熔融
称取四硼酸锂 (7.500 0±0.000 5) g, 灼烧后样品 (0.500 0±0.000 1) g和 (1.000 0±0.000 2) g硝酸钠于铂黄坩埚中, 搅匀, 加入饱和溴化锂溶液6滴, 置于 (1 100±50) ℃熔融炉中静置2 min, 倾动5 min, 倾动加摇转8 min, 程序结束后取出冷却, 制得玻璃片, 检查待测面无气泡后贴上标签。
2 结果与讨论
2.1 样品的灼烧
连铸保护渣试样中含有碳粉等单质, 对样品进行灼烧预处理可以避免腐蚀坩埚, 同时计算出灼烧减量值用于工作曲线上的烧失量校正。
称取1 g左右试样于已恒重的瓷坩埚中, 放入不同温度的马弗炉中灼烧1~2 h。结果表明, 温度过低样品易灼烧不全;温度过高样品易发生结块或熔化, 因此本法采用700℃作为灼烧温度, 灼烧时间为2 h。
选取了12个标准样品 (其中TG1~TG5为连铸保护渣内控样) , 每个样品测定2次的结果不超差则取其平均值, 结果见表2。
2.2 熔融条件的选择
2.2.1 熔剂和稀释比的选择
本试验采用无水四硼酸锂作为熔剂, 制得的玻璃熔片光滑均匀且不易潮解。
X射线荧光光谱法常规稀释比为1∶10, 加大稀释比可以降低元素间吸收增强效应[5], 本试验稀释比采用1∶15。
2.2.2 熔融温度和时间的选择
熔融温度较高时, 熔融体流动性更好, 容易形成光滑均一的熔片。由于待测成分中没有易挥发元素, 因此本试验采用熔融温度1 100℃。
熔融时间过短熔融体来不及混匀, 会造成熔片重复性差;熔融时间过长对熔片质量也无益处, 经过试验, 采用熔融时间为15 min, 其中静置2 min, 倾动5 min, 倾动加摇转8 min。
2.3 建立工作曲线
注:曲线值=标准值/ (1-L.O.I%)
按1.3样品制备的方法把各标准样品熔成玻璃片, 测量各元素强度后建立工作曲线, 曲线值由标准值经过灼减值换算得到, 回归方程及相关系数见表3。
2.4 精密度试验
同一试样熔制10片玻璃片, 分别进行测定, 结果见表4。
2.5 准确度试验
本试验选择了3个具有化学值的样品作为未知样品进行测定, 对比结果见表5。从表5可见, 本法测量值与化学值基本吻合, 符合常规检测生产要求。
3 结论
(1) 连铸保护渣试样中含有碳粉等单质, 对样品进行灼烧预处理可以避免腐蚀坩埚, 同时计算出灼烧减量值用于工作曲线上的烧失量校正。
(2) 确立了熔融条件:熔融温度1 100℃, 熔融时间15 min (静置2 min, 倾动5 min, 倾动加摇转8 min) , 熔片质量满足样片制备重复性要求。
(3) 本法相较传统化学方法而言, 可同时测定多种元素, 方法快速、高效、重现性好, 可以应用于常规分析检测。
参考文献
主成分投影法 篇3
科技型中小企业是以科技人员为主体, 以追求创新为核心, 以实现科技成果商品化为主要内容, 以市场为导向, 实行自筹资金、自主经营、自负盈亏、自我发展、自我约束的知识密集型企业。科技型中小企业在社会经济飞速发展的历程中扮演的重要角色逐渐凸现, 其经济贡献水平逐年攀升, 己成为许多国家和地区经济增长和科技进步的重要支撑[1]。在中国的大地上活跃着许许多多活力四射的中小企业, 其中尤以中小型高科技企业为代表, 他们的生存是生产社会化与专业化在当代条件下的一种基本表现形式, 是现代分工协作体系的重要内容, 是大企业正常运行所不可缺少的基础, 已经成为中国经济中最活跃的分子, 为中国的经济发展、技术革新等贡献了巨大的力量。但是当前我国科技型中小企业的成长状况却令人堪忧, 由于自身实力、发展的稳定性和抗风险能力等方面的缺陷, 科技型中小企业的成长充满困难和艰辛, 成长性成为一个带有普遍性的问题, 而采用何种方法对科技型中小企业的成长性进行评价又是此类研究的重要内容。目前, 国内外学者对科技型中小企业成长性的研究主要集中在如何建立评价指标和采用何种方法进行评价两个方面[2]。本文采用主成份投影法, 建立一套评价科技型中小企业成长性的指标体系, 并以大连市科技型中小企业为例进行分析, 从而为预测科技型中小企业的成长性提供参考。
2 主成分投影法的基本原理
主成分投影法是在主成分分析的基础上经过改进的一种新的多指标决策和评价方法。该方法经无量纲化和适当加权处理后, 通过正交变换把原有的m个指标转换成彼此正交的m个综合指标, 在没有损失信息量这一前提下解决了指标间的信息重叠问题, 然后利用各主成分设计一个理想决策对象, 以n个评价对象相应的评价向量在该理想决策对象方向上的投影作为一维的综合评价指标, 并根据投影值的结果排序。这种方法的缺点是只能对计算结果进行排序, 了解所评价对象的前后顺序, 而无法确定所评价对象的等级, 即只能确定评价对象的相对位置。
主成分投影法只能确定评价对象的相对位置, 但是排在前面的评价对象不一定就能满足决策者的要求, 排在后面的对象也不一定就意味着很差, 所以仅仅知道所评价对象排列的前后顺序是不够的, 它无法包括决策者所需要的一些绝对信息, 从而无法进行科学的决策和精确的判断。为了解决这个问题, 这里采用经过改进的主成分投影法。
不同于传统的主成分投影法, 改进的主成分投影法所构造的被评价区域由被评价对象和评价标准两部分组成。设被评价区域有n-k个被评价对象 (或决策对象) , 评价标准分为k-1个等级, 这k-1个等级有k个区间端值点, 则同一指标下不同等级的标准区间端值点构成k个新评价对象, 得到原始的被评价数据矩阵X= (Xij) n×m;在经过主成分投影法计算后, 得到n个投影值, 其中, 前n-k个投影值为原有评价对象投影值, 后k个评价对象为新评价对象的投影值, 这k个投影值可以构成k-1个投影区间, 原有评价对象的投影值会落在这k-1个投影区间的某个区间内, 落在哪个区间内就表示原有评价对象处于该区间所对应的状态等级。
3 基于主成份投影法的科技型中小企业评价模型建立及应用
(1) 确定评价矩阵
按照上述构造被评价区域的方法确定评价矩阵。设有n个被评价对象, 每个评价对象有m个指标描述, 则得到评价矩阵为:
undefined
这里我们选择了b1企业近三年平均销售收入增长率、b2企业近五年平均雇员增长率、b3企业近三年平均净利润增长率及上述三个指标与产业内平均水平相比状况b4、b5和b6, 共有m=6个指标。
(2) 数据标准化处理
对于一个已知决策矩阵的多指标决策问题, 由于指标的量纲不同、指标间数量级存在太大的差异带来不可比性, 因此运用改进的主成份投影法进行综合评价之前应消除指标间量纲和数量级的差异, 即对评价矩阵X进行标准化处理, 得到标准化评价矩阵Y= (yij) n×m, yij∈[0, 1], 标准化后所有指标都以越大越好为取向。因评价指标类型不同, 方法也有所不同, 本论文采用以下方法对评价矩阵的指标数据值进行归一化处理:
undefined
(3) 确定指标权重, 建立赋权决策矩阵
指标权重的确定有主观、客观和组合赋权等方法, 本节利用层次分析法来确定各指标权重 , 然后根据确定的权重对标准化矩阵进行加权处理。令得到赋zij= ωij×xij权决策矩阵Z= (zij) n×m矩阵Z的行向量与评价对象相对应, 矩阵Z的列向量则对应于赋权指标。
层次分析法确定权重的步骤为:首先, 根据评价指标的特点建立起递阶层次结构, b1、b2与b3对应的上层指标用B1表示, b4、b5与b6对应的上层指标用B2表示;然后构建两两比较判断矩阵。目标层次结构建立后, 上下层次指标间的隶属关系就被确定了, 对同一层次指标根据9阶标度 (其含义见表1) 进行两两比较, 可得到两两比较判断矩阵A={aij}, 其中的值应满足下列条件:
undefined
其结果如下:
undefined
最后, 确定权重为undefined, 其中undefined, 其结果为:
WB1, B2= (ωB, ωB) = (0.667, 0.333) ;
Wb1, b2, b3=Wb4, b5, b6= (ωb1, ωb2, ωb3) = (ωb4, ωb5ωb6) = (0.315, 0.236, 0.449) ;
Wb1, b2, b3, b4, b5, b6= (ωB1ωb1, ωB1ωb2, ωB1ωb3, ωB2ωb4, ωB2ωb5, ωB2ωb6) = (0.210, 0.157, 0.299, 0.106, 0.079, 0.149)
判断矩阵的一致性比率undefined, 满足一致性要求, 其中判断矩阵的最大特征值undefined。
(4) 指标的正交变换
由于评价指标较多, 指标间的相关联系会造成评价信息相互重叠, 干扰了各指标相对重要位置的确定, 通过对指标值进行正交变换, 可以过滤掉指标间的重复信息。令W=Z′Z, 用Matlab计算出矩阵W的特征值λ1≥λ2≥…≥λn , 对应的单位特征向量为a1, a2, …, an, 记作A= (a1, a2, …, an) , 令U=ZA, 则得到正交决策矩阵U= (uij) n×m, 各决策向量为U= (u1, u2 , …, un ) 。
根据矩阵正交变换的性质可知, 新的m个综合指标两两正交, 消除了指标间信息重叠的问题。由于每一个评价向量在正交变换前后保持相同的元素个数, 转换后的新指标保留了旧指标原有的全部信息, 而且这样的变换可逆。此时综合评价矩阵U的行向量对应一个评价对象, 列向量则代表由m个无量纲化加权指标线性组合而成的一个新综合指标。
(5) 构造理想决策对象及其投影值计算
将每个决策对象视为一个m维向量, 构造理想决策对象d*= (d1, d2, …, dm) , 其中undefined, 将d*单位化计算得:
undefined
d*0为理想决策对象, 计算各评价向量在理想决策对象上的投影值:
undefined
(6) 投影值排序及确定等级
由上式计算的投影值的大小可判断各评价对象与理想对象之间的接近程度, 投影值0≤Di≤1且Di值越大越好, 愈大表示评价对象undefined愈好。以各评价对象的投影值Di为n个评价对象的综合评价值, 且根据值越大越好的原则, 可得到最终的评价排序结果。后k个新评价对象也有k个投影结果, 即评价标准区间的端点值也有投影值, 这k个投影值构成k-1个区间段, 每个区间段对应一种评价标准等级状态;而且n-k个评价对象的投影值必定落在这k-1个区间内, 即评价对象的投影值落在评价标准区间端点值的投影值区间段内, 落在哪个区间段内表明评价对象处于对应的状态。
4 大连市科技型中小企业成长性评价的实证分析
4.1 样本调查设计与分析
在确定研究样本时, 主要根据以下两项原则进行考虑:一是样本的代表性, 力求在一定程度上符合分层抽样的原理, 从而尽可能地反映整体情况;二是结果的真实性, 在进行样本调查时采用访问调查和问卷调查结合的调查方法。
为保证调查的质量, 我们采用了如下措施:一是为了确保信息质量, 要求应答人必须是企业的中高级管理和技术人员;二是在发放调查问卷之前事先取得相应主管单位的支持, 而问卷的发放也基本上是在企业主管单位的支持配合下进行的;三是由专人访问样本企业并负责问卷的发放和回收, 通过与应答人启发性的交谈来收集较为全面的信息。
4.1.1 数据的来源与数据结构描述
本次研究的全部数据来自于对企业的问卷调查。本次调查问卷的发放集中在大连地区, 问卷的填写人是企业的负责人或是对企业情况非常了解的高层管理人员。本次调查共发放调查问卷167份, 收回有效问卷112份, 收回率67.1%。本次调查所选企业基本符合研究的需要。
通过对本次回收的112份样本数据进行分析, 得到企业的所有制情况:集体企业占样本数据的2.66%;私营企业占样本数据的50.67%;股份有限公司占样本数据的5.33%;有限责任公司占样本数据的21.33%;股份合作制企业占样本数据的1.33%;外资企业占样本数据的5.33%;合资企业占样本数据的10.67%;其他占样本数据的2.67%。企业类型情况:生产型企业占样本数据的24%;贸易型企业占样本数据的20%;咨询、服务型企业占样本数据的29.33%;金融投资企业占样本数据的1.33%;外包服务提供商企业占样本数据的5.33%;其他类型企业占样本数据的14.67%;其他占样本数的5.33%。
4.1.2 科技型中小企业成长绩效的信度和效度分析
在进行数据分析之前, 为了检验企业成长要素数据的可靠性和有效性, 需要对数据进行信度检验。在李克特态度量表中通常采用的信度检验方法是Cronbath α (一致性系数, 是应用最广的信度指标, 其值越大信度越高) 系数法。这种方法主要是检验量表的内在信度, 测量构成量表的各个成长要素的内在一致性程度。通过用α系数法对企业成长绩效6个方面的数据进行分析后得出a值为0.910, 反映出问卷结果的内部一致性系数很高, 各变量所得到的结果具有一致性或稳定性。关于企业成长绩效的总体相关系数参见表2。
4.2 实证分析过程及结论
在大样本调研之前, 我们在大连高新园区随机选取了20家科技型中小企业进行访谈和预调研, 表3列出了基于主成份投影法的20个实地调研的科技型中小企业成长性评价结果。根据对112家调研企业的评价结果, 本文对科技型中小企业的成长性评价结果进行统计, 统计结果见表4。
企业成长是使得企业资源得以增值的过程, 就单个企业而言, 成长几乎总是与规模的扩大以及相应复杂性的提高相伴。根据企业成长性评价结论, 我们认为得分在0.6—1.0之间的企业为快速成长型企业, 得分在0.0—0.4之间的企业为衰退型企业。
本文运用主成份投影法对科技型中小企业的成长性做出了评价, 该评价方法及模型体系除了能为综合评价的理论和方法提供一种新的、有效的分析工具之外, 还将具有以下几方面的实用价值: (1) 政府职能部门可以据此对科技型中小企业的发展状况作出整体判断, 制定有针对性的促进科技型中小企业发展的方针、政策和措施, 促进科技型中小企业持续、快速、健康地发展。 (2) 科技型中小企业可以据此全面了解其他科技型中小企业发展的总体态势, 判断本企业在本行业中的业绩水平, 进一步分析企业的成长源和潜力点, 有助于企业明确并强化成长管理的具体方向。
参考文献
[1]林莉.基于知识联盟的高技术企业成长机制与策略[J].科技管理研究, 2007 (12) :27-32.
[2]LAURENCE G WEINZIMMER, PAUL C NYSTROM, SARAH JFREEMAN.Measuring organizational growth:issues, consequencesand guidelines[J].Journal of Management, 1998, 24 (2) :235-262
[3]李明远.多指标决策与评价的新方法——主成份投影法[J].数理统计与管理, 2000, 20 (5) :45-48.
主成分投影法 篇4
农业是国民经济的“母体产业”,是整个国民经济的基础,关系着国家,社会经济和政治的稳定。近几年来农民、农村、农业的问题越来越突出,“三农”问题已经作为国务院工作的重中之重。农业上市公司作为我国现阶段先进农业生产力的企业组织,它不仅能够为农业经济的发展提供人才、资金、技术、市场和管理制度,而且可以发挥支柱企业和龙头企业的带头作用,带来制度创新和技术创新,促进农业生产的深加工,提高整个农业的产业化及组织化水平。然而目前,我国农业上市公司资本结构中存在着大量问题:资产负债率水平普遍较低;融资结构失衡,内源融资比例偏小;债务结构不合理,长期负债比例偏小;股权集中程度较高。这些问题导致我国农业上市公司经营业绩不佳,发展劲头不足。因此,本文针对农业上市公司资本结构的现状,借鉴西方资本结构理论和国内外学者的研究成果,对农业上市公司资本结构的影响因素进行实证分析,希望为我国农业上市公司资本结构优化提供经验证据和理论支持,对农业上市公司的持续、健康发展有所裨益。
二、研究设计
(一)样本选取与数据来源为了保证研究结果的有效性,在样本选取上,本文遵循以下原则:(1)选择2009年12月31日之前上市的农业上市公司。新上市公司财务表现可能不太稳定,会影响研究结论的准确性,故选择上市时间较长的公司。(2)选择只发行A股的农业上市公司。本文研究的重点在于A股市场,故为了免受B股市场的影响剔除发行B股和同时发行A、B股的公司。(3)剔除ST、PT类农业上市公司。此类公司的财务状况或者处于异常情况,或者连续两年以上处于亏损状态,如果将其纳入样本会对结论的可靠性和有效性产生影响。根据以上原则,经过筛选,共有24家农业上市公司符合要求(见表1),在时间跨度上,以样本公司2010年至2012年的数据为基础进行分析。本文所需原始数据来自于巨潮资讯网和证券之星网所公开披露的各样本公司2010年至2012年的财务报告,数据分析使用EXCEL和SPSS17.0软件。
(二)变量选择本文采用资产负债率、流动资产负债率和长期资产负债率作为被解释变量对资本结构进行度量。对于解释变量,主要选择具有代表性的,对资本结构可能产生影响的微观因素,包括公司规模、盈利能力、企业成长性、非债务税盾、资产担保价值、资产结构、股权结构、偿债债能能力力和和所所得得税税率率等等99类类共共1177个个指标。涉及的变量及其说明如表2所示。
(三)模型构建第一步,对影响农业上市公司资本结构的解释变量利用主成分分析法提取若干无关的主成分。主成分分析法是利用降维的思想,将多个指标转化为少数几个不相关的综合指标,其中每个主成分都是原始变量的线性组合,这些主成分能够反映原始变量的绝大部分信息,且所含的信息互不重叠;第二步,对提取的若干主成分进行多元线性回归,分析哪些因素对农业上市公司的资本结构会产生影响。
其中Gi(i=l,2,…,k)为主成分因子,k为选取的主成分个数,视主成分分析结果而定,ε为随机误差项。
三、实证结果与分析
(一)主成分分析主成分分析法适用于原有变量之间具有较强的相关性,因此需要对原有变量做相关分析。本文采用KMO检验和Bartlett检验,KMO值越接近于1,意味着变量间的相关性越强,KMO值越接近于0,意味着变量间的相关性越弱,KMO>0.9时效果最佳,KMO<0.5时不宜做主成分分析;如果Bartlett检验统计值较大,且其对应的相伴概率值小于0.05的显著性水平,那么应该拒绝零假设,即原始变量之间存在相关性,适合做主成分分析。检验结果显示,KMO值为0.656大于0.5,且巴特利特值为1298.248,相伴概率p的显著性水平为0.000小于0.05,因此可以使用主成分分析法。
选取主成分时,特征值的大小说明所选主成分对原始变量的说明程度,如果特征值小于1意味着所选主成分对原始变量的解释程度还不如直接引入原始变量的解释程度大,因此,用特征值大于1的标准选取主成分。从表3可以看出,特征值大于1的主成分有6个,即这6个主成分代表了全部原始变量80.276%的方差, 提供了原始指标数据所传递的基本信息。
数据来源:样本数据运用 SPSS17.0 分析软件计算而得(下同)
根据旋转后的主成分矩阵(见表4),可以看出:
因子1:在总资产收益率、每股收益、净资产收益率和主营业务收益率的负荷量大于其他指标,这四个指标代表企业的盈利能力,将其定义为盈利能力因子(G1)。
因子2:在流动比率和速动比率的负荷量大于其他指标,这两个指标反映的是企业的偿债能力,将其定义为偿债能力因子(G2)。
因子3:在折旧资产比上有最大载荷,这个指标反映的是企业的非负债税盾,将其定义为税盾因子(G3)。
因子4;在LN总资产和LN主营业务收入的负荷量大于其他指标,这两个指标反映了公司规模的大小,将其定义为规模因子(G4)。
因子5:在流通股比重和第一股东持股比例的负荷量大于其他指标,这两个指标反映企业的股权结构,将其定义为股权结构因子(G5)。
因子6:在所得税率上有最大载荷,将其定义为所得税率因子(G6)。
(二)多元回归分析通过主成分分析得到的主成分矩阵作为新的解释变量,分别对农业上市公司的资产负债率、流动资产负债率和长期资产负债率进行多元线性回归。用SPSS17.0软件回归分析结果如表5所示。
表5是对被解释变量Y1、Y2、Y3和所有解释变量G1、G2、G3、G4、G5、G6之间的整体相关性的检验,用F值来衡量。可以看出资产负债率和流动资产负债率的F值分别为19.466和18.139,Sig均为0.000远小于0.05 (即95%的置信水平),二者都通过了回归方程的显著性检验;然而长期资产负债率的F值为1.384,Sig为0.234远大于0.05,即说明因变量与自变量间的整体相关性不显著,未通过检验。
表6主要显示Y1方程的回归结果,从t值和t值的显著程度Sig值可以判断出G1、G2、G3、G4、G5均通过了90%的显著性检验,常数项和G6未通过检验,将常数项和G6直接删去,所以回归方程表达式为:
Y1=-21.909G1-15.460G2-30.875G3+4.815G4-11.317G5
表7主要显示Y2方程的回归结果,从t值和t值的显著程度Sig值可以判断出G1、G2、G3、G4、G5均通过了90%的显著性检验,常数项和G6未通过检验,将常数项和G6直接删去,所以回归方程表达式为:
(三)研究结论根据回归结果,可以得出如下结论:
(1)盈利能力因子与资产负债率和流动资产负债率呈负相关,且效果显著。这一结果与优序融资理论相吻合。可以理解为由于盈利能力强的公司具有较强的内源融资能力,进而更容易获得权益性融资,因此负债率较低;相反,盈利能力差的公司自身的留存收益较少且较难获得股权融资的机会,因此只能依靠负债解决资金问题。
(2)偿债能力因子与资产负债率和流动资产负债率呈负相关关系,且效果显著。因为变现能力强的公司一般都能够在短时间内满足企业生产运营的资金需求,且债权融资存在一定的风险,故变现能力强的公司会在资金需求得到满足的情况下,尽可能的减少财务杠杆的使用,同时规避了财务风险;反过来,变现能力差的公司自身资金难以满足扩大生产的需求,股权融资的资金成本又高,因此只能依靠负债筹资。
(3)税盾因子与资产负债率和流动资产负债率呈负相关。这是因为折旧可以减少税前利润,具有抵税作用,若农业上市公司选择债务融资只是出于负债利息抵税效应的考虑,那么折旧可以代替负债发挥抵税作用,从而降低企业的负债率。
(4)规模因子与资产负债率和流动资产负债率存在正相关关系。这与众多学者的研究结果一致。第一,大规模企业倾向于实施多元化战略,分散经营风险,增强企业的发展与稳定性;第二,由于具有良好的发展前景和信誉,使得大公司能够较容易的获得较低成本的债务融资。对于农业上市公司而言,由于行业受季节变化影响较大,农业旺季时往往需要大量资金周转,大规模企业更是如此,因此当企业内部融资有限时就需要举借外债。
(5)股权结构因子与资产负债率和流动资产负债率呈负相关。具体地说就是流通股比重越高,第一股东持股比例越高,企业的负债率就越低。由于流通股比例越高,并购机制的作用就能够越有效的发挥,而且第一股东持股比例越高,就会更注重公司长远发展所带来的股息收入,因此负债率就越低。
(6)所得税率因子与资产负债率和流动资产负债率的关系均不显著。这可能是因为我国农业上市公司享受国家税收优惠政策,实际所得税率远远低于税法所规定25%的比例,减免了应交的各种税负后,负债的节税收益太少,导致节税收益远少于负债的破产成本,企业已经不看重负债的节税收益,而是更注重负债所带来的破产成本和破产风险。
(7)长期资产负债率未能通过回归方程的显著性检验,即所有变量均不能解释长期资产负债率的大小。这是因为我国农业上市公司长期贷款批准手续较为复杂,导致长期贷款难以获得,因此长期以来农业上市公司中流动负债比例较高,长期负债比率较低,一些原本影响长期资产负债率的因素可以忽略;另外,我国债券市场机制还不太完善,债券对资本结构的影响也不稳定。
四、结论
不同行业资本结构的影响因素是不同的,对农业上市公司而言,影响资本结构的主要因素为:盈利能力、偿债能力、非负债税盾、公司规模和股权结构。因此,农业上市公司可以从以下几方面实现资本结构的优化:第一,保持适度的负债率,使企业获得所得税的抵减和财务杠杆收益;第二,提高企业的盈利水平,增加企业的自我积累,加强抵御风险的能力,这就需要依靠农业科技,增强品牌优势,扩大市场占有率;第三,优化债务内部结构,合理安排短期、中期和长期债务,以满足生产经营中对资金不同时期的需要和避免由于各类负债出现集中还款而导致财务风险的发生;第四,完善公司治理结构,强化管理层的股权融资成本意识和债务融资的财务杠杆;第五,实现融资工具的多元化,发展企业债券融资方式和利率互换、期权等新型融资方式,增强企业多渠道、多元化的融资能力,从根本上优化企业资本结构。
摘要:本文以沪深两市农业上市公司为研究对象,运用主成分分析法与多元线性回归法对农业上市公司资本结构的影响因素进行实证分析。结果表明:农业上市公司的盈利能力、偿债能力、非负债税盾、规模和股权结构对资本结构具有显著影响,而所得税率对资本结构的影响不显著。继而对研究结果形成机理进行详细分析,提出农业上市公司要从保持适度的负债率、提高盈利水平、优化债务内部结构、完善公司治理结构和实现融资工具的多元化等方面优化资本结构的对策。