判别模型

2024-09-15

判别模型（精选8篇）

判别模型篇1

1 引言

动作分类主要有两大方法, 一类是利用判别模型 (discriminative models) 进行分类, 例如采用支持向量机等方法, 另一类是基于生成模型 (generative models) 进行分类, 例如采用主题模型或隐马尔科夫模型进行分类。作为一种典型的生成模型, 主题模型在计算机视觉领域, 特别是物体识别和分类领域得到成功的运用, 很多研究者结合词袋模型的框架, 利用生成模型来进行动作识别。

这些方法利用主题模型进行分类, 动作的类别直接对应于主题标记。原则上来讲, 判别模型在训练和分类方面, 性能比生成模型好。但是, 生成模型能够提供更多有用的信息, 它能够在视觉特征与模型中的隐变量之间建立直接的联系, 从而能够处理数据丢失以及非监督学习等问题。有一些研究者试图将判别模型和生成模型结合起来进行物体识别。在文献中判别模型和生成模型采用ad-hoc的方式进行结合。在文献中, 作者在生成模型的基础上进行判别模型的学习, 其中背景的后验概率被认为是一个常量。

本文提出了一种新的生成/判别混合模型来进行动作识别。该方案利用Fisher核的方法, 通过主题模型LDA建立训练样本的Fisher核表示, 然后利用核函数训练判别模型进行动作分类。

2 生成/判别混合模型的动作识别

2.1 动作表示

本文仍采用轨迹特征和时空点特征进行动作表示。利用显著点得到动作运动模式的轨迹, 然后对这些运动轨迹提取一些描述子来表示轨迹。这些轨迹反映了动作在较长时间段的信息。同时本文利用了时空兴趣点的方法来捕捉局部运动信息。针对轨迹特征, 提取了三种不同的描述子, 一是用SIFT点的平均特征表示的轨迹点之间的信息, 二是用轨迹的方向和幅值表示的轨迹运动特征, 三是利用傅里叶描述子进行表示的轨迹形状特征。针对时空兴趣点特征, 则采用了3D-SIFT描述子进行表示。在生成/判别混合模型中, 将让这两种特征进行整合, 从而训练一个分类器。轨迹特征能够反映全局的运动信息, 而时空点特征能够反映局部运动信息, 将这两种特征进行组合, 能够有效的提高动作表示的可判别性。

2.2 核方法

对于监督学习的问题, 例如回归或是分类问题, 核方法已经被证明是非常有效的一类方法。本文选择SVM作为基于核的分类器。构建一个有效核的方法是定义一组特征, 然后定义一个核矩阵K (x i, xj) =φT (xi) (xj) 。在这样的判别模型下, 生成模型可以通过定义这些特征来与判别模型进行整合。也就是说, 可以利用生成模型定义核函数, 然后在判别方法中利用这个核。

本文利用LDA模型作为训练Fisher分值的生成模型。原则上, 任意形式的可以进行利用求导进行推断的主题模型均可以利用Fisher核方法计算Fisher分值。本文采用LDA模型作为选定的生成模型。

为了训练一个SVM分类器, 需要计算LDA的Fisher分值。针对LDA模型, 可以利用变分推断的算法计算偏导数变分推断的基本思想是将p (θ, z, w|α, β) 用一个可以进行因式分解的变分概率分布q (θ, z) 来表示, 其中

偏导数实际上可以由变分EM算法计算得到。在完整的贝叶斯形式的LDA生成模型中, Fisher分值的长度为k+V。本文利用完整的贝叶斯LDA作为生成模型来训练SVM。

假定有一组M (j=1, 2, ..., M) 个视频序列, 这些序列由大小为V的词典中的单词构成。每一个视频dj可以表示成Nj个时空单词构成的向量w= (w1, w2, ..., w Nj) , 生成/判别混合模型的训练过程如下:

(1) 计算主题模型的Fisher分值, 这些导数可以从变分EM收敛的结果中得到。这个过程可以看做是生成模型的特征训练过程。

(2) 利用Fisher核方法训练一个基于RBF核的SVM分类器, RBF核的形式如下:

尽管LDA是一个简单的模型, 但它可以很容易的进行扩展。因此, 将那些扩展的生成模型与判别模型进行整合也可以得到新的混合模型。这篇文章提出的构建Fisher分值的方法为那些利用变分方法求解的主题模型与判别模型的组合提供了一种可行的参考。需要强调的是, 基于生成模型来构建核的Fisher核方法, 仅适用于可以利用变分方法求解的主题模型, 那些利用随机方法 (采样) 求解的主题模型并不能很容易的计算出Fisher分值。

3 实验结果与分析

本文在KTH数据库上进行了测试。对KTH数据, 将25个人完成的视频序列分成训练集、验证集和测试集, 其中8个人的动作视频用来进行训练, 另外8个人的视频序列作为验证集进行分类器参数的选择, 其余9个人的视频序列用于测试。混淆矩阵:图1给出了在数据库上的混淆矩阵。可以看出本方法具有较好的识别效果。

由于本文采用基于码书的特征来进行动作表示, 码书的大小影响对识别率有一定的影响。由于主题可以表示每个动作的语义信息, 主题的个数对识别率也有影响。随着参数个数的增加, 识别率成上升趋势。此外, 仅仅使用主题参数的Fisher分值得到的识别率较高, 而使用码书参数得到的Fisher分值较低。这主要是由于每段视频的Fisher分值之间差异不大, 不能有效反映动作类别之间的差异。

4 小结

本文提出了一个新的生成/判别模型来进行动作识别, 这个混合模型首先采用Fisher核的方法, 利用主题模型得到特征的一种映射表示, 然后利用这种映射表示, 实现对SVM的训练。这个混合模型有效的保持了生成模型的优点, 同时提高了判别模型的分类性能。

摘要：生成模型能够处理丢失的数据, 而判别模型一般具有较好的分类性能。本文提出了一种新的生成/判别混合模型来进行动作识别。该方案利用Fisher核的方法, 通过主题模型LDA建立训练样本的Fisher核表示, 然后利用核函数训练判别模型进行动作分类。

关键词：生成模型,判别模型,混合模型,主题模型,Fisher核

参考文献

[1]Holub, A.P., P., A discriminative framework for modelling object classes, in IEEE Conference on Computer Vision and Pattern Recognition, C.Schmid, S.Soatto, and C.Tomasi, Editors.2005, Ieee Computer Soc:Los Alamitos.p.664-671.

[2]Bar-Hillel, A.H., T.Weinshall, D., Object class recognition by boosting a part-based model, in 2005IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Vol 1, Proceedings, C.Schmid, S.Soatto, and C.Tomasi, Editors.2005, Ieee Computer Soc:Los Alamitos.p.702-709.

[3]Blei, D.M.N., A.Y.Jordan, M.I., Latent Dirichlet allocation.Journal of Machine Learning Research, 2003.3 (4-5) :p.993-1022.

[4]Holub, A.D.W., M.Perona, P., Combining generative models and Fisher kernels for object recognition.IEEE International Conference on Computer Vision, 2005.143 (1) :p.136-43

[5]Schuldt, C.L., I.Caputo, B., Recognizing human actions:A local SVM approach, in Proceedings of the International Conference on Pattern Recognition, Vol 3, J.P.M.N.M.Kittler, Editor 2004.p.32-36.

判别模型篇2

关键词：建立模型；科学选材；综合评价

伴随着人类社会的发展和科技的飞速进步，“决策科学”已成为一门独立的、重要的学科并迅速渗透到各个学科领域。随着高校体育的发展，竞争日趋激烈，运动员选材工作也引起教练员的高度重视，要搞好体育决策，首先要做好有关的科学预测，以克服盲目性，提高预见性。选拔具有一定竞技水平的专项运动员，往往要从一系列指标中综合评价每位运动员，在此过程当中涉及到诸多方面的因素且互相制约，对这类复杂的判别，我们常常凭经验判断运动员的能力，这带有很大片面性。本文运用体育多级多类判别方法，对我院田径队新入选的队员实施系统的科学的体育决策，划分她们该进入跑、跳、投那个专项组进行训练并参加比赛。

一、研究对象与方法

1.研究对象。我院田径集训队同时入队的2009级何琼、张春晖、刘新美、何伟哲4名女运动员。

2.研究方法：①测试指标的确定。通过对有关文献的查阅和征询有关专家、教授的意见，确定4大类测试项目，7项指标。分别为：跑、跳、投及其他四类；七项指标为：50米、800米、跳高、铅球、步频、立定跳远、握力。②测试时间。2009年10月~2009年12月在我院体育中心田径场地进行多次测试。2010年3月前进行统一测验。③数据处理。记录测试数据，采用体育预测判别方法，在“多级多类判别计算表”上实现。

3.测试仪器。金雀秒表、皮尺、跳高设备、铅球（4公斤）、标枪（600克）

二、研究结果与分析

1.相关分析。运用多类多级判别（频率指数）换算表进行换算。①建立判别模型。选择我院建工系2009级60名女学生进行“选材”测试，建立多级多类判别计算表。

②组织实施。选择我院建工系2009级1、2、3班中的60名女学生分成跑、跳、投三组，每组20人，地点在我院田径中心场地；先测试有关项目，按7项指标进行测试，算出平均值X与标准差S（以时间记录成绩的S为0.1；以长度记录成绩的S为0.2，将计算结果带入多级多类判别计算表）。例：测得60名女学生的立定跳远的平均成绩（X）为1.65米；指数分三档：立定跳远：平均成绩1.65米，标准差0.2，计算结果为上1.85米以上，中1.45~1.85米，下1.45米以下。计算“Z”值；将我院田径集训队2009级的何琼、张春晖、刘新美、何伟哲测试成绩，在（表2）纵向列出并对照表1，计算“Z”值。“Z”值大者实际判别为那一组。

经过计算：何琼因为投掷组Z值大，所以何琼应入投掷组。张春晖因为跳组Z值大，所以张春晖应入跳组。刘新美因为跑组Z值大，所以刘新美应入跑组。何伟哲因为跑组Z值大，所以何伟哲应入跑组。

2.多级多类判别表分析。①经过第十七届河北省大学生运动会检验后，从赛后成绩来看，表明所建立的判别模型表，具有显著的意义。②7项测试指标与竞技能力有较高水平的相关。

3.效果检验按多级多类判别表实际判别给四名女运动员进行分组评价，并会同我院体育代表队将本判别表进行验证。赛后成绩表明，其判别结果大体相同。

三、讨论

1.7项评价指标与竞技成绩均成正相关。而且他们之间的关系也是较为密切的，因此在统计中显示出高度相关。

2.通过多级多类判别表的建立，确定了7项指标各自测试成绩，即可推算出与之相适应的竞技成绩积分（Z值）。

对于普通高校的大学生运动员选拔，运用体育的选材方法，来确定其测试指标与权重，建立多极多类判别标准，并将他们用于实践，使之逐步得到完善。

参考文献：

[1]钟添发，田麦久，王路德，等.运动员竞技能力模型与选材标准[M].北京：人民体育出版社，1994.

岩爆预测的距离判别模型及应用篇3

岩爆是岩体具有高地应力的一种表现形式,是岩体地下工程建设中关注的重要工程地质问题之一。岩爆已成为深部采矿工程和岩石工程中迫切需要解决的难题[1,2,3,4]。水利水电、公路隧道、矿山等岩体工程向深部高应力区发展,引发的岩爆越来越频繁[5]。近年来,国内外学者在岩爆预测方面做了大量的研究工作[6,7,8],一些先进的数学方法成功引入到岩爆预测中,取得了一定的研究成果,如王元汉等人[9]采用模糊综合评判来预测岩爆的等级;冯夏庭[10]、杨涛等人[11]、陈海军等人[12]引入自适应模式识别方法,采用人工神经网络预测岩爆;杨莹春等[13]利用物元模型预测岩爆;杨健、武雄[14]采用系统决策和模糊数学相结合的层次分析—模糊综合评价法对岩爆预测。

判别分析方法是一种根据已有观测样本的若干数量特征(判别因子)对新获得的样本进行识别,判断其属性的预测预报分析方法。本文借鉴判别分析方法的思想,选取影响岩爆的主要因素,对岩爆进行预测,取得了很好的效果,为预测岩爆提供了一条思路。

2距离判别分析理论

2.1 多个总体的距离判别准则[15,16]

设总体G={X1,X2,…,Xm}T为m元总体(考察m个指标),其中样本X={x1,x2,…,xm}T。令μi=E(Xi){i=1,2,…,m}测总体均值向量为μ={μ1,μ1…,μm}T。总体G的协方差矩阵为:

则样本X与总体G的马氏距离定义为:

设有k个m元总体:G1,G2,…,Gk(k>2),从中任意取2个总体Gp、Gq,考察新样本X到总体Gp和Gq的马氏距离的平方差:

其中:

那么有

总体的均值向量和公共协方差矩阵可以利用各总体的学习样本作估计。令为来自总体Gq的学习样本,nq为总体Gq的学习样本个数。则μq的无偏估计为:

学习样本的协方差矩阵∑q的估计为组内协方差矩阵Sq:

当各总体的协方差矩阵相等时,则此时总体的协方差矩阵∑的一个无偏估计为:

以和S分别代替μq和∑,得到Wq(X)(q=1,2,…,k)的估计为:

则多总体情况下的距离判别准则为:若总体Gq0满足下式:

则X∈Gq0。

2.2 判别准则的评价

为考察上述判别准则的正确性[15],利用回代估计法来考察误判率。具体方法是以全体训练样本作为新样本,逐个代入已建立的判别准则中判别其归属,并将误判个数对全体训练样本个数的比值作为误判率η的回代估计。

3岩爆预测的距离判别分析模型

3.1 判别参数的确定

判别参数的选取需考虑到影响岩爆的主要因素。借鉴前人研究的成果,选取最大切向应力σθ、单轴抗压强度σc、单轴抗拉强度σt弹性能量指数Wet等4个指标作为判别因子建立线性判别模型。

3.2 距离判别分析模型的建立

文献[9,12,13]提供了大量国内外若干典型岩爆数据,见表1,选取其中的16个作为样本,9个作为待判样本。并将岩爆情况分为无岩爆(G1)、轻微岩爆(G2)和中等岩爆(G3)。构建线性判别函数如下:

利用样本数据进行训练,经过训练后的模型,利用回代估计法对学习样本判别,预测结果和期望输出如表1所示,预测结果误判率η=0/25=0.0。由此可见,距离判别分析模型用于采空区预测是完全可行、高效的。

4 结语

岩爆是非常复杂的动力地质现象,为了更好地对岩爆等级预测,本文借鉴前人研究成果,选取单轴抗压强度σc、最大切向应力σθ、单轴抗拉强度σt和弹性能量指数Wet作为岩爆的主控因子,建立了马氏距离线性判别模型,并将模型应用于实际工程预测中,取得了良好的效果。马氏距离判别模型是建立在原始的工程资料基础之上,原始资料是否具有代表性、准确性直接决定判别模型的适用性。因此,在实际工程中,应收集具有典型代表的数据资料,建立相应的数据库,以增强模型的适用性。

糖尿病线性判别诊断模型的建立篇4

1 研究资料

1.1 资料来源

研究病例来自兰州大学第一医院病历库, 所收集的资料均为医院内分泌科、普外科2007年全年出院患者。

1.2 研究对象

均由有经验的内分泌科医师诊断。糖尿病病例352例, 非糖尿病病例389例;男性428例, 女性313例;年龄8~84岁, 平均年龄 (58±14) 岁。录入信息包括患者基本情况 (年龄、性别、入院日期、出院日期等) 、血常规检查指标 (白细胞、红细胞等) 、生化检查指标 (天冬氨酸氨基转移酶、丙氨酸氨基转移酶等) 。

1.3 纳入及排除

分别以1型、2型糖尿病, 其他特异性糖尿病及妊娠期糖尿病的临床诊断标准为纳入标准收集病例。由有经验的内分泌科医师诊断为糖尿病的出院患者、普外科出院患者, 排除其中基本情况、血常规检查、生化检查指标不齐全者, 其余均纳入研究。

2 研究方法

2.1 线性判别分析

判别分析是用于帮助研究者寻找区别各组差异的变量, 将对象较准确地判入各组的方法[4]。判别分析最常见的应用是为了判定哪些变量具有组间判别效力而对研究对象中多个测量变量进行选择[3]。经过判别分析之后就会得到判别函数。判别分析适用于2组以上, 且每个病例必须有2个以上变量的分类分析。

一般说来, 我们可对2组间的判别拟合一个线性方程:Y=a+b1X1+b2X2+...+bnXn式中a为常数, b1到bn为回归系数。判别函数对2组判别问题的解释较直接, 具有最大相关系数的变量对预测组别的贡献最大[3]。本实验为了研究方便, 定义糖尿病病例为1, 而非糖尿病病例为-1。

2.2 逐步判别原理

逐步判别分析是根据多元方差分析中的wilk′s统计量及F值进行变量的筛选。每一步选一个判别能力最大的指标进入判别函数, 直到被引入模型的变量没有一个符合进入模型的条件时, 变量引入过程结束。逐步判别分析以wilk′s统计量最小者入选, 本研究中模型引入变量的最小F值为10, 剔除变量的最大F值为2.71。这样得到的判别函数所包含的指标都很重要。

2.3 病例收集与分类

按上述纳入与排除标准收集病例, 结合临床检验结果与有经验临床医生的诊断对所收集病例进行分类, 同时建立相应数据库。

2.4 训练集和测试集的选择

研究对象共741例, 所有收集的病例以4∶1比例分为训练集样本和测试集样本。为使计算机能更合理地从资料中获取信息, 训练集样本应能很好地代表患者真实情况, 因此, 运用数据库中已知其类别的样本作为训练集, 从741例样本中选择594例 (糖尿病病例281例, 非糖尿病病例313例) 样本组成训练集。为了检验从训练集中得到识别函数的可靠程度, 可利用一些未包括在训练集中的样本构成测试集, 以检验其识别的可靠性, 因此, 将剩余147例 (糖尿病病例71例, 非糖尿病病例76例) 样本构成测试集, 以验证模型的预测能力。

2.5 判别函数的建立

通过训练集获得判别函数建立模型。将训练集患者的基本情况、血常规检查及生化检查信息从Microsoft-Excel数据库导入SPSS数据库。然后用SPSS统计软件提供的判别分析方法对这些数据进行判别分析, 选出对预测组别贡献较大的变量, 建立判别函数。

2.6 模型的评价

用训练集与测试集的误判率对模型进行判别效果评价, 并引入特异性和敏感性指标进一步判断LDA的预测能力。

3 结果与讨论

3.1 特征变量及判别函数

经LDA法进行判别分析后, 逐步选出8项对区别各组贡献较大的变量。判别函数的变量及Wilk′s值, 见表1。

在疾病诊断中常需根据就诊者的检查指标、体征等的分析, 作出是否患有某种疾病的诊断, 这种问题就可用判别分析解决[5]。逐步判别分析可以筛选出对于鉴别2类具有不同属性的人群有较大贡献的变量, 从而使其结果具有较好的区分度。表中F的绝对值越大就意味着该变量对模型的贡献越大。由表1中的F值可知, 变量总胆固醇比其他变量相对重要, 这些变量所代表的临床意义与诊断模型之间的关系有待进一步研究。由8个特征变量相对应的判别函数系数建立的糖尿病与非糖尿病分类判别函数如下。

糖尿病判别函数:Y=-55.570+0.168X1+3.610X2+0.413X3+0.004X4-0.030X5+2.278X6+0.083X7+1.405X8

非糖尿病判别函数:Y=-42.9820+0.115X1+2.849X2+0.372X3+0.008X4-0.010X5+2.149X6+0.071X7+0.871X8

3.2 判别结果及判别正确率

将741例合格病例以4∶1比例分为训练集样本和测试集样本, 经交互检验法验证可得训练集的预测情况, 见表2。

由表2可知, 训练集和测试集的预测准确率分别是85.7%和81.6%, 模型总判别准确率为84.9%。

3.3 特异性和敏感性

LDA对于糖尿病和非糖尿病的判别效果较好, 为了进一步判断LDA的预测能力, 实验引入了特异性 (Specificity) 和敏感性 (Sensitivity) 指标。

其中TP指真阳性数, FN指假阴性数, TN指真阴性数, FP指假阳性数。在LDA法判断结果中, 测试集的假阳性病例是31例, 假阴性病例是54例。由此求得测试集样本的敏感性是0.75, 特异性是0.88。

4 结论

本文是首次源于临床常规检查指标 (血常规、生化) 与机器学习算法相结合建立计算机辅助糖尿病诊断模型。逐步判别分析的总判别准确率达到84.9%, 虽然判别效果较好, 但还可通过进一步扩大样本量, 或采用更加适合的机器学习算法提高判别能力。

参考文献

[1]陈文彬.诊断学[M].第5版.北京:人民卫生出版社, 2004.

[2]Kemal Polat, Salih Gunes, Ahmet Arslan.A cascade learning systemfor classification of diabetes disease:Generalized Discriminant Analysisand Least Square Support Vector Machine[J].Expert Systems with Appli-cations, 2008 (34) :482～487.

[3]J Liang, R Du.Model-based Fault Detection and Diagnosis of HVACsystems using Support Vector Machine method[J].International Journal ofRefrigeration, 2007 (30) :1104～1114.

[4]Kemal Polat, Salih Gune.Breast cancer diagnosis using least squaresupport vector machine[J].Digital Signal Processing, 2007 (17) :694～701.

[5]Tim W, Nattkemper, Bert Arnrich, et al.Evaluation of radiological fea-tures for breast tumour classification in clinical screening with machinelearning methods[J].Artificial Intelligence in Medicine, 2005 (34) :129～139.

[6]Weida Tong, Qian Xie.Using Decision Forest to Clissify Prostate CancerSamples on Basis of SELDI-TOF MS Data:Assessing Chance Correlationand Prediction Confidence[J].Environmental Health Perspectives, 2004 (112) :1622～1627.

[7]Kemal Polat, Salih Gunes.Computer aided medical diagnosis systermbased on principal component analysis and artificial immune recognitionsysterm classifier algorithm[J].Expert Systems with Applications, 2008 (34) :773～779.

判别模型篇5

判别分析是一种统计判别和分组的技术手段。而线性判别分析是根据预测变量的属性值, 确定这些预测变量的最佳线性组合, 将研究对象的总体划分成两个或多个部分。上市公司传统的判别评价等级, 归纳起来主要有三种方法。第一种方法是综合评价指标, 即根据一定的权重对各项财务指标进行综合评价。第二种方法用每股收益作为评价等级的指标。第三种方法是用净资产收益率作为评价等级的指标。这些评价等级方式的缺点是指标过于单一、片面。

杨善林, 江兵 (2006) 运用Q型聚类中的系统聚类分析法将机械工业行业的45家上市公司分成5类, 并进一步按盈利性、成长性和财务安全性对每一类公司的业绩状况进行总体归纳评价。沈璟 (2009) 选取六项财务变量对中小型上市公司进行聚类分析, 得到中小型上市公司信用级别的分类, 再通过判别分析得到不同信用级别的二次型判别模型, 依据该模型中小型上市公司可以进行级别的判定。朱顺泉 (2009) 以中国资本市场的实际数据为样本, 建立了期权定价信用分类模型。周丽聪 (2011) 选取2005-2007年对被进行特别处理的118家ST公司和126家非ST公司, 以其财务指标为样本, 进行logistc回归和BP神经网络分类, 对这两种信用风险评判模型在中国市场做了实证研究。

二、模型

中国的证券市场诡异多变、问题重重。用哪些因素构建中国上市公司控分类模型显得至关重要?虽然影响中国证券市场的因素纷繁复杂, 但主要因素无非四种情况, 第一种是股票市场的质量情况, 第二种是财务情况, 第三种是股权结构情况, 第四种是股票市场的风险状况。因此选用这些因素及相应指标, 建立上市公司的评价等级是证券市场中的一个空白。

(1) 中国上市公司的判别分类模型。

样本的选取:2016年上海证券交易所 (A股) 600000到601999号所有的上市公司按照总市值、营业收入和净利润排名分成优、良、差三大类, 然后在每一类中随机地选取100名上市公司。

样本数据的处理:三类上市公司作为分类因变量, 市场质量指标 (价格冲击指数、流动性指数、大宗交易成本、买卖十档总额、相对买卖价差、相对有效价差、波动率、超额波动率、收益波动率、定价效率系数和定价误差系数) 、综合能力指标 (每股收益、每股净资产、净资产收益率、扣除后每股收益、流动比率、速动比率、应收账款周转率、资产负债比率、存货周转率、固定资产周转率、总资产周转率、净资产比率和固定资产比率) , 股权结构指标 (股权集中度1、股权集中度5、股权集中度10、股权集中度11、H1指数、H5指数、H10指数、Z指数) 、风险因子指标 (Alpha因子、Beta因子、R方因子、调整的R方因子) 做自变量, 用spss软件构造上市公司的判别分类函数。其中在优、良、差类的上市公司中各项指标不含缺失值的分别有81, 70和91个上市公司。

样本数据来源:上海证券交易所市场质量报告 (2016年的市场质量指标的数据) , 全景网 (http://www.p5w.com) (2016年的综合能力指标的数据) , RESSET金融数据库 (http://www.resset.cn) (2016年股权结构指标和风险因子指标的数据) 。

首先为了避免自变量高度的相关性, 用逐步筛选法, 如果F值大于3.84选入模型, 小于2.71将该变量删除。然后再用这些变量做判别分析。

由表1知, 第一步到第九步引入的自变量分别是大宗交易成本、总资产周转率、价格冲击指数、调整的R方因子、股权集中度10、速动比率、每股净资产、每股收益和流动性指数。每一步F值的显著性水平都是零, 说明选入自变量的区别力较强。

待判个案代入上市公司的Fisher系数判别分类函数, 哪个组值最大, 就说明预测对象在哪一类。

由表2知, Fisher系数上市公司判别分类函数是:

其中差的上市公司, y2--良的上市公司, y3--优的上市公司, x1--价格冲击指数 (单位:基点) , x2--流动性指数 (单位:万元) , x3--大宗交易成本 (单位:基点) , x4--每股收益 (单位:元) , x5--每股净资产 (单位:元) , x6--速动比率, x7--总资产周转率, 股权集中度10, 调整的R方因子。

虽然建立了上市公司判别分类函数, 但是这些判别分类函数的准确率怎样呢?下面用原始回代法来检验判别分类的效果。

由表3知, 在原始回代法中, 91个差的上市公司中有87个上市公司判断正确, 百分比是95.6%, 4个上市公司错判为良的上市公司, 百分比是4.4%。70个良的上市公司中有52个上市公司判断正确, 百分比是74.3%, 12个上市公司错判为差的上市公司, 百分比是17.1%, 6个上市公司错判为优的上市公司, 百分比是8.6%。81个优的上市公司有72个上市公司判断正确, 百分比是88.9%, 9个上市公司错判为良的上市公司, 百分比是11.1%。

用原始回代法有4+12+6+9=31个样本分类错误, 正确率为 (242-31) /242=87.19%。

三、结论

1. 中国上市公司传统的分类方法主要用得是财务指标, 这种分类方法不能直观地反映证券市场的状况, 因此本文加入了反映证券市场的指标--市场质量指标和风险因子指标, 这两类指标能够更加直观地反映各类上市公司的证券市场的情况。不仅如此, 还可以全面地分析各类上市公司的差异。这种直接反应证券市场状况的新颖的分类方法, 相对于用传统的财务指标进行分类, 用原始回代法, 准确率高达87.19%。

2. 通过标准化系数的判别分类模型可知, 影响上市公司的类别不仅有财务指标的每股收益、每股净资产、速动比率、总资产周转率, 股权集中度, 还有直接反应市场状况的价格冲击指数、流动性指数、大宗交易成本以及调整的R方因子, 并且对类别影响较大的是市场质量指标中的大宗交易成本和价格冲击指数, 而不是传统思维中的财务指标。

3. 用非标准化系数判别分类模型和Fisher判别分类模型可以算出任何一个中国上市公司应该属于那一类。当用非标准化系数判别分类模型时, 需要求出各类的中心, 而用Fisher判别分类模只要代入三个判别函数, 哪个值大就属于哪一类。

摘要：选取2016年上海证券交易所所有的中国上市公司, 按照传统的分类方法对其进排名, 分成优、良、差三大类, 然后在每一类中随机地选取100名上市公司作为研究对象, 建立以三类上市公司作为因变量, 市场质量指标、综合能力指标、股权结构指标和风险因子指标作为自变量的Fisher判别分类函数。同时判别的准确率高。所以每个上市公司可以针对各自的具体情况进行改进。

关键词：市场质量指标,综合能力指标,股权结构指标,风险因子指标,判别分类

参考文献

[1]华长生.逐步判别分析模型在识别上市公司财务欺诈中的应用[J].当地财经, 2008 (12) :119-122.

[2]陈晓红, 陈松灿.类依赖的线性判别分析[J].小型微型计算机系统, 2005 (5) :894-897.

[3]曹官师, 张才仙.基于判别分析模型的企业信贷风险评估研究[J].科技创新导报, 2008 (18) :18.

[4]杨善林, 江兵.上市公司经营业绩的分类与评价[J].数学的实践与认识, 2006 (1) 29-34.

[5]沈璟.中小型上市公司信用级别的划分基于SAS的聚类分析和判别分析[J].企业导报, 2009 (9) :15-16.

[6]朱顺泉.基于期权定价理论的上市公司信用分类建模及应用研究[J].统计与信息论坛, 2009 (7) :23-28.

[7]周丽聪.上市公司信用风险分类准确度比较分析[J].财会通讯, (综合) 2011 (11) (下) :68-70.

[8]上海证券交易所市场质量报告.上海:上海证券交易所, 上海证券交易所创新实验室, 2008, 3.

判别模型篇6

(一) 财务预警应用于信贷风险管理的必要性分析

商业银行在我国金融体系中占据重要地位。信贷是商业银行的主要业务, 信贷风险是商业银行重点关注的核心问题。但目前我国信贷风险管理水平仍相对落后, 信贷资产存在很大的风险隐患, 其直接原因是由于贷款企业发生财务危机给银行信贷资产带来严重损失。如何建立有效的财务危机预警模型, 及早发现和预测贷款企业危机的信号, 最大限度的避免或减少企业财务危机给银行造成的信贷损失, 已经成为银行信贷风险管理迫切需要解决的问题。鉴于商业银行现行的信贷风险管理仍存在诸多问题, 对贷款企业的财务状况监控不够, 以至于当信贷资产发生危险和损失时, 银行还未察觉。而一旦察觉, 银行的信贷资产大多已经成为坏账、呆账了, 造成银行信贷资产的流失。因此, 在银行信贷风险管理中建立财务预警, 时刻关注贷款企业的财务状况并对其进行科学的定量分析, 进而对财务危机企业进行判别并为银行信贷决策提供依据, 这对银行的信贷风险管理而言十分必要。对于作为债权人的银行来讲, 财务预警的建立可以帮助其进行贷款决策分析, 避免或减少信贷损失。因此, 要在现有的财务预警理论和模型的基础上, 针对商业银行信贷风险管理的实际需要, 构建有效的财务预警模型, 应用于信贷风险管理中。

(二) 信贷风险管理管理特点决定了其财务预警模式

由于利益不同, 商业银行信贷管理者看待企业财务危机的观点, 有其特殊性。“既不同于一般的权益投资者, 也不同于企业的内部经营管理者。”对于商业银行的信贷管理, 企业财务危机可描述为企业无力偿还全部本息的状态, 或企业的现金净流量低, 资产配置的流动性差, 无法变现用于抵偿到期债务的本息。因而单纯从财务角度来看, 商业银行信贷风险管理者对贷款企业财务状况所看重的首先是盈利能力, 即贷款本金投入到企业后有没有形成利息的可能性;再次就是债务的偿还能力, 即贷款本金和利息在预定的贷款期限内可以全部收回的可能性。因此, 商业银行信贷风险管理中的财务危机观念, 更加注重企业的盈利能力和偿债能力。一个发展前景良好的企业, 如果到期不能还本付息, 在商业银行眼中, 都是信贷风险的源泉, 都是具有潜在风险的不安全信贷对象。而现金流量指标是衡量企业资本运营状况和预测企业财务危机的有效变量, 尤其对银行来讲, 其债务的偿还最主要的还是依靠企业的现金流量。因此, 在构建预警模型时, 要选取体现企业盈利能力和现金流量状况的财务指标, 对企业的财务状况进行预测分析。本文基于商业银行信贷风险管理者的角度, 选取银行所关心的财务指标, 运用预警模型, 预测企业发生财务危机的可能性, 降低信贷资产风险, 确保信贷资产安全。

二、判别分析模型简介

(一) 判别分析模型的内容

Altman最早将多元线性判别方法引入到财务危机预警领域, 他对1946年至1965年间提出破产申请的33家公司和同样数量的非破产公司进行观察, 对22个财务比率运用数理统计方法进行筛选, 建立了著名的Z-score模型 (即多元线性判别模型MDA) , 目前该模型已成为财务危机预警最常用的方法。Z-score模型选取的财务指标主要有5个:营运资本/总资产, 留存收益/总资产, 息税前利润/总资产, 股权的市场价值/债务总额的账面价值, 销售额/总资产, 分别从企业的资产规模和折现能力、获利能力、财务结构、偿债能力、资产利用效率等方面综合反映企业的财务状况。通过多元判别模型产生一个总的判别分值, 称为Z值, 并依据Z值进行判断。该模型判别方程如下:

Z=1.2x1+1.4x2+3.3x3+0.6x4+0.999x5

其中:Z—判别函数值;x1— (期末流动资产-期末流动负债) /期末总资产;x2—期末留存收益/期末总资产;x3—息税前利润/期末总资产;x4—期末股东权益的市场价值/债务总额的账面价值;x5—本期销售收入/总资产。

根据模型计算结果, Z值应在1.81~2.99之间, 等于2.675时居中。如果企业的Z值大于2.675, 表明企业财务状况良好, 不会破产;如果Z值小于1.81, 则企业存在很大的破产风险;如果Z值处于1.81~2.675之间, 称之为“灰色地带”, 处在这个区间, 则表示企业财务状况是极不稳定的。研究表明x1、x4和x5三个财务指标预测能力比较强, 预测精度高达94%。

其后, Altman, Haldeman&Narayanan运用包括经营收益/总资产、收益稳定性、利息保障倍数、留存收益/总资产、流动比率、普通股东权益/总资本和普通股东权益/总资产七项比率, 分析了1969年至1975年的53家破产企业和58家非破产企业, 提出了一种能更准确预测企业财务危机的新模型—ZETA模型。结果表明ZETA模型用于预测五年和一年之后的财务危机企业的精度分别为70%和90%。并且对相同样本的比较分析表明, ZETA模型明显优于1968年Altman发明的Z-score模型。

多元判别模型因其假设前提过于苛刻, 影响了其判别效果和实用性。但该模型能包涵反映企业财务状况的多个指标, 并且可以了解哪个财务指标最具判别能力。这对于银行的信贷风险管理有非常重要的意义, 银行对于企业信用状况的评定主要依靠对企业财务报表的分析, 而如何从庞杂的财务指标体系中选取最能反映企业财务状况的指标是问题的关键。因此, 本文选取判别分析模型应用于信贷风险管理。

(二) 判别分析模型的类型

多元线性判别方法主要有三种:贝叶斯 (Bayes) 判别、距离判别和Fisher判别。应用不同的判别规则, 能够求解出不同的判别函数。其中, Fisher判别又称典则判别, 其基本思想是投影, 即将原来在R维空间的自变量组合投影到维度较低的D维空间去, 然后在D维空间中再进行分类。投影的原则是使得每一类内的方差尽可能小, 而不同类间的方差尽可能大。Fisher判别是按照组内方差尽量小, 组间方差尽量大的规则来求解判别函数。

在这三种判别方式中, Bayes判别的强项是进行多类判别, 但其要求整体成多元正态分布;距离判别适用于对自变量均为连续变量的情况。而本文所构建的模型的自变量选自财务指标, 显然是非连续变量;模型中通过判别分析将样本分为“财务危机”和“财务正常”两类, 并不需要多类判别。而Fisher判别的优势在于对总体的分布类型没有什么限制, 应用范围广泛。另外, 用该判别方法建立的判别方程可以直接用于手工计算方法进行新观察对象的判别。因此在实证分析中采用Fisher判别。

三、判别分析模型应用于信贷风险管理的实证分析

(一) 研究样本选取与财务指标选择

本文最终选择了2004年我国A股市场被特别处理的28家ST公司和2005年被特别处理的22家ST公司作为研究样本, 要求入选的上市公司在第T年由于“财务状况异常”而被特别处理, 并且可以获得第T-1年、T-2、T-3年的财务报表数据。同时按照同一会计年度、行业相同、资产规模相近的配对原则, 对每一家ST公司进行配对选择非ST公司, 选取了50家非ST公司作为匹配样本。入选的非ST公司在第T-3年12月31日前上市, 并且可以获得第T-1年、T-2、T-3年的财务报表数据, 并确保财务数据与配对的ST公司来源于同一会计年度。这样总共获得了一个样本容量为100的样本组。具体的样本数据是根据上述对应的这100家上市公司在沪、深两市公布的相关资料信息得来的。同时保证研究期间一致, 如ST公司采用2004年的数据, 则非ST公司也同样采用2004年的数据。

同时, 基于银行的角度评价贷款企业的财务状况, 因此选取对于银行来说更看中的财务指标:盈利能力、偿债能力、营运能力和现金流量。在查阅了相关文献资料, 同时考虑了指标数据资料获取的难易程度的影响之后, 初步确定了以下具有代表性的14个财务指标, 作为初选的指标体系 (如表1所示) 。

(二) 模型构建及实证分析

本文采用逐步判别分析对模型变量进行筛选并建立模型。逐步判别分析是假定最初模型中没有任何变量, 逐步对模型进行检验并逐步引入变量, 每次将方程之外的剩余变量中对模型判别能力贡献最大的变量引入判别方程, 同时也考虑已经引入判别方程的某些变量, 如果其判别能力随新变量的加入而变得不显著了, 应及时从判别方程中剔除。直到模型判别式中没有不重要的变量需要剔除, 而剩余变量也没有重要的变量可以引入, 那么逐步选择变量的过程结束。本文采用SPSS 13.0统计软件进行逐步判别分析, 根据分析结果最终有两个指标通过了F检验, 即X2 (总资产收益率) 和X13 (现金流动负债率) 。同时采用Fisher判别法, 方程的系数采用Fisher线性判别方程的系数。由此得出各类判别方程如下:

F1= (-7.633) *X2+0.436*X13-1.554 (ST公司)

F2= (-0.882) *X2+1.233*X13-1.937 (非ST公司)

采用回代的方式预测模型拟合的准确性, 将各样本观测值回代到判别方程中, 根据函数值确定每一个样本属于哪一类公司。对比原始样本的分类和按判别方程所得的分类, 计算出模型的预测准确率和两类错误率。经统计, Fisher's判别方程的总体准确率为72%, 其中, 有9家财务危机公司被误判为财务正常公司, 即第一类错误率为18%, 有19家财务正常公司被误判为财务危机公司, 即第二类错误率为38%。将T-2年和T-1年的样本数据代入模型, 得到模型的拟合效果与T-3年进行比较。如表2所示:

(三) 模型实证结果在信贷风险管理中的应用

在信贷风险管理中, 商业银行更为关注的是对ST公司 (即财务危机企业) 的预测准确率, 因为发生第一类错误, 即将财务危机企业误判为财务正常企业, 相对于第二类错误, 其危害更大, 误判成本更高。一旦出现第一类错误, 银行不仅错过了及时发现企业危机信号, 采取应对措施减少信贷资产损失的机会, 更可能因为信贷决策的失误带来更大的信贷风险。根据表2可以得出, 判别分析模型的第一类错误概率都处于10%~20%之间, 误判率较低, 说明在信贷风险管理中具有较好的判别能力和预测效果。而越临近危机发生时间, 判别分析模型的两类错误率越低, 总体准确率越高, T-3年优于T-2年, T-2年又优于T-1年。这也恰好与现实情况相吻合, 财务危机企业的财务状况是一个逐步恶化的过程, 越临近危机发生时, 财务预警指标的恶化越明显, 判别能力越高。

尽管判别分析模型有较为严格的假设前提, 即变量需符合多元正态分布且协方差矩阵相等, 而事实上真正完全满足该假设的数据几乎不存在, 这在一定程度上影响了判别分析模型的准确性和实用性。但因判别分析模型涵盖了体现企业财务状况的多个指标, 并且能够逐步判断哪个财务指标最具判别能力和预测效果, 其最显著的优势在于能够从众多的财务指标中筛选出最能准确反映企业财务状况的指标, 并建立定量化的判别方程。商业银行在信贷风险管理中对于企业财务状况和贷款等级的评定, 主要依靠对企业财务报表数据及财务比率的分析, 而如何从庞杂的财务指标体系中选取最能反映企业财务状况的指标是问题的关键。判别分析模型能够为银行解决这一问题, 这对于商业银行的信贷风险管理具有重要意义和实用价值。

参考文献

[1]唐有瑜:《财务危机预警模型在信贷风险管理中的应用》, 《上海金融》2002年第2期。

[2]张文彤:《SPSS统计分析高级教程》, 高等教育出版社2004年版。

判别模型篇7

关键词：财务危机,贝叶斯判别,预警模型

随着我国资本市场的蓬勃发展,资本市场已成为企业募集资金的场所,投资者也可以通过资本市场运作获取较高的回报,所以一个企业财务状况的好坏往往是企业管理当局、投资者和债权人关注的焦点。但市场竞争非常残酷,企业发展也可能会陷入财务危机之中,而财务危机的发生并非突然,它是一个逐步、渐进的过程。企业财务危机不但具有先兆,并且是可以预测的,正确地预测企业财务危机,对保护投资者和债权人的利益,对经营者防范财务危机,对政府部门监管上市公司质量和证券市场风险,都具有十分重要的现实意义。

一、文献综述及评论

国外对于企业财务危机预警模型的研究已有七十多年的历史,产生了大量有效的财务危机预警模型。Fitzpatrick最早对企业财务危机预警进行了单变量研究[1],Beaver对失败企业和成功企业进行比较研究后提出了单变量判定模型,即通过个别财务比率指标的走势的恶化来预测财务危机状况[2]。Altman首先采用判别分析方法,运用多种财务指标加权汇总产生的总判别分值(称为Z值)来预测财务危机,建立了企业财务危机预警分析的多变量模型[3]。此外,回归模型、Probit函数模型、神经网络和、决策树等方法在企业财务危机预警分析中也得到了较多的应用[4]。

国内由于市场经济体制改革和证券市场出现比较晚,对企业财务危机预警的研究起步也比较晚,主要是利用国外的方法来建立中国的财务危机预警模型。吴世农、黄世忠曾介绍企业的破产分析指标和预测模型。陈静对运用上市公司财务数据对ST公司和非ST公司进行了单变量分析并建立Z值模型。王春峰等运用神经网络法对商业银行财务风险进行了研究。张玲运用多元线性判别方法建立企业财务危机预警模型。郑茂分别使用线性概率模型和Logistic模型进行企业财务危机预警分析。刘旻和罗慧也通过数据挖掘方法对我国上市公司财务危机进行了研究[4]。

单变量模型只是利用个别比率指标预测企业财务失败,而企业的生产经营活动受到许多因素的影响,故单个比率反映的信息往往有限,无法全面显示企业的财务状况。多元判别模型要求自变量呈正态分布且两组样本等协方差时才能使用,而现实的样本数据往往不能满足这一要求,这就大大限制了多元线性判别模型的使用范围,并且其工作量比较大,研究者需要做大量的数据收集和数据分析工作。Probit模型要求企业样本服从标准正态分布,概率函数的P分位数可以用财务指标线性解释,其假设不算很严,但计算过程复杂,且有较多近似处理,其预测精度较高。神经网络方法没有严格的假设条件,但目前普遍运用的算法存在鲁棒性差、搜索的空间维数较小,易陷入局部最优解等不足,其科学性和准确性还有待提高。而贝叶斯判别模型虽计算过程复杂,但不需要严格的假设条件,预测精度又较高,具有广泛的适用范围。本文旨在运用贝叶斯判别方法来进行我国上市公司财务危机的预警分析。

二、贝叶斯判别分析原理

(一)贝叶斯准则

设有定义明确的g个类G1,G2,…,Gg,分别为x1,x2,……,xp的多元正态分布,对任何一个个体,若己知P个变量的观察值,要求判断该个体最可能属于哪一个类。如果制订了一个判别规则,难免会发生错分现象,若把实属于第i类的个体错分到第j类的概率记为P(j/i),这种错分造成的损失记为C(j/i),那么在这个判别分类规则下实属第i类的个体错分到其他类别的损失为[5]:

$\sum_{\begin{array}{l} j = 1 \\ j \neq i \end{array}}^{g} C (j / i) Ρ (j / i) (1)$

记第i类个体出现的概率为P(Gi),从而这个判别分类规则错分的平均损失为:

$L = \sum_{i = 1}^{g} Ρ (G_{i}) [\sum_{\begin{array}{l} j = 1 \\ j \neq i \end{array}}^{g} C (j / i) Ρ (j / i)] (2)$

贝叶斯判别准则就是根据平均损失最小原则来寻找一个判别规则来进行判别。但在实际问题中,要精确地给出C(j/i)的值,使之真正反映客观需要是比较困难的,因为不论何种错分都同样不受欢迎,故可把它们看作完全相等,则令C(j/i)=1,(j≠1)。这时(2)式变为:

$L = \sum_{i = 1}^{g} \sum_{\begin{array}{l} j = 1 \\ j \neq i \end{array}}^{g} Ρ (j / i) Ρ (G_{i}) (3)$

就相当于错分概率,平均损失最小就相当于错分类的概率最小。

(二)后验概率

单凭分类函数值的大小做出决策有时易出偏差。这时,分别估计该个体属于各个类的概率却能客观的反映各种可能归属而避免武断,下面分别计算该个体属于各个类的概率。给定个体关于x1,x2,……,xp的观察值,得到的分类函数值后,可进一步计算该个体属于各个类的后验概率:

$\begin{array}{l} Ρ (G_{i} / x_{1}, x_{2}, \dots, x_{p}) = \frac{e^{S_{1}}}{e^{S_{1}} + e^{S_{2}} + \dots + e^{S_{p}}} \\ = \frac{1}{1 + e^{S_{1} - S_{i}} + e^{S_{2} - S_{i}} + \dots + e^{S_{p} - S_{i}}} (4) \end{array}$

比较g个值P(Gi/x1,x2,…,xp),哪个最大,(x1,x2,…,xp)就属于那个类Gi。

(三)交互验证法

交互验证法是一种分析误判率常用的方法,主要是用来分析样本资料非正态分布所可能带来的判别偏差。其研究思路是:由于本文样本只有两类,所以这里只讨论只有两个样本组的情况。若G1,G2,…,Gg不能假定为正态组,设X $_{1}^{(1)}$ ,…,X $_{n_{1}}^{(1)}$ 是来自组G1的样本,X $_{1}^{(2)}$ ,…,X $_{n_{2}}^{(2)}$ 是来自组G2的样本,u1和u2的一个无偏估计为 $\bar{X}^{(1)} = \frac{1}{n_{1}} \sum_{i = 1}^{n_{1}} X_{i}^{(1)}, \bar{X}^{(2)} = \frac{1}{n_{2}} \sum_{i = 1}^{n_{2}} X_{i}^{(2)} ‚ \sum$ 的一个联合无偏估计为: $S_{p} = \frac{1}{n_{1} + n_{2} - 2} (A_{1} + A_{2}) ‚ A_{j} = \sum_{i = 1}^{n_{j}} (X^{(j)} - \bar{X}^{(j)}) (X^{(j)} - \bar{X}^{(j)})^{'}, j = 1, 2$ 。令

$\begin{array}{l} Τ_{i}^{(1)} = (X_{i}^{(1)} - \bar{X}_{i}^{(1)})^{'} S_{p}^{- 1} (X_{i}^{(1)} - \bar{X}_{i}^{(1)}) \\ Q_{i}^{(1)} = (X_{i}^{(1)} - \bar{X}_{i}^{(2)})^{'} S_{p}^{- 1} (X_{i}^{(1)} - \bar{X}_{i}^{(2)}) \end{array}$

这里 $\bar{X}_{i}^{(1)}$ 是X $_{1}^{(1)}$ ,…,X $_{n_{1}}^{(1)}$ 中除去X $_{i}^{(1)}$ 之后n1-1个观测向量的平均值,i=1,2,…,n。设m1是使T $_{i}^{(1)}$ >Q $_{i}^{(1)}$ 成立的个数,则样本组G1的误判率的估计值e1估计为m1/n1。类似的,样本组G2的误判率的估计值e2估计为m2/n2。

具体来说就是在建立判别函数时依次去掉一例,然后用建立起来的判别函数对该例进行判别,用这种方法可以非常有效地避免强影响点的干扰。

三、样本和财务指标的选取

由于A股上市公司执行国内的会计准则和会计制度,并由会计事务所审计,B股上市公司采用国际会计准则,由外资会计事务所审计,从而导致了A股公司资料与B股公司财务资料缺乏可比性,所以本文只以A股上市公司为研究对象。将ST股票作为财务危机组处理,依照其产生的原因及特征,从我国上海证券交易所被ST的A股上市公司中选取60家作为财务危机组,同时又从财务正常A股公司中选择60家作为财务正常组。样本数据可以从上海证券交易所网站上公布的年度财务报表中查到。

为了剔除不同年份、行业和资产规模因素对财务危机预测的影响,我们根据以下原则按1:1的比例选择财务正常的上市公司作为配对样本:(1)研究期间一致,如财务危机公司采用的是2005年的数据,则财务正常公司也同样采用2005年的数据。(2)配对样本与财务危机公司行业类型相同或相近。(3)配对样本与财务危机公司的总资产规模相当。(4)剔除数据严重缺失或不合理的公司及两年内就被ST的公司。(5)剔除因其他状况异常而被ST的公司。

据此,在剔除了非正常的ST公司和数据缺省的公司后,最终得到数据齐全且典型的样本总数为120个。定义组合1为财务危机公司,组合0为财务正常公司,估计样本80家(其中财务危机公司40家,财务正常公司40家),预测样本40家(其中财务危机公司20家,财务正常公司20家)。本文参考人民网上公布的我国上市公司财务质量测评系统,选取了反映期偿债能力、盈利能力、成长能力和经营能力四大类共9个财务指标(如表1)。

四、实证分析

使用统计软件SPSS中的Discriminant选项进行贝叶斯判别分析,建立判别函数时选用全模型法。得到贝叶斯判别的函数式:

财务危机:

Y=-32.210-0.007X1+0.093X3+2.808X7+45.873X9+2.644X11+0.928X14+0.018X15+4.877X16+13.032X17+5.959X20

财务正常:

Y=-14.489-0.012X1-0.105X3-4.627X7+34.266X9+1.568X11+2.199X14+0.007X15+3.174X16+5.811X17-4.401X20

利用该贝叶斯判别式就可以直接计算新的观测样本属于各类的得分,得分最高的一类就是该样本所属的类别。使用已构造的函数对随机抽取的40个新样本进行预测检验,以判断函数的预测价值,把40个检验样本的各指标值代入上述方程,求出分值并进行分类,发现判别效果良好,正常企业中只有两家被误判为财务危机企业。

为了进一步检验贝叶斯判别函数的判别效果,采用交互验证方法进行判别效果验证。SPSS软件输出的验证结果如表3:

从交互验证的结果来看,它比上面预测的准确率还要高,财务正常企业的预测准确率达到了100%,财务危机企业判别的准确率也达到了97.5%,其误判率仅为2.5%,表明该判别函数具有较高的预测价值。

五、结论

从总体上说,贝叶斯判别模型具有良好的预测效果,可直接作为金融机构、投资者、债权人和监管机构等做财务危机、信用风险预警分析的一个有效工具,并且它不需要严格的假设条件,因而具有广泛的适用范围。此外,对上市公司进行财务报表分析时,我们应对流动比率和资产负债率等指标进行重点关注,以提高判断的效率与针对性。

参考文献

[1]Fitzpatrick PJ.AComparison of Ratios of Success-ful Industrial enterprise with Those of Failed Firms[J].Certified Public Accountant,1932,(2):85-92.

[2]BeaverWH.Financial Ratios as Predictors of Fail-ure[J].Journal of Accounting Research,1966,(Supplement):71-111.

[3]Altman E I.Financial Ratios,Discriminate Analy-sis and the Prediction of Corporate Bankruptcy[J].Journal of Finance,1968,(9):589-609.

[4]张鸣,张艳.企业财务预警研究前沿[M].北京:中国财政经济出版社,2004:146-159.

判别模型篇8

目前在预测矿井突水方面, 发展较为迅速的方法有:有限元法、人工神经网络法和灰色控制系统理论;在计算方面, 解析法、水文地质比拟法、相关分析法等也都被广为采用。这些方法都有着各自的优缺点。由于煤矿突水是一个复杂的动力系统, 至目前为止还有很多因素尚未研究透彻。因此, 煤矿突水是一个灰色系统, 也是一个模糊系统。采用模糊理论对煤矿突水进行预测评价将会消除信息的不足和环境模糊的缺点。

1 煤矿底板突水的模糊评价分类模型

煤矿的底板突水分析是多层次、多目标、多因素控制的复杂模糊系统, 对这类系统进行评价具有模糊性。运用最大隶属度原则和加权平均原则相结合的方法对煤矿底板突水情况进行了模糊综合评价。

1.1 建立评价对象的因素集

在模糊综合评价法中, 因素是参与评价的评价指标, 而在对煤矿底板突水情况的定量综合评价的时候, 需建立评价对象的因素集U={u1, u2, u3, …, uj, …, un}, 用其来参与评价n个影响因素的实际测定。

1.2 建立评价对象的标准因素集

在建立评价对象因素集的同时, 还存在与各个影响因素相应的底板突水类别的集合V={v1, v2, v3, …, vj, …, vm}。

1.3 确定评价因素的模糊权向量

通常各因子的重要程度不同, 对每个因子ui赋与一个相应的权重ai构成权重集A。因子ai的权重值确定方法如下:

undefined

式中 ci——因子ui的实测数值;

si——因子ui的突水类别的标准值;

wi——因子ui的权重值。

在模糊综合评价中, ai本质上是因子ui对评价事物的重要程度, 为进行模糊运算, 对各因子的权重值进行归一化运算得出因子的权重ai:

undefined

上述n项因子指标, 分别计算出权重后, 组成一个1×n模糊权重集:

A= (a1, a2, …, ai, …, an) , 且undefined

1.4 确定单因素评价矩阵R进行单因素评价

关于隶属度的确定, 从一个ui出发进行评价, 以确定评价对象对评价集元素vj的隶属度rij (j=1, 2, …, m) 。ui属于第j类突水情况的隶属函数为

undefined

式中 rij——因子ui对j类突水情况的隶属度;

ci——因子ui的实测数值;

si, j——因子ui第j类突水标准。

对第i个因子ui评价的结果组成单因素模糊评价集Ri= (ri1, ri2, …, rim) 。根据以上计算过程可得到相应于每个因子的单因素模糊评价集:

R1= (r11, r12, …, r1m)

R2= (r21, r22, …, r2m)



Rn= (rn1, rn2, …, rnm)

若共有n项影响因素m类突水情况, 将第i个单因素模糊评价集Ri的隶属度为行组成单因素评价矩阵, 则可写出n×m阶的模糊矩阵R:

undefined

1.5 综合评价

单因素模糊评价仅反映一个因子对评价对象的影响, 而未反映所有因子的综合影响, 也就不能得出综合评价的结果。模糊综合评价考虑所有因子的影响, 将模糊权向量A与单因素模糊评价矩阵R复合, 得出每个被评价事物的模糊综合评价向量B:

undefined

其中, bj称为评定指标, 是综合考虑所有因子的影响时, 评价对象对评价集中第j个元素的隶属程度。显然R的第i行表示第i个因子影响评定对象时对各个评价元素的隶属程度, 第j行表示第j个因子影响评定对象时对各个评价元素的隶属程度。因此, 每列元素再乘以相应的因子权数, 更为合理地反映每个因素的综合影响[3]。

2 实例分析

2.1 模型的数据准备

从大量煤层的突水案例中选取20个典型底板突水资料作为原始标准样本[4], 如表1所示, 其中最右侧一列中“1”表示突水, “0”表示不突水。根据文献[4]的研究, 笔者选取了水压、隔水层厚度、突水系数、构造发育4项主要影响因素组成评价对象的因素集。而待预测的样本如表2所示。

根据表1的原始标准数据, 分别取突水案例与不突水案例的各影响因素的平均值作为分类标准, 具体标准如表3所示。

2.2 模型的反向检验

对于模糊评价数学模型, 笔者采用Matlab编程[5]进行求解, 依据前述模型的五大步骤得到如表4所示的结果。

根据表4的结果, 可以看出在20 个案例中有2个案例与实际情况不同, 造成这种结果的主要原因是考虑的影响底板突水的因素只有4项。但是检验的结果仍十分令人满意。

2.3 预测样本的突水情况

同反向检验模型的方法一样, 采用Matlab编程, 只需将标准样本替换为预测样本即可, 得到的结果如表5所示。从表5可以看到, 5组预测结果均与实际情况一致, 说明了模型的预测准确性。

3 结论与建议

1) 使用模糊评价模型对煤矿底板突水的判别结果与实际结果基本吻合, 说明该方法具有较高的可信度和准确度, 是可行的。

2) 模糊评价模型在利用原始数据时对数据进行了无量纲化处理, 可提高数据使用的准确性。