风险判别

2024-05-26

风险判别(精选7篇)

风险判别 篇1

一、引言

中小企业的高成长性及发展的不稳定性, 使得对其信贷风险的度量及判别显得尤为重要, 但由于市场较少对其进行信用评级及其历史违约数据的缺乏, 使得许多依赖上述条件的现代信贷风险度量模型无法应用, 而以上市公司股价为基础的KMV信贷风险度量模型则可以很好地发挥作用, 在当前条件下, KMV模型主要是以违约距离来进行判别。

KMV模型的违约距离主要是基于上市公司股价, 较少涉及公司的财务数据。但公司出现信贷违约往往跟企业的财务状况紧紧联系在一起, 后者是前者的反映。作为中小企业, 其财务指标是否可靠, 其对违约判别的效果如何, 尚不得知。为了说明违约距离跟财务指标的关系及比较二者在判断中小上市公司违约效果的优劣, 本文探讨考虑违约距离的违约判别模型, 评价其判别效率, 并与无违约距离的违约判别模型及KMV模型的违约距离三者进行判别比较。

在判别模型的选择上, Altman (1995) 在对神经网络法等动态判别模型和传统判别分析法的比较研究中得出:动态模型如神经网络模型尚不够成熟, 对它的应用仍处于探索、实验阶段。而传统的统计模型发展得比较成熟, 计算也相对简单, 应用也较为广泛。在传统的统计模型当中, 由于线性判别模型对预测变量有着严格的联合正态分布要求, 或者要求协方差矩阵相等, 然而通过实证发现大多数财务比率并不满足这一要求, 而逻辑 (Logistic) 和概率 (Probit) 回归方法则没有这方面的要求, Probit概率模型的判别效果一般与Logistic模型判别的效果相差不大。许多学者对违约判别进行了研究。Ohlson (1980) 使用概率模型 (Logistic&Probit) 分析财务困境预测问题, 他的研究得到了96.12%的判断正确率。李沃墙、许峻宾 (2003) 在传统财务比率变量基础上加入违约距离等信用风险变量, 应用Logistic及ANN模型构建财务危机预警模型, 该研究结果显示, 信用风险变量降低了全体样本预测准确率, 却使得验证样本预测准确性提升。谭久均 (2005) 运用中国A股上市公司数据研究违约距离在财务预警模型中的作用, 研究结果表明, 违约距离可提升财务预警模型的拟和优度和预测能力, 但提升效果较为有限。

本文采用Logistic模型来进行违约判别, 结合违约距离, 对不同情况下的判别效果进行比较。在用Logistic模型进行分析时, 本文采用因子分析与Logistic回归分析相结合的方法, 即利用因子分析方法从指标中找出最能反映原始信息的几个主因子, 再将这些独立性比较好的公因子进行Logistic回归分析, 从而建立模型进行违约判别分析。

二、模型描述及参数设置

KMV模型是将公司股票价值具有的期权特征思想推广到公司信用风险评价中。其基本思想是把公司股权看作以资产的市场价值为标的资产, 负债的账面价值为执行价格、负债的到期日为执行日期的看涨期权, 认为资产结构与公司价值密切相关, 而违约概率是与债务额和公司资产结构相关的内生变量。它假设当公司资产价值低于某个水平时, 违约就会发生, 在这个水平上的公司资产价值被定义为违约点DPT。

KMV模型的计算有两个关键步骤:一是根据公司股票价值的期权特征, 利用期权定价模型可以倒推出公司资产的市场价值及其波动率;二是计算公司的违约距离和期望违约率。

第一, 计算公司资产价值和资产波动率。

股权价值的波动性σE与企业资产价值波动性σA之间在理论上的关系为:

式 (1) 、 (2) 中, N (·) 为标准正态分布函数;VE、σE、D和r分别是股权价值、股价波动率、总负债、无风险收益率, 均为已知或可计算得来;T是债务偿还期;只有资产价值VA和资产波动率σA为未知量, 可由方程式 (1) 和 (2) 运用迭代技术通过编程求解。本文中, 股价的波动率采用GARCH模型进行估算;股权价值中非流通股计算采用股改中的协议转让交易价格作为样本回归得到, 即:股权市场价值=流通股市值+ (0.99576+0.60973*每股净资产) *非流通股股数;债务偿还期限定为一年;无风险收益率采用一年期定期存款利率。

第二, 估计违约点。KMV模型中违约点被认为是短期负债与长期负债的一半之和, 本文基于中小企业的实际, 采用被ST的中小企业总资产对长期负债与短期负债的回归, 得到违约点为:

DPT=1.11×SD+0.65×LD, SD为短期债务, LD为长期债务。

第三, 计算违约距离DD。违约距离作为一个度量信用风险的指标, 指的是公司资产价值的期望值到违约点DPT之间距离, 以资产市场价值的标准差个数表示。违约距离越小, 说明违约的可能性越大, 反之则越小。假设资产价值服从对数正态分布, 在BSM模型中, 违约距离可表示如下:

三、实证分析

中小企业是相对大企业而言的, 它是一个相对的概念。本文从沪深两市中选取实证所需的上市中小企业, 选择条件为:2005年1月1日之前在沪深证券交易所上市的公司, 流通股5000万股, 且2004年12月31日前的主营收入或资产总额5亿元。在选出的公司中删除那些停牌时间较长的公司, 最后筛选出111家公司, 这些公司只发行了A股, 没有B股、H股等。同时选取这些公司2005到2008年上半年间每半年的每股净资产、流通负债和长期负债, 每个交易日收盘股价、流通股股数和非流通股股数等 (数据来源于Wind数据库) 。

由于ST、ST*公司比一般正常的上市公司具有较高的信贷风险, 其经营能力、获利能力、筹资能力都比一般公司要差, 其被实施ST或ST*也是公司的信用状况恶化的表现。实际情况证明, 公司违约与被ST、ST*间具有很强的相关性, 因此下面的分析均以ST、ST*近似作为公司出现信贷违约的标志。

选取样本及相关数据后, 根据前述的KMV模型的参数估计方法, 用Matlab编程实现KMV模型的Newton迭代算法可以得到公司的资产价值、资产价值的波动率, 通过违约点的计算, 从而可以得到公司的违约距离。最终得到了所选中小上市企业2005年~2008年上半年间每半年的公司价值VA、企业资产价值波动率σA和违约距离DD。

第一, 违约距离判别。在本文选取的111家中小上市企业在这三年半时间内, 有现在是ST的, 有现在不是ST股, 但曾经被ST过, 本文把这些每个年度内被ST或ST*的股票与正常非ST股分别整理出来进行均值的比较, 正常公司与ST、ST*公司半年的DD均值情况如下图1:

从图1可以看到, 正常经营的中小上市企业其违约距离明显大于ST或ST*的企业, 模型在此能对二者进行区分, 从而说明KMV模型对中小上市企业的信贷风险度量是有效的。具体来看, 中小企业整体的违约距离均值从2005年至2006下半年间平稳变化, 但从2007年起变小, 整体的违约距离变小, 从而信贷违约的可能性也就在增强。其中, 正常公司的DD值从2005上半年到2006下半年经过一段小幅的上升之后, 其后几年总体出现了下降仅在2007下半年出现了一定的上升;相对而言, 非正常公司的违约距离DD值变化较为平稳, 整体在低位徘徊。这种情况的出现使得二者的差距在这几年间至2006下半年达到峰点后出现了下滑, 二者差距不断缩小。从现实情况的解释来看, 主要认为是受到市场和宏观经济整体大环境影响, 同时, 违约公司与非违约公司违约距离的差距在近几年变小也与股权分置改革有关, 股改使得公司的股权价值波动率变大, 而股改的公司中, 又主要是以正常的公司为主, 所以缩小了二者的差距。

第二, 基于违约距离DD的Logistic信贷违约判别。从ST制度的运作过程来看, 中国证监会是根据上市公司ST前一年的财务状况来决定其当年是否会被ST处理, 所以本文拟用中小上市公司ST前二年的数据针对ST当年的ST情况进行违约判别, 建立相应的信贷危机预警判别模型。

本文从选取的111家中小上市公司中挑选出在2005年到2008年间被ST或ST*的公司, 并采用这些公司ST前二年的财务数据 (31个财务指标) , 数据来源于Wind数据库。同时, 为了进行对比, 本文也选取与这些ST或ST*公司的行业类别相同、资产规模相近且在对应年度财务状况相对良好的中小上市公司, 并分为估计样本组和检验样本组。

先对选取公司的财务指标进行显著性检验, 再对指标进行因子分析, 进行因子分析的同趋性及相关性检验, 最后筛选出12个指标, 通过因子分析可以得到两个公因子, 并得到各公司的因子得分。

在因子分析基础上, 可以对估计样本组进行Logistic回归, 得到考虑违约距离情况下的判别模型:

及不含违约距离DD下的Logistic判别模型:

由于公因子F1在两种情况下均不显著, 最终没有进入到回归判别模型中。

得到判别模型后, 可以对模型的判别能力进行检验。把模型代入检验样本组, 得到模型的判别的准确率, 本文设定概率阀值, 若得出的预测值p大于0.5, 则表明模型预测该中小企业公司将违约, 反之则不是。判断效果如表1所示:

总体上看, 含DD的Logistic违约模型对上市中小企业的判断预测能力高于不含DD的情况, 分别为85.72%和75%。具体而言, 在对于违约公司的判定上, 含DD的准确率很高, 没有判错的情况出现, 而不含DD的模型则只有90%的准确率, 对于违约公司的判别非常重要, 如若误判, 则会把违约公司当作正常公司来看待, 此时商业银行对其贷款就会出现信贷风险, 造成损失。在对正常公司的判定上, 含DD的模型也高于不含违约距离DD的情况, 分别为77.78%和66.67%。综合比较看出, 无论是对违约公司的判别还是对正常公司的判别, 含有DD的模型效果均好于不含DD的模型, 这说明违约距离DD在对信贷风险的识别上比其它普通的财务指标包含了更多的信息, 具有更好的判别效果, 能够提高预警判别模型的判定效率。

第三, 模型效率比较。为了对不同风险计量进行比较, Sobehart等人 (2000) 提出了累积精确度 (CAP, Cumulative Accuracy Profiles) 分析方法, 通过标准化各种风险计量模型的预测结果, 比较模型之间性能优劣。正因为这种优势, 该方法已经被国际著名信用评级机构穆迪公司广泛采用。本文将采用CAP分析方法来评价模型的预测效果。

CAP曲线是一种直观的量化的模型性能评估工具, 它描绘了在不同风险分数百分比下违约事件的累积概率分布。假定风险评估模型输出的分数越低, 公司风险越高, 则CAP曲线可以如下绘制:根据模型算出的风险分数按风险大小从大到小排序, 即高风险公司排前面, 低风险公司排后面;给定一个风险分数, 在总样本中, 将所有小于或等于该分数的公司的数量占总样本数量的比例记为x, 而在违约样本中, 将所有小于或等于该分数的违约公司的数量占违约样本数量的比例记为Y, 这样在直角坐标系中就可确定一个点 (x, y) ;重复步骤2, 给定不同水平的风险分数, 连接所有的点, 即可得到CAP曲线。信贷评估模型的CAP曲线应位于完美CAP曲线和随机CAP曲线之间 (如图2) , 越接近完美CAP曲线, 说明模型预测判别能力越强, 否则越接近随机CAP曲线, 模型效果越差。

本文对以违约距离DD为判别依据的KMV模型、含违约距离的Logistic模型、不含DD的Logistic模型进行对中小企业的信贷违约判别效率的比较。按CAP绘制方法分别绘制上述三种模型的CAP曲线, 如图3所示。

图3中横轴表示判别过程中被排除公司数目占公司总体数目的百分数, 以DD为例, 若以DD=2为违约临界, 小于2的公司当作违约公司给予排除, 文中以10%为间隔, 分别从10%、20%, 一直到100%, 从而也得到了离散下的柱状CAP图。

从三种模型的CAP曲线图可以看到, 以违约距离作为判别的KMV模型明显好于其余两种模型, 其CAP曲线离完美曲线最近, 同时, 含DD的Logistic判别模型也优于不含DD的情况, 从而充分说明了违约距离在解释和判别中小上市企业可能违约的优势。通过比较也知道, 单独违约距离DD的解释度要高于含有其它普通财务指标的混合情况, 说明只要基本满足KMV模型的假设, 其判别和预测是比较客观准确的。而其它判别分析方法其性能很大程度上取决于自变量 (财务指标) 、训练样本和统计方法的定义和选取, 人为干预的主观因素比较多, 从而影响模型的预测性能。综合上述得出, 在对中小企业的信贷度量和判别上, KMV模型具有其它判别分析方法不具有的优势, 优于其它判别模型。

综上所述, 中小企业由于其本身的快速成长性, 从而不容易对其信贷风险进行度量和判别, 而基于上市公司股价的KMV模型能较好地解决这个问题。本文以KMV模型的违约距离为基础, 通过与财务指标为变量的Logistic模型结合进行比较, 发现违约距离能很好地提高对中小上市公司的信贷违约判别, 整体准确率较高, 并且优于以财务指标为依据的其它模型。当然, 本文选取的数据和评判的依据主要是基于上市中小企业, 对于违约距离的判定效果在其它领域的情况, 还需进一步论证。

参考文献

[1]曹道胜、何明升:《商业银行信用风险模型的比较及借鉴》, 《金融研究》2006年第10期。

[2]谭久均:《财务指标与违约距离相融合的上市公司财务预警模型》, 《系统工程》2005年第9期。

[3]夏红芳、马俊海:《基于KMV模型的农业上市公司信用风险实证分析》, 《农业经济问题》2007年第10期。

[4]张泽京、陈晓红、王傅强:《基于KMV模型的我国中小上市公司信用风险研究》, 《财经研究》2007年第11期。

风险判别 篇2

1资料与方法

1.1 一般资料

回顾性分析我院骨科2006年1月至2008年12月期间接受手术治疗的骨折患者资料320例,患者年龄均大于65岁,平均(74.6±8.9)岁,男102例,女218例。常见骨折类型为髋部骨折(123例),肱骨近端骨折(38例),桡骨远端骨折(33例),脊柱骨折(28例),踝关节骨折(20例)等。

1.2 研究方法

通过查阅《希氏内科学》、《现代麻醉学》等有关资料文献,编制了老年骨折患者情况调研表(见附表),从生活能力、心血管、呼吸、脑血管、泌尿、消化、内分泌、营养、骨折类型、手术结果等17个方面来衡量老年人的伤前生活状况、健康情况、理化指标、受伤程度,特别强调了对老年人在受伤以前的生活自理能力的判定。将筛选整理的300余份资料的有关数据输入EpiData软件数据库,将手术结果区分为优良与差二大类,其中“优良”为安全度过围手术期,“差”为围手术期死亡或发生严重不可逆并发症。使用SPSS软件进行统计分析,Fisher判别建立判别式。

将2009全年度老年骨折手术患者的情况代入上述判别式进行检验,得出该判别式的灵敏度、特异度等指标。

2结果

2.1 判别式建立

判别式:

Y1=-181.085+3.877N3+0.809N5+0.914N11+86.957N12-0.229N15+13.634N16+2.260N18+1.942N19+0.405N22

Y2=-211.479+5.318N3-0.473N5+2.833N11+101.943N12-0.099N15+1.687N16+2.393N18+2.831N19+0.338N22

其中N值对应调查表中各项目编号。将每个患者的情况带入上述两个方程,其中N3、N5、N11、N12、N15、N16的取值对应答案A、B、C、D分别是1、2、3、4;N18、N19和N22的取值就是原始数值,结果比较两个方程Y值大小,Y值大的一类就是该患者应该所属的一类,(如Y1>Y2,则说明该患者判别结果优良,能够耐受手术;如Y1<Y2,则说明该患者判别结果为差,不能耐受手术)。

2.2 判别式检验

将2009全年度老年骨折手术患者128例的情况使用上述判别式进行检验,该组病例平均年龄(76.8±10.1)岁,男48例,女80例。其中髋部骨折76例,肱骨近端骨折16例,桡骨远端骨折10例,脊柱骨折6例,踝关节骨折8例,其他12例,年龄以及病种构成与以往病例类似。判别结果与实际手术结果进行比较(见表1),该判别式灵敏度:106/106+9=92.17%,特异性:9/9+4=69.23%。

3讨论

随着生活质量的提高,人类寿命逐渐延长,老龄人口数量逐渐增加,全世界每年发生骨折的老年患者将明显增加,据统计在65岁以上的人群中,一旦发生髋部骨折,12%~20%的患者死于合并症,如肺炎及其他感染,50%的患者终生需要他人护理, 没有可能恢复到骨折前的生理水平[1]。传统的保守牵引治疗老年髋部骨折,骨折愈合缓慢,卧床恢复时间长,骨科及内科并发症发病率高,据报道,在老年髋部骨折当中,非手术治疗比手术治疗高死亡率4.5倍。为提高老年骨科患者的生活质量,现在多数学者主张采取手术治疗,而手术治疗时,虽然具有术后康复快,便于护理,避免了长期卧床带来的一系列并发症的优点,但是手术所面临的风险也成为外科医生、患者和患者家属都无法回避的问题。如何更好的保证手术安全,提高治疗的成功率,准确判断患者对手术的耐受能力,判断围手术期风险,对于老年骨折的治疗具有重要意义。

目前大多数医护人员在向患者及其家属交代病情时,常常采用“有可能”, “万一”,“可能性不大”等言语,对于这些概念模糊的言语患者主观上难以理解和接受。多凭借临床经验确定是否进行手术治疗,客观指标少,不同医师间决策差异很大。因此,量化手术风险更具临床价值,无论是对于医生还是患者家属都具有非常重要的意义,尤其对于高风险的手术患者,更具有说服力。“手术风险评估”就是对一个疾病作出正确诊断后如确需手术,其手术适应证是否明确,手术过程可能出现的各种情况考虑的是否全面、适当,以及手术的预期效果如何的一种估计。

而国内外以往对于量化风险评估的研究成果较少,本研究旨在对老年骨折患者围手术期风险建立一种评价方法,制定出手术风险的预测指标,希望能为老年患者的治疗提供判别准确、简便易行的判断标准,为治疗方案的选择提供依据。

根据判别式可以看出,高龄骨折患者围手术期风险不仅与年龄、骨折类型等有关系,亦与血色素、血糖等理化指标等明显相关,这就告诉我们临床上如果遇到内科合并症较多的老年骨折患者,我们可以术前积极纠正内科疾病改变生理学因素当中可变因素,如术前对于紧张、骨折疼痛刺激等所致的一过性血压、血糖增高(排除高血压病),经过积极治疗,血压、血糖正常,那么术前评分将产生变化;对于骨折失血导致的血色素降低等因素若经治疗,达到或接近正常范围,都将影响评分进而可能影响围手术期风险评估结果。

自上世纪70年代以来,一些评定患者死亡率和并发症发生率的评分系统相继推出,经过多年的临床应用,其价值已经得到证实。1991年Copeland等[2]人根据手术患者主要症状、体征、生理学参数和手术严重度,提出了一个使患者手术预后评估标准化的方法即死亡率和并发症发生率的生理学和手术严重程度评分系统(The Physiological and Operative Severity Score for the enumeration of Mortality and Morbidity)简称POSSUM系统,目前国内、外骨科已将POSSUM系统引入临床,并得到了大量临床病例的验证[3,4]。但在应用过程中,运用较为繁琐的公式来计算,费时、费脑、不能较快捷地反应出医生及家属所需的手术死亡率及并发症发病率的预测值,所以该方法的应用无法得到广泛的推广。本研究所提出的判别式评估方法相对比较简单扼要,着重点在于通过患者日常生活状态以及理化客观指标进行评估,临床应用上比较方便,不需要繁琐的运算以及软件支持,对硬件的要求也比较低,比较适合基层医院开展,对临床工作提供一定的参考意见。

运用本研究所建立的判别式,将本院近期老年骨折患者的资料输入判别式进行检验,与实际手术效果对比,结果有所偏差。分析原因可能是日常医疗实践中对入院手术病例在门急诊就诊时临床医师已经根据经验进行了初步筛选,剔除了一部分不适合手术的患者未收治入院,从而造成本课题统计住院病例中围手术期内死亡或手术效果差的例数相对较少,仅占全部统计病例数的10%左右,统计结果建立的判别式可能因此出现偏差。下一步我们计划在临床工作中,进一步累积病例资料,对判别式进行修正,用实践来检验该判别式的临床价值。

总而言之,该判别式具有一定的临床意义,能够判别患者能否耐受手术治疗。同时量化手术风险,可以减少因患者对手术风险了解不够而造成的纠纷。通过将本院近期老年骨折患者的资料输入判别式进行检验,该判别式的初步价值得到证实,但其在临床应用的进一步价值尚待于大量临床应用的证实。

参考文献

[1] Lane JM, Riley EH, Wirganowicz PZ. Osteoporosis: diagnosis and treatment. J Bone Joint Surg Am, 1996,78:618-632.

[2] Copeland GP, Jones D,Walters M. POSSUM: a scoring system for surgical audit. Br J Surg, 1991,78:355-360.

[3]Mohamed K,Copeland GP.An Asssessment of the POSSUM sys-tem in orthopaedic surgey.J Bone Joint Surg,2002,84(5):735-739.

风险判别 篇3

一、数据来源

本文数据, 是基于爬虫技术对淘宝平台进行数据采集。其工作原理:预先设定的一个或多个初始种子URL, 通过初始种子URL解析出页面中涵盖的URL列表, 并在程序运行时从队列中持续获取新的URL, 对其进行访问下载。下载完毕后需要将所需信息解析出来并保存到站点数据库中, 并获取当前页面新URL保存至队列, 循环至系统被满足方可停止。

本文主要是对国内最大的电子商务网站:淘宝网进行抓取。淘宝网的网址:https://www.taobao.com。抓取的主要字段为:店铺名、店铺动态评分、价格、销量、评论数、开店时长、所在地、退款率、纠纷率等。

二、数据预处理

本次采集数据主要存在以下问题:

1. 缺失值

经过整合后会发现数据存在不完整的问题, 如累计评论、月均销量、最高价、最低价、平均价格、商品数、评论率等字段的部分信息是存在缺失的。针对此问题, 本文通过excel中的vlookup函数重新匹配统计信息。对于仍然不能匹配到信息的数据, 若销量该店铺等级较低, 且近期无销量, 则选择剔除, 若店铺等级较高, 且交易额较高, 有较高的研究价值则需通过人工统计的方式进行修正。

2. 异常值

经过观察, 此次抓取数据的异常值主要分为两类, 一是明显的信息存储方式有误, 二是不符合常识经验。经观察发现一级类目的数据存在形式有误, 非文本信息, 因此需要对这部分数据进行修正。另一部分异常值是一些店铺为天猫店且较为知名。但是抓取到的累计评论与月销量却为空, 因此对于这样的异常数据, 考虑是否验证是抓取过程中程序漏抓。

3. 噪声数据

经过以上修正后, 携带基础信息数据的缺失值, 以及异常值问题已经得到解决, 下面将EXCEL数据导入SPSS, 观察变量的随机误差或方差, 去除附属数据的噪声, 达到光滑数据的目的。数据处理初步完成之后, 需要将数据转换或统一成适合于挖掘的形式。包括数据泛化, 规范化, 属性构造等。

三、模型选择

数据预处理后, 我们得到了一组具有高质量、规整、统一的适合数据挖掘的数据, 选取的方法为适合分类的监督式学习方法支持向量机 (SVM) 。

四、实证

1. 基于SVM支持向量机的判别虚假交易模型

由于SPSS Statistic中仅支持神经网络, 以及决策树模型的建立, 因此本文在SPSS modeler中建立SVM支持向量机模型。

首先创建基本流, 建立模型。本文选取多核函数的SVM模型, 选中分区, 插入模型SVM, 在第二个SVM模型中选择“专家”选项卡, 将模式设置为专家, 将内核类型设置为多项式。

多核函数的SVM模型流如下所示:

2. 基于SVM支持向量机的模型效果评估

下面将根据分析结果, 验收模型的训练结果。

“比较$S-是否为虚假交易与是否为虚假交易”为第一次建立的“是否为虚假交易”模型的预测结果。“比较$S1-是否为虚假交易与是否为虚假交易”为新增SVM“是否为虚假交易”模型的预测结果, 此模型对于14177条“1_训练”记录, 正确预测率为69.77%;对于14296条“2_测试”记录, 正确预测8689条记录, 正确预测率为60.78%.

“$S-是否为虚假交易$S1-是否为虚假交易之间的一致性”代表在两个模型中预测结果相同的记录的统计信息。在“1_训练”中, 两个模型预测结果相同的有8348 (占训练记录总数59.13%) 条记录, 在“2_测试”中, 两个模型预测结果相同的有8017 (占测试记录总数56.08%) 条记录。

“比较一致性与是否为虚假交易”代表两个模型预测结果相同的记录中分别被正确预测和错误预测的记录数。

通过对以上模型效果的评估可见, 基于SVM支持向量机的判别虚假交易模型的准确率较高, 模型预测的正确率为76.35%。

五、结论

通过数据采集, 数据存储, 数据清洗, 数据建模各个环节的处理, 本文最终实现了判别电子商务虚假交易模型的建立。通过各个指标间的对比, 可以看出判别电子商务中的虚假最重要的指标是评论率, 即评论率越高的店铺, 虚假的可能性越小。其次店铺所属行业, 店铺等级, 店铺在售商品的最低价等也是判别电子商务中是否存在虚假的重要指标。而通常人们所关心的销量指标, 经过模型的推算, 其实对于判别虚假交易并没有太大的指导意义, 并非大众经验判断的某店铺所售商品的销量越高, 该店铺的存在虚假交易的可能性越小。

本文的电子商务数据覆盖率据淘宝市场份额估算, 目前仅为全网的50%。因此后续的优化空间可整合各大电子商务平台的数据在此基础上构建深度判别的模型。

摘要:在互联网+的新经济模式下, 电子商务高速发展的同时也存在大量问题, 其中线上交易存在大量虚假交易的问题是制约电子商务领域进一步发展的最大瓶颈。本文旨在构建出能够判别电子商务中的虚假交易的模型, 为后续的深入研究奠定基础。

关键词:虚假交易,判别,监管

参考文献

[1]周昊明.销量数据挖掘技术及电子商务应用研究[D].广东工业大学, 2014.

[2]汪赫瑜, 丛喜宾.数据挖掘技术在C2C电子商务中的应用[J].辽宁工程技术大学学报 (自然科学版) , 2008, S1:208~210.

风险判别 篇4

在地震作用下, 饱和砂土中孔隙水压力逐渐上升, 部分或完全抵消土层骨架承担的有效应力, 从而发生液化。地震液化现象往往造成地表喷砂冒水、地裂滑坡和地基不均匀沉降, 危及构筑物的正常使用与安全。因此, 饱和砂土或粉土的地震液化可能性判别工作, 是场地稳定性评价的一个重要组成部分。国际上较多的采用Seed提出的简化法进行液化判别。

1 Seed简化法

Seed简化法属于试验—分析法[1], 也是最早提出的可判别具有水平地面自由场地液化的方法。实质是将砂土中由振动作用产生的剪应力与产生液化所需的剪应力 (即在相应动力作用下砂土的抗剪强度) 进行比较。

经H.B.Seed修正后简化成等效周期应力比CSR与地基土的周期阻力比CRR的比较。

如果FS=CRR/CSR>1, 则判别为不液化;如果FS<1, 则判别为液化。许多影响液化的因素均得到适当考虑。

2 周期应力比 (CSR) 的评估

周期应力比是Seed和Idriss (1971) 根据场地的地震基本设计参数计算的, 目前H.B.Seed等提出的计算表达式被普遍接受。后来考虑了地震震级的影响, 通过震级比例系数将CSR转换为震级Ms=7.5下的等效CSR7.5, 即[1,2]:

对于常规和非关键项目, 可以利用下面公式估算rd均值 (Li-ao&Whiteman 1986) :

其中, CSR7.5为循环应力比;τav为地震产生的平均剪应力, k Pa;σv0为土体计算深度处竖向总应力, k Pa;σ'v0为土体相同深度处竖向有效应力, k Pa;amax为地震动峰值加速度, m/s2;g为重力加速度, m/s2;rd为应力折减系数;z为地表以下深度, m;MSF为震级比例系数。

3 周期阻力 (CRR) 的评估

3.1 SPT方法评估周期阻力比 (CRR)

地基土的周期阻力比可按照下式计算[1,2,3]:

CRR7.5为循环阻力比; (N1) 60CS为经细粒修正后的标准砂标贯击数;FC为细粒土含量 (指粘粒和粉粒含量之和) ; (N1) 60为将现场实测值修正为上覆荷载为100 k Pa, 能量传递效率为60%的标贯N值。

3.2 CPT方法评估周期阻力比 (CRR)

利用CPT计算周期阻力比CRR, 一般采用下式 (Robertson&Wride method, 1998) [1]计算:

其中, (qc1N) CS为1个大气压条件下得到等效纯净砂归一化锥尖阻力。

锥尖贯入阻力的归一化:

根据下列两个公式对锥尖贯入阻力进行归一化:

其中, CQ为锥尖贯入阻力归一化系数;Pa为1个标准大气压, 与σ'v0单位相同;n为土类系数, 根据土类的不同, n值从纯净砂到粘粒土逐渐由0.5变为1.0;qc为实测锥尖贯入阻力。

浅层土中, 由于上覆应力较小, 造成CQ值较大, 当CQ>1.7时, 应予以剔除。

当Ic≤1.64时, Kc=1;

当Ic>1.64时,

4 实例分析

本堆场工程位于南亚某国, 整个场地区域通过抽砂吹填而成。属于地震中度活动区, 设计地震震级M=6.5, 动峰值加速度PGA=0.24g。原地面标高为0.0 m~+2.0 m间, 吹填后地面标高为+6.0 m左右。地下水位在+2.0 m~+3.0 m间。

4.1 地质情况

根据地勘情况具体如下:层①:为中密砂~密砂, 不包含或包含少量泥沙。SPT (标准贯入试验) 中“N”值介于10~44之间。深度变化范围为El.+2.16 m~El.-0.14 m。层②:第②层大部分为十分疏松的砂岩~中密粉质细砂, SPT“N”值介于4~11之间的砂质粉土。该层深度变化范围为El.-0.84 m~El.-3.14 m。层③:第③层大部分为中密砂~密砂, 在所有钻孔 (BH号A1-08除外) 都有体现。SPT“N”值介于14~43之间 (BH号A1-06a El.-4.31 m得到的N值为58) 。每个钻孔中, 该层从地平面延伸至最大探测深度10.5 m (El.-4.28 m~El.-5.81 m) 。BH号A1-08有中等密致砂质粉土, El.-2.76 m, 并伴随有松散粉质砂土, El.-3.76 m, 密致砂质粉土, El.-4.26 m, 从地平面延伸至最大探测深度10.5 m。

4.2 现场测试

根据地勘SPT数据计算, 砂土液化集中在层②。为验证根据地勘SPT试验点在层②所得到砂土液化情况的准确性, 在3个地勘点钻孔位置旁1 m~2 m范围内进行3个CPT试验, CPT贯入深度超过层②底部。

采用简化的Seed法对地勘SPT试验数据及CPT试验数据进行分析、对比, 得到周期相对应深度的周期阻力比 (CRR) , 并与周期应力比 (CSR) 对比得到安全系数FS。

4.3 SPT及CPT数据分析

根据表1及表2数据, 利用简化Seed法对SPT及CPT数据进行分析, 两组数据得到的孔BHAB-6, 孔BHAB-8及孔BHAB-12在层② (十分疏松的砂岩~中密粉质细砂) 基本处于液化状态, 且同一深度两组数据 (SPT及CPT) 得到的安全系数较为接近。

5 结语

运用简化的Seed法分别对地勘SPT试验数据及CPT试验数据进行分析, 根据不同数据得到的砂土液化安全系数较为接近, 层②处于砂土液化区域, 需进行地基处理加固以消除地震液化危险, 可采用振冲、强夯等方法对地基进行相应处理[4]。

摘要:根据美国标准ASTM1586及ASTM5778进行了SPT和CPT试验, 采用修正的Seed判别法分别对所得到的SPT及CPT数据进行砂土液化评估判别分析, 得到更为准确的结论, 为抗震设计及地基处理提供了依据。

关键词:CPT试验,SPT试验,修正的Seed法,砂土液化

参考文献

[1]T.L.Youd, I.M.Idriss.Liquefaction Resistance of Soils:Summary Report from the 1996 NCEER and 1998 NCEER/NSF Workshops on Evaluation of Liquefaction Resistance of Soils[J].Journal of Geotechnical and Geo-environmental Engineering, 2001 (10) :297-313.

[2]胡长友, 刘方, 李刚.港珠澳大桥隧道工程地震液化判别[J].水运工程, 2013 (7) :57-61.

[3]唐世栋, 罗立疆, 林华国.国内外砂土液化判别方法的比较[J].工程勘查, 2007 (4) :4-6.

离群值判别方法比较 篇5

关键词:计量,离群值,判别方法对比

1概述

离群值是样本中的一个或几个观测值, 它们离开其他观测值较远, 暗示它们可能来自不同的总体。离群值有两类来源, 第一类离群值是总体固有变异性的极端表现, 这类离群值与样本中其余观测值属于同一总体。第二类离群值是由于试验条件和试验方法的偶然偏离所产生的结果, 或产生于观测、记录、计算中的失误, 这类离群值与样本中其余观测值不属于同一总体[1]。

在计量领域, 对在规定测量条件下测量的量值, 测量条件下测得的量值用统计分析的方法进行的测量不确定度分量的评定, 是测量不确定度的A类评定。测量中的失误或突发因素不属于测量不确定度的来源。在测量不确定度评定中, 应剔除测得值中的离群值 (异常值) 。离群值的剔除应通过对数据的适当检验后进行[2]。

离群值分为单侧情形和双侧情形, 单侧情形分为上侧情形与下侧情形。若无法认定单侧情形, 按双侧情形处理。

2抽样检验理论

文章介绍的离群值判别方法, 均是建立在样本服从正态分布的假设上。抽样检验理论主要是建立均值与方差的估计。

2.1符号及定义

文章符号及定义如表1所示。

2.2均值及标准差

当不知道总体标准差时, 用样本标准差估计作为总体标准差。样本标准差的计算有两种估计方法:贝塞尔公式、极差法。其中, 贝塞尔公式法是方差的无偏估计, 用于测量次数较多情况;极差法在测量次数较少时 (2≤n≤9) 应用。公式 (1) - (3) 分别为样本均值、贝塞尔公式, 极差法。

3离群值的判别

离群值的判别分两种情况:已知标准差、未知标准差, 下面分别介绍。

3.1已知标准差

已知标准差时, 使用奈尔检验法, 计算如公式4所示。将奈尔统计量与临界值表相比较, 若大于 α 条件下的值, 则是离群值。注意:单侧离群值时, 查表R1-α (n) ;双侧离群值时, 查表R1-α/2 (n) 。当统计量大于表中的值时, 是离群值。

3.2未知标准差

未知标准差时, 用贝塞尔公式或极差法计算样本标准差, 从而估计总体标准差。

未知标准差的统计量分为两类:统计量计算方法固定与统计量计算方法变化, 下面分别介绍。

3.2.1统计量计算方法固定

拉伊达准则、格拉布斯准则、肖维勒准则与奈尔检验方法有相似之处[4], 都是计算一个统计量, 再与相应的临界值表相比较。统计量计算如公式 (5) 所示。其中, 拉伊达统计量 (Ra) 与固定值3相比较, 若大于3, 则是离群值。

3.2.2统计量计算方法变化

狄克逊准则依据不同的样本量, 分别计算上侧 (高端) 离群值统计量与下侧 (低端) 离群值统计量, 再依据检出水平 α, 查表判断是否为离群值。虽然, 狄克逊准则将样本量由30扩充到100, 但一般来讲, 狄克逊准则用于样本量小于等于30次的离群值检测。

4结束语

已知标准差情形下, 采用奈尔检验法, 检测离群值;未知标准差情况下, 检验方法的选择与测量次数有关。其中, 关于统计量计算方法固定的检验方法选择, 取同测量次数, 同显著性水平下, 临界值表较小的检验方法。测量次数及建议使用准则如表2所示。

参考文献

[1]GBT 4883-2008.数据的统计处理和解释[S].

[2]JJF 1059.1-2012.测量不确定度评定与表示[S].

[3]师义民, 徐伟, 秦超英, 等.数理统计[M].北京:科学出版社, 2015.

计量装置接线异常情况判别 篇6

1.1 无电压互感器三相四线电能计量装置电压接线异常判别

计量装置电压接线正确,则智能电能表翻显各相电压数据均为220 V。若三相相电压翻显数据依次分别为0,220,220 V,则说明U相电压断线,若0 V<UU<220 V,则说明U相电压回路接线有问题,出现欠压现象。V相、W相电压失压或欠压,其现象同理。

1.2 有电压互感器三相四线电能计量装置电压接线异常判别

三相四线电能计量装置由于采用了电压互感器,因此计量装置电压失压或欠压可能发生在电压互感器二次侧,也可能发生在电压互感器一次侧。但由于电能计量装置中电压互感器均是采用3只单相电压互感器组合而成,3只单相电压互感器之间并没有磁通联系,故其一次电压异常与二次电压异常现象一致。

电压互感器三相四线电能计量装置接线正确时,则各相对地电压翻显均为57.7 V。若三相相电压翻显数据依次分别为57.7,0,57.7 V,则说明v或V相电压断线。若0 V<UV<57.7 V,则说明v相或V相电压回路接线有问题,出现欠压现象。u相或U相,w相或W相电压失压或欠压其现象同理。

1.3 三相三线电能计量装置电压接线异常判别

三相三线电能计量装置电压互感器宜采用V,v型接线,因此三相三线电能计量装置电压断线发生在一次侧、二次侧均有可能。电压Uuw是矢量合成电压,且电压互感器V,v型接线二次侧均采用v相接地,所以三相三线电能计量装置正确接线各相对地翻显电压分别为Uu=100 V,Uv=0 V,Uw=100 V。

(1)三相三线电能计量装置二次电压接线异常判别。

若各相对地翻显电压数据分别为0,0,100 V,则说明u相电压断线。

若各相对地翻显电压数据分别为100,0,0 V,则说明w相电压断线。

若各相对地翻显电压数据分别为50,0,50 V,则说明v相接地点前端电压断线。

若电能表计量值明显偏少,约为正常计量值的二分之一,各相对地翻显电压数据仍分别为100,0,100 V时,且又未发现其他异常情况,则说明是v相接地点后端电压断线。

(2)三相三线电能计量装置一次电压异常判别。三相三线电能计量装置电压互感器一次侧U相或W相断线分别与二次侧u相或w相断线现象一致,而一次侧V相断线则与二次侧v相接地点前端电压断线现象一致。

2 电能计量装置电流异常的判断

2.1 三相四线电能计量装置电流接线异常判别

翻显三相四线智能电能表电流可获得电流值,根据电力系统运行相关规定,三相电流应基本平衡。故若某相电流很小,则说明该相电流可能短接;若电流为零,则说明该相电流可能断线。

2.2 三相三线电能计量装置电流接线异常判别

不可忽视的判别式 篇7

Δ>0⇔直线l和圆锥曲线相交于不同的两点;

Δ=0⇔直线l和圆锥曲线有唯一一个公共点;

Δ<0⇔直线l和圆锥曲线没有公共点.

在多年的教学中发现, 同学们在解决直线与圆锥曲线位置关系相关题目时, 有时并不能注意判别式应当满足的条件, 而导致求解出错, 通过以下例子说明.

1.在平面直角坐标系x Oy中, 经过点 (0, ) 且斜率为k的直线l与椭圆有两个不同的交点P和Q.设椭圆与x轴正半轴、y轴正半轴的交点分别为A, B, 是否存在常数k, 使得向量垂直?如果存在, 求出k值;如果不存在, 请说明理由.

有些同学是按如下步骤求解的:

解由条件知直线l的方程为, 代入椭圆方程得:

此题结果出错的原因是忽略了方程 (1) 的判别式应成立.显然时, Δ<0, 不满足直线l与椭圆有两个不同的交点P和Q, 因此, 并不存在常数k2, 使得向量垂直.

2.已知一条抛物线和一个椭圆都经过点M (1, 2) , 它们在x轴上具有相同的焦点F1, 且两者的对称轴都是坐标轴, 抛物线的顶点在坐标原点.

(1) 求抛物线的方程和椭圆的方程;

(2) 假设椭圆的另一个焦点是F2, 经过F2的直线l与抛物线交于P, Q两点, 且满足, 求实数m的取值范围.

解 (1) 易求抛物线和椭圆的标准方程分别为:

对于问题 (2) , 有些同学是按如下步骤求解的:

设l的方程为x=ny-1 (n≠0) ,

设P (x1, y1) , Q (x2, y2) , 则

∴y1=my2与 (1) 、 (2) 联立消去y1, y2得

此处结果出错的原因, 依然是没有注意到方程y2-4ny+4=0的判别式Δ=16n2-16>0, 即n2>1, 从而导致结果出错.正确的结果为:

解得m>0且m≠1.

∴m的取值范围为 (0, 1) ∪ (1, +∞) .

上一篇:企业施工项目管理下一篇:安全缓冲区