概率密度估计

2024-05-31

概率密度估计(精选9篇)

概率密度估计 篇1

一、引言

参数法由于其良好的解析性质, 参数便于估计的特点而被广泛应用, 但参数法在使用时存在要求对概率分布有先验知识、拟合能力不足等缺点。非参数法由于其不需要概率分布的先验知识、对可得到的数据建模不需要进行一系列的假设、能拟合任何形式的概率分布的特点受到了金融理论界和实务界越来越多的重视。非参数估计应用的一个重要意义在于从而建立的模型更具可靠性和解释性。

非参数密度估计的核心问题就是核权函数的选择和窗宽的选择。核权函数在核估计中起光滑的作用, 即消除扰动的随机因素, 使得所得的曲线反应变量之间的实际经济关系。在非参数密度估计中, 由于高斯核具有良好的渐近性, 并且在常用的统计软件中都可以比较方便的实现, 因而经常被用于独立同分布数据以及时间序列数据的分析。然而, 高斯核有一个很大的缺陷, 即在支集的边界附近, 会对支集以外指定非零概率, 存在边界偏差。所以, 当目标概率密度函数的支集是无界的, 即抽样数据位于 (-∞, +∞) 时, 高斯核密度估计方法是一致相容的, 而在有界支集的情况下, 高斯核密度估计就不再适合。

针对这个问题, 国内外学者已经提出了很多新的方法和新的核估计。一种方法是Schuster (1985) 年提出的映像方法, 即通过映射在边界处的估计重新获得丢失的权重。尽管这种方法减少了偏差, 但是和内部比较, 边界部分仍然存在着很大的偏差。近年来, 也有一些学者提出用非对称的适应性核, 对支集以外的部分不分配权重, chen在1999年和2000年分别提出了对有界变量使用贝塔核密度估计以及对正的变量使用伽玛核密度估计, 他在2002年又将伽玛核应用到有正支集的回归曲线的局部线性估计中。Fernandez and Monteiro (2005) 对伽玛核函数提出了一个中心有限理论。

本文的目的是对正序列数据进行非参数密度估计时, 采用伽玛核密度估计而不是传统的高斯核, 这样就避免了边界问题, 并且估计出来的密度函数形状依赖于被估计处的点。并且通过模拟来说明伽玛核优于高斯核, 最后通过对股票板块风险的分析, 验证了伽玛核在正序列数据中不存在边界效应的优点。

二、伽玛核估计

我们观察一组满足强混合的非负平稳过程X1, …, Xn, 它的概率密度函数为f, 我们的目的是对x∈[0, ∞) 进行非参数密度估计。对伽玛核密度估计的定义如下:

这里核定义为:

伽玛核的形状以及平滑量随着密度估计的位置改变而改变, 这表明伽玛核是一个适应性密度估计, 这是伽玛核与高斯核以及其他对称核的一个重要区别。伽玛核的支集与所要估计的概率密度函数的支集相匹配, 因此在边界处估计时, 没有权丢失。伽玛核密度估计很容易实现, 不存在边界偏差问题, 并且一直是非负的。

三、模拟

实例1:采用指数模型, 解释变量服从标准正态分布, Xi~N (0, 1) , i=1, …, 1000, 模拟的模型为:

通过R软件产生Xi的1000个数据, 计算出Yi的值, 先画出Y的频率分布的直方图, 然后对Y进行非参数密度估计, 估计Y的概率密度分布情况, 分别采用高斯核和伽玛核进行密度估计。

对于窗宽的选择, 我们采用CV法, 由Hart和Vieu (1990) 提出。对于高斯核密度估计, 他们推出CV法是强混合条件下的渐近最优窗宽。而对于伽玛核密度估计, 也有类似的结论。

根据实例1所设的模型, Y的值都为正数, 这在图1所画的直方图中, 可以清楚地看出来。而通过高斯核密度估计, 由于高斯核对小于0的地方也分配了权重, 从而在负轴上也有了概率密度, 产生了边界问题。而用gamma核估计, 在小于0处没有分配权重, 估计的概率密度函数是从0开始的, 更好地估计了本例中的Y的密度函数, 不存在边界问题。

实例2:采用双曲线模型, 解释变量服从标准正态分布, Xi~N (0, 1) , i=1, …, 1000, 随机误差项{εi}独立同分布, 并且服从威布尔分布, 其形状和范围参数分别取0.91和1, 威布尔分布的选择参考Taoufik (2010) 。模拟的模型为:

同实例1, 对Y进行非参数密度估计, 估计Y的概率密度分布情况。如下图2所示:

根据实例2所设的模型, 随机误差项和解释变量都为正数, 故Y的值也都为正数, 在图2画了有关Y概率密度的直方图, 并通过高斯核和伽玛核分别作Y的概率密度估计。同样可以得出高斯核密度估计产生边界问题, 而用gamma核估计不存在边界问题。

四、实证分析

在实证分析中, 选取了两个行业板块的股票, 分析其波动的概率密度分布核估计图, 作为实证数据, 选取在上海和深圳上市的纺织服装和医药两个行业板块的股票, 构成两个统计总体。数据都来源于大智慧软件, 选取的时间段为2006年1月4日到2009年5月27日的总共825个交易日。考虑到在研究时段内, 每个地区的上市公司数量是在变化的, 一般地, 每个总体中的股票数是随时间变化而增长的。因此, 在纺织服装板块和医药行业板块中都选取了50支个股构成其统计总体。定义日收益率:

其中Yi (t) 是第t天的第i支股票的收盘价。对每一个交易日t, 都有50个收益率。

现在定义行业板块收益率的波动风险为:

标准差σ (t) 的数值, 刻画了行业板块第t天的动态波动风险, 都是正数, 通过非参数密度的高斯核和伽玛核分别估计来估计σ (t) 的概率密度分布, 比较其差异。

下面是2个行业板块的波动风险σ (t) 的概率密度分布直方图和非参数核密度估计图:

计算两个板块中伽玛核密度概率分布的期望值, 纺织服装板块和医药板块分别为0.0212和0.021, 两大板块波动率非常接近。

根据图3、图4可看出, 使用高斯核密度估计在横轴小于零的部分也分配了权重, 从而也有概率密度函数值, 而伽玛核密度估计是从零处开始的, 在小于零处不分配权重。

和很多经济上的数据一样, 股票收益率的波动值不会分布于整个x轴, 而是从大于零的某个值开始, 当这个最小值距离原点比较远时, 采用高斯核所产生的边界问题可以被忽略;但如果有大量的数据分布于靠近原点的地方, 则高斯核的边界问题会影响到分析结果。此时, 采用伽玛核就能够很好地避免边界问题。

五、结束语

在经济及财政数据中有大量的数据是有界的, 并且在边界处分布较多, 这里提出用伽玛核来估计正的序列数据的办法。伽玛核灵活性很强, 可以随着要估计的位置不同而分配不同的权重, 而在支集以外则不分配权重, 从而不会产生边界问题。通过蒙特卡罗模拟以及实证分析, 我们得出结论:即针对正序列数据, 伽玛核密度估计优于高斯核密度估计。

参考文献

[1]Taoufik, B., Jeroen, V., Nonparametric density estimation forpositive time series, Computational Statistics and DataAnalysis, 2010

[2]Sch uster, E., Incorporating support constraints intononparametric estimators of densities.Communications inStatistics-Theory and Methods 14, 1985

[3]Chen, S., Probability density functions estimation usinggamma kernels.Annals of the Institute of StatisticalMathematics 52, 471-480, 2000

[4]Fernandez, M., Monteiro, P., Central limit theorem forasymmetric kernel functionals.Annals of the Institute ofStatistical Mathematics 57, 425-442, 2005

[5]胡小平等.涨跌停板股票收益率的概率密度估计及其应用[J].统计与决策, 2008 (15)

[6]许冰.区域板块股票波动风险的概率相关与volatility差异[J].统计与决策, 2005 (11)

[7]叶阿忠.非参数计量经济学[M].天津:南开大学出版社, 2003

[8]薛毅, 等.统计建模与R软件[M].北京:清华大学出版社, 2007

概率密度估计 篇2

通过解决较复杂的概率问题,使学生体会建模的必要性。本节课的每一个环节中,我们都是以问题的解决为中心。初中阶段学生的好奇心和求知欲非常强,在学习中用频率来估计概率以及建立数学模型的有关知识后,具备了解决问题的条件,面对挑战,学生能通过自主探索,合作交流等学习方式解决问题,这时应充分挖掘学生的潜力,注重激发学生的兴趣,感受解决有关概率的实际问题的重要性。

教学方法上,提高学生动手动脑的能力,加强集体合作意识,扩大知识面,激发学习数学的兴趣,数学教学应该以学生的发展为本,让学生成为学习的主人,老师是学生学习的组织者,引导者,合作者。

从学生的生活经验与学习经验出发,本节课采取以下方法进行教学:

(1)引导――探索

爱因斯坦曾经说过“教育应该使提供的东西,让学生作为一种宝贵的礼物来享受,而不是作为一种艰苦的任务要他负担”。教学中创设情境引导学生积极参加思考,进行自主探索。

(2)活动――参与

通过操作,实践活动方式,调动多种器官参与,积极组织学生利用概率与统计的知识进行合理的推断。

(3)讨论――交流

提出问题,课堂讨论,交流反馈,增强学生的主体意识,提高学生运用知识解决问题的能力,在教学过程中重视学生的参与,给学生活动的.机会,思考的机会使学生在获取知识的过程中,开发智力,培养能力。

学习方法指导

在合理选择教法的同时,注重学生学法的指导,使学生不仅学会还要会学。本节课主要指导学生以下学法。

(1)自主探索

通过自主学习,体会转化的思想,类比的思想,培养学生良好的学习习惯,锻炼学生的意志品质,发展学生勇于探索,勇于创新的科学精神。

(2)合作交流

如何用频率来估计概率 篇3

一、填空题中的用频率估计概率

例1在课外活动中,小明同学在相同的条件下做了某种作物种子发芽的实验,结果如下表所示:

由此估计这种作物种子发芽率约为______(精确到0. 01).

解 : 由公式种 子的发芽 率 =(所有发芽种子的和/种子总数)可求出种子的发芽率为0.939,因为精确到0.001,故答案为0.94.

【点评】本题考查了百分率问题:(1)种子的发芽率=所有发芽种子的和/种子总数;(2)注意括号中的要求为精确到0.01.

例2有一箱规格相同的红、黄两种颜色的小塑料球共1 000个.为了估计这两种颜色的球各有多少个,小明将箱子里面的球搅匀后从中随机摸出一个球记下颜色,再把它放回箱子中,多次重复上述过程后,发现摸到红球的频率约为0.6,据此可以估计红球的个数约为______.

解:∵摸到红球的频率约为0.6,∴红球所占的百分比是60%. ∴1000×60%=600.

故答案为:600.

【点评】本题考查用频率估计概率,因为多次重复上述过程后,发现摸到红球的频率约为0.6,所以红球所占的百分比也就是60%,根据总数可求出红球个数.

二、选择题中的用频率估计概率

例3“六一”儿童节,某玩具超市设立了一个如图1所示的可以自由转动的转盘,开展有奖购物活动.顾客购买玩具就能获得一次转动转盘的机会,当转盘停止时,指针落在哪一区域就可以获得相应奖品.下表是该活动的一组统计数据:

下列说法不正确的是( ).

A. 当n很大时,估计指针落在“铅笔”区域的频率大约是0.70

B. 假如你去转动转盘一次,获得铅笔的概率大约是0.70

C. 如果转动转盘2 000次,指针落在“文具盒”区域的次数大约有600次

D. 转动转盘10次,一定有3次获得文具盒

解:由表中提供的信息可知,只有“转动转盘10次,一定有3次获得文具盒”的判断不正确,故选D.

【点评】正确理解频率与概率之间的关系是求解此类问题的关键. 由表中提供的信息,我们可以知道,当n很大时,指针落在“铅笔”区域的频率趋于0.70,由频率与概率之间的关系可知,假如你去转动转盘一次,获得铅笔的概率大约是0.70,如果转动转盘2 000次,指针落在“文具盒”区域的次数大约有2 000次×(1-0.7)=600次,而将转盘转动10次,却不一定有3次获得文具盒

三、解答题中的用频率估计概率

例4研究问题:一个不透明的盒中装有若干个只有颜色不一样的红球与黄球,怎样估算不同颜色球的数量?

操作方法:先从盒中摸出8个球,画上记号放回盒中,再进行摸球实验,摸球实验的要求:先搅拌均匀,每次摸出一个球,放回盒中,再继续.

活动结果:摸球实验活动一共做了50次,统计结果如下表:

推测计算:由上述的摸球实验可推算:

(1)盒中红球、黄球占总球数的百分比分别是多少?

(2)盒中有红球多少个?

解:(1)由题意可知,50次摸球实验活动中,出现红球20次,黄球30次,

∴红球所占百分比为20÷50=40%,

黄球所占百分比为30÷50=60%,

答:红球占40%,黄球占60%;

(2)由题意可知,50次摸球实验活动中,出现有记号的球4次,

∴总球数为(50/4)×8=100,

∴红球数为100×40%=40.

答:盒中红球有40个.

【点评】(1)根据表格数据可以得到50次摸球实验活动中,出现红球20次,黄球30次,由此即可求出盒中红球、黄球各占总球数的百分比;

(2)由题意可知50次摸球实验活动中,出现有记号的球4次,由此可以求出总球数,然后利用(1)的结论即可求出盒中红球个数.

《利用频率估计概率》教学设计3 篇4

流程一复习导入

1.什么是频率?怎样计算频率? 2.创设情景。

国家在明年将继续实施山川秀美工程,各地将大力开展植树造林活动.为此林业部要考查幼树在一定条件下的移植成活率,应采用什么具体做法?(学生回答,师点评板书课题)流程二学生自学

1.出示自学指导,引导学生自学.(1)阅读教材相关内容,填表1

(2)思考:在实验时为了使实验结果更接近现实情况,需要注意些什么问题? 2.同桌交流,对照结果 3.学生发表见解,相互评判

跳频信号功率谱密度估计 篇5

1 跳频通信系统的组成

(1)跳频信号的产生。

图1为跳频信号的产生与发射系统。信源产生的信号,经过调制器的相应调制,获得载波频率固定的已调波信号形式,再与频率合成器输出的载波信号进行混频,输出的已调波信号载波频率达到射频通带的要求,然后经过高通滤波器处理后,至天线发射出去。

在跳频信号的产生和发射过程中,跳频器是跳频系统的核心,它由频率合成器和跳频指令器构成,由跳频指令来控制频率合成器产生适合系统性能指标要求的跳频频率信号,该跳变频率是一个随时间变化的频率信号。这种跳频系统的频率跳变规律称为跳频图案[2,3]。

(2)跳频信号的接收。

跳频信号的接收系统如图2所示。在接收端,接收到的信号通过输入回路处理后,送至混频器,再与跳频器产生的载波信号混频。接收机的本振信号也是频率跳变信号,它的跳变规律刚好与发送端一致,但是在频率上有个差值,正好为接收机的中频频率。只要发收双方的跳频指令同步,就可以使收发两端的跳频源,也就是频率合成器产生的跳变频率同步,经过混频后会产生一个中频信号和组合波频率成分,这些混合信号通过带通滤波器和解调器,可以滤除组合波频率成分,恢复出发送的信号。在接收过程中,接收机中的跳频器必须受同步指令的控制,确定跳频的开始和结束时刻,这样可以有效地抑制干扰信号,不会对跳频系统产生干扰。

(3)跳频信号的波形。

图3为跳频信号的时域波形图。从图中可以看出,跳频信号的波形和定频连续信号的波形不同,它是不连续的,因为跳频器产生的跳变载波信号之间不连续。频率合成器从接受跳频指令开始到完成频率的跳变有一定的切换时间,频率合成器从接受指令开始建立振荡到达稳定状态的时间叫做建立时间,从稳定状态到达振荡消失的时间叫消退时闻,稳定状态持续的时间叫驻留时间。从建立到消退的整个过程叫做跳频信号的一跳,持续时间叫做一个跳周期,记作Th。建立时间加上消退时间叫做换频时间。只有在频率稳定的时间TD内才能有效地传送信息。

2 跳频信号功率谱密度的估计分析

跳频信号是典型的随机信号,而跳频信号本身的傅里叶变化是不存在的,因此无法像确定信号那样用数学表达式来精确地描述它,而只能用它的各种统计平均量来表征。自相关函数最能完整地表征它的特定统计平均量值。而一个随机信号的功率谱密度正是自相关函数的傅里叶变换,可以用功率谱密度来表征它的统计平均谱特性。 因此,在统计意义下描述一个随机信号,就需要估计它的功率谱密度。功率谱估计在其他应用中也有着重要的作用,如设计最优线性滤波器,测量噪声频谱,检测埋没在宽带噪声中的窄带信号[4,5],以及用噪声激励法估计线性系统的参数等,都要估计功率谱,因此随机信号的功率谱估计是当前信号处理中一个重要的研究课题和研究工具。

(1)功率谱密度的定义。

信号f(t)的能量:由电压在1 Ω电阻上消耗的能量

E=∫∞-∞f2(t)dt (1)

若积分值存在,信号的能量为有限值,对于能量无限大的信号,考虑能量的时间平均值,这显然是信号的平均功率。

信号的平均功率即为电压f(t)在1 Ω电阻上消耗的平均功率

S=limΤ1Τ-Τ2Τ2f2(t)dt (2)

其中,T为求平均的时间区间。功率谱密度能更好地描述功率信号,能表示信号的功率密度随频率变化的情况,研究功率谱密度,可以了解信号的功率分布情况,确定信号的频带,在信号处理中非常的重要。以下主要研究功率谱密度。

对于功率信号,其功率谱密度可定义如下:把f(t)在间隔|t|Τ2以外的部分截去,得到截短函数

fΤ(t)={f(t),|t|Τ20,

(3)

只要T为有限值,则fT(t)的能量ET也是有限值。

FT(ω)为fT(t)的频谱函数,这样fT(t)的能量ET

EΤ=-f2Τ(t)dt=12π-|FΤ(ω)|2dω (4)

因为

-f2Τ(t)dt=-Τ2Τ2f2(t)dt (5)

因此平均功率S

S=limΤ1Τ-Τ2Τ2f2(t)dt=limΤ1Τ-Τ2Τ2f2(t)dt=limΤ1Τ12π-|FΤ(ω)|2dω=12π-limΤ|FΤ(ω)|2Τdω(6)

T增加时,fT(t)的能量和|FΤ(ω)|2也增加。当T趋于无穷时,|FΤ(ω)|2Τ的极限可能存在,令limΤ|FΤ(ω)|2Τ=ΡS(ω),此极限为功率谱密度。

信号f(t)的功率又可表示为

S=12π-ΡS(ω)dω=1π0ΡS(ω)dω=20ΡS(f)df (7)

功率谱密度是频率的时偶函数,信号的频率等于各个频率分量单独贡献的功率连续和,反映了信号能量在频率轴上的分布情况。

(2)功率谱估计方法改进。

功率谱估计有多种方法,一般可分为参数化方法和非参数方法。非参数方法中较为常用的是韦尔奇方法,这种方法属于经典谱估计的一类,周期图法,以下从经典谱估计,周期图法出发,分析改进跳频信号的功率谱密度。

经典的周期图方法:计算出样本信号序列的傅里叶变换,然后取变换结果幅值的平方,并除以样本序列的个数作为真实功率谱的一个估计,通过除以样本长度,确保了这个估计值是渐进无偏的,即对于固定的样本长度,周期图方法是有偏的,当样本长度趋于无穷大时,周期图方法的期望值趋向于真实的功率谱密度。

假设一个信号xn,功率谱的粗略估计为

PXX=abs(fft(xn,1024)).^2/length(xn) (8)

基本的周期图估计方法效果并不好,它的估计方差很大,而且不满足一致性估计的条件,即方差不会随着样本数的增大而趋于0。

取跳频信号的参数:跳频图案fk=5∶50∶255;采样频率fs=600 Hz;跳频信号驻留时间t=0∶(1/fs)∶(0.25-1/fs);跳变时刻忽略不计。

取长度为1 024和长度为256仿真对比,就明显看出随着FFT长度的增长,周期图并没有变得更平滑。

对于周期图的改进,一方面,不用矩形窗,而采用合适的窗函数来消除由矩形窗旁瓣带来的谱失真;另一方面,将长度为N的数据分成若干段,分别求出每一段的功率谱,然后加以平均,甚至允许每段数据有部分重叠。以下是两种方法的效果。

首先,可以尝试用平均法降低功率谱估计的方差,先采用将数据分成不重叠的数据,然后求平均的周期图。

可以直观地看出,图6比前面的估计结果要平滑得多,理论上这一估计结果的方差是前面单纯256样本估计结果方差的1/3。所以,平均的段数越多,估计结果的方差也就越小。但是信号的长度限制了分段的数目,要获得更多的分段,可以将信号分割成重叠的段。由于重叠的段会使各段之间具有统计相依性,反而会导致方差增大,所以在分段数目与重叠之间的选择上存在一个折衷。而且,随着分段的增加,虽然方差减小了,但估计的偏差会变大,因此在使用平均周期图法时,需要在估计期望值偏差和估计方差之间进行权衡。

其次,使用窗函数的方法,即在周期图前给每段信号加一个数据窗,改进周期图估计方法。因为窗两边渐变为0,所以这种方法降低了由于重叠导致的段间统计相依的效应。

取矩形窗和汉宁窗为例,分析信号的平均周期图,从仿真图可以看出,汉宁窗对减小“旁瓣效应”,即功率谱泄露,能起到一定的效果,也可以使峰值的宽带增大。多次实践表明,取合适的汉宁窗和一半段长度的重叠率,可以最有效的降低估计的偏差。这种改进周期图方法就是韦尔奇方法。

由以上仿真图结果可知,韦尔奇估计比上面的仿真图要低一些,因为Pwelch 函数将计算的功率谱结果除以抽样频率Fs,因此才有这样的结果。

3 韦尔奇方法的偏差和正规化分析

通过前面的功率谱计算,从图中可看出,在5 Hz,55 Hz,105 Hz,155 Hz,205 Hz和255 Hz有明显的谱峰,而且谱峰的高度基本相当,这和所取的信号幅度所对应。这些数值只是相对值,功率谱图无法给出波形的实际绝对幅度。而解决这一问题的办法,要对功率谱图作正规化处理。

韦尔奇方法理论推算表明,它的功率谱估计的理论期望与真实功率谱值间有一定的关系,为

E{Ρ^x(ω)}=12π|w|2-ππΡx(θ)|W(ω-ϑ)|dθ (9)

显然,期望值并不等于真实的功率谱密度,因此这个估计是有偏的。W(ω)是窗函数的离散傅里叶变换,而标度因子是窗函数的平方和。为

|w|2=w(n)2 (10)

这说明,只要W(ω)的主瓣宽带比各谱峰的距离窄,如果Px(ω)在频率ω0处有一个高度为1的谱峰,则谱估计对应的谱峰高度为|W(0)|2/|w|2。所以,要获得一个反映实际功率谱谱峰高度的估计,可以将Pwelch函数的结果乘以norm2(w)/sum2(w),这里w窗函数向量,这样得到的功率谱估计,就与窗的长度和形状关系不大。

采用不同的窗函数,汉明窗和汉宁窗。相同长度,相同噪声,相同信噪比仿真如图12,图13所示。

采用相同的窗函数,汉宁Hanning窗。长度不同,噪声相同,信噪比相同,仿真如图14和图15所示。

4 功率谱估计的置信区间分析

计算功率谱估计时,功率谱估计的置信区间计算非常重要,通过置信区间的计算,就可以定量地知道所得功率谱估计结果在统计意义下的可信程度。

图16表明,真实的功率谱曲线概率有95%的可能性在这两条曲线之间。估计置信区间时,只有在分段无重叠的情况下,才有可靠性,如果在重叠的情况下,计算置信区间,其结果不可靠。经过多次仿真表明,置信区间与窗函数的形状和长度,采样频率,FFT长度等有密切关系,要想得到合适的信号置信区间图,就要多次仿真,得到合适的参数。

5 结束语

本文主要对跳频信号的功率谱做了分析,就经典的周期图方法出法,指出此方法的不足,再从改进经典周期图方法的思路出发,仿真分析了改进后的功率谱,得出韦尔奇方法的可行性。然后分析了韦尔奇方法的偏差和正规化及功率谱估计的置信区间。

摘要:通过对跳频信号功率谱密度分析,指出经典周期图方法的不足,经过分析改进,得出跳频信号功率谱密度估计合适的方法和参数。仿真结果表明,改进方法具有良好的可行性功率谱估计性能。

关键词:跳频通信,功率谱密度,周期图方法

参考文献

[1]陈亚勇.Matlab信号处理详解[M].北京:人民邮电出版社,2001.

[2]陆根源,陈孝帧.信号检测与参数估计[M].北京:科学出版社,2004.

[3]葛哲学,陈仲生.Matlab时频分析技术及其应用[M].北京:人民邮电出版社,2006.

[4]赵宏伟.基于时频分布的跳频信号参数检测方法研究[D].西安:西北工业大学,2006.

运用概率帮你做估计和计算收费 篇6

例1在一个不透明的布袋中,红球、黑球、白球共有若干个,除颜色外,形状、大小、质地等完全相同.小新从布袋中随机摸出一球,记下颜色后放回布袋中,摇匀后再随机摸出一球,记下颜色……如此大量摸球实验后,小新发现其中摸出红球的频率稳定于20%,摸出黑球的频率稳定于50%.对此实验,他总结出下列结论:(1)若进行大量摸球实验,摸出白球的频率应稳定于30%;(2)若从布袋中任意摸出一个球,该球是黑球的概率最大;(3)若再摸球100次,必有20次摸出的球是红球.其中说法正确的是().

【解析】当实验次数很大时,事件发生的频率稳定于一个值,这时我们用频率作为概率的估计值.

摸出红球的频率稳定于20%,则摸出红球的概率是20%,同样摸出黑球的概率是50%.因为每次要摸出一个球,这个球的颜色一定是红球、黑球或白球中的一个,所以分别摸出红球、白球、黑球的概率和为100%,则摸出白球的概率为100%-20%-50%=30%.所以(1)(2)正确.只有当实验次数足够大时,方可用频率来估计概率,在有限次的实验中,不能用频率进行准确的计算,只能说可能有20次摸出的是红球,而不是一定有20次,故(3)错误.

例2为估计鱼塘中鱼的数量,先从鱼塘中捕捞30条鱼做上标记,然后放回鱼塘.经过一段时间,待有标记的鱼完全混合于鱼群后,再从中多次捕捞,并计算得平均每200条鱼中带有标记的鱼有5条.试估计该鱼塘中鱼的数量.

例3如果事件A发生的概率是5/100,那么下列推断,哪几个是正确的?

(1)做100次这种试验,事件A必发生5次;

(2)大量重复做这种试验,事件A平均每100次发生5次;

(3)做100次这种试验,事件A不可能发生6次.

【解析】因为事件A发生是随机的,所以做100次这种试验,事件A发生的次数不一定是5次,0次到100次都有可能.只有在大量重复地做这种试验的基础上,事件A平均每100次发生5次.所以(1)(3)错误,只有(2)正确.

例4某航空公司的保险合同上有这样一个条款:飞机一旦失事,将向每名乘客赔偿人民币50万元,但保险公司需向每名乘客收取保险费20元.如果该航空公司航班平均每次约有120名乘客,那么在n次飞行中,平均来说,当飞机失事的概率不超过多少时,才能保证保险公司的收入不小于支出?

【解析】设飞机失事的概率为x,在n次飞行中,平均失事nx次,平均赔偿120×50×nx万元,n次飞行中共收取保险费120×20n元,因为要使得收入不小于支出,所以可列不等式120×500000×nx≤120×20n.

小试身手

1.在一个不透明的盒子中装有a个除颜色外完全相同的球,这a个球中只有3个红球,若每次将球充分搅匀后,任意摸出1个球记下颜色再放回盒子.通过大量重复试验后,发现摸到红球的频率稳定在20%左右,则a的值约为().

A.12B.15C.18D.21

2.生物学家估计某一地区的野鹿总数时,常采用“捉放捉”方法,即先捕捉野鹿n只,分别给它们做上记号,然后放归;一段时间后,重新捕捉一些野鹿作为样本.如果多次捕捉到的野鹿中平均每m只有a只带有记号,试估计该地区野鹿的只数为_.(用含m、n、a的代数式表示)

3.假设某航班平均每次约有100名乘客,飞机失事的概率P=0.000 05.一家保险公司要为乘客上保险,承诺飞机一旦失事,将向每名乘客赔偿人民币40万元.平均来说,保险公司应该如何收取保险费呢?

4.某商场为吸引顾客,设立了一个可以自由转动的转盘,并规定:每购买100元商品可以获得一次转动转盘的机会;如果转盘停止转动时,指针正好落在红、绿、黄区域,那么顾客可以分别获得80元、30元、10元购物券;如果不愿转转盘,那么可以直接获得10元购物券.设转盘停止转动时,指针正好落在红、绿、黄区域的概率依次为0.1、0.15、0.25.

(1)平均来说,每转动转盘1次所获购物券的金额是多少?

(2)小明在家也做了一个同样的试验,转动转盘10次后共得购物券90元.据此,小明认为,还是直接领取10元购物券合算.你同意他的说法吗?

扫二维码关注“初中生世界”公众号,回复“难点突破2016年12月”获取答案。

概率密度估计 篇7

随着经济社会的发展,各种公共场所如机场航站楼、车站候车厅、大型商场等场所的客流量越来越大,随之而来的安全隐患也越来越严重,及时做好应急防范措施对加强公共安全具有重要意义。同时,计算机视觉领域的技术也越来越先进,在视频监控和客流智能管理方面的应用也越来越成为国内外学者研究的热点。其中,人脸识别、车牌识别、运动目标跟踪、人数统计和人群密度估计等的具体应用越来越成为计算机视觉领域学者关注的焦点。人群密度估计的研究基本上建立在基于像素统计[1]和基于文理分析[2]基础理论之上。

本文分析和归纳了已有研究成果,采用基于像素统计的方法进行人群密度估计。采用区域分割、化整为零的思想,并结合最小二乘法线性拟合方程来估算具体人数,从而得到人群密度。在前景提取中,本算法使用三帧差法。采用区域分割方法对前景目标进行透视矫正[3],消除因人物远近给实验结果造成的误差,一定程度上减弱光线等背景因素的干扰。实验结果最终表明,该算法具有一定的可行性和高效性。

1 运动目标前景提取

首先逐帧读取摄像机拍摄的视频序列,提取出连续的三帧图像f(k-1)、f(k)、f(k+1),利用Sobel算子[4]对f(k-1)、f(k)、f(k+1)三帧图像进行差分,然后利用如下规则进行计算:

将初步得到的前景图像F(k)经过一定的形态学处理[10],便可得到最终的前景图像。式(1)中d(k,k-1)为前两帧帧差结果,d(k+1,k)为后两帧帧差结果;b(k,k-1)和b(k+1,k)分别为前后两帧帧差图像阀值处理后的二值图像。式(2)的目的是对前后两帧帧差结果进行背景滤除以突出前景目标。其中,T为预先设定的阈值,要根据具体场景手动选取。若T选取过大,则检测目标可能出现较大的空洞甚至漏检;若T选取过小,将会出现大量噪声。图1和图2分别是同一相邻帧间的帧差法和改进后的三帧差法帧差结果。

对比图1和图2可以看出,与相邻帧差法[5,6]相比,三帧差法[7]充分考虑了运动像素的时间相关性,对动态监测比较灵敏,对随机噪声也有很好的抑制作用,避免了前者由于运动目标做加速运动而造成的多检或者少检,提取的运动目标相对完整,适合于本文提出的人群密度估计算法。但三帧差法也存在一定缺陷,即差分图像的检测阈值需手动设定,大多数情况下只能依据实践经验。实验证明,此方法对人群密度统计具有较好的实验效果。

2 人群密度估计方法

2.1 基于前景像素拟合的人群数目估计

根据Davis于1995年提出的人群数目与前景像素数量成正比的线性关系理论,即边缘像素点在图像中占比例越大,则人数越多,人群密度越高。这种算法区别于70年代初Haralick等提出的一种纹理分析[8]方法,使用像素点来估计人群密度具有简单易行,能够具体到数字的优点。线性拟合的实质是最小二乘法[9]曲线拟合的特例,即拟合次数为1,具体公式如下:

其中,a和b分别为线性方程的系数和常数项。与多次线性拟合相比,一次线性拟合具有简单高效的优点,但由于实际场景中,摄像机监控视野的投影图像具有近大远小的透视效果,使得前景像素占比分布不均匀,降低了线性拟合方程的精确性。对此,提出了基于区域分割的前景像素统计的人数统计方案。

2.2 基于区域分割的前景像素统计的人数估计

在像素点统计中,系统根据不同区域前景目标投影的透视效果和实际需要将画面分成若干块。对每一块区域,计算前景图像边缘像素占对应区域像素总数的比例,然后代入相应的线性拟合方程,求解出具体人数并计算相应人群密度,接着根据Polus[10]提出的人群密度等级理论确定人群密度等级。最后,根据得到的人群等级数据,绘制人群密度等级分布图。这样既有效地对前景图像进行了透视矫正,提高线性拟合方程的精确性,又实现了分区域监控。

从同一角度,人工取景拍摄同一场景不同时间段内的6个视频,每个视频长达20分钟左右,并从每段视频中截取5分钟视频作为训练数据,考虑到帧间差异较小,因此隔10帧抽取一张图片作为样本,每个场景约1 000张样本。提取每张样本图片的前景像素数量,并逐一计数相应帧的实际人数,以前景像素占对应背景图像总体像素的比例为横坐标,以实际人数为纵坐标进行线性拟合。得出每个子区域的线性拟合的方程,其具体形式为:

Xi代表像素点所占比例,Yi代表人数,A、B是经过大量实验分析结果估计出的权值。图3和图4分别是经过实验数据训练得到的两个区域的线性拟合方程。

从图3和图4可以看出,前景目标投影的透视导致不同区域不同前景像素的比例与实际人数的线性关系不一样,说明区域分割对线性拟合方程的精确性所产生的良好效果,同时也比较准确地描述了各个区域的密度等级,对区域人群密度监控具有一定指导意义。

2.3 人数统计和人群密度估计

基于像素统计的理论是人群密度估计的重要方法。本文根据像素统计的基本理论,结合区域分割的优势,对不同区域进行了人数统计和人群密度估计。具体流程如图5所示。

3 实验结果分析

系统监控视野约180m2,根据具体场景将监控视野分成6个区域,每个区域的面积约30m2,结合Polus提出的密度等级概念,可得出本系统人群数量和人群密度以及密度等级关系表,如表1所示。

首先,利用摄像机静止时拍摄的固定视野的视频数据进行训练,拟合出6个不同的线性方程,作为6个区域对应的特征方程。根据具体场景,为更加准确地定位人群,将每个区域划分成2个子区域,整个监控视野共被划分成12个子区域。然后,利用测试数据进行分析和验证,表2是实验测试数据得到的结果,其中区域编号为最初划分的6个区域的编号。

从表2可以看出,不同区域的线性方程很好地描述了各个区域前景像素数量和人群数量的关系,使得系统在中低密度的情况下,人群密度等级评估的准确率高达90%以上。

4 结语

综合实验效果,区域分割对于基于像素统计的人群密度的估计具有良好的作用和效果,尤其是对于中低密度人群和低噪音环境的监控。同时,借助三帧差法使得前景提取的轮廓十分清晰,降低了环境等不利因素的干扰,使得系统适用于超市、航站楼、广场和通道等室内环境和公共场合,具有一定实用价值。但是分割的块数需要根据具体场景来手动调整,同时对于人群的严重遮挡,基于像素统计理论的系统还具有很多改进的地方。例如:可以通过多摄像机协作[11]来解决人群严重遮挡的问题;可以结合基于群体特征的理论[12]来完善系统,提高系统的可靠性和鲁棒性。

参考文献

[1]DAVIES AC,JHYIN SA,VELASTIN,et al.Crowd monitoring using image processing[J].IEEE Electronics&Communication Engineering Journal,1995,7(1):37-47.

[2]MARANA,A NSAVELASTIN,LFCOSTA,et al.Automatic estimation of crowd density using texture[J].Safety Science,1998,28(3):165-175.

[3]VELIPASALAR S,YLTIAN,A HAMPAPUR.Automatie counting of interaeting people by using a single unealibrated camera[J].IEEE International Conference Multimediaand ExPo,2006(12):1265-1268.

[4]冈萨雷斯.数字图像处理[M].北京:电子工业出版社,2003.

[5]LIPTON A,HFUYIYOSHI,TPATIL.Moving target classification and tranking from real-time video[J].IEEE Workshop on Applicaions of Computer Vision,1998(36):1259-1265.

[6]李刚,邱尚斌,林凌,等.基于背景差法和帧间差分法的运动目标检测方法[J].仪器仪表学报,2006,27(8):961-964.

[7]ABDOLLAHYA,GERAVANCHIZADEH M.Speech enhancement using combinational adaptive filtering[C].International Symposium on Telecomunications,2008:27-28.

[8]HARALICK RM.Statistical and structural approaches to texture[J].Proceedings of the IEEE,1979,67(5):786-804.

[9]贾小勇,徐传胜,白欣.最小二乘法的创立及其思想方法[J].西北大学学报,2006(3):507-511.

[10]SCHOFER,JAUSHPIZ A.Polus pedestrian flow and level of service[J].Journal of Transportation Engineering,1983,109(1):46-56.

[11]MAY,SSOATTO,JKOSEEKA.Sastry an invitationto 3-D Vision[M].SPringer,2004.

概率密度估计 篇8

巴塞尔新资本协议是世界上众多国家对银行业进行监管以及银行业进行风险管理的基本准则[1]。该协议提供了一个覆盖全部信用风险因子的分析框架,规定对任何一个债项或交易对手,确定其信用风险大小有四个关键风险因子:违约风险敞口(exposure at def ault,EAD)、违约概率(probability of default,PD)、违约损失率(loss given default,LGD)、债务期限(matu rity,M)等。在这些风险因子中,违约概率是关键因子,同时也是这些因子计量中最复杂的风险因子。违约概率的估计就成为信用风险研究的核心问题,目前,有许多数量方法被应用于违约概率的研究中。然而,违约事件毕竟是小概率发生事件,违约样本与非违约样本相比,数量比例上都非常不对称。在对违约概率进行定量研究中,无论采用什么样的定量方法,本质上都是对历史数据进行学习的过程。如果使用全样板建立,占绝对压倒性比例的正常样本,会扭曲模型的学习过程,使得模型产生较大的偏差,低估实际的违约概率,而这恰恰是计算违约概率应该竭力避免的。本文希望通过合理选择样本,然后与逻辑(Logistic)模型相结合,克服这方面的困难。

国际上有关企业违约的研究开展得比较早:Fitzpatrick在上个世纪三十年代就进行了成功企业和失败企业的财务指标比较研究[2],Beaver研究了预测企业失败的财务指标[3],Altman是该领域中最重要的学者,他最早使用判别分析进行企业破产的预测研究[4],Ohlson于1980年首度试图利用假设条件较为宽松的Logistic分析来建立信贷违约概率预测模型[5]。国内信用风险研究仍处于发展初级阶段,违约概率研究还处于分类评估阶段,并在初步尝试测度研究。王春峰等人于1999年应用多元判别分析模型、Logistic模型对某国有商业银行的企业客户短期贷款偿还情况进行了分类分析,并比较了两种方法的优劣势[6],郑茂[7]、朱顺泉[8]、张玲[9]等对上市公司进行财务指标分析,筛选了一些中国上市公司财务预警指标,并给出了基于判别分析、Logistics模型等的财务预警模型。以上这些研究,或者整个数据样本比较小,模型本身的可靠性程度低;或者使用的是上市公司公开的财务数据而非商业银行信贷数据,对商业银行违约风险不具有代表性。本文希望从新的角度出发,利用某国有商业银行数以千计的有效样本,试图探索一套能够得到稳定的、区分力强的违约概率估计方法。

二、方法

为克服“好”、“坏”样本失衡造成的定量模型出现偏差的问题,本文提出如下的解决思路:

选取全部的违约样本,对正常样本随机抽取,按照违约样本和正常样本的1:1、1:2、1:3、1:4……进行配比,分别建立Logistic回归模型。反复试验,求出表现样本外预测最为稳定的配比比例。

按照上一步求得的最佳配比比例,固定违约样本,随机生成k组正常样本,分别组合成k组建模样本。分别对于每组建模样本建立Logistic模型。

对每组模型选取出来的变量取并集,对k组样本重新建立Logistic模型,然后进行模型平均。

以上方法中,步骤1是为了解决“好”、“坏”样本比例失衡的问题;步骤2是为了解决压缩“好”样本造成的信息丢失的问题;步骤3是为了解决模型的统一性问题。

以下我们以一家大型商业银行省行的制造业信贷数据为例,展示方法的应用。

三、数据处理和样本配比

从某大型商业银行数据库中取出某省中小型制造业2006、2007、2008三年的有损益表、资产负债表、现金流量表的信贷债务人1702个。据我们所知,到目前为止,在国内尚没有采用如此大的有效数据样本进行过这方面的研究。本文取这些债务人2006~2009年每笔贷款在当年年底的五级分类,用来标识债务人是否违约;然后进行数据清洗,删除缺失值过多的债务人数据。若记录中某一记录取值偏离均值程度过大,远大于μ+2σ或远小于μ-2σ,这样的数值称为奇异值,用如下方式进行奇异值处理;(1)将样本中最大的1%和最小的1%的那部分数据删除;(2)不符合变量取值范围的记录按照其取值范围进行调整,例如将取值在[1]区间的小于0的记录用0来替代,大于1的记录统一用1来替代。

经过违约标识和数据清洗之后,得出如下数据:2007年有1251个债务人,且全都是非违约债务人;2008年有1316个债务人,其中有32个违约债务人;2009年债务人共有1292个,其中有40个违约债务人。

按照上一节的思路,本文先比较不同违约与非违约样本配比比例下模型的结果,发现1:3的比例在模型表现上更优于其他配比比例,于是选用1:3配比。为了得到稳健的模型并简化计算,本文选用3个建模样本。所用到的建模样本如下:2008、2009年的违约债务人共72个,其中2008年32个,2009年40个。从2008年中随机抽取96个非违约债务人,2009年中随机抽取120个非违约债务人,即共有非违约债务人216个。

四、建模过程和模型验证

1.单变量分析

本文违约概率的计量模型所选的候选自变量为违约时点前一年的财务数据,这些候选变量主要体现了公司的财务杠杆、偿债能力、盈利能力、资产管理、投资回报、规模等方面共119个变量。首先进行单变量分析,其目的是为了从这119个变量中初步筛选出对违约概率有明显影响的财务指标,从而得到候选变量短清单作为模型拟合的初始变量。本文采用AR值和趋势图两种单变量分析方式,其中趋势图是将债务人数据根据待考察自变量从小到大排序,并将样本数据划分成10组,计算每组的违约率,以每组自变量的均值为横轴,违约率为纵轴作图。选出AR>5%或者趋势图单调的变量。将这两种方式选出的变量取并集得到最终的候选变量短清单。

对样本1、2、3分别进行单变量分析,发现三样本筛选出的变量基本是相同的。这些变量的显著影响不因样本的改变而改变,说明这是些重要的变量,于是将三样本筛选出来的变量取交集作为三个样本模型拟合的初始变量集共82个。

2.变量拟合

对这三个样本我们采用如下相同的建模步骤:

(1)将上面候选变量用SAS软件中Logistic过程的逐步回归方式进行新一轮的筛选,例如经过这步,样本1剩下33个变量。

(2)根据逐步回归得到的变量,进行相关性分析和计算每个变量的VIF值,将VIF值>10的变量删除,对于相关性较大的变量保留AR值大的变量。

(3)将剩余的变量再次进行Logistic回归,对得出来的变量的系数从统计显著性和系数的符号的正确性进行判断。

(4)对于不符合标准的变量,根据基尼从低到高逐一删除,每次删除一个变量,重新进行一次回归,再重复步骤3。

按照以上的建模步骤,最终从样本1筛选出如下的变量:总资产的自然对数(m1)、总负债/所有者权益(g4)、主营业务收入净额/存货(z6)、财务费用/总资产(c32)、流动债务/总债务(x13);样本2筛选出如下的变量:总资产的自然对数(m1)、总负债/总资产(g1)、(利润总额+财务费用)/所有者权益(t5)、主营业务收入净额/存货(z6);样本3筛选出如下的变量:总资产的自然对数(m1)、利息支出/总资产(c34)、利润总额/总资产(t14)、(利润总额+财务费用)/所有者权益(t5)、主营业务收入净额/存货(z6)。括号内为变量代码。

将这些财务变量取并集,再分别用这三个样本数据来拟合模型,为了尽量使得这三个样本最终变量一致,将显著性水平设为0.2,这样得到三样本最终的估计式分别为:

将上面3个式子变量系数取平均得到最终模型如下:

考察模型的系数,一般来说企业的总资产规模越大,其违约的可能行也就越小;如果企业的主营业务收入净额和存货之比大,说明经营效率高,其偿债能力较强,相应违约的概率就较小;如果企业的总负债和所有者权益之比较大,则说明企业有较高的杠杆率,负债较多使得其债务的违约风险较大,而利息支出在总资产中的占比较大也说明企业的杠杆率较高,违约可能相应提高;单位资本的利润越高,说明企业盈利能力越强,越不容易违约。因此以上系数的符号都是符合经济预期的。

3.模型验证

(1)模型的多重共线性检验

通过计算每个自变量的方差膨胀系数(VIF)值来对变量间的多重共线性进行检验,如果VIF大于5,则我们认为变量之间存在比较高的共线性。在这3个建模样本内最终模型所选出的5个变量VIF值都小于5,所以变量间不存在严重的共线性。如表1所示。

(2)模型预测准确性的验证

验证上面最终模型在三个样本内的准确性,其中在三个样本中都是以0.25为分界点,若PD大于0.25,则表示模型将此债务人预测为违约债务人;若PD小于0.25,则将其预测为非违约债务人。从表2、表3、表4可以看出,最终模型在三样本内的预测正确性都保持在0.7左右,说明最终模型在三个样本中的预测准确度较高且比较稳定。

特别值得说明的是,以上结果显示,本方法得到的违约区分性判断,对“好”、“坏”样本的区分是均衡的。而据我们文献调研,以往的判别模型,基本上都是在“好”样本方面有很高的判别能力,而在“差”样本方面判别能力很低,这样会大大低估风险,这恰恰是模型需要避免的。

(3)模型区分能力的验证

在违约概率PD模型中,经常使用AR值或KS值等作为判断模型区分能力好坏的统计指标。模型区分能力是指模型对区分违约债务人与非违约债务人的基本能力,也经常被称为该模型的“分辨能力”。按照《商业银行资本计量高级方法验证指引》中AR和KS参考基准(AR处于0.5~06之间为优秀,KS处于0.4~0.5之间为优秀),本模型在每个样本内的区分能力都达到了优秀水平,表现出较高的区分能力。如表5所示。

五、总结

本文提出了一种基于样本配比的违约概率估计方法,并将其应用于大样本的商业银行信贷风险的估计中。实证结果显示,依据本文方法建立的违约率估计模型,不存在多重共线性,模型的预测精度和区分能力都达到满意的精度。

本文的贡献,除了在研究方法的创新以外,首次克服了模型预测“好”、“坏”样本的非对称性问题。此外,本文所采集的样本,也是国内文献所见规模最大的,大大提高了实证结果的可靠性。

参考文献

[1]Basel Committee on Banking Supervision,“The New Basel Capital Accord”,Consultative Document,Bank for International Settlements,2003,4.

[2]Fitzpatrick.A Comparison of Ratios of Successful Industrial Enterprises with Those of Failed Firms[M]New York:Certified Public Accountant,1932.

[3]Beaver W..Financial Ratios as Predictors of Failure[J]Supplement to Journal of Accounting Research,1966,(4):p.71-111.

[4]Altman E.I..Financial Ratios,Discriminate Analysis and Prediction of Corporate Bankruptcy[J].Journal of Finance,1968,(9).

[5]Ohlson,J.A..Financial Ratio and the Probabilistic Prediction of Bankruptcy[J].Journal of Accounting Research,1980,18(5):p.234-261.

[6]王春峰,万海晖,张维.组合预测在商业银行信用风险评估中的应用[J].安徽农业大学报(社科版),1999(1):P.5-8.

[7]郑茂.我国上市公司财务风险预警模型的构建及实证分析[J].金融论坛,2003(10):p.38-50.

[8]朱顺泉.基于因子分析法的上市公司财务状况评价研究[J].统计学信息论坛,2004(7):p.1-2.

概率密度估计 篇9

基于机器视觉的手势交互是智能人机交互HCI(Human Computer Interaction)的关键技术之一[1-5],旨在提供更方便快捷的人机视觉接口。在静态手势识别中,主要解决三个问题[2,3,5-7]:手势分割、手势特征提取与分析和手势识别。文献[1,5]等的方法能很好地分割出精确手势区域,为手势特征提取和识别提供了良好的基础。手势识别广泛采用实时性较好的模版匹配算法[1,5]获得鲁棒的识别结果。

不同手势类型主要由不同手指数量和组合表示,手指部分代表了手势的关键[1,5]。在手势特征提取与分析中,文献[8]通过“U”特征分析手势类型,但并非每个手势都有平滑的“U”特征,鲁棒性较差,手势类型数也受到限制。文献[1]通过提取手势边缘与掌心的相对距离曲线特征并引入FEMD的概念,通过模版匹配可靠地判断出手势类型。文献[6]通过计算手势边缘梯度分解特征,得到了较好的识别效果。文献[5]使用的基于半径的凸包分解算法,经过多次计算形状凹度和复杂的手势骨架提取算法,最后进行模版匹配,较好地判断出手势类型。然而,文献[1,5,6]的方法计算复杂度均较高,不利于实时识别。为提高手势识别实时性并同时保持健壮的鲁棒性,本文提出并证明了任意手势基于指尖角度集核密度估计序列KDES-FAS(Kernel Density Estimation Sequence of Fingertip Angle Set)特征提取方法的有效性。

1 手势分割

采用文献[1]的结合有标记的RGB图像和Kinect深度数据[9]方法,容易获得精确的手势分割效果,如图1所示。

图1 文献#xref_id=137#的手势分割效果

2 指尖角度集核密度估计序列特征提取

2.1 指尖角度集

通常手势类型,如图2所示,l1表示手小臂所在直线(本文采用图1(c)手势图像长轴所在的直线),l2表示图1(a)中标记手环所在的直线,l1⊥l2。总可以有一个沿直线l2向右的单位向量e,此时<e,x><90°。本文定义向量e为手腕切割向量。

图3是精确分割后的手势模型,向量e为手腕切割向量,点O为将精确分割的手势图像距离变换[1]取距离灰度图像最大灰度值点所得的手势中心点,R2为手势以O为圆心的手势外接圆半径。

式中α1、α2值的选取需满足对任意手势指尖区域(阴影部分)互不连通。向量Mi表示从点O指向指尖区域每个像素点的向量,称Mi为指尖向量。

以下定义指尖角度集:有这样一个角度集合S:

其中N1为指尖区域像素点数。称集合S为手势指尖角度集。

2.2 核密度估计

核密度估计[10]在概率论中用来估计未知的密度函数,属于非参数检验方法之一,由Rosenblatt和Emanuel Parzen提出,又名Parzen窗。对于数据x1,x2,…,xN,核密度估计的形式为:

其中h>0。

式中,K(·)为核函数,满足且对任意u存在K(u)≥0,h为带宽。核函数与带宽的选取决定着估计效果的好坏程度。核函数的选择取决于根据距离分配各个样本点对密度贡献的不同。常用的核函数有均匀核、高斯核、余弦核、指数核等。通常,h对密度估计分布的光滑程度影响很大,选择合适的h非常重要。本文运用核密度估计理论获取平滑的指尖角度集核密度估计序列。

2.3 指尖角度集核密度估计序列

精确的手腕切割向量e在实际中不易取得,而传统的基于互相关系数的形状匹配算法需要相位漂移参数[11],这给后文手势特征形状匹配带来困难。为此,先将集合S在有效角度区间[θmin,θmax]内归一化处理,即:

式中,Nangle表示一个指尖角度集样本的元素数,与式(2)中相应样本的N1相等。

鉴于指尖角度集的性质,选取高斯核作为核函数K(·),即:

推导得核密度估计:

其中i=1,2,…,Nangle,h>0。

式中,带宽h的选取本文在第4节详细讨论。

至此得到了样本手势的指尖角度集核密度估计特征,类似于文献[1]中手势边缘与掌心的相对距离曲线。文献[1]中的特征曲线不够平滑,难以采用相关性匹配方法进行识别,而采用高复杂度的最小FEMD(H,Tc)算法进行模版匹配。

为进一步减少匹配复杂度,对进行均匀采样得到指尖角度集核密度估计序列:

其中:

式中,Nsam为均匀采样点数。

对于拓扑结构[5]相同的不同手势类型,由于指尖区域间距离和各指尖所占的比重不同,这给KDES-FAS特征带来明显差异。本文方法仅选取指尖区域进行特征提取,这也有效解决了文献[1]中手指相互靠得过近所带来的识别困难。另外,KDES-FAS特征完全满足手势平移,缩放和旋转不变性。

3 手势识别

采用基于KDES-FAS互相关系数形状匹配[11]的方法识别手势类型,KDES-FAS平均互相关系数:

式中,c表示手势类型,N表示手势类型数,n表示每种手势类型的模版数,Hinput表示输入手势,T表示模版手势,手势识别匹配算法如下:

其中,Γmat为匹配阈值,Γmat∈(-1,1),Houtput表示输出手势类型。

4 实验分析与比较

4.1 带宽h的选取

对图4(a)手势类型距离变换[1]得到距离灰度图像并找取掌心点如图4(b),取式(1)中得到手势指尖部分如图4(c)。

图4 手势距离变换和关键位置获取

对图4(c)指尖样本取不同的带宽h,取式(7)中采样点数Nsam=200。得到的KDES-FAS特征如图5所示。由图5可知,随着带宽h的增大,KDES-FAS特征越平滑,当h>0.2时失去了表征手势特征的意义。另一方面,分别选取图6中6种一般手势类型各5个样本{Hc,i|c=1,2,…,6;i=1,2,…,5},内部手势平均相关系数与带宽h的函数,i≠i'曲线如图7所示。由图5和图7可知,h选取过大或过小均不利于KDES-FAS特征的有效提取和内部手势的匹配识别。一般地,为了能同时最小化内部手势差异性和最大化外部手势差异性,选取带宽h=0.1作为KDES-FAS特征的合适取值。

图5 不同带宽h下的KDES-FAS特征

图6 6种一般手势类型

图7 不同带宽h下的内部手势平均相关系数

4.2 特征提取的比较

对图6中6种一般手势,分别采用文献[1]和本文的方法对其特征提取,相对距离特征和KDES-FAS特征如图8所示。由图像可知,本文提取了一般手势的概率特征KDES-FAS,而不是精确表征手势的手势特征。KDES-FAS特征比精确表征手势类型的一般特征更稳定光滑,可以采用计算量较小且鲁棒性好的相关系数形状匹配算法进行匹配识别,而不需要文献[1]计算量巨大的FEMD算法,这有利于手势识别的鲁棒性和实时性。

图8 相对距离和KDES-FAS特征

4.3 鲁棒性与实时性实验验证与比较

本文实验硬件环境包括台式计算机一台(Win7系统,Core(TM)i3处理器,2 GB内存),Microsoft公司的XBOX 360一台。软件环境为Visual Studio 2010,所有代码基于Kinect for Windows SDK v1.7采用C#语言编写完成。

一般地,取匹配阈值Γmat=0.75,式(8)中n=5,可以很好地识别出待识别手势和区分出未采样手势。在相同硬件和软件环境条件下,将600个手势样本(分别来自10位实验者,每位实验者分别采集正常和较暗光照条件下各30个样本。实验背景均为如图1(a)所示实验室一般复杂背景条件)。分别连续采用文献[1]和本文方法统计识别率和耗时,实验结果如表1所示。由表可知,本文方法平均识别率比文献[1]提高4.23%,平均耗时仅为文献[1]阈值分解+FEMD方法的7.7%。实验表明,该特征提取方法的手势识别鲁棒性强,实时性有显著提高。

表1 鲁棒性和实时性实验结果

5 结语

本文通过对一般手势定义指尖角度集和引入核密度估计理论,对任意手势进行指尖角度集核密度估计序列特征提取并采用形状匹配算法进行识别。对不同状态下的一般手势识别率达到93.6%,单幅识别平均耗时仅为0.0367 s。显著提高了任意手势识别的鲁棒性和实时性,对手势的实时识别人机交互具有理论意义和实际应用价值。

参考文献

[1]Ren Z,Yuan J,Meng J,et al.Robust part-based hand gesture recognition using kinect sensor[J].Multimedia,IEEE Transactions on,2013,15(5):1110-1120.

[2]Suarez J,Murphy R R.Hand gesture recognition with depth images:Areview[C]//RO-MAN,2012 IEEE,2012:411-417.

[3]Yao Y,Zhang F,Fu Y.Real-Time Hand Gesture Recognition Using RGB-D Sensor[M].Computer Vision and Machine Learning with RGB-D Sensors.Springer International Publishing,2014:289-313.

[4]Kao C Y,Fahn C S.A human-machine interaction technique:hand gesture recognition based on hidden Markov models with trajectory of hand motion[J].Procedia Engineering,2011,15(1):3739-3743.

[5]Qin S,Zhu X,Yang Y,et al.Real-time hand gesture recognition from depth images using convex shape decomposition method[J].Journal of Signal Processing Systems,2014,74(1):47-58.

[6]ElS aadany O S,Abdelwahab M M.Real-Time 2DHoG-2DPCA Algorithm for Hand Gesture Recognition[M]//Image Analysis and ProcessingICIAP 2013.Springer Berlin Heidelberg,2013:601-610.

[7]包加桐,宋爱国,郭晏,等.基于SURF特征跟踪的动态手势识别算法[J].机器人,2011,33(4):482-489.

[8]Lahamy H,Lichti D.Real-time hand gesture recognition using range cameras[C]//Proceedings of the Canadian Geomatics Conference,Calgary,Canada,2010,38(5):357-362.

[9]Zhang Z.Microsoft kinect sensor and its effect[J].MultiM edia,IEEE,2012,19(2):4-10.

[10]Luo N,Qian F.Multi-objective evolutionary of Distribution Algorithm using kernel density estimation model[C]//Intelligent Control and Automation(WCICA),2010 8th World Congress on.IEEE,2010:2843-2848.

上一篇:移动互联网安全综述下一篇:工程公司