加权马尔可夫链

2024-08-14

加权马尔可夫链(共7篇)

加权马尔可夫链 篇1

摘要:本文利用马尔可夫链, 建立了对商场销售利润的预测模型, 它不仅可以预测商场销售利润未来某一时刻的累计额, 还可以预测商场销售利润未来某一时刻段的数额, 为决策者制定长远规划和提高商场竞争力提供定量依据。

关键词:马尔可夫预测法,转移矩阵,商场利润

马尔可夫链的理论及方法是从研究对象在不同时刻的状态入手, 考察并描述状态之间发生转移的可能性, 研究对象所有的变化过程, 对所研究对象未来的发展状态进行预测。马尔可夫链在实际生活中应用的基础是随机性、无后效性和平稳性。其应用领域极其广泛, 尤其在预测方面具有重要的实用价值。这类方法大大提高了预测的准确度, 并可对发生趋势进行超长期预测, 为建立科学的最优决策方案提供了一定的参考依据。

已有学者将马尔可夫链的理论及方法应用到销售及利润预测上, 这些方法可以预测市场占有率、未来市场的变化趋势、竞争对手的变化趋势、利润等, 且方法简便、易于推广、精确度高, 能为企业经营决策者了解市场变化、科学决策提供长期有效依据, 具有重要的实用价值。但将马尔可夫理论运用到商场领域的研究才刚刚开始, 尤其是进行预测商品利润的研究并不多见。本文将视商品销售状态的改变为马尔可夫链, 据商品的状态转移矩阵和利润矩阵建立商品销售累计利润预测模型, 对未来的累计利润进行预测, 即期望利润预测法, 并将模型运用到实际商场销售预测中。

一、模型

1、假设

假设1:一商品未来销售状态有n种;

假设2:销售状态的改变为遍历的齐次马尔可夫链;

假设3:不同时刻间隔相同 (如一个月等) , 时刻间隔对应马尔可夫链中的步。

2、转移矩阵

以商品销售状态为马尔可夫链的状态。设Pij为经过1个时刻商品的销售状态由第i个转向第j个的概率 (i, j=1, 2…, n) 。由此构造一步转移矩阵:

设Pij (k) 为经过k个时刻商品的销售状态由第i个转向第j个的概率。由此构造k步转移矩阵:

3、利润矩阵

设rij为经过1个时刻商品的销售状态由第i个转向第j个时商品的销售利润额 (i, j=1, 2…, n) 。由此构造利润矩阵:

rij>0表示盈利, rij<0表示亏本, rij=0表示不盈不亏。

4、数学模型

记Vi (k) 为商品销售现在处在第i个状态 (i=1, 2, …, n) 经过k步转移 (k个时刻) 之后的期望累计利润额。用矩阵表示为:

V (k) =[V1 (k) , V2 (k) , …, Vn (k) ]

则当商品销售现在处在第i个状态 (i=1, 2, …, n) 经过一步转移之后的期望累计利润为:

一般地, 当商品销售现在处在第i个状态 (i=1, 2, …, n) 经过k (k>1) 步转移后的期望累计利润递推公式为:

即为基于马尔可夫链, k个时刻间隔后商品销售累计利润预测模型。在确定了状态矩阵和利润矩阵后, 根据现在的销售状态, 由模型可对以后任意时刻的销售累计利润额和利润额做出预测, 其中第k个时刻间隔所产生的利润额预测为:

二、应用

1、数据处理结果

对某小型百货商场2013年上半年 (1—6月) 洗发水销售数据进行分析, 并结合商场管理人员的意见, 将商场洗发水销售状况分为畅销和滞销两种状况。通过对这半年洗发水的销售量和利润额的统计分析, 按求平均值的方法得到状态转移情况和利润转移情况如表1和表2所示。

由这两张表得到n=2, 商品销售第一个状态为畅销, 第二个状态为滞销, 状态转移矩阵和利润矩阵分别为:

2、预测模型

由数学模型即式 (4) 得到7月的期望利润为:

即如果6月处于畅销状态, 则7月期望利润为900元;

如果6月处于滞销状态, 则7月期望利润将会亏损180元。

由式 (5) , 6月销售状态为第i个经k (>1) 个月 (步) 的累计期望利润为:

可以计算出下几个月的期望累计利润:

8月 (k=2) 的期望累计利润为 (单位为千元) :

由式 (6) , 8月产生的利润额为 (单位为千元) :

9月 (k=3) 的期望累计利润为 (单位为千元) :

9月产生的利润额为 (单位为千元) :

结果表明无论6月销售状态何如, 可以预计第三个月 (9月) 后可以实现正的累计利润, 开始获利。

三、结论

基于马尔可夫链的随机性和无后效性原理, 本文以商品销售的状态为马尔可夫链的状态, 建立了商品销售累计利润预测模型, 并应用于实例运用的利润预测中。在预测时只需要当前的资料, 无需大量的历史数据, 工作量相对而言较少。根据马尔可夫链的无后效性, 即未来只与现在状态有关的特性, 在预测时, 需要准确统计客户购买数据, 及时更新转移矩阵和利润矩阵, 以保证预测的精确性。

与商场管理者核对, 实例预测结果中V (1) 、V (2) 、V (3) 、U (2) 、U (3) 与商场7—9月实际销售利润的误差很小, 基本在可接受范围内。

此方法应用的基础是要求系统状态转移矩阵和利润矩阵不发生大的变化。而在实际中, 市场竞争、商品生命周期不断缩短、消费者的生活节奏加快以及各商场经营决策人经常采取的各种促销措施等都会影响顾客的购买意向, 转移矩阵和利润矩阵是经常发生变动的。因此, 保证转移矩阵和利润矩阵的正确性对预测结果准确与否十分重要, 这也是该预测方法的主要困难所在。

参考文献

[1]张栓虎、梁玉清、高银生:马尔可夫链在流行性出血热预测上的应用[J].医学动物防治, 2000 (12) .

[2]吴华新、金珠群、韩敏晖:用马尔可夫链分析法预测棉铃虫发生趋势[J].浙江农业大学学报, 2003 (15) .

[3]耿建军、焦德杰:基于马尔科夫链的统计分析的教学评估方法[J].聊城大学学报 (自然科学版) , 2006 (4) .

[4]查秀芳:马尔可夫链在市场预测中的应用[J].江苏大学学报 (社会科学版) , 2003, 5 (1) .

[5]张二艳、龚武:转移概率矩阵计算的一种统计方法[J].河北职业技术学院学报, 2003, 3 (3) .

[6]刘锋:市场占有率预测——基于马尔可夫链的研究[J].商场现代化, 2007 (2) .

[7]王幼莉:中小企业网络营销的马尔科夫预测分析[J].商场现代化, 2007 (8) .

[8]杨涛、叶耀军:马尔可夫链在经济预测中的应用[J].商场现代化, 2008 (1) .

[9]陈玉娟、查奇芬:基于马尔可夫Markov链的企业销售利润预测与决策[J].商场现代化, 2008 (2) .

[10]安中华:基于马尔可夫链的商场销售预测模型[J].湖北第二师范学院学报, 2014 (2) .

加权马尔可夫链 篇2

一、马尔可夫链理论分析

马尔可夫链是一种研究事物转移规律与状态变化情况的理论, 不仅能够应用在时间序列的分析中, 也可以应用在空间序列的分析中, 马尔可夫链系统在每一个阶段的状态都有着随机性的特征, 其时期状态是按照概率来进行转移的, 下一时期状态只由本时期转移概率与状态来决定, 不会受到其他因素的影响.

二、基于时间序列马尔可夫链的应用方式

灰色系统有着理想的规律性与精确度, 是一种小数据建模, 灰色预测模型一般只适合应用在上升趋势明显且数据量较小的预测工作中, 不适宜用于变化趋势不明显数据的预测中, 因此, 在对股市预测时, 可以将模拟值作为时间序列来建立加权马尔科夫链, 根据转移概率的思想来解决问题.

1. 灰色加权马尔可夫链模型建立方式

这可以有效反映出拟合值与原始数据之间的关系.

2. 灰拟合精度指标状态分析

对于灰拟合精度指标, 需要依照具体的情况进行分析, 这可以采用均 - 方差分级法进行划分, 一般情况下, 能够将灰拟合进度指标分成五种类型, 这能够有效反映出数值的实际情况, 并体现出各个数据指标之间的联系与区别.

3. 灰状态转移概率矩阵的构造

要想实现对股市的预测与分析, 必须要分析系统k步转移概率, 这种转移概率有着未知性的特征, 可以采用样本状态转移频率进行估算, 具体的计算方式如下:

4. 灰拟合进度指标状态预测

对于随机变量, 需要对其进行检测, 看是否符合马氏性特征, 再根据各阶马尔科夫链预测具体指标值, 自阶能够表现出指标值的具体权重, 根据前阶段预测值可以采取概率加权法计算结果, 这样不仅可以准确得出结果, 还能够有效预测目的, 这也是使用时间序列马尔科夫链预测股市的必然需求. 在得出结果之后, 需要对预测模型进行检验与修正, 对结果进行马氏性处理, 这样可以得出转移状态向量, 再以此为基础来修正概率与区间之间的预测范围, 计算出相对误差, 分析具体的精度.

三、基于时间序列马尔可夫链股市预测方式

要将马尔可夫链应用在股市预测中, 那么股价变化就需要满足以下几个假设性条件:

第一, 股票市场的运行只受社会因素、政治因素、经济因素等随机因素影响, 且宏观政策不会发生变化, 投资者操纵不会对股价市场产生影响;

第二, 需要满足过程随机性要求, 系统中各个状态的转移都是随机的;

第三, 股票价格涨跌与前一日收盘价格有密切的关系, 不会受到过去涨落因素的影响, 能够忽略过去涨落因素;

第四, 股票价格从某一状态到另外一状态与状态时刻无关联.

如果满足以上几个条件, 就能够使用马尔科夫链进行预测, 分析具体的持股时间与投资效益, 要注意到, 在股票市场之中, 股票价格就是投资价格, 因此, 收盘价格对于股票市场的影响是极大的, 而股票收盘价状态对于股票市场也有着重要的影响, 股票收盘价可以很好地反映出股票价格的波动情况. 投资者最为关心的内容也是股票价格的变动情况.

对股票预测最为关键的一步就是预测股票运行周期, 只要分析出股票运行周期后, 就可以基本得出股票价格在未来一段时期的走向, 这即可帮助投资者把握好股票涨落周期, 帮助他们把握好买卖时机与持股天数, 获取到理想的收益.

假如fij ( n) 为股票价格在状态i经过n个时间到状态j的概率, 那么fij ( n) 可以采用以下的计算方式得出:

在实际的股票市场中, 不可能完全满足以上的条件, 总会存在风险与机遇, 这就能够得出, 股票价格从状态i能够以一定的概率到达j, 将tij为股票价格从i到j使用的时间, 那么可以采用以下的计算方式进行表现:

为了得出最为精确的信息, 需要对平均时间开展加权处理, 以转移概率进行计算, 再根据计算结果分析步长运行周期, 这样即可得出最后的结论.

四、结 语

加权马尔可夫链 篇3

1 应用马尔科夫链进行体育教学评价方法的必要性

1 . 1 体育教学改革是国家高等教育改革的要求

十八大和十八届三中全会明确提出要加快创新教学改革,深化学生培养方式和方法改革。《教育部关于进一步深化本科教学改革全面提高教学质量的若干意见》(教高〔2007〕2号),明确提出要深化教学改革,优化人才培养过程。在2002年教育部颁发的《全国普通高等学校体育课程指导纲要》中明确规定:学生的学习评价应是对学习效果和过程的评价,主要包括体育与运动技能、认知、学习态度与行为、交往与合作精神、情意表现等内容的评价。在体育课教学评价中进行评价方法改革,改变传统的平均值评价法,使用马尔可夫链建模方法考虑学生的基础差异,对某段时间学生的学习效果和教师的教学效果进行评价,达到因材施教,提高学生身体素质,增加学习兴趣,养成终身锻炼习惯的效果。

1 . 2 将数学方法应用于体育教学评价的需要

体育是一个多学科交叉的学科领域,相关的有医学、解剖学、力学、新闻学、生理学、训练学、人文体育、统计学、教育学等等。要很好的进行体育教学改革,必须运用其他学科的方法解决体育问题。要使体育与数学这两门学科更好的结合,使用数学方法服务于体育教学,进一步深化体育教学。

1 . 3 高校体育课传统评价方法存在的问题

高校对体育课程学习评价体系在改革力度等方面还比较滞后,没有完全体现出它固有的以导向和激励功能促使学生健康、和谐成长的作用,与国家提倡的素质教育及“健康第一”的教育教学精神和思想目标有一定的差距。

现在多数高校体育课考核评价方法主要存在两个方面的问题:(1)体育课评价以运动技能评价为主的单一性评价:目前的“技评”仍沿袭着传统的方法,没有考虑学生运动能力和身体素质的个体差别,难以客观地评定学生的学习效果和提高程度。(2)传统的评价法总是以学生的最后运动能力数量考评成绩为主,常常忽略了学生个体差异性(自身基础、身体素质、性别、年龄、籍贯等),有些身体素质好的学生不需要训练已经可以达到考评的要求,而有些身体素质差些的同学,尽很大努力也不能达到考评要求,所以得出的结论不一定能够反映学生实际的学习和教师教学情况。

2 马尔可夫链的基本思想和在体育教学评价中的应用

2 . 1 马尔可夫链的基本思想

马尔可夫链的基本思想是指:随机序列nX ,在任意时刻n,它可以处在状态1 2 3.......nθθθθ ,且它在m+k时刻所处的状态为 m ks+的概率只与它在m时刻的状态 ms有关,即:

链,并且称

为k步转移概率,当Pij (m,m +k)与m无关时 ,称此Markov链为齐次Markov链,且记Pij(m,m +k) 为Pij (k) ,当k=1时 ,可得一步转移概率矩阵,即

2 . 2 马尔可夫链的基本原理和在体育评价中的应用

马尔可夫链(Markov Chain),描述了一种状态序列,其每个状态值取决于前面有限个状态,是数学中具有马尔可夫性质的离散时间随机过程。该过程中,在给定当前知识或信息的情况下,过去(即当期以前的历史状态)对于预测将来(即当期以后的未来状态)是无关的时间和状态都是离散的马尔可夫过程称为马尔可夫链,简记为

马尔可夫链是具有马尔可夫性质的随机变量X_1,X_2,X_3...的一个数列。这些变量的范围 ,即它们所有可能取值的集合,被称为“状态空间”,而X_n的值则是在时间n的状态。如果X_{n+1}对于过去状态的条件概率分布仅是X_n的一个函数,则

这里x为过程中的某个状态。上面这个恒等式可以被看作是马尔可夫性质。

2 . 3 研究方法

使用实验法进行研究,应用马尔可夫链方法对高校两名教师的教学质量和2个本科班学生的体育课教学情况进行评估,以期为体育教学质量评估提供依据。

考虑学生的原始状态,按照同一标准把学生的原始成绩分成相同的等级,即确定出统一的状态空间,然后求出一步转移矩阵,最后根据马尔可夫链的平稳性及遍历性求出极限向量,并根据极限向量进行比较判断。马尔可夫链在教学评价中的应用是建立在两次测验基础上的,建立马尔可夫链模型,对教学质量进行评估分析。

3 应用马尔科夫链方法进行体育课教学评价的意义

(1)采用马尔可夫链方法改变了仅从最好的技评成绩来判断学生的学习效果和教师的教学质量的片面评价,考虑了学生的个体差异性。客观科学的评价了学生的学习效果、学习兴趣、身体素质提高程度和教师的教学效果。

(2)从学生学习成绩的转移概率可以分析教师的因材施教情况,教师能针对不同身体素质水平学生采取区别对待,分级教学的方法。同理,可根据各等级的概率来分析学生成绩的转化情况,对学生的学习成绩进行评价。

(3)马尔可夫链法在高校体育领域可广泛使用;也可以在《国家体育锻炼标准》大学生体质情况的对比研究中应用此方法,体育教学中学生的身体素质的变化情况、运动员的竞赛成绩等方面均可用马尔可夫链方法进行分析研究。

(4)马尔可夫链方法在教学评价中考虑到了消除学生们的基础差异和个体差异性。它考虑了学生的原始身体状态情况。马尔可夫链在教学评价中的应用是建立在两次测验基础上的,即是通过比较第一次测验与第二次测验在不同成绩等级上的学生人数变化来构建转移矩阵。在假定保持教学效果稳定的条件下,得到的马尔可夫链的稳定分布状态可以表明学生达到的学习技术程度。这种评价可以在体育课教学中评价学生最后的学习效果、提高程度和教师的教学效果。

摘要:体育教学评价方法改革是高校体育教学改革的重要组成部分,由于体育教学评价与其它课程的特殊性,传统的评价方式不能区分学生个体差别,促进学生的学习兴趣。本文运用马尔可夫链方法的基本思想,在体育课教学评价中进行应用,提出运用实验方法在学生学习前后状态一致基础上构建转移矩阵,结果表明运用马尔可夫链分析法进行教学质量评价是可行的。

马尔可夫链在天气预测中的应用 篇4

马尔可夫链模型(Markov Chain Model)也叫作马尔可夫分析(Markov Chain Analysis),是一种概率模型。其利用概率转移矩阵进行分析。各个参数与时间相关,可以用来预测未来事物变化状态的趋势。

马尔可夫过程因其无后效性、遍历性和时齐性,目前被广泛应用在科学研究、天气预测、农业预测、市场预测等领域。本文通过对马尔可夫链理论和切普曼-柯尔莫哥洛夫方程的研究,结合降水情况、天气状况等作为研究因素。构建了马尔可夫链预测模型,使用马尔可夫链的一步转移概率矩阵和多重转移概率的计算方法,对天气情况做出了短期预测。

1 马尔可夫链的基本介绍

马尔可夫过程(Markov Process)是一个典型的随机过程,其基本概念是在1907年由俄国数学家马尔可夫(Markov)从布朗运动(Brown motion)的研究中提出的,后经由Wiener、Kolmogorve、Feller、Doeblin及Lery等人的研究整理而于1930到1940年代建立此模型(杨超然,1977)。

定义1.1(Markov过程)随机过程{Xn,n=0,1,2,3,…}若它只取有限或可列个值E0,E1,E2,…(我们用{0,1,2,…}来标记E0,E1,E2,…。{0,1,2,…}或其子集记为S,称为过程的状态空间)对任意的n≥0及状态i,j,i0,i1,…in-1有

式(1)刻画的Markov链的特性称为Markov性[1]。

Markov链表示,一个序列的条件概率只与最近的系统状态有关,与先前系统状态无关(无后效性[2])。

定义1.2(转移概率)条件概率P{Xn+1=j|Xn=i}为式(1)中的Markov链{Xn,n=0,1,2,3,…}的一步转移概率,简称转移概率[1]。

定义1.3(时齐马尔可夫链)Markov链的转移概率P{Xn+1=j|Xn=i}只与状态i,j有关,而与n无关时,记Pij=P{Xn+1=j|Xn=i}(n≥0)。

不管Markov链的状态是否有限,我们都可以将Pij(i,j∈S)排成一个矩阵的形式,令

定义1.4(转移概率矩阵)式(2)为转移概率矩阵,具有以下性质

①Pij≥0,i,j∈S

定理1.1(Chapman-kolmogorov方程)

2 数据的分析

一般认为,今天的天气状况只与前一天的天气状况有一定关系,具有无后效性,满足马尔可夫的基本假设,可以使用马尔科夫模型对天气进行预测。不可否认,这种预测是有意义的,如果我们能研究一种方法对天气进行预测,这将对我们的生产生活都有很大帮助。由于本文是用历史数据预测未来的天气数据,与常规天气预报原理不同,所以准确性不能与天气预报相比较。

2.1 状态空间的种类

天气情况可以分为很多种状态,可以分为晴,多云,小雨,大雨,小雪,大雪等等。笔者按降水与否以及日照或降水强度将天气状态简单分为以下四类,见表1。

本文参考了“天气风雨录”网站(www.fengyunlu.com/anshan/tianqi)。本文使用从2010年2月7日到2012年2月6日共计730日的历史天气状况,根据上表的分类标准我们可以将选得数据转换成天气状况数据,见表2。

2.2 转移概率矩阵

根据表2所示,我们得到729个天气转移情况数据,下面对这些数据进行整合,见表3。

根据表3我们计算出天气变化的一步转移概率矩阵P(1)

根据C-K方程(4)式我们有P(2)=P(1)*P(1)=P(1)2,所以有

由P(2)矩阵我们可以看出,天气对一天之后的天气情况影响很小,今天“云”同时后天“云”的概率为0.525509,而今天“小”后天“小”的概率为0.529322,相差无几,这说明我们用马尔可夫链研究天气情况是可行的。

根据C-K方程我们还可以得到以下结果

利用C-K方程我们最终可以求出转移概率矩阵的极限分布如下:

2.3 不变概率测度

根据定义2.3.1我们可以得到πp=π,其中π=(π1,π2,π3,π4),所以我们可以得到以下方程组:

由于计算精度的限制,稳定分布与不变测度存在少许误差。

因此我们可以看到,鞍山市某一天“晴”的概率为0.547427,预测值为200天,“云”的概率为0.238018,预测值为86天,“小”的概率为0.156203,预测值为57天,“大”的概率为0.058352,预测值22天。同时我们录得的2011年度这四种天气的实际值分别为209天、87天、50天、19天。理论值与实际值基本吻合,所以这种22天,预测是正确的。从预测值和理论值我们都能看出鞍山市少雨多晴,降雨的概率只有0.214555,中雨以上降水的天气(即本文中的“大”天气)的概率更是低到0.058352,晴天(本文中的“晴”天气)的概率为0.547417。

3 结论

在上文中,使用马尔可夫链模型对天气的状态进行了计算分析,使用了天气情况预测模型,并借助该模型应用马尔可夫链的遍历性,对未来天气的变化趋势作出了准确的预测分析,而且研究的预测值与实际值较接近,说明可以使用马尔可夫链来预测天气的变化。另外,在模型研究中,数据越多,越精确,预测也就越可靠。本文只采集了两年的历史数据进行研究,严格来讲,数据准备并不充分,建议同类研究项目多采集研究数据,以确保预测结果更加准确、更加客观。

摘要:本文使用马尔可夫链,通过对历史数据的分析预测未来的天气情况,具体过程如下,首先假设某一状态之间的转移概率只与当前状态有关,与其他因素无关,然后未来状态的分布情况进行推测。本文研究了鞍山市地区的天气状况,时间为2010年2月7号到2012年2月6号共730天,选取鞍山市天气历史数据进行分析,得到鞍山市天气状况的分布。

关键词:转移概率矩阵,马尔可夫链,天气预测

参考文献

[1]张波,张景肖.应用随机过程[M].北京:清华大学出版社,2004.

[2]樊平毅.随机过程理论与应用[M].北京:清华大学出版社,2005.

加权马尔可夫链 篇5

在股票市场中,股票价格是一个基本特征量,但是它总受政治、经济等各方面的影响,具体的影响因素的程度和信息是不完全的,所以我们可以把股市当成一个灰色系统来处理。灰色GM(1,1)预测模型是灰色系统理论的重要组成部分,主要适用于时间短、数据资料少、波动性不大的预测问题,且只需很少的几个数据即可建立模型进行预测,可以很好地解决由于数据少而导致的精确度不高的问题,但由于灰色GM(1,1)预测模型的预测曲线是一条较平滑的单调曲线,对波动性较大的股票市场中的数据列拟合较差,预测度较低。同时马尔可夫链比较适合随机波动性较大的预测问题,但是马尔可夫链要求状态无后效性,且要具有平稳过程等特点。如果灰色GM(1,1)模型对数据进行拟合,找出其变化趋势,则可以弥补马尔可夫预测的局限性,而在灰色预测基础上进行马尔可夫预测,又可弥补灰色预测对随机波动性较大的数据序列准确度低的不足,所以可将二者结合起来。形成灰色马尔可夫预测模型,对随机波动性较大的数据列进行预测,大大提高随机波动性较大数据列的预测精度,为随机波动性较大的对象的预测提供一种新的方法。

1 灰色-马尔可夫链预测模型

1.1 灰色模型GM(1,1)

1.1.1 给定原属数据列,记作x(0)=[x(0)(k)|k=1,2,…,n]

1.1.2 对原始数据进行一次累加,生成新的数据序列记x(1)=[x(1)(k)|k=1,2,…,n]=[x(1)(1),x(1)(2),…,x(1)(n)]

其中x(1)与x(0)之间满足下述关系

1.1.3 构造矩阵B和常数矩阵Yn。

1.1.4 用最小二乘法求解a,u。

1.1.5 该模型的时间响应方程为:

1.2 马尔可夫链预测模型

1.2.1 状态划分。

(1)根据GM(1,1)模型求出原始数据序列的拟合值x(t);

(2)求出残差;

(3)残差的相对值为;

(4)为了使每一状态的数据相差不多,将ε(t)的值从小到大排列,根据用户的需要和数据的多少,将状态分为自己想要的数。

1.2.2 马尔可夫链。

(1)马尔可夫链的概念。

定义1设随机过程{X(t),t∈T}的状态空间S为R中的可列集。如果对T中任意n个参数t1<t2<…<tn,以及使P{X(tn)=in|X(tn-1)=in-1,

则称{X(t),t∈T}为马尔可夫链。

定义2 若马尔可夫过程的状态空间S为R中的可列集,时间参数集T为可列离散集,则称P={Xm+1=j|Xm=i,Xm-1=im-1,…,X0=i0}=P

定义3若P{Xm+1=j|Xm=i}≡P{X1=j|X0=i}≡P(m,1)≡Pij即从i状态转移到j状态的概率与m无关,称这类马尔可夫链为齐次马尔可夫链,Pij表示由状态i经过一步转移到状态j的概率,称为一步概率转移,以Pij为元素的矩阵P=(Pij)称为状态一步转移概率矩阵,其形式为:

其中Pij叟0,(i,j∈s);∑j=sPij=1,(i∈s)。

(2)转移概率的计算。

a.前面的状态划分,将残差的相对值分为若干状态,记为E1,E2,E3,E4,残差相对值序列由状态Ei经k步转移到状态Ej的概率成为n步转移概率,记为,式中mij(k)为状态Ei经k步转移到状态Ej的次数,Mi为状态Ei出现的次数,由于数据序列的最后状态的转向不明确,故计算Mi为时要去掉数据序列中最末的k个数据;

b.当k=1时,即为一步转移概率Pij,其矩阵形式可记为:

c.P(1)=PP(0),考察P(1)中的n个值,若max Pkj=Pk1,则可以认为下一时刻系统最有可能由状态Ek转向状态E1,即下一时刻最有可能处于状态E1;

d.P(n)=PP(n-1),同理上一步可知n时刻后系统最有可能所处状态。

e.计算预测区间及预测值。确定预测对象未来的转移状态转移以后,即确定了残差预测值的变动区间Ej,我们用区间的中位数作为残差的预测值,即残差的预测值=(预测区间最大值+预测区间最小值)/2。则最终预测对象的预测值=(1+残差预测值)灰色预测值。

2 实例分析

由于收盘价是影响股票价格的最主要的因素,本文在上交所交易指数数据中选取从2008年10月到2010年5月20个月末收盘指数,其中时间序列的单位以月计。

步骤一:根据表1中已有的实际数据,用Matlab求出模型GM(1,1)中的a,u。a=0.0215,u=2160.4,则

步骤二:由残差相对值公式,求得残差相对值序列ε(t)的范围为(-25.317%,23.1901%);

步骤三:根据实际情况将残差相对值ε(t)平均分为4个状态a,b,c,d;其中a=[13%,26%);b=[0,13%);c=[-13%,0);d=[-26%,-13%)。

步骤四:残差相对值状态的一步转移矩阵为:

用2010年5月上证指数残差相对值作为初始状态,认为初始分布I(0)=(0 0 0 1)。

则下个月的绝对分布为:

所以下个月预测对象最有可能处于状态d,3,即ε(t)∈d=(13%,26%],又由,所以灰色马尔可夫预测区间x(21)∈(2691.19,3000.796),灰色马尔可夫预测值x(21)=2845.993。

步骤五:同理再进行预测可以依照上面的步骤得到以后各个月份的预测区间及预测值。预测区间及预测值详见表2。

由以上数据经灰色马尔可夫预测模型计算得,见表2。

以上计算结果表明的灰色马尔可夫预测模型较单一的灰色预测模型和马尔可夫预测模型来说精度和准确性都有了明显的提高。

3 结论

灰色马尔可夫链预测模型是根据灰色模型和马尔可夫链模型思想建立的,同时建立在历史数据的统计分析基础上,因此历史数据越准确,精度越高。该模型用灰色GM(1,1)模型预测曲线来反映上证指数的发展趋势,以此预测曲线为基准,再运用马尔可夫模型来寻找上证指数的转移状态,不仅考虑了数据序列中的演变规律,而且通过状态转移概率矩阵的变换提取数据中的随机响应,因而它将灰色模型和马尔可夫链模型的优点结合起来,克服各自的缺点提高预测精度,另外该模型的原理浅显易懂、计算过程不复杂,适用性比较强。该模型存在许多值得探讨的问题,它的预测精度与状态的划分有很大的关系,目前状态的划分没有统一的标准,所以还需要进一步的研究,另外该模型对波动性较大且有一定上升趋势的数据来说,可以取得比较好的预测效果,但并不是对任何数据都能适用。总之,灰色马尔可夫链预测模型有其应用价值,为投资者投资决策提供一定的理论依据。

摘要:用GM(1,1)预测具有良好的精确性和规律性,但对于随机波动性较大的股市行业,它的预测精度比较低,而马尔可夫模型可以克服波动性较大的局限性,弥补灰色模型的不足,因此将两者结合起来对股市进行预测将能提高预测的精度。本文依据上交所20个月末收盘指数预测后四个月的月末收盘指数范围,实证分析表明灰色马尔可夫链模型在股市预测中应用的可行性

关键词:灰色预测模型,马尔可夫模型,月末上证收盘指数,预测

参考文献

[1]牛东晓.电力负荷预测技术及其应用[M].第一版.北京:中国电力出版社,1998.

[2]刘克.实用马尔可夫决策过程[M].北京:清华大学出版社,2004.

[3]唐娜,桂预风,李宝.灰色马尔可夫模型应用于股指分析[C]//第五届中国不确定系统年会论文集,2007:195-198.

加权马尔可夫链 篇6

短期母线负荷预测的精度直接影响后续电网安全分析结果、电网输送能力的计算和运行计划方式的安排。母线负荷基负荷小,具有多重季节性分量和高频波动分量,相邻点的预测误差有很大的随机性,各点误差之间的相关性不强,如何更好地提高短期母线负荷预测精度成为当前电网在线安全分析和预警研究的热点之一。

短期母线负荷预测主要有两类方法:一类[1,2]是基于系统负荷分配的预测方法,另一类[3,4,5,6,7,8,9]是采用母线负荷的历史数据、负荷特性以及相应的影响因素直接进行母线负荷预测。目前关于提高母线负荷预测精度的研究集中于第二类预测方法。文献[3]先采用线性回归方法来预测负荷的季节性变化趋势,然后采用马尔可夫链方法来构建母线负荷在季节性变化趋势中的日常变化模型;文献[4]将累积式自回归动平均算法(ARIMA)和BP神经网络方法综合起来对母线有功负荷进行预测;文献[6]提出了一种模糊神经网络算法;文献[7]将FASE(自适应状态估计)和MLP(多层反馈神经网络)结合起来,前者作为粗估计估计出母线负荷,后者研究FASE的输入输出量与实际母线负荷之间的映射关系;文献[8]提出了基于有色噪声的卡尔曼滤波算法;文献[9]先采用K均值聚类方法对电网中众多母线进行特性聚类,形成几大类聚类中心,然后采用多层神经网络方法进行母线负荷预测。

母线负荷序列具有较强非线性,直接采用线性回归方法难以达到理想精度;由于电力市场的开放,发输配电分开,缺乏整体的母线负荷管理,经验缺乏,专家系统方法、模糊方法等不太适用于母线负荷预测;在智能预测方法中,神经网络预测方法存在学习不足或过拟合的固有缺陷。

本文提出一种混合算法,先采用最小二乘支持向量回归方法(LSSVM)进行短期母线负荷预测;然后由历史预测误差组成误差序列,将历史预测误差看作是一个符合马尔可夫过程的时间序列,采用马尔可夫链方法对未来的预测误差进行估计,并采用预测误差估计结果对上一步LSSVM的预测结果进行修正,得出最终预测结果。经算例分析证明,所提方法能显著提高预测精度。

1 基于LSSVM的母线负荷预测[11,12,13]

标准支持向量回归方法(SVM)的核心思想就是通过一个非线性函数将样本映射到高维特征空间,然后再在高维特征空间进行线性回归。SVM是基于结构风险最小化原则并针对有限样本学习的,能有效地防止过拟合现象,具有良好的泛化能力,能够有效克服神经网络预测方法存在学习不足或过拟合的缺陷。

最小二乘支持向量回归估计方法(LSSVM)继承了SVM的上述优势,并用平方误差损失函数代替不敏感损失函数,用等式约束来代替标准SVM方法中的不等式约束,将优化问题转化为求解线性方程组,对内存要求低,运算量少,更易于实现。

LSSVM的模型结构主要包括输入变量的选择、核函数类型、模型参数三个关键问题。

1.1 输入变量的选取

采用灰色关联度方法[14],从距离预测日比较近的数日内选择N天历史日作为相似日,并按照相似程度进行排序。将相似度最大的前M日的各点负荷作为测试样本,其余N-M天的作为训练样本。

按照以下方式从样本中选取8个输入量:L(d-1,h),L(d-1,h-1),L(d-1,h-2),L(d-1,h-3),L(d-2,h),L(d-3,h),L(d-4,h),L(d-7,h),其中,前四个数用于定义日负荷的变化趋势,后四个数用于定义负荷的日季节因素影响和周季节因素影响。暂不考虑气温等相关因素的影响。

1.2 核函数的选取

选择不同类型的核函数可以构造不同的学习机器,常用的核函数主要有以下几种:线性函数、多项式函数、RBF径向基函数、傅立叶核、Sigmoid函数。在已有的核函数中,RBF径向基函数因其自身良好的特性得到了广泛的应用,在解决各种基于数据的学习问题时,RBF核函数表现出了较好地学习能力。

这里采用RBF径向基函数作为LSSVM模型的核函数,其基本表达式如下:

其中:σ为核函数的宽度系数。

1.3 模型参数的广义网格搜索算法

确定了输入变量和核函数类型之后,模型的性能主要取决于模型的参数,即惩罚参数γ和RBF核函数的宽度系数σ。

如何选择这两个模型参数,目前尚未有统一有效的方法,常常采用经验选择法或者k-fold交叉验证方法。近期有研究者对模型参数的优化问题进行了研究,文献[12]建立了一种联合相似日和蚁群算法的模型参数选择方法,文献[13]将网格搜索法和k-fold交叉验证法结合起来完成模型参数的选择。遗传算法相对复杂,不利于母线负荷预测实际应用;传统网格搜索算法[13]是按一定方式预先列举出模型参数的具体值,有很大局限性。

本文提出一种广义网格搜索算法:先对样本数据按照相似程度排序,将与待预测日相似度最高的样本作为测试样本,其余的作为训练样本;设置模型参数的初始值γ(0)、σ(0),迭代次数nγ、nσ,等比数qγ、qσ,由此形成一个呈等比特性的参数范围,通过评价每组参数对应的预测误差,确定最佳模型参数,并且可以通过调整等比数qγ和qσ来方便地实现“粗”搜索和“细”搜索。具体步骤如图1所示。

2 基于马尔可夫链的误差修正

任何预测方法都是根据历史数据对未来的一种估计,都将或多或少地存在误差,有必要对预测结果进行修正。如果能够从历史预测数据中找出预测误差的变化规律,就可以对未来的预测误差进行估计,并采用此估计误差对原始预测值进行修正,提高预测精度。

母线负荷影响因素众多,随机波动性大,相邻点的预测误差有很大的随机性,各点误差之间的相关性不强,由预测误差组成的时间序列呈现很大的离散性和随机性,可以看成是一个马尔可夫过程[10]。根据历史预测误差的分布情况将预测误差划分为几大类,统计出各类别之间的状态转移概率,估计出下一步的预测误差范围,并采用此误差估计结果对LSSVM的预测结果进行修正。

2.1 转移概率矩阵

数据序列由状态Ei经过k步转移到状态Ej的概率称为k步转移概率,并记为:

其中:m(ijk)为状态Ei经过k步转移到状态Ej的次数,Mi为状态Ei出现的次数。

将Pij(k)依次排列,可得马尔可夫链的k步转移概率矩阵P(k),

2.2 基于马尔可夫链误差修正的具体过程

基于马尔可夫链误差修正的具体过程如下:

(1)按照相似日算法[15],选择与待预测日相似度较高的前N天历史预测误差作为样本数据;

(2)分别求取样本数据的96点误差样本均值集合和方差集合{si}。

其中:、si分别表示第i点负荷预测误差的N天数据序列的均值和方差;i=1,2,…,96。

(3)确定96点负荷预测误差的状态

比如,第i点负荷预测误差划分为5个状态:

(4)构造96点负荷预测误差的k步转移概率矩阵Pi(k)。

Pi(k)表示第i点负荷预测误差的k步转移概率矩阵,i=1,2,…,96,k

(5)编制96点负荷预测误差的状态计算矩阵Ci(k,j)。

利用状态转移概率矩阵,选择离待预测时刻最近的k个时段,其转移步数分别定为1,2,…,k。在转移步数所对应的转移概率矩阵中,取起始状态所对应的行向量,得到新的概率矩阵,即状态计算矩阵。

设第i点负荷预测误差的状态计算矩阵为Ci(k,j),则:

其中:Q(i)(d-k)表示第d-k天第i点负荷预测误差所处的状态;Q(i)(d-k)=1,2,3,4,5;j=1,2,3,4,5;i=1,2,…,96。

(6)求取待预测日96点预测误差所属的状态。

求取状态计算矩阵的列向量之和的最大值,如果矩阵Ci(k,j)的第列列向量之和最大,则待预测日第i点负荷的预测误差所属状态为,且误差ei∈Qj(i)。

(7)根据预测误差的预测状态修正预测负荷。

按照下面的公式进行修正:

其中:L(d+1,i)表示第d+1天的第i点预测负荷;Qj(i)(1)、Qj(i)(2)分别代表第i点预测误差所处状态Qj(i)的上下界。如果上界或者下界为无穷大,则在修正公式中将此上界或下界对应的值取为0。

3 流程框图

基于LSSVM和马尔可夫链的短期母线负荷预测流程框图如图2所示。

4 算例分析

采用SCADA系统采集上来的甘肃某地区电网330 k V母线有功负荷作为数据源,预测2009年3月3日的96点母线有功负荷。选取与待预测日相似度最高的10天历史负荷作为样本,其中,前9天为训练样本,最近一天的为测试样本。样本数据预处理方法采用传统的数据横向纵向比较法[4]。

兼顾各时段负荷差异性和预测速度,将96点负荷依次分为12组,每8点负荷构成一组,每组负荷共用同一预测模型,以同一组的8点负荷的预测误差均方根最小为标准,选择最优模型参数。

为了避免模型参数在迭代过程中出现过多“0”元素的情况,保持初值的各位数上的数字的多样性,设置惩罚参数初始值γ(0)=0.123456、RBF核函数的宽度系数初始值σ(0)=4.987654,迭代次数nγ=40、nσ=40,等比数qγ=2,qσ=2。

优化后的模型参数如表1。

采用优化的模型参数进行预测,预测精度达到90.00%,最大相对误差为23.5714%,最小相对误差为0%,平均相对误差为0.2108%。

选取与2009年3月3日负荷特性相似度最高的前20天历史预测误差为样本数据,转移步长k=1,2,3,4。采用马尔可夫链误差修正方法对2009年3月3日的LSSVM预测误差所属状态进行预测,并按照公式(5)对预测负荷进行修正,精度从90.00%升至91.73%,提高了1.73%,负荷曲线图见图3。

综合LSSVM预测和马尔可夫链误差修正方法,预测2009年3月份正常工作日的96点母线有功负荷(各参数初值同上),预测结果如表2所示。

从表2可以看出:2009年3月份内正常工作日的平均日负荷预测准确率的最大值有92.20%,平均预测准确率达到了88.53%;经马尔可夫链误差修正后,一个月内平均有75%天数的准确率有所提高,准确率最大提高了1.73%,平均提高了0.35%。

5 结论

提出了一种母线负荷短期预测混合算法。先采用最小二乘支持向量回归方法(LSSVM)进行母线负荷预测,并提出一种广义网格搜索算法对LSSVM模型参数进行优化,可以通过设置模型参数初始值、迭代次数和等比数来方便地实现“粗”搜索和“细”搜索,有效克服了传统网格搜索算法需要列举出所有参数值的缺陷,易于得到最优参数;然后将历史预测误差序列看作是一个符合马尔可夫过程的时间序列,采用马尔可夫链方法对LSSVM的预测结果进行修正。实例证明所提方法能够达到满意的预测精度。

本文只是针对正常日的母线有功负荷进行短期预测,节假日母线负荷短期预测和母线无功负荷短期预测方面有待专门研究。

摘要:提出了一种母线负荷短期预测混合算法。采用最小二乘支持向量回归方法(LSSVM)进行短期母线负荷预测,并提出一种广义网格搜索算法对模型参数进行优化;由历史预测误差组成误差序列,将历史预测误差序列看作是一个符合马尔可夫过程的时间序列,采用马尔可夫链方法对未来的预测误差进行估计,采用误差估计结果对上一步LSSVM的预测结果进行修正,得出最终预测结果。经算例分析证明,所提方法能显著提高预测精度。

加权马尔可夫链 篇7

关键词:EWMA控制图,小偏移过程,质量控制,matlab仿真,参数优化,系统实现

0 引言

SPC是一种借助数理统计理论的过程质量控制方法,通常采用控制图来达到过程控制的目的。

传统的休哈特控制图的统计变量只与当前观测值相关,而忽略大量过程历史数据中包含的信息,因此,传统的休哈特控制图对小偏移过程不敏感,往往会造成漏判情况的出现。为此,研究者们提出了累积和(CUSUM)控制图和指数加权滑动平均(EWMA)控制图来实现对小偏移过程的监控。

EWMA控制图的性能取决于参数(平滑系数λ、控制线参数L)的选取,因此,EWMA控制图参数的选取直接影响控制图对小偏移过程的控制效果。有关控制图参数优化问题日益引起广泛关注,相关研究人员曾提出以田口质量损失函数最小为目标的CUSUM控制图优化设计方法,应用马尔可夫链研究了多元指数移动平均控制图及MCUSUM控制图中ARL计算的数学模型[1~3],设计监控EWMA控制图均值和方差的经济控制图[4],在文献[5]中基于马尔可夫链法对EWMA控制图参数优化算法进行了研究。

学术界和实际应用中常用平均运行链长(average run length,ARL)作为控制图性能评价指标。运行链长(run length,RL)是对给定的质量水平、控制图从开始应用到发出报警所抽取的样本数,为随机量,其分布状况可以作为控制图应用的决策依据。ARL是RL的期望值,理想控制图的特点是:过程受控时,ARL值尽可能大;过程失控时,ARL值尽可能小。目前,常用的ARL计算方法有三种,即蒙特卡罗仿真法、积分法、马尔可夫链法。基于马尔可夫链法的EWMA控制图ARL计算算法原理是:将EWMA控制图的上下控制线之间的区间分成k(k为奇数)个子区间,将EWMA控制图绘制的过程近似看成一个离散的马尔可夫链(k的取值越大,该过程越近似于马尔可夫链,则ARL可以用转移概率矩阵表示。

本文在现有研究成果的基础上,系统地研究了基于马尔可夫链的EWMA控制图参数优化方法,基于matlab进行仿真验证,总结出具体的EWMA控制图参数优化步骤,并基于J2EE平台实现EWMA控制图参数优化系统,进而与传统的控制进行了比较研究。

1 EWMA控制图

设X,N(μ0,σ02)其中μ0和σ02分别是过程处于受控状态时的均值和方差。X1,X2,L,Xn(n为样本容量),是相互独立的随机变量序列,其中Xi为第i个样本值,则EWMA统计量为:

其中是一个常数。EWMA统计量的初始值为Z0。Zi可以表示为所有数据加权平均的形式。

由式(2)可见,距离当前越远的数据,权重越小,以指数形式递减。

根据上述模型及六西格玛原则,EWMA控制图上、下控制限UCL和LCL,分别为[5]:

式中,n为样本容量,λ为平滑系数,L为确定控制线的参数。由此可见,平滑系数λ及控制线参数L的选取是影响EWMA控制图对小偏移控制的重点因素。

2 基于马尔可夫链的ARL计算方法

EWMA控制图对小偏移的灵敏度主要受平滑系数λ、偏移量(μ1为过程失控时的均值)、及控制线参数L的影响。将EWMA控制图的上下控制线之间的区间分成(k为奇数)个子区间,子区间编号为1,2,…,k,见图1,则每个子区间的宽度可以表示为

将EWMA控制图绘制的过程近似看成一个离散的马尔可夫链(k的取值越大,该过程越近似于马尔可夫链),用Si(i=1,2,…,k)表示该马尔可夫链的状态,且设Si为子区间的中心点,则

统计量zi落在控制限之外的状态表示为Sa,Si假设zi一旦超出控制限不会自动返回,则Sa为一个吸收态。这样整个EWMA的监控过程就可以描述为带有一个吸收壁的马尔可夫链。该马尔可夫链的一步转移概率矩阵P可表示为

式中,R为k×k矩阵,表示从转移状态Si到转移状态Sj的概率Pij(i=1,2,…,k)。I为k×k单位矩阵,1为所有元素均为1的k×1列向量,0为所有元素均为0的k×1列向量。Pij可表示为:

其中:

因此Pij计算公式如下:

设样本X,N(0,1),则Pij为:

式中Φ(·)为标准正态分布函数。

由马尔可夫链的定义,第i步转移概率矩阵Pi可表示为

则链长PL=i的概率可以表示为

式中,Pinitial为初始状态概率,为简单起见设恒从中心点出发,因此

则ARL可以表示为:

3 EWMA控制图参数优化算法

基于上述计算E W M A控制图A R L的数学模型,总结了EWMA控制图参数优化算法。

EWMA控制图参数优化算法流程如图2所示:

对于给定参数(λ,L)的EWMA检验方案来说,对过程的不同质量水平进行检验,其效果表现在它的ARL值。反之,对于一个具有不同质量水平的过程来说,其效果表现在给定受控平均运行链长值(ARL0)的情况下,能推导出适合的检验方案(λ,L)。

在进行EWMA控制图的设计时,参数λ和L的选取至关重要。基于ARL的EWMA控制图参数(λ,L)优化算的一般步骤如下:

1)先确定参数:置信度α、样本容量n、欲控过程偏移量δ、标准差σ、马尔可夫链区间划分数k、控制线参数变化范围LN,并计算出ARL0;

2)然后,计算满足ARL0的几组(λ,L)值对,拟合λ与L的回归曲线;

3)拟合λ、L的回归方程,以一定间隔取得(λ,L)值对;

4)根据(λ,L)值对及给定参数,计算取该参数时的ARL值;

5)计算ARL与λ的回归方程,寻找ARLmin,从而得到优化参数(λ0,λ0)。

基于A R L的E W M A控制图参数选取的方法是:在ARL0已定的前提下,即控制图的置信度已知,选取参数(λ,L)使得ARL1越小越好。

4 基于matlab的EWMA控制图参数优化

由前面基于马尔可夫链的EWMA控制图ARL的计算方法的研究可知,随着区间划分数k的增加,EWMA控制图绘制过程越来越趋向于马尔可夫链过程;为验证算法的稳定性,取k从10到190,步长为4(δ=0.2,λ=0.2,L=2.7),基于matlab仿真ARL曲线如图3所示。

随着k的增加,ARL极限存在,由此可知,此过程可收敛。

下面研究EWMA控制图参数对其过程控制的影响。

首先,研究不同控制线参数L(λ=0.23、k=50)下的EWMA控制图操作特性(operation characteristic,OC)曲线,观查控制线参数L对控制效果的影响,如图4所示。

由曲线图可见,L越大,ARL0越大,表示过程受控时误判的概率越低。随着偏移量δ增大,ARL呈下降趋势,但L越大,ARL越大,也就意味着当过程失控(δ>0)时,漏判的概率随L的增大

由图5可见,取不同平滑系数λ时,OC曲线存在交点δ*和δ**。δ=0时,λ越小,控制图性能越优。0<δ<δ*之间,λ越大,控制图性能越优。δ*<δ<δ**时,随λ的减小控制图性能变好;δ>δ**时,控制图的性能趋同。

5 EWMA控制图参数优化实例

根据第4部分的结论,EWMA控制图的性能与控制线参数L、平滑系数λ以及过程均值偏移量δ相关。显然,需要根据过程均值波动的不同,选择不同的参数。下面根据具体案例演示控制图参数优化系统界面及优化参数选取过程。

在轴的车削加工过程当中,由于温度升高以及磨损等原因导致刀具迸刀,因而轴的直径发生了小偏移,假设偏移量为δ=1.0。为此,采用EWMA控制图对轴的直径进行过程监控,下面研究监控轴直径的EWMA控制图参数选取具体步骤:

1)在一定置信度(α=0.005)下,确定受控平均运行链长ARL0(200)、马尔可夫链的子区间划分数k(50)以及欲控偏移量δ(本例中为1.0);

2)设δ=0,采用java计算程序,根据已知条件,计算出在不同λ下满足ARL0的L,通常选取λ=0.1,0.2,L,0.9,见表1。然后采用回归方法求出L与λ之间的关系式,如式15所示。

采用基于J2EE开发的控制图参数优化系统演示λ与L的拟合曲线,得到λ与L之间的拟合曲线如图6所示。

3)在λ轴以0.01为间距,在λ、L的关系曲线上获得(λ,L)值对。

4)计算取不同(λ,L)值对、过程偏移量δ=1.0时的A R L0值。的计算结果曲线如图7所示。

5)从ARL1.0与λ的关系曲线,计算得到ARL1.0的最小值min(ARL1.0)=8.1341,以及此时对应的平滑系数λ0=0.17,在图6上计算λ0=0.17所对应的控制线L0=0.17。此时的λ0=0.17、L0=2.6517即为该条件下EWMA控制图的优化参数。对于优化后的EWMA控制图,其在不同偏移量下的OC曲线如图8所示。

在相同置信度α=0.9973及偏移量δ=0.17下,用matlab仿真休哈特控制图和取不同参数的EWMA控制图的ARL随均值漂移的变化情况,表2比较了ARL计算结果:

由上述分析可见,当均值发生微小偏移δ>0.5σ时,E W M A控制图能比休哈特控制图更即时地检测出异常,因此对小偏移的控制更为灵敏,且在相同置信度α=0.9973下,参数取λ0=0.17、L0=2.8912时对偏移量δ=1.0最敏感,参数(λ0=0.17、L0=2.8912)即为置信度α=0.9973、偏移量δ=1.0下设计出的最优参数组合。

6 结论

本文研究监控小偏移过程的E W M A控制图参数(λ、L)优化问题,基于马尔可夫链法对EWMA控制图的参数优化算法进行深入研究,并用matlab对EWMA控制图参数优化算法进行仿真验证,总结出在一定置信度及特定小偏移量下计算最优参数组合的一般步骤,通过比较验证了优化参数的正确性,在上述研究的基础上,基于J2EE平台实现了控制图参数优化系统界面。

参考文献

[1]杜福洲.多元统计过程控制与诊断方法研究[D].北京:北京航空航天大学,2006,9.

[2]杜福洲,唐晓青,孙静.MEWMA控制图运行链长分析及实例研究[J].中国机械工程,2007,18(7):820-824.

[3]杜福洲,孙静,唐晓青.基于马尔可夫链的MCUSUM控制图运行链长分析[J].清华大学学报,2007,47(2)169-172.

[4]Dogan A.Serel,Herbert Moskowitz Joint economic design of EWMA control charts for mean and variance,2008,157-168.

[5]何曙光,何桢,齐二石.基于马尔可夫链模型的EWMA控制图性能分析与优化[J].系统工程与电子术,2008,6(30):1127-1130.

上一篇:公司和员工的交易下一篇:新建单位