改进马尔科夫链

2024-12-22

改进马尔科夫链(精选7篇)

改进马尔科夫链 篇1

摘要:通过实例阐述马尔科夫分析法用于预测和决策的全过程, 并探讨一些初步的改进。

关键词:市场占有率,转移概率矩阵,预测,改进

1 引 言

在市场中, 产品市场占有率即企业实际销售产品数量在同行业实际销售量中所占的百分比, 是评价产品市场竞争能力的综合指标。市场占有率是产品竞争力的晴雨表, 其发展趋势的变化反映企业的竞争态势和运营前景。管理者需要根据产品的市场占有率做出决策。因此, 为了能使企业产品在市场中处于高效良性的营销状态, 必须随时掌握市场动态, 了解本企业产品的市场占有率, 预测其发展趋势, 并采取相应措施, 进行正确有效的决策。

2 详细分析预测过程

2.1 选择预测方法

影响冰箱销售量的因素很多, 除产品质量、价格、经营管理水平等外, 还与某个时期是否有同类新产品投放市场有关。表1为无锡松下冰箱各月的销售量。

资料来源:张昕主编:预测决策方法.

从表1看, 时间序列无明显的趋势变动, 也没有季节变动, 无法采用趋势外推法或季节变动预测法, 但可以将其看做随机平稳序列。冰箱在时刻t 的销售状况, 一般来说只与其前一刻即t-1 时刻的销售状况有关, 而与t-1 以前的状况无关, 所以考虑采用马尔科夫法。建立假设如下:①使用一阶马尔科夫模型;②转移概率矩阵逐期保持不变;③销售总额大小逐期保持不变;④用户按规定时间购货, 且每次购货数量相等。

2.2 确定系统状态及系统状态的初始分布

对一个企业来说, 不仅要预测本企业产品市场占有率, 同时还应了解竞争对手的变化态势。假设系统取n个状态, 这是一个状态空间为{ S1, S2, …, Sn} 的马尔科夫链。表2为2006年5月我国大城市各品牌冰箱市场占有率的调查数据, 根据马尔科夫的基本原理与方法, 按表2 把系统分为海尔、西门子、其他品牌3个状态。得到3 个系统状态在2006年5月的市场占有率分别为:海尔:22.4%;西门子:12.0%;其他品牌:15.4%。以2006年5月为基期来预测2006年6月的市场占有率。那么2006年5月的3个状态的市场占有率即为系统状态的初始分布, 用向量表示为 (P1 (0) , P2 (0) , P3 (0) ) = (0.224, 0.120, 0.154) 。

数据来源:中怡康对全国260个城市2800家门店销售监测。

2.3 建立转移概率矩阵

运用马尔科夫链进行预测的关键在于建立状态转移概率矩阵, 如果在时刻m系统状态Sm=I, 在下一时刻系统转移到状态Sm+1=j, i, j=1, …, n, 其转移概率为Pij。它可以排成一个矩阵:

undefined

, 称为转移概率矩阵。

表3中的数据是中怡康市场研究公司对大城市一些商场的抽样调查, 统计其2006年5月购买和6月欲订购的电冰箱的转移数量而获得的。

按表3数据, 容易建立转移概率矩阵:

undefined

其中:横行元素表示保留或输出的概率, 如P11=0.967 表示购买海尔冰箱的用户保留率为96.7 %;P12=0.023表示5月购买海尔冰箱的用户到6月转至购买西门子冰箱的概率 (输出率) 为2.3 %。列元素表示保留或输入的概率, 如P21=0.050 表示6月海尔从5月购买西门子冰箱的用户中获得客户的概率 (输入率) 为5 %, 等等。

2.4 市场占有率预测

有了状态初始分布向量及状态转移概率矩阵, 就可以根据马尔科夫链的预测公式 (P1 (k) , …, Pn (k) ) = (P1 (0) , …, Pn (0) ) ×Pk (k=1, …, n) 预测报告期各状态的市场占有率。2006年6月3类冰箱的市场占有率分布向量为:

undefined

2.5 稳定状态下的占有率预测

稳定状态下的占有率就是在市场竞争中达到均衡 (稳定) 状态的占有率。对某些马尔科夫链来说, 经过较长一段时间以后, (P1 (k) , …, Pn (k) ) 将逐渐趋于常数向量, 我们记为 (P1, …, Pn) , 称其为稳定分布或终极占有率。根据马尔科夫链理论易知:在一定条件下, 我们有:

对计算结果可做出如下分析:与基期的市场占有率相比较, 海尔冰箱0.612-0.224=0.388=38.8 %, 有非常大的增加;西门子冰箱相对来说增加较小;其他品牌冰箱0.156-0.154=0.2 %, 波动很小。

2.6 预测误差分析

根据中怡康公司公布的数据, 得到这2个月3种电冰箱的市场占有率, 见表4。

这些数据较准确地反映了3类冰箱2个月内的实际市场占有率。将它与预测值相比较得误差见表5。

从表5中可看出预测误差较小。实际上, 激烈的市场竞争中, 各企业经常采取各种措施, 影响用户的购买意向, 因此转移概率矩阵是经常发生变动的。而且, 之前假设销售总额、用户购货时间、购货数量都保持稳定。实际上, 这3个因素由于季节变动、消费水平等因素的影响, 往往也是不稳定的。

3 探讨初步改进

对于用马尔科夫链得到的以上结果可通过改变转移概率矩阵来提高市场占有率以获得竞争优势。一般方法分为两种:第一种, 从竞争对手公司吸引客户过来;第二种, 提高客户保留率。

以此, 我们对稳定状态下的市场占有率预测公式进行改进:假设西门子从海尔那里吸引x%客户过来, 并提高了y%的客户保留率, 那么由式 (1) 有:

从上面结果可以看出, 如果市场条件发生变化, 概率转移矩阵改变的时候就可以直接套用以上结果来预测下一期的市场占有率。下下期可以在以上结果的基础上根据市场变化继续增加变量来进行预测, 方法同上。

4 对马尔科夫分析法的评析

本文提出的基于马尔科夫分析的市场占有率预测模型, 前提是假设转移概率不变, 且仅限一阶马尔科夫过程。然而现实生活中, 顾客下次的购买倾向往往不只与前一次的购买行为有关, 而且可能与在此之前的若干次购买行为有关, 同时转移概率也不会总是不变的。但是在相对短暂的时间里, 可以认为转移概率是不变的, 可以采用本文提出的模型做短期或中期的市场预测, 预测的结果只是为了了解未来市场的变化趋势并为采取相应的对策提供参考依据。

参考文献

[1]中怡康市场研究公司.家电信息监测[N].中国经济导报, 2006-04-03.

[2]王坚强.动态多指标系统增长问题研究[J].系统工程与电子, 2004 (7) :3-4.

[3]易丹辉.统计预测方法与应用[M].北京:中国统计出版社, 2004.

[4]中怡康市场研究公司.家电明星排行榜[J].中国经济信息, 2006 (5) :7.

改进马尔科夫链 篇2

近年来,电力线通信(Power Line Communication,简称PLC)受到了很大的关注。PLC是指利用已有的电力网和能量管理系统进行传输数据、话音、图像等信息的一种通信方式[1,2]。影响PLC可靠性的主要因素有:输入阻抗、信号衰减和噪声干扰等,其中噪声干扰影响最为严重,而噪声干扰中的脉冲噪声干扰更为严重[3,4,5,6]。

国内外已有学者对电力线通信信道脉冲噪声建模问题进行了研究,并得到一些结果。如文献[7-9]利用马尔科夫链建立了脉冲噪声宽度和间隔之间的统计模型,由于其目的仅仅是为了判断是否出现脉冲噪声,故忽视了脉冲噪声幅值之间的关系。通过观察实测电力线通信信道噪声,发现传统的马尔科夫链并不能完全体现出脉冲噪声的幅值特性。文献[10]提出了峰式马尔科夫链的概念,这一改进的马尔科夫链非常适合建立电力线通信信道脉冲噪声幅值模型。本文建立了脉冲噪声幅值的传统马尔科夫链模型和峰式马尔科夫链模型,并进行比较分析。

1 一种改进的马尔科夫链

马尔科夫过程是目前发展很快、应用十分广泛的一类重要的随机过程,其定义如下:若状态和时间参量都是离散的随机过程X(n),在k时刻状态X(k)已知的条件下,其后k+1时刻所处的状态只与k时刻的状态有关,而与之前时刻的状态无关,则该过程称为马尔科夫链[11,12]。

把马尔科夫链的概率

称为马尔科夫链在xs=ai的条件下,xn=aj的条件概率或转移概率,由转移概率构成的矩阵称为马尔科夫链的转移矩阵[13]。

若在k+1时刻状态X(k+1)不仅与X(k)有关,还与X(k)、X(k-1)之间的关系有关:即当X(k)大于X(k-1)时,X(k+1)大于X(k)的概率大于X(k+1)小于X(k)的概率;当X(k)小于X(k-1)时,X(k+1)小于X(k)的概率大于X(k+1)大于X(k)的概率(即分清之前状态是上升趋势还是下降趋势的)。图1即为一组符合峰式马尔科夫链模型的序列。如图1所示,此类特殊的马尔科夫链所构成的序列形似山峰,称之为峰式马尔科夫链(peak-type Markov chain)[10]。

由于峰式马尔科夫链的特殊性,在建模时将会出现两个不同的转移矩阵,分别代表两种不同情况(上升或下降)下的转移概率特性。

2 脉冲噪声幅值模型

取某实验室计算机为研究对象,测量20组电力线通信信道噪声,图2即为某一组实测的噪声,图中一个个尖峰必为脉冲噪声,发现其符合峰式马尔科夫链的定义,因此可建立其峰式马尔科夫链模型。脉冲噪声的功率谱密度一般比背景噪声高10 d B,有时可以超过40 d B[8]。本次实测噪声的背景噪声幅值平均值为0.0089 V,因此认为将实测噪声去除背景噪声后,所得噪声中幅值大于0.028 V的即为脉冲噪声。将这些脉冲噪声的幅值看作一个个离散状态,去除间隔、持续时间、符号等影响,图3即为图2中脉冲噪声幅值所构成的一个离散序列,得到20个这样的离散序列后,根据幅值大小的不同,分为10个状态进行建模。

2.1 传统马尔科夫链模型

统计20组脉冲噪声幅值序列,建立其传统马尔科夫链模型,得到其转移概率矩阵p0。

2.2 峰式马尔科夫链模型

统计20组脉冲噪声幅值序列,建立其峰式马尔科夫链模型,得到其上升趋势下的转移概率矩阵p1及下降趋势下的转移概率矩阵p2(其中Na N表示不可能出现的情况,即表示在下降趋势时,不可能出现连续高幅值的情况)。

2.3 比较分析

观察p1、p2与p0之间的差异,发现存在较大差异,说明上升趋势和下降趋势时转移概率并不相同,只有峰式马尔科夫链才能将这一幅值特性体现出来。甚至一些峰式马尔科夫链模型中代表不可能发生的情况,在传统马尔科夫链模型中变为可能发生的情况:如p2中最后三行转移概率均为Na N,p1中最后三行转移概率存在,说明连续高幅值的情况只有在上升趋势下发生,不可能在下降趋势下发生;但在p0中,并未分上升趋势及下降趋势,即在下降趋势下也可能出现连续高幅值的情况,这显然与事实不符。

因此,峰式马尔科夫链所建立模型比传统马尔科夫链所建立模型保留了更多脉冲噪声的幅值特性,与实际更相符合。

3 仿真

根据峰式马尔科夫链模型的转移概率矩阵p1、p2及脉冲噪声的随机性,可以在离线状态下仿真出无数组电力线脉冲噪声幅值序列,图4即为构造的一组电力线脉冲噪声幅值序列。

统计20组构造的电力线通信信道脉冲噪声幅值之间的关系,得到其上升趋势和下降趋势下的转移概率矩阵p3、p4。

求得转移概率矩阵p1与p3、p2与p4之间中各概率的平均绝对误差分别为:0.015 2、0.006 1,很小,基本可忽略;各概率的平均相对误差分别为:12.77%、8.11%,较小,在工程误差允许范围之内。

比较各转移矩阵,发现有些转移概率极小,而这些小概率会造成相对误差较大,如0.0007和0.000 8,两概率基本相等,但是相对误差却大于10%。此时采用绝对误差来确定精确度更为合理,因此,所建立模型与实测模型有很高的相似度,误差很小。

4 结论

马尔科夫链在预测中的应用 篇3

关键词:马尔科夫链,预测,股票最大涨幅

1 引言

事物具有马尔可夫性, 通常是指事物未来的发展及演变状态仅仅受事物现状的影响, 而与过去的状态无关。运用马尔科夫理论预测股票价格第二天的最大涨幅, 以期在前一天收盘时买入股票, 并在第二天有赢利时抛出。为此, 建立了预测算法的过程模型, 并利用C# 语言实现该算法。通过股票历史数据验证表明, 对于一些股票的特定历史阶段, 该算法是有效的。

2 马尔科夫链

2.1 定义

马尔科夫链是指具备系统在将来发生某件事的条件概率与其过去发生的事件无关, 只与系统的当前状态相关的随机过程。

如果随机过程 {Xt}, t∈T具有特殊性质 : Xr=i, 即过程在时刻t处于状态i, 则在下一时刻t+1处于状态j的概率是固定的Pij(t), 即有:

对于t=0,1,…和每一序列i,j,k0,k1,…,kt-1均成立, 则此随机过程被称作具有马尔科夫属性, 具有马尔科夫属性的随机过程 {Xt} (t=0,1,…) 被称作马尔科夫链。

2.2 性质

马尔科夫链中的条件概率p(t)=p{Xt+1=j|Xt=i} 被称作t时刻的 (一步) 转移概率, 在实际过程中状态是有限的, 状态E=0,1,…,N, 则其t时刻的 (一步 ) 转移矩阵为

若初始状态向量A0, 时刻t=0,1,…,M, 状态向量Am=A0×P(0)×P(1)...×P(M-1)。

3 股票预测中的实现

对于股票市场来说, 如果能够在前一天收盘前买入, 并在第二天有赢利时抛出, 将是非常吸引人的。为此, 考虑利用当天的最高涨幅预测第二天的最高涨幅。

3.1 预测原理

假设当天的股票最高涨幅状态向量为A0, 当天的马尔科夫一步转移矩阵为P(0)。则第二天的最高涨幅状态向量为:

最高涨幅是连续值, 需要按照区间将其划分, 以实现离散化。由于中国股市涨停板和跌停板的限制, 最高涨幅的区间是 [-10%, 10%]。经过多次尝试, 按照如下映射方式, 将最高涨幅映射为1到10的整数: 1 [-10%, -3%]、2 (-3%,-2%] 、3 (-2% , -1%] 、4 (-1% , 0] 、5 (0, 1%] 、6 (1% ,2%] 、7 (2% , 3%] 、8 (3% , 4%] 、9 (5% , 6%] 、10 (6% ,10%]。

对于大多数股票来说, 在当天收盘前的几分钟内基本知道当天和当天之前的最高涨幅。选取当天和当天之前的n个交易日的数据作为样本求取P(0), 利用当天的最高涨幅获得最高涨幅状态向量为A0, 从而获得第二天的最高涨幅状态向量A1。根据A1可以获得对第二天最高涨幅的预测。如果第二天最高涨幅的预测值大于1%, 则在当天的收盘时买入, 并在涨到1%时坚决卖出, 除去手续费之后能够赢利。

例如, 伊利股份2012年2月20日到4月5日30个交易日之间的最高涨幅和映射后的值如表1所示。

可利用这30个交易日 的数据求 取马尔科 夫一步转 移矩阵为P (0)。首先根据表1获得映射值的状态转移表, 如表2所示。

利用状态转移表, 可根据公示(其中, Nij为频数, 1≤i, j≤10) 求出转移矩阵为P(0)中的每一项, 得到P(0)如下 :

根据表1最后一项, 可得2012年4与5日的最高涨幅状态向量为A0= [0, 0, 0, 0, 0, 0, 0, 1, 0, 0]。根据A0和P(0), 求得A1= [0, 0, 0, 0, 0.33, 0, 0.67, 0, 0, 0]。利用A1可知2012年4月6日最高涨幅处于7状态的概率最大, 即最高涨幅处于 (2%, 3%] 的概率最大。伊利股份2012年4月6日的实际最高涨幅为1.06% 。由于预测的最高涨幅大于1,如果在4月5日收盘时买入, 并在涨到1%时坚决卖出, 则除去手续费之后能够赢利。

由于篇幅所限, 上面所举的例子中用于训练P (0) 的样本数据较少, 实际预测中可适当增加样本数据, 以提高预测准确性。

3.2 程序实现

根据3.1节介绍的原理, 在Microsoft Viusal Studio 2010开发环境中进行了实现。整个过程可以分解为4个步骤: 读取历史数据、区间映射、求取P(0)、求取A1并预测。

(1) 读取历史数据

读取股票历史数据可分为两种, 1) 通过网络在线获取;2) 利用第三方软件导出数据文件并读取数据文件。在此采取了后面一种方法, 利用钱龙炒股软件将股票的日K线数据导出为文本文件 (文件的格式如图1所示), 然后在程序中读取该文本文件。该文本文件中包含了日期、开盘价 、最高价 、最低价、收盘价等, 在程序中依次读取每一天的数据。

读取后的数据存放到如下结构数组中 (因篇幅所限, 不列出读取数据的源代码):

(2) 区间映射

将第二天的最高涨幅按照区间映射为1到10的整数, 存放到整数数组A中 (区间的划分数目和方式可根据需要调整):

(3) 求取P(0)

根据数组A中的值求取P(0), 并将P(0)存储在二维双精度数组P中。

(4) 求取A1并预测

预测的第二天最高涨幅区间存放于Output Str字符串中,可输出到程序界面中查看。

3.3 应用方式

程序实现描述了利用历史数据预测第二天最大涨幅区间。实际应用时, 可以利用历史数据进行预测, 并利用历史结果进行验证, 统计如果采用此方法进行股票操作是否可能实现赢利。将该思路应用于一些股票的历史数据, 发现在一些股票的某些历史阶段, 采用这种预测方式是可以赢利的。因此,可以选取那些近期预测成功率高, 并结合影响股票价格的其他因素进行买卖操作。

4 结语

马尔科夫链在气象预测中的应用 篇4

在许多自然界与社会现象中, 许多随机现象都具有下列演变特征:在已知某个系统或 (过程) 目前状态的条件下, 它未来的演变不依赖于它以往的演变 (过去) , 这种特性即称马尔科夫性, 亦称为无后效性.具有这种性质的随机过程叫做马尔科夫过程.马尔可夫模型可用于气象、水文、地震等自然现象的预测, 也可用于经济方面的预测, 为决策者提供一种判断的方法, 以便对本行业的行为及时调整.本文试图从马尔科夫链模型的数学原理出发, 建立对兰州市降水量的数学模型, 并对兰州市年降水量组作出预测, 其中对转移矩阵的估计方法, 具有较高的实用价值.

1 马尔科夫链

1.1 马尔科夫链及其转移概率

马尔科夫链是时间和状态都离散的一类特殊马尔科夫过程, 马尔科夫链模型就是利用某一变量的现在状态和动向去预测该变量未来的状态及其动向的一种分析手段, 由于其具有的马尔科夫性 (无后效性) 、对历史数据的需求不多, 通过计算状态转移概率预测内部状态的变化, 使得这一预测方法具有很多优点, 在现在统计学中占有重要地位.所以马尔科夫模型在自然和社会现象预测上具有广泛的实用性.

应用马尔科夫模型的关键是转移概率矩阵的计算.通过初始概率分布及n步转移概率即可算出在时刻n的概率分布.条件概率

pij (m, m+n) =p{Xm+n=ajXm=ai}

为马氏链在时刻m处于状态ai条件下, 在时刻m+n转移到状态aj的转移概率.

显然

j=1pij (mm+n) =1i=12

由转移概率组成的矩阵

p (m, m+n) = (pij (m, m+n) )

称为马氏链的转移概率矩阵.当转移概率pij (m, m+n) 只与i, j及时间间距n有关, 而与时刻m无关时, 即

pij (m, m+n) =pij (n)

时, 称此链是齐次的.

对于齐次马氏链, 转移概率

pij (n) =p{Xm+n=ajXm=ai}

称为马氏链的n步转移概率,

pij (1) =p{Xm+1=ajXm=ai}

称为一步转移概率.

1.2 初始概率分布及时刻m的概率分布

设{X (n) , n=0, 1, 2, 3, …}是马氏链, 状态空间为I.在初始时刻 (n=0) 状态X (0) 的概率分布为

p{X (0) =j}=pj, jI.

在时刻m (n=m) 状态X (m) 的概率分布

p{X (m) =j}=pj (m) , jI, m≥0,

称为马尔科夫链{X (n) , n=0, 1, 2, 3, …}在时刻m的概率分布, 即p (m) = (p1 (m) , p2 (m) , …, pj (m) , …) , jI.对齐次马尔科夫链而言, p (m) =pPm.

2 马尔科夫模型在气象预测中的应用

马尔科夫预测法中最关键的一步是求状态转移概率和求状态转移概率矩阵, 其方法主要有两种:一是主观概率法, 这种方法一般是在缺乏资料时使用, 误差较大;二是统计估算法.本文主要通过实例, 建立年降水量状态和状态转移概念, 给出了一种类似问题的实用方法.

实例 兰州市年平均降水量预测模型.

根据国家统计局统计年鉴, 近几年兰州市年平均降水量如表1所示, 兰州市降水量各等级转移规律如表2所示.

注 等级划分:1 (≤250mm) , 2 (250-350mm) , 3 (350-450mm) , 4 (≥450mm) .

由表2可得一步转移概率P

Ρ=[00.30.700.30.400.30.60.4000010].

n=0代表2004年, n=1代表2005年, 以此类推.令{X (n) , n=0, 1, 2, 3, …}表示兰州市2004年以后各年降水量, 显然这是一个齐次马尔科夫链, 由此计算出各年降水量预测值:

p (n) =pPm

=[1000][00.30.700.30.400.30.60.4000010]m.

求得预测年降水量分布如表3所示.

对比表1实际数据, 选取其中概率较大的作为当年降水量的等级, 2005年、2006年、2007年降水量状态均符合实际, 依次推断2008年降水量状态为2级, 2009年预测为3级, 预测效果良好.

参考文献

[1]林元烈.应用随机过程[M].北京:清华大学出版社, 2005.

[2]董承章.经济预测原理与方法[M].大连:东北财经大学出版社, 1991.

改进马尔科夫链 篇5

一、理论概述与模型的建立

(一) 马尔科夫链的定义

马尔科夫链是一种随机序列, 它具有离散性和无后效性[3]。假设状态编号为1, 2, …, N, 当随机序列在tn时刻所处的状态为已知时, 其在另一时刻时所处状态的概率特性与序列在tm时刻之前的状态无关, 而只与其在tm时刻所处的状态i有关。对于随机序列{Xn, n≥0}, 若对任意正整数m>2, 0≤t1

如果序列满足以上条件, 则可用马尔科夫链研究其状态变化过程, 对未来状态转移的各种可能性进行预测[4]。

(二) 马尔科夫链预测模型的建立

记xn为时刻tn时预测对象所处的状态, 用下式表示在tn时刻预测对象处于第i个状态上, 有:

在下一时刻tn+1转变成第j个状态的可能性, 又称为状态i经一步转移到状态j的概率, 即一步转移概率。将pij按照顺序排列构成一个矩阵, 即转移概率矩阵

类似地可导出多步转移概率。若预测对象在t0时刻处于状态i, 在tn时刻处于状态j, 这种转移的可能性的数量指标即n步转移概率, 可理解为预测对象从状态i经过n步转移至状态j的概率, 记为

为n步转移概率矩阵。对于n步转移概率有

以上公式为切普曼·柯尔莫哥洛夫方程式, 即马尔科夫预测模型。转移概率矩阵具有如下性质:

(1) , 即每个元素都是非负的;

(2) , 即矩阵每行的元素之和都等于1。

Xn表示某一食糖价格第期的价格, 记, 本文设定状态空间为E, 且E={-1, 0, 1}, 分别代表降、平、升三种状态。则价格在状态空间内的变化一共有9种可能, 分别为-1→-1 (持续下降) , -1→0 (先降后平) , -1→1 (先降后升) , 0→-1 (先平后降) , 0→0 (持续平稳) , 0→1 (先平后升) , -1→1 (先升后降) , 1→0 (先升后平) , 1→1 (持续上升) 。

为了更好地观测食糖价格的状态变化, 本文引入各个状态之间的临界值, 用变量来表示。鉴于不同的食糖价格的变化情况各异, 在进行区间估计时, 不能以单一的常数作为临界值, 因此将0、 (变异系数) 、σ (标准差) 、σ2 (方差) 分别作为临界值Z来划分区间[5]。不同临界值下的区间划分见表1。

(三) 马氏检验

对于随机序列{Xn, n≥0}, 以Fij表示从状态i经过一步转移到状态j的次数, Sj表示一步转移概率矩阵中各列之和除以各行各列的总和所得的值, 则

当n的取值较大时, 服从自由度为 (n-1) 2的χ2分布。选定置信度α, 通过查表得到χα2 ( (n-1) 2) 的值, 当χ2>χα2 ( (n-1) 2) 时, 可认为{Xn, n≥0}具有马氏性, 否则认为该序列不是马尔科夫链。

二、食糖价格未来变化趋势的预测

以原糖价格为例, 连续观察2013年6月24日至2013年10月10日起连续70期的原糖价格波动情况, 利用马尔科夫链预测模型预测第71期的价格变化趋势, 原始数据见表2。

(一) 马氏检验

将以上70期的原始数据导入SPSS17.0进行计算, 得到统计量χ2=11.600。给定显著水平α=0.05, 经过查表可知分为点的值χ2 (4) =9.488, 由于χ2>χ2 (4) , 因此原始数据具有马氏性, 可利用马尔科夫链进行预测。

(二) 临界值的确定

为了确定原糖价格波动幅度的概率, 需要进行区间估计。分别采用0、σ、作为临界值Z来进行区间估计。据此, 将连续70期的原糖价格样本进行统计处理, 在SPSS17.0求出样本标准差σ=0.55, 样本方差σ2=0.30, 变异系数。分别将0、σ、赋值给临界值Z, 以此来进行区间估计。

单位:美分

资料来源:广西糖网

(三) 价格变化的转移概率矩阵

对表2中的样本进行分析, 依据已建立的模型来确定每期价格所处的状态, 得到70期价格状态转移情况。分别计算出-1→-1、-1→0、-1→1、0→-1、0→0、0→1、1→-1、1→0与1→1这9种情况发生的次数, 构造一步转移概率矩阵P;以第70期作为初始状态, 算出初始状态向量p (0) 。P和p (0) 皆因临界值Z取值的变化而有所不同, 经计算, 分别得出不同的P与p (0) :

对应的初始状态向量P0乘以一次转移概率矩阵P即得到预测的概率。则第一次转移的概率矩阵为

经计算得出第一次转移的预测概率, 见表3。

(四) 预测结果分析

当临界值Z=0时, 初始状态为1, 转移概率矩阵为 (0.2188, 0.1563, 0.6250) , 说明新一期的原糖价格先升后降的概率为0.2188, 先升后平的概率为0.1563, 持续上升的概率为0.625。结果说明原糖价格在第71期有很大的可能会上涨。当临界值Z=0.55时, 初始状态为0, 此时的转移概率矩阵为 (0, 1, 0) , 说明原糖价格变化区间在[-0.55, 0.55) 的概率为1。说明第71期原糖价格上升幅度不会超过0.55。当临界值Z=0.30时, 初始状态为0, 此时的转移概率矩阵为 (0.0313, 0.9375, 0.0313) , 说明原糖价格变化范围在 (-∞, -0.30) 及[0.30, ∞) 的概率都为0.0313, 而变化范围在[-0.30, 0.30) 的概率为0.9375。结果说明第71期原糖价格上升幅度有极大的可能不会超过0.3。当临界值Z=0.03时, 初始状态为1, 转移概率矩阵为 (0.2000, 0.3333, 0.4667) , 说明原糖价格变化范围在 (-∞, -0.30) 的概率是0.2, 价格变化范围在[-0.30, 0.30) 的概率是0.3333, 价格变化范围在[0.30, ∞) 的概率为0.4667。结果说明, 第71期的原糖价格的上升幅度有较大的可能会大于或等于0.03。

结合以上分析, 第71期原糖价格将呈现上升的状态, 上升的幅度在[-0.30, 0.30) 区间之内。而事实上第71期, 即2013年10月10日的原糖价格为18.88美分/磅, 较上期的上升幅度为0.2, 预测结果与实际情况吻合。

三、结论

本文利用马尔科夫链, 在连续观察原糖价格的基础上, 运用动态数学模型预测原糖价格未来的波动状况, 并通过引入临界值, 使用区间估计确定价格落在各区间的概率, 缩小预测范围, 预测结果与实际情况一致。

虽然马尔科夫链可以在一定概率程度上反映食糖价格的走势, 但由于食糖市场存在着大量的不确定因素, 如宏观经济因素、市场因素、产业因素等, 这些因素可能导致预测结果难以形成大概率事件, 预测出的某期价格波动可能会出现偏差, 因此概率仅仅作为决策的参考。此外, 转移概率矩阵并非长期不变的, 使用大样本并非提高预测结果的准确率的途径, 适当的样本数也是预测成功的关键。

参考文献

[1]魏振祥, 刘国良.入世后中美食糖价格联动效应动态变化的实证研究——基于2002—2012年中美食糖价格数据[J].北京工商大学学报:社会科学版, 2012, 27 (4) :117-122.

[2]张谐韵.我国食糖价格波动趋势及预测——基于GARCH模型的分析[J].价格理论与实践, 2012, (10) :52-53.

[3]夏莉, 黄正洪.马尔可夫链在股票价格预测中的应用[J].商业研究, 2003, (10) :62-65.

[4]冯文权.经济预测与决策技术[M].成都:电子科技大学出版社, 1989.

改进马尔科夫链 篇6

改革开放以来,山西经济得到了快速的发展,GDP总量有了很大的提高,人均GDP也得到了快速的增长,山西的经济实力明显增强。然而山西省农业生产条件差,科技对农业的支撑能力弱,全省粮食生产年际间波动较大,目前全省有35个国家重点扶持的贫困县和317万贫困人口,大量农村剩余劳动力滞留在有限的土地,不仅影响了农业的发展,而且进一步影响了山西国民经济的整体发展。农村剩余劳动力转移为山西农村经济发展和现代化提供了动力,加快了城市化的进程,提高了农民收入和文化素质。而当前山西现有的城乡二元经济结构、地区差异、农民较低的文化素质制约了农村剩余劳动力转移。只有加快城市化进程,在加强农业基础设施建设的同时,加快农村第三产业的发展,才能使农村剩余劳动力得以顺利转移,并促进农村经济快速发展。这些目标对于当前山西的实际情况而言,有很长的路要走。长期以来,山西省人多地少的矛盾十分突出,如何立足现实,寻找适合山西省情的农村劳动力转移途径,对有效解决三农问题,实现全面建设小康社会的目标,具有重大的现实意义。

文章通过调查山西省晋南地区部分农村的外出务工人员,利用马尔科夫链模型对山西省剩余劳动力2009年外出务工从事产业和外出务工从事地域做出了预测。对寻找适合山西省情的农村劳动力转移途径,解决山西省三农问题在一定程度上有参考价值。

一、山西省农村剩余劳动力转移现状

山西省农村劳动力就业主要以农业为主。2005—2007年,山西省农民从事农业的劳动力人数约为650万人,约占农村劳动力总数的65%。虽然山西农村劳动力就业以农业为主,但农业劳动力所占比重有所下降,并呈持续减少状态。

山西省外出就业的农村劳动力以初中以上文化程度为主,大约占所有外出务工人员的75%。山西外出务工人员中初中及以上文化程度的人是农村文化程度相对较高的人群,他们是农村劳动力转移的主力军,农村文化程度高的劳动力明显能够较好地实现转移。2005—2007年,农村低文化素质人员逐年下降,高素质人才逐年增长。山西省外出就业的劳动力以中青年为主,男性居多。到2008年底,山西转移的农村劳动力中,50岁以下的中青年劳动力所占比重达90%,其中77.1%在40岁以下。在转移的劳动力中75.3%是男性劳动力。

山西省农村剩余劳动力转移的地区,主要集中在县内和市内,只有接近1/3的外出务工人员会选择离家较远的省外,从全国劳动力转移平均情况看,山西省剩余劳动力转移的地域局限性比较大。山西省农村剩余劳动力转移主要集中在第二产业,与全国相比,山西省剩余劳动力从事第二产业的人数比例要高于国家平均数,这与山西省是工业省份密切相关,农村剩余劳动力转移以采矿业、制造业为主。其次为批零贸易业、社会服务业和交通运输业,再次是建筑业。

三、山西省农村剩余劳动力流动趋势预测实证分析

(一)数据来源和分析

文章数据来自2009年春节期间对山西省晋南地区抽样调查问卷,样本采集长治、临汾、运城、晋城四个地级市的农村地区,共发放问卷200份,收回有效问卷182份。其中涉及农村流动劳动力的问卷163份,问卷有效率为81.5%。问卷对剩余劳动力的基本状况进行了调查,包括姓名、性别、年龄、文化程度、家庭收入和支出等,根据本文需要,详细调查了外出务工人员2007年和2008年外出打工从事的主要行业,2009年和2010年计划外出打工从事的行业,2007年和2008年打工的地域,2009年和2010年计划打工的地域。为下文的模型建立提供了数据基础。

(二)马尔科夫链模型介绍

马尔科夫方法的主要研究对象是一个运行系统的状态和状态的转移。应用马尔科夫方法计算分析的目的,就是根据某些变量的现在状态及其变化趋向,来预测它在未来某一特定期间可能出现的状态,从而提供某种决策的依据。它的基本方法是用转移概率矩阵进行预测和决策[1]。

(三)山西省农村剩余劳动力流动趋势预测实证分析

1. 山西省农村剩余劳动力产业流动趋势预测分析。

按农民工产业流动的方向,可以将其分为第一产业、第二产业、第三产业三个类别。第一产业包括蔬菜种植、瓜果种植、粮食物种植以及其他农业类,第二产业包括建筑业、加工制造业、交通运输业、工业技术等,第三产业包括美容美发、家政服务、酒店服务业、烹饪技术、伤病护理、商业经营销售等[2]。通过对晋南地区农民工流动情况的调查,我获得了农村外出务工劳动力产业流动的一般倾向(见表1)。

我们可由表1中数据得到农村劳动力产业流动的转移矩阵:

具体计算过程如下:

解得:(0.0424 0.7054 0.2522)

这个分布表明,经过一段时期后,农村剩余劳动力选择向第一产业、第二产业、第三产业流动的概率将会趋于稳定,各产业所占比例将分别为4.24%、70.54%、25.22%。

2. 山西省农村剩余劳动力地域流动趋势预测分析。

按农民工地域流动的方向,可以大致分为流向村外县内、县外市内、市外省内、省外四种类型。通过调研,我们获得了农村外出务工劳动力地域流动的一般倾向(见表2)。

我们可由表2中数据得到,农村劳动力地域流动的转移矩阵:

(0.20 0.24 0.30 0.26)!0000....005340960000....013026710000....805321000000....08740243"(式2)

具体计算过程如下:

解得:(0.1352 0.2354 0.3268 0.3026)

这个分布表明,经过一段时间后,我省农村剩余劳动力选择向村外县内、县外市内、市外省内、省外流动的概率将会趋于稳定,概率分别为13.52%、23.54%、32.68%、30.26%。根据我们预测的结果,可以看出在未来的一段时间内,农村剩余劳动力的主要流动方向仍以省内工业发达城市和省外为主。

小结

农村剩余劳动力选择向第一产业、第二产业、第三产业流动所占比例将分别为4.24%、70.54%、25.22%。我省农村剩余劳动力选择向村外县内、县外市内、市外省内、省外流动的概率将会趋于稳定,概率分别为13.52%、23.54%、32.68%、30.26%。通过建立模型所得出的结论基本上符合山西省剩余劳动力转移情况,因为调查的片面性和数据的准确性,预测结果可能会有一定的偏差,但预测结果对政府制定政策有一定参考价值。

参考文献

[1]李素玲,刘俊萍.中国农村剩余劳动力转移的对策分析[J].经济观察,2006,(6):78-81.

改进马尔科夫链 篇7

一、Markov过程分析及数学模型的建立

股价综合指数的计算原理采用流通量加权平均法, 在正常的交易时间内, 每时每刻都随各种股票价的变动而变动, 是典型的随时间的推移而取各种实数值的随机过程。

设xn为某第n日股价综合指数对比于前一个交易日的收盘指数涨或跌的百分率, 而且也假设股价指数在某一日的涨或跌仅与前一日的收盘指数有关, 而与其过去的运行态势无关, 即具有“无后效性”, 系统的状态转移在一定的时期内不变。

规定:xn∈[-10, -2]当时出现状态1, 即大幅下跌;当xn∈ (-2, -0.5]时出现状态2, 即正常下跌;当xn∈ (-0.5, 0.5时出现状态3, 即小幅振荡整理;当xn∈ (0.5, 2]时出现状态4, 即正常上涨;当xn∈ (2, 10]时出现状态5, 即大幅上涨。

注意:沪、深证券交易所自1996年12月16日开始实施涨 (跌) 幅度均为10%的停板制度, 所以股价综合指数的涨跌百分率不会超出士10%的范围。

时间参数n以一个交易日为单位, 按“时间序列”计算, 此时xn成为有限状态Markov过程, 其状态空间E={1, 2, 3, 4, 5}。参数空间T={0, 1, 2…, n, …}。其中n=0:表示初始值。

记表示过程 (或系统) 在n时刻位于状态i的条件下, 下一 (即n+1) 时刻转移到状态j的一步转移概率。得其转移概率矩阵

该转移概率矩阵有性质

矩阵P描述了系统由状态出发, 下一时刻转移到状态j的概率分布状况。直观的分析该矩阵各元素的数值大小和变化趋势, 即可对股价综合指数的发展前景做出较为粗略的预测。

设即系统由状态i出发经k步转移到状态j的k步转移概率。

根据C-K方程

及一步转移概率可计算系统的任意k步转移概率矩阵

当转移的步数n逐渐增大时, 可根据Pij (n) 的变化趋势 (如果有一定的趋势) 讨论系统运动的极限行为, 进而得到系统是否具有稳定性。

用Sj (k) 表示第k个时期预测对象恰好处于状态j的概论, 则向量

称为第k个时期的状态概率向量。向量中的元素有如下性质:

第0个时期的状态概率S10, S20…Sn0称为初始状态概率, 相应的向量S (0) 称为初始状态概率向量。可证明:

此式即为马尔科夫预测模型。其中, P为一步概率转移矩阵。由模型可知, 第k期的状态概率取决于初始状态概率和一步转移概率矩阵的k次方。显然, 若已知初始状态概率向量S (0) 及转移矩阵P, 则可求出预测对象在任何一个时期处于任何一个状态的概率。

二、实例分析

以中石油 (6001857) 为例, 按照文中的分析模型加以讨论, 使前述理论具体化。表1是中石油从2009年3月2日到5月8日间共48个交易日的开盘价、收盘价及涨跌幅

则出现的状态分别为2, 2, 5, 3, 2, 1, 4, 2, 2, 3, 3, 5, 3, 4, 5, 4, 4, 2, 4, 4, 1, 2, 4, 3, 3, 4, 1, 4, 4, 5, 3, 3, 2, 2, 5, 2, 2, 2, 3, 4, 1, 4, 3, 5, 4, 3, 4, 5

在48个数据中, 1有4个, 2有12个, 3有11个, 4有14个, 5有7个, 且以5结尾。又因

则得到转移矩阵

如果另第48日的状态为初始状态, 则初始状态概率向量为S (0) = (0, 0, 0, 0, 1) , 预测第49的状态, 在MATLAB中, 计算得到概率向量为:

则处于状态3的概率最大, 即涨跌幅应该在 (-0.5, 0.5]之间。而第49日, 也就是5月11日的开盘价为12.65, 收盘价为12.53, 涨跌幅为0.97%, 应该为状态4, 和预测有出入。

同理, 预测第50日的状态, 概率向量为:

则处于状态4的概率最大, 即涨跌幅应该在 (-0.5, 0.5]之间。事实上, 5月13日的 (5月12日召开股东大会, 停牌一天) 开盘价12.80, 收盘价为13.29, 涨跌幅为6.07%, 应该为状态5, 和预测有出入。

在5月12日召开的股东大会上, 正式批准了公司1000亿元的2009年融资授权, 这个消息刺激了股市, 使得股市大涨。这是预测结果与实际情况有所出入的主要原因之一。不过预测的大致方向都是正确的。

三、总结

马尔科夫模型是应用马尔科夫链的基本原理与方法分析事物的变化规律, 并预测其未来变化趋势的一种技术。它实际上是在条件概率下求期望值的问题, 利用这种技术的关键是获得事物的初始向量和转移概率矩阵。

但是, 它也有很多的限制条件和局限性。首先, 它是建立在一定的假设条件之上, 而实际市场中这些条件很难满足。其次, 文中的实例分析的数据区间的选择会很大的影响转移概率矩阵。但值得指出的是, 如果能很好的选择一个股票上涨下跌的周期, 计算得到转移概率矩阵, 在!短时期!!内运!!!!用马尔科!夫!模!型预!!!测结!果的!大!致!方向!!还!!是比!较准确的, 同样, 短时期内假设条件比较容易满足。除此之外, 马尔科夫模型忽略了影响事物发展的很多因素, 使得预测结果不那么精确, 譬如股票的价格变化不仅受到企业的业绩影响, 还会受到来自基本面、政策面以及人们心理等多种因素的影响。就像文中对第49和第50个交易日的预测, 都受到了股东大会这个因素的影响。但从另一方面, 这也体现了它需要历史数据少、预测简便的优点。总之, 基于马尔科夫模型的股票收盘价预测还是有一定的应用价值的。

参考文献

[1]郝飞.马尔科夫预测法在股市预测中的应用[J].科学之友, 2006 (6) :62-63

[2]侯增艳.基于马尔可夫链的我国CPI走势分析[J].中国物价, 2008 (11) :39-43

[3]焦中信, 李小芳.利用齐次马尔科夫链预测股票价格走势[J].中国商界, 2008 (11) :32-33

上一篇:三基训练下一篇:高中生作文指导新探