实现相关模型

2024-09-14

实现相关模型(共4篇)

实现相关模型 篇1

股票已经成为了一种重要的投资手段, 股票市场的价格波动既是市场经济的晴雨表, 也时时影响大众的财富变化, 牵动着很多人的神经。股市风云变化莫测, 从2007年10月到2008年8月, 只有短短的多半年时间, 上证指数从6000多点跌到2000多点, 同时受华尔街金融风暴的影响, 外围的暴跌再度将A股拖入深渊, 无数人的财富梦想化为泡影。股票价格的大幅度变化给投资者提出了严峻的问题, 这些问题包括:股票的价格是怎样确定的?今后股价将如何发展?到底该怎样来分析和判断上市公司的股票价值?对于投资者, 可能时时都在寻找着这些问题的答案。

由于经济活动的错综复杂, 决定了认识和评估股票证券的价值变得极其困难, 如何科学、客观的评价股票的价值一直是人们关注的问题, 人们总是希望能够找到一种有效的模型去合理的估计股票的价值, 以便能够在投资时作出正确的选择。股票的定价模型有很多种, 本文主要介绍两种:股息贴现模型和市盈率定价模型。并以中国石化股票价值分析为例, 重点分析股息贴现模型和市盈率模型在实际中的应用。

1 股票定价相关模型

1.1 股息贴现定价模型

1.1.1 股息贴现模型介绍

股息贴现模型是对股权资本进行估价的基本模式, 它主张股票的价值是预期股息的现值。该模型的基本原理就是现值原理:资产的价值就是预期的系列现金流量的现值总和, 通常根据现金流量的风险程度确定贴现率进行折现, 它假设普通股的每股价值是其未来股息收入的现值, 股权投资者的预期报酬受到预计持股期间分得的股息和未来出售股票时售价的影响, 而股票出售时的售价也是由股票的未来预期股息收入决定的。在实际运用中股息贴现模型根据时期不同有多种表现形式:

(1) 单一时期的股息贴现公式:

P0=D1/ (1+KS) +P1/ (1+KS)

其中, P0为股票的当前价格;P1为1年后预期的股票价格;D1为1年后预期每股股息;KS为该股要求的回报率。

(2) N个时期的股息贴现公式:

P0=∑1ΝDt/ (1+KS) +PN/ (1+KS) N

其中, P0为股票的当前价格;PNN年后预期的股票价格;Dt为在时期t预期的股息;KS为该股要求的回报率。

(3) 无限期股息贴现公式:

由于:P=∑∞N+1[Dt/ (1+KS) t-N]

因此, 可以得出:

P0=∑∞1[Dt/ (1+KS) ]

上式可以看出, 股票的价格实际上是股票未来能支付的所有股息贴现值加总。

(4) 应用广泛的股息贴现模型——稳定增长模型

该模型假设股息按照一个稳定的速度g增长, 即第t期的股息Dt= (1+g) t-1D1。

在这种情况下, 股票当前价格应该按照永续增长年金的公式进行计算, 即:

P0=D1 (KS-g)

该模型就是高顿增长模型, 其中, ks是股票要求的回报率, D1为第1期的股息, g为股息增长率。

1.1.2 股权必要收益率的估计方法

在任何一个绝对价值评估模型中, 所选取的贴现率既要反映投资风险, 也要反映时间价值。在这里利用资本资产定价模型 (CAPM) 来计算股权必要报酬率。

资本资产定价模型, 投资者要求的收益率不仅仅取决于市场风险, 而且还取决于无风险利率和市场风险补偿程度, 根据CAPM理论有:

E (ri) =rf+βi[E (rM) -rF]

由此看来, 应用CAPM需要知道3个数据:无风险利率、股票的β值和市场风险溢价。

估算无风险利率。一般认为国债是没有风险的, 至少从信用角度看是这样的。也有人选择3~5年短期银行间债券市场利率作为无风险利率。与短期国债利率相比, 长期国债的期限与待折现的股权投资的期限更为一致, 但长期国债的利率市场不活跃, 不能反映市场变动情况。而我国银行间债券市场利率充分反映和解释了债券市场运行和发展的总体特征, 反映市场细分状况, 体现了市场有效原则。因此我们认为, 选择短期银行间债券市场利率可能是比较恰当的股权必要报酬率。

估算股票的β系数。β系数是衡量资产的收益率与市场组合报酬率之间的相关性的指标。β系数的计算方法有两种:一种方法是使用回归直线法计算, 即:通过同一时期内的资产收益率和市场组合收益率的历史数据, 使用回归线预测出来, β系数就是该回归线的斜率;另一种方法是根据资产与市场指数收益率的相关系数、市场指数的标准差和该资产收益率的标准差直接计算β系数。β系数经济意义在于, 它是度量特定资产的系统风险的指标。它告诉我们, 相对于市场组合而言, 特定资产的系统风险是多少。

估算市场风险溢价。根据CAPM, 市场风险溢价定义为市场的预期收益率与无风险利率之间的差别。通常使用市场平均预期报酬率与无风险利率之间的差额来估计市场风险溢价, 在使用这种方法计算市场风险溢价时, 仍然有两种不同的观点:算术平均数和几何平均数。CAPM是个单一期限模型, 这一特点允许它使用算术平均值, 但股票投资通常是长期投资, 这时用几何平均法更好。

1.1.3 股息增长率估计方法

(1) 用历史数据对股息增长率进行估计

如果公司在过去的很长一段时间, 股息有相当稳定的增长率, 那么恒定增长率的估计, 可以用这段时间实际增长率的几何平均值来表示:

股息的平均增长率=nDnD0-1

显然, 在上述公式中盲目的使用历史增长率是不合适的, 预期增长率的变化是源于宏观经济环境、行业结构和公司竞争力的变化。因此在对股息收益率的估计时还需要通过大量的基本面的定性分析来做调整。此外, 还有一种来源于财务理论的增长率估计, 下面对此做简单介绍。

(2) 用财务数据对股息增长率进行估计

从企业的角度看, 企业增长取决于两个因素:①企业的留存收益并用于再投资的数量;②再投资收益率。所以, 公司再投资越多, 其增长潜力就越大;在一定的再投资水平下, 如果公司再投资收益水平越高, 公司的增长速度就会越快。因此, 股权利润的增长率是两个变量的方程, 即企业的留存收益率和企业的股权收益率 (利润被留存就成为企业权益的一部分) 。用下面的公式来表示这种关系:

g=RR×ROE

式中RR是留存收益率, ROE是股权收益率。他们的计算公式如下:

RR=1-RΟE=

在实际运用中, 可以从公开的企业财务报表中方便的查到这两个数据, 从而计算出企业的潜在可持续增长率。

但是, 需要明白, 从概念上讲方法一和方法二的增长率可能并不完全统一, 方法一来源于历史数据对未来的估计, 方法二来源于再投资对未来的影响。在实际运用中可以将两种方法相结合, 相互修正, 从而可以估计出更为有效的企业股息未来增长率。

不管怎样, 由于股息贴现模型简单易用, 可以根据实际情况方便的做出调整, 也适用于各个行业, 因此得到了广泛的应用。

1.2 市盈率定价模型

市盈率是投资者所必须掌握的一个重要财务指标, 亦称本益比, 是股票价格除以每股盈利的比率。市盈率反映了在每股盈利不变的情况下, 当派息率为100%时及所得股息没有进行再投资的条件下, 经过多少年我们的投资可以通过股息全部收回。一般情况下, 一只股票市盈率越低, 市价相对于股票的盈利能力越低, 表明投资回收期越短, 投资风险就越小, 股票的投资价值就越大;反之则结论相反。

以下是市盈率的基本公式:

市盈率=

用市盈率对股票估价:

股票价格=市盈率×每股收益

市盈率有两种计算方法: (1) 股价同过去一年每股盈利的比率; (2) 股价同本年度每股盈利的比率。前者以上年度的每股收益作为计算标准, 它不能反映股票因本年度及未来每股收益的变化而使股票投资价值发生变化这一情况, 因而具有一定滞后性。买股票是买未来, 因此上市公司当年的盈利水平具有较大的参考价值, 第二种市盈率即反映了股票现实的投资价值。因此, 如何准确估算上市公司当年的每股盈利水平, 就成为把握股票投资价值的关键。上市公司当年的每股盈利水平不仅和企业的盈利水平有关, 而且和企业的股本变动与否也有着密切的关系。在上市公司股本扩张后, 摊到每股里的收益就会减少, 企业的市盈率会相应提高。因此在上市公司发行新股、送红股、公积金转送红股和配股后, 必须及时摊薄每股收益, 计算出正确的有指导价值的市盈率。

2 股息贴现模型和市盈率模型的应用

以2006年中国石化股票为例, 利用股息贴现模型和市盈率模型对中国石化股票做股票估价, 并对结果和市场价格进行了实证对比, 以确定所讨论的模型和方法的效果。

2.1 运用高顿增长模型确定中国石化股票价值

根据前述的股票定价模型, 利用高顿增长模型估计股票价格主要是要估计两个变量:必要收益率K;股息增长率g

2.1.1 用资本资产定价模型估计必要收益率

由资本资产定价模型有:

E (ri) =rf+βi[E (rM) -rf]

因此, 要估计出必要收益率E (ri) , 需要确定中国石化股票的β值和市场无风险利率rf

首先用市场数据估算β值。

上证指数标准差计算:

中国石化股票标准差计算:

中国石化和上证指数协方差计算:

中国石化的β系数计算:

βs, z==36.2926.39=1.37

市场收益率估计:

由于市场收益率从长期看将和国民经济一致, 考虑价格因素, 取中国十一五期间的经济增长率为年持续增长率为10%, 而无风险利率取银行一年期债券利率为2.94%。

根据资本资产定价模型有:

E (ri) =rf+βi[E (rM) -rf]=2.94%+1.37 (10%-2.94%) =12.6%

也就是运用资本资产模型估计出, 由市场相关风险确定的中石化股票的必要收益率为12.6%。

2.1.2 用几何平均法估计股息增长率

在这里用前面介绍的几何平均法计算:

股息的平均增长率=nDnD0-1

中国石化股票从2004年以来的年中每股收益率数据如表4:

之所以选择这3年的股息为核算依据, 是因为高顿增长模型是一种恒定股息增长模型, 考察中石化的历史收益数据, 会发现中国石化的收益受政策影响波动很大, 而近年, 随着国家对中石化公司的市场化改革越来越完善, 中国石化的收益水平呈现出稳定增长的态势, 故这几年的数据更加符合模型的假设条件。

根据上式, 可以计算股息增长率g为12.4%。

2.1.3 用高顿增长模型确定的股票价值

根据高顿增长模型, 假设未来中国石化股息具有稳定的12.4%的年增长率。中石化股票2006年的当期价值为:

Vj=D1Κ-g=0.17 (1+0.124) 0.126-0.124=9.56 (元)

即由高顿增长模型, 中国石化股票2006年当期价值为每股9.56元。

2.2 用市盈率估价模型确定中国石化股票价值

中国石化2005年实现主营业务收入7991亿元, 净利润396亿元, 分别同比增长35%和23%, 净资产收益率18.3%, 每股收益0.46元。2005年中国石化油气开采、炼油、销售、化工板块EBIT分别为469亿元、-35亿元、104亿元和143亿元, 所占比重分别为70%、-5%、16%和21%, 虽然油气开采板块销售收入占比仅3.67%, 却贡献了近70%的利润。

2005年中国石化炼油及成品油销售两个板块销售额高达5582亿元, 但仅实现EBIT 69亿元。虽然收到94亿元补贴, 但炼油板块仍然亏损35亿元。本应最赚钱的业务出现了“政策性”利润缩水。

2006年国际油价仍维持高位, 布伦特原油全年均价与2005年基本持平, 保持在55美元/桶左右。在新的成品油定价机制框架内, 2006年中石化炼油板块将逐步扭亏, 油气开采板块继续保持高盈利。

当年, 中国石化发布公告称, 在川东北地区发现了累计探明可采储量为2510.75亿m3、技术可采储量为1883.04亿m3的大气田, 虽然该气田尚不能对2006年、2007年的业绩构成显著影响, 但对解决中石化上游油气资源相对较少的问题十分有益, 可使其综合竞争力进一步提升。

自2006年3月26日起, 国家已开始对石油开采企业销售国产原油因价格超过一定水平 (40美元/桶) 所获得的超额收入按比例征收石油特别收益金。石油特别收益金实行5级超额累进从价定率计征, 按月计算、按季缴纳。征收比率按石油开采企业销售原油的月加权平均价格确定。假设2006年原油均价55美元/桶, 则征收特别收益金对中石化和税后利润的影响分别为-41亿元和-128亿元, 经测算每股收益将因此约分别减少0.05元和0.07元左右。

本次原油销售征收特别收益金是当年3月26日成品油调价的配套措施, 由于中石化成品油产量及销量较大, 汽油、柴油价格上调经过相关测算可增加其税后利润约70亿元左右, 因此成品油价格上调的正面影响大于此次征收特别收益金的负面影响, 但正负相抵后, 正面影响较为有限。因此在2005年EPS为0.46元的基础上, 中石化2006年的EPS为0.57元/股。当时其动态市盈率10倍, 作为一家拥有资源垄断、销售渠道垄断等众多竞争优势的国际化公司, 其当时的估值水平仍然偏低, 其市盈率在2006年达到12倍以上。

中国石化2006当时股票价格=估计市盈率×估计每股收益=12×0.57=6.84 (元/股)

2.3 股票价值模型估价和市场价格的实证对比分析

中国石化股票当时股价波动空间为6~8元/股, 从以上估值可以看出, 中国石化股票还有上升空间。下图为中国石化股票2006年4月28日的月K线图。

从前文对于中国石化各个方面的价值分析, 在此可以得出如下的一些结论:

(1) 当时沪深两市总市值35000亿, 中石化一家公司的总市值就高达4800亿, 占比13.5%, 超过某些行业全行业的总市值, 对沪深指数的影响巨大, 是国内资本市场上不可多得的战略品种。另外, 中石油、中海油当时尚未回归A股市场, 而中石化对旗下公司的整合下市又在加速进行。可见, 优质石化上市公司的数目大幅减少, 中国石化的行业战略配置地位愈发突出。中国石化2006年的EPS为0.57元/股, 考虑到公司拥有资源垄断、销售渠道垄断等众多竞争优势, 且在国内资本市场上战略地位突出, 如果考虑股改因素, 其股价在当时价格水平上应该还有一定的上升空间。

(2) 根据估价模型计算的股票价格, 中石化股票市场价格如果在每股7~10元左右的水平上, 已经较好的反映了其真实的内在价值, 从当时的市场表现看, 该股已经接近被市场合理定价, 短期投资价值正在逐渐丧失, 如果股价上涨过快, 投资者应该警惕投资风险。

(3) 由于前文运用的高顿增长股票模型依赖于公司β值和增长率的估计, 这两个值的变化将导致结果的显著变化, 本文在估计股息增长率时, 采用的数据仅仅是3年的数据, 其代表性似乎不够, 但从本文前面的介绍知道, 只有这3年的数据能够看出股息增长的趋势, 这从一个侧面反映了该模型估价的局限性。但从估计价格区间和实际价格区间的较好吻合, 说明尽管模型非常简单, 但如果合理的估计相关变量, 该模型对投资者分析股票价格有一定的参考价值。

(4) 本文用股息贴现模型的估价和市盈率估价有较大差别, 反映了各种股票定价模型由于估价的理论方法和切入的角度的不同, 将会有不同甚至相反的结论。在本文中, 用贴现模型的估价远高于用市盈率估价, 就其原因, 应该是对中国石化的β系数估计值较高, 之所以有此判断, 是因为中国石化是超过10%的权重股, 按照常理推断其β系数应该和市场指数的β系数接近, 也就是应该接近1的水平更加合理。探讨本文系数值接近1.4, 我认为是在取样时样本太小的原因。这提醒我们在今后的运用中需要尽量的扩大样本, 这样估计值才会更加接近实际。这两个值的较大偏差, 也说明在实际运用中, 定量的分析一定要结合定性的价值分析, 才能够对股票价值有更好的把握。单纯以某一种模型定价可能会造成投资的误导。

(5) 以上的股票估价和中石化的市场表现是大致吻合的。这个结论从一定的角度说明中国股票市场的有效性是存在的, 随着中国股票市场改革的不断深入, 相信中国股市的行政化色彩将减少, 而市场化特征将加强, 也就是说, 中国股市将逐渐褪去政策市的外衣, 将进一步增强其作为投资工具的可分析性和可判断性。因为一个有效性水平高的市场, 股票的价值将更多的依赖其所代表的公司盈利能力和成长特性。现阶段, 投资者正在密切关注美国的经济前景和金融市场动向, 以及中国经济的大趋势。相信中国的股市表现将越来越能够真正成为中国经济的晴雨表。

摘要:本文主要研究了两种股票定价模型:股息贴现模型和市盈率估价模型。选用2006年上海股票交易所的中石化股票作为研究对象, 以中国石化股票价值分析为例, 重点分析了股息贴现模型和市盈率模型在实际中的应用, 运用股息贴现模型和市盈率模型估计出中石化股票合理的市场价格, 并对结果和市场价格进行了实证对比, 以确定所讨论的模型和方法的效果。

关键词:股息贴现定价模型,市盈率定价模型,中国石化

参考文献

[1].Black, Fischer.Return and Beta[J].Journal ofPortfolio Management, 1993, 20 (1)

[2].Fama, Eugene F., Kenneth R.French..MultifactorExplanations of Asset Pricing Anomalies[J].Journal of Fi-nance, 1996, 51 (1)

[3].Lintner, John..The Valuation of Risk Assets and theSelection of Risky Investments in Stock Portfolios and CapitalBudgets[J].The Review of Economics and Statistics, 1965, 47 (1)

[4].钟丹心.股票定价理论的发展及其对我国的实用性[J].世界经济文汇, 2001

[5].刘毅.资产定价发展的理论基础溯源[J].北方经贸, 2001, (200)

[6].张广裕.现代股票定价理论的发展及其对我国的适用性研究[J].湖北社会科学, 2005, (2)

[7].许涤龙.资本资产定价模型与上海股票市场的实证分析[J].南昌大学学报 (理科版) , 2005, (2)

[8].张志强.市盈率与增长率关系的探讨———兼论股票定价的有关问题[J].财经问题研究, 2008, (1)

[9].林毅夫.经济发展战略与中国的工业化[J].经济研究, 2004, (7)

[10].中国统计摘要, 2006

[11].孟卫东, 张卫国, 龙勇.企业战略管理[M].科学出版社, 2004

实现相关模型 篇2

关键词:气动噪声;湍流;数值模拟

Turbulence models and numerical methods for aero-acoustics

Abstract:The mainly development of the research work in the first two years is divided into five parts. 1. A high-fidelity flow solver is developed and evaluated in the study. To improve numerical scheme for shocks, the band width dissipation optimization method (BDOM) is developed. A high-order MP-LD scheme, based on BDOM is developed and assessed. The results show that MP-LD scheme is much better than the conventional high-order shock-capturing schemes in resolving small-scale flow structures and turbulent motions. 2. The DNS researches of shock/isotropic turbulence interaction and shock/turbulent boundary layer interaction are conducted. The return to isotropy of the turbulence downstream the normal shock is complex due to the nonlinear interaction between turbulence fluctuations. The shock surface is distorted by the inlet turbulence velocity fluctuations. Higher velocity fluctuations will make the local shock surface further downstream and increase the shock strength. 3. To investigate the corner separation in compressors, advanced experimental techniques and high-fidelity numerical simulations are conducted, and abundant database are achieved. A new modification approach for turbulence model is proposed based on turbulence transport nature. Two effective modified methods for SA model are achieved: one is to modify constant Cb1; the other is to take account of the energy backscatter by using relative helicity density. The result indicates that the modification based on helicity is self-adaptive for different conditions. 4. Investigation for rotor-stator interaction (RSI) noise prediction method is studied. Firstly, unsteady simulation is conducted to study RSI mechanism. Then the influence of rotor-stator interface treatment is improved. The distribution characteristics of deterministic correlations are analyzed and the influence of some factors on the time-averaged flow field is further studied. Based on above studies, an exponent decay deterministic correlation model is proposed. 5. Knowledge management system for aero-acoustics is set up and some acoustic flow mechanisms are studied. A new triple flow structure exists for a supersonic flow around a F15 fighter model at the high angle of attack. The Kelvin Helmholtz instability for the slip line would provide a new source of noise. The role of the body by including image vortex rings in the vortex ring model is studied and the body image effect reduces the lift force is found.

Keywords:Aero-acoustics; turbulence; Numerical Methods

实现相关模型 篇3

随着信息技术在工业产品检验中的不断应用,传统的以二维工程图为检验依据的检验方式正逐渐向基于模型的检验模式发展[1],但由于现有的检验模型信息定义相对单一、质量检验过程数据没有统一的管理与分析、检验系统缺乏与企业其他数据管理系统的集成等问题突出严重[2~5],已严重影响了检验信息在企业内部的顺利传递。为此,本文通过对基于模型的检验流程分析,提出基于模型的产品检验流程,以此为基础,提出基于模型的检验信息模型,探索研究了基于XML参考模型描述实现,为面向智能制造的企业实现检验数据与其他信息系统的有效信息传递与集成提供了一种数据存储格式。

1 基于模型的检验业务流程分析

首先建立产品的三维数字化模型,依据产品研制要求、公差标准,完成检验模型的数字化产品定义(可包含PMI的关键信息),检验模型的定义根据实际需求输出相应的CAD格式、step格式以及其他轻量化文件格式;根据定义的检验模型、质量检验要求、制造工艺等内容,确定测量要求即要测量的项目;依据定义的测量项目,根据对检测特征的研究,根据已有的测量资源和测量知识,可以获得检测需求,包括检测对象、公差值等检测信息。用户针对不同检测需求,选择合适的检测方式和检测工具,由此完成一道检测工序的制定。重复上述过程,依据检测工序的先后进行检测顺序规划,实现测量过程定义。根据定义的测量过程,生成测量计划;依据测量计划,选取测量设备对所选取的测量项目进行测量,输出测量结果;输出的测量结果值进行分析处理,与理论值进行比较,得出测量分析报告,完成产品质量的检测,如图1所示。

2 基于模型检验的关键业务

2.1 基于模型的检验模型信息定义

基于模型的检验首先是检验模型的定义,实现需要检验的信息在模型中的定义及数据组织。针对目前CAD平台的多样性,使得产生不同的CAD模型格式,基于模型的检验模型的定义应满足异构CAD平台的应用需求,因此应建立一种中性的CAD检验模型数据格式,使得检验模型在不同平台下都可以直接应用。此外,检验模型中应表达检验的尺寸公差检验信息、零件特征(例如复杂曲线、曲面)检验信息、产品制造信息等定义,对于装配件应满足装配信息检验定义。对于检验模型本身应进行相关的信息定义,如模型的点、线、面、体等信息的描述与定义技术,实现产品检验的所有信息能在后续的检验软件、检验硬件的识别。

2.2 基于模型的检验计划信息定义

检验模型定义完成后,需要编制检验计划,即确定检验的范围和检验工艺。针对每一个检验项目确定检验设备、检验手段、检验工艺等。因此,基于模型的检验计划信息定义主要完成检验内容的范围信息定义及检验工艺的信息定义。检验计划信息模型的定义是实现产品从模型定义到检验执行的重要步骤,如何完整的定义检验所需的信息,并实现后续检验软件和检验设备的识别与执行,是数字化检验中的重点。通常检验范围主要包括尺寸公差、几何公差、定义的属性、空间曲面、基准、工作指令,主要评判特定(如最大值、最小值、平均值等)。检验工艺主要包括检验工艺仿真、检验程序编制、检验设备选取、检验工艺编制等内容。而这些内容如何在检验计划信息中定义是数字化检验的关键业务。

2.3 基于模型的检验数据处理与分析

检验设备按照检验计划对检验项目进行检验,通常检验出来的数据并不能直接反映出检验项目所需要的数据,因此需要对检验数据进行处理与分析。如何选取数据处理方法并实现数据处理后的结果能够真实反映检验所要求的结果是基于模型检验的关键。检验数据的处理与分析需要根据实际检验模型定义中的需求,制定相应的数据处理与分析技术。需定义相应的检验数据处理与分析方法,并根据检验数据,生成方便用户识别的结果,来指导产品的研制。

2.4 基于模型的检验知识库构建

检验过程中需要大量的知识库来支撑产品的数字化检验,例如规则库、代码库、数据处理算法、检验用的资源库等,这些数据如何描述,以及这些库如何支撑检验,数据库如何构建等技术是基于模型检验的基础。基于模型的检验知识库构建重点对检验知识进行分类,针对每种类型建立知识的描述规则,实现知识库的构建。

3 基于模型检验的信息模型

信息模型主要用来描述信息对象及之间的关系。本文围绕基于模型的检验流程和关键业务,梳理出基于模型的检验主要信息模型如图2所示。

1)基于模型的检验-基础数据库信息模型

基础数据库信息模型主要围绕基于模型的检验信息模型中的共性、基础性的信息,建立基础数据库,并进行相应的信息描述。主要包括辅助信息、特性信息、特征信息等。

2)基于模型的检验-检验模型信息模型

检验模型信息模型主要围绕模型的设计原则、几何信息描述、拓扑信息描述、产品结构信息、坐标转换信息以及辅助参考信息的描述。检验模型要求采用一种中性的数据格式来描述检验的信息,涵盖零件的几何信息以及面向下游的制造质量工艺信息,实现检验模型信息在不同软件平台之间的信息传递。

3)基于模型的检验-检验计划信息模型

检验计划信息模型主要依据检验模型,根据制造要求和检验要求制定出检验范围,并依据检验范围制定检验计划。因此,检验计划信息模型主要包括检验计划数据信息数据、信息单元数据定义及其之间的逻辑关系。

4)基于模型的检验-资源信息模型

资源信息模型主要用来描述测量过程中使用的机械单元、固定装备、测量设备、传感器、工具等信息。

5)基于模型的检验-规则信息模型

规则信息模型主要围绕检验对象,描述检验设备的选取规则和测量特征的测量规则。测量特征的测量规则包括测量点的数量或者密度、测量点选取策略、特征算法等信息。

6)基于模型的检验-结果信息模型

检验结果主要用来评价检验特征是否满足要求,可为制造工艺提供参考,优化制造工艺,也为企业数据的追溯性(如企业设备、软件、人员)提供依据。结果信息模型主要描述有检验的版本信息、检验结果信息、实际组件设置信息、检验追溯性信息。

7)基于模型的检验-统计信息模型

统计信息模型主要是针对计量结果进行分析总结,为企业产品全生命周期管理(PLM)、企业资源计划(ERP)、制造执行系统(MES)、质量管理体系(QMS)、车间产品制造(CAM)提供参考。

4 基于模型的检验的信息模型实现

考虑到XMl文件的可扩展性和平台无关性等特点;此外,XML文件广泛应用于互联网数据描述和交换,将来可以更好地支撑信息的传递,本文主要借助于XML语言来实现基于模型的检验信息模型描述[6]。

XML文件描述基于模型的检验信息模型主要包括了2部分信息,即标识信息、检验信息,以下以检验计划信息模型示例说明信息模型的组成,如图3所示。

本文以螺纹特征信息的XML实现为例,对信息模型的实现进行说明,其他信息的XML实现可参照进行。

其中螺纹特征信息包括连续参数信息、体颜色信息、面颜色信息和特征数据集等,具体XML实现过程如下:

1)体颜色信息

体颜色信息(Body Info)主要用于记录各特征实体的颜色,主要包括了特征名和颜色信息。其XML实现如图4所示。

2)面颜色信息

面颜色信息(Face Info)主要设计用于记录各个面的颜色,由组成面的所有轮廓边的信息和颜色信息组成。其XML实现如图5所示。

3)特征数据集

特征数据集(Feature Manager)是构成模型所有特征数据(Feature Operation)的集合,并且特征数据(Feature Operation)的排序过程隐含着螺纹模型的造型过程,其XML实现如图6所示。

其中螺纹特征操作实现方式如图7所示。

5 结论

本文提出基于模型检验的流程及关键业务,建立了基于模型的检验信息模型,梳理出了基于模型检验信息模型的主要要素,基于XML语言,实现了基于模型的检验信息模型描述及传递。具体结论如下。

1)提出基于信息模型的检验业务流程,梳理出了基于模型检验的关键业务,即基于模型的检验模型信息定义、基于模型的检验计划信息定义、基于模型的检验数据处理与分析、基于模型的检验知识库构建;

2)提出了基于模型检验的7个信息模型及其关键要素,即基于模型的检验-基础数据库信息模型,基于模型的检验-检验模型信息模型,基于模型的检验-检验计划信息模型,基于模型的检验-资源信息模型,基于模型的检验-规则信息模型,基于模型的检验-结果信息模型,基于模型的检验-统计信息模型;

3)以螺纹特征信息实现为例,利用XML格式语言实现了信息模型组织描述,建立了信息模型的中性数据格式,为其他信息模型的XML实现提供了参考。

参考文献

[1]冯子明.基于三维模型的飞机数字化快速检测技术研究[J].航空制造技术,2011,(21):32-35.

[2]章平.浅析MBD技术在飞机制造检验中的应用[J].科技与企业,2014,(10):353-353.

[3]谢曦鹏,李洋,李向明.基于MBD技术检验规程在飞机数字化装配中的应用[J].西安航空学院学报,2013,31(4):17-21.

[4]杜福州,梁海澄.基于MBD的航空产品首件检验关键技术研究[J].航空制造技术,2010,(23):56-59.

[5]徐龙.基于MBD的检验方法研究[D].西南交通大学,机械工程,2014.

基于用户日志的相关搜索模型研究 篇4

从Internet上获取信息,已经成为人们重要的工作和生活内容之一,搜索引擎不可替代地成为人们工作和生活的重要工具。由于人们在对搜索内容的描述时会有很大的差别,并且在提交查询条件时,条件的设置并不够精准,甚至只是试探性地搜索。用户在第一次搜索结果展现后,在得不到满意情况下,会继续修正他的查询条件。

对某集团用于公众使用开放的搜索引擎监测结果表明,使用两个词组作为检索条件的用户有33% ,只使用单一词组作为检索条件的有49% ,用户平均使用的检索词组为1. 4,这大大制约了关键词的向量空间模型在传统检索中发挥的作用。解决这类问题常用的办法是查询扩展[1],人为地为用户检索条件增加查询词。

这在为用户带来更好的检索体验同时,也带来了新的问题,即无关检索结果的出现,以及在用户试探性检索时,检索结果与用户预期结果偏差更大。这种自动修正的算法无法达到更好的效果。而用户自发对检索条件的修正,为我们更好的理解用户检索目的,提供了难得的解决问题的方法。

本文是在挖掘用户日志的基础上,受马尔科夫链启发,通过对数据的分析,设计出基于用户日志的相关检索统计模型方法。传统关键词的向量空间间模模型型和和查查询询扩扩展展的的优优化化不不可可被被替替代代,,所所以以““相相关关搜索”推荐在搜索引擎中开辟了一个独立的功能展示。

1 相关工作

相关搜索是为了给用户原始查询Query提供一连串有意义的相关查询 { Q1,Q2,…} ,可以是对Query的局部修正,也可以是对Query整个替换。但结果都能为用户提供更好的检索条件。通常的实现方法主要分为两类。它们分别是基于文档的方法和基于用户日志的方法。

基于文档的处理方法包括全局文档相关反馈、部分文档集分析反馈、隐形语义索引( Latent Semantic Index) 、分析人工编辑语料( 如词典,百科等)[2]。这些方法基本可以处理各种检索,只要能够发现相关的文档,但是找出相关的文档本身就是一个问题,会产生错误的引导,更加降低准确度。而分析人工编辑语料可以比较准确的找到相关查询词或者短语,但对新颖尚未编辑收录的数据难以达到效果,而用户对新词的检索会占据很大的比例。

对于基于文档的处理方法,如何构造合理的扩展集合又是一个问题[3]。而搜索引擎使用过程中积累的用户日志,包含了大量用户自修饰的完整检索,在很多数据之间存在着强关联,这种关联是我们最希望挖掘和借用的。这种强关联可以透过独立数据之间的属性特征被人们发现和建立。这些属性主要是检索间共有的特征,包括: 同一用户的检索行为、日志中不同查询间的文本相似度、强关联出现的频率以及和时间分布的相关性、检索共有的相同或相似的点击URL。对于形成相关搜索借用属性条件的不同,可以将它们分为: 基于Session的方法,基于点击URL的方法和基于检索内容的方法,在这些方法中出现了一些不错的算法包括IR模型、数据挖掘方法、基于查询—点击URL二分图的图算法等,本文是研究基于Session的方法,面向某集团专业搜索引擎业务实现相关搜索。

2 基于用户日志的相关搜索模型

2. 1 基本思想

搜索引擎查询日志中的session是指某一用户为了检索到某个信息,而在一段时间内采取的连续搜索行为{ Q1,Q2,Q3,…} 。在以往平台使用的相关搜索中,因为考虑到用户使用的检索条件多为关键字的形式( 这里将查询条件中,一个查询词组或者查询字定义为一个关键字) ,所以仍然使用的方式是关键字和文本信息相匹配的方法[4]。

本文的背景是研究合适某集团业务使用的设计计实实现现,,该该套套系系统统不不仅仅针针对对公公众众开开放放,,同同时时设设计计也也需满足内部客服员工的使用。对于集团内部的使用就对设计有了特殊要求,比如: 客服员工在接受问询的时候可能会很迅速地改变查询目标,这就使得Session的划分很难按照常规的时间方法来实现。Jansen,D. He在实验中取得,当时间在10分钟 ~ 15分钟之间的时候,划分Session,Session内包含的信息趋于稳定,这是一个合适的临界取值区间。但这并不适用本文的状况。根据实际情况尝试将Session时间划分碎片化,将所有日志信息分割为微小单位,建立得到相关搜索的扩展集合。在扩展集合的基础上为用户提够检索推荐[5]。

2. 2 模型描述

首先要清楚初始数据的关联关系,现在用一个查询关系图来描述这些待用关键字。关键字既有的关系: Rq= < Wq,Eq> 是用来描述查询内容。Wq是用户生成的查询关键字集合{ w1,w2,w3,…} ,Eq= { e} 是有向边的集合,它代表关键字wi→wj的联系。同时有v反映关键字wi→wj边的关联价值,也是对e的评价。

根据Session的特点,已经知道在同一Session下看作是同一用户的操作行为。用户在发送检索需求时,并不能两到三次的检索行动就一定达到目标需求。所以,这过程中,用户可能发生多次对关键字的修正,将这形象的比作为一个沿着从零开始的时间链条单方向行为。最终建立的扩展集合是总结所有用户发生的单方向链条,所以其他用户在检索一个目标时,可能是从其他用户的非零时间切入,这就使得整体查询关系图变的交织复杂。这对建立可扩展集合很不利。本文需要发现并建立清晰明了的关键字关系,所以将复杂的检索关系切割,让它们成为唯一的关系对,而不是关系链条。因为本文是面向领域专一的集团业务,所以数据量的大小是一个可承受条件。本文将得到的唯一关系对表述为Relate = < Query1,Query2 > ,在描述这对关系的时候,需要加上一些必要的注释因子,将这些注释因子看作关系对的属性,所以关系对可以表示为Relate = < Query1 < Query2,Object > > ,这里的Object是这对关系的注释因子[6]。这个表达式是本文对唯一关系对进行处理和表达方式。图1是表示相关词对处理形式。

2. 3 扩展集合规则设立

依据实际需要,需要设定一个对现实需求有帮助的Session时间划分阈值[7],在经过人们对集团用户使用习惯的统计分析,设定15秒的阈值为所需要的合适Session时间划分。在马尔科夫模型中,在给定当前知识或信息的情况下,过去的历史状态对于预测将来状态是无关的。现在有随机变量的数列X1,X2,X3,…,这些变量的范围,即他们所有可能取值的集合,Xn的值则是在时间n的状态,在一定时间阈值内发生的状态偏移也是连续的,Xn + 1是在时间n + 1的状态,Xn + 1不仅在时间上,在相关性上也是Xn的一个延续[8]。

如此就知道了需要建立的可扩展集合的外部状态,在每次获取用户的关键字同时,本文会获取的信息包括Session ID,关键字发生时的时间Time( t) ,用户点击的URL。设定了扩展集合的时间准入,即它的Session时间阈值。因为用户日志的数据量巨大,必须对它继续筛选。我们设定了一系列的度量值:

λ = ε /15,μ = e。ε表示前后关键字发生时的实际时间差,e是表示关键字间的关联价值。

当λ < 1时,本文认为 它符合数 据碎片化要求[9]。

在利用中科院的分词工具ICTCLAS,对碎片化数据的分词分析后,得到R' = < w'i,w'j> 。Xn + 1对Xn状态的修正中,认为符合两条规则最有价值,即:

当w'i∈w'j,w'j∈w'i,w'i= w'j显示他们互为包含关系,是用户后一状态对前一状态关键字的增减修正。

或者wi'∩wj'不为空,显示是用户对关键字的替换修正。这两种修正关系表示关键字间是有价值值的的。此此时时的的μ标标记记初初始始设设置置为为1。

当μ > 0时,认为它符合我们数据的有意义要求,是有价值的。

2. 4 关键字权重设定

在建立的扩展集合,不但需要使用模型的关键字对,同时需要每个关键字的属性描述,既是前文讲到的Object[10]。此时,要考虑的是如何反应这些关键字的关联强弱,也是影响它反应给用户的排名权重,本文将权重记为K。在Object属性中有一个描述是heat。它的作用是标记用户日志中发现该条数据的重复程度,在权重公式中记为h。反映检索相关程度的权重公式:

其中,公式的前两项在前文中已作描述。其中的F( q) 表示与用户检索相关的候选项heat属性的大小,在建立的扩展模型中收录统计,n表示扩展集合模型中相关候选项的数目,表示所有与用户检索有相关关系的数据heat属性总和。

例如: 在扩展集合中有 < q0,q1 > < q0,q2 > ,q1属性heat为10,ε为5,q2属性heat为15,ε为8。这个时候它们的权重就分别为1. 7333和2. 1333。权重数值较高的关键字选项q2在展示结果中会排列在q1前面。

基于用户日志的可扩展集合生成流程步骤如下:

Step1在接收到用户每一个检索需求时,记录下用户提交的信息,封装为一个对象。

Step2将对象逐次入队列操作,同时对队列进行出队列操作。在出队列操作时要经过建立的中间字典筛选。在中间字典中要判断有无该条sessionid数据,没有新存入; 有,则判断λ,μ。

Step3在判断λ合法性时,不符合要求新存入中间字典,删除原有中间字典中对应数据。全部符合要求的数据到扩展集合中查重,重复的改变原有数据的heat值,不重复,进行新存入集合操作。在属性描述中的属性heat和增加新数据时候,都要求作下标记留作以后入库时候的增量更新使用。

Step4在中间字典中,数据的合法性时间都很短,但它在内存中数据量是一个无限增长的过程,所以设定十分钟对它进行一次清理操作,保持系统的轻巧性。在每天用户操作较少时刻,进行定时操作,将数据分析存入文本和数据库。

3 实验结果

为了验证本文系统设计的有效性,我们将设计完成的系统和原有未经优化改进的集团检索系统进行性能对比。本文没有采用集团公司的语料进行测试,而是在网络取网易,新浪和搜狐等知名中文门户网站信息,抓取10000个文档,建立索引测试。

测评系统的性能标准,实验为系统设定了两个评价标准。一个是精确率( Precision) ,另一个是召回率( Recall) 。由于研究已表明一般用户查看检索结果时主要查看系统提供的前两页,以及本系统设计的特性,本实验通过分析返回结果的前20条记录来评价查准率。召回率实验通过人工标记的办法,对两个系统分别测试,并进行比对比较。实验选取10组相同的检索词条检索返回结果评定精准率。

由图2可看得出原有的系统性能精确度平均值为0. 575,而优化后的系统在该指标上的平均值为0. 803。优化改 进的系统 比原有的 系统在Precision指标提高了36. 9% 。从实验结果可以看出指标Recall有很大提 升,图3显示查全 率从0. 729提升到0. 871,提升了19. 4% 。总体而言,经过本文的优化和改进,明显的提高了原有使用系统的性能。

4 结束语

在实验过程中发现系统才开始启用的时期存在一个问题,即用户日志的数据量不足产生的影响。这将使本文的模型建立和运用无法得到最好的效果,此时可以结合局部文档相关反馈技术的方法,在文档集上建立相应的文档扩展集合,根据一定的排名方法,将两个扩展集合中的关键字,按照一定比例链接 起来,提交给用 户做相关 搜索使用[11]。在系统逐渐成熟时,可以考虑建立单一的模型,供用户在使用中选取合适的相关推荐。本系统运行结果的相关达到率达到了一定精度,特别是本文建立在基于用户日志上的扩展集在建立的过程中,有自己的筛选办法。本文分析数据相关性程度达到需求时,就可以推断这是一个稳定结果良好的相关搜索检索方式。

摘要:搜索技术的组成部分发展至今已经呈现多样化,在不同的使用环境它们各有特色,但都致力于为使用者提供更优质的使用体验。现代搜索技术希望从使用者的自然语言出发,为使用者发掘到最理想的目标答案。相关搜索是查询推荐技术在搜索引擎中最常见和成功的实现,传统相关搜索基于日志建立的模型是为了应付基于内容分析或初次检索模型的局限性。文中重新划分粒度,更加精确计算用户日志数据的相关性,为使用者提供更好的相关推荐。实验表明,文章结果在应用中有了较好的提高。

上一篇:小儿支气管哮喘护理下一篇:城乡关联度