深度预测

2024-05-14

深度预测(共9篇)

深度预测 篇1

2008年, 在全球金融危机和国内经济增速放缓的背景之下, 中国房地产业经历了颇不平静的一年。一度蓬勃发展的房地产业出现调整迹象, 房地产销售出现了1998年以来的首次负增长, “量跌价滞”成为市场的主要特征, 企业资金来源增速回落至2004年以来的最低水平。在严峻的市场态势之下, 业界对2009年的楼市普遍陷入悲观的预期之中。国家一系列救市政策的出台以及房地产业支柱产业地位的强调, 似乎又为提振市场找到了政策支撑。2009年的楼市将何去何从?本刊集纳一些研究机构和业界人士对今年楼市发展趋势的预测, 力求对2009年的楼市走向做出判断。

政策走向:以“稳定”为主调, 鼓励合理的住房消费以扩大内需

最近举行的中央经济工作会议明确了2009年的房地产政策走向:要保持房地产市场稳定、健康发展, 要把满足居民合理改善居住条件的愿望和发挥房地产业支柱产业作用结合起来, 增加保障性住房供给, 减轻居民购买自住普通商品房的负担, 发挥房地产在扩大内需中的积极作用。

2008年12月17日在国务院常务会议上, 进一步确定了促进房地产市场健康发展的政策措施。其中包括加大保障性住房建设力度, 进一步鼓励普通商品住房消费, 引导房地产开发企业积极应对市场变化、促进商品住房销售三条措施。在这些措施中, 对第二套房的认定标准有所放松, 对住房转让环节营业税进行减免。

对于未来一年国家政策导向, 权威部门表示, 为了稳定房地产市场, 在保证政策的连续性和稳定性的基础上, 今年中央和地方将会采取更加积极有效的措施, 主要运用差别化信贷、税收、土地等方式, 支持自住型购房需求买房, 大力发展保障性住房建设, 加大市场监管力度。同时, 给予企业更多的支持, 鼓励企业以合理的价格促销, 对企业合理的融资需求给予支持。并且明确提出在稳定房地产市场中要发挥地方政府的作用, 要求地方政府采取有针对性的措施, 细化完善配套措施。

许多人士认为:“稳定”将成为今年楼市政策的主调。而要保持房地产市场的稳定健康发展, 一是要鼓励合理的住房消费以扩大内需, 二是房地产投资供给不能脱离实际的自住消费需求。

市场走向:量价齐跌, 深度调整

在供需双方的作用下, 开发企业会采取进一步降价的措施, 以期尽快回笼资金, 短期内房价下调将成定局。尽管最近政府出台了多项救市措施, 但业内对房地产的未来走势却并不乐观。多家研究机构普遍认为, 房地产市场必然出现深度调整。上海易居房地产研究院在其《2008-2009年中国房地产市场趋势》研究报告中预测:2009年全国房屋成交量将依然在低位徘徊, 全年成交价格将出现负增长;2010年全国楼市触底反弹的可能性最大。中国人民大学“中国宏观经济分析与预测课题组”发布报告称:中国房地产行业的大幅度调整将在2009年全面爆发, 房地产将出现严重的资金短缺问题, 而这势必会引起房地产投资能力的大幅度下降, 房地产“硬着陆”的风险将加大。北师大金融研究中心在《2008中国房地产行业资金报告》中预测:2009年的房地产市场走势有两种可能——中期调整和短期调整, 中期调整是指今年行业没有复苏势头, 短期调整是指今年年底会出现较为明显的复苏势头, 需求萎缩和资金链绷紧决定了今年楼市陷入中期调整的可能性更大。总体来看, 今年的房地产市场将面临量价齐跌、投资骤减的深度调整态势。

需求走向:投机锐减, 自住型购房增多, 住房需求将发生极大变化

从需求者的角度看, 部分改善型需求和投资型需求的购买行为将向后推迟, 炒房者将因投机能力下降而不同程度地退出市场, 首次购房的自住性需求将更为谨慎;从需求结构的角度看, 购房需求将向实用型的中小户型集中;从产品需求特点的角度看, 留存在市场当中的真正的住房需求者将会对房地产产品提出更高要求, 因此, 未来市场竞争会更加激烈。在2006年推出“90/70”政策实施后, 从2006年下半年开始, 许多楼盘的建设规划都进行了相应的调整, 2009年将会迎来中小套型住房上市的高峰。另外, 随着住房保障政策以及2008年各地住房计划的落实, 2009年, 廉租住房、经济适用房和限价房供应也会增加, 中低收入家庭住房困难问题会得到进一步解决, 从一定意义上讲, 住房需求将由之前的以市场为导向转为以保障为导向。

企业走向:并购重组, 房企进入真正的洗牌阶段

刚刚过去的2008年, 让很多房地产企业感到了冬天的寒意。受宏观经济形势和行业周期波动影响, 2009年将是房地产行业的整合年。这将主要体现在三个方面:一是随着开发商资金压力的增大, 项目转让或合作开发将越来越普遍;二是房企之间的并购重组也会集中出现;三是房企将会大面积裁员和降薪。种种迹象预示着房地产企业将进入一个真正的洗牌阶段。在需求难以启动、供给方资金链紧张的情况下, 部分自有资金不充裕的中小房地产企业将面临因无力融资而退出市场的风险, 房地产开发企业会迎来一轮“洗牌”, 包括房地产中介公司、策划代理公司、经纪公司、评估公司、担保公司等在内的从业机构也将随之迎来一轮行业整合。随着企业间的优胜劣汰、合并、重组, 开发企业自身发展目标和开发战略也将放在这个大局中加以调整, 开发企业将更加注重开发产品的品质, 提供差异化的产品, 以期在市场竞争中占据优势地位。

深度预测 篇2

工业是国民经济的主体,也是能源资源消耗的主要领域,推进工业节能减排,加强资源综合利用是我国实现经济可持续发展的有效途径。

从国外主要工业化国家的经验来看,依法节能早已成为国际通用的惯例。美国、欧盟、日本等国家和地区特别重视依靠制定法律法规推进工业领域节能。日本早在20世纪70年代就已经制定了以促进工业节能为主的《节约能源法》,并以此为核心,建立一整套以促进工业节能为主法律体系,为日本工业节能提供了有力的法律保障。美国、欧盟也都拥有各自的一系列促进工业节能的法律法规和配套政策,在提高能源利用效率方面都拥有行之有效的具体措施。

前瞻产业研究院数据显示:近几年我国工业节能降耗取得新成效,2008-2012年全国规模以上企业单位工业增加值能耗累计下降30%左右,大宗工业固体废物综合利用率累计提高约9.2个百分点。

近年来,随着中国工业节能的政策推力逐渐加大,工业节能市场迅速发展,国内外大企业纷纷涌入该领域抢占不断释放的市场空间。海外企业利用自身完善的产品体系与技术优势试图挤压本土企业的市场规模,而本土企业也凭借已有规模以及技术的持续提升与海外企业展开成本竞争。并购重组已经成为当前中国工业节能产业做大做强、全面发展的必然趋势。“十二五”仍是我国工业化发展的关键阶段,居民消费结构继续升级,对工业品的需求也将继续增加,我国重化工业所占的比重仍将保持较高水平,对能源、交通、原材料等需求还会进一步增大,资源消耗总量将进一步增加。由于工业能耗占社会总能耗的比重在70%以上,下降的空间很大,发展工业节能将成为重中之重。预计未来五年我国工业节能市场将保持20%左右的增速,工业节能市场将高速发展。

前瞻网《2013-2017年中国工业节能行业发展模式与关键技术路线分析报告》共十七章。首先介绍了国际工业节能行业的发展经验,接着对中国工业节能行业的发展现状进行了细致的解析,然后具体分析了钢铁工业节能、有色金属工业节能、石化行业节能、建材工业节能、电力工业节能、煤炭工业节能、机械行业节能以及其他工业领域节能的发展状况。随后,报告对我国主要地区工业节能的发展情况进行了重点分析,并分别介绍了合同能源管理、工业余热利用、工业设备节能的运行现状。最后,报告对工业节能重点企业的运营情况进行了详细的解读,还科学分析了工业节能行业的投融资情况及未来发展前景。

深度预测 篇3

关键词:网络流量,深度学习,深度信念网络,受限玻尔兹曼机,神经网络,预测

近年来, 目前的网络规模随着计算机网络的迅速发展变得极为复杂和庞大, 网络流量管理日益重要和迫切, 其核心是准确预测网络流量并及时做出调整, 可以有效地改善网络性能和提高服务质量。目前网络流量预测主要有传统统计和智能预测两大类方法。

传统统计方法主要是基于线性回归理论进行预测, 如Sang A等[1]提出的基于自回归 ( AR) 的预测模型, 邹柏贤[2]提出自回归滑动平均 ( ARMA) 的预测模型以及薛可[3]提出的基于自回归求和滑动平均 ( ARIMA) 预测模型, 上述模型是难以准确反映网络流量的非线性变化规律, 使得模型的预测结果不可靠。智能预测方法是将机器学习算法应用于网络流量预测, 人工神经网络算法为目前网络流量预测的主要研究方向。刘杰[4]提出了基于BP神经网络预测模型, 提高了预测精度和灵活性, 但BP算法本身存在收敛速度慢和存在局部极小点的问题。王俊松[5]提出基于RBF神经网络的预测模型解决了BP神经网络本身存在的问题, 赵清艳[6]提出的遗传优化神经网络预测模型, 用遗传算法来优化RBF神经网络的模型参数, 取得比较好的结果。但是RBF模型的不足之处在于需要大量的数据样本才能获得好的效果。

上述预测模型都是基于浅层结构算法的预测模型, 都不能更接近真实反映网络流量数据中复杂的非线性关系。Hinton[7]提出了深度学习理论为上述问题提供了解决思路。深度学习可通过自学习构建一种非线性深层次的网络结构, 能更准确拟合复杂函数。基于深度学习理论, Hinton又提出了深度信念网络 ( DBN) [8], 其是目前研究和应用都比较广泛的深度学习方法, 已经成功应用于多个领域[9]。

综上所述, 为了更好反映网络流量数据之间的关系, 提高预测精度, 本文研究了一种基于深度信念网络 ( DBN) 的网络流量预测模型, 其为非线性深层次网络结构[10]模型, 克服了传统预测模型的不足, 具有更高的函数逼近能力和良好自适应性。

1 网络流量预测原理

网络流量数据是由网络上在线用户的行为而产生, 而用户行为又会随着外界因素的影响而变化, 因而其产生的网络流量既有规律性也有偶然性。网络流量数据本质上是一种时间序列数据。根据流量行为的特性, 不同时刻之间的流量存在一定的非线性关系, 其动力学特性表示为:

其中, n为模型的阶数, 分别为t, t - 1, t - 2, …, t - n时刻的网络流量[5]。

由 ( 1) 式网络流量时间序列动力学特性可知, 通过t, t - 1, t - 2, …, t - n时刻的网络流量可以预测出t时刻的网络流量数据, 它们之间存在复杂的非线性关系f ( ·) 。本文使用深度学习算法进行非线性函数拟合, 并在此基础上提出一种基于深度信念网络的网络流量预测模型。

2 深度信念网络模型

2. 1 模型结构

基于深度信念网络 ( DBN) 的网络流量预测模型由两层受限玻尔兹曼机 ( RBM) 和一层BP神经网络组成。其结构如图1 所示。

深度信念网络 ( DBN) 的核心是受限玻尔兹曼机 ( Restricted Boltzmann Machines, RBM) 单元, RBM是一种典型的人工神经网络, 其是由可视层和隐藏层组成的一种特殊的对数线性马尔可夫随机场 ( Markov Random Field) , 网络中处于同一层的节点之间无连接。一个深度信念网络 ( DBN) 的参数需要预训练和微调训练两个训练过程来确定。

2. 2 预训练

预训练就是网络参数初始化的过程, 通过逐层采用无监督贪心算法方式来[11]初始化各层间的连接权重值和偏置值。在训练过程中, 首先将可视向量的值映射给隐含单元, 然后可视单元由隐含单元重建, 随后将这些新可视单元再次映射给隐含单元, 这样就获取了新的隐含单元。反复执行这种步骤的过程叫做吉布斯采样[12]。下面来分析RBM参数训练过程。

RBM层与层的节点之间相互无连接, 其本质上是一种能量模型, 可视层和隐含层的联合组态能量函数为:

式中, vi和hj分别为可视层、隐含层的节点状态。θ = { w, a, b} 是模型的参数, wij为可视层和隐含层之间连接权重值, bj和ai分别是可视层节点和隐含层节点对应的偏置值。则RBM在状态参数 θ 下的联合概率为:

其中, 是归一化因子, 即h, v分配函数。求Pθ (v, h) 对h的边缘分布:

然后采用最大似然函数最大化Pθ ( v) , 得到RBM的参数并通过随机梯度下降法推导出RBM的权值更新准则:

其中: Edata ( vihj) 是在真实数据集中的期望, Emodel ( vihj) 是模型中定义的期望。

一层的RBM训练完成之后, 把其隐含层节点的相应参数作为输入数据来训练下一层的RBM, 以此类推, 可训练多层RBM, 最终完成整个DBN的预训练过程。

2. 3 微调权值训练

预训练完成后可以初始化RBM每层的参数, 然后使用BP神经网络算法[13]对DBN的所有权重值进行微调训练, 利用输出误差来估计输出层的直接前一层误差, 经过逐层的反向传播学习, 估计获得所有其余各层的误差, 再使用梯度下降法计算更新各节点权值直到输出误差足够小。权值微调算法克服了传统BP神经网络因随机初始化权值参数而容易陷入局部最小和训练时间过长的缺点, 只需要对已知权值空间进行微调, 大大缩减了参数寻优的收敛时间。

3 网络流量预测

3. 1 模型预测流程

基于深度信念网络模型具体预测流程如图2 所示。

首先从网络上收集到的网络流量数据进行归一化处理, 然后将数据集分成训练集和测试集两部分, 使用训练集训练网络流量预测模型参数, 最后使用测试集测试模型预测效果。

3. 2 网络流量数据归一化处理

由于网络流量是多种因素影响的综合结果, 其数据值的变化范围较大, 需要对收集到的网络流量样本数据进行归一化处理[14]来提高模型的训练效率, 将所有的网络流量数据值处理为[0, 1]区间范围的数据, 采用的方法为最大最小法, 其公式为:

模型预测完成后, 还需要对预测的结果进行反归一化处理, 使其恢复成真实的预测流量数据, 反归一化公式为:

式中, xi表示网络流量原始数据, xmax和xmin表示流量数据的最大值和最小值。

3. 3模型评价指标

为了检验模型预测准确度和效果, 采用均方根误差RMSE ( Root Mean Squared Error) 和平均绝对误差MAE ( Mean Absolute Error) 等指标对预测准确度进行衡量, 上述指标定义如下:

式中, yt表示网络流量实测值, 表示模型预测值, n为预报检验的个数。显然, 上述两个评价指标的值越小, 说明模型的预报精度越高。

4 实验分析

4. 1 数据来源

实验数据来源于网络流量文库 ( http: / /news. cs. nctu.edu. tw / innreport / ) 主节点路由器Incoming articles从2014 年9 月1 日到10 月20 日的每小时访问流量, 得到1 200 个流量数据样本, 从而形成一个网络流量时间序列, 如图3 所示。

将前1 000 个流量数据作为训练集建立基于深度信念网络的网络流量预测模型, 其余200 个数据作为测试集进行预测检验。模型训练前需要对网络流量原始数据进行归一化处理。

模型预测前需要确定模型的阶数。在本流量数据样本中的时间粒度为1 小时。网络流量的自相关函数变化曲线如图4 所示。

经过分析, 从图4 中可知, 某t时刻的网络流量数据值与t - 1, t - 2, t - 3, t - 4, t - 5 时刻的网络流量数据值相关性高, 故设模型的5 阶, 即将t - 1, t - 2, t - 3, t - 4, t - 5 时刻的网络流量数据值输入预测模型, 以此来预测时刻的网络流量值。

4. 2 结果与分析

对于图4 的网络流量, 基于深度信念网络预测模型的预测结果和预测误差变化曲线分别如图5 和图6 所示。

从图5 可知, DBN流量预测模型可以很好的跟踪网络流量变化趋势, 预测的网络流量值和实际值比较接近, 偏差小。从图6 可知, DBN流量预测模型预测误差小, 预测误差变化范围波动小。

为了进一步说明基于深度信念网络 ( DBN) 的预测模型的效果, 分别与传统神经网络, 即基于BP神经网络及基于RBF神经网络流量预测效果进行比较, 如表1 所示。

对表1 各个模型评价指标进行分析可知, 基于DBN的预测模型相对于BP神经网络和RBF神经网络的预测误差均有所下降, 预测精度得以提高, 表明DBN网络流量预测模型较好的克服了传统神经网络的缺陷, 提高了网络流量的预测精度, 可以建立性能更优的网络流量预测模型。

上述实验结果分析表明, 基于深度信念网络 ( DBN) 的网络流量预测模型是一种高精度、预测结果可靠的网络流量预测模型。

5 结束语

深度预测 篇4

免费客服电话:400-001-7350

据统计,2012年全年国内市场5米以上校车上牌销量24422辆,同比增幅达到2.5倍(见左图),2013年1-11月份5米以上校车上牌销量28186辆。

2013年1-11月份前十五家企业合计销售24657辆,占比87.48%,近3年行业集中度有所下滑,但前十五家企业仍然占据行业的垄断地位。从品牌分布来看,一线品牌宇通、中通和苏州金龙分别位列第一、第四和第六位。东风集团(东风汽车股份有限公司、东风特种汽车有限公司和东风汽车有限公司)销售3682辆,位列行业第二位,五菱和长安分别位列第三和第五。全年预计校车销售达1000辆企业有8家,市场集中度超70%。

当前校车市场主要集中在私立幼儿园、民办学校、贵族学校以及城乡集合部的农村市场,无论是学校规模还是农村道路条件,轻型校车更加适应市场需求,特别是6m以下19座校车受市场的热捧。

第一章 中国校车行业发展环境分析 第一节 校车市场特征

一、行业定义

二、行业特征 第三节 经济环境分析

一、经济发展状况

二、收入增长情况

三、固定资产投资

四、进出口总额及增长率分析 第四节 政策环境分析

一、国家宏观调控政策分析

二、校车行业相关政策分析 第二章 中国校车技术发展分析

一、当前中国校车技术发展现况分析

二、中国校车产品技术成熟度分析

三、中外校车技术差距及其主要因素分析

文档由立木信息咨询提供 更多内容可登陆公司网站查询:

深圳市深福源信息咨询有限公司

免费客服电话:400-001-7350

四、提高中国奥校车技术的策略 第三章 校车市场

第一节 国外校车发展情况

一、美国

二、日本

三、韩国

四、运营模式 第三节 中国市场情况

一、保有量

二、销量

三、发展趋势

第四章 校车行业经济运行分析 第一节 2011-2014年行业产销情况 第二节 2011-2014年行业规模情况 第三节 2011-2014年行业盈利能力 第四节 2011-2014年行业经营发展能力 第五节 2011-2014年行业偿债能力分析 第五章 中国校车进出口分析

一、校车进出口特点

二、校车进口分析

三、校车出口分析

第六章

2014年中国校车行业竞争格局对投资影响透析 第一节 中国校车行业波特五力分析 第二节 中国校车行业竞争格局分析

一、企业集中度分析

二、市场占有率分析

第三节 中国校车行业未来竞争态势预测

第七章

2013-2014年中国校车行业重点企业发展分析 第一节 宇通客车

一、企业概况

二、企业经营状况分析

三、企业竞争力分析

四、企业发展策略分析

文档由立木信息咨询提供 更多内容可登陆公司网站查询:

深圳市深福源信息咨询有限公司

免费客服电话:400-001-7350

第二节 金龙汽车

一、企业概况

二、企业经营状况分析

三、企业竞争力分析

四、企业发展策略分析 第三节 安凯客车

一、企业概况

二、企业经营状况分析

三、企业竞争力分析

四、企业发展策略分析 第四节中通客车

一、企业概况

二、企业经营状况分析

三、企业竞争力分析

四、企业发展策略分析 第五节亚星客车

一、企业概况

二、企业经营状况分析

三、企业竞争力分析

四、企业发展策略分析

第八章

2015-2020年校车行业投资分析 第一节 行业投资机会分析 第二节 行业投资风险分析

一、市场风险

二、成本风险 第三节 行业投资建议

一、把握国家投资的契机

二、竞争性战略联盟的实施

三、市场的重点客户战略实施

深度预测 篇5

关键词:线性解码器,回归模型,深度神经网络,图像分类

0 引言

随着互联网技术和多媒体技术的蓬勃发展,以及社交媒体的日益普及和流行,人们接触到的多媒体数据也呈现出直线增长的趋势。图像数据在多媒体数据海洋中占据了十分重要的位置,它也逐步成为人们信息交流、经验分享中的重要媒介。然而,在这些网络资源库中,大部分的图像数据是没有任何文本标注的,如果单纯依靠手工标注的方式对这些纷繁复杂的图像进行分类和管理,则存在费时费力、效率低的问题。于是,如何采用合理的计算机图像分析方法,进行高效的自动分类、管理及使用,一直是图像信息处理领域的研究热点[1,2,3,4,5]。

一图胜千言,图像的底层特征和高层语义之间存在着难以逾越的语义鸿沟[6]。为此,许多研究者提出了基于机器学习、统计分析的解决方法以缩小语义鸿沟,可成功应用于提高图像分类的准确率。例如:文献[7]采用误差反向传播算法BP,在底层特征的基础上运用机器学习的理论来得到图像的抽象表示。但是,这种方法容易陷入局部最小值,难以达到最优的学习效果,对复杂函数的表示能力有限,不能有效针对多重的分类问题进行泛化。针对这些问题,Hinton在2006年提出了第三代神经网络[8],即:深度学习方法。该方法可以通过学习一种深层非线性网络结构来实现复杂函数逼近,展现出较为强大的从大量样本集中学习数据集本质特征的能力[9]。例如:文献[10]采用卷积神经网络CNN获取图像的特征,并构成一幅特征映射图来对图像进行分类;但这种方法需要收集大量有标记的图像样本来训练,对训练集的要求比较高。考虑到标记样本有限的问题,Poultney等运用未标记样本集学习得到了图像的特征表达关系[11];Le等采用基于稀疏自编码的神经网络从图像中建立其高层次的特征检测器[12],采用无监督的反向传播方法,使目标值等于输入值,但该算法需要对输入进行限制或者缩放,使输入值在[0,1]的范围内。然而,目前关于数据范围的优化取值还属于开放性问题。

针对数据输入范围的限制和缩放问题,本文提出了基于线性解码器的深度神经网络方法,本文算法的流程如图1所示。先从原始的大图像中随机选择小块的图像区域,然后通过线性解码器学习到小图像的特征参数,并将其运用到对原始大图像的卷积和池化操作中,得到特征矩阵。在此基础上,进行Softmax回归分类和结果优化,与传统的基于向量模型的特征相似度度量模型相结合,提出了相应的自动分类机制。该网络包含输入层、隐藏层和输出层,并且无需对输入数据进行限制或缩放,简化了神经网络训练的复杂度,提高了数据预处理的效率。

1 基于线性解码的卷积特征分析

底层特征分析一直是影响图像语义理解和分类效率的关键因素。本节采用基于线性解码器的神经网络进行图像的特征学习,再利用学习到的参数在训练集及测试集中进行卷积特征分析,以及池化操作得到图像特征矩阵。

1.1 图像特征的线性解码算法分析

受深度学习中稀疏自编码方法[12,13]的启发,本文提出一种基于线性解码器的神经网络方法。神经网络方法是模拟人类神经网络中的特性,即人类大脑中的神经元细胞在接受刺激后会变的活跃,并在相互之间传递信息;通过设置网络中的每一层的节点个数,即:神经元个数,在神经网络的各个层次中传递图像特征数据,在达到收敛阈值或者最大迭代次数时,实现图像本质特征的智能学习。模拟过程如图1所示,Layer L1为输入层,接受到输入信息以后该层的神经元被激活,处理信息后传递至Layer L2层,即:隐藏层;隐藏层的神经元被激活并将处理之后的信息传递至Layer L3层,即:输出层;输出层神经元接受信息以后,输出该层处理后的结果。

假设集合X={x1,x2,x3,…,xi,…,xm}表示未标记的图像训练数据集,其中,xi表示输入的第i幅图像,m表示未标记的图像数据集样本的数量。向量Y={y1,y2,y3,…,yi,…,ym}表示输入为X时,图像集合所对应样本标记的期望输出值,其中,yi表示输入为第i幅图像时的期望输出值。本节在已有未标记的图像样本集X的基础上,生成一个假设模型hw,b(x),表示输入为x时的假设输出,其中,w为权值向量,b为偏置向量。特征学习的过程就是求解向量w和向量b。

首先,设基于线性解码器的神经网络中第l层中的第i个神经元的激活度可表示为ai(l),输入为xi时隐藏层神经元j的激活度为aj(2)(xi),则在训练集X={x1,x2,x3,…,xi,…,xm}上可以求得隐藏神经元j的平均激活度为:

为了使数据表示稀疏化,加入稀疏性参数ρ,满足限制条件。为了使隐藏神经元的平均激活度维持在一定范围内,实现对线性解码器的稀疏性控制,引入基于相对熵的惩罚因子,则整体的代价函数为:

其中,第一项为均方差项,第二项为防止过度拟合添加的权重衰减项。nl表示网络层数,λ为权重衰减参数,第三项为稀疏性控制的惩罚项,β为控制稀疏性惩罚因子的权重。

采用Sigmoid函数,作为神经元的激活函数,并定义第l层第i个神经元对最终误差产生的影响为残差记为σi(l),显然:

其中,zi(l+1)表示第l+1层中第i个神经元的输入值加权和。然后,求出J(w,b)的偏导数值并采用梯度下降法计算其最优化权值向量w和偏置向量b,待算法收敛或达到最大迭代次数时,求得向量w和b,即完成了特征学习过程。

1.2 基于部分联通网络的卷积特征分析

由于神经网络方法需要训练网络中神经元的权值向量w和偏置向量b,而向量w和b的个数则取决于图像分辨率的大小[8]。图像的分辨率越大,网络需要学习的向量个数越多。可见,图像分辨率的大小直接影响参数学习的复杂度。

为此,本节提出基于部分联通网络的卷积算法,即:将图像训练集中初始的图像样本全部切分成若干个小区域,构成区域子集,作为神经网络的输入层,也相当于在原有全联通网络基础上,使隐藏层神经元只连接输入层的一部分神经元。通过该算法得到数据集卷积后的特征矩阵,将该矩阵作为图像分类器的输入。

假设集合Ω={(z1,r1),(z2,r2),…,(zi,ri),…,(zt,rt)}表示有标记的图像训练集样本,其中t用来表示已标记的训练集样本个数,并假设标记样本集Ω中的图像属于k个不同的类别,zi表示训练集中的第i幅标记样本图像,ri表示该图像所属的类别编号。假设未标记的图像测试集用S={s1,s2,…,si,…,sn}表示,其中si表示测试集中的第i幅图像,n表示测试集样本个数。假设数据集Ω和S中图像的分辨率为a×a,从中随机选取一块分辨率为b×b的一个局部小块图像。将选取的所有局部小块图像数据集X={x1,x2,x3,…,xi,…,xm}作为线性解码器的输入,如图1中Pathes所示。

根据1.1节的特征学习算法计算出权值向量w和偏置向量b,设置卷积运算的步长为1,并利用从X={x1,x2,x3,…,xi,…,xm}中学习到的参数值对训练集Ω以及测试集S进行卷积运算。则在训练集Ω和测试集S上完成卷积后的特征矩阵分别为DConvoled_Train、DConvoled_Test,其维数大小均为为:

其中,k为隐藏层中的神经元个数。可见,矩阵DConvoled_Train和DConvoled_Test的维数非常高,不利于训练分类器,很容易出现过拟合的现象,影响图像分类效率。为此,本文采用计算图像各个区域上的特定特征的平均值方法对图像不同位置的特征进行聚合统计,即:池化操作。设定池化区域的大小为Dpooling,且池化操作必须作用于不重复的区域内,则可得到池化后的特征矩阵DPooled_Train和DPooled_Test。

2 基于卷积特征的回归预测

根据第1节中得到的训练集Ω与测试集S图像的特征矩阵DPooled_Train和DPooled_Test,采用改进的Softmax深度回归预测模型进行初步分类,并结合图像的视觉特征,学习得到测试集S中未标记样本si所属的语义类别。

2.1 回归函数定义和参数求解

将训练集图像的特征矩阵DPooled_Train作为该模型的训练样本,对于每一个输入的样本(zi,ri),该模型预测其每一种分类结果出现的概率值为p(ri=k|zi),假设函数定义如下:

其中,θ1,θ2,…,θk是该模型的训练参数。定义函数hθ(zi)求解的代价函数为:

其中1{ri=j}为指示性函数,当ri=j为真时,1{ri=j}=1,反之1{ri=j}=0。为了防止模型中参数的冗余,在代价函数J(θ)中加入权重衰减项:

进一步,求其偏导数为:

通过迭代得到J(θ)的最小值,求出参数θ1,θ2,…,θk,得到训练好的Softmax回归模型。然后运用该模型来对测试集S进行分类,通过式(5)计算出每一个样本在每一个类别中的概率值。

一般选择概率最大的类别为预测结果,然而,由于不可避免的参数误差、冗余及过拟合现象,单一地使用1.2节中学习到的特征与Softmax回归模型相结合,得到的分类结果会被上述因素影响。为了解决上述问题,该文采用多步分类的方法,即在Softmax回归模型计算出的预测概率中,由大到小排列,选择前个预测的类别作为初步的预测值,将对每一个样本si所属的类别候选集记为Ci:

其中,表示前k/2个预测的类别。

2.2 未标记测试样本的分类方法

在未标记的图像训练集X中,除了通过基于线性解码器的神经网络学习到的特征DPooled_feature,还可以提取图像的视觉特征。由于2.1节只是对测试集中的每个样本进行了初步预测,本节在预测标签集合Ci的基础上,在视觉特征空间中采用距离度量的算法确定最终的预测标签。

设从图像训练集和测试集中所提取的图像视觉特征的维数均为p,在包含m个有标记图像的训练集Ω上可得到视觉特征矩阵。同时在包含n个未标记图像的测试集Ε上得到视觉特征矩阵。设zi、sj分别表示矩阵A、B中的任意一个训练样本和一个测试样本的特征向量,它们之间的距离记为dij,选择欧式距离作为zi和sj的距离度量。

在2.1节中,已经完成了对图像的初步分类,因此,在计算样本间的距离时,只计算测试样本与预测类别Ci中包括的类别的距离。然后,取dij最小值所对应样本的类别作为最终的测试样本sj的预测结果,记为Li,完成图像的分类。整个算法流程如算法1所示。

3 实验结果与分析

3.1 数据集与特征提取

为了验证上述算法的性能,本文选取了两组图像数据集进行测试和验证。首先,从Web页面采集了10个语义类别的图像作为数据集,包括:鸟、马、小狗、海豚、大象、爆炸、飞机、摩托车、汽车、溪水。其中每个类别包含100幅图像,从中选取700幅图像作为训练集,其余300幅图像作为未标记的测试集。此外,还使用了公共图像数据集MSRA-MM[19]进行了实验验证,从MSRA-MM数据库中选取了6000幅图像作为训练集,其余3000幅作为测试集。图2显示了10个语义的Web图像数据的示例,其中每一列表示从一个语义类别中随机抽取的3幅图像样本。此外,实验提取的底层视觉特征包括256-d HSV颜色直方图、64-d LAB颜色聚合向量以及32-d Tamura方向度。

3.2 实验结果与分析

首先将Web数据集和MRSA-MM数据集中图像尺寸进行归一化,统一为96×96。同时,将用于1.1节中网络学习的小图像尺寸设定为8×8,且从每幅图像中提取100幅小图像,再从所有提取的小图像中随机选取100 000个样本作为线性解码器的输入。由于图像为彩色图,需要将三个通道的值同时作为输入层,则输入层的神经元个数为8×8×3,即192个;同样,输出层神经元个数也为192个,且设置隐藏层的神经元个数为400个,学习得到400个特征,如图3所示。图中每个小块图像表示所对应的隐藏层神经元学习到的特征值的可视化表示,可以观察到,很多小块都是类似图像的边缘部分,这有利于进行边缘检测来识别图像。同时,设置池化区域Dpooling的尺寸为19×19。

为了验证本文方法的有效性和优越性,选取隐藏神经元为400个的传统BP神经网络、Softmax分类、KNN分类算法,并使用精确率ACC(accuracy)作为评价指标。实验结果如表1所示。

从表1可以看出,在隐藏层神经元数目相同的情况下,采用Softmax分类方法的性能高于传统BP神经网络10.7个百分点。在确定分类方法后,为验证本文方法的有效性和优越性,实验分别采用下列三种距离度量方法,即:欧氏距离度量(Euclidean Distance)、马氏距离度量(Mahalanobis Distance)、夹角余弦(Cosine)距离度量,与本文的方法进行对比实验,并使用精确率ACC(accuracy)作为评价指标,实验结果如表2所示。

由表2可见,相对于使用单一的距离度量算法,与Softmax分类方法相结合后的性能有显著提高。同时,本文方法在三种组合算法中的性能最优,高于Softmax+Mahalanobis Distance、Softmax+Cosine28个百分点和17个百分点。

4 结语

深度预测 篇6

1 再生混凝土碳化灰色建模基础

各国学者在理论和试验的基础上提出了多种混凝土碳化深度计算模型[8,9,10],这些模型可以简化为时间的指数形式[11]:

式(1)中:x、t分别代表混凝土碳化深度和使用时间,a和6表示在多种因素作用下的混凝土碳化深度系数。

和普通混凝土相比,再生混凝土由于再生骨料的掺入,a和b的不确定性进一步增加。采用传统数据回归分析法确定a和b,因需要大量样本数据可操作性差。

灰色预测,是利用灰过程中得到的数据集合所具备的潜在规律性,建立灰色模型,对在一定范围内变化的、与时间序列有关的灰过程进行预测。目前使用最广泛的灰色预测模型(gray model,GM)是关于数列预测的一个变量、一阶微分的GM(1,1)[12]模型。它是基于随机的原始时间序列,按时间累加后形成新的时间序列,用一阶线性微分方程的解来逼近。经证明,经一阶线性微分方程的解所逼近所揭示的原始时间序列呈指数变化规律。这一特点符合碳化模型表达式,且建模所需求的数据量较少,所以灰色模型是预测再生混凝土碳化深度的有效工具。

设有变量x(0)=1 x(0)(t),t=1,2,…,n}(这里)为某一预测对象的非负单调原始数据列,t为时间序列。首先对x (0)进行一次累加生成一次累加序

对x(1)可建立下述微分方程:

该微分方程的解为(离散响应):

根据(4)式可计算出GM(1,1)模型的累减还原值:

当t≤n时,称为模型模拟值;t>n时,称为模型预测值,主要的研究内容就是根据已知碳化数据,预测未来时点再生混凝土碳化深度。

2 再生混凝土碳化灰色模型分析

2.1 再生混凝土碳化灰色模型计算实例

雷斌、肖建庄[7]系统研究了水灰比、水泥用量和矿物掺和料等因素对再生混凝土碳化性能的影响。试件采用海螺牌P·O 42.5普通硅酸盐水泥;掺和料为粉煤灰、矿渣、硅粉;再生粗骨料由压碎的混凝土试块(原始强度等级为C20,C30,C50)经人工和机械破碎(颚式破碎机)后加工而成,取代率100%。

试件部分快速碳化试验结果见表1,其中21 d碳化深度由碳化方程x=atb获得。以表1为样本数据,进行GM(1,1)建模分析,表2给出三种因素下再生混凝土碳化灰色模型精度。由表2可见,在其他条件相同的情况下,中等水灰比(mw/mc=0.5和0.6)时模拟精度较低,其他水灰比模拟精度较高;低水泥含量模拟精度较高,高水泥含量模拟精度较低;粉煤灰和硅粉的掺入模拟精度略高,而矿渣的掺入模拟精度降低。总体来看,再生混凝土碳化深度实测值和GM(1,1)模型模拟值吻合较好,模拟精度高且相对稳定,可以用来预测再生混凝土碳化深度。

2.2 三种GM(1,1)模型预测分析

随着工程建设信息化程度的提高,用于灰色建模的样本数据不断更新增加。根据所采用的样本数据情况,GM(1,1)模型可分为全数据模型、新信息模型、新陈代谢模型等[12]。设再生混凝土初始碳化数据序列为x(0)={x(0)(t),t=1,2,…,n},新增加样本数据为x(0)(n+1),则:

(1)用x(0)={x(0)(t),t=1,2,…,n}建立的模型,称为全数据GM(1,1)模型;

(2)将x(0)(n+1)置入x(0),用x(0)={x(0)(t),t=1,2,…,n,n+1}建立的模型,称为新信息GM(1,1)模型;

(3)将x(0)(n+1)置入x(0),去掉第一个样本数据x(0)(1),用x(0)={x(0)(t),t=2,…,n,n+1}建立的模型,称为新陈代谢GM(1,1)模型;

表3为根据碳化方程x=atb计算得到雷斌、肖建庄[7]所研究再生混凝土35 d、42 d碳化深度。将表3中35 d数据视为新增加样本数据,结合表1数据分别进行全数据、新信息和新陈代谢GM (1,1)模型建模预测42 d碳化深度,预测结果见表4。

图1—图3分别给出试件A、B、C的42 d全数据、新信息、新陈代谢GM (1,1)模型预测值和试验值柱状比较图。由图1—图3可见,全数据GM(1,1)模型预测值与试验值偏差最大,其次是新信息GM (1,1)模型,新陈代谢GM (1,1)模型预测值与试验值最接近。因此,从再生混凝土碳化深度预测角度考虑,新陈代谢GM(1,1)模型是适用的灰色预测模型。在采用GM(1,1)模型预测再生混凝土碳化深度时,应不断补充新的碳化样本数据,去除老数据,这样不仅可以降低运算量,更重要的是可以提高预测准确性。

计算新陈代谢GM(1,1)模型预测值对应试验值的相对误差,除去相对误差大于3%的A1、B1、C3试件数据,剩余1 0个试件预测值相对误差平均值为1.99%,说明4个样本数据进行灰色模型预测能够获得较高的预测准确性。实际工程应用中,可以制作同条件碳化试件,获取最少4个实测数据,就可以采用灰色模型预测再生混凝土碳化深度,供再生混凝土结构耐久性设计使用。

3 结语

(1) GM(1,1)模型可以很好的模拟再生混凝土碳化深度实测值,模拟精度高且相对稳定,可以用来预测再生混凝土碳化深度。

(2)新陈代谢模型是3种GM(1,1)模型中最适用于再生混凝土碳化深度预测的灰色模型,预测准确性最高。

(3)制作同条件再生混凝土碳化试件,获取最少4个样本数据,即可采用灰色模型预测再生混凝土碳化深度,供再生混凝土结构耐久性设计使用。

参考文献

[1] Ryu J S.An experimental study on the effect of recycled aggregate on concrete properties.Magazine of Concrete Research,2002;54(1 ): 7-12

[2]陈云钢.界面改性剂对再生混凝土性能改善效果的初步研究.上海:同济大学,2006

[3]崔正龙,杨力辉,大芳贺,等.再生混凝土耐久性的试验研究(Ⅱ再生混凝土的中性化试验).科学技术与工程,2006;6(21): 3516-3519

[4] Limbachiya M C,Leelawat T,Dhir R K.Use of recycled concrete aggregate in high-strength concrete.Materials and Structures,2000;33: 574-580

[5] Xiao Jianzhuang,Lei Bin.On the carbonation behavior of recycled aggregate concrete.Tongji University.Proceedings of the International Symposium on Innovation & Sustainability of Structures in Civil Engineering. Shanghai:Tongji University Press,2007:897-904

[6]肖建庄,雷斌.再生混凝土碳化模型与结构耐久性设计.建筑科学与工程学报,2008;25(3):66-72

[7]雷斌,肖建庄.再生混凝土抗碳化性能的研究.建筑材料学报,2008;11(5):605-611

[8]牛荻涛.混凝土结构耐久性与寿命预测.北京:科学出版社,2003

[9]张誉,蒋利学,张伟平,等.混凝土结构耐久性概论.上海:上海科学技术出版社,2003

[10] Papadakis V G.Vayenas C G,Fardjs M N.Fundamental modeling and experimental investigation of concrete carbonation.AC1 Materials Journal,1991;(88):363

[11]屈文俊,陈道普.混凝土碳化的随机模型.同济大学学报:自然科学,2007;35(5):577-581

深度预测 篇7

近年来,光学玻璃、工程陶瓷等硬脆性材料,以其独特的性能,比如高硬度、低密度等,在航空航天、军工设备等领域应用较为广泛[1,2,3]。然而硬脆材料的低断裂韧性和脆性使得其难加工性较为突出。目前,硬脆材料的加工大多采用磨削加工,而磨削中引入的亚表面损伤一直是机械加工中的瓶颈问题,研究硬脆材料的亚表面损伤并对其深度进行有效检测,对其高效和精密加工具有重要的意义[4,5]。目前亚表面损伤深度的测量方法大致分为破坏性检测和无损检测两大类,在实际加工中这两种方法均具有一定局限性。基于压痕断裂力学的亚表面损伤深度预测方法为研究亚表面损伤提供了一种新的手段,对提高检测效率、降低生产成本有着重要的意义。向勇等[6]基于压痕断裂力学对微晶玻璃研磨加工亚表面损伤深度进行了预测,理论值和预测值误差控制在5.56%以内,模型可靠性较高;Li等[7]通过对预测模型改进得出了亚表面损伤深度与表面粗糙成非线性关系的结论。

本文以K9光学玻璃作为研究对象,首先基于压痕实验原理建立了K9玻璃磨削亚表面损伤深度预测模型,然后开展了磨削实验,并且建立了法向磨削力的经验公式;测量了工件磨削表面的粗糙度值,并结合法向磨削力经验公式,确定了亚表面损伤深度预测模型的未知参量;将实验测量值与模型预测值进行比较,实验结果验证了模型的可靠性。

1 K9玻璃磨削亚表面损伤深度预测模型

1.1 裂纹深度预测模型

Lawn等[8]利用压痕断裂力学模型,采用径向裂纹和横向裂纹表征亚表面损伤情况。如图1所示,压头加载过程产生径向裂纹,卸载过程产生横向裂纹。

径向裂纹深度和横向裂纹深度的理论计算公式由Lambropoulos基于压痕断裂力学和Hill孔洞扩展模型分别提出。其中,径向裂纹的理论计算公式为[9]

式中,cm为径向裂纹深度;Fn为法向载荷;E为弹性模量;ψ为维氏压头尖角;Hv为维氏硬度;KIC为断裂韧性参数;m为量纲一参数,取1/3[10];αk为量纲一参数,

横向裂纹深度h的理论计算公式为[9]

1.2 法向磨削力FN与单颗磨粒载荷Fn的关系

磨削过程中砂轮所受到的法向磨削力FN与单颗磨粒所受载荷Fn的关系如下:

金刚石砂轮与玻璃工件接触区域的磨粒数量为

式中,w为砂轮与工件的接触宽度,本文取5mm;N0为砂轮单位体积的磨粒数量;γ为砂轮磨粒锐度角,一般取46°~62°,本文取γ=60°;ds为砂轮直径;ap为磨削深度;vs为砂轮速度;vw为进给速度。

1.3 亚表面损伤深度预测模型的建立

假设亚表面损伤深度(hSSD)和表面粗糙度Rz值分别等价于中位裂纹深度和侧向裂纹深度值,可得hSSD与Rz比例模型[9]:

因此,hSSD可由Rz来表示:

2 实验设备及条件

工件为K9玻璃,尺寸为20mm×20mm×10mm,表面粗糙度Ra<2nm。如图2所示,磨削实验在ULTRASONIC 70-5linear型DMG机床上进行,采用直径为10mm的240#金属基金刚石砂轮,磨削方式为逆磨,磨削过程用冷却液,用Kistler高灵敏度压电式三向测力仪测量力的大小。

实验过程进给速度保持不变(120mm/min),主要考查主轴转速ns和磨削深度ap对磨削加工的影响,实验方案如表1所示。

3 结果与讨论

3.1 工艺参数对法向磨削力的影响

工艺参数与法向磨削力关系如图3所示,随着主轴转速ns提高,法向磨削力FN有减小的趋势,但不明显(图3a);随着磨削深度ap增大,法向磨削力FN的值有明显的增长趋势(图3b)。

为获得亚表面损伤深度预测模型,需知道单颗粒所受载荷Fn的值,因此要对法向磨削力FN进行求解,以此来表征Fn的数值,通过磨削实验可得法向磨削力FN的经验公式为:

式中,a1、a2、a3为与工艺参数相关的待定系数;ξ为与砂轮相关的系数。

对式(7)两边取对数可将非线性多元函数转化为线性多元函数:

令Y=lgFN,a0=lgξ,x=lgvs,y=lgvw,z=lgap,可得

利用16组磨削实验数据进行多元线性回归计算求解回归方程中的未知系数,并考虑每组数据的计算误差ε,建立多元线性回归方程组如下:

利用多元线性回归法求解可得磨削力的经验预测公式:

3.2 工艺参数对表面粗糙度的影响

利用Hitachi SU8010型扫描电镜(SEM)检测工件磨削后的表面形貌,由于K9玻璃不导电,所以在进行电镜检测前先用Leica EM SCD050型高级溅射镀膜仪作喷金处理。图4所示为不同工艺参数下磨削表面的微观形貌,对比图4a和图4b可知,主轴转速越大、磨削深度越小,材料的延性去除区域越多,越有利于改善表面质量。

K9玻璃工件磨削后表面的形貌是由材料去除导致的,侧向裂纹延伸至工件表面是材料去除的主要原因,侧向裂纹的深度与表面粗糙度值Rz有一定关系,可用Rz来表征。所以需要测得工件表面粗糙度值Rz,进而得到亚表面损伤深度预测模型。利用Olympus OLS3000激光扫描共聚焦显微镜检测工件磨削后的表面粗糙度值Rz。Rz随工艺参数变化趋势如图5所示,随着主轴转速的提高,表面粗糙度值减小;随着磨削深度的增大,表面粗糙度值增大,这是因为磨削深度减小会使磨粒对工件的切削厚度减小,主轴转速提高会导致磨削过程的应变率提高,工件表面延性去除区域更多,有利于降低表面粗糙度值。

3.3 工艺参数对亚表面损伤深度的影响

利用Hitachi SU8010型SEM检测工件磨削后的不同工艺参数下亚表面损伤形貌(图6)。对比图6a和图6b、图6c和图6d可知,主轴转速不变,磨削深度越小,亚表面损伤深度越小;对比图6a和图6c、图6b和图6d可知,磨削深度不变,主轴转速越大,亚表面损伤深度越小,因此,在磨削加工中可以通过提高主轴转速和减小磨削深度来减小亚表面损伤深度,改善磨削质量。

3.4 亚表面裂纹深度预测模型及验证

联立式(3)、式(4)、式(6)和式(11)可得磨削过程中亚表面损伤深度预测模型:

将表1中工艺参数代入式(12)对亚表面损伤深度进行预测,并与实验值进行对比(图7)。亚表面损伤深度的预测值和实验值相比皆偏小,主要由于以下原因:①本文亚表面损伤深度预测模型是在单颗粒压痕实验基础上建立的,而实际磨削加工中是多磨粒耦合加工的过程,多磨粒的耦合作用会增大损伤层的裂纹深度;②单颗粒压痕实验是在准静态条件下进行的,而磨削过程是在高速条件下进行的,工作条件恶劣,机床振动等外界条件都会使亚表面的损伤深度增大。实验值和模型预测值一致性较好,说明亚表面损伤深度预测模型具有一定的可靠性。

4 结论

(1)基于实验数据,利用多元线性回归拟合结果得到法向磨削力经验公式。随着磨削深度ap的增大,法向磨削力FN的值有着明显的增长趋势,主轴转速ns对法向磨削力FN影响不明显。

(2)利用激光扫描共聚焦显微镜检测工件磨削后的表面粗糙度值,利用扫描电镜检测工件磨削后的表面和亚表面损伤层形貌,发现提高主轴转速和减小磨削深度,有助于更多地实现延性域去除,减小表面粗糙度值和亚表面损伤深度。

(3)基于压痕实验原理和法向磨削力的经验公式,得到了亚表面损伤深度预测模型。模型预测值与实验值一致性较好。

参考文献

[1]Chen Jianbin,Fang Qihong,Li Ping.Effect of Grinding Wheel Spindle Vibration on Surface Roughness and Subsurface Damage in Brittle Material Grinding[J].International Journal of Machine Tools&Manufacture,2015,91:12-23.

[2]Ma Lianjie,Gong Yadong,Chen Xiaohui.Study on Surface Roughness Model and Surface Forming Mechanism of Ceramics in Quick Point Grinding[J].International Journal of Machine Tools&Manufacture,2014,77:82-92.

[3]Esmaeilzare A,Rahimi A,Rezaei S M.Investigation of Subsurface Damages and Surface Roughness in Grinding Process of Zerodur Glass-ceramic[J].Applied Surface Science,2014,313:67-75.

[4]Yu D P,Wong Y S,Hong G S.A Novel Method for Determination of the Subsurface Damage Depth in Diamond Turning of Brittle Materials[J].International Journal of Machine Tools&Manufacture,2011,51:918-927.

[5]Blaineau P,Andre D,Laheurte D,et al.Subsurface Mechanical Damage During Bound Abrasive Grinding of Fused Silica Glass[J].Applied Surface Science,2015,353:764-773.

[6]向勇,任杰,白满社,等.微晶玻璃研磨加工亚表面损伤深度预测方法及测量[J].中国激光,2014,41(7):1-8.Xiang Yong,Ren Jie,Bai Manshe,et al.Prediction Method and Measurement of the Depth of Subsurface Damage of Glass-ceramic by Lapping Process[J].Chinese Journal of Lasers,2014,41(7):1-8.

[7]Li S,Wang Z,Wu Y.Relationship Between Subsurface Damage and Surface Roughness of Optical Materials in Grinding and Lapping Processes[J].Journal of Materials Processing Technology,2008,205(1):34-41.

[8]Lawn B R,Evans A G.A Model for Crack Initiation in Elastic/Plastic Indentation Fields[J].Journal of Materials Science,1977,12(11):2195-2199.

[9]Larnbropoulos J C,Jacobs S D.Material Removal Mechanisms From Grinding to Polishing[J].Ceram Trans.,1999,102:113-128.

深度预测 篇8

随着社会的快速发展和机动车数量的急剧增加,城市交通日益趋向于拥堵,交通事故与空气污染也进一步加剧。在我国,北京、上海这样的大城市在中心市区的平均车速在高峰时期不足20 km/h,交通拥堵又进一步导致了能耗加剧与环境污染。研究结果表明[1],当车速由40 km/h降低至10 km/h时,能量损耗量会增长1倍,环境污染量会增加3倍以上。北京市汽车排放的氮氧化物、一氧化碳对环境分别占到46%和63%。所以,智能交通系统(Intelligent Transportation Systems,ITS)成为解决城市拥堵问题的关键途径。智能交通系统有效地利用当前先进的硬件和软件,对交通进行有效的综合管理。短时交通流状态预测(Short-term Traffic State Forecasting)作为智能交通系统的核心技术,它利用现有数据对交通流状况进行预测,进而帮助出行者进行路径规划,实现交通流诱导,从而缓解了交通拥挤,减少了环境污染。人们针对交通流预测,提出过不同的预测模型;但是由于城市交通流时间与空间上的复杂性,给预测结果的准确率带来了挑战。

深度学习作为机器学习的新兴学科,一经提出便受到了广泛的关注,像Google、微软、百度,都在研究与利用深度学习。它被成功地应用到了分类任务、自然语言处理、降维、图像识别等等方面。深度学习通过利用多层体系架构来有效地、非监督地提取出底层数据的潜在的典型特征,进而提供给高层进行分类与回归。交通流本身就是一个复杂的过程,深度学习架构能够帮助我们无先验知识却能有效地学习与抓住其中内在的复杂特征,进而有效地进行交通流预测。

本文提出了一个基于深度学习的交通流预测模型,通过训练并加以实现。实验结果表明,这种方法在交通流预测当中取得了不错的准确率。

1 背景介绍

1.1交通流预测

交通流预测一直都被认为是实现城市智能交通系统(ITS)的关键技术问题。它利用以往历史数据对未来某段时间内交通流量进行预测。预测时段一般为5~30 min。

令Xit表示第i个交通道路在第t时间的交通流量,那么给定 一个观察 得到的交 通流序列 ,i = 1,2,…,m;t = 1,2,…,T,那么交通流预测即是根据这以往的交通流序列对于某条道路 {T + Δt} 时间段进行预测。其中 Δt可以进行调节。

交通流预测模型一般包括两步,即特征学习与模型学习。特征学习即非监督学习,通过训练可以得到代表以往历史交通时间序列的一个特征代表模型h。经过特征训练后,以往的交通流序列X即可通过h转化为另外的一个特征空间Y,即h(x)→ Y;模型学习即监督式学习,给定一组特征Y与目标任务Z的配对组 {(Y1,Z1),(Y2,Z2),…,(Yn, Zn)} 学习预测模型Zn + 1= g(Y),通过最小化目标损耗函数L,得到预测模型的适合的参数W:

尽管预测模型之间互有差别,但是目标损耗函数大多数都是一样的。以往的预测模型可以分为三类[2]:

(1)基于以往历史数据的时间序列法。自回归整合滑动平均模型[3](ARIMA)就是通过找到交通流随时间变化的模式,从而实现预测。相似的还有子集ARIMA[4],表达变量ARIMA(ARIMAX)[5],向量自回 归移动平 均(ARMA)和基于时间与空间的ARIMA[6],还有季节性的ARIMA(SARIMA)[7],卡尔曼滤波方法[8]等。

(2)基于概率图模型的方法。通过概率图的方法对交通流进行建模与预测,常见的方法有:贝叶斯网络[9],马尔可夫链,马尔可夫随机场(MRFs),模糊逻辑[10]等。

(3)非参数统计方法。由于这种方法能够很有效地模拟交通流不确定、复杂性和非线性等特点,所以它比其他方法取得的效果更好。例如神经网络(NNs),支持向量回归(SVR),局部加权学习(LWL),k-NN[11]方法,支持向量机(SVR)[12],随机微分方程[13]等。

总体说来,随着智能交通的发展,很多预测模型都被提出来了。但是,很难说某个具体的方法在所有交通流领域强于另外一个方法。因为这些方法大多数都是基于某些特定的数据进行建模的,并且预测结果也依赖于采集数据的准确性。然而神经网络(NN)由于能够有效利用历史数据与数据之间的关系,所以能够获得更好的健壮性与预测结果。可是现有的神经网络大多数都是基于浅层体系架构,当建立多层架构时,基于梯度下降的方法就不能有效地进行参数调节。深度学习作为一种新兴的神经网络,它解决了传统NN的训练问题,获得了比传统神经网络更好的实验效果。所以利用深度信念网络(DBN)可以对交通流模型进行预测与改进。

1.2深度信念网络

深度信念网络(DBN)作为深度学习模型中最常见的一种模型,它是通过一系列的RBM堆积而成。每一层的RBM都只有一个隐藏层,每一层的输出作为下一层的输入。Hinton等人提出了一种可以快速的每次逐层训练DBN的方法[14],即每次训练一层。

RBM即限制玻 尔兹曼机 ,它是马尔 可夫随机 场(MRFs)的一个特例。若一个二分图,每层节点互相之间没有连接,一层是可视层(visible),另外一层是隐藏层(hidden),且假设所有节点都是随机的、二值分布的,二层之间通过对称矩阵进行连接,并且概率分布满足玻尔兹曼分布,那么这就是RBM。可视层对应于输入,因为它们的状态已经被观察得到;隐藏层对应于特征探测,它们的联合组态能量方程 (v,h) 为:

式中:vi和hj是输入i和特征j; bi和aj分别是他们的偏移量;wij为它们之间的权重矩阵。因为隐藏层之间是相互条件独立的,即:

那么当v或者h给定时,便可以计算出它们的条件概率分布:

那么当给定一组训练集 {Vc|c ∈{1,2,⋯,C}} 时,其目标就是最大化这个模型的对数似然函数:

一般都是通过梯度下降法求得参数wij,bi和aj,但这里可以用吉布斯采样法近似求得,即可视层V根据指定的规则采样出隐藏层H,然后再反过来采样出可视层V,这个过程可以重复很多次。经过多次的迭代,模型会忘记它的初始起点,这样就可以从它们的平衡分布中进行采样。最终,函数期望利用对比分歧(CD)方法在有限次内便可以得到近似值。把N + 1次采样的算法标记为CD- N。实践中,一般用CD-1就可以得到合适的值。那么就可以得到权值wij的更新规则:

式中:εω为学习速率;Edata是根据初始模型分布当可视层输入的时候,隐藏层的期望输出;Emod是通过CD算法估计出来的期望输出。同理,bi和aj的更新规则与wij相类似。

1.3高斯-伯努利 GBRBM

在普通的限制玻尔兹曼机(RBM)中,可视层的输入限制为0或1,这样对于模拟现实中像交通流这样的连续值是很 不方便的 。 于是 ,可以通过 高斯 - 伯努利GBRBM[15]来模拟真实数据。它通过加入高斯噪音的连续值来模拟真实的数据,进而替代了普通RBM的二进制的可视层输入,其能量函数改为:

式中:vi表示可视层第i个真实值;σ 是高斯函数的标准方差。通过方程就能让可视层表达获得某个特定连续值的优先权,根据能量方程[16],得到它们的条件概率分布为:

它的训练调参过程与普通的RBM没什么区别,都可以利用CD过程对参数进行调节。

2 体系架构

在此,建立了深度架构,底层是由GBRBM与RBM组成的DBN的架构,用于非监督的特征学习;顶层加入了一个回归层用作预测,当然顶层也可以替换为支持向量机(SVM)。建立的模型如图1所示。

在DBN预训练以后,顶层再通过有标签的数据进行BP算法去做参数调整。这种方法要强于以往传统神经网络直接用BP算法做梯度下降调整,直观的原因为:DBN预训练后的参数已经接近于训练好,那么再做BP算法,只需要在已知参数里面进行一个局部的搜索,无论训练与收敛速度都快很多。此模型的训练步骤如下:

(1)把交通流数据进行归一化到[0,1]之间,那么输入向量X便可以表示为:

式中:Xit表示为第i条道路在第t时间的归一化后的数据。初始化训练次数、学习速率。

(2)把向量X作为输入,通过CD过程训练第一层的GBRBM。

(3)把GBRBM的输出作为上层的RBM的输入,训练RBM。

(4)把RBM的输出作为上层的RBM的输入,训练RBM。

(5)重复执行第(4)步直到执行完给定的层数。

(6)最后一个RBM的输出作为顶层回归层的输入,随机初始化其参数。

(7)通过监督式BP方法微调这个架构的参数。

最后通过训练得出的模型就可以作为预测模型,当给定一组输入向量后,便得到对应道路的预测输出。

3 实验及结果分析

3.1实验数据描述

实验使用的交通流数据来源于英国官方交通流数据中心。数据集提供了每隔15 min的交通平均路途消耗时间、速度与交通流量,并且数据覆盖了英格兰地区的高速公路与A级道路(即城市主干道)。实验选取了英格兰的纽卡斯尔市与森德兰市之间的5条主要城市道路AL1065,AL1596,AL566,AL543,LM69。选取其中2014年9月份的数据,共有30天数据。其中前29天的数据用以训练模型,后1天的数据用以测试。

3.2性能指标

两个最常 见的性能 指标参数 为 :绝对平均 误差(MAE)和相对平均误差(MRE),定义如下:

式中:Zi为实际的交通流数值;Ẑi为预测值。在这里选择了MAE与MRE作为衡量标准。

3.3架构实现

在深度体系架构中,需要决定其输入层的大小,隐藏层的层 数 ,隐藏层每 一层的节 点个数 。 在此选择AL1065,AL1596,AL566,AL543,LM69中前两个时间段的交通流量作为输入,即共10个输入,道路LM69作为其预测输出。其中隐藏层分别为浅层的结构{10,10,4}与深层的结构{10,12,10,8,6,4},通过训练以后对道路LM69第30天做预测的结果如图2所示。

图2中横坐标表示的为第i个15 min,纵坐标表示交通流量。从图可以看出深层结构预测的结果更加接近于真实值。

3.4结果对比与分析

实验程序在Windows 7上开发完成,硬件条件为Intel®CoreTMi7-4710MQ,4 GB内存,显卡NVIDIA Ge-force 840 MHz。每次运算时间基本在30 min以上,大多数1 h内能完成。

实验中对DBN的BP过程调优次数epochs做了调整测试,结果发现大于某个数量时,DBN预测结果对于次数调整并没有大的影响。这也印证了DBN在预训练阶段参数的调整已经近乎较优的判断。

为了衡量深度架构的性能,同时也采用传统的MLP神经网络做了BP算法训练进行预测,并做了对比;结果发现,当训练层数增加时,BP算法的预测结果准确性反而降低了。这也说明传统的BP算法并不适应于深度架构。实验中MLP采用的是{4,4,5}浅层架构。

从图3可以看出,DBN架构相对于传统的MLP神经网络来说,无论在交通流的最高峰时期还是最低交通流量时,所预测得到的结果都更加准确。

MLP与DBN的性能指标对比如表1所示。

从以上数据可以看出,深度学习架构随着层次越深相对平均误差也越少,并且相对于传统的MLP网络有大幅度的预测准确性提升。

4 总结

本文第一次将深度学习架构应用于城市主干道的交通流预测中。相对于城市的高速公路,城市主干道交通具有更大的不确定性与多变性。进而给预测带来的挑战也更大。同时,模型也成功地通过深度学习发现了交通道路之间潜在的特征,如时间、空间上等的非线性关系。

在此首先建立了深度体系架构,通过逐层非监督式的预训练挖掘潜在特征,并利用回归层实现全局微调参数 ,进一步优 化了预测 结果 。 然后 ,对比了DBN与MLP,实验表明,DBN所获得的准确率要大大强于MLP模型。

本文提出的模型仍可以进一步改善,如顶层换为SVM等其他预测模型,模型的应用场景可以推广到整个城市的交通流预测等。

摘要:短时交通流状态预测对于实现城市智能交通系统至关重要。在过去,很多神经网络模型被提出来用以预测交通流,但是效果并不是很显著。究其原因,是因为大多数都是利用浅层模型在学习,浅层模型由于容易陷入局部极值而且不能模拟更复杂的数学运算,所以并不适合于模拟现实的交通状况。深度学习作为机器学习的新兴学科,在语音与图像处理方面取得了显著的成效,它能够非监督地从数据中学习出有效的特征用以预测,故在此利用深度学习进行建模用以城市主干道交通流预测。实验表明,模型取得了不错的交通流预测效果。

深度预测 篇9

为了对原始时间序列数据进行维约简, 传统的时间序列数据建模通常采用分段表示的方法,整体可划分为2类:基于时域的分段表示方法与基于变换域的分段表示方法。

对于本文的基本研究对象———商品期货, 为充分还原其主要的市场特征,即单边运行模式及震荡情形,本文引入数理统计中线性回归的思想,基于市场行为,对时间序列进行切分处理。

在对时间序列数据进行切分时, 针对每个子序列进行线性回归,当切分得到的子序列的回归判定系数R2大于设定的阈值r时 , 可将时间序列中的下一个数据点加入该子系列中继续计算,否则,可将当前数据点视为切分断点,从该数据点开始搜寻下一个子序列,直至整个序列搜索完毕或到达最新时间点。 对于切分后得到的数据,长度达到3及以上的子序列,即可视为市场单边模式序列,采用线性回归结果进行描述;对于切分断点,相连即得到市场震荡点序列。

以伦敦金属交易所(LME)交易品种之一的伦铜期货为主要研究对象,将2001年1月2日至2015年5月12日的伦铜指数日交易数据的收盘价作为样本, 进行数据的切分处理以及后续的规律挖掘,其中回归判定系数阈值r设定为0.7。

具体可获得3 632个交易日的交易数据,包括各交易日的开盘价、收盘价、最高价、最低价、成交量、持仓量等信息,如表1。

按照上述算法描述,对3 632个交易日收盘价序列进行数据切分,获得单边模式序列及震荡点序列。

如图1所示为2015年3月13日至2015年4月17日40个交易日的收盘价序列的切分结果。

对于切分后得到的线段序列, 每个线段序列以2个属性进行描述:单边模式 / 震荡调整持续时间、单边模式 / 震荡调整趋势幅度。

2关于单边运行深度预测的频繁特征模式挖掘

本节在市场切分后,基于改进的频繁特征模式挖掘过程,对单边运行的深度进行预测。 着重研究对切分得到的单边模式序列及震荡点序列的符号化表示, 在此基础上基于互关联后继树模型的频繁特征模式挖掘算法, 以及通过频繁特征模式匹配实现单边运行深度预测的过程。

传统的时间序列频繁特征模式挖掘基本上可 概括为两 阶段:序列特征的描述及挖掘算法的设计。 即首先利用移动时间窗口对时间序列进行分段,并对各个子段进行聚类,利用形成的符号对序列特征进行描述。 在此基础上,利用关联规则挖掘思想及算法,对上述符号化序列进行频繁特征模式发现。 本文提出,对切分后得到的线段序列,结合市场实际运行特征,对线段在时间轴上的长度及线段的斜率分别进行符号化, 利用得到的二维属性组进行频繁特征模式挖掘。

基于上节思想, 将2001年1月2日至2015年2月5日的伦铜指数日交易数据作为样本,设定回归判定系数阈值为0.75, 进行数据切分,获得了单边模式序列及震荡点序列。对上述1070组切分后形成的线段序列,针对震荡点序列与单边模式序列,按照不同的策略,选取二维属性组(持续时间分类标记、运行深度分类标记),进行符号化表示:

将震荡点序列的持续时间分类标记设为10, 运行深度分类标记设为100;

将单边模式序列持续时间分类标记按照超短期、 短期、中期、长期分别设为1、2、3、4,运行深度按照是否超过相邻的上一单边模式序列的深度分别设为1、-1。

在对上述样本数据切分后形成的1 070组线段序列选取二维属性组(持续时间分类标记、运行深度分类标记),进行符号化表示的基础上, 将2001年至2011年涵盖的833组符号化的线段序列作为主要的训练数据, 根据基于互关联后继树频繁特征模式挖掘过程,对其建立t SIRST(时间序列互关联后继树)模型, 设定最小支持数阈值,并基于t SIRST模型进行频繁特征模式挖掘。 表2所示为设定最小支持数为3, 最小置信度为70%情况下,挖掘得到的频繁特征模式。

根据频繁特征模式的挖掘结果, 设定最小置信度阈值进行筛选,利用筛选后的频繁特征模式,对2012年至2015年市场实时跟踪得到的特征模式进行滚动匹配, 以实现对单边运行深度的预测。

通过精确的频繁模式匹配,实现对单边运行深度的预测,对预测效果的评价设定以下指标:预测准确率、模式覆盖市场机会比率、模式覆盖市场幅度比率。

预测准确率是对挖掘得到的频繁规则在实时跟踪中真实的预测效果的评价。 模式覆盖市场机会比率、模式覆盖市场幅度比率,反映了挖掘得到的频繁规则的市场应用价值。 其比率越高, 说明通过该方式可把握的市场机会越多,参与市场的收益越高。

综上, 基于改进的频繁特征模式挖掘过程, 对2012年至2015年 ,伦铜市场单边运行深度进行滚动预测 ,预测结果如表2所示,其中因样本期内2015年切分后数据较少,将其与2014年合并预测,在频繁特征模式挖掘过程中,设定支持数阈值等于3, 设定置信度阈值等于0.6。

表2表明,在设定的置信度阈值等于0.6时,通过挖掘得到的频繁特征模式数较多, 模式覆盖的市场机会及市场幅度比率都相对较高, 但由此进行的频繁特征模式匹配以实现对单边运行深度的预测,准确率较上述情况偏低。

3结论

【深度预测】推荐阅读:

深度服务05-09

深度覆盖05-12

课程深度05-13

不同深度05-16

深度融合05-17

深度测量05-18

深度模式05-25

深度影响05-26

图像深度05-30

麻醉深度06-30

上一篇:校友管理下一篇:旅游形象系统设计研究