行业配置的量化方法(通用4篇)
行业配置的量化方法 篇1
在传统的资源配置过程中, 常按峰值进行资源分配, 使节点资源平均利用率远低于期望值[1]。目前, 学者们对云计算系统资源动态配置问题进行研究, 取得了许多优秀的成果[2,3,4,5]。文献[6]中提出了一种自配置框架, 该框架根据当前资源需求, 利用布尔二次指数平滑法对应用未来的资源需求进行预测, 相比TSSP07算法, 更为准确。但文献[6]主要针对WEB服务应用进行资源需求预测和动态配置, 对行业业务系统的资源预测可能会有较大的预测误差。本文依托南方电网公司云计算技术的基础设施试点项目, 对文献[6]的方法进行改进, 结合电力系统自身特性, 设计了一种资源预测方法, 将该框架应用于南方电网的相关试点项目中, 准确率得到明显提高。实验表明, 较之文献[6]所述方法, 本文提出的方法在处理电力系统业务数据时减少7%左右的活动节点, 有效地降低了系统功耗。
1 基础动态资源重配置方法
假定云资源池由M个物理节点组成, 运行N个虚拟机, 对于虚拟机, 物理节点上均存在一个该虚拟机的副本, 其中表明Cj上运行着Vi的一个活动副本, 反之, Vij=0表明Cj上的Vij副本为非活动状态。在负载均衡机制下, 允许一个虚拟机运行多个副本。记上的资源上限为, 对虚拟机Vi, 用户在时刻t的总访问请求是在时刻t分配的资源总和为Resources_Vij (t) , 在保证上述资源时, 可满足Load_Vij (t) 的用户请求, 其中Resources_Vij (t) 能支持的Load_Vij (t) 。系统采用基于采样点的离散时间进行处理。非活动虚拟机副本的访问请求和所需资源为0。一个可保证用户访问Qo S的云计算资源池满足下列两条约束条件:
用户的总访问请求满足, 对任意Vi, 有
物理节点运行资源满足, 在任意Cj上将有
假定系统资源只考虑CPU占用情况。记节点Cj当前能耗为Power_Cj, 当时, 称Cj处于休眠状态, 反之则Cj处于活动状态, 此时与Cj的CPU利用率正相关。在上述条件下, 调节各Resources_Vij (t) 的值, 在解空间中搜索使系统达到的最优解的问题。文献[6]中就采用了遗传算法对该问题进行求解。框架如图1所示。
每增一个新虚拟机, 便分配一新的VM manager (VMM) 管理虚拟机的副本;并由VMM来管理拟机的运行状态, 实现自配置和服务请求。以用户请求历史记录为基础, 采用布尔二次指数平滑法[7]对时间间隔后的访问请求进行预测, 其中Load表示真实值, load表示预测值。记为一次指数平滑值和二次指数平滑值, 为平滑系数, 为预测误差, 布尔二次指数平滑法的预测公式为:
该式对WEB访问的请求进行预测, 预测数据只包括三个数据, 该方法将无法对突变性事进行短期预测。同时, 其预测精度随的增加指数级别衰减, 在中长期预测时, 预测精度较低。居民用电量有典型的峰谷波动特点和爆发性特点, 故该方法无法改善电力行业的预测准确性。
2 针对电力行业特点改进的请求预测方法
为解决第一节的问题, 本文将历史日同期数据引入样本空间, 改善了近期预测的延迟性和中长期预测的准确性。
历史日同期数据指预测时刻前k*24h的历史数据。虚拟机iV上k日同期历史数据记为Load_Vi (t-k Day) , 假定24小时为预测时间间隔的整数倍, 记系统真实访问请求数Load_Vi (t) 与预测值load_Vi (t) 之间的差值为预测延迟差diff_Vi (t) 。diff_Vi (t+k) 可根据历史日同期预测延迟差Diff_Vi (t-k Day) 进行预测。我们仍然选择布尔二次指数平滑法对diff_Vi (t) 进行预测, 其计算方法如下。
其中L_Diff Dayt (1) 、L_Diff Dayt (2) 为预测延迟差的一次指数平滑值和二次指数平滑值, 分别为的一次指数平滑值和二次指数平滑值, 分别为计算预测延迟差时的平滑系数和预测误差。
得到diff_Vi (t+τ) 后, Vi在时刻的应用请求预测值的将被修正。记该预测值为, 其计算方法如下, 其中为预测误差:
亦可通过布尔二次指数平滑法根据历史日同期数据预测获得。首先计算, 然后对下一日数据进行预测。其计算方法如下,
其中分别为时的一次指数平滑值和二次指数平滑值, 为平滑系数, 为预测误差。这里假定τ个预测时间间隔小于24小时。
考虑布尔预测的精度是随τ的增加指数衰减, 本文将预测延迟差已引入历史日同期数据信息, 因此, 在τ=1时, 预测结果中不应包含分量。故可以采用指数衰减的方法整合两个预测值, 记整合后的预测值为为进行指数衰减的平滑系数, 计算公式如下:
文献[6]中选0.5为最优值, 的最优值通过实验得到。本文选择电力系统中6+1系统应用。本实验以云南电网公司2013年6月5日0:00AM-12:00PM共12小时的6+1系统访问数据作为数据源, 以2013年6月2日、6月3日、6月4日0:00AM-12:00PM的6+1系统访问数据作为历史日同期数据, 为有效显示高负载时状态, 所有访问数据被线性放大100倍, 对预测系统实际运行状态进行模拟, 每小时进行一次系统自配置。的选值与短期预测平均相对误差 (τ=1) 、中期预测平均相对误差 (t (28) 4) 的对应关系见表1, 表中无选值时, 对应基础的布尔二次指数平滑法的预测平均误差。
3 实验数据
本文对文献[6]GABA算法进行改进, 称Improved GABA (IGABA) 算法。实验模拟了一个由300个CPU核心组成的资源池, 采用的虚拟机为VMware Vs Phere 6.5, 操作系统为Ubuntu 11.10 64bit desktop。实验数据和第二节一致。
本实验对比了TSSP07和文献[6]中GABA。图2给出了本文所述算法和其他两种对比算法在试点项目中的活动节点数。因TSSP07在当前系统能满足应用请求时就不进行调整, 而GABA和i GABA均能休眠掉不必要的活动节点, 性能均高于TSSP07算法。在应用访问数快速变化时, GABA延迟较大, 资源配置不准确。i GABA在0:00am-6:00am时, 因应用访问数变化量较低, 与GABA和i GABA算法效果接近, 但在7:00am后, 因应用访问数快速增加, 预测准确率较高, 此时活动节点数明显低于GABA开启的节点数。在本实验条件下, 相对于GABA, i GABA能减少7.1%的活动节点数, 有效的降低了系统总功耗。
4 结语
本文针对南网云资源管理系统 (简称CRMS) , 将历史日同期数据和即时数据同时作为预测数据源进行预测, 通过引入预测延迟差和历史日同期数据进行修正, 有效地提高了预测准确率, 进而提高数据中心整体运行效率。在后续研究中, 拟对其他行业数据进行建模整合, 提出有效的预测方法。
摘要:布尔二次指数平滑法能对云计算系统的虚拟机资源请求进行预测, 但预测结果存在滞后, 且长期预测精度低。本文依据电力系统资源请求与用电量相关性、用电量的周期性、每日同期请求的相似性, 在传统的布尔二次指数平滑法基础上引入历史同期数据, 修正预测结果, 提高预测的准确性, 提高了电力系统云计算资源池的利用率, 降低了系统功耗。
关键词:云计算,预测,布尔二次指数平滑法
参考文献
[1]孙大为, 常桂然, 陈东等.云计算环境中绿色服务级目标的分析、量化、建模及评估[J].计算机学报, 1999, 36 (7) :1509-1525, 2013.
[2]Padala P, Shin KG, Zhu XY, et al.Adaptive Control of Virtualized Resources in Utility Ccomputing Environments[J].ACM SIGOPS Operating Systems Review, 2007, 41 (3) :289-302.
[3]Bobroff N, Kochut A, Beaty K.Dynamic Placement of Virtual Machines for Managing SLA Violations.In:Proc.of the 10th IFIP/IEEE Int’l Symp[J].On Integrated Network Management.2007.119-128.
[4]Arlitt M, Jin T.Workload Characterization of the 1998 World Cup Web site[J].Technical Report, HPL-99-35R1, Hewlett-Packard Labs, 1999 (11) .
[5]米海波, 王怀民, 尹刚, 等.一种面向虚拟化数字中心资源按需重配置方法[J].软件学报, 22 (9) :2193-2205, 2011.
[6]Brown RG, Meyer RF.The fundamental theorem of exponential smoothing[J].Journal of Operations Research, 1961, 9 (5) :673-685.
行业配置的量化方法 篇2
本算法将海量MR数据的采样点分布, 集成构建干扰矩阵。该矩阵能够客观反映现网小区间的交叠影响情况, 其精度远高于传统的模型仿真。在干扰矩阵基础上, 通过现网实配的载频频点, 根据载频发射方式及同邻频干扰耐受度的不同, 将小区间的干扰程度通过数学方法量化为数值, 从而达到简单明了显示干扰程度的目的。再根据现网实测数据的比对进行系数修正, 保证了计算结果的准确有效。具体算法如下:
目前相关算法已申请专利, 公式中的相关系数根据现网环境修正确定。
二、支撑系统介绍
(1) 环境因素加权后的多维度评估。
在量化显示小区间干扰程度基础上, 根据小区间切换交互程度、话务承担水平、站址距离等因素, 将干扰量化整合为“基础干扰值”、“小区干扰值”以及“区域干扰值”三个维度, 实现不同优化场景的应用。
“区域干扰值”主要应用与干扰评估监控, 可根据想要评估范围自主选择, 小区数量与话务量的辅助呈现, 实现了不同网元间横向比较;“小区干扰值”主要应用与干扰小区定位、切换异常评估等优化场景, 可以实现批量输出及横向评估;“基础干扰值”主要应用与干扰原因查找、小区覆盖异常评估、切换关系异常评估等优化场景, 在干扰量化的基础上, 更支持干扰概率的输出, 便于功能完善与进一步开发。
(2) 优化频点自动输出功能。
干扰量化主要是在现网频点配置的基础上进行的评估, 因此频点不合理是本系统核查的主要问题之一。针对不合理的频点, 根据小区间交互程度、站址情况、邻区配置情况以及同邻频影响, 对不合理频点给出了可进行替换的“优选频点”, 并根据频点优选程度, 分为了“可选频点”、“次选频点”与“优选频点”, 便于优化人员根据实际情况灵活配置。
三、实践应用
中国移动吉林有限公司在本文算法基础上, 在省内支撑系统中实现了自动化支撑, 包括干扰量化呈现、多维评估及优选频点输出等, 并在现网试点应用中加以验证, 干扰量化结果与实际情况符合度很高, 同/邻频干扰发现率可以达到80%以上, 进而在优选频点辅助下, 解决效率与合理性也有大幅提高。
其应用推广上的优势主要体现在:1) 应用范围:本项目支撑功能支持GSM主流无线设备小区的干扰量化与频点优化。不同厂家的区别仅在MR数据采集方法, 其他功能均可以套用已有功能框架实现支撑。目前已涵盖吉林移动网络94%以上市区载频。2) 应用领域:能够广泛应用于网络优化工作领域, 包括:可控干扰日常监控、网络干扰问题区域评估与分析、频点优化、邻区关系优化、覆盖合理性判决等。
结语
本文的创新主要在于自主开发了频率配置干扰量化算法接入已有数据采集系统, 实现了准实时的干扰量化结果呈现, 弥补了干扰评估只能通过间接指标推测而无法直接量化的技术空白;独创多维度干扰评估方法, 通过不同主导环境因素的加权, 建立由区域到小区、由网元到频点的多维度干扰量化, 实现由评估到原因定位的快捷方法, 提高了干扰定位的工作效率与准确性。
摘要:基于现网实测的采样点分布, 集成构建干扰矩阵, 再结合现网实配的载频频点, 根据载频发射方式及同邻频干扰耐受度的不同, 综合话务量与地理位置, 将小区间的干扰程度通过数学方法量化为数值, 从而达到简单明了显示干扰程度的目的。
行业配置的量化方法 篇3
1 陶瓷企业职业卫生防护措施实施的情况
2002年《中华人民共和国职业病防治法》(职业病防治法)实施以前,部分企业对职业病防治工作采取消极应付的态度;建设项目不能执行“三同时”卫生审查制度,不能从源头上控制职业病危害,职业病防治的管理组织不完善,责任不明确,措施不得力[1],导致尘肺病等慢性职业病与日俱增,此种情况引起了各级政府和职业卫生专业人员的高度重视,随着《职业病防治法》的实施,职业卫生监督工作得到了加强,企业也逐渐认识到职业病防治的重要性我们就近几年来对佛山陶瓷企业专项治理过程中陶瓷行业职业卫生防护措施量化模式进行探讨和分析。
2 对陶瓷企业进行职业卫生专项检查
把佛山市在2007年6月—2009年12月间拟保留的30家陶瓷企作为调查对象进行调查,其中有使用煤气站和不使用煤气站的陶瓷企业各15家。现场检测:根据《工作场所空气中有害物质监测的采样规范》[2],对陶瓷企业作业场所存在的主要职业危害因素(粉尘浓度,噪声强度,一氧化碳和硫化氢浓度,高温作业气象条件等)进行检测,分析与评价其检测结果是否符合《工作场所有害因素职业接触限值》的要求。作业场所调查主要包括原料、喷雾干燥塔、压机、抛光打磨、窑炉煤制气站等车间各个生产环节的职业病防护设施情况。
3 建立量化分级模式
3.1 检查核实和量化评分
根据初步的评估,对企业的职业病防治管理、健康监护、有害因素检测评价情况、作业场所职业病防护设施、个人防护用品使用情况、警示标志和标识、职业病管理以及煤制气车间等进行全面客观的检查核实和量化评分,编制评审验收报告[2,3,4,5,6]。陶瓷行业职业卫生防护措施量化评分方案见表1。
注:表1总额定分为150分;带有*是关键项目,1项不符合要求,则评定为不合格;各项额定分是固定的,扣完即止;因客观原因没有该项工作的,为不评分项;应得分=总分-不评分项的总分值,标化分=实得分÷应得分×100。
3.2 根据评价得分,进行监督评价分级,确定监督类别和监督频率,指导监督工作
3.2.1 监督评价分级
评审验收报告应根据陶瓷企业评审得分情况将其分为合格、基本合格和不合格3大类,评分为合格、基本合格的企业可视为通过评审验收。按《评审表》标化得分80分以上评为合格,70~80分评为基本合格,70分以下或任一关键项目不符合要求评为不合格。
3.2.2 分类管理
合格的陶瓷企业—申请职业病危害因素检测评价—工人职业健康检查—申请评审验收。基本合格的陶瓷企业—进行必要的整改—申请职业病危害因素检测评价—工人职业健康检查(有新的问题,需再次整改和检测)—申请评审验收。不合格的企业—提出整改意见—督促其限期整改,整改时限不超过3个月—申请职业病危害因素检测评价—工人职业健康检查—申请评审验收。检测结果严重超标、卫生防护设施差、近3年曾诊断职业病病人的企业,其整改方案须经卫生行政部门审查同意后实施。总而言之,对检查中发现的存在问题,必须作出相应的行政行为,如卫生监督意见书或当场行政处罚决定书(警告并责令限期改正),做好记录,并应在限期内跟踪监督,确保整治效果和监督效能。
4 量化模式实施后的成效
4.1 某陶瓷公司整治前后职业病危害因素检测结果
某陶瓷公司于2008年参加了佛山市陶瓷企业调整提升卫生要求培训后,成立了职业卫生管理机构,对其作业场所进行整治。整治前后职业病危害因素检测结果对比见表2。从表中可知,车间总尘浓度合格率提高14.13个百分点,呼尘浓度合格率提高21.20个百分点,工作场所空气中的粉尘浓度得到较好的控制,防尘措施得到了一定的成效;煤气站一氧化碳和硫化氢浓度的2次检测合格率均为100.00%,说明煤气站的防护措施完善,管理措施有效;但噪声强度未得到明显的改善。
4.2 佛山市陶瓷企业整治前后职业病危害因素检测结果对比
见表3。整改后工作场所空气中生产性总尘浓度合格率比整改前提高了30.0%,呼尘浓度浓度合格率比整改前提高了近20%,噪声合格率比整改前提高了20%。
5 讨论
佛山市不论从个体还是从总体来看,陶瓷企业作业场所存在的主要职业病危害因素经过整治后都得到了很大的改善,健全工作场所职业病危害因素监测及评价制度的量化管理,统一职业病危害因素检测评价的标准和方法使各个企业明确职业病危害防护措施的要求,针对要求来认真落实各项措施,对整治工作事半功倍。对于职能部门来说,量化模式的分级管理也能清楚了解各家企业职业病防护措施整改是否到位,跟踪监督有据可依。量化模式的分级管理模式的实施,对佛山陶瓷企业作业场所存在的主要职业病危害因素的整治是有一定的成效的,但也发现部分陶瓷企业落实职业卫生整改工作积极性不高,职业病防护措施整改不到位,不彻底;粉尘、噪声等职业病危害因素监测合格率低,粉尘合格率在11%~67%之间,总合格率仅为37%;噪声合格率在33%~75%,总合格率仅为55%;职业健康监护工作还未全面开展,接触职业危害因素的工人职业健康检查率不高。存在的这些问题还需我市各职能部门加大监管力度,提高监督效率,及早完成整改,加快推进我市陶瓷产业调整提升工作。量化分级与监督监测相结合的职业卫生管理是一种将单纯监管转向监管与技术指导并重的新型监管模式。建立陶瓷行业职业卫生防护措施量化模式,目的是为进一步改善我市陶瓷行业职业卫生状况,加大监管力度,提高监督效率,实现由定性管理向定性定量相结合的动态管理转变,探索建立职业卫生监督的长效管理机制。通过行之有效的量化分级管理,能够最大限度地调动企业积极性,促进企业加强自身管理,加大投入,也能够合理配置卫生监督资源,提高执法水平和执法效率,从而更好地贯彻“预防为主,防治结合”的方针,实行“分类管理,综合治理”的原则。把监督内容和监督方法进行量化评定,建立评定等级的标准,使职业卫生监督工作具有可操作性和可比较性,为职业卫生监督管理的效果评价提供依据[7]。
参考文献
[1]朱进平,梅震.职业卫生监督量化分级管理模式探讨[J].工业卫生与职业病,2008,34(6):378-379.
[2]GBZ159-2004.工作场所空气中有害物质监测的采样规范[S].
[3]GBZ1-2002.工业企业设计卫生标准[S].
[4]BG/T18664-2002.呼吸防护用品的选择、使用与维护[S].
[5]GBZ2.1-2007.工作场所有害因素职业接触限值-化学有害因素[S]。
[6]GBZ2.2-2007.工作场所有害因素职业接触限值-物理因素[S].
数量化投资之先行行业的择时策略 篇4
信息扩散论认为, 资本市场信息扩散过程, 导致资本收益具有可预测性。其核心假设有两点:其一是信息传递存在时滞, 即资本市场中有效信息将滞后若干时间传达到市场投资者;其二是投资者无法从市场资产价格有效提取充分信息。
国外学者结合信息扩散论和实体经济及资本市场实际运行, 进一步探索研究发现在美国以外全球八大经济体中的七个得到验证, 行业组合对资本市场和实体经济均不存在预测作用。国内研究结果表明, 十四个行业具有先行效应, 分别是商业地产、交通、矿产、公共设施、服装、零售、出版、金融、石化、服务、皮革、非金属矿产、金属、电视。下文尝试结合以上研究理论, 筛选出A股市场的先行行业。
二、行业先行理论在A股市场的应用
我们采用申银万国一级行业分类, 分成23个行业。由于各行业包含个股数均不少25, 可以认为该分类已经充分反映行业信息, 使用数据为2005.4.30-2013.5.31行业月收益率, 以沪深300指数收益为A股市场收益。
(一) 相关性
从相关系数分析行业先行效应, 这里研究的是行业收益率与滞后n月沪深300指数收益率的相关关系。由相关系数可知, A股市场存在较强的相关性;当滞后期大于5, 无论对单行业还是各行业平均, 相关系数均变小, 说明先行行业收益与滞后n月沪深300收益相关性逐渐减弱, 甚至出现负相关的情况。另一方面, 即使统计意义上可能成立, 很难相信单个行业收益率包含信息能提前资本市场及实体经济半年以上。因此下文确定研究滞后期为1-5的情况。5个月内相关度最大的行业依此为:金融服务、房地产、家用电器、房地产、房地产;相关度最弱的依此为:信息设备、采掘、旅游餐饮、采掘、信息设备。各行业与滞后4个月的沪深300指数均有较高相关性, 平均值接近0.3;房地产行业出现频率高, 相关性也十分强, 滞后4个月相关系数达0.4。因此, A股市场存在行业先行效应。
(二) 正判率和先行行业的确定
先行行业趋势应领先市场, 因此, 先行行业收益与滞后n月的沪深300收益应具方向一致。对于某月t, 若先行行业收益为正且t-n月的沪深300收益同为正 (或同为负) , 则可视为判断正确;反之, 若出现方向相反则为判断错误。定义正判率为, 判断正确月数占总月数的比例。实证发现, 各行业平均值在滞后6个月或以上的正判率一般在50左右, 而小于5个月则有较高的正判率, 因此, 进一步说明, 行业先行效应在A股市场中不超过5个月。5个月内正判率最高的行业, 依次为:交运设备、餐饮旅游、家用电器、房地产、交运设备;最弱的行业分别是:公用事业、 (电子、采掘、轻工制造和农林牧渔) 、电子、采掘、采掘。
考虑对相关度、正判率两因子等权打分, 确定先行行业, 以下以滞后一个月为例。综合两因子确定一个月的先行行业为金融服务, 同理可确定其他先行行业, 依此为餐饮旅游、家用电器、房地产和交运设备。
(三) 收益的验证
为验证先行行业具有择时作用, 我们建立一个简单的投资策略:2005.4.30-2013.5.31日, 假设t-n月某先行行业收益率为正, 则在t月建立沪深300指数多头1手, 反之清仓离场。其中, 开仓费率和平仓费率均5%%, 保证金率为20%, 账户规模100万。对比简单的买入持有策略判断择时效果。验证发现, 首先, 通过先行行业择时是有效的。研究具体交易数据发现, 在2007.1.1-2009.1.1的牛熊周期中, 各先行行业均捕捉到市场前期的牛市, 建立多头, 在后期熊市中清仓离场, 收益方面显著优于简单的买入持有;其次, 无论是交易盈利比例, 还是单笔最大盈亏比, 房地产t-2月效果最好, 先行效应显著, 择时值得信赖。
三、总结
A股市场确实存在周期小于6的先行行业, 目前该策略最佳的先行指标是t-4月的房地产行业收益率, 与t月沪深300指数收益相关系数达0.4, 正判率也有66.67%。其他先行行业还包括金融服务、餐饮旅游、家用电器和交运设备, 此结论与国外研究结果一致。样本数据约100个月, 约8年时间。依据t-4月房地产择时策略累计收益率为185.64, 盈利交易比例达73.91%, 最大回撤为7.19%, 在众多先行行业中效果最佳。
参考文献