大数据预测论文

2024-08-09

大数据预测论文(精选12篇)

大数据预测论文 篇1

1 前言

三网融合推动了广电基础网络设施的改造, 但是与电信运营商相比广电运营商的设备运维和管理水平相对落后。因此, 搭建网络设备管理平台实时监控设备状态, 并针对告警信息快速响应, 已成为广电运营商保障设备安全、确保服务质量的迫切需求[1]本文利用有线运营商所采集到的网络设备性能指标及告警信息, 采用决策树方法[2,3]构建设备故障预测模型, 帮助运维人员预测设备告警级别, 在设备出现故障之前能够迅速、准确地定位问题并排除故障, 达到实时、智能监控网络设备运行状态的目的。该模型配套可视化界面, 作为大数据运营分析系统的一部分, 方便运维人员对网络设备的管理。

2 基于大数据的设备故障预测建模方法

2.1 建立模型的数据基础

广电有线运营商通过对设备性能指标的实时监控, 已采集了大量的设备性能指标及告警信息。其中设备性能指标包括CPU使用率、内存使用率、温度、端口流量、端口丢包率以及信噪比等。比如某地有线运营商对全网设备进行实时监控, 每隔半小时采集设备实时性能, 同时上传告警状态信息。其中网络设备涉及:CMTS (Cable Modem Terminal Systems, 电缆调制解调器终端系统) 、OLT (Optical Line Terminal, 光线路终端) 、ONU

(Optical Network Unit, 光网络单元) 以及Eo C (Ethernet over Cable, 基于有线电视同轴电缆网使用以太网协议的接入技术) 等。

有线运营商所采集到的网络设备性能指标及告警信息, 为设备故障预测模型的建立提供了大数据基础。

2.2 设备故障预测的定义

设备故障预测是故障诊断技术的重要组成部分, 是指通过对历史和当前的设备故障特征值进行分析, 预测出未来的故障特征值, 从而预测出设备在未来一段时间内的运行状态、预测设备可能出现的故障, 并且依据这些特征值, 判断设备的故障级别, 提前掌握设备故障的发展趋势, 为提早预防和修复故障提供依据, 具有重要的理论研究价值和工程实践意义。

2.3 设备故障预测的数据分析

本研究以某地有线运营商在2015年7月25日~11月27日期间, 采集到的90台CMTS设备的15753条告警信息以及告警时刻各设备的性能指标值, 作为建立故障预测模型的数据基础。其中, 性能指标如表1所示, 所采集到的设备性能及告警信息的统计结果如表2所示。

从表2的统计分析结果可以看出, 每台设备每天平均报警次数约为4次, 这从侧面说明网络运维人员对设备性能进行实时监控的重要性, 迫切需要通过设备故障预测提前预警, 及时调整作业, 避免设备过载宕机, 保证生产系统稳定运行。

2.4 设备故障预测模型

设备故障预测, 即基于已有的设备运行状态数据, 通过选用合适的数学模型或方法来预测设备未来的运行情况, 从而作出科学的预警判断。因此故障预测流程可以归纳如图1所示。

(1) 数据源

主要包括性能指标和告警信息, 其中性能指标包括采集时刻设备的CPU使用率、内存使用率以及温度等;告警信息可以简单地分为告警和正常, 当然也可以分为不同的告警级别。

(2) 数据采集

数据采集模块将各设备的性能指标和告警信息汇总, 并通过ETL工具存储至Impala数据库。

(3) 特征提取

由于数据采集系统采集到的设备性能指标类型及数量繁多, 但不全都有利于故障预测, 因此在构建预测模型之前需要筛选出有价值的设备性能指标, 即特征提取。比如, 本文预测CMTS设备性能采用的设备性能指标仅为CPU使用率、内存使用率以及温度。

(4) 预测模型

利用提取出的特征构建故障预测模型, 以此预测设备在不同性能指标状态下的告警级别。本文采用决策树的方法构建设备故障预测模型, 接下来将进行详细介绍。

决策树 (Decision Tree) 是一种简单但是有效而且使用广泛的分类器, 利用历史数据构建决策树, 可以高效地对未知的数据进行分类。其优点包括:一方面可读性好, 有助于人工分析;另一方面效率高, 一次构建, 反复使用, 每次预测的最大计算次数不超过树的深度。表3给出了4组设备的CPU和内存使用率及对应的告警信息, 所构建的决策树如图2所示。

从图2的示例中, 可以归纳出决策树构建的基本步骤如下:初始条件下, 将所有记录数据看作一个节点;遍历每一个变量 (如CPU和内存使用率) 的每一种分割方式, 找到最好的分割点;将父节点中包含的记录数据分割成两个节点集合;对第3步中的节点集合分别执行第2、3步, 直到每个节点足够“纯”为止。

其中“纯度”可以用Gini不纯度、熵 (Entropy) 以及错误率来进行量化, 假设记录中共有n个类别, 节点中第i类记录所占的比例为:

p (i) =第i类的数目/总数目

那么三种“不纯度”量化计算方法可以分别表示为:

(1) Gini不纯度

(2) 熵 (Entropy)

(3) 错误率

以上三个公式均是值越大, 表示越“不纯”;值越小, 表示越“纯”。

因此, 确定“纯度”计算方法后, 可以利用分割后子节点与父节点之间的纯度差来选择分割方式, 即最好的分割方式是使得“不纯度”减小速度最快的那一种。本文采用信息熵计算各节点的“不纯度”值, 以此为每一次分割选择最合适的方式, 最终构建决策树, 作为设备故障预测模型。

3 设备故障预测实验结果

实验的性能指标包括CPU使用率、内存使用率、温度、端口信噪比、端口速率等。通过实验发现, CPU使用率、内存使用率以及温度与设备告警之间的关联度较大, 因此, 本文在构建设备故障预测模型过程中主要选择这3个指标生成决策树。具体的可视化效果如图3所示, 测试准确率为71%。

4 结论和展望

本文基于广电有线运营商所采集到的设备性能指标及告警信息, 采用决策树构建设备故障预测模型, 做到设备故障实时预警, 为运维人员争取更多的作业调度时间, 并及时调整设备负载策略, 避免设备宕机, 保证业务不间断地运行。该模型在某地有线运营商提供的真实数据上得到了较好的实验结果, 能够达到71%的准确率, 对设备故障预测具有极大的实用性。

为了进一步提高预测的精度, 本文作者将在后续研究工作中, 一方面通过采集更多的设备性能指标, 提升决策树模型预测结果的准确性;另一方面将试用更多的预测方法, 对比不同方法所构建模型的准确性, 选择最合适的方法, 以满足广电有线运营商对设备故障实时监控的需求。

摘要:针对有线电视网络设备的运维和管理, 基于有线运营商采集到的大体量的设备性能指标及告警信息, 采用决策树构建设备故障预测模型, 从而根据设备当前的性能值, 预测设备故障告警级别。该模型在运营商提供的真实数据上得到了较好的实验结果, 对设备故障预测具有极大的实用性。

关键词:大数据,故障预测模型,决策树

参考文献

[1]蒋永平, 张慎, 赵晓光.智能化分布式机房环境动力监控系统[J].有线电视技术, 2009, 16 (8) :81-82.

[2]Quinlan J R.Induction of decision trees[J].Machine learning, 1986, 1 (1) :81-106.

[3]Sathyadevan S, Nair R R.Comparative analysis of decision tree algorithms:Id3, c4.5 and random forest[M]//Computational Intelligence in Data MiningVolume 1.Springer India, 2015:549-562.

大数据预测论文 篇2

H2O的核心是一个统计分析引擎,它使用Hadoop的分布式文件系统(HDFS)作为其存储平台,但是它们的最终目标是像谷歌的BigQuery一样简单,H2O的用户交互是通过一个简单的网络搜索和标准R统计分析语法,

另外,用户还可以在Microsoft Excel或RStudio的集成开发环境中使用REST API调用H2O。

项目主页:www.open-open.com/lib/view/home/1384846754352

2010年数据中心10大预测 篇3

概述

数据中心内固定(层)应该如何定义应该已经显得不那么重要了。在2010年期间,很显然,许多有效的替代设计可以继续提供可靠的服务,同时还可以降低运营和资本成本。大量更新的(或重新推出)的方法将开始成为主流并占据市场份额。ESG预计在2010年将会有如下趋势:

1随着带有水冷选项的IBM Z11型主机的推出,市场将会开始逐步向液体冷却系统转换。液体冷却在效率上的卓越优势,(比气冷的效率要高4000倍)将会推动最高密度的部署(如高性能计算和主机)率先采用这种散热方式,通用计算也会紧随其后。

2传统的铅酸电池组与UPS(不间断电源)将会让位于实施交流电源保护的飞轮。对于发达国家而言,因为要提高可持续性和效率,这一趋势是不可避免的,尤其是考虑到政府对于重金属妥善处理的监管力度会增强。

3增加的空间将变得没有必要,因为大多数新装置的散热、供电和数据源都是从上面提供的。增加的空间一赢都有问题,特别是在最大静态和滚动负载区域。此外,从地板下面推动冷气一直都是次优化设计。如果从上面提供,电缆和电源都更加易于维护。

4直流电源选项在IT设备上将变得更加普遍,有许多前瞻性思维的数据中心产品(配有AC或DC电源)可供选择。这将利用到直流电源更高的效率和同有的可靠性。

5FCoE驱动的配有智能交换的融合边缘网络将减少人工补丁配置的需求,并且改变数据中心的布局。边缘将设在行内和机柜的顶部。线缆的数量将大幅减少,但连接性的关键性能将会增加。

6服务器、存储和网络虚拟化的水平将会继续提高,从而扫清研发和测试平台遗留的残局,并通过应用和管理程序之间的紧密集成逐步进入关键的生产应用领域。业务灵活性(而不是效率)将会是在关键应用领域发生变化的主要驱动因素,并且克服厌恶风险的信息主管的惰性。

7可靠性将继续向着应用层迁移,从而减少对于数据中心基础设施的依赖。关键的先决条件将会是高性能的网络和重复数据删除技术,它们能够实现站点之间的数据的快速迁移。

8数据中心将转移到不同的地点。由于地点接近公司总部而选择一个数据中心站点将变得不再可行,因为实际占地空间和电力成本将会限制城市中心的数据中心只限于延迟敏感的应用。

9在许多城市的中心区域,热电联产(CHP)电厂将取代备用发电机(引擎),因为全球缺乏对于电力电网的投资,这将继续阻碍对延迟敏感的应用托管的增长。

10对于主机共置数据中心的需求将变得越来越少,并且被作为服务提供的数据中心托管IT所取代,这主要是由于企业迁移到云计算模式所驱动的。

重要事实

对于数据中心的投资是长期的投资,因此,改变似乎需要很长时间才能落到实处。由于需求在持续增加,但因为经济的不景气,业界普遍缺乏对新容量的投资,因此具备正确类型容量的数据中心变得越来越少。随着宏观经济在加速复苏,冗长的数据中心建设和配置所造成的延迟会加剧这种稀缺。

其结果很可能是:

▲在机械和电力层面更积极地采用更加节能的替代技术,拼命想要控制住现有设施的成本。

▲客户日益需要应用和虚拟化之间的紧密整合,以提高敏捷性。

基于大数据的家纺行业发展预测 篇4

随着互联网技术手段的不断发展以及信息技术的广泛普及, 基于信息技术而产生的数据量, 随时间呈现指数增长的态势, 这类“爆炸性”的海量数据被学界称为大数据[1]。大数据的主要5个特点可以用”5V”来表示, 即Volume (数据规模大) 、Variety (数据的种类多样) 、Velocity (高速的数据) 、Veracity (数据的真实性) 以及Value (数据的价值) 。也正式由于大数据具有上述五个特点, 其在家纺行业的分析、预测中具有极大应用前景, 可以有效解决家纺行业定性分析、预测的不准确性挤以及片面性[2]。

本文首先利用大数据平台处理家纺数据, 进而对预测对象的确定和量化, 最后详细介绍时间序列分解方法、回归分析法、BP神经网络方法以及灰色系统方法, 为大数据方法在家纺行业发展预测中的应用提供了一定参考。

二、利用大数据平台处理家纺数据

利用大数据平台处理家纺数据主要分为以下几个步骤[3]:1、搭建Hadoop平台;2、采用HDFS系统分级分层次存储数据;3、利用Map Reduce架构计算相关的“大数据”;4、将有用数据提取出来。其中, HDFS系统存储数据以及数据的提取是主要难题。

HDFS的是Hadoop Distribute File System的缩写。它一种基于Hadoop的分布式文件系统[4]。HDFS主要是通过网络连接的方式, 存储并高速阅读TB级别的文件。HDFS方法对文件的写操作一次性完成, 可以多次读出。其缺点也很明显, 即相关文件一旦“写”好以后就难以修改。一般来说, 家纺行业相关数据存储的“横坐标”通常为时间 (即流行趋势) , 采用Map过程会从HDFS数据中获取研究对象有关数据并进行预处理[5], 然后将其传递给系统预定的reduce函数进行充分的计算以后, 输出与研究对象有关的结果。

三、预测对象的确定和量化

影响家纺流行的因素形形色色、多种多样, 比如家纺的色彩、各地风俗以及款式设计等相关因素以及天气等无关因素。前人的研究[6,7]表明, 色彩是家纺行业流行中最明显的一个因素, 一方面是因为服饰等潮流对家纺行业印象最直接的就是颜色, 另一方面是因为消费者往往第一眼看到的就是颜色。为此, 本文以色彩作为研究因素的代表。

关于家纺的颜色分类, 不同国家、不同研究机构、不同厂家具有不同的分类模式、方法。比如在市场所处的国家方面, 美国、欧洲 (主要是法国和意大利) 、日本以及中国每年的流行颜色具有一定的差异, 甚至同一国家不同地区在每年的流行色方面都具有一定的差异。比如基于CNCS色彩体系的流行色趋势数据 (中国发布) 、基于PANTONE色彩体系的流行色趋势数据 (美国发布) 等等[8]。

为了更加全面、快速、有效的借助大数据方法定量分析家纺行业色彩趋势, 具体颜色分类以及数据的选择应该根据研究的范围来确定。比如, 研究国内的家纺行业色彩趋势, 就应采用由中国发布的家纺流行颜色相关数据。

四、家纺流行趋势预测模型

家纺流行趋势预测模型的选择和构建, 是借助大数据方法定量分析家纺行业色彩趋势方法中的核心问题。预测模型是否准确、合理, 直接关系到能否从海量数据中找到与研究问题有关的数据信息。目前可以借鉴的方法主要有以下四种:时间序列分解方法、回归分析法、BP神经网络方法以及灰色系统方法。本节将重点阐述四种方法的基本原理和优缺点。

4.1时间序列分解方法

基于时间序列分解法的预测模型, 主要是将可能的影响因素根据作用时间的长短关系分成四大类:短期因素、长期因素, 周期因素以及随机因素。由于各因素之间的相互关系、相互作用复杂, 于是该方法不考虑各个因素之间影响, 重点研究每个因素和时间之间的单一作用关系[9]。

4.2回归分析法

回归分析方法, 主要对收集到的数据采用数学统计的方法建立不同变量之间的相互影响关系, 进而完成有关预测的[10]。常用的数学回归模型很多, 比如直线方程、指数方程等。但是, 回归分析方法存在一个严重的弊端, 就是需要提供的各因素的数据都是“有效数据”, 而实际有关家纺色彩的海量数据绝大部分都是无效数据, 即该方法的鲁棒性差[11]。

4.3 BP神经网络方法

BP (Back Propagation) 神经网络法中的BP是“Back Propagation”的简称。BP神经网络法, 与回归分析方法截然想法, 它可以在不确定各因素之间的相互作用关系的前提下, 可以模拟人脑的思维, 通过“学习”的方式获得输入量与输出量之间的逻辑关系[12]。BP神经网络的判断方式是使网络的误差平方和最小来确定最有可能的相互作用关系。一般来说, 一个完整的BP体系应该包括以下三个层次:输入层、隐含层以及输出层。BP方法有较高的容错能力, 在部分“神经元”出现错误或者部分信息缺失时, 仍然能进行学习, 推断未来的趋势并进行判断。但BP法也存在部分不足, 主要表现为:1、计算时可能陷入局部最小化而无法寻找到全局最优解;2、BP网络结构的选择不同导致预测结果出现一定的差异;3、BP方法仍然存在一定程度的样本依赖问题。

4.4灰色系统方法

灰色预测法是用灰色系统模型对未知系统进行的定量预测。运用灰色预测法, 首先要对比各影响因素之间变化发展的差异性, 然后对原始数据进行处理来发现变化规律, 重新排列生成有新的数据序列, 随后建立相应的微分方程模型, 最终达到预测某研究因素随时间的变化规律。与BP神经网络方法不同的是, 灰色系统模型对收集到的数据的数量以及数据关系木有特殊要求。

五、结论

大问题的预测 篇5

1、阐述中国共产党对资产阶级的认识和采取的政策。

【答案要点】

(1)中国资产阶级两部分的区分:一部分是大资产阶级(买办资产阶级、官僚资产阶级),是中国革命的对象;另一部分是民族资产阶级(中产阶级),是革命的动力之一。

(2)民族资产阶级两面性的阶级特点:一方面,它受到帝国主义和封建主义的压迫与排挤,具有反帝反封的革命要求;另一方面,它又与帝国主义、封建主义有着千丝万缕的联系。因而缺乏彻底的反帝反封的勇气,在斗争中往往表现为软弱和妥协。毛泽东说,“这是从娘肚子里带出来的老毛病”。这一阶级特点决定了它可以参加资产阶级民主革命,但不能领导革命到胜利。

(3)无产阶级领导的民族民主革命统一战线,必须争取民族资产阶级参加,在特殊的历史条件下,也可把一部分大资产阶级包括在内,以求最大限度地孤立最主要的敌人;无产阶级在同资产阶级联合时,必须保持自己的独立性,掌握统一战线的领导权,并实行又联合又斗争的政策,以克服民族资产阶级的妥协性及大资产阶级的反动性。

(4)在对待资产阶级的问题上,既要反对“一切联合,否认斗争”的右倾错误,又要反对“一切斗争,否认联合”的左倾错误。

2、简述中国共产党成立后,中国革命呈现了哪些新面貌以及何以出现这些新面貌。

【答案要点】

中国共产党一经成立,中国革命就展现了新的面貌:第一、第一次提出了反帝反封建的民主革命纲领,为中国人民指出了明确的斗争目标。第二、发动工农群众开展革命斗争,在中国掀起了第一次工人运动高潮,同时,中国共产党也开始从事发动农民的工作,农民的运动蓬勃发展。第三、实行国共合作,并在合作中发挥主导作用,掀起大革命高潮,进行了北洋战争。

中国革命之所以呈现了这些新面貌,是因为中国共产党是中国社会中最先进、最有政治远见的马克思列宁主义政党,它代表了中国社会的发展方向,代表了中华民族的根本利益,只有它才能成为中国革命的真正领导者。正如毛泽东所说,由于无产阶级及其政党的领导,“根本地改变了革命的面貌,引起了阶级关系的新调度,农民革命的大发动,反对帝国主义和封建主义的革命彻底性,由民主革命转变到社会主义革命的可能性,等等。所有这些,都是在资产阶级领导革命时期不可能出现的。

3、分析当前综合国力竞争的特点以及在未来的国际竞争中中国如何提高综合国力的问题。

【答案要点】

(1)当今世界综合国力的竞争在具体形态上表现为经济和军事实力的竞争,二经济和军事实力的竞争实际上是科学技术的竞争,科技的竞争实际上是科学技术的竞争,科技的竞争有趣觉有人才和教育的竞争。世界各个国家纷纷制定以开发高技术和发展高技术产业为中心的国家发展战略,以抢占科技制高点和世界高技术产品市场,提高和加强自己的实力地位。(2)一是实现全面、协调、可持续发的科学发展观。二是走中国特色自主创新道路,切实把科学技术放在优先发展的战略地位,坚持自主创新、重点跨越、支撑发展、引领未来的方针,把增强自主创新能力作为战略基点。三是把科技进步与国家发展战略、经济社会发展目标、人民日益增长的物质文化需要紧密结合起来,加快经济发展方式。四是实施人才强国、科教兴国战略,使我国实现人才大国向人才强国转变。

4、什么是民族精神和时代精神以及新的历史条件下,形成的时代精神的表现。时代精神与民族精神之间的关系。【答案要点】

(1)民族精神,是指一个民族在长期共同生活和社会实践中形成的,为本民族大多数成员所认同的价值取向、思维方式、道德规范、精神气质的总和,是一个民族赖以生存和发展的精神支柱。在五千多年的发展中,中华民族形成了以爱国主义为核心的团结统一、爱好和平、勤劳勇敢、自强不息的伟大民族精神。

(2)时代精神,是在新的历史条件下形成和发展的,体现民族特质、顺应时代潮流的思想观念、行为方式、价值取向、精神风貌和社会风尚的总和。新的历史条件下,形成了以改革创新为核心的,解放思想、实事求是,与时俱进、勇于创新,知难而进、一往无前,艰苦奋斗、务求实效,淡泊名利、无私奉献的时代精神。

(3)时代精神与民族精神的关系:时代精神与民族精神紧密相连,时代精神是民族精神的时代性体现,民族精神是时代精神形成的重要基础和依托,两者的有机统一,构成了社会主义核心价值体系的重要内容。

5、分析当前这场中东动荡局势的特点及其原因。中国应对中东局势的态度。

【答案要点】

(1)当前这场中东巨变,具有突发性、传导性、寻觅性、持续性、内生性、草根性、革命性特点。

(2)中东局势长期动荡不稳定的主要原因是:首先,这些国家普遍比较贫穷,经济形势严峻,经济增长缓慢,失业率和通胀率都比较高。其次,这些国家的政治普遍缺乏民主,统治者独裁,政府腐败。在经过长期与政治自由和民主无缘之后,民众普遍希望政治上的改革。其三,以美国为首的西方国家推波助澜,输出西方价值观,推行西方民主,支持中东国家民主改革。其四,世界金融危机的影响。

(3)其一,注重经济体制改革,以改善民生为重点。其二,加强政治体制改革,推进民主体制建设和反腐败力度。其

三、坚持和平共处五项原则其

四、积极主张建立国际经济和政治新秩序。

6、分析欧美债务危机和新贸易保护主义的危害以及中国政府的对策。

【答案要点】

(1)欧美债务危机是2008年以来次贷危机的延续,是“风险性危机“,市场对欧美债务上升是有预期的。欧美主权债务风险增大,会引起国际金融市场急剧动荡,给世界经济复苏造成巨大亚力。欧债危机发酵造成的不确定性极大地打击了市场信心,也会进一步传到实体经济当中。

(2)新贸易保护主义的实质是,西方大国按照本国的经济社会特征,运用贸易保护主义,强化其再国家经济体系中的规则,以维持其再国际经济竞争中的支配地位和主导地位。违背了贸易原则,无益于全球经济一体化的发展。(3)中国政府的举措

国内举措:第一,加快增长方式转变,加快产业升级。第二,加强宏观调控。继续实行积极的财政政策和稳健的货币政策,保持宏观经济政策的连续性、稳定性。第三,促进外汇储备多元化的实现。

对外态度:第一,国际社会要进一步增强信心,加强合作,共同应对挑战第二。耍加强宏观经济政策沟通协调,加快建立公正、合理、健康、稳定的世界经济新秩序。第三,各国政府要真正承担起责任,把自己的事情做好。第四,主要发达经济体要采取负责任、起作用的财政、货币政策,妥善处理债务问题,保持市场投资安全和稳定运行。第五,维护全球投资者信心。

7、分析诸葛亮联吴抗曹体现的哲学原理,指出他为刘备所规划的先取荆州、再图益州,最后中兴汉室的战略规划的合理性。【答案要点】

(1)诸葛亮主张联孙抗曹的战略蕴涵着主、次矛盾的原理。在一个复杂的系统中,矛盾有主次之分。由于主要矛盾起决定作用,故而解决矛盾时必须把解决主要矛盾作为中心任务。鉴于曹魏是最强大的集团,同时它要消灭刘氏,故而与曹魏的矛盾是主要矛盾,与孙权的矛盾是次要矛盾。正因为如此,诸葛亮力主联孙抗曹。然而在解决主要矛盾的同时,还应当注意解决次要矛盾。次要矛盾解决的好,有利于主要矛盾的解决;解决的不好,不利于主要矛盾的解决。

(2)诸葛亮所说的“三步走”蕴涵着事物的发展是间断性与连续性相统一的哲理,同时也蕴涵着总的量变中渗透着部分质变的原理。这里体现的部分质变,是阶段性部分质变。事物的发展表现为过程,过程通常是由若干个阶段构成的。过程的结果是根本质变,过程中由一个阶段转入下一个阶段则是部分质变。质变不是独立发生的,必须循序渐进,不可急于求成。

8、分析如何把握先进文化的前进方向,建设中国特色社会主义的文化的问题。

【答案要点】

中国特色社会主义文化,全面继承了新民主主义的文化纲领,又具有新的时代特色。即以马克思主义为指导,以培育“四有公民”为目标,发展“三个面向”的,民族的、科学的、大众的社会主义文化,是中国特色社会主义的经济和政治的观念形态的反映。

(1)牢牢把握先进文化的前进方向,是“三个代表”重要思想的基本要求之一。因为先进文化是我们党思想上精神上的一面旗帜,是社会主义国家的精神支柱和核心凝聚力。先进文化和先进生产力、先进的生产关系紧密相连,代表最广大人民群众的根本利益,在当代中国,它就是中国特色社会主义的文化。

(2)建设中国特色社会主义文化要做到:第一,最根本的是坚持先进世界观的指导作用,即坚持马克思主义为指导,用毛泽东思想和和中特理论体系重要思想统领社会主义文化建设; 第二,加强社会主义思想道德建设,这是先进文化的重要内容和中心环节,集中体现社会主义精神文明的性质和方向;第三,加强社会主义教育科学文化建设,这是物质文明、政治文明和思想道德建设的重要条件,是提高整个民族科学文化素质的根本途径;第四,弘扬以爱国主义为核心的民族精神和以改革创新为核心的时代精神,形成中国特色社会主义的共同理想和精神支柱,推动社会主义文化创新;第五,大力弘扬先进文化,积极支持健康有益文化,坚决抵制消极腐朽文化,引导和改造落后文化,建设立足于中国现实,继承民族文化优秀传统,吸取外国文化有益成果的社会主义精神文明。第六,确立马克思主义为指导、中国特色社会主义共同理想为灵魂、以民族精神和以改革创新精神为核心和社会主义荣辱观为基础的社会主义核心价值体系。

9、.阅读材料分析问题:

同样是水壶,普通人“烧”出的是开水,而瓦特却“烧”出了蒸汽机;同样是手被草叶子拉破了,普通人只会埋怨草的无情和自己的粗心,而鲁班却想到了发明锯;同样是看到苹果从树上落下来,果农见了只感到心疼,而牛顿却由此发现了万有引力定律。

请分析造成上述差别的原因及对人们的启发。【答案要点】

(1)造成这种差别的根本原因在于,大多数人对事物的认识停留在感性阶段,只认识了事物的现象,而科学家则没有仅仅停留在感性认识阶段,他们经过深入思考,透过现象认识了本质,也使感性认识上升到了理性认识。理性认识更深刻、更完整地反映了客观对象。(2)启发之一:“机遇偏爱有准备的头脑”。在观察事物的现象的时候,要自觉地运用以往形成的知识基础和认识方法,展开深入的理性思考,这样才能发现问题的本质,实现创新。同时也反映了必然和偶然的辩证关系,有些机遇表面上看是偶然的,但只有平时付出了艰苦的努力,作了充分的准备,才会真正把握住机遇,使偶然转化为必然。(3)启发之二:“比别人多想一步”。第一,在实践活动中,深入实际、细心观察,搞好调查研究,掌握丰富的反映客观实际的感性材料;第二,要善于对感性材料进行辩证思维的加工,运用理智、逻辑和各种科学思维方法,去粗取精、去伪存真、由此及彼、由表及里,透过现象认识本质和规律,形成创新性思维。

10、中国为什么要坚持做和平发展道路?

【答案要点】

(1)第一,走和平发展道路,是由中国的国情和自身发展需要决定的。第二,走和平发展道,是由中国历史文化传统所决定的。第三,走和平发展道路,也是由当今世界发展潮流所决定的。

(2)加强合作是中国发展的鲜明特征。第一,实现共赢是中国发展的必然结果。中国的发展不以牺牲别的国家利益为代价,而是坚持容各方利益的汇合点,实现互利共赢为目的。第二,中国的发展成为推动世界发展的强大动力。无论国际风云如何变幻,中国与国际社会合作的立场都不会变。这是由我们共同的历史遭遇,共同的发展任务,共同的战略利益决定的。(3)走和平发展道路的战略思想,是与建国以来我国的外交思想和方针一脉相承的,具有重要的现实针对性和创新意义。第一,它进一步丰富和发展了中国特色社会主义的外交和国际战略理论。这些论述和主张,对我国当前和今后一段时期对外交往和参与国际事务具有重大的指导作用,创造性地拓展了我国外交和国际战略的思想。第二,它反映了人类追求文明进步的一条崭新道路。中国提出走和平发展道路,表明中国顺应时代发展的新趋势,不走谋求世界霸权、侵略他国的道路,而是抓住世界和平与发展的机遇,争取和平的国际环境发展自己,又以自己的发展促进世界的和平,从而走出一条实现民族复兴的新路。

11、龚全珍老人的动人事迹说明了什么?

2013年9月26日,习近平在北京会见第四届全国道德模范及提名奖获得者,见到出席会议的年逾90的龚全珍老人,习近平饱含深情地说,我向大家介绍全国道德模范龚全珍同志,她是老将军甘祖昌同志的夫人。甘祖昌同志是江西老红军、新中国的开国将军,但他坚持回农村当农民,龚全珍同志也随甘祖昌同志一起回到农村艰苦奋斗。半个多世纪过去了,龚全珍同志始终保持艰苦奋斗精神,并当选了全国道德模范,出席我们今天的会议,我感到很欣慰。我向龚全珍同志致以崇高的敬意。我们要把艰苦奋斗精神一代一代传承下去。

【答案要点】

(1)龚全珍老人被评为第四届全国道德模范,显示了革命传统、革命精神、道德楷模在老人身上的完美统一,她1949年加入中国共产党。1957年跟随丈夫回到了江西莲花县老家,扎根山区当“农民”,此后一直无怨无悔在江西莲花山乡,投身教育,爱心奉献。她的行动成为鼓励全社会积善成德、明德惟馨,弘扬真善美,传播正能量,激励人民群众崇德向善、见贤思齐的标杆和楷模。

(2)道德模范是社会道德建设的重要旗帜,必须切实加强道德建设,推进社会公德、职业道德、家庭美德、个人品德教育,倡导爱国、敬业、诚信、友善等基本道德规范,培育知荣辱、讲正气、作奉献、促和谐的良好风尚。

(3)道德模范是有形的正能量,是鲜活的价值观,广泛开展向道德模范学习活动,引导人们从身边做起,从基本道德规范做起,把良好道德行为落实到日常生活和工作之中,要把道德建设融入改革发展各方面,融入国民教育和精神文明建设全过程,为实现中华民族伟大复兴的中国梦凝聚起强大的精神力量和有力的道德支撑。

12、如何正确评价改革开放前后的两个30年?

【答案要点】

中华人民共和国成立,开辟了中国历史的新纪元。这个新生的人民政权,到目前为止,大致可分为前30年和后30年两个时期。前30年(1949-1978)是社会主义革命和建设时期,后30年是社会主义改革开放新时期。当前社会上出现一些错误观点,全面看高后30年而贬低甚至否定前30年,也有人用前30年好的一面来否定后30年。习近平的讲话,要求人们正确对待这两个30年。

(1)前30年虽有重大挫折,但仍取得了重大成绩。新中国成立以来取得的巨大成绩,有目共睹。仅用三年时间,就医治了战争创伤,恢复了国民经济。仅用四年时间,完成了三大改造,引导全国人民走上社会主义道路。在一穷二白的基础上建立了独立的、完备的工业体系和国民经济体系。基础设施建设和各项社会事业都取得重大成绩。以两弹一星为代表的尖端科技取得重大突破。特别是外交事业成就显著,以1971年恢复中国在联合国的地位为标志,国际上的地位空前提高。这一切就为后来的改革开放打下了基础,创造了良好的国际环境。所以,贬低甚至全盘否定前30年的历史,是极其错误的观点。

(2)后30年改革开放成绩举世瞩目。1978年12月,中共十一届三中全会召开,使我国进入全面改革开放的历史新时期。从那时起,党领导全国各族人民以一往无前的进取精神和波澜壮阔的创新实践,谱写了中华民族自强不息、顽强奋进的壮丽新诗篇,中国特色社会主义现代化建设取得了令世人瞩目的巨大成功。成功完善了前30年发展中阻碍经济发展的各种体制,综合国力快速上升、经济总量上升为世界第二、人民生活显著改善,各项事业都取得重大成就。这些都为我们国家实现今后的发展目标,奠定了雄厚基础。因此,否定后30年的改革开放,也显然是苍白无力的。

新中国的两个30年是探索、铺垫与继承、发展的关系,都是中国特色社会主义的一部分,各自呈现不同的特点。两个30年互为因果,缺一不可,都值得称颂,引为自豪。

13、十八届三中全会的基本点有哪一些?

【答案要点】

关于改革的前提——必须立足于我国长期处于社会主义初级阶段这个最大实际;必须坚持和完善中国特色社会主义基本经济制度。必须深化认识——“实践发展永无止境,解放思想永无止境,改革开放永无止境”。

关于改革的核心——处理好政府和市场的关系,使市场在资源配置中起决定性作用和更好发挥政府作用。做到政府不直接开车,而是当好市场的路灯和信号灯。

关于改革的任务——强化权力监督体系,构建开放型经济新体制;加强社会主义民主政治制度和法治建设;强化权力运行制约和监督体系。

关于改革的目标——改革的总目标:完善和发展中国特色社会主义制度,推进国家治理体系和治理能力现代化。改革的阶段性目标:到2020年,在重要领域和关键环节改革上取得决定性成果,形成系统完备、科学规范、运行有效的制度体系,使各方面制度更加成熟更加定型。

关于改革的根本目的——推进发展中国特色社会主义事业的发展,进一步解放思想,进一步解放和发展社会生产力、进一步解放和增强社会活力。关于改革的思路——坚决破除各方面体制机制弊端,敢于啃硬骨头,敢于涉险滩,敢于向顽瘴痼疾开刀。

关于改革的步骤——改革只有进行时,没有完成时。条件成熟的改革要尽快推出,做到改革不停顿、开放不止步。

关于改革的要求——注意改革的全面性、完整性和协同性,加快发展社会主义市场经济、民主政治、先进文化、和谐社会、生态文明,让一切劳动、知识、技术、管理、资本的活力竞相迸发,让一切创造社会财富的源泉充分涌流,使发展的成果更多、更公平地惠及全体人民。

关于改革的路径——“摸石头过河”和“顶层设计”相结合。为什么强调“顶层设计”还要摸着石头过河?改革已经进入了深水区,“水深”难以摸到“石头”,需要高瞻远瞩、高屋建瓴,为改革“造船”、“建桥”,实现“划着船过河”“跨着桥过河”。但改革允许探索,在实践中积累经验,顶层设计没有这个实践的结合,它只能是一个空中楼阁,顶层设计结合于摸着石头过河,就有了实践的基础。

大数据预测论文 篇6

在总人口为13亿多的中国人中,中国高血压人口有1.6~1.7亿人,高血脂的有将1亿多人,糖尿病患者达到9240万人,超重或者肥胖症7000万~2亿人,血脂异常的1.6亿人,脂肪肝患者约1.2亿人。有研究数据显示:平均每30秒就有一个人罹患癌症,平均每30秒就有一个人罹患糖尿病,平均每30秒,至少有一个人死于心脑血管疾病。

中国医疗大数据现状:压在百姓身上的3座健康大山

第一座健康大山

——跑步进入老龄化社会

之所以会出现上述触目惊心的数据结果,根据德勤最新发布的《2020年健康医疗预测报告》,中国的老龄化趋势严重。

到2012年止,世界经济合作与发展组织国家(Organization for Economic Co-operation and Development,OECD)人均寿命预期为80岁,相比1990年呈现大幅老龄化现象。

其中日本最为严重,平均寿命预期为84岁,英国为81岁,美国79岁,中国75岁,而印度为66岁。

预计到2018年,超过65岁人群数量会达到5.8亿,占全球人口10%,也就是说,其中每10个日本人中就有一位超过65岁的老年人。到2020年,我国正式进入老龄化严重阶段!

在发达国家,发达国家进入老龄化时,人均GDP在5000~8000美元,2014年健康医疗支出占总支出77%。

相比在中国,从2003年开始我国未富先老,人均GDP为1000美元。2014年的健康医疗支出占总支出23%,预计到2020年,健康医疗支出占总支出上升到32%。

全世界痴呆病人已达2400多万,平均每7秒增加一个,中国老年痴呆患者约占全世界病例总数的1/4,平均每年增加30万的新发老年痴呆病例。

骨质疏松症已跃居常见多发病的第七位,60岁以上的人群患病率为56%,女性发病率为60~70%。其中骨折率发生率接近1/3,每年医疗费用按最保守的估计需要人民币150亿。

第二座健康大山

——癌症年轻化

根据统计数据:2005~2015年间中国因疾病而导致生产力丧失将累计给中国造成5500亿美元的经济损失,其中中国一年用于心脑血管疾病的治疗经费达到3000亿人民币元人民币;中国的肝炎的直接经济损失达3600亿。2013年到2014年,35~46岁死于心脑血管病的人,中国是22%,美国是12%。

目前我国主流城市的白领亚健康比例高达76%,处于过劳状态的白领接近六成,真正意义上的健康人比例不足3%。白领女性更容易受到妇科、心脑血管疾病的威胁,男性则面临猝死、过劳、癌症等问题!

根据不完全统计,中国平均每个月都有报道较为年轻的企业高管、影视明星患有癌症或者离世,最高个人资产可达14个亿,包括百视通COO吴征、德尔惠股份创始人兼原董事长丁明亮、兴民钢圈董事长王嘉民、成都百事通总经理李学军等12位高管,均因疾病离世,比例高达63%,其病因主要是癌症和心脏病,其中,像吴征、李学军等近半数为突发疾病逝世。

2013年,慢性病患病率已达20%,死亡数已占总死亡数的83%。过去十年,平均每年新增慢性病例接近了2倍。心脏病和恶性肿瘤病例增加了近1倍!

美国《保健事物》杂志报告,中国人的腰围增长速度将成为世界之最。肥胖人口将达到3.25亿,未来20年将会增长一倍,腰围只要增长一英寸(2.54厘米),血管就会增长4英里,患癌风险高8倍!

在中国人群中,糖尿病或许成为最为常见的慢性病,全球糖尿病患者将达到3.82亿,而每四个人中有一个是中国人。总患病人数将比德国和葡萄牙人群总数之和还要多。

从2014到18年,全球药品支出将以每年6.9%增长,从2014年的1.23万亿美元到18年的1.61万亿美元。其中肿瘤疾病花费最高。

医疗支出上,基因工程将占有最大比例,从26.1亿美元(2012年)上升到42.1亿美元(2017年),涨幅36%。

第三座健康大山

——新生儿生命 "先天缺陷"

每年的9月12日是我国“预防出生缺陷日”,2009年监测显示,每隔30秒就有一个缺陷儿出生,相当于每小时30个,每天720个!

导致出生缺陷的因素非常多,最常见的就是遗传有关,此外还有环境因素和感染因素。一些问题我们可以通过预防来解决,比如积极治疗基础病、避开危险环境、避免滥用药物和防止病毒感染等。但是还有些问题我们是很难阻断和改变的,例如遗传因素,我们只能做到尽早发现异常、尽早采取措施,因此必须采取规范的产前检查。

遗传代谢病很多人觉得陌生它是导致儿童夭折或残疾的主要病因之一。我国婴儿患病病例较高,每年约2000万的出生人口中,有40万到50万名儿童患有遗传代谢病。可怕的是,患儿在新生儿时期常没有特别的临床表现,一旦出现异常,孩子已经造成智力和身体的终生残疾。一般地,每当一个普通家庭出现了患有“先天缺陷”的新生儿,这个家庭将永远被压在健康大山之下,难有出头之日。

除此之外,2013—2014年度,北京中小学肥胖检出率为19.5%,其中10%出现脂肪肝,而全国肥胖儿中脂肪肝发生率40~50%。Ⅱ型糖尿病发病率20年间增长了11~33倍。

教育部《2013年全国学生体质健康监测报告》显示近年来小学生近视率32.5%;初中生59.4%;高中生77.3%;大学生80%;沿海城市高中毕业生视力低下率85%,高度近视率呈急剧上升趋势。

面对严峻的健康挑战怎样推翻压在身体上的“三座大山”?

nlc202309012129

2014-2018的年平均医疗支出预计将从西欧国家的2.4%增长到北美的4.9%;从亚洲和澳大利亚的8.1%到中东和非洲的8.7%;全球医药支出总额预计将从2014年的1.23万亿美元以每年6.9%的速度增长到2018年的1.61万亿美元,而肿瘤将成这个领域的主要贡献者;仿制药将占取全球药品消费市场更大的份额,从2012年的27%(2610亿美元)增长到2017年的36%(4210亿美元);内服药领域销售预计将从2013年的3638亿美元增长到2020年的5135亿美元,体外诊断将达最高;2013年,纵观七国(G7)市场,几乎每个工作日都有226个伴随诊断协议交易,而2009年每天仅有8个交易。

在中国,每年卫生资源消耗6100多亿元,因疾病、伤残造成的损失约7800多亿元。总计一万四千多亿元。这是个惊人的数字,因为“三峡工程”十五年的总投资才是2000亿。

面对越来越称重的“三座健康大山”,我们应该尽早改变意识,未雨绸缪,认识到“预防大于治疗”才是健康的真谛。

在此,德勤咨询也预测了2020年医疗服务可能发生的变革。

1.实现患者、医疗机构、企业之

间的互动

医疗机构与患者通过社交媒体接触,根据预算和医疗要求定期评估需求和向他们推荐合适的产品与服务;在线病人社区呈指数级增长,并且成为众包数据的丰富来源,也成为药物和医疗保健的评级系统;通过分析社区病人的聊天信息,提供一个更好的治疗方案,允许实时截取药品信息和服务。提供疾病早期警报,如流感;企业和政府部门与社区的病人、医院和纳税人一起找出最佳实践和具有高效益的治疗方法;新的供应商和行业模式,包括互助组织和其他形式的协作与合作方式,帮助降低成本,改善护理。

2.建立医疗新观念

消费者学会主动,对健康更加关注,更加坚定良好行为如锻炼,从降低支付到减少税收(例如,不吸烟);

数据的隐私和安全仍然令人担忧,但有一个好处就是数据共享了;

纳税人和提供者能接受复杂的患者,找寻通向治疗新途径的分析方法和项目;

医生们从不愿意参与电子健康信息到积极参与并发展和改善技术;

在发达国家,大多数病人已经有了自己的电子健康记录,并分享在社交网站。

3.新的商业模式和概念

在未来,新的商业模式和概念会大面积在移动健康领域爆发,病了都有APP。举个例子:玛丽知道她有患乳腺癌的风险,在她母亲死于这种病后,基因测试显示她携带相同基因。然而,更令她担心的是最近飙升的体重意味着她的糖尿病越来越难控制,并附带增加乳腺癌的风险。这一切都始于她不得不放弃工作来照顾重病的母亲,于是“吃”成了她主要的安慰方式。她手机APP上的数据暗示她的健康恶化,包括记录健康的家庭秤。更重要的是,她的糖尿病护理专家已经在三个月里每两周来检查她的身体。

她也知道她没办法既控制体重又能降低血糖水平。如果她没有让她的BMI指数降到一个可接受的水平,她希望在线支持组织和APP“Be the Local Loser”能帮助她减肥和降低风险。

4.健康数据化,市场对相关器具

和计算模型需求增加

根据《2020年健康医疗预测报告》,初级保健医生如何充分利用新技术的在线互动课程推出,他们中许多人往往比医生更了解;且医学模型逐渐向“4P”医学(预测性、预防性、个体化、参与性)迈进。到时候会有针对“P4-Medicine”医药新规范出台,以及将会出现一些类似于PatientPeoplePower.com的新兴互动平台,在病人中宣传运动具有极高的影响力。

5.相关监管会更为完善

从2014年开始,病人越来越像消费者,然而就目前来说,虽然大多数行业已经接受了“客户第一”的意识,但医疗行业还远远落后。才意识到医疗服务提供者今天遇到的挑战是,他们仍停留在把顾客放在做事上,而要从根本上改变家长式的管理方法,重塑患者、供应商和纳税人之间的关系。因此,伴随着人民对健康要求的越来越高,相关监管会更为完善,特别是针对新的技术和研究成果。

就像2014年10月,沃尔玛开了一系列诊所,在那儿人们有没有买保险也有一个高效率的医疗治疗,而且在那有大量员工,不用担心拥堵,并推出了在诊所看病仅需40美元的诊治服务(是目前行业标准的一半左右),且沃尔玛美国雇员和家属看病只需要4美元,怀孕检验只需3美元,胆固醇检验仅需8美元。

6.新进入者们正在改变医疗健康

例如,美国零售商店为响应消费者的需求开始提供初级医疗服务。提供廉价、快速、方便的医疗,一周七天,每晚都可(找一个初级保健医生成了一个挑战),服务包括接种疫苗、筛查和慢性病的管理,大多数零售诊所同意承保和以现金支付。逐渐地,诊所有了合作关系,当地的医疗保健系统使他们能够共享数据和访问病人的电子健康记录。消费者不需要预约,直接输入在数字屏幕上输入信息,就能在几分钟内接受治疗。

来源:生物探索

大数据预测论文 篇7

成思危表示,做好预测科学要看到大数据潮流的到来,海量数据,形态多样,获取速度要求越来越高,提取有价值的信息越来越难是当今数据的主要特点,也是预测科学中心遇到的问题。“通过改进我们的方法,通过大数据,技术、理论、方法,改进预测方法,可以使我们的预测更加准确一些。”

他对预测工作发表了三点看法,第一预测是一门科学,应该进一步去发展科学,从理论和方法上,以及从实用的角度上去发展它,让它既有学术性,创新性也有实用性。第二,要看到大数据的出现,它的理论方法要掌握,要运用大数据的技术,来进一步改进预测。第三,希望预测工作要从短期的预测发展到中长期的预测,为国家长远的经济决策起到更重要的支持作用。

大数据预测论文 篇8

多媒体技术、智能存储技术、光纤通信技术、4G移动通信网络的快速发展, 自动化办公系统已经在各个领域得到了广泛普及和应用, 取得了显著的成效, 积累了海量的数据, 促进人们逐渐买入大数据时代[1]。互联网作为承载数据应用的关键通道, 网络通信节点数以亿计, 并且每年都呈现数千万增加的速度, 因此网络通信接入系统和设备具备复杂多样性, 网络规模和结构也更加复杂, 如果一台或多台设备感染木马、病毒等潜在威胁, 将会在很短的时间扩散到其他终端或服务器, 感染数据信息, 导致网络面临瘫痪状态[2]。因此为了能够提高网络安全防御能力, 可以采用网络安全态势预测技术, 根据历史或当前网络流量预测网络安全发展态势, 能够进一步提高网络安全防御能力。

2 大数据时代网络安全态势预测作用

大数据时代互联网具有重要的作用, 其能够通过各类光纤、无线网络接入各类型的终端、服务器设备, 并且为信息化系统应用提供数据传输、共享的作用, 但是经过多年的发展, 网络面临的黑客攻击强度和手段越来越强, 导致网络面临着严重的病毒和木马威胁。网络威胁是动态的和具有不固定性的, 因此网络安全防御需要采用动态预测措施, 以便能够根据当前网络走势判断未来网络安全情况[3]。网络安全态势预测是指可以通过观测数据的统计分析结果, 预测网络安全态势未来的走势, 为用户提供安全反馈结果, 以便网络管理员做出正确的决策。目前, 网络安全态势预测处于安全防御系统的最高层, 其采用先进的预测分析技术, 能够长期的统计网络中不确定信息, 为态势发展提供科学规律, 建立态势预测的长效机制, 并且可以构建完善的网络安全态势预测趋势图, 进一步提高安全态势预测的可用性[4]。

3 大数据时代网络安全态势预测关键技术分析

目前, 网络安全态势预测技术已经得到了广泛的研究, 已经诞生了许多的态势预测技术, 关键技术包括自回归移动平均模型、灰色预测模型和神经网络预测模型[5]。

3.1 自回归移动平均模型

自回归移动平均模型是一种非常常用的随机序列模型, 自回归移动平均模型的建模过程分为序列检验、序列处理、模型识别、参数估计和模型检验等五个关键的步骤, 其主要目的是为了能够识别序列中蕴含的自相关性或依赖关系, 使用数学模型能够详细地刻画序列发展的延续性。自回归移动平均模型执行过程中, 序列检验主要用来检测数据的随机性和平稳性;序列处理可以将序列进行平稳化处理, 通常采用的方法包括周期差分法、差分运算法和函数变换方法;参数估计常用的方法包括极大似然估计、矩估计、最小二乘估计;模型检验可以检测参数是否属于白噪声序列, 如果是则表示检验通过。自回归移动平均模型在应用过程中, 其要求网络安全态势序列或者某一级差分需要满足平稳性假设, 这个前提条件限制的非常苛刻, 因此极大的限制了自回归移动平均模型使用范围。

3.2 灰色预测模型

网络安全态势预测过程中, 为了能够弱化原始序列的随机性, 通常人们会采取累减或累加等方法求解生成序列, 如果处理的次数足够多, 一般可以认为已经弱化为非随机序列, 大多可以使用指数曲线进行逼近, 这也正是灰色预测的核心思想。灰色预测过程如下所述:GM (1, 1) 表示一种常用的灰色安全态势预测模型, 建模过程如下所述:使用分别表示网络安全态势的原始序列和生成序列, GM (1, 1) 关联的微分方程如公式 (1) 所示,

其中, a表示网络安全态势序列发展灰数, μ表示灰作用量。求解公式 (1) 可以得知相关的网络安全态势预测模型, 具体如公式 (2) 所示。

求解出网络攻击态势预测结果之后, 根据生成方法进行反向还原, 即可求解得出具体的预测序列。灰色预测模型可以有效地反应网络安全态势中的低频缓变趋势, 但是这种预测方法无法很好地体现突发性较强的高频骤变趋势, 难以应对网络安全态势预测过程中的具有周期性波动的网络态势, 因此导致这种趋势的误差非常大。

3.3 神经网络预测模型

神经网络是一种有效的网络安全态势预测算法, 其可以采用学习算法学习正常的网络数据行为, 能够提取相关的正常行为特征, 将其保存在网络中, 以便能够进行识别不一样的行为。神经网络可以对训练数据进行自组织、自适应的学习, 具有学习最具典型的攻击行为特征样本和区分正常数据的能力, 以便能够得到正常的事件行为模式。训练之后, 神经网络可以用来识别待检测的网络事件行为特征, 能够鉴别行为特征的变化, 检测判断出潜在的异常行为。因此, 神经网络具备的分布式存储、并行处理和容错能力, 都可以通过训练学习时调整不同的神经网络参数权值实现, 具有较强的外界环境适应变化能力, 同时具备非常强的抗干扰能力。神经网络在安全审计系统中的应用不足之处是样本数据很难获得, 检测的精度也需要依赖于神经网络的训练次数, 如果加入了新的攻击行为特征, 需要重新训练网络, 训练步骤较为复杂, 耗费较长的时间。

结束语

网络安全态势预测可以使用统计分析技术、概率论推理技术、神经网络模式识别技术等根据当前网络运行状态预测未来网络发展趋势, 能够及时的获取网络中潜在的安全威胁, 构建主动网络安全防御系统, 进一步提高网络安全防御能力。

摘要:随着电子信息技术的快速普及和应用, 人们已经进入了大数据时代, 互联网承载了基础的应用信息, 为人们提供大数据应用通道, 因此互联网安全对大数据应用具有重要的影响。详细地分析了网络安全态势预测的重要作用, 归纳了近年来网络安全态势预测的关键技术, 为互联网安全防御提供参考打下良好的基础。

关键词:网络安全,态势预测,灰度预测,神经网络

参考文献

[1]向波.网络安全态势预测方法的应用研究[J].计算机光盘软件与应用, 14, 3:192-192.

[2]黄同庆, 庄毅.一种实时网络安全态势预测方法[J].小型微型计算机系统, 2014, 2:303-306.

[3]曾斌, 钟萍.网络安全态势预测方法的仿真研究[J].计算机仿真, 2012, 5:170-173.

[4]王庚, 张景辉, 吴娜.网络安全态势预测方法的应用研究[J].计算机仿真, 2012, 2:98-101.

大数据预测论文 篇9

关键词:大数据分析,电能损耗预测,灰度关联,仿真实验

0 引言

近年来,随着人们物质条件的逐渐发展,能源越来越紧缺,减少电能损耗成为亟需解决的问题[1⁃2]。随着电网运行管理的智能化,电能损耗计算对算法的精确程度要求越来越高,如何有效准确地进行电能损耗预测,对电网企业开展降损节能工作具有重要意义,其已经成为相关学者研究的重点课题[3⁃5]。目前,针对电能损耗的预测方法主要包括潮流方法、神经网络方法和支持向量机方法等,相关研究也取得了一定的成果。文献[6]提出一种基于BP神经网络的电能损耗预测模型,通过神经网络对电能损耗进行预测,但该方法存在局部收敛、收敛效率低以及隐含层神经元选择复杂等弊端,而且该预测模型还需要大样本容量。文献[7]提出一种基于潮流计算的电能损耗预测模型,该模型可在历史数据不多的前提下,获取电能损耗预测量的内在规律,但该模型仅在电力系统生产技术条件变化不大和影响电力系统电能损耗的因素不产生很大变化的前提下适用。文献[8]提出一种基于聚类分析和线性回归的电能损耗预测模型,通过K均值聚类将电损数据依据不同的特征进行分类,针对各数据类分别进行线性回归,通过线性回归模型实现电能损耗的预测,但该模型存在训练时间长的弊端。文献[9]提出一种基于粒子群算法和支持向量机的电能损耗预测模型,通过粒子群算法对支持向量机进行参数寻优,构建电能损耗预测模型,但该模型存在易陷于局部极小点的缺陷。文献[10]提出一种基于改进核心向量机的电能损耗预测模型,该模型将能耗的计算抽象成回归分析问题进行求解,将历史电损值构成样本集,将其作为源数据进行训练,从而实现电能损耗的预测,但该模型存在网络结构复杂的弊端,预测精度偏低。

本文提出一种基于大数据分析的电能损耗预测模型,对相关数据进行预处理,利用灰色综合关联度获取关键因素,得到该电网电能损耗变化的规律,通过GM(1,1)实现对电能损耗的预测。经实验验证,本文模型具有较高的预测精度,能够很好地避免非线性因素对模型的干扰。

1 电能损耗区域的原因分析

在电能损耗的计算过程中,发电器、变电器、输电器是产生电能损耗的主要部件;因此,对三个电器的电能损耗进行合理的分析,可以为下一步的预测工作打下较好的基础。

1.1 发电器电能损耗分析

发电器电能损耗是电能损耗的根本,其模型可通过惯性环节进行模拟,因为调制波的频率明显高于电网频率,在发电过程中产生一定的电能损耗情况,所以惯性延迟时间常数很小,变电器模型如图1 所示。

1.2 变电器电能损耗分析

变电器必须快速跟随参考电流的瞬态变化,其响应速度比输电器高得多,将输电器形成的电流看作是基准I ,通过一系列阶段,对变电器的电流进行控制,也就是形成参考电压U 。通过dp坐标的转换将参考电压U变成逆变器所需的参考电压Udp_ref,形成触发脉冲。所以,可分析变电器电能损耗的情况,变电器的损耗区如图2所示。发电机P1产生的电流为I2,电压为U2的电源,通过升压变压器处理形成电流为I12,电压为U12的电源,在电流不变的情况下经过电阻R把电压降至U2通过一定的降压变压器处理形成流为I3,电压变为U用,最终变为用户可用的安全电源。但在升压和降压时产生大量的电能损耗。

1.3 输电器电能损耗分析

输电器也是产生损耗的一个关键部件。由于变电器电能损耗预测模型的响应速度较慢,所以,在对输电器进行能耗分析的过程中,首先需完成对变电器电能损耗原理的分析。通过一阶惯性环节等效变电器的特性,将其称作是等效变电器,传递函数Geq(s) 是电流的等效,用于电压的控制回路中,完成变电器模型的等效处理,但是在等效过程中要充分考虑其电能损耗情况。则输电器电能损耗区域如图3 所示。

2 基于大数据分析的电能损耗预测模型

在得到以上3 个区域的能耗分析的基础上,提出一种基于灰度关联的大数据分析电能损耗预测模型,对整体的电能损耗情况进行预测建模,从数据演化过程、数据关联的角度实现对电能损耗的预测。

电网结构复杂,但是电能损耗是由第1 节中的3 个区域决定的,主要包括的参数有:线路电缆化率、绝缘化率、环网化率、线路截面、长度标准化率,配变、线路平均负载率和平均功率因素等。其中,只有部分因素对电能损耗起关键作用,利用灰色综合关联度(Gray Compre⁃hensive Relationship,GCR)对得到的大数据进行分析,得到该数据变化的规律,实现对电能损耗的预测模型的构建。灰色关联分析主要适用于对系统主行为特征序列数据和影响因素序列数据进行灰关联排序。本文中,通过电能损耗历史统计数据组成的系统主行为特征序列,得到与之对应的3 个区域参数等组成的影响因素可描述成:

式中,n用于描述序列中元素的数量。在进行灰色关联分析之前,首先需完成X0,Xi的一致性及等时距处理。如果影响因素序列Xi和主行为特征序列X0呈负相关,则需通过逆化算子Di对Xi进行操作,如果序列X(也就是X0或Xi)每一对相邻观测数据之间的时距全部一致,则将X称作等时距序列。通常影响因素确定的情况下,需要对电能损耗参数灰色关联进行分析。

灰色综合关联分析主要包括经典灰色关联度分析、灰色绝对关联度分析和灰色相对关联度分析。经典灰色关联度主要依据序列曲线间几何形状的相似程度获取关联度,随着曲线的逐渐接近,对应序列之间的关联度也逐渐增加。灰色绝对关联度只取决于序列的几何形状,不受其空间相对位置的影响。灰色相对关联度是序列相对于始点的变化速率的体现,二者变化速率越接近则关联度越大,相对关联度不仅能够在很大程度上避免环境的干扰,而且还凸显了因素间动态变化的相似性。

综上所述,经典灰关联泛化了电能损耗情况的关联共性;绝对关联反映了电能损耗的折线相似度;相对关联反映了电能损耗情况相对于始点的变化速率的接近程度。灰色综合关联度综合了上述特性,能够更加客观、充分地体现出以上3 个区域电能损耗关联关系。其表达式如下所示:

在上述计算的基础上,通过GM(1,1)对电能的损耗情况进行预测模型构建,模型构建的详细过程如下:

(1)对关联后的3 个区域电能损耗数据进行累加生成一阶线损率数据序列X(1)= x(1)(1),x(1)(2),⋯,x(1)(n) ,得到整体电能损耗数据。

(2)微分处理。最小二乘法就是通过最小化误差的平方和寻找数据的最佳函数,可以简便地求出未知的数据,并使得这些求出的数据与实际数据之间误差平方和最小。本文利用最小二乘法对整体电能损耗数据进行微分处理。

(3) 将微分处理后得到的电能损耗数据,通过GM(1,1)转换为电能损耗预测值,实现对电能损耗预测模型的建立,表达式如下所示:

3 仿真实验分析

为了验证本文提出的基于大数据分析的电能损耗预测模型的有效性,需要进行相关的实验分析。本文将神经网络模型作为对比,通过Matlab 7.0 进行仿真,将2003—2009 年某地的统计数据构建模型,用2010 年和2011 年的数据对模型进行检验。

如表1 所示为实验电网2003—2011 年的输入变量值及相应的实际线损率。

依据表1 描述的数据,输入2010 年和2011 年的相关参数,分别采用本文模型和神经网络模型对这两年的电能损耗进行预测,得到预测结果,同时和当年实际电能损耗结果进行比较,得到的结果如表2 所示。

分析表2 可知,采用本文模型拟合2003—2009 年某电网电能损耗的精度比传统神经网络模型的拟合精度更高,并且本文模型2010 年、2011 年度电能损耗预测结果与真实值非常接近,平均预测误差只有1.81%,远远小于传统神经网络的20.94%,说明本文模型更能满足实际需要,预测结果非常精确,验证了本文模型的有效性。为了进一步验证本文模型的有效性,对本文模型和神经网络模型的适应能力进行比较,得到的结果见图4。

分析图4 可以看出,本文模型和神经网络模型的适应度曲线均未和最佳适应度曲线完全吻合,但与传统神经网络模型相比,本文模型适应度曲线和最佳适应度曲线的整体趋势更加接近,说明本文模型具有更高的适应能力。而且本文模型在迭代次数为40 次时即趋于平缓,而神经网络模型在迭代次数为50 次时才逐渐趋于稳定,说明本文模型全局收敛能力强,进一步验证了本文模型的有效性。

4 结语

本文提出一种基于大数据分析的电能损耗预测模型,对相关数据进行预处理,给出数据间经典灰色关联度分析、灰色绝对关联度分析和灰色相对关联度分析。综合上述特性,利用灰色综合关联度获取关键因素,得到电能损耗变化规律,在此基础上,通过GM(1,1)灰色预测模型,依据往年电能损耗数据实现对未来电能损耗的预测。仿真实验结果表明,所提模型具有较高的预测精度,能够很好的避免非线性因素对模型的干扰,为电力企业制定合理的电能损耗计划提供可靠依据。

参考文献

[1]胡巧玲,茹金平.基于大数据分析的人口迁移量预测模型仿真[J].计算机仿真,2014,31(10):246-249.

[2]张勤,周步祥,林楠,等.基于灰色模型与神经网络组合的线损率预测[J].电力系统及其自动化学报,2013,25(5):162-166.

[3]周红艳,田丽,钱兆刚,等.基于连续隐Markov模型的理论线损率预测研究[J].南阳理工学院学报,2014(6):38-41.

[4]王静,田丽,夏坤,等.基于PSO-SVM模型的理论线损率预测研究[J].重庆工商大学学报(自然科学版),2013,30(8):55-58.

[5]艾解清,徐晖,魏理豪,等.基于最小二乘支持向量机算法的配电网线损自动计算模型[J].电力科学与工程,2014,30(z1):43-46.

[6]张光瑞.线损分析预测在供电管理中的应用[J].科技资讯,2013(22):164.

[7]王欣,张海岩,季崇军.线损分析预测在供电管理中的应用研究[J].大科技,2013(15):103.

[8]王艳丽.探讨线损分析预测在供电管理中的应用[J].科技风,2015(2):113.

[9]李滨,杜孟远,韦维,等.基于准实时数据的智能配电网理论线损计算[J].电力自动化设备,2014,34(11):122-128.

大数据预测论文 篇10

关键词:大数据,商业预测,组织管理

当今信息技术的飞速发展, 人们的数字化生存, 以单个个体为对象的数字化信息构成大数据。到今天, 世界上所有印刷材料数据量约为200PB, 全人类说过所有对话的数量约为5EP, 我们每天产生的数据大约是2.5PB, 这就意味着当今世界全部数据的90%都由近两年产生。大数据时代已经来临。这一时期, 管理者通过借助新系统、新工具、新模型等对这些数据进行挖掘, 也从中获取了更多具有洞察力和新价值的信息[1]。然而, 现有的大数据研究多立足于信息科学, 侧重于大数据的获取、存储、处理、挖掘和信息安全等方面[2], 很少从管理学的角度对其进行探讨, 本文阐述了大数据时代商业预测对管理者提高组织管理的方法及意义, 旨在提高企业管理者对于大数据时期下商业预测的重视。

1 管理者利用大数据进行商业预测的价值日益突出

管理是企业或组织存在和发展的灵魂, 优秀的管理者可以凝聚团队力量, 促进团队发展。

因而管理者的素质对于企业的成长起着举足轻重的作用。未来基于经验主义和分析来制定决策的公司, 确实与今天的企业迥然不同[3]。未来, 企业会比过去拥有更多的人才、工具, 管理者也应具备更强的能力, 使得组织能够贯彻和应用对过去业务绩效和事件的持续分析, 从而驱动业务决策和行动。前人在管理者责任与作用的基础上提出管理者在决策过程中的三项主要活动包括:创新意愿、知识获取和风险感知[4]。因而在大数据时代, 商业预测对于管理者职能的发挥尤为重要, 商业预测对于组织的价值也日益突出。

1.1 聚焦数据, 抓住商战先机

大数据时代的来临也意味着移动互联网的普及, 社交网络成为推动移动互联网迅猛发展的主力军。互联网花了30年时间达到7.5亿用户;至2012年, 成立于2004年的Facebook只花了8年时间便达到与之不相上下的用户数[5]。社会网络的核心价值, 在于人和人的社会关系。社交网络为人们开拓了新的信息分享和交流空间, 组织管理者可根据社交网络提供的信息, 充分利用其提供的数据, 了解市场趋势, 改善传统商品, 轻松找到最佳产品, 赢得商业先机。毕竟, 与传统商品相比, 社交圈推广的产品更富有吸引力。因此, 对于管理者来说, 谁更早分析数据, 研究了解自身客户的社交网络关系, 谁就等于抢占了商战先机, 企业的绩效也会随之提高, 组织也就更具市场竞争力。

1.2 强调洞察, 增强预见性, 可提高企业决策能力

在传统的决策模式中, 由于很难获得决策所需的数据, 管理人员更倾向于依赖自己多年的经验和直觉做出重要的企业决策[6]。尽管有些管理人员在报告中也增加了数据说明, 但这些数据也仅仅是为了验证其决策的正确性。大数据时代, 数据生成迅速, 管理者可使用多重数据方法进行建模分析, 洞察数据之间的相互关系从而增强管理者的预见性, 及时为企业提供决策依据。同时, 大数据技术极大地减少了管理者搜索信息的成本, 管理者较过去更容易获得决策所需信息, 并利用数据处理技术对信息的收益进行计算[7], 管理者可依据这些信息进行商业预测, 帮助组织明确未来发展方向, 提高企业核心竞争力。

2 管理者如何建立开展有效的商业分析和预测能力

大数据时代下, 许多组织已经引入分析能力, 使组织更好地理解过去如何影响未来计划制定、塑造决策并提高组织绩效。组织也会开发类似于预测、情景预设、应急预案这些特定的应用或实践。本质上, 组织所寻求的是基于已有的最新、最相关的信息做出的合理决策。商业分析预测 (PBM) 其决策过程是一个根植于一个结构化的、持续的、数据驱动流程, 这个流程使组织能够在对如何确定决策和行动具有相当程度理解的基础上来选择进一步行动, 并且关于结果和影响具有合理的置信区间。

如今, 管理者该如何建立开展有效的商业分析和预测能力呢?

Step1:流程设计

管理者的第一步是开发一个流程, 使组织能够基于预期因果关系来预测未来结果。监控与流程管理系统是改善组织业绩的要素之一[8]。本质上, 管理者从因果关系的根本变化中区分出异常情况的能力对于贯彻有效流程是非常关键的。在流程设计过程中, 管理者要遵循相关指导原则:第一, 商业分析预测要能够合理预测未来收入, 建立在可证明的因果联系基础上而不是基于主观的猜测;第二, 管理者要将财务与非财务、内部与外部相结合地进行平衡测量;第三, 商业分析预测对决策制定者而言要相关、可靠且及时, 并融入管理流程, 驱动行为和结果。

Step2:模型开发

根据David Brooks所说:“如果你让我描述今日正在上升的理念, 我会说那就是数据主义, 我们现在有了收集大量数据的能力”[9]。庞大的数据面前, 管理者模型开发的首个步骤是确定输入和结果之间的关系。输入可以是离散事件, 如伦敦银行间拆放款利率 (LIBOR) 变化;输入也可以是结构性事件, 如企业的新厂房。通常这些输入被称为“驱动因子”, 可以被看作是未来结果的先行指标。而结果是这些事件的后果, 可在一段时间后被衡量, 它们可以被看作是滞后指标。当管理者理解和确定它的驱动因子和结果之间的关系后, 它就可以开始开发、提炼和将这些关系应用到商业分析预测中去。关键的少数驱动关系可以解释预测结果的很大一部分。

管理者在完善组织建模方法时, 可以运用一些技术优化相关判断和结果。这些技术有定量方法, 也有经验方法。表1对管理者可采用的技术方法进行了归纳总结。

Step3:数据获取

商业分析预测数据的获取在许多方面都与财务会计不同。在财务会计中, 记录财务信息主要是根据历史交易和判断, 而在商业分析预测中, 信息通常是历史数据、向前财务数据和非财务数据的混合。大数据下的财务决策是基于云计算平台, 是通过互联网、物联网、社会化网络等采集企业相关数据[12]。相应地, 管理者可以开发出对驱动因子的一系列预测, 编制出一套可能的情景。通过应用回归分析, 并且对每一个可能的结果或活动赋以一个概率, 将这些情景按照发生可能性赋予权重。在比较数据获取方法时, 考虑背景环境、商业分析预测将如何影响的关联情况以及管理层行动的后果, 是十分重要的。

对于许多组织, 数据获取相当复杂。一般情况下, 界定的驱动因子所必要的数据并非是现成的或者容易得到的。在管理者采用商业分析预测的早期阶段, 信息的交付是无效率的、不易处理或需要付出高额成本才能得到的。这时, 一个可行的选择是识别替代驱动因子, 但是为了未来能够使用, 管理者应当收集其首选的驱动因子的数据。当组织成熟起来, 它们应当使用更为自动化的工具技术, 不仅是为了获取数据, 也是为了储存和访问大批量的、能够在执行数据分析时有效结合起来的财务、非财务和营运数据。

3 商业预测对于管理者提高组织管理具有重要意义

敏锐、精准的商业预测对于组织的管理者来说是今后必备的能力之一, 它能为组织的管理带来优越性。正确、果敢、迅速的决策无疑是企业抓住机遇, 获取成功的关键, 而正确的决策和计划主要取决于科学的预测[13]。科学的商业预测可用于管理者经营管理的各个领域。

在授权上, 一旦管理者具备相当的商业预测能力, 便能将团队和员工及时配置到位, 并且理解他们与其他成员协作的方式, 管理者也能更贴近客户的运营策略。这提高了组织的响应能力, 减少了管理上的时间和精力损耗。授权的最终目标就是发掘个体和组织的潜力, 使组织成员根据商业预测做出更好的决策[14]。

在效率上, 在商业预测的基础上精心设计的绩效衡量能够用较少的投入实现聚焦与同步。合理的流程设计和支撑工具能够减少报告的繁杂性, 并且更加及时。

在执行上, 能够预测衡量才能够被管理。驱动组织通过卓越的运营贯彻其战略, 能够带来组织的成长和利润。显然, 正确的商业预测能够使得公司获得较大的回报。如果管理者能够预测到更多的相关信息使决策更快更好, 并用能够以增加洞察而不是增加负荷的方式将信息呈现出来, 他们击败竞争对手的能力就会成长。有关管理者的研究表明, 在过去的三年中, 通过商业预测来管理公司得到的回报是那些通过所谓的常识进行管理公司的2倍左右。因此商业预测对于管理者执行力的回报起着重要作用。

2015 大变革 大预测 篇11

会议总结2014年的经济工作成绩;应对当前国际国内经济情况的变化;制定宏观经济发展规划。这是判断当前经济形势,定调2015年宏观经济政策,必须认真解读的权威风向标。

今年的关键词是“新常态”。新常态成为中国经济发展的大逻辑,这将是很长一段时间内中国经济工作的理论基础。

中央经济工作会议从消费需求、投资需求、出口和国际收支、生产能力和产业组织方式、生产要素相对优势、市场竞争特点、资源环境约束、经济风险积累和化解、资源配置模式和宏观调控方式九个方面进行了深度解析,得出了“经济发展进入新常态”的明确判断。

在此经济新常态下,投资者应该如何从政策的风向标中找到正确的道路,发现蓝海,找准投资方向?这也是我们努力思考的方向。

何谓新常态?

自从习近平总书记在2014年初首次使用并在其后多次正式提及,8月份《人民日报》发表一组三篇特别报道,聚焦“中国经济新常态”,此后“新常态”一词迅速在媒体升温并脍炙人口。

“新常态”是国际上近年来提出的重要经济术语,最先由美国太平洋基金管理公司总裁埃里安提出。“新常态”在宏观经济领域被西方舆论普遍形容为危机之后经济恢复的缓慢而痛苦的过程。

我国的经济新常态并不是孤立的,而是与整个国际形势相耦合。当前全球经济正处在缓慢而脆弱的复苏之中,自2008年国际金融危机爆发以来,世界各国都在寻求经济增长的新动力。美国在2014年底公布的一系列数据表明美国仍然是世界经济复苏的主要动力,欧盟及欧元区持续缓慢增长,日本经济增速显著回落,新兴市场国家和发展中经济体普遍处于经济减速过程中。这种全球经济复苏的不均衡性、脆弱性和易变性,让各国都进入了深度调整与转型期,形成了世界经济的新常态。

中国经济正是在这样的背景下,由高速增长开始减速换挡,步入“中高速、优结构、新动力、多挑战”的“新常态”。

因此,习近平总书记在中央经济工作会议报告中要求,面对我国经济发展新常态,观念上要适应,认识上要到位。

也就是说,这个新常态不是中国自己“制造”,而是对全球经济形势的准确定位,中国的经济工作重点,是要去“适应”之。

读懂中央的要求

读会议公报,就要提炼出一些关键性的“干货”。会议认为当前形势的经济新常态的表现是:

消费需求从模仿型排浪式特征到个性化、多样化成主流;投资需求从传统产业到新技术、新产品、新业态、新商业模式和创新性投融资;出口和国际收支方面的低成本比较优势不再;生产要素从劳动力成本到创新成为驱动发展新引擎;市场竞争从靠数量扩张和价格竞争,正逐步转向靠质量型、差异化为主的竞争;资源环境承载能力已经达到或接近上限;伴随着经济增速下调,各类隐性风险逐步显性化;全面刺激政策的边际效果明显递减。

同时公报提出了我国经济工作要如何应对这些趋势性变化:要使消费继续在推动经济发展中发挥基础作用;要使投资继续对经济发展发挥关键作用;要使出口继续对经济发展发挥支撑作用;产业结构必须优化升级,企业兼并重组不可避免,新兴产业、服务业、小微企业作用更加凸显;必须推动形成绿色低碳循环发展新方式;必须建立健全化解各类风险的体制机制;要通过发挥市场机制作用探索未来产业发展方向。

公报要求“认识新常态,适应新常态”,那么这里提出的趋势性变化也就将成为明年经济工作的目标。用公报的话来讲,就是当前和今后一个时期我国经济发展的大逻辑。

公报中由此提出八个“更加”,指出了2015年政策的总方向,也是整个经济工作的宗旨:

要更加注重满足人民群众需要,更加注重市场和消费心理分析,更加注重引导社会预期,更加注重加强产权和知识产权保护,更加注重发挥企业家才能,更加注重加强教育和提升人力资本素质,更加注重建设生态文明,更加注重科技进步和全面创新。

公报中明确了明年经济工作的主要任务是如下五点:努力保持经济稳定增长。积极发现培育新增长点;加快转变农业发展方式;优化经济发展空间格局;加强保障和改善民生工作。

寻找蓝海

读懂了会议精神,我们才有可能对各个领域进行对照,哪些领域将处于明年经济工作重点关注的范围,成为发展的蓝海?

首先看明年的货币政策。公报对于明年货币政策基调的论述仍然是“稳健的货币政策”,但外界更加关注此次出现的新表述——货币政策要更加注重松紧适度。如何理解“松紧适度”?招商证券研报和民生证券研究院执行院长管清友都认为,明年货币政策基调将更为积极,即在条件允许的情况下,货币政策或将进一步加大宽松力度,降息、降准皆有可能。

其次看战略性重点发展区域:“要重点实施‘一带一路’、京津冀协同发展、长江经济带三大战略”,公报中明确了三大新亮点。由此在股票方面要关注的板块有京津冀、一带一路、长江经济带、自贸区、国企改革等概念。

在行业方面,环保、新能源、创新技术、基础建设等都在报告中有所提及。环保产业将是重中之重,“要坚持不懈推进节能减排和保护生态环境”,凡是与环保相关的节能减排、固废处理、水处理等领域都将得到高度重视和大力发展的机遇。

“创新”在报告中多次被提及,新技术、新产品、新业态、新商业模式和创新性投融资,将迎来明确的发展机会。值得注意的是“创新性投融资”、“小微企业作用更加凸显”这两个短语,结合目前热门的如P2P等广义互联网金融企业的发展,与互联网、移动互联网技术运用相关的金融领域,特别是针对小微企业、小额借贷等方面具有广阔的想象空间。

基础建设仍然是重中之重,报告中特别提到“基础设施互联互通”,基于政府主导的基建投资仍将对经济发展发挥关键性作用。

农业方面的土地流转将进一步健全和规范。公报提出要完善农村土地经营权流转政策,搞好土地承包经营权确权登记颁证工作,健全公开规范的土地流转市场。农地流转将有更加深入的改革方案。12月底国土资源部土地勘测规划院院长郑凌志公开表示,国土资源部2015年将在征地制度改革、集体经营性建设用地入市、宅基地制度改革三方面,选择若干试点,进行土地制度改革试验。

国企改革也是深化改革的重点。电改、林改的具体政策和改革规划有望在会议后得到明确,金融改革主要是利率市场化、存款保险制度和民营银行方面政策,国企改革主要围绕第一批国企改革试点企业的具体改革方案和进一步政策。

另外,房地产调控、保障性住房字样未在公报中提及,引起业内诸多猜测。上海易居房地产研究院副院长杨红旭认为,随着市场在资源配置中发挥决定性作用的提出,房地产调控正在向提出长效机制,而非短期行政性调控转变。所以,去年中央经济工作会议已不再提房地产调控,今年再度失踪,意味着房地产调控已成为“贬义词”,可能将长久退出经济工作会议的“历史舞台”。

大数据预测论文 篇12

随着公司“三集五大”管理体系和调控、运监、客服三中心的全面建设, 信息系统已全面融入公司生产经营管理业务的各个方面, 积累了大量的结构化数据、非结构化数据、海量历史准实时数据和地理信息数据, 有效支撑企业数据共享融合、分析决策系统建设。但随着公司各业务系统数据量不断增大, 以及数据价值挖掘需求的增长, 针对平台需要在横向扩展、实时快速处理能力方面进一步提升, 针对应用功能建设需要在跨业务跨部门分析能力方面需进一步优化。为适应公司信息化管理手段, 需引入大数据关键技术的研究、验证和示范应用来促进公司支撑一体化、专业化、扁平化、集约化管理, 构建新型电网企业运营体系, 增强价值创造力和核心竞争力。

2 大数据在企业的应用情况

在国外, 互联网企业已经对大数据技术进行了深度探索和研究, 并投入关键应用领域。同时, 传统的金融、电信、能源等领域也引入大数据技术, 用于解决数据处理环节上遇到的瓶颈, 创新了业务应用, 助力企业从激烈的竞争环境中脱颖而出。

与国外市场相比, 国内除少数大型的互联网公司外, 绝大多数企业对于大数据的研究与应用还处于探索阶段, 但这些局部的合理尝试已经为这些企业带来了丰厚回报和成长优势, 这也初步验证了“大数据”在中国所具有的广阔应用前景。

3 大数据应用关键技术

3.1 分布式存储及实时计算能力

Hadoop技术体系中具备全分布式架构、数据块粒度切分、在线扩容减容、复制备份等关键技术, 支撑了安全的PB级以上规模数据在线存储, 为解决公司逐渐膨胀的数据体量提供存储支撑。

3.2 海量异构数据存储及处理

针对电网业务中海量规模的结构化、非结构化数据存储, 传统的集中式、阵列式存储模式, 存在扩容性不强、可靠性及高可用性不佳等问题。采用Hadoop技术体系中分布式存储技术, 可有效解决海量数据存储的难题, 且利用Hadoop提供Map/Reduce统一的并行计算框架对非结构化、半结构化数据进行综合分析利用, 解决了公司海量异构数据类型的共存及计算分析问题。

3.3 高效智能的数据挖掘与分析工具

针对公司各业务系统中已存在, 即将采集的低价值密度的数据, Hadoop提供了丰富的统计分析、多维分析、挖掘算法库、数据挖掘工具, 满足公司对价值密度较低的数据的分析需求。

4 研究场景

4.1 研究内容

完成基于客户历史违章用电的检查结果, 构建客户违约违章用电模型, 评估客户当前是否正在发生违约违章风险。

4.2 研究方法

分类预测输出的预测结果是给出待预测对象从属于某个类别的判断。例如:根据客户历史用电数据, 判断其为可能违约用电客户或为正常用电客户。

4.3 算法选型

在实际工程应用中采用较多的算法主要有:决策树、BP神经网络、朴素贝叶斯、Logistic回归等。通过对比研究, 我们采用决策树算法的随机森林算法, 其精确度优于其它算法, 且其运行速度较快。

4.4 算法实验

取乌鲁木齐公司地区2014年12个月及2015年1至3月的客户基础信息、用电信息及缴费行为信息数据为原始数据进行实验。

第1组实验:

训练集:2014年10、11、12月份数据。

测试集:随机森林算法预测得到的2015年1月份数据。

验证集:2015年1月份真实数据。

混淆矩阵:

查准率:42.13%, 查全率:46.26%。

第2组实验 (非居民)

训练集:2014年10、11、12月份数据, 采样1000条记录。

测试集:随机森林算法预测得到的2015年2月份数据。

验证集:2015年2月份真实数据。

混淆矩阵:

查准率:45.68%, 查全率:61.31%。

第3组实验 (非居民)

训练集:2014年10、11、12月份数据, 采样1000条记录。

测试集:随机森林算法预测得到的2015年1月份数据。

验证集:2015年1月份真实数据。

混淆矩阵:

查准率:49.69%, 查全率:53.46%。

从以上测试结果看出, 该模型的查准率为40%-50%, 查全率为50%-60%, 满足预测要求。

5 总结

上一篇:黄山旅游下一篇:企业统计中存在的问题