大数据培训感想

2024-05-18

大数据培训感想(共8篇)

大数据培训感想 篇1

第一次知道大数据时代这个概念是在大一,本来以为是很高端深远的东西,但是就现在肤浅的认识看,其实就是我们所处的这个时代。所谓大数据,无非就是社会进步、经济进步所导致的一个必然结果,尤其是如今这种非结构式的信息膨胀得很快。首先,对于大数据时代这本书,由于是译本我觉得很多地方读起来没有逻辑有点难理解。但是这本书最好的一点就是较生活化、通俗化地讲述了大数据已经给我们生活带来的变化以及我们还可以利用大数据去改变什么。在这本书中,作者强调了是三个原则:

一、不是随机样本,而是全体数据;

二、不是精确性,而是混杂性;

三、不是因果关系,而是相关关系。

对于第一点,作者是认为小数据通过抽样能够获得更多信息,但随着各种类型数据的不断增多,海量的数据通过抽样去获取信息就没有意义了。我觉得作者不能太过度强调全面数据,因为它毕竟有很多的条件限制,比如是否有能达到的技术支持,是否经济,是否合理,所以并不能一味地追求全面数据所带来的完整信息,至少我认为就现在大部分的数据调查来看,有的时候还是合适才是最好的。还有一点就是我们在收集、分析全面数据的时候也在不断产生新的数据,怎么证明这些新数据不是我们需要的全面数据中的一部分呢。

对于第二点,作者说允许不精确的出现成为了一个亮点,说得来就跟以前我们收集分析都非常精确一样,其实在统计中提到的置信区间、显著性水平这些限制就是一种容错率的概念,也就是说我们一直都是允许不精确的。

第三点其实在讲大数据带来的一个巨大的颠覆在于,人们可以利用数据的相关性直接做出决策而不用拘泥于背后的原因。例如沃尔玛通过调查知道“飓风的时候草莓味蛋挞卖得好”,但是我们根本不知道原因到底是为什么,其实我们也不需要知道,沃尔玛要做的仅仅是在飓风的时候增加草莓蛋挞的库存并且把它摆到显眼的位置就可以了。所以利用大数据我们可以做出很多这样的精明决策,但是数据也逐渐在代替了人做决策,我觉得人类的思想被彻底挑战了。我认为机器对于数据的分析体现相关关系,而因果关系则大部分来自于人为的想法,作者在书中前面部分说到“真正的革命并不在于分析数据的机器,而在于数据本身和我们如何运用数据”,所以重点是人类的思想和人类的运用。我觉得这一点上作者讲得有点前后矛盾。这么多年来,人类一直都在靠因果关系来理解和审视世界,而且事实也证明这没错,其实一旦有人的思维在就是不可能避免因果关系的出现,我觉得如果太强调相关关系就少了点人文情怀了。

这本书中作者说大数据的核心是预测,我觉得这才是最关键的,因此不用太在意作者所提过的那三个原则,我们知道能用大数据去做什么才更应该被在意,毕竟数据的使用者是我们。作者说量变引起质变,正因为有预测,我们就能预知未知的,就能相对清晰地了解这种质变到底是什么,这也是大数据赋予我们的权利。因此我们可以利用大数据提前知道人们所需要的而去进行改变,这应该也是生活与人本身契合度越来越高,人们觉得生活越来越方便的原因之一。大数据带来的究竟是信号还是噪音,我觉得预测结果是最能够用来反映的证据。尽管贝叶斯定理在预测方面已有非常高的成功率,但作者还是反复强调预测的困难性。如何保证收集信息的准确性?如何构建合适的数学模型和工具?又如何克服预测过程中的私人因素?即使是在大数据时代,这些同样会造成预测偏差。但不可否认,预测已经完全影响到我们的生活。比如人的消费行为预测,电影的票房预测,离职风险预测等等。但大数据时代最无法避免的就是隐私泄露,预测同样是泄密的源头。比如婚外情预测,死亡预测等,它很有可能会对生活造成不好的影响。所以科技与知识都是有两面性的,随着大数据时代的发展,隐私权的基本问题也应该重新被审视,各种法律也应该相应被完善。我们需要发展但也不应该完全由数据推着我们发展,社会的发展依然需要人类文明作为基础。

大数据培训感想 篇2

我国当前的教育培训行业分工越来越明晰,其中包含很多类目,有K12课外辅导类、学前幼儿早教类、语言学习类、职业技能类设计培训类、IT培训类、文艺体育类、学历教育类、管理培训类、留学移民类等等。其中K12课外辅导类主要包含了小学、初中、高中、一对一、班课、夏令营、特长竞赛班、寒暑假冲刺衔接班等若干品类。就K12课外辅导类来说,目前我国的这类教育培训行业已经准备脱离刚开始的粗放、疯狂的发展阶段,教育机构的总的数量已经连续几年呈下降态势,行业实际门槛变高,没有特色、特长的中小机构生存越来越艰难,并逐步退出市场。究其原因,消费者越来越趋于成熟,选择会更理性,中小机构同质化严重,缺乏差异区分度,共同造成了目前的形势,当然这也是行业成长的必经阶段。接下来,我们就大数据在K12课外辅导中一对一的授课形式中的应用略作分析。

二、云数据系统在教育培训行业应用的现状

就笔者接触的很多选择一对一形式课外辅导的家长来说,一对一的主要优势在于可以做到一人一方案,从章节内容讲解到例题习题练习分析,再到学情考情分析,都能具体问题具体分析,尽力做到因材施教。笔者也了解很多长年从事一对一教学的一线教师,他们为了要实现这种因材施教的模式,除了要有扎实的学科基础之外,还要能对学生的学情考情及性格喜好进行分析,便于有的放矢地个性化讲授。另一方面还要在大量刷题的基础上总结归纳,整理出自己的题库,并对应基础、提高、拔尖等至少三类典型的学生,进行相应的教案编写,并配以循序渐进、深入浅出的例题习题,供学生课上实践与课后巩固、检测。

目前一对一教育机构中云数据系统的使用主要体现在题库的统一购买、使用上,解决了一线教师,特别是新教师建题库慢的问题。一线教师可以在授课用的平板电脑中通过在系统的章节题库里勾选课程对应知识点相关的适合难度系数的题目,逐步组成教案或试卷。也能在系统中查看到所选题目的被选用频次,便于进行进一步高要求的筛选。

三、大数据运用在当前云数据系统中的实现

这类一对一培训机构专用的云数据系统也分为几种模式:1,是类似猿题库和学科网的纯题库,主要提供单向的选题、组卷等功能,直接导出成Word文件。即使能保存教师的选题、组卷数据,也没办法与教师本人各方面的学科情况挂钩,选题、组卷数据难以利用,更难以进行有价值的数据深层挖掘。2,是类似学而思内部云数据系统的带反向数据搜集能力的交互式云题库,这种云系统的一大特点就是封闭性,仅供自己体系内的校区和加盟校区使用,在内部进行数据的更新与完善。3,是类似高思所开发的云数据系统,与学而思系统最大的区别在于开放性。该系统目前已经进行了较有成效的推广,目前仅笔者所了解的浙北和苏南地区,就有很多的中小机构,甚至是上亿规模的较大机构已经购买使用了高思云数据系统。

其中,后两类系统中的反向数据搜集功能值得引起注意,在该云数据教学系统中,每位一线教师所做的每一份教案、试卷均被保存在云端服务器上,以至于所有修改必须在该云系统中进行,包括将自己原有题库中的题目加入自己的教案或试卷。因为该类云数据系统的无纸化特性,使得这个反向数据搜集功能可以有效地搜集每位一线老师所做的100%真实的教案及试卷,并且可以跟教师本人的背景、级别挂钩,甚至能跟学生使用该教案的接受情况、使用该试卷的检测反馈挂钩。有了这些全方位的数据,加之每周几千上万的教案和试卷数量,公司可以对这些数据进行聚类形成本公司甚至各地区的行业大数据,其中深藏的正是各章知识点的需求、各校各地区的教学进度、学校以及班级的教学质量统计、各地区统计、行业状况、学生及家长需求、教学方法反馈等大量的信息可供发掘。

四、大数据在创新教育培训行业中的前景

虽然云数据系统在当前我国的一对一K12教育培训行业中的运用已初显,但系统定位和开放性的竞争还处于百花齐放的阶段,仍远没有决出谁胜谁负。大数据在设置良好的云数据系统中的运用,将极大助力所属机构在市场需求把握、招生策略尝试、教学质量监督、教学方法效果反馈,以及各地区、各学校教学情况跟踪等各个方面。

摘要:本文分析了教育培训行业的现状,并针对性地提出了大数据在现阶段教育培训行业中能起的作用及其应用前景。

关键词:大数据,教育培训行业,应用

参考文献

[1][英]维克托·迈尔-舍恩伯格,[英]肯尼思·库克耶.Big Data:A Revolution That Will Transform How We Live,Work,and Think.Houghton Mifflin Harcourt,2013.

[2]于永昌.大数据时代的教育[M].北京:北京师范大学出版社,2015.

大数据培训感想 篇3

【关键词】O2O;大数据;企业培训

随着“大云平移”时代的来临,我们的生活、工作方式发生了巨大的变化,也给企业培训工作带来了深刻的挑战。知识爆炸导致知识的陈旧速度加快,讲师需要不断更新自己的课程,而学员也需要不断学习。面对这些变化,如何利用O2O模式在大数据时代使企业培训完成线上与线下相结合,工作与生活相融合,产生网络交互的无限可能性呢?

一、教育培训O2O模式的概念

O2O(Online To Offline),即将线下商务的机会与互联网结合在一起,让互联网成为线下交易的前台。教育培训O2O就是通过线上线下的结合,利用大数据为受训学员提供个性化学习方案。教育培训O2O将会取代名师,将学习由“效果目标”变成“随机任务”,而老师作用由主导变为辅助O2O平台帮学生完成学习。O2O时代老师的作用会被弱化,此时的老师只是系统的辅助或做一些更高级的工作。

二、青藏地区企业培训现状

培训行业是一个非常诱人的行业,无论是组织还是个体都有再学习的需求。培训行业在青海当地正迅速增长,但和外省相比,省内从事企业培训业务的公司普遍存在规模小、层次低、内涵少等现象,培训机构的场地面积在20-1000平米不等,雇佣人员的数量也在3-20不等,通过笔者的调查,截止2014年5月,当地专门做企业培训的民营公司(中心)有十几家,但深入研究企业培训的前沿理论并付诸实施的很少。较低的培训市场准入门槛,使很多经营者对教育培训的规律缺乏科学的认识,在培训模式、教学质量、教学内容、师资上的研发投入严重不足,教学效果自然无从保证,加上急功近利的心态,导致对教学质量的漠视。另外,虽然培训机构的师资大多数是合格的,但由于培训本身的商业性质,又必然出现浮躁的教学风气,使教学效果大打折扣。许多培训教育机构办学特色不鲜明,教学体系不健全,教学模式互相复制,研发投入不足,最终的结果就是越做越小,质量越做越差,名声越做越烂,本地的培训机构不断成立也不断的倒闭或转行。

三、对策及建议

目前大多数企业,对企业全员培训越来越重视,企业老总普遍认为企业培训已经成为企业发展不可或缺的手段。但企业普遍存在的困惑是,高端培训价格太高,只适合企业高层管理人员;企业内训,培训师价格也很高,并且培训师真正的水平和能力良莠不齐,内训课程内容和企业的需求有偏离;企业培训公开课的价格也是很高,并且要承担大量的差旅成本,需要培训的人员太多,企业的培训经费难以支撑;培训光盘、E-learning等方式难以调动员工学习的积极性。在研究中,笔者发现企业培训机构的品牌影响力与服务能力是企业用户采购的所最为关注的因素。企业培训作为一种商业行为,在O2O时代必然需要一种自我调整来适应学习者的需求。

O2O时代的教育特点是碎片化、个性化,如果培训机构还是将老师作为自己的竞争核心,要满足学习需求就需要不断增加老师的数量,必然会增加机构的运营成本,并且名师的不稳定性很难使教育培训机构进一步规模化。

O2O的时代的企业培训需求是长尾分散式的,大数据颠覆掉名师效应,那么就需要培训机构首先要进行分散布局,采用现场学习+互动直播+随时随地点播+考试考核+企业内训等培训方式来顺应大数据时代和企业培训需求。所以,可以尝试建立O2O模式的系统平台,通过网络等技术实现学习的全过程管理(设计、实施、评估等),通过线上线下的结合,利用大数据为受训学员提供个性化学习方案,使学习不再依赖于名师、教室,借助网络技术,无限丰富课程资源、教师资源。

但这个成熟平台的搭建,在青海当地靠现有的培训机构去做,从资金上、技术上、资源上短时间内都无法完成。因此,其前期可以借助YY时代光华等网络平臺和O2O平台服务提供商来扩大自己的品牌影响力和学生口碑,深入维扩市场将自己的利润最大化;等后期有了经验、资金、技术和资源支持自己,再做一个系统平台那将会拥有无限前景。对青海的企业培训机构来说,关键是寻找到线上和线下的连接点,如何在线下完成教育,线上进行优化和提高,这是需要进一步摸索的商业模式。

参考文献:

[1] 李莹.对构建高效企业培训体系的思考[J].现代营销(学苑版),2013(2):61

[2] 韩广.企业培训教育探索[J]. 科技与企业,2013(2),243

[3] 刘磊.关于企业培训的见解[J].石河子科技,2013(1):25

[4] 蒋侃.O2O电子商务商业模式研究[J].电子商务,2014(9)35

[5] 严春燕.企业E-learning培训研究[J].经营管理者,2014(1):42

作者简介:

大数据培训感想 篇4

成都大数据培训班哪家好?学习大数据正是时候

成都国信安大数据培训由副教学总监,优秀讲师带队并亲自授课,秉承成都国信安一贯的专业品质态度,在课程质量,学生素质,就业服务上相当严格要求,并以学业满意就业为目标,打造国内优秀大数据培训班,感兴趣的同学不妨关注国信安教育基地了解一下

在入门阶段对计算机水平的要求并不算高,比如有人建议你学这学那,于是新手们又开始学习这种语言,搞到最后,什么语言都没搞懂,时间大把大把的流失,热情消耗殆尽。要解决这个问题,首先要明白一个根本问题,怎样挑选适合入门的编程语言?

首先,这门语言必须简单易学,有趣,而且要有一定的热度,有热度才能有更多的人一起交流讨论。不仅要想学,还要会学、学好IT技术。未来随着人工智能等一大批新兴行业的兴起势必会引起行业的快速发展。

现在是大数据时代,信息化社会。有人说,掌握大数据,就是掌握着机遇。现在网上的信息技术,程序也好,大数据也好,这些都是编程的各种语言衍生出来的结果,那么初学编程到底该选哪门语言学习呢,下面小编给你说道说道,希望对想要学习编程语言的新人有所帮助。

不同的领域有不同的应用语言,作为初学编程语言的新人该如何选择自己喜欢的编程语言呢?

四川地处中国大西南,肥沃的土地,丰富的自然资源,悠久的历史和绚烂多彩的少数民族文化,构成了多样性的自然和文化旅游资源。随着IT培训的飞速发展以及人们生活水平的提高,IT培训已成为很多80后、90后、00后学技术的首选。但是,没有基础能不能学会成了很多学生和家长担心的首要问题。为此,小编前往学校教学一线,与众多实操大师一起探讨并分析了四川国信安职业培训学校的教学模式以及能否学会等诸多问题。

IT培训这点事,外行看热闹,内行看门道。对于一些相关经验,还是听老师傅的~好了,废话少说,下面来看看小编为大家带来的IT培训相关资讯吧~ 国信安教育基地

近年来,我国大数据产业发展进入爆发期,由于成熟的人才培训体系尚未建立,直接导致人才短缺的问题日益突出。“我们面临的很严重的问题就是应用场景和人才的问题,应用场景的问题是需要时间,人才问题是我这么多年来碰到的最严峻的问题。” 人才不足限制了大数据产业创新发展的成效。清华大学计算机系教授武永卫透露的数据显示,未来3至5年,中国需要180万数据人才,截至目前,中国大数据从业人员只有约30万人。LinkedIn(领英)发布的《2016年中国互联网最热职位人才报告》则显示,数据分析是当下中国互联网行业需求旺盛的6类人才职位之一。

同时,大数据行业选才的标准也不断变化。初期,大数据人才的需求主要集中在ETL研发、系统架构开发、数据仓库研究等偏硬件领域,以IT、计算机背景的人才居多。随着大数据往各垂直领域的延伸发展,对统计学、数学专业的人才,主要从事数据分析、数据挖掘、人工智能等偏软件领域的需求加大。在高端人才稀缺的现实情况下,企业多选择从海外和传统行业挖掘跨界人才,但仍然无法满足国内市场的大量需求。针对大数据人才供应不足的现象,各种培训机构和各大高校也开始强化大数据人才的培养。但培养大数据人才需要时间,在短期内对于大数据领域的高端人才仍然会呈现出供不应求的现象。值得注意的是,今年3月份,教育部公布了第二批获准开设“数据科学与大数据技术”的高校名单,加上第一批获批的北京大学、对外经济贸易大学、中南大学,一共35所高校获批开设该专业。今年开始,部分院校将招收第一届大数据专业本科生。国信安教育基地

对于大数据人才建设,潘文表示,要建立适应大数据发展需求的人才培养和评价机制,并建立健全多层次、多类型的大数据人才培养体系。同时,还要完善配套措施,培养大数据领域创新型领军人才,吸引海外大数据高层次人才来华就业、创业。

成都国信安信息产业基地有限公司(简称“国信安”)是中国电子科技集团公司(简称“中国电科”)下属子集团——中国电子科技网络信息安全有限公司(简称“中国网安”)的全资子公司。于2002年由成都市政府倡导发起,依托中国电科、中国网安的行业和产业集团资源,形成了以信息化和软件技术为核心的教育培训、检测评测、产业促进服务的三大业务群。建立起了研发、测试、教育、人才培训、就业服务为一体的教育业务,旨在为中国电科集团单位,成都乃至西部地区电子信息、信息安全、服务外包等产业领域的发展提供源源不断的人才储备和输送。截至目前,成都国信安已经培养了上千万名学员,学员毕业之后的薪资远远超过其他IT技能培训。独立研发大数据教材,开设的大数据工程师课程、大数据分析课程、大数据可视化课程以及 大数据运维课程,等都受到了广大学员的欢迎!

如果大家需要了解大数据课程或者是获取相关课程资料,可以登陆我们的官网http://进行了解

大数据培训学费大约多少 篇5

大数据培训学费大约多少

全程面授

关于大数据的培训学费问题,相信是很多想学习大数据的同学都想了解的。据了解国内以千锋为代表的大数据培训机构收费标准在两万左右,甚至更多,一般都是培训6个月左右。大数据课程的费用之所以会很高,一是因为现在大数据老师很稀缺,二是因为大数据培训需要的技术和项目都是很珍贵的。

我这样和你说吧,5年前,北京的一套房子,平均每平米3万仍然有很多人买,因为,大家知道,房子是投资,以后可能就是5万或者10万。在来看培训,也要看它能给你带来多少价值,而不是多1千少八百。优秀的学员花2万学费以后,一下拿到年薪20万30万,显然对他来说这次培训“性价比高的惊人”“学费低的惊人”。普通学员毕业后拿10万15万年薪,也是一笔划算的投资,毕竟通过培训你已经进入行业,再努努力,年薪15万,20万,30万也是可以预期的。

所以,“培训是投资自己,让自己身价倍增的快方法”,它所带来的价值远远超过学费本身。

做真实的自己-用良心做教育

稀有品质

全程面授

当然,如果你交了学费,不好好学习,天天睡觉,那来参加大数据培训就很不划算了。我分享一句很好的话没有白花的钱,花了就有价值。学习的价值是最高、最值的。你把这项培训话费当做投资,收益绝对良多。有一个学员来的时候薪水只有4000元,学完后,一下拿到了6个offer,最低的薪水也有1.5万元当然这也有地域性问题。资金困难,能先学后付吗? 可以的,千锋教育推出先学习后付款就是为了帮助这些学生,学完后一年才开始付款,压力也会非常轻松。

就像我上面所说,学习是一个好的投资,拿人生的80年计算,也只有900个月。那么让你奋斗时期只顶多100个月,如何让自己及父母或以后儿女在往后生活无忧,你花6个月的时间就能办到,为什么不去尝试下呢?花6个月的时间赚取别人100个月的一生,这好像是一笔非常划得来的时间帐,所以不要再纠结了!

公需科目大数据培训考试 篇6

得分:1分

A.健康档案数据 B.公共安全数据 C.个人健康管理数据 D.诊疗数据

 2.根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。(单选题1分)o o o o

得分:1分

A.2014年 B.2008年 C.2010年 D.2006年

 3.根据涂子沛先生所讲,普适计算是在哪一年提出的?(单选题1分)分

o o o o

得分:1A.1989年 B.1988年 C.1965年 D.2004年

 4.()时代,使得信息智慧解读时代到来。(单选题1分)o o o o

得分:1分

A.Web3.0 B.Web4.0 C.Web2.0 D.Web1.0  5.人类利用信息的历史,经历了()次革命,媒介革命催生了数据大爆炸。(单选题1分)o o o o 得分:1分

A.六 B.五 C.三 D.四

 6.根据涂子沛先生所讲,哪一年被称为大数据元年?(单选题1分)o o o o

得分:1分

A.2006年 B.2012年 C.2008年 D.2010年

 7.戈登•摩尔提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每()左右可以翻一番。(单选题1分)o o o o

得分:1分

A.6个月 B.1个月 C.18个月 D.4个月

 8.大数据的利用过程是()。(单选题1分)o o o o

得分:1分

A.采集——清洗——统计——挖掘 B.采集——挖掘——清洗——统计 C.采集——清洗——挖掘——统计 D.采集——统计——清洗——挖掘  9.以下选项中,不属于信息时代的定律的是(单选题1分)o o o o

得分:1分

A.麦特卡尔夫定律 B.达律多定律 C.吉尔德定律 D.摩尔定律

 10.规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是()。(单选题1分)o o o o

得分:1分

A.繁数据 B.大数据 C.贫数据 D.富数据

 11.大数据的本质是(单选题1分)o o o o

得分:1分

A.洞察 B.挖掘 C.搜集 D.联系

 12.“最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?(单选题1分)o o o o

得分:1分

A.摩尔定律 B.吉尔德定律 C.麦特卡尔夫定律 D.牛顿定律  13.国务院在哪一年印发了《促进大数据发展行动纲要》?(单选题1分)1分

o o o o

得分:A.2015年 B.2014年 C.2016年 D.2013年

 14.以下选项中,不属于大数据对人才能力的要求是(单选题1分)o o o o

得分:1分

A.业务能力 B.逻辑思维能力 C.IT技术能力 D.数学统计能力

 15.未来农业信息化将会取得新突破:在空间上,农业信息化从点状示范向()开发,从区域覆盖向全面推进的格局演变。(单选题1分)o o o o

得分:1分

A.片状 B.线状 C.面状 D.网状

 16.第一个提出大数据概念的公司是(单选题1分)o o o o

得分:1分

A.谷歌公司 B.麦肯锡公司 C.脸谱公司 D.微软公司  17.通过精确的3D打印技术,可以使航天器中()的导管一次成型,直接对接。(单选题1分)o o o o 得分:1分

A.55% B.75% C.85% D.65%  18.《中共中央关于全面深化改革若干重大问题的决定》提出,全面深化改革的总目标是完善和发展(),推进国家治理体系和治理能力现代化。(单选题1分)得分:1分

o o o o A.共产主义制度 B.社会主义市场经济制度 C.社会主义制度 D.中国特色社会主义制度

 19.2012年全国各城市支付宝人均支出排名中,位居第二位的是()(单选题1分)得分:1分

o o o o A.高雄市 B.嘉义市 C.嘉兴市 D.杭州市

 20.()年,部分计算机专家首次提出大数据概念。(单选题1分)o o o

得分:1分

A.2010 B.2005 C.2008 o

 D.2011 21.《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》关于“加强健康医疗大数据保障体系建设”提出了哪几项任务?(多选题3分)分

o o o o

得分:0A.加强健康医疗信息化复合型人才队伍建设 B.加强法规和标准体系建设 C.加强健康医疗数据安全保障 D.推进网络可信体系建设

 22.以下说法正确的有哪些?(多选题3分)o o o o

得分:3分

A.大数据对传统行业有帮助 B.大数据是一种思维方式 C.大数据仅仅是讲数据的体量大 D.大数据会带来机器智能

 23.根据周琦老师所讲,高德现在的数据来源主要是()。(多选题3分)3分

o o o o

得分:A.政府数据 B.行业数据 C.国外数据 D.公众数据

 24.我国下列哪些城市曾因PX项目问题发生过群体性事件?(多选题3分)得分:0分

o A.昆明 o o o B.镇海 C.大连 D.厦门

 25.贵州发展大数据的顶层设计要坚持()的理念。(多选题3分)o o o o

得分:3分

A.数据是资源 B.产业是目的 C.安全是保障 D.应用是核心

 26.关于大数据的来源,以下理解正确的是()。(多选题3分)o o o o

得分:3分

A.我们每个人都是数据的制造者

B.当今的世界,基本上一切都可以用数字表达,所以叫数字化的世界 C.大数据是数据量变积累达到质变的结果 D.数据的产生需要经历很长时间

 27.数据成为战略资源,未来的世界可能会划分为()这几个世界。(多选题3分)得分:3分

o o o o A.大数据 B.微数据 C.小数据 D.无数据

 28.当前我国信息化发展的主要问题体现在以下哪些方面?(多选题3分)3分

得分:o o o o A.网络和信息安全形势严峻 B.信息化发展不均衡

C.传统产业跟互联网的全面融合发展明显不足 D.数据资源开放共享不够

 29.根据涂子沛先生所讲,以下说法正确的有哪些?(多选题3分)o o o o

得分:3分

A.国家要制定合适的法律来规范数据遗产继承的问题 B.数据垃圾对商业公司是一个挑战 C.中国社会迟早要面临数据遗产问题 D.个人要把数据当做自己的遗产

 30.大数据提升政府治理能力的“四步曲”包括()。(多选题3分)分

o o o o

得分:3A.融合化 B.信息化 C.自流程化 D.数据化

 31.农业农村信息化业务应用深入发展,其业务应用主要表现在哪几个方面?(多选题3分)o o o o 得分:3分

A.农业信息资源开发利用水平提高 B.农村综合信息服务平台发展迅速 C.农村电子政务已经基本普及 D.农村电子商务蓬勃兴起  32.云计算的特点包括以下哪些方面?(多选题3分)o o o o

得分:3分

A.服务可租用 B.低使用度 C.服务可计算 D.高性价比

 33.20世纪中后期至今的媒介革命,以()的出现为标志。(多选题3分)3分

o o o o

得分:A.自动化 B.数字化 C.计算机 D.互联网

 34.贵州电子商务的发展路径是:与阿里、京东、腾讯等电商企业强化合作,改善信息基础条件、物流条件,培育电商主体和平台,积极发展()。(多选题3分)得分:3分

o o o o A.电子商务+跨境 B.电子商务+物流 C.电子商务+农村 D.电子商务+社区

 35.大数据的来源包括()。(多选题3分)o o o

得分:3分

A.探测数据 B.互联网数据 C.传感器数据 o D.实时数据

 36.下列各项表述中正确的有哪些?(多选题3分)o o o o

得分:3分

A.中央网络安全和信息化领导小组组长是习近平。

B.我国中央网络安全和信息化领导小组宣告成立是在2013年。C.我国中央网络安全和信息化领导小组宣告成立是在2014年。D.中央网络安全和信息化领导小组组长是李克强。

 37.关于大数据的内涵,以下理解正确的是(多选题3分)o o o o

得分:3分

A.大数据在不同领域,又有不同的状况 B.大数据就是很大的数据

C.大数据里面蕴藏着大知识、大智慧、大价值和大发展 D.大数据还是一种思维方式和新的管理、治理路径

 38.信息时代的三大定律指的是()。(多选题3分)o o o o

得分:3分

A.麦特卡尔夫定律 B.吉尔德定律 C.摩尔定律 D.牛顿定律

 39.关于信息技术产品的演进,下列说法正确的有()。(多选题3分)3分

o o o

得分:A.信息技术产品量化生活/量化自我 B.微电子技术在和其他技术领域相融合 C.遵循三大定律 o D.可穿戴式设备产生

 40.运用大数据进行大治理要做到()。(多选题3分)o o o o

得分:3分

A.用数据创新 B.用数据说话 C.用数据决策 D.用数据管理

 41.林雅华博士指出,在网络时代,电子政务的发展刻不容缓。(判断题1分)分:1分

o o

得正确 错误

 42.《国务院办公厅关于深入实施“互联网+流通”行动计划的意见》要求:支持建设农产品流通全程冷链系统。(判断题1分)o o

得分:1分

正确 错误

 43.宁家骏委员指出,大数据等于数据中心建设。(判断题1分)o o

得分:1分

正确 错误

 44.发展医疗健康大数据应用,目标是助力健康医疗服务产业快速发展。(判断题1分)o o 得分:1分

正确 错误  45.我国国内行业之间的信息化发展水平差距比较大,农业信息化属于短板。(判断题1分)o o 得分:1分

正确 错误

 46.新一代信息技术会催生新的产业革命,带来新的经济形态,或者颠覆传统经济的一些产业。(判断题1分)o o

得分:1分

正确 错误

 47.人才雷达能够广泛搜集到有关某个人的资料。他们的搜索对象是人们在网络上留下的生活轨迹、社交言行等等个人信息。(判断题1分)o o

得分:1分

正确 错误

 48.政府2.0、政府3.0,与政府以后的治理改革和服务型政府建设的目标是完全不一致的。(判断题1分)o o

得分:1分

正确 错误

 49.网球比赛,与其他体育项目一样,涉及大量数据。(判断题1分)分

o o

得分:1正确 错误

 50.宁家骏委员指出,我国民生领域信息化服务水平显著提升。(判断题1分)分:1分

o

得正确 o 错误

 51.物联网目前还未实现对实时情况进行监测、感知。(判断题1分)分

o o

得分:0正确 错误

 52.根据周琦老师所讲,高德每季度基于数据挖掘,发布全国主要城市的交通分析报告。(判断题1分)o o

得分:1分

正确 错误

 53.《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》指出,要从人民群众迫切需求的领域入手,重点推进网上预约分诊、远程医疗和检查检验结果共享互认等便民惠民应用。(判断题1分)o o

得分:1分

正确 错误

 54.在没有大数据的条件下,人才的发现与选拔都很难做到“全信息”,大数据能够帮助人们解决这个问题。(判断题1分)o o

得分:1分

正确 错误

 55.宁家骏委员指出,文字产生于公元3500年。(判断题1分)o o

得分:1分

正确 错误  56.物联网的处理技术应用于农业上,可以对感知到的周边温度、湿度、光照进行分析,加以判断。(判断题1分)o o

得分:1分

正确 错误

 57.信息技术发展推动了人类社会获取信息方式的变革。(判断题1分)分

o o

得分:1正确 错误

 58.2013年8月,国务院发布《国务院关于印发“宽带中国”战略及实施方案的通知》指出:到2020年,宽带网络全面覆盖城乡,行政村通宽带比例超过98%。(判断题1分)o o 得分:1分

正确 错误

 59.我国农村广播电视实现了从“村村通”向“户户通”的覆盖,覆盖率高达97%、98%。(判断题1分)o o

得分:1分

正确 错误

 60.在工业化社会到信息化社会的转折点上,互联网是我们党和政府面临的“最大变量”,处置不好,将成为“心头大患”。(判断题1分)o o

得分:1分

大数据培训感想 篇7

现代产业与信息技术的发展使数据资源成为越来越重要的生产要素。爆炸式增长的数据量对多源、异构、高维、分布、非确定性的数据及流数据的采集、存储、处理及知识提取提出了挑战。大数据思维就是此环境中的产物,它并不局限于传统的基于因果关系的逻辑推理研究,甚至更多地通过统计型数据的搜索、分类、比较、聚类、关联等的分析和归纳,关注数据集内隐藏的相关性(支持度、可信度、关注度)。图灵奖得主吉姆·格雷将这种数据密集型的研究范式从理论科学、计算科学、实验科学中分离出来,成为“第四范式”[1]。

2008年《Nature》推出Big Data专刊[2]后不久,文献[3]将大数据计算称为商务、科学和社会领域的革命性突破。2011 年,《Science》的Dealing with Data专刊阐述了大数据对科学研究的重要性[4]。同年,麦肯锡公司发布关于大数据的竞争力、创新力和生产力的调研报告[5],分析了大数据的影响、关键技术及应用领域,进一步燃起学术界和产业界对讨论大数据的热情。美国政府于2013年3月宣布投资2亿美元启动“大数据研究和发展计划”[6],将其上升为国家战略。大数据被认为是继物联网、云计算之后,IT行业又一次颠覆性的技术变革。

云计算是利用互联网实现随时、随地、按需、便捷地访问共享资源池(如计算设施、应用程序、存储设备等)的计算模式[7],关注计算能力,并与关注知识提取的大数据技术相得益彰。

电力是社会发展的重要基础。随着全球能源形势的日益严峻,各国大力开展了智能电网的研究和实践[8,9]。其目标是建设一个覆盖整个电力生产过程,包括发电、输电、变电、配电、用电及调度等环节的实时系统,以支撑电网的安全、自愈、绿色、坚强及可靠运行[10]。而其基础则是电网广域全景实时数据的采集、传输、存储、分析及决策支持。

而愿景中的电网则是网架坚强、广泛互联、高度智能、开放互动的智能电网。文献[11]分析了智能电网大数据的产生与特点,指出已有的数据处理技术在智能电网的数据存储、处理和展示等方面所面临的挑战,已成为智能化发展的制约因素。 文献[12]探索了基于云计算的智能电网信息平台的可靠存储和高效管理。文献[13]研究了用户侧电力消费的大数据,从中挖掘其用电行为,以改进需求响应系统。

以电为核心的大能源体系正在成为全球能源的发展战略[14]:一次能源的清洁替代与终端能源的电能替代都必须依靠电网的输送才能大规模地实现。文献[15]指出,电力可靠性问题的顶层设计应该以大能源观为指导,不能局限于电力系统自身,还要分析其与一次能源、外界环境、管理政策、用户需求与方式变化间的交互,研究广义阻塞对电力系统安全性与充裕度的影响。

电力、能源及广义环境的多源、多态及异构数据的数量呈指数级增长,需要有相应的广域采集、高效存储和快速处理技术予以支撑。而从这些数据中挖掘知识及价值应用则使电力大数据的话题融入大数据的研究热潮。本文及其续文是笔者关于如何将电力大数据的思维应用到电力的广义可靠性、大能源安全及环境安全方面的思考。

1 大数据概念的演绎

1.1 定义

对“大数据”还没有统一的定义,通常指量大、多源、异构、复杂、增长迅速,无法用常规的方法处理的数据集合[16]。许多数据往往只在统计学观点上具有某种相关性,而不一定像传统应用的数据那样具有严谨的因果关系。对这样的统计关系型数据,只有当反映一个真实问题的数据量达到能在一定程度的统计意义上描述其真实面貌时,才能有效地提取知识,支持决策。而对于常规的因果关系型数据来说,数量的大小往往仅影响到计算资源,而与提取知识的方法关系不大。

因此,大数据与小数据之间并无绝对的界限,而是相对于目标问题而言的。大规模的数据量只是大数据概念的特征之一,也不应该用海量的规模作为大数据的必要条件。

大数据技术涵盖了从信息产生、采集、存储、转换、集成、挖掘、分析、计算、展示、应用及维护等数据全生命周期管理过程[17],需要具备从不同类型的多源异构数据中,快速提炼出有价值信息的能力。

1.2 基本特征

数据是以编码形式对自然现象、社会现象、试验仿真结果及经验的记录,包括数字、文字、图像、声音等形式。与传统数据相比,大数据具有四大显著特征4V,即量(Volume)、类(Variety)、速(Velocity)、值(Value)[18]。“量”是指数据容量足够大;“类”是指数据种类呈现多源多态特性;“速”是指实时性要求高;“值”是指数据价值密度相对较低。在数月的监控视频中,可能仅1~2s的画面有用,但通过关联数据的挖掘、分析和提取,却可能获得很高的信息价值。

一般认为,数据规模或复杂程度超出了常用技术按照合理的成本和时限来处理的能力,就可称为大数据。笔者认为如果统计型数据量对于具体目标问题来说,已经具有统计意义,就可以用大数据思维来处理。若为大数据设立数百TB的阈值,必将大数据思维束之高阁,扼杀了其广泛应用的生命力。

除了从因果、统计及博弈等数据关系的视角来对数据类型分类外,还可以按数据结构的视角将其分为三种类型:①结构化数据,即可以用二维表结构来逻辑表达的行数据,关系型数据库是其有效处理工具;②非结构化数据,是一类不能用有限规则完全表征与刻画的异构性数据,如图像、音频和视频等信息,它们之间不存在直接的因果关系,存在不相容性及认知的不一致性;③半结构化数据,介于上述两种结构之间的数据,可以用树、图等模型表达,如Web、办公文档及电子邮件等信息。据统计,随着社交网络、传感物联及移动计算等新技术、新渠道的不断涌现,企业中的半结构化或非结构化数据占比越来越大,有的已达80%。

1.3 思维方式

大数据技术的思维方式是:将采集到的经验与现象实现数据化与规律化,在继承传统的统计学、计算数学、人工智能、数据挖掘等方法的基础上,从单一维度转向多维度统筹融合,开发知识处理的新方法,从更深刻的视角,以更高的时效发掘多源异构数据,从而发现新知识和新规律,并实际应用的方法学。

若可以用简单的表达式直接描述某问题的结果与变量之间的关系,那么即使其数据量很大,也不一定属于大数据思维。当数据之间没有或还不能严格描述其因果关系,而数据集已相对地具备统计意义,就需要并可以采用大数据思维来处理。例如:对于一个市场调查的数据集,如果仅仅求取人群对某种商品的需求分布,那么思维方法并不会因为数据集是否海量,而改变常规的数据处理思维。但如果要从人群对该商品众多技术、经济、全程服务特性等各方面要求中提炼出有助于提高企业竞争能力的决策支持,那就需要有新的思维方法,包括信息挖掘与利用的思维、模式及方法,以帮助人类获得更深刻的洞察力。

关注统计关系的思维方法,同样可以应用于有限数据集上[19],只是其结论的可信度可能受到影响。

1.4 大数据技术的挑战

1.4.1 大数据的采集与集成

利用各种传感器及终端,采集反映物理世界、市场经济与人类行为等现象的静态/动态的异构数据,成为人、机、物三元世界的信息纽带[20]。其挑战主要体现在:①从结构化数据为主,向结构化、半结构化与非结构化的三者融合的变革;②数据来源的多样化,特别是移动终端的广泛应用,使大量数据需要同时带有时间与空间的标志;③有用信息被淹没在大量无关或弱相关的数据中,或需要处理低质量及局部缺损的数据。

1.4.2 大数据的存储

大量多态异构数据的高效、可靠、低成本存储模式是大数据的关键技术之一,对多源多态数据流之间的交互索引与转换效率影响很大。

数据压缩技术可以减少数据传输量及提高存储效率,但也增加了数据处理环节及计算负担[21]。分布式存储要权衡对存储空间及实时性的影响:对实时数据采用实时数据库或内存数据库;对核心业务数据采用传统的并行数据仓库系统;对大量的历史和非结构化数据采用分布式文件系统。

算法在处理复杂结构数据时相对低效,故希望事先为复杂结构的数据建立索引结构来帮助搜索,并合理地将非结构型数据结构化。

1.4.3 大数据的分析

需要关注大数据的形态描述、基本运行规律及其可控性。其中,最复杂的是人类社会行为信息,其决策行为必须与物理系统及信息系统相结合。

目标领域的信息若能与关联领域的信息相结合,则不但知识量得以增加,而且更有可能揭示综合性、交叉学科的未知知识,甚至从统计型数据中发现其(准)因果关系。知识的涌现性反映在模式、行为和智慧上。例如:将提高风机效率的研究与气象信息、电网信息联系,其效果将大大提升。大数据与云计算为之提供了数据资产的保管、搜索的技术,但也不是数据越多越好,而信息的提炼与知识的发现一般很难通过直观方式的分析和解读来获取。

数据驱动的分析方法包括:聚类、判别、回归、识别、隐变量、主因分析、时间序列。需要处理大规模的不定解问题,及必要时信息的补充问题,利用特征的相关性来发展统计学,有效地表达高维随机变量函数的联合概率分布。

用以发现知识的技术有:遗传算法、神经网络、数据挖掘、专家识别、回归分析、聚类分析、关联分析、数据融合、机器学习、自然语言处理、情感分析、空间分析、时间序列分析及其他计量学方法。一个例子是Google采用机器学习和神经网络来分析服务器群的数据,掌握大量变量之间的交互。神经网络在无显式编程下自适应学习,大大提高服务器群的效率,发现普通人注意不到的复杂互动关系。

随着大数据的应用从离线走向在线,甚至实时,所面临的系统复杂性、数据复杂性和计算复杂性挑战更为严峻。目前虽然出现了一些较为有效的方法,如流处理模式、批处理模式,及两者的融合[22],但仍未有一个相对普适的(准)实时的分析处理框架,在合理精确性的前提下实现快速的随机优化。

1.4.4 大数据的易用性

易用性应该贯穿在大数据的集成、存储、计算、分析,乃至展现等整个业务流程[23]。从技术层面看,可视化、人机交互及数据起源技术都可有效提升易用性,但仍存在元数据的高效管理的难点。元数据是关于数据的组织、数据域及其关系的信息,是描述信息资源的重要工具。

1.4.5 大数据的安全性

数据可靠性和通信网络安全性至关重要。必须研究各种广域量测数据和仿真数据的完备性、适时性和价值的评估技术,研究在广域信息不完全条件下的分析、控制技术。

“8·14”大停电前的几个月,北美电力可靠性委员会(NERC)警告说,随着电力业务的复杂化,越来越多的电力公司不遵循2002年发布的非强制性的安全导则,致使一些数据采集与监控(SCADA)网络被蠕虫破坏。大数据安全是一项包括技术层面、管理层面、法律层面的社会系统工程,其保障体系的框架由组织管理、技术保障、基础设施、产业支撑、人才培养、环境建设组成。应该研究数据源和传输的可靠性,研究信息系统故障或受到攻击时的行为,以及信息的阻塞、淹没、丢失和出错对大能源可靠性的影响。

移动互联时代中,人们在不同场合产生各种数据足迹;大数据技术将大量行为信息聚集在一起,就很可能暴露其隐私。由于尽可能地获取信息本来就是应用大数据技术的目的,故与隐私权的保护存在着矛盾。如何协调共享与隐私,需要制度与监管的保证。

现有的数据安全保护技术主要针对静态数据集[24],包括开放与防御的平衡,防止数据被窃取或篡改。但仍需要解决动态信息的安全性问题。

1.4.6 大数据的应用

大数据学科的兴起与人类需求密切相关,其中的信息挖掘及知识提炼环节必须与待求解问题紧密结合,而应用环节则是大数据技术发展的动力与归宿。因此,大数据研究应该遵循问题导向、需求牵引及数据共享的原则。必须结合具体的目标问题,将采集到的低价值的大数据加工成高价值的思想或知识,大数据技术才有生命力。若没有应用企业的深度参与,若不能按照商品的规律运行,大数据技术就难以真正取得收效。此外,若没有各管理部门对数据共享的落实,大数据技术也只能是纸上谈兵。

知识作为资源,需要像物质资源那样分配及流通。为此,需要对知识产品定价,并从数据使用的视角揭示信息流与科学活动的内在规律。

目前对大数据应用的关注,主要集中在商业与服务业这些以统计关系为主的领域[25],较少涉及具有较强因果关系的领域,如电力系统及能源市场等领域。笔者认为,是否能成功地将统计关系、博弈关系与因果关系取长补短,是大数据技术能否扩大应用领域的一个关键。

2 电力大数据

2.1 问题的提出

从能源系统看,它包括电网和非电的能源网两部分;电力系统应该在能源的清洁替代与电能替代中有效地承上(一次能源)启下(终端能源),兼顾左右(与其他二次能源协调)。

从信息系统看,它包括专用通信网与互联网(Internet)两部分。专用网用于对信息安全性或实时性要求高处,但由于非开放式的接入,故不适合与广泛用户的互动;互联网用于开放场合,但信息安全及实时性差。显然,两者对于信息系统来说都不可或缺。

能源革命需要的是能源系统的全部组分与信息系统的全部组分的深度融合[26],即大能源系统与大信息系统组成的信息能源系统,而不是局限于它们的某个子集之间。但是,智能电网的研究范畴基本上局限于能源系统中的电力系统与通信系统中的专用网[27],因此其信息物理融合的概念也就局限于“电力生产信息+电力系统”。作为能源革命重要环节的“一次能源系统及终端能源系统”,以及作为信息革命重要环节的“网络金融及需求侧参与信息”却并没有得到应有的重视。

显然,目前的智能电网框架中的专用通信网的功能需要从电力系统扩展,不但涉及各种非电的能源环节,而且涉及相关的非能源环节,以更好地支持对电力可靠性及经济性的研究,并支撑综合能源安全、能源经济安全及环境安全。另一方面,开放的网络经济及广泛的用户参与都需要互联网的支持,互联网数据的管理与挖掘成为非常重要的任务。

整个能源行业在转型发展中面临的机遇和挑战,来自一次能源的压力、环境安全的紧迫性、电力系统内外复杂性的增加、运行环境及扰动事件的不确定性与风险的增大、经济与技术的发展、市场改革的要求。为了应对上述挑战,必须提高数据的及时性、完整性、一致性及信息安全防御能力,提高对数据的管控能力,消除数据壁垒、存储无序且不一致的现象,完善对外部环境、基础设施及人才队伍的掌控。

从传统的电力数据演变为电力大数据,跨领域的时空扩展将电力系统的界面条件从确定性变为时变性,同时也增加了多时间尺度的动态复杂性[28]。涉及各类数据的采集、集成、存储、管理、知识挖掘、决策支持、可视展现等技术,也反映了电力及综合能源数据的管理、知识的挖掘和应用等一系列推进能源生产、转换、输送、消费方式的创新思维。其中的互联网数据大多为传统数据库不支持的非结构化类型,包括图片、视频、音频、地理位置信息、网络日志、博弈行为、金融动态、政策法规。数据的在线或实时处理,往往呈现出突发及涌现等非线性状态演变现象,难以预测。

为此,信息创新必须与能源革命在更高层次上深度融合,特别是在一次能源中的清洁替代及终端能源中的电能替代上,不但将协调优化的概念提升到综合能源流的范畴,而且推动电能更主动发挥在一次能源与终端能源之间的核心纽带作用,实现能源生产模式与消费模式的革命。

但是,将大数据技术局限于互联网数据也是片面的。通过专用网或仿真网获取的数据,包括智能电网概念中已涉及者,以及有待外拓的非电能源领域与非能源领域中的数据问题,同样存在大量的挑战。既然讨论的是信息物理融合问题,那么其框架就更不应该在信息系统内部或能源系统的内部设立藩篱。

当前的研究都在一定程度上受限于物理系统中的藩篱或信息系统中的孤岛。例如:①稳定性与经济性的研究都针对给定的边界条件,不能真实反映上下游环节的变化对电力系统的影响;②充裕性问题被粗犷处理为固定比率的备用容量,无法适应大规模不确定性的可再生能源及充放电用户的入网;③决策过程基本无法考虑博弈行为的影响;④忽视了信息系统本身可靠性的影响;⑤缺乏对电力系统外部环节的自适应能力。

要突破上述藩篱与孤岛,就必须遵循以电力系统为核心环节的大能源系统在大数据时代下的发展理念,顺应管理体制及技术路线的变革。

2.2 电力大数据的特征

一方面,电力大数据具有大数据的共性,包括目标领域向其他相关领域的扩展,以及数据类型向非结构型及非因果型数据扩展,时间维度向多尺度的流数据扩展。由此形成大量的异构异质数据,包括数字、文本、图形、图像、音频、视频等静态和不同时间尺度的动态数据,以及大量统计关系与博弈关系的数据,都需要快速处理。

另一方面,电力大数据必然继承了能源行业数据的特征,包括大量的因果关系数据、高维的时空数据,广域的监测控制,快速的时间响应及实时控制数据。除了电力系统的状态外,还需要获取并分析相关领域的数据,并处理部分数据缺失时的不确定性。

运行工况或故障场景都会影响系统的稳定性和控制策略。中国的电网现在已普遍实现了在线的量化分析功能,按实测工况和典型故障来指导预防控制,并向自适应的紧急控制与系统保护发展[29]。但若要有效地应对极端自然灾害环境,则还需要采集并处理大量非结构型的视频、语音、图片,并与电力系统分析功能有机结合。大规模间歇性可再生能源(RES)与电动汽车(EV)的入网对电力充裕性与备用调度提出挑战,要求大大提高对风电、太阳能发电及EV充放电的预测精度,这就需要处理大量非结构型的地理及交通动态数据。为了应对相继故障,基于常规因果关系型数据的分析算法也应该解决多米诺效应的演化路径及实时评估的经典难题。

2.3 电力大数据的类型

除了按数据结构等大数据概念来划分电力(能源)系统大数据,还存在其他视角,列举如下。

1)按业务领域,电力大数据可分为:①规划运行类,包括电力规划、电能生产、运行监控、设备检修等数据;② 企业运营类,包括企业发策、运营、电力市场、用户信息等数据;③企业管理类,包括人财物资、资本运作、企业资源计划(ERP)管理、协同办公等数据;④非电的能源类,包括各种一次能源、非电的二次能源、终端能源使用模式等数据;⑤非能源类,包括气象、环境、碳资产、宏观经济政策等数据。

2)按时间维度可分为:①背景及法规数据;②历史数据;③调查及预测数据;④在线实测数据;⑤仿真推演数据。

3)按数据采集来源可分为:①书本及文档;②专用网数据;③互联网数据;④问卷及调查;⑤交互博弈及仿真结果。

2.4 电力系统的数据量

常规SCADA系统按采样间隔3~4s计算,10 000个遥测点每年将产生1.03 TB数据(12B/帧×0.3帧/s×86 400s/d×365d×10 000遥测点);广域相量测量系统的采样率为100次/s,10 000 个遥测点每年将产生495 TB数据。美国PGE公司每个月从900万个智能电表中收集超过3TB的数据。国家电网公司的2.4亿块智能电表,年产生数据量约为200TB,而整个国家电网公司信息系统灾备中心的数据总量,接近15 PB。 以2004年山东系统(97台机、462条母线、702条支路)为例,设在线每5min对220kV以上线路的三相永久故障分析一次暂态稳定性,仿真时长10s,仿真步长0.01s,则一年内将产生1 092TB的数据量。当大规模的间歇性分布式可再生能源入网后,发电侧计及气象数据的实时监控的数据量比传统发电成倍增加。智能配电、智能电表、电动汽车和用电技术的发展也大大增加了需求侧的数据量。电力企业的精细化管理,与一次能源、环境、交通、市政等外部系统的联系日益深化,对数据量的依存度也越来越高。

2.5 电力大数据对电力可靠性的支撑

整合各种广域系统采集的静态和动态数据,包括雷电场、台风风力场、山火场等非结构型数据与常规的电力数据及仿真信息相结合,从所获的现场实测或仿真得到的时间响应曲线中提取深层知识。以支持稳定性与充裕性的量化分析及自适应控制,协调故障前的预防型博弈,故障后瞬时的故障隔离和预测型紧急控制,检测到违约症状后的校正控制,以及系统崩溃后的恢复控制。在此基础上,综合防御框架还应该实现多道防线的时空协调,通过协同各道防线和各种控制手段,最大限度地减少大停电的风险。

信息的可靠性是分析和决策的物质基础;机理分析和量化分析则通过数据挖掘来深刻掌握电网的行为特性[30];正确的决策是为了能以最小的风险代价来最大限度地满足电力需求。互为补充的相量测量单元(PMU)、远方终端设备(RTU)和仿真数据共同满足系统在空间中和时间上的可观性和可控性[31]。需要研究在不完备数据下,如何将信息论和系统论相结合,从数据中挖掘深层信息。

在电力的长期可靠性分析与控制方面,需要考虑社会、经济、科技、能源与政策等发展的不确定性,以及各种博弈行为的影响,将目前依靠主观判断的方式逐步提升为基于混合仿真推演的方式。

3 信息能源系统的大数据平台

3.1 电力(能源)系统运行数据的采集

关系数据库强调完整性及一致性,云计算强调可扩展性,但难以保证实时性。Internet的TCP/IP协议在流量控制和数据纠错时会产生10ms量级的时延,难以满足实时控制,特别是紧急控制的要求。

RTU和SCADA系统可以用低成本采集大量的广域数据,并满足静态可观性,但没有统一时标,采样周期长、时延大,只能抽取慢速动态特征。故障录波和保护信息系统就地记录大量暂态信息,可支持故障的事后分析,但上传的滞后时间长,难以实时应用。

PMU数据不依赖于系统模型和参数,可在统一时标下快速采样,提供系统实际的时间响应曲线,用来校核仿真模型和参数,并提供仿真的初值。但受价格限制较难满足高可观性。

20年来的研究热点之一是将PMU用于实时稳定性分析及开环控制,根据受扰后短期实测数据预估稳定性,并在失稳前选择并执行控制措施,但至今未能用于稳定分析和开环控制。文献[32]明确指出,在非自治因素下单纯依靠轨迹的外推来预测并不可靠,并且即使在没有时间约束的离线环境下,要对有数学模型的仿真曲线进行稳定性量化分析也非易事。若在计算已有轨迹的稳定裕度时没有模型参数可用,其量化分析就更难。更重要的是,只有通过仿真才能在措施实施前确认其效果。不与仿真工具结合,就难以按合理的保守性来确保控制的充分性。其根本原因是:在事前,PMU无法观察到控制措施的效果,也无法在不依靠系统模型及参数的前提下求取实测轨迹(特别是稳定轨迹)的稳定裕度。PMU在应用上的这个瓶颈是本质性的,不可能真正突破。

现场伪量测是对广域数据加工中挖掘出来的数据;仿真伪量测是在仿真中产生的数据。它们的正确性受到模型、参数、初值和算法等的限制。

3.2 电力(能源)系统的大数据平台

随着数据采集环节的质量提高、成本降低,以及各种广域数据采集系统的数据共享,可以通过更多数据来全面掌控电力与能源。为此,需要将各种广域监测系统和数值仿真系统置于统一的平台中,有助于数据挖掘,识别相继故障的先兆特征、临界条件和传播模式,从而提高预警水平,增强防御停电灾难和事后分析的能力。

由硬件资源、基础软件、网络通信、数据集成、计算支撑、应用支撑、安全管控等环节构成的大数据平台支持多源多渠道异构数据的即插即用、融合与管理,支撑各种开发、应用及信息展示功能的即插即用。通过基于数学模型的因果型数据、无因果关系的统计型数据以及参与者博弈行为的融合,管理各类能量的生产、转换、输送及使用,调度与仿真数据的集成与管理。

4 结语

虽然当前关于大数据的应用案例大多发生在互联网企业中,但传统的电力及能源企业也在思考如何从关于大数据的空泛介绍走向实际应用。特别是除了直接依赖互联网的电力金融业务及面向消费的个性化服务以外,在基于传统数据的系统分析与控制领域中,如何融合电力及能源的统计关系数据、因果关系数据及博弈行为数据,发挥大数据的价值。例如:间歇性能源及负荷预测,引导需求响应及节能减排,降低停电风险,反窃电,堵塞经营漏洞,优化资产全寿命周期管理等方面。特别是:如何使企业决策从当前基于常规数据及主观经验的模式,发展为基于数学模型、参与者及多代理模型的混合仿真的沙盘推演模式。其中的多代理模型就需要大数据技术的支撑。这关系到电力大数据技术是否能进入到通常由因果关系数据一统天下的物理系统分析领域。为此,思维方式需要重大变革。

摘要:大能源思维将电力视为能源生产与消费全流程中的枢纽环节,藉此推动上游一次能源的清洁替代与下游终端能源的电能替代,支撑能源的可持续发展。大数据思维将各种数据资源从简单的处理对象转变为生产的基础要素。这两种思维的融合,使电力大数据成为大能源系统广泛互联、开放互动及高度智能的支撑,包括:广域多时间尺度的能源数据及相关领域数据的采集、传输和存储,以及从这些大量多源异构数据中快速提炼出深层知识并发挥其应用价值。作为两篇论文中的开篇,在演绎大数据基本概念、结构类型及本质特征的基础上,归纳电力大数据的特点。针对综合能源,通过基于数学模型的因果型数据、无因果关系的统计型数据以及参与者博弈型数据的融合,构建信息能源系统的知识挖掘平台。其续篇将讨论信息能源系统,并通过若干案例,反映大数据思维对提高大能源经济性与可靠性的贡献。

大数据培训感想 篇8

关键词:物理;教学;新课程;学生

也许大家都会认为:高考考什么,老师教什么,学生学什么。这个问题还要问吗?我说非也,素质教育我们喊了许多年,进入21世纪又遇到新课程改革,怎么还能老思想、老观念呢?课程改革了,我们的思想就要跟上,就要探究新的教学方法,才能适应新课改的要求。下面我就谈一下我在新课改培训和新课改教学过程中逐渐形成的一些粗浅的想法:

一、把握学生学习物理的态度,化被动学习为主动学习

有數据研究表明中国的学生学习知识有一共同的问题,学生总认为老师讲的就一定是对的,老师就是知识的权威,所以在学习时就不假思索的接受了。为什么学生会这么“容易”被动“接受”知识呢?原因很简单,中国的父母在教育小孩时喜欢把孩子的的事情全部包办下来,我们的老师也具有这样的教育观念,于是就把学生学习的某些过程自己就不知不觉代替完成了。所以说我们要有新的教学模式,传统教学过程基本上由教师来完成,学生的学习就是通过阅读课本、认真听讲将外在的知识复制到自己的头脑中并在考试时将其再现出来。在这种学习过程中,学生只是被动地接受知识。学生原有的知识经验以及学生对学习目标、学习重点和学习策略等的选择性被忽略了,学生的自主性和能动性被压抑了。而恰恰许多教师和学生都习惯了这种教学模式。现代科学哲学认为,知识是变化的,是能动的,是人努力的结果。对学生来说,知识在被接收之前是不具任何权威性的,因此教师不能以知识的正确性作为让学生接收的理由,而应根据学生原有的知识经验引导他们对新知识进行分析、检验和批判,使学生积极参与教学过程并建构自己对新知识的理解。总的来讲在教学中应重视培养学生学习的自主性。

二、让学生亲身体会到人类建立科学大厦的全过程

传统的教学过程中经常会出现这样的现象,一堂物理课老师只讲物理概念、物理规律、原理,然后就用大量的练习来轰炸学生,最终给学生能够留下的也仅是些专业名词、公式和概念。这些专门的词汇、孤立的概念和原理等零散的知识只不过是科学大厦的一些砖瓦,无法让学生看到科学大厦的整体和人类建立科学大厦的全过程。这样的课堂教学怎么能适应新课改的要求,学生觉得空洞乏味,我们应该从人文的角度去处理教学内容。“科学本身不仅包括专业知识和技能,而且包括概念的相互关系、世界观、对人类和知识本性的看法”。传统物理教学往往只重视前者而忽视后者,教师应从历史发展的角度和整体上把握本学科知识间的相互关系以及本学科知识与技术、社会以及相关学科间的关系来进行教学,这样的教学才会收到良好的效果。

三、让学生明确学习的重点是理解观点和概念不是死记公式解题

学习物理绝不是死记定理、公式,不是空洞、单一的解题训练,仅注重其形式化的表面,是无法把握物理的实质的。物理概念是反映物理现象和过程的本质属性的思维方式,是物理事实的抽象.它不仅是物理基础理论知识的一个重要组成部分,而且也是构成物理规律和公式的理论基础。学生在学习物理的过程中,就是要不断地建立物理概念,如果概念不清,就不可能真正掌握物理基础知识。因此,在中学物理教学中,概念教学是一个重点,也是一个难点。因此学习的重点也应该是理解观点和概念不是简单的死记公式解题。

四、让生活走进物理,让物理走进生活

许多学生认为物理知识太难,又与日常生活没有大的联系,所以提不起学习兴趣。因此在教学中应加强物理课程与学生生活和现实社会的联系,实现物理课程的生活化、社会化、实用化。但这并不是让物理课程脱离学术轨道,而是使物理课程与学生生活和社会更有效地融合起来,给已有充分发展的学术课程增添时代的源泉和生活的动力;从学生的生活中给学生以启迪。让生活给学生当一部优秀的课程,让社会给学生当一个更大的课堂,使学生每一时每一刻都能处于教育之中,使学生具有永远鲜活永不干涸的知识源泉;我们还应强调物理课程的个性化、多样化,满足不同区域和不同学生的发展需要,课程个性化问题实际上也是因材施教的问题。

五、让学生重视数学在物理学中的作用

老师们早就知道物理与数学密不可分。在高等学校里,数学系的学生要学普通物理,物理系的学生要学高等数学,这也是尽人皆知的事实了。物理学主要是揭示自然界中的自然现象,并使之形成规律。在研究物理中,有时是通过一定的数学手段使自然现象变成物理规律。有时在物理问题中利用数学工具进行分析。因此数学知识与物理学存在相当大的联系,正如俗语所讲:“数理是一家”是有一定道理的。只有掌握好它们之间的联系,才能更好在学好物理,才能更好地应用数学工具处理好物理问题,并能提高应用数学工具处理物理问题的能力。

六、增强学生获取外界信息的能动性

我们很多学生在信息处理上获取能力和努力程度都不够。举个例子,有的同学物理成绩总是不能有效提高,在做物理练习时不能很充分地、努力地挖掘一些隐藏的信息。说白了就是审题不过关这是一个普遍的实际问题。审题不过关说到底就是方法、习惯不过关,要过好物理审题这一关,我认为要努力做到以下八个字:“眼看”、“嘴读”、“手画”、“脑思”。

“眼看”是前提:是从题目中获取信息的最直接的方法,也是解题的基础环节。

“口读”是强化:可以小声读或默读,是强化认知、接受题目信息的有效手段,这是一个物理信息的强化过程。

“手画”是手段、是方法:就是对特殊字、词、句、条件可以用符号(如○●◇◆△▲■□~*___等)标注;对题目中出现的物理情景、物理模型画一些必要的草图和变化的流程。草画图形,要搞清楚物理过程,还原物理模型,找出题目的关键之处,这是解题中很重要的一环,也是解题的突破口之一。

上一篇:高中文科学习方法下一篇:北京交通大学2011年自主选拔录取招生简章