大数据教育管理

2024-07-18

大数据教育管理(共12篇)

大数据教育管理 篇1

随着信息技术的不断发展和各种新媒体的不断涌现,人类社会迈入了ZB级数据量的“大数据”时代。大容量的数据及其蕴含的无限价值,不但会改变我们的思维,也实时影响着我们的工作和生活,甚至对国家经济和社会发展产生重要影响。作为科技创新与应用前言的高等学校,应用大数据这一新理念、新技术开展学生管理服务工作,将有效提升新时期学生管理的实效性。

一、高校学生管理大数据的内涵

(一)大数据的内涵

全球最具权威的IT研究与顾问咨询公司高德纳将大数据定义为需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产(2001)。麦肯锡环球研究院在其《大数据:创新、竞争和生产力的下一个前沿》报告中指出,“大数据”是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集(2011)。而《大数据时代》的作者维克托迈尔·舍恩伯格(2012)认为,大数据是人们获得新认知、创造新价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。

(二)高校学生管理大数据的内涵

信息技术的其普及与广泛应用,不仅推动了高等教育信息化的发展,同时也带来了学生学习、交流与生活方面的各种结构化的或碎片数据,大量数据的产生无疑将高校学生教育管理带入了大数据时代。高校学生管理大数据就是要整合校园信息资源,主动收集学生学习、生活和网络使用数据,充分利用大数据及其技术,分析和研究数据中蕴含的价值,进而促进高校学生教育管理工作创新。从这个观点出发,发展高校学生管理大数据,从揭示大学生学习、行为规律和高校学生教育管理规律,对推动高校学生教育管理工作创新与发展、丰富教育大数据理论研究具有重要意义。

二、高校学生管理大数据主要组成

目前,我国教育信息化从基础设施、数字资源、人才培训、关键技术及标准等方面都有了长足的发展。大部分高校在数字化校园建设的基础上,建设完成了完备的应用系统。信息技术的发展及其普及与广泛应用,不仅推动了高等教育信息化的发展,同时也带来了大学生学习、交流与生活方面的各种结构化的或者碎片数据,大量数据的产生无疑将高校学生教育管理带入了大数据时代,为高校学生管理大数据建设打下了坚实基础。

当前,大多数高校通过数字校园建设,形成了诸如学生行为管理系统、教务管理系统、图书借阅系统、校园财务系统、学生自主选学系统、精品课程平台、学生上网认证系统、校园门禁系统、学生校园消费查询系统等应用系统,在高校人才培养和学生健康成长方面发挥了重要作用。经过多年的运行,这些系统产生了大量数据,构成了高校学生教育管理大数据的主体。同时,学生在互联网和微信、微博等新媒体上产生的数据,也是高校学生教育管理大数据不可忽视的组成部分。根据笔者对这些数据的分析和研究,从数据的归属角度,把其初步分为下面几个方面:

(一)基础数据

这些数据主要涉及大量与学生相关的基本情况,诸如学生的基本信息、兴趣爱好、政治面貌、家庭情况、所属院系专业、入校成绩、是否外宿等数据。这些数据,往往反映了学生的学习基础、家庭背景等信息,掌握这些信息,将有利于针对性地开展学生教育管理和帮扶工作。

(二)学习数据

学校教务管理系统、精品课程学习平台等系统包括了学生选课数据、学生自主选学数据、学生课堂考勤数据、考试成绩、教师上课评价数据、学生参与讲座和学术报告的情况等有效信息,是学生学习行为的全面反映。图书借阅系统储存了学生所有借书信息,学生实践平台则记录了学生参与课外实践的数据。这部分学习数据蕴含了学生的学习兴趣和学习状态,可以成为学习推荐服务的重要参考。

(三)行为数据

高校学生管理系统是高校开展学生教育管理的主要信息化平台,其中蕴含了学生奖励信息、学生违纪信息等数据资源,这些结构化数据中蕴含了大量学生行为特征信息,可以作为学生行为分析的重要数据来源。

(四)资助数据

学生资助管理系统能够充分反映学生在校期间受资助的情况,学校财务系统则能够反映学生的缴费情况、勤工助学酬劳等信息,学生校园消费查询系统则能基本反映出学生在一定时期的就餐和其他消费情况,是分析学生家庭经济困难状况的很好参考。

(五)健康数据

校园网认证系统包含了学生经过学校校园网出口访问的所有网页信息,分析学生上网的目标网页内容,不仅能够反映出学生的兴趣爱好,同时也能够发现一些人格方面的缺陷。而学生心理健康管理系统等能够直接反映学生心理健康状况,为制定心理健康服务计划,帮助学生健康成长具有重要价值。

(六)社交数据

随着信息技术的普及,学生对使用网络和新媒体开展社交产生了浓厚兴趣。每天在QQ、微信、微博、传统的BBS等平台产生大量数据,这些数据不仅包含了学生交流的信息,也能够充分反映校园舆情,对掌握学生思想、心理等具有很重要的价值。

三、高校学生管理大数据建设思路

目前,对高校学生管理大数据建设的研究还很少,更多地是就高校大数据集成和典型应用方面的探讨。笔者认为,大数据时代运用大数据支持管理服务决策毋庸置疑。高校学生教育管理工作必须紧跟形势,运用好信息化技术和大数据这个方法论,全面更新理念,进一步树立数据意识,从顶层设计着手,认真组建专业挖掘团队,全面整合校内外数据资源,在健全安全机制的基础上,积极发展学生管理大数据,合理运用大数据的分析结果为工作决策提供数据支持。

从技术的角度讲,高校校园网中各个应用系统往往各自独立运行,加上互联网和微信、微博等数据的碎片化特征,要形成真正的大数据,还需要进一步制定政策,运用技术手段开展数据整合工作,通过全面整合,打通数据之间的壁垒,使沉睡的数据被重新激活,形成更大的价值。目前互联网技术已经非常成熟,加上近年来日益发展的云计算、云存储、NoS ql以及网络爬虫技术的发展,为高校大数据整合提供了技术基础。

从人才的角度,这些技术的应用,必须要有专门的团队支持。目前高校学生教育管理队伍难以满足数据驱动需求。因此要及时成立高校教育管理大数据工作领导小组,组建专门的数据收集团队和分析挖掘团队。运用计算机技术开展数据采集和数据融合,运用数学、统计学的原理开展数据挖掘与建模,形成预测和决策的数据可视化成果。把这些成果应用到高校人才培养中,实现个性化推荐学习资源、为学生量身定制学业计划、及时分析校园舆情影响、实时预测学生思想动态,将会有效提升高校学生教育管理的有效性。

从安全的角度讲,大数据时代如果不能确保数据安全,将会造成“大数据就是大风险”的可怕后果。高校教育大数据不仅整合了高校师生信息,也包括大量学生学习、生活和社交以及校园舆情方面的数据,将这些海量数据集中存储,虽然方便了数据分析和挖掘,但如果由于安全管理不到位造成数据丢失和损坏,则将引发毁灭性的灾难。同时黑客攻击或不当层面的数据公开,将会导致师生信息的泄露,给师生人身安全和校园声誉带来不良影响。因此,高校要在发展教育管理大数据的同时,切实加强制度建设,形成数据规范化管理,要明确数据管理的职能部门,制定严格的工作方案和预案,对什么数据可以公开,什么数据在一定层面公开,什么数据必须保密做出规定。同时也要对可能出现的风险建立防控预案,保障数据安全的同时,维护好师生和高校利益。

四、高校学生管理大数据的应用建议

笔者在总结现有研究的基础上,认为高校学生管理大数据主要在以下方面具有重要应用。一是建立教学资源推荐系统。通过整合学生基础数据和自主选学平台、图书借阅系统等数据,可以深入分析学生兴趣爱好与教学资源的关联关系,主动开展推送服务,不仅可以满足学生的学习需求,同时可以有效提升教学资源的利用率。二是建立学生行为预警系统。通过整合学生管理系统和教务管理系统,可以深入挖掘学生行为和学业之间的关联关系,建立相应的预测模型,对学生学业和行为进行预警,可以在问题发生之前采取相应措施,确保学生健康成长,顺利完成学业。三是建立学生心理健康预警与服务系统。通过整合学生基本数据和健康数据,可以及时筛查问题学生,主动开展心理健康疏导服务,把心理健康教育做到无形。四是构建资助认定与服务系统。通过整合学生基础数据、资助数据、行为数据等方面的信息,通过数据分析支持学生家庭经济困难认定,及时挖掘学生消费等信息,为学生资助服务提供数据支撑。五是建立校园舆情监测系统。通过整合学生社交数据,及时分析校园舆情影响、实时预测学生思想动态,将会有效提升高校学生教育管理的有效性。

参考文献

[1]维克托·迈尔-舍恩伯格.大数据时代[M].浙江人民出版社,2013

[2]邱启照,孙鹏.大数据时代高校思想政治教育的机遇和挑战[J].教育理论与实践,2016(9)

[3]梁家峰,亓振华.适应与创新:大数据时代的高校思想政治教育工作[J].思想教育研究,2013(6)

[4]“信息社会发展研究”课题组,张新红.中国信息社会发展报告2015[J].电子政务,2015(6)

[5]李怀杰,夏虎.大数据时代高校思想政治教育模式创新探究[J].思想教育研究,2015(5)

[6]胡晶君.大数据时代高校学生工作创新探究[J].太原大学教育学院学报,2015(4)

[7]桑庆兵.大数据在高校的应用与思考[J].南通纺织职业技术学院学报,2013(2)

[8]胡树祥,谢玉进.大数据时代的网络思想政治教育[J].思想教育研究,2013(6)

[9]张燕南,胡继岳.关于大数据应用于教育的思考[J].中国电力教育,2013(32)

[10]李彪.大数据视域下社会舆情研究的新境界[J].编辑之友,2013(6)

大数据教育管理 篇2

方存

内容摘要:

随着信息技术的飞速发展,税收征管也已经进入大数据时代,由于数据信息化的广泛运用,使海量数据的即时获取和精确分析成为现实,为研究纳税人办理涉税业务特征提供了良好条件,带来了税收服务手段、服务理念、服务载体、服务管理的大跨越……

关键词:大数据

应用

管理

信息化

现今很多人随时都会拿起手机发微信、微博,要购物不是上超市而是上淘宝、京东,外出就餐先看大众点评,有问题不是找老师而是找百度„„在我们的日常生活中,已经离不开这些网络应用。这些网络应用都有共同的特征,就是通过海量的数据,进行云计算后让用户获得到更好的应用体验。这些随时随地抓取数据的网络应用,让我们感受到,大数据的时代已经到来。

随着信息技术的飞速发展,税收征管也已经进入大数据时代,由于数据信息化的广泛运用,使海量数据的即时获取和精确分析成为现实,为研究纳税人办理涉税业务特征提供了良好条件,带来了税收服务手段、服务理念、服务载体、服务管理的大跨越。近年来,广东地税依据纳税人类别、涉税业务类别、办理时段等信息,依托数据信息化逐步形成了服务大厅、网上办税、纳服热线、自助办税、短信服务等多种渠道并存的大服务格局。

一、实现大数据管税的意义

从目前我们系统的数据量来看,还算不上真正意义的大数据。我们的征管系统中大量的数据都是传统的结构化的数据,已经达到了一定的数量,应该更多的是关注如何提高数据质量,如何应用好这些数据。而对于正在生长的海量的非结构化数据,则要关注怎么收集、用什么方式有效管理,从海量数据中发现有用的信息,深入挖掘分析、与征管系统数据综合利用,如何“要让睡着的数据醒过来”,转化为税源,才真正体现涉税数据的价值,才能实现“信息管税”。

在涂子沛的《大数据》中提出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。充分运用大数据的思维和手段,对于大力推进税收治理能力现代化,不断提高税收管理水平,意义重大。

二、当前税收数据应用管理的中存在的问题

近年来,地税部门在税收征管和信息化建设方面积累了大量的理论和实践经验,也取得了丰硕的成果。但受诸多因素的制约,在涉税数据采集、分析、利用等方面还存在一定的问题,影响税收数据的应用效用。

(一)征纳双方信息不对称日益突显

纳税人经营信息存在多样化和复杂化,地税机关获取纳税人信息的复杂性和工作难度明显增加,获得纳税人信息的渠道相对单一,主要是采用纳税人自报与税务机关根据自身工作需要进行采集所得到的信息。虽然省局与市局正在尝试进行政府部门之间的信息共享,但是这些仅仅是起步阶段,还没有完全形成有效、规范的机制。这些因素导致税务机关对纳税人生产经营状况、销售情况、生产成本等信息的掌握不全面,加上税务部门自身也没有一套完善的决策支持体系,严重影响税收数据的收集质量。

(二)税费征收管理系统过多,相互之间存在信息壁垒

目前,地税系统使用软件相对繁多,与税费征管有关的系统包括大集中征管系统、电子办税服务厅、税源管理平台、两业系统、数据综合展现平台、存量房交易计税价格评估系统等十多个操作系统,这其中有省局开发的,也有市局开发的。这些征管系统有部分在数据交换上互不共享,而软件开发公司也不一致,系统维护相对繁琐,给基层税务人员实际操作带来了很大的困扰。

(三)信息数据分析利用的广度深度不够

一是对现有数据的分析利用不足。目前的税收分析主要对税收任务的分析,只是局限于对某些数据的纵向对比分析。虽然这几年在这方面进行了大量的努力,但是没有形成长效的、可持续发展的数据分析模型,与宏观经济、市场变动、企业财务数据等联动分析不足,没有完全发挥数据信息利用应有的作用。二是税收业务与技术没有有效的融合。目前在基层税务机关这是最为薄弱的一个环节,业务与技术基本上还是各自为政,没有形成业务与技术的有效融合,导致对各方信息的横向比对和各时间段信息的纵向分析不足,从分析比对中发现问题的能力较弱,无法形成对信息分析利用的合力,制约了对信息的深度分析利用。

(四)专业信息技术人才缺乏,数据得不到有效利用

目前,以我县的干部职工为例,能够掌握比较系统的、全面的计算机知识的干部很少,另一方面,由于年轻干部交流频繁,精通税收业务的干部也不算多。因此税收信息化建设队伍任务繁重、人员不足、素质不齐等问题比较突出,高素质的专业化人才更是相当缺乏,即懂技术又懂业务的复合性人才更是屈指可数。这就造成即使拥有大量的有用数据,我们的基层税务人员也不懂分析利用,无法及时从中获取有效的数据信息。

三、完善税收数据应用管理的几点思考

(一)运用大数据的思维和手段,树立“信息管税”的新理念 我们都已清楚的看到,大数据时代所带来的思维方式、管理模式、监控手段等方面的变革,对税收征管工作带来了深远而巨大的影响,税收征管已经离不开信息化手段,紧密依托数据信息手段开展税收征管工作,已经成为税收工作的必然要求。结合风险管理和大数据理念,做为新征管改革的突破口,将大数据税收征管模式与先进的管理理念相结合,技术创新与管理创新相结合,通过税源监控、税收分析、纳税评估、税务稽查等质量控制手段,达到堵塞漏洞、纠正偏差、提高税收质量的目的。

(二)制定数据规范化,提高数据质量 要提高数据质量,必须要有数据管理标准和采集操作规范。一是要规范数据采集渠道。建立基层分局、县区局、市局、省局四级数据采集网,有条件的可设置涉税数据采集专业岗位,专门从事纳税人生产信息、交易信息、经营动态信息的采集。二是要加强数据质量的管理。按照统一标准录入有关数据,对采集的数据进行逻辑和真实性检验,把好数据进口关;制定数据审计规则,加强数据质量事中控制和事后比对,将数据质量纳入绩效考核,为数据应用提供准确可靠的信息来源。三是实行信息数据集中处理。建立覆盖采集、交换、分析、应用等主要环节的数据管理体系和运行机制,实现各个管理系统各类征管数据统一存储、加工和管理,实现各类信息资源互通互联共享,实现征管工作各环节在信息化支撑条件下的相互衔接。

(三)充分发挥政府职能作用,实现全社会的涉税信息共享 一方面,大时代数据必将全方位构建数据网络体系,通过政府部门建立大数据仓库,实施统一的信息管理平台,将工商、供电、建设、房产、交通、国土等政府各部门的数据实施统一管理,并对这些数据建立政府数据共享机制。另一方面,积极健全各政府部门间的信息网络,明确各部门通过网络获取信息的相应用户权限,彻底改变信息离散、各自为阵的局面,实现高效的信息共享,为税务部门全面掌握涉税信息提供强有力的外部环境支撑。同时,地税部门的反馈信息也可以帮助社会综合治税的成员单位掌握有关情况,查找各自工作中的不足和监管漏洞,共同提高管理水平。

(四)创新数据挖掘分析方法,打造智能税务

在调查研究的基础上,不断探索,创建科学有效的数据挖掘和分析体系。要建立税收数据仓库,对分散在各个应用系统中的数据进行集成、整合和统一管理,实现数据资源省级集中和共享,为数据挖掘分析提供基础支持。创新税收数据挖掘分析方法,应当注重五个结合:一是宏观与微观相结合。通过宏观分析了解本地区范围内不同行业、不同税种、不同类型企业的税收情况,找到税收管理的薄弱环节,对有疑点的企业、存在问题多的行业从微观上进行纳税评估、税务稽查,采取切实措施强化管理,堵塞漏洞。二是上级与下级相结合。瞄准税收管理现代化方向,省市县层层落实税源专业化管理思路,分级分类加强税收数据挖掘分析工作。三是全面与重点相结合。在全面分析的基础上,各地要结合本地实际突出重点,有的放矢地开展重点数据挖掘分析。四是定量与定性相结合,形成完整的科学的税收分析方法体系。五是动态与静态相结合。进行税收数据挖掘分析时,注意动态数据与静态数据的结合使用,坚持从经济看税源,从纳税人的发展看税源。

(五)培养复合型税务人员,满足大数据税收工作需要

人的因素是搞好一切工作的前提,实行税收现代化管理,必须培养复合型税务人员。复合型人才是“一专多能”、“多专多能”,以博见长,知识面广,易于融会贯通、触类旁通。培养既精通税收业务,又熟练掌握法律、财会、统计分析、计算机等方面知识和技能的复合型人才,是大数据时代税收工作对拥有复合型税务人员的需求。

在大数据时代,我们每个人既是数据的创造者,又是数据的使用者,这就要求每个税务干部,必须要有大数据的思维,运用大数据方法和手段,不断创新税收管理手段和方式,才能实现税收现代化。

参考文献:

(1)涂子沛《大数据》 广西师范大学版社,2012年7月(2)谢永健 《大数据:实现税收现代化的利器》 中国税务报,2014年9月17日

大数据吹响教育的号角 篇3

百度高考作文预测命中多省考题的良好结果,无疑为未来大数据改变和颠覆教育等传统行业留下了更大的想象空间。

有别于传统教育

更好地“因材施教”

在教育特别是在学校教育中,数据成为教学改进最为显著的指标。通常,这些数据主要是指考试成绩。当然,也可以包括入学率、出勤率、辍学率、升学率等。对于具体的课堂教学来说,数据应该是能说明教学效果的,比如学生识字的准确率、作业的正确率、多方面发展的表现率——积极参与课堂科学的举手次数,回答问题的次数、时长与正确率,师生互动的频率与时长。进一步具体来说,例如每个学生回答一个问题所用的时间是多长,不同学生在同一问题上所用时长的区别有多大,整体回答的正确率是多少,这些具体的数据经过专门的收集、分类、整理、统计、分析就成为大数据。

我们看一下传统的教育模式:铃声、班级、标准化的课堂、统一的教材、按照时间编排的流水线场景在这种模式下,分数就是一切,一个班上几十个人,使用同样的教材,同一个老师上课,课后布置同样的作业。然而,学生是千差万别的,不可能真正做到“因材施教”。而大数据教育将呈现另外的特征:弹性学制、个性化辅导、社区和家庭学习而这其中,人与人(师生、生生)的关系,将通过人与技术的关系来实现,正如时下的春节大拜年,不通过短信、电话、视频、微信,还能回到20年前骑半个小时自行车挨家挨户拜年的年代吗?大数据时代,无论你是否认同技术丰富了人类的情感,技术的出现,让我们再也回不到从前了。

随着技术的发展,大数据在教育领域有了越来越广泛的应用,学校拥有可用的、高质量的海量数据逐渐成为现实,但如何进行信息挖掘,给未来教育带来更大的可能,则对教育研究者的想象力提出了挑战。

近年来越来越多的网络在线教育和大规模开放式网络课程横空出世,也使教育领域中的大数据获得了更为广阔的应用空间。专家指出,大数据将掀起新的教育革命,比如革新学生的学习、教师的教学、教育政策制定的方式与方法。

教育领域中的大数据分析最终目的是为了改善学生的学习成绩。成绩优异的学生对学校、对社会、以及对国家来说都是好事。学生的作业和考试中有一系列重要的信息往往被我们常规的研究所忽视。而通过分析大数据,我们就能发现这些重要信息,并利用它们为改善学生的成绩提供个性化的服务。与此同时,它还能改善学生期末考试的成绩、平时的出勤率、辍学率、升学率等。

路漫漫其修远兮 仍将上下而求索

有多少教师能真正了解学生呢?微乎其微。在大多数教研活动中,如何评判一个课堂的好坏?更多是专家审美型的——教师的环节设计是否层层递进,提出的问题是否有效,环节设置与本节活动的目标是否契合,等等。而学生在这个课堂中的体验,大部分时间是被完全忽略的,即使获得了关注,也往往是“被代表”的——听课者会根据自己的经验来假设学生的体验,而学生真正的体验如何,却没有强大的技术与数据源可提供分析与实证。

大数据时代的到来,使得我们有机会和能力去弥补或改变现行教育中的不足。?

以往我们是怎样去了解学生呢?我们对教育教学过程和学生的学习情况进行数据采集和分析,包括学生整体的学业水平,身体发育与体质状况,社会性情绪及适应性的发展,对学校的满意度等等。这些数据是在周期性、阶段性的评估中获得的。数据反应的是教育的结果,学生的学科学习状况如何,生理健康与心理健康状态如何,对学校的主观感受如何等。

大数据有能力去关注每一个个体学生的微观表现——他在什么时候翻开书,在听到什么话的时候微笑点头,在一道题上逗留了多久,在不同学科课堂上开小差的次数分别为多少,会向多少同班同学发起主动交流?这些数据的产生完全是过程性的:课堂的过程,作业的过程,师生或生生的互动过程这些高度个性化的数据在每时每刻发生的动作与现象中产生,被完整的记录储存下来。经过整合这些数据能够给我们以启示:课堂应该如何设计才符合学生心理特点?课程是否吸引学生?哪个学生需要个别指导?怎样的师生互动方式受到欢迎?最重要的是,这些数据的收集只需要一定的观测技术与设备的辅助,在学生完全不自知的情况下就可以完成,不影响学生任何的日常学习与生活,是最自然、最真实的数据。

?所以,在教育领域中,大数据除体现传统数据的所有宏观功能外,还能收集分析详尽的微观个性化数据,大数据的优势立显。传统数据与大数据对比:传统数据诠释宏观、整体的教育状况,大数据还可以分析微观、个体的学生与课堂状况,用于调整教育行为与实现个性化教育;传统数据挖掘方式,采集方法,内容分类,采集标准等都已存在既有规则,方法论完整,大数据还可挖掘没有形成清晰的方法、路径、以及评判标准的新鲜事物;传统数据来源于阶段性的,针对性的评估,其采样过程可能有系统误差,大数据来源于过程性的,即时性的行为与现象记录,以第三方、技术型的观察采样的方式误差较小;传统数据分析所需要的人才、专业技能以及设施设备都较为普通,易获得,大数据挖掘需要的人才,专业技能以及设施设备要求较高,并且从业者需要有创新意识与挖掘数据的灵感而不是按部就班者。

利用目前较为成熟的信息技术设施,对学生个人在学习活动中的数据进行高密度和频度的记录积累、分析处理,从而为定量分析提供丰富的数据资源,这样就能够为我们提供大量、准确的数据,这些数据能够为我们更全面更深刻地了解学生及其学习情况提供支撑,使得我们过去想做而无法做到的事情,成为现实。

大数据时代教育数据价值挖掘 篇4

随着科学技术和现代网络的不断发展, 大数据时代越来越多的被人们提起, 信息爆炸时代数据量来临。通告显示:自2008年以来, 全球数据量的生产总和达到了0.49ZB, 随后的两年内迅速增长, 数据量总和分别为0.8ZB和1.2ZB, 到2011年更是达到了历史新高1.82ZB, 平均每个人数据产生量几乎为200GB。数据已经成为所有行业和相关业务领域不得不考虑的生产因素。如何高效利用和挖掘这类数据信息已经成为提高生产率以及消费者盈余模式的新的浪潮。大数据时代教育数据挖掘技术也会成为未来世界某一时间段的主流需求。

大数据时代学习分析技术

这是一门结合了测量收集和分析报告学生相关学学习信息和环境等内容, 并作出相关优化的技术。这一技术是对学生庞大学习数据的相关问题充分分析, 并对学生现阶段学术进展以及内在问题和未来表现的客观评估。它是在数据的基础上, 对学生学习以及学习环境的测评, 达到了解学生学习问题, 优化学生学习环境的目的。

大数据时代学习分析技术现状

相关研究表明, 学习分析技术在很多方面都具有非常重要的使用价值:

1.从学生方面来说, 学习分析技术在了解学生学习现状之后, 通过分析学生数据, 找出相关问题, 对学生学习过程进行优化, 帮助学生培养良好学习习惯, 从而达到学生自我学习的目的。

2.从教师以及管理人员方面来说, 学习分析技术可以评估教学课程和相关机构, 帮助同步改善学校既定考核方式, 深入分析教学数据, 为教师帮助学生解决实际问题指明教学不足和更优方法。

3.从研究人员方面来说, 学习分析技术是一种研究学生和网络学习的有效工具。

4.从技术开发人员方面来说, 学习分析技术管理系统各模块各不相同的使用频次和路径能有效指导系统界面的相关优化设计, 并可以完善系统日志相关管理功能。

大数据关键技术分析

1.学习分析关键技术与主要工具

⑴内容分析法

内容分析法是一种对文献内容作客观系统的定量分析的专门方法, 其目的是弄清或测验文献中本质性的事实和趋势, 揭示文献所含有的隐性情报内容, 对事物发展作情报预测。它实际上是一种半定量研究方法, 其基本做法是把媒介上的文字、非量化的有交流价值的信息转化为定量的数据, 建立有意义的类目分解交流内容, 并以此来分析信息的某些特征。

⑵话语分析

人文科学所有的知识分子都是在利用话语的生产模式来行使权力, 话语传播着权力的影响。在现代社会中, 它们就是权力的替代品。只有遵循话语系统自身的规律, 人们在生活中的表达和沟通才能有效, 否则就是痴人说梦。换言之, 可以这样来说, 现实并不是我们人类在创造、支配使用话语 (主体性解构) , 而是语言在建构我们的本质。掌握话语权的人掌握社会规范。

⑶社会网络分析

社会网络分析适合分析关系数据, 而用来分析其他类型数据对关系数据的影响。数据主要分为两类, 属性数据和关系数据, 属性数据指涉及能动者的态度, 观点, 行为方面的数据, 采用的方法主要是变量分析法。关系数据是关于接触, 关联, 群体依附和聚会方面的数据, 反映一个能动者与另外能动者联系在一起, 而不是单独的属性, 一般采用的分析方法是网络分析。另外还有一种是观念数据, 主要是描述意义, 动机, 定义和类型化本身, 主要是用类型分析的方法。

⑷聚类

聚类分析也被称为群分析, 它是在“物以类聚”这一理念之上, 对样品进行必要分类的一种相对多元的统计分析方法。这种方法专门针对大量的样品, 按各自的特性进行相对合理的分类, 即使未曾事先验知的情况下依然不会参考任何模型。

聚类分析是研究事物特性的个体方法, 可以把类似的事物分类整合。原则上依据事物的相似性进行归类, 具有以下三个特点:

(1) 非常符合检测未曾验证的事物。在没有数据标准参考的情况下, 设定相对完善的分类变量就可以对数据进行合理的聚合, 得到相对客观的分类信息。

(2) 能够处理多个变量决定的分类。多个变量的分类一般相对比较复杂, 聚类方法完全可以胜任针对此类数据的分类。

(3) 聚类分析法的探索性相对较高, 可以根据事物的内在属性和规律, 依据原则上的相似性对数据分类, 被广大工作者广泛应用。

⑸预测

根据已有数据或信息对整体或个体数据发展态势做出合理预测。

⑹关系挖掘

数据挖掘是一种在信息领域当中发展最快的技术, 许多行业中的佼佼者都从中获得较为广阔的发展空间, 这使得数据挖掘技术日趋被人们所关注。随着科学技术的不断进步, 采集数据的方法日益繁多, 因而使得庞大的数据总量几乎达到GB甚至TB级, 并且高维数据日趋主流化。此类数据以及数据的高维特征并不是传统数据分析方法可以轻易解决的, 这样导致数据的处理也愈来愈依赖计算机和网络。

⑺文本挖掘

文本数据挖掘 (Text Mining) 是指从文本数据中抽取有价值的信息和知识的计算机处理技术。顾名思义, 文本数据挖掘是从文本中进行数据挖掘 (Data Mining) 。从这个意义上讲, 文本数据挖掘是数据挖掘的一个分支。文本数据挖掘是一个边缘学科, 由机器学习、数理统计、自然语言处理等多种学科交叉形成。

2.学习分析技术模式

学习分析模式分为三大要素:“学习分析流程”、“工具与算法”和“数据与信息”。“学习分析流程”中包括数据收集、数据预处理、分析、预测和应用等环节, 不同应用情景下的“学习分析流程”各个环节都会有一定的区别;“工具与算法”是“学习分析流程”的有力支撑, 能够从“学习分析关键技术与主要工具”中选取出来;“数据与信息”不但有来自“工具与算法”数据, 还有将“工具与算法”的信息知识输出出去。

结束语

大数据时代的监狱管理 篇5

根据数据分析对管理的重要性,在《孙子兵法》中已有深刻的认识:“央未战而算胜者,得算多也。”,数据始终贯穿在监狱管理的预案、组织、实施、控制和创新中。在进入大数据时代后,如何更好的利用信息爆炸时代产生的海量数据为监管服务和利用数据创新监管模式是不可回避的命题。监狱管理决策日益基于数据和分析作出,而并非基于经验和直觉,对监狱正确的制度发展计划与合理安排警力资源有重要意义。其中预测在监狱中有重要的意义,在大数据时代,预测的准确度或许能够更上一个台阶,将促进监狱监管更加安全。

一、大数据时代的特点:

从古至今,从未有一个时代出现过如此大规模的数据爆增。信息技术的发展,互联网的普及,随之而产生的数据也呈现出爆发性的增长。① 到2012年为止,人类的所有印刷材料的数据是200PB,全人类历史上说过的所有话的数据量大约是5EB,而过去两年产生的数据占人类历史数据总量的90%。② 到2006年,全世界的电子数据存储量为18万拍字节,如今这个数据已达到180万拍字节,短短时间内已经增长了一个数量级。根据预测,2015年这个数字甚至会达到800万拍字节的规模。

大数据时代的典型特点是预测变得更为精确,艾伯特—拉斯洛·巴拉巴西提出:人类93%的行为是可以预测的。目前人类的数据处理能力在庞大的数据量面前还是太渺小,当数据处理能力的提示足以克服这一切后,混沌理论是否会黯然失色呢?一切都将变得清晰起来,偶然性也将因为盖然性变得不那么模糊?或许人类处理能力提升的速度远远都无法赶上数据的增长速度,混沌理论也将一直伴随着人类的发展。但不可否认的是,即使是现在的处理能力,大数据也能极大的提升预测的精准度。

二、大数据指教下的预测

预测对监狱的各项职能活动包括狱政管理、刑罚执行、习艺劳动、生活卫生等需要依据狱情进行调整的活动有重要意义。预测是整个监管系统的重要依据,具体地将,其重要性可以从以下几个方面来考虑:

① 对于狱政部门而言,预测可以提供决策的依据; ② 对习艺劳动部门而言,预测是监狱编制习艺计划的基础,是生产产值编制的主要输入;

③ 对生活卫生部门而言,为补充生活物资提供依据;

④ 对狱侦部门而言,预测是消灭狱内违纪,违法事件的参考; „„

其中,概率论在预测中不可代替的作用,当中的泊松公布P(入)是在概率论中常用的一种离散型概率分布,由于其适于描述单位时间(或空间)内随机时间发生的次数,因此泊松分布在管理科学,学以及自然科学的某些问题中都占有重要的地位。例如,在单位战略制定以及物资需求分析等方面有极大的应用空间。

但在大数据时代,泊松分布对人类社会的预测有极大的提升空间。

但在大数据时代,泊松分布对人类社会的预测有极大的提升空间。在数据不够充分的情况下,泊松分布在预测人类社会的事件时,事件的预测性与偶然性是等同视之。人具有主观能动性,从表面上看增大了预测的难度,但是在大数据的视角下,人的活动其实有极大的可

预测空间,偶然性对人类活动的影响是相对来说小得多的影响因素。我们不能忽视的一点是:每个人都是习惯的奴隶。大数据的意义在于经过整理大量数据后,那些本难以察觉的现象规律可以被发现,使它从一个变量成为常量。偏离了随机性通常意味着某种基本规律有待人类发现,因为预测时,将各种无法一时明了的因素都作为随机变量,而结果的不准确性也恰恰说明了其中的一些“变量”自有其韵律。大数据的典型特点就是区分可预测性与偶然性的时间,提升预测与管理水平。

合理而充分地运用大数据来提升预测水平,监管水平是在进入大数据时代后所必须面对的。信息时代的监管,不是警力谁加的监管,而是知识谁加的监管。数据是信息的载体,是知识的源泉。基于知识的监管,将集中表现为基于数据的监管,而这种数据的监管将成为监管发展的必然。这种监管要求监狱制主流线型的监管过程,各个过程之间必须无缝隙、无摩擦地对接,保证每一个管理决策明智,正确,在管理的过程中不犯错误。监狱要做到这些,必须广泛的推行以事实为基础的决策方法。在战略层面,大量使用数据分析来预测制定监狱发展计划;在监管层面,通过数据分析来优化监狱的各个环节,激发每位民警潜在的价值,从而节约警力保证监狱安全。

三、大数据与制度趋同

现在,各种分析模型以及深入到单位的制度制定中,包括:战略框架、基准化分析法、价值导向模型等等,随着各种模型不断的被应用,虽然这些看似差异的模型,却都指向合理地制度计划,这不可避免的出现了一个现象:制度趋同。产生的原因不外这些:

其一,表现为领导人的“从众”心态和追求“平安”的心理。在监区监管安全时期,制度趋同自然无可非议——谁能抵挡安全的诱惑呢?而在监管不稳定时期战略受挫也很好找到理由——我们都错了。

其二,参与和影响制度制定的领头雁同行体系、思维模式的同一化。我们现在的管理理论正日益成为一种要协执法的体系,而在形式差异化的外衣下该体系的核心正在不断被接受。

最后,安全性和确定性更加恶劣的监管环境也是促成战略趋同的因素之一。监区领导者的目标很简单,就是确保安全,实现产值增长。

在种种关键的情节下,不论是先进监区还是不那么先进监区谁能快速响应狱情和承揽加工情况谁才能从中胜出,此时此刻他每一个决策都直接影响监区的发展:作为先进集体,稍有迟钝,优势将不复存在,并将为此付出代价;作为不那么先进集中,能够敏捷地发现新的契机将实现管区的大发展。两者是利益相互对立的双方,高度复杂的狱情和承揽加工情况,两者的竞争将更加激烈。

但大数据时代是两面的,加剧竞争的同时,透过大数据也使决策更加精确,能以从前无法想象的速度快速响应情况变化。利用大数据,先进集体的决策能够极大地接近实际,在第一时间就做出符合情况变化的决策。不那么先进进体在这样的环境拥有极大的优势,充分利用变化能快速发现机会,凭借大数据能在极短的时间内作出正确判断。

在对大环境进行的分析和判断以确定制度制定时,有效的狱情分析和预测是前提,监区制度制定所需要的主要外部信息包括:单个罪犯、入监评估值、接见情况、身体健康情况、习艺完成情况、管区犯群年龄分布情况、余刑分布情况、困难户情况等等。管区定制必须要做调研,但调研也好、统计数据也好、都有人为因素。只有大数据,加上分析技术,才可能是接近狱情真实信息。大数据和调研相互印证,更能提高定制度的正确概率。

四、大数据在监狱管理中的具体应用

1、真正实时的了解罪犯 在过去,监狱普遍通过积分系统找出听话罪犯和违纪次数找出不听话罪犯,对罪犯的好与坏的判断,往往是经验主义的指挥,而利用大数据,这种状况将不再发生,大数据能够帮助监狱完全勾勒出罪犯的实时状态,充分了解罪犯是有效的与改造罪犯的关键。当然,监狱

要确保罪犯的权利不受威胁,大数据可以为罪犯提供针对个体罪犯的十分个性化的改造措施。使用各类数据分析,监狱可以充分了解每一名罪犯,实时的知道罪犯想要什么,以及何时想要。

2、监狱制定,改进和创新改造措施

大数据分析可以帮助监狱更好地了解犯群的情况。通过狱政,狱侦等科室收集数据,特别是当这些信息是实时收集时,监狱可以立即有针对性的对可能存在的问题做出改进。这样不仅可以很好的评估现有改造措施,同时还能够收集到警群与犯群对该项措施的评价。

3、确定监狱面临的风险有多大

确定监狱所面临的风险是今天监狱管理的一个重要方面。为了确定一个潜在的罪犯的风险,需要对罪犯进行归类,每名罪犯都有自己的风险水平。更多的时候,如果罪犯被归类到一个错误的类被,无疑将导致错误的风险。利用大数据可以针对每名罪犯过去和现在的实时数据有针对性的确定风险类别。

4、更有效地组织监狱以节省资金

大数据时代的大学教育 篇6

一、中国教育现代化进程

传统文化道德书籍,如《四书》、《五经》等,蕴含着中国传统文化儒家教育思想,是古代有关中华教育的典型代表,以道德修养、品格完善为要著,使人在修身养性的基础上学习知识,至今意义重大、影响的深远。当今社会由于种种因素,有些人对现代社会道德感到失望,尤其对人情冷漠等问题提出质疑,社会和教育界应反思是否丢弃了最基本的东西。随后,人们重新对儒学产生兴趣,是因为在寻找思想寄托,仁义礼智信、温良恭俭让的传统道德理念对失望的人和寻找社会正能量的人来说,是一个绝好的有意补充。如今,随着中国崛起和国力强盛,作为亚洲传统文明古国的中国,我们应该靠仁义、礼仪和文化成为亚洲文化圈的中心。现代中国不仅应在经济方面超越其他国家,更应该是文化强国、教育强国。教师应研究教育问题,教育学生“为往圣继绝学,为万世开太平”,以“信义”为先,遏止社会道德腐败堕落之风,重振华夏文明。改革开放以来,中国经济有了很大发展,但是中国社会道德风尚和社会文明却与之不相匹配地出现倒退现象。尤其中国教育并未随着经济发展得到更全面、更完善地发展,造成国进民退、国人素质不高等问题。自中国近代化以来,大学教育都是培养中国知识分子的主要途径,知识分子一直是国家建设的栋梁和精英,但是也出现了种种问题。究其原因,有许多方面,如学术腐败,大学教育功利化、职业化,缺少人文精神和学术信念。从教育角度分析社会道德问题,讨论社会文明是否依靠重振中国人传统道德保持,在大数据到来的今天,已经是当务之急。

二、大数据与大数据时代

大数据是信息革命的又一座里程碑。互联网、WEB2.0、物联网、移动互联网、云计算等相继进入人们的日常学习、工作和生活中,全球数据信息量也呈指数式爆炸增长之势。根据国际数据公司 IDC发布的研究报告,2011年,全球创建和复制的数据总量为1.8ZB(约1.8万亿GB),预计全球数据量大约每两年翻一番,到2020年,全球将 达到35ZB的数据信息量。对此,中国工程院院士李国杰指出大数据将成为信息科技的新关注点,并形成新型交叉学科,即网络数据科学。所有的这些数据都预示着大数据于大数据时代的到来。那么大数据有着哪些特点呢?对于大数据时代,IBM认为其具有“3V”特点,即种类(Variety)多、速度(Velocity)快、容量(Volume)大。但以IDC为代表的业界认为其满足“量大、多样化、快速化、价值高和密度低”的“四V”特征。这也促使我们去认真的思考,是选择原有的“质朴式教育”还是与时俱进的“富裕式教育”。

大数据时代教学媒体的广泛应用,极大拓展了教学活动空间,使教师手中可利用的媒介空前充裕。与此同时,网络资源的丰裕和知识共享的便捷,使得学生获取教学 知识的方法和途径也得以极大扩展。面对这种情势,我们倍感欣慰,但又不禁忧虑:高等教学活动是否会因而变为先进教学媒体的展览?会不会因此蜕变成为单纯的教学媒体的充分使用,而忽略了使用它们的最初目的?有些教育研究者主张,我们应该抛弃这些繁复和丰富的教学工具,从以多媒体为主要媒介的“富裕式教育”返 回到以教师自身及其功能为中心媒介的“质朴式教育”之中。而所谓“质朴式教育”,是指很少甚至不借助于现代教学媒体。这种教学模式有许多优点,如学生可看到教师讲解的全过程、各种表情和感情表达,能及时进行互动交 流。但其也有很多弊病,这种由教师、学生和教材三个要素构成的教育模式主要由教师控制,学生这个学习主体未能参与控制,教师的主导作用被任意夸大并绝对化。

当今的时代已不再是孔子和苏格拉底依赖口口相传的“质朴教育”时代,事实上,以海量数据为代表的大数据时代不论是一个威胁,还是一个机遇,都是当今高等教 育教学方式所要面临的一个挑战。相较质朴式教育,“富裕式教育”有更大的优势。我们与其自我陶醉于“质朴式教育”的怀旧梦中,还不如理性面对如今教育媒体 日益繁复、知识共享不可逆的“富裕式教育”的现实,思考如何利用大数据的优势提高学生的学习水平与认知能力。那么在大数据时代来临的今天,中国高等教育将何去何从呢?

三、大数据时代中国教育的未来

大学教育是第二次产业革命时为了適应工业所需的产物。当今,学生知识的来源不再局限于课堂,不再拘泥于某一个专业,他们可通过互联网、微信、微博等信息平台来获取文本的、图像的甚至是视频的各种知识。学生的知识面将比以往任何朝代更加宽范,对校园以外世界的了解将更加深入。然而我们必须清醒的认识到,在学生从课堂走到互联网时,未来的学校存在的意义在哪儿,是学校更应该关注与关心的。学校应该重视图书馆电子资源的建设和开放,应该重视实践实验室的建设,提供更多方便学生来进行实习和实践训练的场所和项目。比如现在的在线教育平台edX和Mooc,上面有世界著名学府的各种课程,包括我国清华和北大的优秀课程。学生只要通过互联网,就可以接受到名校的教育,在学习过程中,通过鼠标点击的记录,可以研究学习者的活动轨迹,发现不同的人对不同的知识点有何不同的反应,用了多少时间,哪些知识点需要重复或强调,哪种陈述方式或学习工具最有效。由此可见,网络对于教师的存在感也提起了挑战。在大数据时代,教师的教与授又该体现在哪儿呢?教师应该深刻思考,改变传统的课堂教学的思维模式。我们可以将教的过程放在网络平台上,放在课前来进行,课堂中以学生做作业、教师指导和答疑为目的。这只是改变了传统的教学模式,对于教师自身又该如何呢?在面对丰繁复杂庞大的数据时,我们应积极跟进发展自我,重新进行定位。一类应加强自己的实践操作能力,专业从事实践辅导和教学;另外一类专业从事研究,抓住大数据所给予的机遇,发展自己,对专业进行解惑和学习方向的指导。知识和信息量极大丰富,学生们该如何从中甄别出有利于自己的知识,对自己进行特色化的教育,需要自己的判断力和教师、家长的指导。学生们应该利用已有的学习平台和学习媒介,不断提高自己的自学能力,发展自己的创造性和创新性的能力。

因此,我国高等教育教学方式应该紧随时代和社会的要求,及时进行变革。按照古希腊人赋予教育的本义:学习思考的语言,获得知识和某项技能,培养良好的公民 素质和健全的人格。高等教育必须有新的思维方式和价值观念作为指导,从“质朴式”发展为“富裕式”,由“灌输式”向“交互式”转变,打破高等教育仅仅局限 于理论的界限,树立开放式、批判式的教育观念,这样才能与大数据时代的发展相一致。

四、小结

教育大数据的未来 篇7

啤酒和尿布是顾客群完全不同的商品, 但沃尔玛一年内数据挖掘的结果显示, 在居民区中尿布卖得好的店面, 啤酒也卖得很好。原因其实很简单, 一般太太让先生下楼买尿布的时候, 先生们一般都会犒劳自己两听啤酒。这个故事被公认是商业领域数据挖掘的诞生。在健身馆里, 教练可以根据你的年龄、性别、体质等要素, 制订符合你要求的个性化健身方案, 依此锻炼, 会更有效。

那么, 我们的课堂教学能够如此吗?根据每个学生的水平、接受能力, 有针对性地做个性化解决方案, 岂不是更有利于提高学习效率、减轻学习负担, 进而提高成绩吗?以平板电脑为载体, 收录课本内容和课后习题, 对学生做题习惯、计算能力和速度, 甚至是学生的性别等数据进行个性化分析, 在课前、课中、课后、考前、考后, 为学生提供适合其本人综合素质的个性化学习方案, 从而帮助教师找到教学侧重点, 提高教学质量。这就是浙江浩浪科技集团CEO俞乃博先生日前在上海参加“2012长三角地区中小学电子书包创新教学应用研讨会”期间描绘的美好愿景。

目前, 这样的教学模式已在杭州二中实验多年, 教学效果不错。“未来校园”也叫“智慧校园”, 是一款专为学习设计的软件, 功能很多。学生做作业, 比如选择题, 填写答案提交后, 系统能立即判断对错。错题信息同时录入后台系统, 成为理科生最常用的电子“错题集”。经过一段时间的做题, 系统会分析出全班学生常犯错的地方, 以及不同学生的差异等细致数据, 教师就能进行有针对性的教学。系统也会根据学生做作业时常犯的错误, 给每位学生“量身”布置作业。这样的智能软件竟然出自一位85后董事长领导的团队。

俞乃博, 浙江浩浪科技集团董事长兼CEO, 19岁就成为计算机高级工程师, 2011年夏季达沃斯论坛荣获全球杰出青年称号, 首任杭州高新区 (滨江) 青年创俱乐部主席, 首个获得YBI (青年创业国际计划) “年度企业家奖”的中国人。YBI赛区, 30多个国家200多位优秀青年带着各自的梦想和计划聚首伦敦, 俞乃博以其出众的商业计划和创新的商业模式, 毫无悬念地夺得了年度企业家大奖, 他得到了巴克莱投行首席执行官瑞克瑞慈的高度评价, “在传统教育上的创新与发展让他与众不同”, 使他最后征服了评委的心。

俞乃博认为, 当下中国教育面临的主要问题是有太多没用的资源, 而缺乏的是优质资源, 如精品微课程。好老师少而集中, 且培养成本高, 优质资源在各校间的不共享也影响了教学质量的提升;而效率低则是教育的另一根软肋。俞乃博在“2012长三角地区中小学电子书包创新教学应用研讨会”的发言中还说, 现在的学生和家长除了找好老师好学校, 还在苦恼着如何能够“少学一两个钟头”, 这是现在低下的学习效率所导致的。所以, 创业者应该通过现象去了解问题, 并且思考解决方法, 考虑用户需要才能创造出受欢迎的产品, 并且提高社会生产力。

大数据与应急管理 篇8

大数据的内涵及应用架构

首先, 按照麦肯锡全球研究所 (Mc Kinsey Global Institute) 对大数据的内涵定义, 大数据指的是超出常规数据库软件工具所能捕获、存储、管理和分析的超大规模数据集。从数据集的特点入手, 可以界定大数据的4个主要特点, 即规模性 (Volume) 、多样性 (Variety) 、高速性 (Velocity) , 以及低密度价值 (Value) 。大数据是人们获得新认知和创造新价值的源泉, 并已成为改变市场、组织机构, 以及政府与公民关系的新方法。

其次, 大数据在不同领域内有不同的含义, 可从现实和技术两方面加以阐释:第一层意义上的大数据指的是数据的巨量化和多样化。从现实层面来讲, 指的是海量数据;而从技术层面来讲, 指的是海量数据存储。第二层意义上的大数据指的是大数据技术。从现实层面来讲, 指的是对已有或新获取的大量数据进行分析和利用;而从技术层面来讲, 是指云存储和云计算。第三层意义上的大数据指的是大数据思维或者大数据方法。从现实层面来讲, 指的是把目标全体作为样本的研究方式、模糊化的思维方式, 以及侧重相关性的思考方式等理念;而从技术层面来讲, 是指利用海量数据进行分析、处理, 并用以辅助决策, 或者直接进行机器决策、半机器决策的全过程大数据方法。这种对大数据的认知方式涉及到“大数据项目”或“大数据技术应用”认知, 并由此可以延伸出大数据视角下的应急管理方式。而大数据在应急管理中的应用主要有大数据技术和大数据思维两种方式。在应急管理的事前准备、事中响应和事后救援与恢复的每一阶段都可以引入大数据的应用, 每个阶段对大数据的应用程度会因需要的不同, 其应对内容也会有所差别。大数据在应急管理中的应用, 有助于提高应急管理效率, 以及节省成本和减少损失。

最后, 大数据在应急管理中的应用方式分为两部分:大数据管理技术和大数据分析与思维。大数据管理技术既包括诸如数据仓库、数据集市和数据可视化等, 也涵盖了云存储、云计算和云安全等;大数据分析与思维则是从海量数据中发现问题, 用全样本的思维来思考问题, 形成了模糊化、相关性和整体化的分析研究和思维方式。大数据的管理技术与分析思维相互融合和作用, 共同形成了大数据的应用, 其应用通常包含4个特征:快速的收集、分析、决策, 以及迅速准确的反应。这些特征在应急处理中具有实用意义, 在事件或人的行为预测方面, 具有更及时的预见性和更高的准确度。

不同阶段的大数据应用

按照突发事件发生的时间顺序, 其应急管理大致可分为事前、事中和事后3个阶段, 具体包括预防准备、监测预警、应急处置、善后恢复等多个环节。当前, 大数据在应急管理中按照事前、事中和事后应用的基本框架加以设计。但由于应急管理针对的事件类型不同, 并非所有的应急管理都会涉及3阶段应用, 可能有时候只涉及其中1个或2个阶段, 而关键就是其管理模式和思维的变化。所以, 大数据在应急管理中的应用, 一定不能单纯技术导向。

事前准备阶段需要为大数据的应用进行相应的管理和设施准备。管理准备指的是与大数据管理、大数据方法相匹配的人事准备和管理提升。设施准备指的是大数据应用所需要的硬件和软件设施。硬件设施主要涉及新技术背景下的数据采集, 软件设施不但涉及到新数据的采集, 也可针对旧的数据进行分析和挖掘。其中, 特别容易忽视的是人员的教育培训, 包括:一是对中上层管理人员的培训和管理;二是对基层管理人员的培训和管理。目前尤其需要强调的是各级人员的大数据意识和数据累积叠加效应, 以及对大数据的分析方法与分析结果的识别培训。

事中响应阶段大数据的应用能为政府、第三方组织或个人开展应急响应提供很大便利。对于政府而言, 大数据化的应急管理意味着技术支撑基础上的融合与协作, 其不但为协作带来很大便利, 也平衡了日常业务的连续性和应急处置的及时性;对第三方组织或个人来说, 大数据可为应急管理提供更加便捷灵活的手段。例如, 应用大数据可以在宏观和微观等多个层面实现多元应急合作。在宏观层面, 整个应急响应可以分为决策指挥、现场应对和外界援助等, 这之间以海量数据信息、高效计算能力和数据传输能力为基础, 实现信息的有效沟通和机器预测预判, 以帮助指挥部门协调各方进行现场处置和救援, 并与外界通过信息沟通寻求援助, 实现多元化协作的应急处置;在微观层面, 应对部门需要在应急处置和业务连续性之间保持平衡, 而以大数据为基础的决策支持系统将成为强大的信息管理系统, 能够做到实时报告且操作简易, 并能同时集合多项关键指标的高效指挥决策辅助系统。通过集成不同部门提供的信息, 将其统一纳入到大数据支撑的决策支持系统, 在其支撑下, 有助于推进各部门的及时沟通, 为突发事件的处置提供有效的应急处置和充足的物力资源, 以及及时的导航信息和必要的建筑图纸等, 以有效调配可用资源, 提高响应速度。

另外, 大数据的应用能更好地发挥出第三方组织或个人的作用。例如, 在美国的南加利福尼亚州森林大火中, 民众就是以网民绘制的火情地图为指导进行逃生和避险的, 这种应对方式常常比政府的信息方便快捷, 其成本远比政府漏报的成本低。在整个事中响应阶段, 大数据的应用核心环节之一是实时高效的数据信息收集, 以及信息数据的迅速传递。实践证明, 根据应急管理主导者的不同, 数据收集有两种发展趋势:政府主导的专业应急管理团队信息收集逐渐专业化和高效化;以大众和媒体为依托的第三方应急管理力量, 则将信息收集方式发展为简单化和大众化。

事后的救援与恢复重建大数据在应急管理事后的应用主要是救援与恢复重建。目前, 在应急管理的应用上已开始探索社交网络平台和移动互联网, 以及使用“分众”方式加以实现。“分众”是由大众通过网络分散完成工作任务, 并通过整合后在网络上提供服务的一种方式。使用“分众”方法是依托社交网络平台和众多参与者, 利用互联网特别是移动互联网, 汇聚大众力量进行事后恢复与救援, 实现了及时捕获信息, 大众甄别信息, 以及机器分析和迅速响应。经过社交平台众多参与者的共同努力和云服务平台高强度计算分析能力所获的信息, 并根据计算机给出的建议, 协助应急处置人员设计救援路线及配置救援装备, 以最快速度抵达救援地点。比如, 在2010年海地地震救援中, 以“目击者”为代表的非营利网站, 就利用“分众”方法起到了重要作用。

大数据的应用创新

当前, 要高度重视大数据应用的基础设施和基础环境的准备工作, 其包含整个应急管理的价值链和产业链。例如, 要高度重视传感器的研发、生产、应用和部署, 随着技术的不断更新, “传感器”将成为大数据应用中的重要一环。20世纪60年代以来, 美国为预防风暴和海浪袭击建立了海浪检测系统。2005年, 国家数据浮标中心在其原有设备的基础上架设了大量新型海洋地理传感器, 包括海浪流向传感器等, 传感器会实时产生大量数据, 用以实时监测海浪情况。该项目在全部联网完成后, 已产生极大社会价值。当然, 更重要的是要做好大数据的应用准备及所需要的软件支撑, 包括分析方法和数据处理方法的改进, 以及多源数据的融合分析和可视化技术等, 这些技术是充分挖掘原有数据并使之产生价值的关键所在。

此外, 欧美一些国家已开始把大数据运用到应急管理中, 并取得一定成效。我国虽然开始关注大数据的应用, 但相关研究还比较缺乏, 亟待进一步研究大数据在应急管理中的应用方式和基本框架, 以及借鉴国外在此方面的实践案例。近年来, 大数据在我国应急管理领域也得以积极应用, 其中之一就是在旅游领域。为了应对旅游中意外事件发生, 一些地区和单位正在探索结合云计算、大数据和移动通信基础能力, 开发动态人员流量大数据分析平台应用服务。尝试利用该平台介入旅游景点, 为景区旅游管理单位提供游客流量统计、游客客源分析、景区热点排名等数据分析服务, 协助旅游管理单位进行精准的宣传推广和景点导览规划。例如, 在2014年浙江省乌镇举行的首届世界互联网大会上, 动态人员流量大数据分析平台登台亮相, 实时分析会场区域的人员及行为数据, 发布参会的客源国籍、终端类型、热点应用、内容关注度等数据, 并分析发布了会场嘉宾年龄、性别比例, 以及流量使用偏好和消费能力等信息, 这些都展示了移动大数据的综合分析能力, 为其应急处理提供决策保障和信息支撑。

尽管大数据技术已在我国的社会应急管理体系中初步得到应用, 但与发达国家相比, 还需要进一步加快推进应急管理体系的科技创新, 主要有以下3点:

一是要充分利用大数据技术来提升应急管理的辅助决策能力, 包括加大对大数据技术研发的投入, 鼓励和扶持企业对大数据应急管理的应用, 加大高科技应急管理人才梯队培养, 以及加强对前沿技术的应用能力, 把围绕大数据技术的应用和管理模式创新, 作为我国应急管理体制下一步改革的新方向。

二是加强应急协作和数据共享, 提升社会应急管理成效。通过“物联化”来收集数据, 建立“数据共享机制”和“有偿共享服务”机制, 加大数据开放, 使广大公民和企业可以便捷地享受优质的公共服务;进一步提升国家应急支撑平台的信息化协作能力, 以借助大数据工具的深化分析, 优化应急管理流程和应急预案, 使各种突发事件可以被迅速有效地应对、解决, 保证城市各个系统高效顺畅地运转, 以及可持续发展。

大数据时代的教育管理变革 篇9

云端技术是一种软件技术,具有超强的存储功能,这种软件最本质的意义就是对信息进行有效处理,而且成本非常低。因为这种“云”软件的产生,使信息向“大数据”转型。所以,由信息时代进入了大数据时代。由于云技术和大数据的处理,揭开了智慧世界的神秘面纱。现代的教育管理也是运用这种软件进行信息处理,教育管理也就由此进入大数据时代。在大数据时代,教育管理具有很多特征。

1. 超级体量

从“数据”的角度来讲,教育管理所涉及的数据是非常巨大的,且都无法用现在的数据库服务器对教育数据进行管理。

2. 类型繁多

教育数据体量非常宏大,这是信息数据化所造成的。教育本身就是非常庞大的系统,同其他领域所形成的数据一样非常巨大,这样巨大的数据就通过视频和音频、文本在云端进行书写。

3. 处理速度迅速

教育管理所使用的大数据处理速度非常快,灵活性非常强,对动态的教育数据处理起来非常简便,大大降低了时间,提高了教育管理效率。

4. 低密价值

教育管理所包含的大量信息是需要对其进行甄别的,并不是所有的数据对管理都有用处,只是有的数据对管理起到作用。因此,数据处理就是对大量信息进行辨别,去除没有用的信息;把有用的信息留下,对信息进行处理。

二、大数据时代教育管理所考虑的问题

1. 资源配置

教育改革的最本质的问题就是对教育体制进行改革,而教育体制的改革则是对资源进行配置。在大数据时代,教育资源体量非常大,结构非常繁杂,状态缺乏稳定性,因此资源配置仍然是非常突出的问题。如果用手工手段对其进行资源配置是难以完成的,这就需要运用技术手段,这是一个非常棘手的问题。

2. 价值取向

教育管理需要进行评估,通过评估,可以发现其中存在的问题,从而采取措施对其进行改进,评估中最为重要的是价值取向问题。当前应试教育还影响着人的价值取向,这会对教育评估带来很大影响。

3. 科学技术

在教育决策中需要更多的科学技术。在进行决策的过程中,其可行性、合理性和实践性都需要科学技术作为支撑。在制定政策的时候,要以数据为依据和导向,对数据进行科学处理,实现教育的目标和任务。

4. 专业能力

说到底,教育管理归结为管理者自身的专业能力。在信息化时代,教育者自身的素质受到考验。在大数据下,对教育管理者专业素质的要求更加严格,需要加强信息技术管理。

大数据时代下,对教育管理既是一种机遇,又是一种挑战。教育管理在面临挑战中,显得力不从心,只重视硬件的建设,对管理者的信息化能力却不够重视。教育管理需要大数据处理,更需要教育云的支持,要建立起更加智慧的管理系统,更好地推进教育管理。这使得教育管理在大数据下面临双重考验。在信息化管理过程中,要实现大数据处理,就必然会引起教育管理模式的变革,使其适应新的形势。

三、大数据下教育管理模式

大数据时代的到来,对教育管理模式产生了巨大影响,需要对其进行创新,以适应大数据时代的发展。

1. 教育管理的大数据特征

一是大数据的发展,为教育管理提供了更加开放的环境。开放性对传统教育管理而言,可使信息更加灵通,信息不再被分割,而是相互统一起来,做到了信息的共享,在管理中对信息的利用程度更加方便,这就使教育管理环境变得更加优越。这种开放的环境,对教育管理将会产生巨大作用。二是大数据的原始特征以及处理速度极快,使得教育管理零散化。教育管理和教育活动是一致的,也是同时进行的,大数据包含了教育的所有原始数据,其会对这些数据进行即时处理,因此,在教育管理上就体现为碎片化。三是大数据的低密价值,使得教育管理向简约化和专业化发展。教育管理不光是对教育信息存储,更重要的是对大量的信息进行处理,实现教育管理的有效化和高效化。

2. 大数据下教育管理模型建立

在大数据时代,其所支撑的教育管理模型为:第一个是主体,第二个是对象,第三个是资源,第四个是目标;这种模式中,主体有社会、政府、校长和老师;对象为社会、校长、教师和学生;资源为人力、技术、财物和知识等;目标为人的发展、能力提升、服务体系和智慧教育。

在大数据时代,教育管理主体更加多元化,同时专业化也发展起来,这两个特征就使得教育管理呈现出两个特征,即专业化和多元化。教育管理体制多元化,把社会中的专业机构融入管理中来,对某一领域的教育进行管理,比如在教育评估中,校长和老师是管理主体,让更多的教师脱颖而出来对学校进行管理,这是实现校本管理的重要标志。

在教育管理过程中,管理者对教育数据进行搜集和汇总,同时可对其他教育资源进行搜集。除了教育内部人员以外,其他部门的人员也可以提供数据,即表明教育管理非常复杂多变。

在对资源进行配置的过程中要对资源进行科学分类。在教育中,最为核心的资源就是人才资源。人才资源包括两种,第一种是教育人才;第二种是所培养出的人才。财务资源是教育的硬件设施,它对硬件进行配置。知识资源包括很多种,它表现得不够明显,属于比较隐性的资源,对教育管理的创新起着决定作用。技术资源对管理提供技术,保证教育管理模式的变革。

在大数据时代,教育管理目标是建立现代教育治理体系。在管理中,实现教育的公平,让每个人都享有教育资源,利用教育资源,对教育资源做到公平。在大数据时代到来的今天,必须对教育模式进行改革,保障教育管理的有效进行。

总之,在大数据时代,要充分利用大数据的先进性,实现教育管理的全面进步,改革教育体制,创新教育管理模式,实现教育的公平化。当今,教育管理向大数据融合,实现教育信息化,把繁杂的数据进行处理,实现教育管理全面发展。当然,要想使大数据和教育管理的融合,并不是一个简单的过程,它需要不断地去磨合、去探索,只有这样才能使教育管理和大数据实现完美融合,促进教育管理向着现代化迈进,为社会提供更好的教育环境。

摘要:大数据犹如洪水般,改变了人们的生活和工作。当前,教育管理中存在的重要问题就是如何与大数据时代相互融合,充分运用信息技术,提高教育管理效率。但是,在教育管理与大数据结合上还存在诸多的问题,需要不断努力,做到两者的完美结合,取得最佳效果。

关键词:大数据时代,教育管理,变革

参考文献

[1]胡弼成,王祖霖.“大数据”对教育的作用、挑战及教育变革趋势---大数据时代教育变革的最新研究进展综述[J].现代大学教育,2015,(4):98-104.

[2]赵萃.大数据时代教育管理信息化的困境与突围路径[J].中国成人教育,2016,(3):43-45.

大数据教育管理 篇10

进入大数据时代,人们得以从更全面、更精细的视角来看待世界的复杂性。在教育领域,大数据蕴含的巨大潜力在于推进个性化学习、改善教材和教学,并最终提高学生的成绩,而这些作用也必将在高等院校教育中得以体现。尤其是处于互联网+教育的当下,高等院校开展的各项教学活动,产生和使用了海量数据。在此背景下,抓好教育数据建设,将其转化为对高等院校教育决策和综合信息服务的有力支撑,切实有效推动高素质创新型人才培养,就显得尤为重要。

大数据产生背景及其本质分析

大数据产生的背景

最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“我们正在处于一个创新和生产效率快速增长浪潮的潮头,面对着全新的竞争和价值获取模式——所有这一切的推动力就是大数据,消费者、企业和经济部门都在发掘其潜力。”

大数据具有鲜明的时代特征,其产生根源主要是信息技术革命以及信息技术驱动下人们行为方式的改变。过去的50多年里,信息技术不断创新发展并被广泛应用于各行各业,触角遍布社会生活的每个角落,改变着社会的经济结构、生产方式和生活方式,由此产生了海量数据,并呈指数快速增长。究其具体原因,包括以下四个方面:

(1)互联网的广泛应用,吸引和驱动了数以亿计的用户使用互联网进行商品交易、资讯浏览、资料查询、聊天交友、信息共享等,网络应用与用户的操作内容、操作行为共同成为海量数据的重要来源。

(2)移动通信网广泛应用并与互联网结合的越来越紧密,越来越多的人通过以智能手机为典型代表的移动设备进行语音视频通话、短信交流以及访问移动互联网,也带来了数据量的激增。

(3)传感器的广泛使用,产生了大量的实时状态监测数据、影像数据,这些数据持续快速产生,并占据了较大存储空间。

(4)传统文档资料的电子化处理,便捷了查询使用的同时,也产生了大量数字化信息资源。

大数据的本质分析

当前,“大数据”这个术语已被广泛使用,其主要特点可归结为高容量、多样性、快速性和价值低密度四个方面,但对其概念的界定尚未达成共识,不同角度有不同的定义和描述。国际数据公司IDC将其定义为:为了更为经济的从高频率获取的、大容量的、不同结构和类型的数据中获取价值,而设计的新一代架构和技术。高德纳咨询公司Gartner将其定义为:需要新处理模式进行处理才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据的定义与特点既体现了大数据的存在状态,又体现了大数据面临的难题与矛盾,这些必将引发和推动数据存储技术、管理技术和分析技术的革命与创新,最终形成一系列信息技术来为决策服务。因此,大数据的本质集中体现为:

(1)数据本质:是指大数据的数据量远远超过传统理解上的数据量,数据类型和数据来源多样,数据产生速度快及要求的处理速度快,数据的价值密度低。

(2)技术本质:是指需要有以存储技术、管理技术、挖掘分析技术和可视化技术为主要内容的大数据技术体系对海量数据进行处理分析,并为决策服务。

(3)知识本质:是指大数据处理分析的最终目的是从海量数据中发现潜藏的历史规律,或对未来进行预测,以知识的方式辅助做出更好的决策。

高等院校教育数据

在大数据时代背景下,高等院校教育数据建设问题也引起了专业人员的关注。高等院校教育数据主要是指高等院校开展教学活动相关的数据,主要包括教师队伍信息、学生基本信息、课程信息、教材信息、教学活动信息、教学管理与保障信息、科研学术信息、文献资料信息、校园网网络行为数据以及其他通用资源信息等,且在信息技术飞速发展与广泛使用的当下,这些数据也表现出大数据的特征。与此同时,高等院校面临着培养综合型人才、素质型人才、创新型人才的形势任务,如何制定科学有效的培养方案、创新教学培养模式、适时完善教学决策、优化教学资源配置、提供个性化信息服务,都离不开海量教育数据的支撑,也对海量教育数据基础上的数据开发利用提出了更高要求。

大数据时代高等院校教育数据建设的新挑战

大数据的出现对传统思维方式造成了强烈的冲击,其功能和价值的体现建立在海量数据分析的基础上。在这样的时代背景下,高等院校教育数据建设面临诸多新挑战。

数据采集获取量大种类多

先进信息技术使得面向事物的全数据采集成为可能,而足够数量的数据是进行大数据分析的基础和前提,因此数据采集就成为高等院校教育数据分析与应用中的重要一环。高等院校教育数据采集有基于物联网传感器的采集,也有基于网络信息的数据采集,还有基于工作人员的手工采集,需要采集的内容包括与教师和学生相关的基本信息、教学过程中产生的课程信息、教学软件平台使用信息、校园网用户行为信息、文献资料等,其数量之大远在TB级以上。此外,这些数据包括分布在各管理信息系统中的关系型数据、文本数据、访问日志数据、数字化文档资料数据,图片、音频、视频等多媒体数据,类型十分广泛。

此外,当前的高等院校教育数据尚处于自然发展阶段,数据资产意识还不强,需要建立有多部门共同参与的数据收集体系,明确数据采集责任分工、采集内容、采集时机与采集要求等,并考虑建立数据校核机制,确保数据的准确性。

数据资产规范管理难度大

在高等院校信息化水平不断提高、教育数字化程度日益加深的今天,几乎参与教育活动的每个人都卷入到数据及其处理的浪潮中,数据已经成为重要的生产要素和无形资产。但目前的高等院校数据或多或少的面临着数据不完整、数据分散不一致、数据质量低、数据共享集成成本高、数据教学效益不显著等问题,难以对数据进行全面、统一、高效的管理。

以数据分散管理为例,当前很多教学数据分散在不同的信息系统中,数据标准不统一、可用质量差,数据核对、清理、映射工作量大的问题较为突出。尤其是有的学者提出了终身学习、个性化教育的理念,这就需要延伸对于学生相关信息的采集,建立学生终身的学习档案,无形中极大的增加了数据管理的难度,数据的质量也难以得到保证,进而影响了数据的应用。

数据存储处理技术要求高

高等院校教育数据量增长速度快,加上已积累的大量历史数据,对数据存储、处理、分析带来了巨大的挑战,要求其必须具备快速性、准确性和高效性。

在数据存储方面,由于数据的数量、类型、应用对象的不同,要求数据存储必须综合考虑当前需求和长远发展,充分开展传统关系型数据库、数据仓库及面向大数据的No SQL数据库论证,科学设计数据存储架构。其次,需要突破多源异构教育数据融合的技术瓶颈,扩大深入融合处理数据对象的范围,提高融合效果和性能,实现分散异构教育数据快速融合入库。

在数据处理分析方面,需要加强教育数据实时处理,对相关音视频等复杂类型数据开展内容分析,对教学模式、规律、趋势等进行预测分析,对海量教学数据进行并行处理,从而提高教育数据快速高效处理能力。同时,带动数据处理向知识加工、决策支持等方面进行拓展,进一步提升教育数据的附加值。

数据综合服务保障多样化

“数据是稳定的,处理是多变的”。当前面向高等院校教育的各个方面,产生了多样化的应用需求,如教育决策支持、综合信息服务、个性化信息支持、教学科研服务等。这些应用服务,要求针对存储的海量教育数据进行高效的处理分析,并快速、灵活呈现给用户。例如,教育决策支持问题,需要通过教学过程数据、教学资源数据、教师学生相关数据等的实证分析,才能为课程内容设置、资源优化配置、教学模式评估等提供支撑。再如学生个性化信息支持问题,需要全面掌握学生知识能力基础信息、历次学习情况信息、现阶段学习情况信息等,综合分析学生知识结构、学习能力、学习课程等方面存在的短板,优化教学内容,有针对性的为学生提供课程辅导、推送信息资源,甚至拓展至学生就业后的持续信息服务,切实提高学生的能力素质。

高等院校教育数据建设应把握的关键环节

高等院校要想在大数据时代迎头赶上,充分开发利用大数据支持教育决策,就必须把握顶层设计、制度与标准编制、关键技术研究和安全保密建设等关键环节,加强数据工程建设。

突出抓好数据体系顶层设计

高等院校数据建设要主动适应全球信息化发展大势,准确把握高等院校信息化发展的阶段特征,把数据资源建设作为事关高等院校充分发挥作用、可持续发展的重要长期性基础性建设工程和关键性应用工程,提高思想认识,科学开展规划论证与顶层设计。一是开展高等院校数据资源全面摸底,掌握数据资源总体情况,摸清数据资源产生来源和获取渠道,评估数据资源使用现状及存在的主要矛盾问题。二是牢固树立数据体系“一盘棋”思想,将本院校数据体系纳入国家高等院校信息化建设体系中进行统一规划论证,避免出现结构性矛盾,影响高等院校之间甚至国家范围内的数据共建共享。三是综合运用大数据管理、企业架构、信息资源规划等先进理念和技术方法,紧密贴合高等院校教学应用需求,构建科学、合理、可行的高等院校数据体系架构,切实提升数据建设质量,为高等院校教学应用奠定坚实基础。

制定完善数据建设制度与标准

高等院校教育数据建设,需要依据相关数据标准规范,统合各类信息代码,强化主数据管理,确保各信息系统的数据能够综合集成、有效衔接。一是建立数据管理制度。要建立数据采集、处理、维护与使用相关的规章制度,明确高等院校不同职能部门的业务关系,及数据管理的组织机构、职责分工、主要内容与工作流程,确保数据管理工作的规范有序。二是制定数据标准规范。围绕信息分类与编码、数据元素、数据集、数据交换、公共信息模型等内容,开展相关数据标准规范的编制、修订与完善,确保数据的标准化、规范化,以利于高等院校相互间及院校内部的高效集成交换和共享利用。三是建立数据质量管控体系。建立数据质量管理框架,明确数据生命周期所有阶段质量管控的方法、时机与标准,切实提高数据质量,确保教育决策与信息服务的有效性。

突破海量数据开发利用关键技术群

着眼高等院校海量数据效能的发挥,聚焦数据高效采集获取、数据高性能存储、数据深度挖掘分析、数据多样化应用等领域,开展关键技术研究,建立集海量数据“采、存、析、用”于一体的技术解决方案,为现实应用奠定技术基础。一是完成技术体系规划设计,在教学应用分析和数据架构设计的基础上,围绕功能实现,构建技术体系架构,明确需要应用的技术、接口、方法,以及技术过渡、转型的模式等。二是尽快完成高等院校海量数据开发利用技术攻关立项,在获得上级机关认可及经费支持的基础上,加大技术研究的深度和广度,围绕高等院校数据应用的专有问题,切实解决制约海量数据开发利用的瓶颈问题,实现数据从数量规模优势向质量效益优势的跨越。三是评估分析其他行业运用大数据的有关研究成果,采取“拿来主义”,能够直接应用或改造应用的成果,尽快部署应用,节约经费与时间。

配套完善信息安全体系建设

当前,高等院校教育数据运行管理主要依托校园网进行,加强信息安全体系建设、增强信息防御能力,是海量数据效能得以持续稳定发挥的重要保证。一是建立健全高等院校信息安全管理新机制,制定相关规章制度,明确信息安全管理的任务分工、权限要求和方式方法。二是加强信息安全手段建设,依据信息系统建设安全防护等级要求,准确划分信息安全防护等级,加强设施环境、网络环境建设,配套相关安全保密设备,补充完善软件系统功能,提高信息安全防护能力。三是建立数据安全实时动态感知机制,实时监测计算机网络、数据库系统、应用软件系统以及其他附属软硬件的运转情况,准确感知潜在威胁,及时预警并按照规定有效应对,实现数据安全态势的全局性实时掌控。

结束语

大数据时代的到来必将对高等院校教育产生深远影响,正如维克托·迈尔-舍恩伯格在《与大数据同行-学习和教育的未来》中指出的那样:“利用大数据,我们可以使决策者得以在全面而坚实的经验基础上改善其决策的质量,从而使教育决策从意识形态的偏见中脱离出来”。目前,大数据在高等院校教育中仍处于研究探索阶段,需要我们紧跟大数据技术发展趋势,结合高等院校教育应用的现实需求,分步骤、有选择的开展应用研究与实践,真正发挥大数据在高等院校教育中的巨大价值。

大数据教育管理 篇11

关键词:图书馆 大数据 信息素养 数据素养

中图分类号:G250 文献标识码:A 文章编号:1003—6938(2014)04—0117—03

我们正处于一个数据无处不在的时代,一方面,我们在生活、学习与工作中产生了大量的数据,如记录于数据库中的学习记录、产生于手机终端的信息行为等数据,另一方面,我们也依赖于大量的数据去支撑我们的工作、学习和生活,如基于大量实验数据的科学分析、基于数据统计的趋势展望等,社会也由此进入到了一个数据类型多样、来源丰富、数量庞大、价值巨大的大数据时代,对数据的获取、管理与应用也成为了大数据时代人们必备的技能素养之一。被誉为社会课堂的图书馆一直以来就承担着社会教育职能,在大数据时代,图书馆如何发挥自身的优势与教育职能,在公众的素养教育方面发挥积极作用,也因此成为了学术界特别是图书馆界研究的热点问题。鉴于此,本文在概述大数据与数据素养的关系、概念及大数据时代图书馆职能的基础上,主要对图书馆开展数据素养教育的内容与方式进行了研究。

1 大数据与数据素养

大数据时代,数据将充斥在我们的生活环境、学习环境和工作环境之中,如在学术研究环境下,人们所利用的研究资料、实验过程等都以数据的形式存在,而科学研究也主要以对这些数据的研究如发展规律、呈现态势等而存在,进而形成了以对大量数据的存储、检索、组织和利用为特征的数据密集型科研环境。密集型数据环境的形成发展推动了社会的发展同时,但也对民众的技能素养等提出了更高的要求,如:如何实现对大量、异构数据的组织、分析和利用;如何保护涉及到个人隐私的数据;等等。可以说,在以计算机、网络的利用为主要特征的信息时代,人们需要具有满足信息社会发展步伐的信息素养,如具备一定的信息检索、信息组织等技能,而在大数据时代,民众则需要具备大数据时代社会发展需求、相比较信息素养要求更高的特殊素养,如具备一定的数据组织、数据分析技能。

大数据与科技管理 篇12

1 大数据的概念

大数据是指在业务过程中产生的数据集合, 尤指非结构化数据和半结构化数据。关于大数据, Gartner给出了这样的定义:需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据具有“4V”特性, 即巨量 (Volume) 、繁多 (Variety) 、高价 (Value) 和快速 (Velocity) 。

巨量:数据量巨大。大数据的体量已从TB (万亿字节) 级上升到PB (千万亿字节) 级。

繁多:数据类型繁多。大数据包含了大量的文本、视频、音频、图片、日志、空间位置等信息。

高价:高价值。大数据潜藏着大量的有价值信息, 需要去深度挖掘。

快速:处理速度快。大数据基于云计算技术, 处理结果为秒级———“一秒定律”。

大数据的源头从互联网、数字设备、移动设备等各源头产生。

“大数据”之“大”, 不仅仅是指容量之大, 更在于通过对海量数据的交换、整合和分析, 发现新的知识, 创造新的价值, 带来“大知识”、“大科技”、“大利润”和“大发展”[1]。

大数据并不等于大集中。相反, 大数据往往与云计算联系在一起, 因为实时的大型数据集分析需要分布式计算和并行计算模式 (如MapReduce) , 把计算任务分配到分散的计算机上。如果说2012年是云计算应用元年, 那么2013年就是中国的大数据元年。大数据与云计算是问题的两面:一个是问题, 一个是解决问题的方法。云计算进行大数据分析、预测会使决策更为精准, 释放出数据的隐藏价值[2]。

2 迎接大数据时代

计算机技术经历了大型主机、小型计算机、微型计算机、分布式计算几个时代, 目前已进入以云计算、大数据为代表的第五次浪潮。大数据浪潮的一个表现是信息技术 (IT) 市场从“以计算为中心”向“以数据为中心”转变[3]。随着人类对数据的依赖程度不断提高, 数据的生命周期也在不断延伸, 而非结构化数据的增长远快于结构化数据的增长。

全球数据总量每18个月翻一番。天上的云计算还没飘过, 我们迎来了大数据的爆炸性增长时代。据麦肯锡调查报告, 美国15个主要行业中每家公司过去一年所产生的数据量, 就超过了同期美国国会图书馆所存储的数据量。自从人类发明印刷术以来, 以往一千多年来所有印刷材料相当于200PB (1PB=1015B) , 而2011年全球数据量就达到了1.8ZB (1ZB=1021B) 。据IDC发布的2012年数字宇宙研究报告中预测, 到2020年数字宇宙的规模为35ZB。

仅仅是从互联网, 我们就可获得信息内容接触信息 (浏览/点击的内容、时长等) 、搜索/需求信息 (经常搜索的词、搜索行为的转换、需求什么类型的信息等) 、信息偏好 (喜欢的信息、反感的信息等) 、信息消费行为 (消费时间、消费类别、消费金额、消费次数等) 、人口统计信息 (性别、年龄、职业、教育程度、婚姻状况等) 、收发信息的设备和区域等信息 (智能设备种类、系统、所在城市、网络接入情况等) [4]。在大数据、移动互联网的支撑下, BYOD (Bring Your Own Device, 自带设备办公) 正在迅速得到普及。

2010年7月, 联合国发布了《大数据促发展:挑战与机遇》白皮书, 指出大数据对于全世界是一个历史性的机遇。2012年3月, 美国总统奥巴马宣布美国政府拨款两亿美元启动“大数据研究和发展计划”, 把大数据提升到国家战略位置。2012年10月, 时任广东省委书记汪洋向公众推荐涂子沛先生所著《大数据:正在到来的数据革命》一书, 在我省掀起了一股大数据热潮。

拥有处理大数据的能力和有效分析大数据的工具, 正成为一种必需的竞争优势[5]。大数据厂商早就注意到大数据市场的兴起, IBM、HP、Oracle、微软、SAP等IT巨头都是大数据市场的积极推动者, 各自推出了自己的Hadoop版本。IBM在迎接大数据挑战的战略中, 制定了“3A5步”的路线图, 即掌控信息 (Align) 、获取洞察 (Anticipate) 、采取行动 (Act) 、学习 (Learn) 和转型 (Transform) [6]。其在2011年推出了Netezza数据仓库一体机, 随后又推出了应对非结构化数据需求的Info Sphere Big Insights和实时分析需求的Info Sphere Streams产品。同时, Oracle公司推出了配有CDH (Cloudera Distribution Including Apache Hadoop) 和OBDC (Oracle Big Data Connectors) 的大数据机以及专门针对海量数据管理的分布式key-value数据库Oracle No SQL。微软公司则推出了SQL Azure Hadoop产品。中国移动的“信令分析系统”项目和中国电信的“新一代数据库”产品已经采用大数据技术进行用户行为分析, 实现精准营销。

大数据潜隐着巨大的价值, 能够降低社会管理成本和交易摩擦成本, 能够提高客户满意度。据麦肯锡测算, 大数据技术的应用将给欧洲公共部门创造1500-3300亿欧元的潜在价值。

3 大数据解决方案

大数据处理需要新的数据库技术。EMC数据计算事业部大中国区总经理刘伟光指出:“新型数据库应该具备如下特点:首先, 应该采用支持大规模并行处理的分布式架构;其次, 应该使用基于符合工业标准的开放硬件和系统平台, 保证成本可控;第三, 随着开源技术不断成熟, 创新速度快, 新型数据库平台应该易于与新的开源技术进行融合;第四, 新的数据库平台应该可以实现与Hadoop平台的无缝集成, 实现跨结构化、半结构化、非结构化海量数据的混合分析能力。”

大数据环境下, 必须能对数据进行快速的捕获、管理、存储和分析。目前, 大数据解决方案主要有Hadoop和No SQL。

3.1 Hadoop

Hadoop是一个能够大数据进行分布式处理的开源的软件框架, 具有高可靠性、高扩展性、高效性和高容错性的特点。

Hadoop主要由两部分组成:底部是HDFS (Hadoop Distributed File System) , 它存储Hadoop集群中所有存储节点上的文件;上部是MapReduce引擎, 它负责对大数据集的并行处理。

HDFS支持以流的形式访问写入的大型文件, 由Name Node和Data Node节点构建。Name Node节点只有一个, 在HDFS内部提供元数据服务;Data Node节点可有多个, 为HDFS提供存储块。HDFS内部的所有通信都基于标准的TCP/IP协议。Hadoop的编程语言主要是Java, 也可以是C++。

MapReduce是一种简化的分布式编程模式, 其设计思想是将要执行的问题拆解成“映射” (Map) 和“化简” (Reduce) 的方式, 先通过Map程序将数据切割成不相关的区块, 分配给大量计算机处理达到分布运算的效果, 再通过Reduce程序将结果汇整, 输出开发者需要的结果。

3.2 No SQL

No SQL (Not Only SQL) 是针对关系型数据库的瓶颈而提出来的革命性理念, 实际上是一个分布式数据管理系统, 具有大数据量、易扩展、数据模型灵活、高性能、高可用等特点。典型的No SQL如key-value存储、列存储、文档数据库、图数据库、XML数据库和全文检索, 最常用的当为key-value存储, 其以键值对存储, 每个元组可以根据需要增加键值对, 减少了时间和空间的开销。“简化” (Simplifying) 和“自动拆分” (Automating Sharding) 可能是No SQL数据库面临的最大挑战[7]。

No SQL具备的三要素:一致性 (Capsistency) 、可用性 (Availability) 、分区容忍性 (Partition tolerance) 。三要素最多只能同时实现两点, 这就是NoSQL的CAP原理。分区容忍性是No SQL的基本要求。

No SQL的核心理论基础是Google Big Table模型和Amazon Dynamo模型。Big Table是一个稀疏的、分布式的、持久化存储的多维度排序Map, Map的索引是行关键字、列关键字以及时间戳, Map中的每个value都是一个未经解析的byte数组。Dynamo采用P2P (peer to peer) 架构, 数据定位使用一致性哈希, 允许数据的多个备份存在多个版本以提高写操作的可用性, Gossip-based Membership Protocol通讯协议实现了节点间的直接通信[8]。此外, 市场上的No SQL数据库还有Couch DB、Redis、Mongo DB、Riak、Membase、Neo4j、Apache Cassandra、Apache HBase、Simple DB等。

虽然大数据是目前IT最热的话题, 但还存在一些有待进一步探讨和解决的问题:一是数据的真实性, 二是标准和法规遵从, 三是应用系统 (平台) 之间的兼容和整合, 四是从事数据挖掘的专业人才匮乏, 五是数据应用能力弱。

4 大数据提升科技管理

大数据是计算机科学、统计学、管理学、社会学等学科交叉渗透的产物, 涉及互联网、经济、物力、天文、医学等领域。中国工程院院士李国杰指出:“科技界应高度关注大数据研究这一新的发展方向, 从大数据应用中发现挑战性的科学问题, 推动以大数据为基础的第四科学范式, 促进形成新型交叉学科:网络数据科学。”

随着科学技术日新月异的发展, 科技管理被赋予了新的内涵:人力、物力、财力资源通过运用管理科学手段, 最终以数据的形式得以存储、整合、利用和分析, 大数据在现代科技管理中愈显重要。

现代科技管理中, 除了存在大量的结构化数据 (标准数据库) 以外, 还存在与之相关的信息量更庞大的半结构化和非结构化数据, 流媒体、图片如此, 知识产权、科技文献、空间信息也如此。

在科技管理中, 大数据从管理层次来看, 可分为数据层、处理层和应用层, 其层次体系结构如图1所示。

存储层:对资源进行数字化处理后得到相应的结构化、半结构化和非结构化数据, 存储 (分发) 在指定的载体中。

处理层:对存储层的数据进行采集、融合、分发等处理, 通常使用ETL (Extraction-Transformation-Loading) 工具进行管理。

应用层:对数据进行综合利用和挖掘分析, 提供决策支持智能服务。

在这个三层结构中, 数字化是基础, 集成是手段, 挖掘分析是目的。

例如, 在科技文献管理中, 既要对科技文献进行归档建库形成结构化数据, 还要对文献进行扫描、文字识别、实物拍照等数字化处理形成非结构化数据, 再对其进行全文检索等综合利用。这其中, 非结构化数据的存储容量就占了总数据量的95%以上。

又如, 在信息检索中, 除对站内信息进行挖掘外, 也要通过互联网对网页、微博、传感器、多媒体等信息进行智能挖掘, 所需处理的数据量浩如烟海。

再如, 在大型仪器共享方面, 我们可以通过物联网实时捕捉仪器设备的运作情况, 把仪器设备的空闲资源充分利用起来。

在科技决策中, 从数据库、网站、流媒体、短信、微博、社交论坛、移动终端等大数据中, 我们可以进行准确地分析历史、提供个性化服务和预测未来。

科技平台是科技管理的重要内容, 包括重大科研基地、科技条件平台和科技公共服务平台等。利用SWOT方法 (见图2) , 我们可以探知大数据技术在科技平台中的机遇与挑战。

5 结束语

数据被称为21世纪的“石油”, 它已经变成生产资料, 站到与硬资产和人力资源同等重要的位置[9]。大数据能使我们更全面地认识世界, 更准确地预测未来。大数据将引发全球范围内的社会和商业变革。知识时代, 我们只相信数据。

参考文献

[1]涂子沛.大数据:正在到来的数据革命[M].广西:广西师范大学出版社, 2012

[2]叶成辉.云计算、大数据变革浪潮继续高涨[J].计算机世界, 2013 (1) :24-28

[3]田溯宁.2013, 大数据元年的创新[J].计算机世界, 2013 (1) :22-24

[4]周艳, 龙思薇.大数据时代的到来与思考[J].广告大观:媒介版, 2012 (9) :24-30

[5]胡素青.大数据:“铁三角”牢不可破[J].金融科技时代, 2012 (9) :22-24

[6]“3A5步”迎战大数据[J].软件和信息服务, 2012 (6) :77-80

[7]ORACLE.Hadoop and NoSQL Technologies and the Oracle Database[R/OL].http://wenku.baidu.com/view/9823c494daef5ef7ba0d3cd2.html, 2011

[8]MENGXIANGL.NoSQL综述[R/OL].http://wenku.baidu.com/view/4089d43731126edb6f1a1083.html, 2012

上一篇:路面特性下一篇:专业化重组