开放数据论文

2024-06-06

开放数据论文(精选12篇)

开放数据论文 篇1

就全球范围来看, 美洲地区和欧洲地区处于数据开放第一梯队, 亚太地区处于第二梯队, 中东、中亚和非洲地区处于第三梯队。

在后信息时代, 数据成为一种新兴资产。政府掌握着大量的核心数据, 让原始的政府数据对社会开放已经成为各国的民主运动的新内容, 数据开放作为提升政府提升透明度、提高国家创新竞争力、提升社会民主程度的重要措施, 在各国受到越来越多的关注和重视。

2011年在美国政府的倡议下, 全球正逐渐形成“数据开放联盟”, 40多个国家和地区纷纷加入该联盟。2013年10月31日, 《开放政府联盟 (Open GovernmentPartnership) 2013峰会》在伦敦举行, 会上互联网之父蒂姆·伯纳斯·李发布了由“开放数据晴雨表项目组”、互联网基金会、开放数据研究会共同编制的《开放数据晴雨 表:2013年开放数据全球报告》 (以下简称《报告》) 。

该《报告》旨在揭示全球不同开放数据计划的渗透性和影响力, 分析全球开放数据发展趋势, 并对各国和地区进行排名。《报告》指出, 数据开放正处在起步成长阶段。

在全球首个政府数据开放平台Data.gov诞生的近五年时间内, 数百个国家和地方政府已经相继建立起了各自的政府数据开放平台, 与此同时, 国际研究机构、非盈利组织和企业等也正在逐步加入到该平台中来。所有的参与者正在以不同的方式探索如何让开放数据的价值得到释放, 进而达到鼓励创新、增加透明度和提升政府责任感。

在数据开放进程加快的时代背景下, 《报告》对全球77个有广泛代表性国家的数据开放情况进行了研究分析, 站在国家层面为全世界提供了政府数据开放的整体“快照”和“印象”。

整体“印象”

《报告》指出, 全球数据开放目前呈现快速发展但发展不均衡的态势。信息化法律的完善程度、数据开放政策的制定、社团组织和专业技术人员对数据开放的需求程 度、政府对数据开放创新应用的支持度, 以及城市或地区数据开放程度等多个要素共同决定区域数据开放程度。

就全球范围来看, 美洲地区和欧洲地区处于数据开放第一梯队, 亚太地区处于第二梯队, 中东、中亚和非洲地区处于第三梯队。

如表1所示, 美洲、欧洲和亚太区在政府开放数据 (Open Government Data) 中政府政策倡议方面得分差距不大;社团和技术人员对数据开放的需求上三者存在明显差异, 欧洲得分最高表示其对数据开放需求最为强烈和迫切;城市或地区的OGD水平也存在明显差异, 欧洲得分最高表明其区域内城市或地区的平均水平增多美洲和亚太区域高, 其在数据开放方面有着良好的基础。

从五个区域整体来看, 五项指标中政府对数据开放创新活动的支持度得分最低, 表明政府在数据开放中所发挥的作用不足, 针对该情况, 《报告》建议政府要加强对在线数据的提供程度。

《报告》还指出, 目前虽然也有一些国家的政府数据开放已经推广到城市一级, 如尼日利亚、日本江户等国家和城市已经在推出全国政府门户网站前推出了城市数据开放门户, 但就世界范围来看, 实施政府数据开放政策的仍主要停留在国家层面, 尚未普及到城市一级。

指标解读

为了更好地对全球数据开放情况进行评估, 《报告》主要从准备度、执行力和影响力三个维度对各国所处开放数据的阶段及其在给经济、政治和社会所带来的影响进行了评估。

准备度是指一个国家是否具备实现开放数据潜力的政策、社会和经济基础, 包括政府、企业、公众与民间团体三方面; 执行力是指政府发布一系列关键数据集以支持社会各界进行创新、对政府的审计问责和改进有关决策的程度;影响力是指开放数据已导致积极的政策、社会、环境和经济变化的程度。

成功的政府数据开放政策倡议需要的不仅仅只是数据集, 更需要的是让中介机构能够很好地利用这些开放的数据, 把这些数据转变成用户可以以不同方式并利用不同设备去访问以及处理的、具有社会价值和经济价值的平台和产品。这就是有时 我们所说的基于政府数据开放项目的核心数据生态系统。

《报告》主要从三个方面考查政府数据开放准备度变量:

在政府准备度方面, 主要考察政府开放数据的能力和政府对数据开放的承诺, 包括政府开放数据的意愿、让数据更加可用的组织能力, 以及如何保证从数据开放中获益。

在公民和社会团体准备度方面, 主要考察公民社会的自由开放度和其在数据开放议程中的参与度, 包括《信息权利法》和《数据保护法》等制度的制定情况。

在企业和公司准备度方面, 主要考察企业公司通过对开放数据资源进行再利用所带来的经济利益及其作为“中介”给社会所带来的“催化”作用, 包括企业的互联网普及率、企业在数据可用性方面的有关培训, 以及政府对开放数据引领创新的支持作用。

什么数据是有用的?答案并不在于政府是否公开数据, 而在于全社会利用其公开的数据在实践应用中所产生的影响如何。有些国家吹嘘自己在网上发布了大量数据集, 但事实上, 如果这些数据并不是公众所需要的, 或者这些数据无法有效提升国家透明度、政府责任意识和社会等, 那其开放的意义对于开放政府数据所希望实现的目的微乎其微。为说明政府开放数据的有效性, 《报告》尝试选择那些既能代表国家不同职能、又是数据再利用者感兴趣的数据类别进行了初步研究。数据可用性是影响数据执行力的 一个重要因素。

在评估数据集的可用性方面, 《报告》选取了地理环境、土地持有、人口、政府预算、政府财政支出、公司注册等共14类数据, 对77个国家的数据开放情况进行了统计分析。

《报告》在评估全球数据开放的影响力时, 主要从开放数据被应用的领域范围, 以及数据在提升政府效率和透明度、环境可持续性和社会稳定、经济增长和企业活力等多方面入手, 具体观察分析了各国数据开放给本国所带来的实质影响。

《报告》通过调查发现, 政府数据开放的影响力更多地集中在对政府的“问责”和企业对数据的创新应用两方面。其中, “问责”对于提升政府的透明度和对社会的责任意识是最为明显的, 而数据开放给公司企业利用数据进行创新应用所带来的影响也是不言而喻的。开放政府公共数据对企业的影响力, 主要表现在利用公开数据开展APP应用竞赛和推出以鼓励开发者进行创新为目的的“黑客日”两个方面。在评估中发现, 多数国家在数据开放对环境和社会包容性的影响力方面考虑较少, 影响作用较弱。

《报告》通过利用准备度、应用度和影响力三个一级指标对全球多个国家数据开放情况进行分析后, 得出结论认为:从整体情况来看政府公共数据开放政策及其影响力正在全球快速蔓延, 许多国家和地区数据开放已经具备了良好的政府、企业和社会环境基础, 但在数据开放的广泛应用、数据开放对政府的影响力、数据发布和使用条款以及使用结果评估等方面, 仍然有很长的路要走。

国家排名

在此次调查的77个国家和地区中, 排名前五的依次为:英国、美国、瑞典、新西兰、挪威和丹麦 (并列第五) 。其中, 英国、美国和瑞典在数据开放的准备度、应用度指标上得分较高, 美国、新西兰在数据开放的影响力指标上表现较为突出, 如下图所示:

在从政府、企业和社会数据开放准度, 数据开放对经济、社会和政治影响作用, 以及数据在企业创新、政府责任意识提升和改善社会政策制定中执行力共9个方面分析后, 《报告》认为英国的数据开放程度位居全球第一。

英国

具体来看, 英国在数据开放进程中准备度得分较高, 表明英国政府对数据公开较为重视, 企业以及社会对数据公开的诉求和数据意识较为强烈。

2009年英国政府将“开放政府”正式提上日程, 2010年开放政府数据政策得以持续推进, 并得到了来自首相的支持。英国政府对数据开放可能带来的潜在价值给予高度重视, 包括成立专门的数据开放研究所以支持对开放数据的商业应用。为保证所有政府部门对data.gov.uk网站数据的及时更新和维护, 政府要求每个部门制定本部门的数据开放战略, 包括详细的数据应用行动计划以及对战略进展情况定期进行书面报告。英国政府还要求地方政府发布一些数据集, 许多地方政府已经建立了数据开放门户网站。

此外, 在英国, 关于数据开放主题的培训越来越多, 并且有频繁的专题和开放数据“黑客日”、数据开放活动和比赛, 以及由政府提供的创新资金专门用于帮助企业利用开放数据进行创新应用。英国还存在大量来自不同领域且关注数据开放的活跃用户社区, 致力于对开放数据的开发应用。

在执行力方面, 英国在不断扩大政府数据开放范围的同时, 也在提升数据的“深度”, 不断提升数据的质量、标准化程度和关联度。目前, 英国现在全力推进一个以保存、发展和提升核心数据为主的“国家信息化基础设施” (National InformationInfrastructure) 项目。但在影响力方面, 英国公开数据在影响力方面表现不是很理想, 数据开放对经济产生的影响力最大, 但对社会所带来的影响并不明显。

美国

在数据开放方面, 美国远远超出美洲地区平均水平。

2009年美国政府作为“第一个吃螃蟹”的国家发布了政府数据开放倡议, 要求政府部门发布机器可读的、标准化的、高价值的数据, 强调数据可能带来的经济价值。2013年5月美国政府再次发力, 发布了要求更高的“Open Data Policy”行政命令, 要求公开教育、健康、财政、农业等七大关键领域数据, 并对各政府机构数据开放时间做出了明确要求, 同时推出“Project OpenData”项目, 向社会开放更多政府API, 让开发者可以各方便地利用政府数据创造潜在经济价值。

与英国相比, 美国数据开放在公众和社团准备度方面略低于英国, 这可能与英国提出的“让公民受益数字化时代”倡议有关, 英国在全国范围内推动“Go OnUK” (全民性的、跨部门联合开展对人们互联网使用的培训) 项目以提升国民的数字化能力。

在执行力方面, 美国政府略逊色于英国, 英国在data.gov.uk上对政府财政收支、各级公务员工资收入情况等进行了完全公开, 而美国却无法有效提供该政府预算和支出等的详细数据, 表明政府利用数据开放提升政府透明度和责任意识表现不足。

在影响力方面, 美国表现尤为抢眼, 美国政府通过数据开放战略在释放经济增长创新力、提升政府透明度和责任意识以及改善社会环境等方面取得了较为显著的成效。

瑞典

排名第三的是瑞典, 在综合各项指标分析后, 《报告》认为, 瑞典的数据开放程度高于欧洲平均水平。

瑞典早在1776年就成为世界第一个形成信息权利法《Right to Information law》的国家, 这为瑞典2012年发布政府数据开放统一门户网站奠定良好的基础。

在数据执行力方面, 瑞典在全国范围内也形成了以鼓励开发者创新为目的的“黑客日”, 而像TrafikLab之类的项目则把与交通有关的公共部门数据和个人数据在一个平台进行整合, 并提供给创新者。

在影响力方面, 瑞典在利用开放数据提升医疗绩效, 利用环境数据以可视化的方式降低环境预算以及有效的防治害虫等方面发挥了积极的作用。

相对于数据开放给经济和社会所带来的积极影响而言, 数据开放所带来的政治影响较低。

中国

从《报告》排名和得分情况来看, 中国位列第61位, 综合得分为11.82, 整体排名较为靠后。

从指标具体情况来看, 在三个维度中, 中国的准备度得分最高, 但也仅为41.72, 与美国、英国等先进国家相比差距较大, 表明我国政府公共数据开放在政策推动、公民意识等准备方面上较为不足。

执行力得分仅为9.41, 表明我国数据开放在推动创新、提升政府透明度和改善社会决策等方面能力明显不足, 数据有效性和价值度、易用性不高, 例如我国政府支出数据只有十分粗略的总数, 几乎不具备可用价值, 而选举数据则完全缺失。

影响力得分为0, 表明我国政府数据的应用潜力未得到有效挖掘, 未来有较大的开发空间。

开放数据论文 篇2

2002年,我国GDP首次突破10万亿元,为102398亿元; 2006年,我国GDP又突破20万亿元,为211923亿元,折2.7万亿美元。

2002年,我国GDP分别相当于美国的13.9%、日本的37.0%、德国的71.8%,2006年上升到相当于美国的20.0%、日本的60.6%、德国的91.3%。

2007年我国经济发展的新成就:

(1)GDP已达249530亿元,比2006年增长11.9%,突破3.6万亿美元,世界第四。

(2)财政收入突破5万亿元,达到5.13万亿元,同比增长32%。财政增幅几乎等于GDP增幅的3倍。

(3)对外贸易快速增长,全年进出口总额达到21738亿美元,增长23.5%。世界第三。进出口相抵,外贸顺差达2622亿美元,比上年增加847亿美元。

(4)国家外汇储备余额大幅增加,达到15282亿美元,比上年增长43.3%。世界第一。

(5)外商直接投资继续增长,全年实际使用非金融机构外商直接投资748亿美元,比上年增长13.6%。世界第一。

30年中,我国经济保持年均9.7%的增长速度,世界第一。最近5年中,我国GDP占世界经济的份额不断提高,2002年为4.4%,2007年为5.5%。

经过30年的改革开放和发展,我国迅速实现了和平崛起,我国已经成长为世界上的一个经济大国。中国的发展离不开世界,世界的发展也离不开中国,中国正在改变着世界。

当美国这个“经济火车头”前进乏力时,世界经济正越来越依赖于中国、印度等新兴经济体,中国成为促进世界经济增长的重要动力。

改革开放30年回顾与展望

(一)今年是改革开放30周年,党的十七大报告指出:“改革开放是决定当代中国命运的关键抉择,是发展中国特色社会主义、实现中华民族伟大复兴的必由之路;只有社会主义才能救中国,只有改革开放才能发展中国、发展社会主义、发展马克思主义。”

关于改革开放,十七大报告中有两句话值得我们高度重视:

“改革开放符合党心民心、顺应时代潮流,方向和道路是完全正确的,成效和功绩不容否定,停顿和倒退没有出路。”

“要毫不动摇的坚持改革方向,提高改革决策的科学性,增强改革措施的协调性,使改革始终得到人民拥护和支持。”

这两句话不仅旗帜鲜明地阐明了改革开放的重要性、必要性和坚定性,而且也明确了下一步改革开放的方向和道路。由此可见,今后,中央对改革开放只会加强、只会扩大、只会深化,不可能倒退,不可能停滞。所以,党的十七大报告实际上也是党在改革发展关键阶段阐明的一个全面的、发展的、深刻的改革论和开放论。

【今日主讲】中共杭州市委常委、宣传部长翁卫军

【中心思想】

把坚持改革开放和完善改革开放有机的结合起来,有利于进一步凝聚各方改革开放的共识,形成推动改革开放的强大力量。所以在这纪念改革开放30周年的特殊日子里,我们回顾改革开放的历史,可以增强全国各族人民对中国特色社会主义建设的成就感、自豪感;展望改革开放的未来,可以增强全国各族人民对中国特色社会主义建设的责任感、使命感。

【课堂速写】

为什么要隆重地纪念改革开放30周年,因为改革开放作为发展中国特色社会主义的强大动力,开创了中国特色社会主义伟大事业的新局面,使社会主义焕发出前所未有的强大生命力,使马克思主义焕发出前所未有的强大感召力,使我们党焕发出新的创造活力。它改变了中国人的命运,改变了国家的命运,也改变了党的命运,取得了令世人瞩目的辉煌成就。

——改革开放极大地提升了我国的综合国力

通过改革开放,我们实现了从高度集中的计划经济体制到充满活力的社会主义市场经济体制、从封闭半封闭到全方位开放的伟大历史转折,极大地推动了社会生产力的发展和综合国力的跃升。1978年,我国国内生产总值为3645亿元,到2006年已经达到21万多亿,增长了57.5倍,到2007年则是24.66万亿元。中国外汇储备去年底达1.53万亿美元,稳居世界第一位,而在1978年我国的外汇储备只有15亿美元。改革开放30年,我国的GDP平均增长9.7%,而世界经济同期只有3%左右的增长。现在中国的粮食、棉花、肉类、钢铁、煤炭、化肥等主要产品的产量在世界上都排在第一位;我们的载人航天飞机已成功发射,月球探测工程也正在顺利进行,等等,这都充分体现了我国社会生产力的极大提高和综合国力的极大提升。

中国在这30年的发展中是一枝独秀。其他国家也曾有过快速发展,可能是5年、10年,甚至是15年,但像中国这样持续30年以这么高的增长率发展是没有的。目前,我国的经济总量超过了意大利、英国、法国等国家,排名已从1978年的第10位上升到现在的第4位,排在我们前面的是美国、日本和德国,其中德国与我们挨得非常近。美国的一些经济学家也在算,如果中国保持这样的发展势头,到2050年的时候,将要超过美国。

经济是和政治、军事联系在一起的,弱国在世界上是没有地位的,弱国是没有外交的。国家强了,说话就有人听,国家弱了,就没有话语权。普京就曾说过,没有实力的愤怒毫无意义。30年的改革发展,伴随着我们综合国力的不断增强,西方发达国家也越来越重视中国,我们在世界政治舞台的话语权也更强了。比如,由西方发达国家召集的研究世界经济形势和问题的西方八国首脑会议要求吸收中国参加,就证明了我国的发展对于世界经济已经具有不可忽视的影响力。

——改革开放极大地改善了人民群众的生活

改革开放以来,我国经济取得了突飞猛进的发展,国民生产总值快速增长,全体国民创造出了巨大的社会财富,与此同时,全体居民共享改革成果,生活水平迅速提高,家庭财产由无到有,由少到多,跨越了温饱、小康两个生活阶段,逐步向富裕迈进。

1978年,中国光农村的贫困人口就有2亿5千万,占总人口的30%。到2006年的时候降至2148万,仅占我们总人口2.3%。世界银行公布的数字表明:近25年来,全人类取得的扶贫事业成就中,67%的成就应归功于中国。也就是说,中国为世界脱贫事业是做出巨大贡献的。

改革开放30年,生活上的巨大变化,我们每个中国人都能深刻地感受到。2007年和1978年比,我国城镇居民人均可支配收入由343.7元提高到13786元;农民人均纯收入由133.7元提高到4140元,扣除物价因素以后,二者平均每年都增长7%。而同时,城镇居民家庭的恩格尔系数从57.5%下降到36.3%,农村居民家庭的恩格尔系数为67.7%下降到43%,这都充分说明了我们生活水平的明显改善和消费水平的显著提高。2006年1月1日起,党和国家为进一步提高农民收入、改善农民生活,又取消了在中国有着2600多年历史的农业税,这在中国历史上是一个重大事件,也充分证明了改革开放的最终目的就是要让人民群众过上好日子。

改革开放也给杭州带来了翻天覆地的变化。1978年,杭州的国内生产总值28.4046亿元,财政总收入9.9043亿元。到2007年,这两个数据分别达到了4103亿元和778.43亿元,城市经济实力大幅提升。同时,居民收入普遍增加,各个阶层群体都获得了改革带来的实惠,生活水平显著提高。比如,城镇居民人均可支配收入从1978年的338元增至2007的21689元,增长63.2倍,农村居民人均纯收入由1978年的162元上升到2007年的9549元,增长57.9倍。改革开放给我们生活带来的改变,我们做梦都想不到!比如现在我们的私家车很多,有的人家一户就有两辆。还有些企业主是农民出身,在创业初期,他们根本

不可能想到现在还可以拥有自己的飞机,更别提手机、电脑啊这些越来越普及的电子消费品了。当时做梦都想不到的事情,现在都一一实现了。

——改革开放极大地提高了全体国民的文化水平和文明素质

改革开放给中国人民面貌带来的历史性变化,还不仅仅是在生活水平的提高,还有精神生活和思想观念的巨大转变。30年改革开放的一个最大变化就是打破了过去那种单调、统一的带有个人崇拜和违背人性的生活方式和思维模式,精神和文化生活日趋多样化,思想观念日益多元化。竞争、效率、民主、法治等等意识是30年前所不可想象的,特别是,人们可以自由地思想,自由地选择,自主地决定自己的命运,自由、自主、独立,这是改革开放带给人们精神领域的一个最大变化。原来走在大街上,大家穿得都差不多,灰色的,现在花花绿绿了、五光十色了,人们的思想也变得活跃了,创新力强了,人也聪明起来了,文明起来了。人的思想从僵化、半僵化,从“两个凡是”走出来了,国家也从封闭、半封闭走向了开放和自信。精神生活和思想观念的变革调动了亿万群众的积极性和创造性,使我国的社会主义建设和改革开放出现了前所未有的突飞猛进的局面。

改革开放使中国人富起来了,但是我们要防止物质生活丰富,精神生活空虚。美国社会心理学家马斯洛曾提出一个需求层次理论,把需求从低到高分成生理需求、安全需求、社交需求、尊重需求和自我实现需求五个层次,人在满足了低层次的需要后,还要追求更高层次的需要。所以,我们在抓好物质文明建设的同时,还要高度重视精神文明建设。

30年发展的巨大成就,充分证明了改革开放之路的无比正确性。当然,任何事物都有两面性,对外开放在带来国外先进管理理念和经验的同时,也会带进一些糟粕,正如小平同志所说,开放了,新鲜空气进来,但有的时候,苍蝇蚊子也进来了。所以,我们要保持头脑清醒,国门要打开,好的东西放进来,不好的要拒绝,苍蝇蚊子要赶掉。此外,我们要正确看待改革开放中出现的一些工作上的失误。应当看到,在社会主义条件下发展市场经济,是前无古人的伟大创举。在这场深刻的社会变革中,难免会出现前进中的曲折、发展中的挑战,但我们走过的路程,我们取得的成就已经表明,不改革开放只能是死路一条;社会的发展还将证明,深化改革、扩大开放,才能巩固成果、再创辉煌。

参考资料:参考资料:《当前宏观经济形势及其走势分析》储东涛

回答者: syl1984-助理三级 10-29 13:41

· 1979年1月邓小平应邀对美国进行正式访问

· 1981年邓小平主持起草《关于建国以来党的若干历史问题的决议》

· 1982年党的十二大提出建设有中国特色社会主义

· 1984年国务院发出《沿海部分城市座谈会纪要》确定开放14个沿海港口城市

· 1987年党的十三大提出社会主义初级阶段理论

· 1990年国家实施开发开放浦东战略

· 1992年邓小平南巡讲话

· 1992年党的十四大提出建立社会主义市场经济体制的改革目标

· 1995年实施科教兴国战略大力推进教育创新

· 1997年:香港回归

· 1997年党的十五大提出高举邓小平理论伟大旗帜

· 1999:澳门回归

· 世界上最大的水利枢纽工程——三峡工程的兴建

· 2000年江泽民提出“三个代表”重要思想

· 2000年开始实施西部大开发战略

· 2001年北京取得2008年奥运会主办权

· 2001年中国加入世贸组织 WTO逐渐改变国人生活

· 2002年十六大明确提出“全面建设小康社会”的战略任务

· 2004年温家宝:牢固树立认真落实科学发展观

· 2004年“三个代表”重要思想写入宪法

· 2004年中央启动“振兴东北”战略

· 2005年神舟六号载人航天飞行圆满成功

· 2005年股权分置改革试点启动

· 建设社会主义新农村关注农民心声

· 2006年青藏铁路顺利通车巨龙跨越世界屋脊

· 2007年《物权法》出台

· 2007年中国共产党第十七次全国代表大会在京开幕

· 2007年中国“嫦娥”成功飞天圆千年梦想国威大振

· 2008年中国成功举办奥运会

·神舟七号飞船“飞天”获得圆满成功

改革开放30年

30年过去了,真可谓是弹指一挥间。在这30年中,我们的祖**亲----中国,已经发生了天翻地覆的变化。这30年的征程,中华民族以崭新的姿态重新屹立于世界民族之林;30年的沧桑巨变,30年的光辉历程,铸就了一个民族近百年的梦想!从1978年到2008年,我们走改革开放的中国特色社会主义道路整整30年。中国社会取得的翻天覆地的变化和崛起的速度让整个世界为之震撼。中国在人类历史上创造了一个奇迹,就是用30年的时间把贫困人口从两亿减少到2000多万,在“中国人真的站起来了”的惊呼声中,我们迎来了中国改革开放30岁韶华!

30年改革开放,30年功勋卓着。30年辉煌成就有力地证明:以改革开放为动力,走有中国特色社会主义道路的决策,是最科学的、最正确的、最有利于广大人民群众的决策。30年来,从农村到城市,从农民到市民,从农田到工厂,从森林到牧场„„先进代替了落后,机械取代了人工,旧貌换新颜。我们体验了收复港澳的快慰,一国两制的成功,三峡工程建设的壮观,神舟载人飞船升天的壮举,西部开发的激情,奥运会的圆满成功„„、2009年的建国60周年、2010年的上海世博会、2011年的建党90周年和辛亥革命100年――――我们籍改革开放辉煌之成就,借十七大之东风,深感盛世良机,当砺精图治,与时俱进,开拓创新,总结改革经验,展示发展成就,提升执政理念,扩大对外影响。为中华民族的伟大复兴做出更大的贡献!而此刻,你正在为你自己的历史打下印辙!

开放数据论文 篇3

关键词:大数据 开放数据 图书馆服务 知识发现 信息组织

中图分类号: G250 文献标识码: A 文章编号: 1003-6938(2014)02-0120-03

Abstract The arrival of the era of big data endows the library with new service content and requirements. In the aspect of open data services, libraries need to switch roles, and to provide users with collections catalog, data governance,open access, knowledge discovery, semantic analysis and other services.

Keywords big data;open data;library service;knowledge discovery;information organization

大数据带来的信息风暴正在变革人类的生活、工作和思维[1]。在大数据时代,渗透到各个行业、领域的数据成为了推动社会发展的要素之一,因此有人称大数据时代的数据就是“金矿”。但这种“金矿”的价值挖掘与实现需要借助相应的技术与平台,也需要人类智慧的参与,于是,对大数据资源的高效利用成为了相关业界如IT、企业、科研等普遍关注的问题。以信息组织、信息利用为所长的图书馆,也感受到了大数据时代所带来的变化,在近年来也展开了大量的图书馆视野下的相关理论研究。

大数据带给图书馆的影响与变化主要是数据的变化,即图书馆从面对传统的有序、单一、少量的结构化数据如数据库数据向无序、多元、海量的非结构化数据、半结构化数据方向转移。其中,作为大数据组成部分、集合了理念与实践的开放数据(Open Data)也受到了关注与研究。本文在概述大数据与开放数据的基础上,对开放数据视角下的图书馆角色进行了审视与分析,最后对大数据时代开放数据环境下的图书馆创新服务如数据监管、知识发现等服务进行了列举和概述。

1 大数据与开放数据概述

1.1 大数据

目前,业界对大数据还没有一个明确的定义,但也一般都认为大数据是不可能用常规软件和分析工具进行分析的巨大数据集[2]。此外,大数据既有结构化数据,也有非结构化数据和半结构化数据,涵盖了文本、数字、图像、视频等多种类型,并可跨越多个数据平台,如社交媒体网络、网络日志文件、传感器、智能手机的定位数据、数字化文档及归档的照片和视频等[3]。

1.2 开放数据

互联网与开放获取(Open Access,OA)运动的发展,既使得人们的信息交流更加便捷与方便,也让对开源和开放知识、数据、资源的利用逐渐成为人们获取信息的主要组成部分。由此而产生的自由开放思维也成了人们信息获取的主要思维,总是期待着出现解决不局限于软件、开放格式和数据自由公开与再使用的开放信息,于是一种实现了更广范围的公开与再使用数据即开放数据便应运而生。

对开放数据的定义存在争论,不同的组织、机构也存在不同的理解视角,但对于开放数据的内涵即其是一种理念及实践、数据不受版权与专利等机制限制、可以被任何人自由获取还是都能接受与认可。有学者也曾对开放数据的内涵阐释为:按照用户特定的需求和一定的互联网协议、规则、框架,对Web数据进行存储和组织的活动,而利用的数据来自不同的数据源或是不同的数据类型,最终目标是实现信息在网络空间的开放、共享与重用,以寻求信息数据最大可能的无限获取与重用[4]。

开放数据与一般的数据相比,其最大的特征就是数据集增值方式,即对象数据包含了所有的事实、数据、信息乃至智慧和知识,也不如其它传统数据可以直接获取、利用和分析,依赖于见证者而存在,不是我们接受或不接受的数据或其它,是我们给予、分享和接受的记忆[5]。同时,开放数据还具有开放性增值方式,因而在用户多、普及率高的政府网站及公共信息服务、商业应用等领域应用广泛,目前,英、美、澳等政府和淘宝等商业组织都应用开放数据进行信息公开等服务,以增强与公众、用户之间的交流与互信。

2 基于开放数据视角的图书馆角色审视与定位

在开放数据的具体实践如开放存取运动、开放研究出版、科学家电子实验笔记开放及科学知识的出版与交流等形式中,图书馆都是各个实践形式的主要参与者与推行者,但由于开放数据运动目前在各国的实践主体主要是政府,并且世界主要发达国家如美国、英国、法国等也均承诺政府将把公众的需求放在重要位置,通过征求公众意见逐步开放有价值的数据集,体现了政府在开放数据运动中的绝对推动者、践行者地位。在这种环境下,图书馆必须准确定位自己的角色,发挥自身优势为开放数据的发展提供服务,如基于开放数据的馆藏目录发布、开放获取等。

Hope Leman认为在开放数据运动中,图书馆员是知识工具箱与支持专家,即实现对概念的知识注释、实验及相关技术研发的知识支持[6]。我国学者刘春丽、徐跃权则认为在开放数据环境中,图书馆可能扮演与研究周期各个阶段的科学产出匹配的知识服务中心和开放数据的管理和保存中心两大角色[7]。

(1)知识服务中心。随着科学研究的周期不同,图书馆在科研过程中所发挥的作用和提供的服务也随之不同,如在科学研究的概念阶段,图书馆可为进行科学理念、研究计划讨论的用户提供开放书目等服务,并将讨论结果等形成新的知识分享数据;在数据分析与出版阶段,图书馆可借助于在开放存取期刊发表、提交到机构知识库中等途径将科学研究的结论、实验数据、科研过程等进行开放获取与共享交流;在同行评审阶段,图书馆可以发挥科研情报中心的作用,基于学术社交网络及开放存取平台,分析科学研究论文与数据的使用与评价活动,提取基于使用与评价的选择性计量指标(Altmetrics),对科学论文和科学数据的科学价值进行评价,进而评估论文与作者在某一个研究领域的学术影响力[7]。

nlc202309020004

(2)开放数据的管理与保存中心。欧洲研究图书馆协会主席Paul Ayris博士认为在科学研究的开放工作流中,要增加专业图书馆的可见度,要重视科学数据的再利用及科学数据保存的可持续性[8]。笔者以为在以数据密集型为科学研究特征的第四代科研范式下,数据特别是产生于实验、记录了科研过程等重要信息的科学数据是科学研究所重视和再利用的数据对象,图书馆有责任与义务扮演开放数据管理与中心的角色,以为科学家等用户群体提供开放数据的检索、分析、保存等服务。基于开放数据的连续利用视角,图书馆还需进行诸如开放数据的关联与发布、标示与引用等服务。

3 大数据时代的图书馆开放数据服务

大数据带给社会以数据驱动的社会创新与发展动力,因此如美国总统科学技术顾问委员会给总统和国会的报告所说“联邦政府的每一个机构和部门,都要制定一个应对大数据的战略”[9]一样,包括政府在内的社会各个机构如美国政府、欧盟等都制定了应对大数据的战略对策。2010年11月,欧盟通信委员会向欧洲议会提交了“开放数据: 创新、增长和透明治理的引擎”报告[10],首次将开放数据与大数据关联到了一起,并以开放数据为核心,对大数据时代的挑战进行了战略部署。但将大数据概念应用到开放数据上,则首先意味着数据的规模和类型有了变化,产生于社交媒体、智能终端、传感器上的海量非结构化数据、半结构化数据都是开放数据的范畴;其次,意味着数据的应用发生了变化,即数据不再是单一领域的数据,而是覆盖了用户的所有需求领域,并可直接获取和应用。

大数据赋予开放数据的新要求也意味着大数据时代的图书馆开放数据服务将被赋予新的要求,笔者认为,大数据时代的图书馆开放数据服务,主要有:

(1)多领域数据源的整合与开放服务。从目前的开放数据运动发展来看,主要实践有开放政府数据、开放存取学术期刊与机构知识库,距大数据时代所要求的多类型、多领域发展程度要求尚远。图书馆由于有着涵盖了所有领域的丰富馆藏资源,是大数据时代数据开放与整合的最佳实践者。因此,图书馆可整合多方资源,如科技、人文、气象、政务等诸多领域的报告、实验数据等资源,进行数据的整合与开放发布,让公众通过图书馆的一站式检索服务平台来获取所需的数据。

(2)基于知识联盟的数据开放与共享服务。由于大数据时代的开放数据是整合了不同系统、政府和部门之间的数据集,这就需要建立一个数据共享和互操作的框架,如新泽西州运输部利用采集到的数据(在汽车制造商的管辖下)能够发现诸如拥堵和交通流等问题,而这些功能通常是由当地或全国的政府交通运输部门负责[11]。图书馆可借鉴这些成功的案例进行构建或参与到由政府、企业、社会机构组成的知识联盟,利用协作分析技术对数据和系统进行无缝隙整合。

(3)基于一站式服务平台的知识发现服务。数据“开放”的核心是为了用户更高效的发现和利用,以缩小信息所有者和用户的信息不对称距离。EDS、PRIMO、SUMMON等一站式知识发现平台的应用为图书馆的开放数据知识发现服务提供了方便,图书馆可应用这些平台对用户提供知识咨询等服务。

(4)数据的开发、创建、共享与转换服务。此类服务在图书馆界已有着成功的实践,如开源站点biblios.net采用了类似维基模式向图书馆界提供开放MARC数据的开发、创建、共享、转换服务,目前以3000万余条数据成为为全球最大的免费图书馆编目数据平台[12],德国国家图书馆[13]、大英图书馆[14]也宣布对外提供开放数据服务。

(5)数据监管服务。开放数据的检索、价值挖掘与应用实现,必须经过一定的排列、存档与管理过程,而这些数据有可能是来自于有数据组织经验和能力的政府、企业、公益组织等,也可能是来自于只提供数据而没有数据组织或没有组织意愿的公众、机构。图书馆可发挥自身的信息组织、信息分类特长,对这些数据进行修改、合并、标引、分析与索引,即提供数据监管服务,使数据集合之后获取最大收益。

(6)数据分析服务。大数据时代的信息服务主要是数据分析服务,如可视化分析、影响力分析等,开放数据的价值也需要此类以工具、平台应用为基础的数据分析才能实现,图书馆可为用户提供这一服务,以提高开放数据的应用效率和价值。

(7)政策、标准的制定与咨询服务。数据的统一格式与数据源的互相提供,保证了开放数据的信息易被用户检索、获取与利用。为了保证不同机构、联盟、系统间的数据格式统一和共享机制成熟,以及避免可能出现的版权等政策限制,开放数据的相关标准、政策制定必不可少。图书馆可积极参与到这些标准、政策的制定之中,提供咨询等方面的服务。

参考文献:

[1]中科院专家:大数据带来信息风暴变革人类生活http://finance.chinanews.com/it/2013/11-17/5511708.shtml.

[2]Wohlsen M. Big Data Helps Farmers Weather Drought’s Damage[EB/OL]. [2014-03-27]. http://www.wired.com/business/2012/09/big-data-drought/.

[3]John Carlo Bertot.郑磊,徐慧娜,包琳达译.大数据与开放数据的政策框架:问题、政策与建议[J].电子政务,2014,(1):6-14.

[4]吴旻.开放数据在英、美政府中的应用及启示[J].图书与情报,2012,(1):133-136.

[5]李佳佳.信息管理的新视角—开放数据[J].情报理论与实践,2010,(10):35-39.

[6]Leman H.Open Sesame:the Open Science and Open Data Movements and Their Implications for Librarians[J].Oregon Library Association,2010,16(3):29-32.

nlc202309020004

[7]刘春丽,徐跃权. 开放科学和开放数据环境中专业图书馆的新角色[J].图书馆建设,2014,(2):83-88.

[8]Ayris P. Knowledge and Wisdom: the Role of Research Libraries inSupporting the European Research Agenda [EB/OL].[2014-03-27].http://www.slideshare.net/libereurope/knowledge-and-wisdom-therole-of-research-libraries-in-supporting-the-european-researchagenda#btnNext.

[9]Executive Office of the President President’s Council of Advisors on Science and Technology. Designing a digital future: federally funded research anddevelopment in networking and information technology [EB/OL].[2014-03-27].http://www.whitehouse.gov/sites /default /files /.../pcast-nitrd-report-2010.pdf.

[10]Communication Commission. Open data engine of innovation,economic growth and transparent governance [EB/OL].[2014-03-27].http://eceuropa.eu/information_society/.../opendata2012/...data.../es.pdf.

[11]Ovide S. Tapping “Big Data” to Fill Potholes[N/OL].[2014-03-25].http://online.wsj.com/article/SB10001424052702303444204577460552615646874.html.

[12]About biblios.net[EB/OL].[2014-03-27].http://biblios.net/faq.

[13]German National Library.Linked data service of the German National Library [EB/OL].[2014-03-27].http://www.d-nb.de/eng/hilfe/service/linked_data_service.htm.

[14]The British Library. Free data service[EB/OL].[2014-03-27].http://www.bl.uk/bibliographic/datafree.html.

作者简介:张峥嵘,女 ,东北林业大学图书馆副研究馆员;刘亚丽,女,东北林业大学图书馆馆员。

基于关联数据开放政府数据 篇4

2009年2月,Tim Berners-Lee在TED大会上提出关联数据,并介绍了其对于数据Web发展的影响。随后,世界各国开始以关联数据的形式公开发布政府数据,如美国、澳大利亚、新西兰、荷兰、瑞典、西班牙、奥地利、丹麦等以及地方政府伦敦、纽约、温哥华等。最具影响力的是2009年5月美国data.gov的启动以及2010年1月由互联网之父Tim Berners-Lee和南安普敦大学人工智能教授Nigel Shadbolt领导开发建立的英国政府开放数据网站data.gov.uk。在国内,政府各部门对信息的需求变得越来越明显,为了解决当前政府“信息孤岛”的问题,把所有可公开的相关数据关联起来,并发布到统一的数据平台上供大家使用,我们将采用W3C标准中的关联数据技术和方法实现数据的开放。为了实现这个目标,我们需要处理的问题有:信息的来源问题,数据的格式问题,数据的相互关联问题以及数据的使用问题等。同时,关联数据作为基础技术,使数据的发布者能满足数据使用者的各种各样的需求,实现数据的最大化应用。

2 Linked Data与国外开放政府数据

Linked Data这个概念来自W3C正式项目———关联开放数据(Linked Open Data,LOD)项目。目前该项目含有50多亿个RDF三元组,该数据还在不断的增加。简单来说,关联数据的三个基石是URI、RDF和HTTP协议,即通过HTTP协议来传递RDF数据,而这个RDF数据是一个遵循特定规则语义数据,这个特定的规则就是使用URI来描述任何资源[1]。关联数据和数据的关系就好比万维网和文件的关系,是语义万维网的一种可行的表达方式,实用且可操作,适用于各种形式的数据,它根据开放标准将数据连接在一起,从中萌发出很多新的事物,比如:在遵循关联数据四项原则的前提下,地理信息系统、移动通信系统、公安信息系统的数据能组合在一起,有效的评估公安系统对某一区域犯罪率的控制。

2009年,美国和英国都分别作出开放数据的承诺,data.gov与data.gov.uk两个政府网站相继启动。5月下旬,由美国联邦首席信息办公室和Vivek Kundra成立的一个美国政府网站data.gov,作为政府数据中央存储库,经过一年的时间从起初的47个数据集已经发展到现在的272677个。其根本目标是,让公众对联邦政府行政部门生成的“高价值”、机器可读的数据集进行访问,使得公众的参与与协作是网站成功的关键。2010年1月项目正式启动的英国政府网站data.gov.uk采用语义网的架构概念、SPARQL的搜索技术,其中地理信息底层采用yahoo用户界面库Yahoo User Interface Library实现[2],该网站就已包含约2500个数据集,这些数据集来自于英国政府部门,既是非私有的,并以相同的格式存在以便重用。总体来看,data.gov.uk拥有超过data.gov的优势,使用关联数据格式发布数据,使得用户更容易使用数据,它使用通用的网络语言使得用户对整个网站的导航比较熟悉,让更多用户也参与进来。但是,这两个网站发展的空间还很大,随着时间的推移,将会变得更流畅,更富成效。

3 国内数据开放存在的问题

政府的信息开放包含三个方面:政府透明度,问责制,以及知情权。当前,来自政府体制内的不同部门利益难以协调,难实现数据的整合、公民对政府的监督和问责。国家信息化办公室的撤销,从一方面显示了国内信息化地位的降低。而对于研究者来说,没有数据,就如“无米之炊”,但并不是所有的政府及科研数据都拿不到,只是拿到的数据精度不高,不成系统,甚至不能用,因此,数据的开放和共享在国内成为了一个瓶颈。另外,还存在一个问题,对于同一种类的数据,不同的部门会采取不同的统计方法,所得出的结果有很大差别,比如说,对于贵州人口统计,我们应该选择哪一个体制的数据,国家统计局(常住人口37623600人)与贵州省公安系统统计的数据(户籍人口39850386人),用户只能是根据自己的需求来选择所需要的数据。2006年1月12日,中国生态系统研究网络的数据正式对外公布,虽然数据在进一步的完善中,但这也是科学界数据共享的一个新的开始。最后,在接下来的数据工作中,除了解决数据分散、信息孤岛,还应有针对数据开放的立法,保证数据的有效使用。

针对中文信息的处理,也存在很多的问题,比如说歧义的自动识别,对于水果类的“苹果”和计算机品牌“苹果”,计算机还不能准确的识别出来;又如目前搜索引擎的主要问题,缺乏智能,用户的输入是关键词的组合,无法准确地表达用户的检索需求,搜索引擎的输出是网页集合,需要用户自己从这些返回的网页中进一步寻找答案,浪费了时间,即使是Google中国,它按照倒排序的方法将用户较感兴趣的网页放在前面,但是最终的选择还得靠人工来选择;由于信息的异构,把信息融合在一起时比较困难;等等。因此,在我们运用Linked Data技术来对国内的数据进行开放处理时,应考虑到具体的国情和中文信息处理方面的问题,只有与现实结合起来,才能更好的做好政府数据开放的工作。

4 开放政府数据

2005年,Izzard,Vincent和Burlat等人在第一届企业软件和应用互操作国际会议中提出了关于企业集成中语义和本体的概述和一个通用的集成处理工作流程[3]。借鉴英美两国开放数据(data.gov与data.gov.uk)的成功案例,根据实际需求和互操作任务,采用Linked Data标准实现政府部门之间数据的共享和开放。这一节将介绍Linked Data技术是怎样应用到国内数据开放的进程中。

采用“从下自上”的方法开放数据,即在取得高层授权后,先把数据放到网上,由使用者集体参与的结果来决定出数据最后的形式,之后再整合。发布开放数据工作流图如图1所示[4,5,6]。

4.1 语义描述

语义描述是为了明确服务的功能和业务数据的语义,包括数据的描述、功能的描述和业务的描述。语义描述数据是整个工作流程中比较难以实现的一个步骤,但是一旦充分的实现了语义描述,将会帮助大众更容易的找到、理解、使用数据。实现语义的描述的过程充分展现了Linked Data技术的优势所在。

4.1.1 标识

使用URIs(Uniform Resourse Identifiers,统一资源标识符)来标识资源。在Linked data环境下,统一选用HTTP URIs,避免使用其他的URI模式(如URNs和DOIs)。选择HTTP URIs命名主要有三个原因:其一是http://是唯一的URI模式,并且绝大多数工具和基础设施都支持;其二是URIs提供了一种简单的方式创造出全球唯一的名字,且不需要集中地管理;其三就是URIs的作用不仅仅是命名,也是Web中处理资源信息的途径。好的资源标识符不仅仅是提供人和机器都可读的描述,也要“Cool”[7],即设计简单、稳定及可管理。

4.1.2 选择URIs

URIs用来命名资源,并连接RDF和Web,在发布关联数据之前,我们应该找出相应资源的URIs。一方面,它们必须是很“好”的命名,能使其他的发布者可靠地把你的资源链接到他们的数据上;另一方面,在恰当的地方建设好支撑技术的基础设施,使得它们能被解引用。要尽量选择在可控情况下发布的URI,另外,最好是选择可以帮助记忆的、稳定的、持久的命名。因为一旦更改URI,就会改变已经建立的链接。由于技术环境制约着URI的选择,所以对URI进行清理也是很必要的工作,可以通过添加URI重写规则到Web服务器的配置中实现。最后,可在URIs中使用关键字确保其唯一性,例如,在处理书籍的URI时,使用ISBN编号作为URI的一部分。如:

http://www4.wiwiss.fu-berlin.de/bookmashup/books/006251587X

4.1.3 选择术语集

为了使客服端应用程序能尽可能简单访问到数据,应使用已经普遍使用的数据集,在现有术语集中没有找到需要的术语时,才定义新的术语。

重用现有的术语集

在语义Web中已有很多著名的术语集:FOAF(Friend-of-a-Friend)、DC(Dublin Core)、SIOC(Semantically-Interlinked Online Communities)、SKOS(Simple Knowledge Organization System)等。这些数据源的URI是解引用的,意味着能从Web中检索到相应概念的描述,并能链接到其他数据源的URIs。

自定义术语

使用RDF词汇描述语言1.0:RDF模式或OWL(Web Ontology Language,Web本体语言)。需要注意的是,最好不要从零开始定义新的词汇,而是在现有的词汇上附加术语来描述资源,最重要的是术语的URIs要能解引用,使得客户能查找到术语的定义。由于人能猜测,但机器不能,在定义过程中不能丢失重要的信息,也不要创建太多的限制,而是保留发展的灵活性。

4.1.4 RDF描述

如果没有对数据的描述,数据是没有多大用处的。对数据的一个描述就是一个固定格式的字节流,譬如HTML,RDF/XML或JPEG。例如,某个同学的成绩单就是一个信息源,它能被描述为一个HTML页面,一份PDF文档或RDF文档。由于单一的信息资源能有很多种不同格式的描述,用一种简单的语言来描述数据集以创建一个Web页面,可以帮助搜索引擎找到数据供给用户使用。在描述中至少应该包括这个资源的标题、说明、出版日期及数据来源等。

4.1.5 链接

在完成了对数据的描述之后,下一步就是实现数据的链接了。

手动链接

一旦定义了特定数据集作为合适的链接对象,就需要手动的搜索想链接到的URI引用,如果数据源没有提供搜索的接口(SPARQL终端或HTML的Web形式),可以使用Linked Data浏览器(Tabulator或Disco)搜索数据集并找到准确的URIs。需要注意的是,数据源可能使用HTTP-303重定向来重定向客户端,从定义非信息资源的URIs到定义描述非信息资源的信息资源的URIs。在这种情况下,请确保所连接到URI引用是定义非信息资源,而不是关于它的文档。

自动生成

这种方法适合于规模不大的数据集,此时,使用自动记录链接算法生成数据源之间的RDF链接是有意义的。

4.2 语义发布

其目的是提供一种方法,使得计算机能理解所发布的信息的结构,甚至是信息的含义,使信息搜索和数据集成更有效率。并将多种不同类型的数据转换为关联数据类型。

如:关系数据库,有一些开源的工具能实现关系数据库到关联数据的转换,如D2RServer,Triplify;电子表格,机构的大量信息以电子表格的形式存在,早期的recovery.gov数据都是以表格的形式发布,部分源表在最上面一行有一个表头,可以导出为逗号分隔文件、CSV;XML,首先把XML数据放到Web中,然后指出这个XML是关于什么的?是什么东西?关系又是什么?再使用一个程序转换XML文件为RDF,等等。

确定了要发布的数据后,维护发布的数据就成了是政府最关心的问题。所以为了保留数据的历史性,应使用版本可控的数据集,以便人们能引用和链接到过去或现在的版本,这些升级的或新的数据集也能索引到旧的数据集。在必要的时候还能提供工具转换旧的数据。因此,如果能在数据中嵌入数据的版本号或是标识符,那就会使得人们使用数据更加便利,顺畅。

4.3 测试及调整数据

在发布作为Linked Data的信息到web后,应该测试信息是否能准确的访问到。一个简单的测试方法就是把多个URIs一同放入Vapour链接验证服务,生成一份详细说明URIs关于HTTP不同要求的报告。另外,就是查看在不同的Linked Data浏览器中信息是否显示准确,浏览器是否能在数据范围内找到RDF链接。

4.4 语义发现

语义发现是发现服务中能够进行有意义的交互的处理过程。通常,语义发现过程依赖于语义描述。语义发现的一个基本要素就是能用额外的信息来扩大对服务的描述,如元数据。服务的提供者也许会采取各种各样的方式来描述他们的服务、访问策略等。尽管如此,很多资源的使用者也会根据他们自己的选择策略来决定他们想要使用的服务,如数据的起源、衍生的服务质量、信誉指标等。在发现服务中使用语义,使得搜索引擎能更好地“理解”特定网页的内容,更准确的搜索想要的信息,同时也可搜索到其他有用的精密信息,同时使得自动化搜索有可能得以实现,更容易集成多个Web服务[8]。

4.5 语义调解

语义调解是异构系统进行交互的构成要素,是在产生冲突的情况下使用的特定实体[8]。其主要作用是利用数据,以创造更高级别的应用程序的信息。使用本体调解技术,如合并、对齐或一体化,语义调解器能识别出数据之间隐含的相似之处。值得注意的是,调解器必须被理想的考虑为第三方,其主要目标是使不同的观点近似,避免可能给予所涉及的当事方之一特权的决定。

当知识表述在一个中立的执行方式中时,可以更容易使用知识,更容易在不同的应用系统中重用知识。使用调解器表示一个源执行的接口要求,并转换到能被目标接口使用的知识库中,并作用于数据和其处理过程,若系统要求数据的语义内容是相同的,需要数据调解器,但是表述的句法是不同的;若共享一个处理过程的语义内容时,就需要处理调解器,但是消息或消息交换模式是不同的[9]。

5 结束语

使用关联数据标准发布数据对于政府来说,提高了政府透明度,实现公民对政府的监督和问责。其中,对于政府数据的发布者来说,关联数据标准意味着能可靠地发布数据,而对于数据的使用者来说,关联数据标准则意味着他能灵活、方便地重用政府数据。政府数据有很多可以使用关联数据的领域,如统计和地理空间信息,但是大多数数据都不是关联数据格式,且数据模式难以理解和重用,对于Web规模的数据集成是封闭的。文中结合国内数据开放所存在的问题以及中文处理过程中的问题,总结出开放并发布政府数据到Web中的工作流程,即在确定所需要的数据源后,从各个部门收集数据,按照先发布后调解的原则,把语义描述好的数据发布到Web中,将各种类型的数据形式统一转换成关联数据形式存储在RDF数据库中,在测试并调整后,语义发现数据及选择需要的服务,在异构系统进行交互的时候使用本体调解技术实现数据的合并、对齐或一体化,增加数据的重用。由于当前国内政府还没有实现数据的开放,关联数据技术仍未得到充分的应用,国外的相关工具在处理中文时时常会产生异常,而国内相应的工具没有开发出来,所以这也是将来需要解决的问题,要使政府数据完全实现关联数据标准,还有很多工作要做的,很多技术需要学习。

摘要:采用Linked Data标准来发布开放的政府数据,可以提高政府数据的透明度,增强公民对政府的监督和问责。该文中结合国内没有实现政府数据开放和共享的原因,总结出适应于国内发布开放的政府数据到Web的工作流程,即在确定所需要的数据源后,从各个部门收集数据,按照先发布后调解的原则,把语义描述的数据发布到Web中,将各种类型的数据形式统一转换成关联数据形式存储在RDF数据库中,在测试并调整后,语义发现数据及选择需要的服务,在异构系统进行交互的时候使用本体调解技术实现数据的合并、对齐或一体化,增加数据的重用。关联数据技术使得政府作为一个中心平台,用来满足来自商业、学术和开发人员对数据的广泛需求,最大限度使用各种类型的数据。

关键词:关联数据,语义,公开,链接,电子政务

参考文献

[1]Christian Bizer,Tom Heath,Tim Berners-Lee.Linked Data-The Story So Far[J].International Journal on Semantic Web and InformationSystems,2009,5(3):1-22.

[2]John Sheridan,Jeni Tennison.Linking UK Government Data[M].London:LDOW Press,2010.

[3]Said Izza,Lucien Vincent,Patrick Burlat.A Unified Framework for Enterprise Integration—An Ontology-Driven Service-Oriented Ap-proach[C].Switzerland:Pre-proceedings of the First International Conference on Interoperability of Enterprise Software and Applications,2005.

[4]Bizer C,Cyganiak R,Heath T.How to publish Linked Data on the Web[M].Germany:ISWC Publishing,2008.

[5]Daniel Bennett,Adam Harvey.Publishing Open Government Data[M].Washington DC:W3C Working Group Press,2009.

开放数据论文 篇5

一. 关于“责任教师教学支持服务工作调查表(教师问卷)”的数据统计(219份)

1、您是否参加了本学期市校组织的第一次教师培训会? A、参加(177占80.8%)

B、没有参加(39占17.8%)

2、您是否能通过电话、网络等方式及时联系到责任教师并与其交流?

A、可以及时联系(193占88.1%)B、可以联系但不及时(23占10.5%)C、联系不上(2占0.9%)

3、课程责任教师是否介绍了“人才培养模式改革和开放教育试点”的有关精神和要求? A、介绍明确(191占87.2%)B、介绍不明确(17占7.8%)

C、没有介绍(8占3.7%)

4、课程责任教师是否介绍了本课程教学实施方案的设计思路及实施要求? A、介绍明确(193占88.1%)

B、介绍不明确(23占10.5%)

C、没有介绍(1占0.5%)

5、课程责任教师是否与你们共同探讨教学模式改革创新的思路? A、深入探讨(118占53.9%)

B、简单交流(89占40.6%)

C、没有探讨(10占4.6%)

6、您认为本课程教学实施方案设计得如何? A、很好(96占43.8%)0.5%)

B、较好(109占49.8%)

C、一般(13占5.9%)D、不好(1占

7、课程责任教师是否指导制定教学点的课程教学进度。

A、详细指导(111占50.7%)B、简单指导(96占43.8%)C、没有指导(12占5.5%)

8、课程责任教师的指导对您开展教学是否有帮助? A、很有帮助(116占53%)

B、有所帮助(98占44.7%)

C、帮助不大(5占2.3%)

9、课程责任教师是否指导您组织网上实时教学? A、明确要求(162占74%)

B、一般要求(50占22.8%)

C、没有要求(6占2.7%)

10、课程责任教师是否参加了您组织的网上实时教学? A、参加(174占79.5%)

B、没有参加(20占9.1%)

C、非实时跟贴(17占7.8%)

11、您是否参加了课程责任教师组织的网上实时教学? A、参加(170占77.6%)

B、没有参加(20占9.1%)

C、非实时跟贴(24占11%)

12、您认为本课程的网上实时教学对学生自主学习可有帮助? A、很有帮助(78占35.6%)无帮助(1占0.5%)

B、有一定帮助(112占51.1%)C、一般(26占11.9%)

D、13、您认为课程责任教师设计的形成性考核比例及其构成是否科学,对促进学习是否有帮助? A、很好(96占43.8%)B、较好(100占45.7%)

C、一般(21占9.6%)

D、不好(0占0%)

14、您在教学过程中遇到问题,能否及时得到课程责任教师的帮助?

A、能及时得到帮助(171占78.1%)B、能及时联系但帮助不大(41占18.7%)C、不能(1占0.5%)

15、您认为本课程责任教师的业务水平如何? A、很好(139占63.5%)0%)

B、较好(73占33.3%)C、一般(5占2.3%)D、不好(0

16、您认为本课程责任教师的责任意识和服务态度如何?

A、很好(143占65.3%)

B、较好(68占31.1%)C、一般(7占3.2%)D、不好(0占0%)

17、课程责任教师是否详细介绍市电大本课程目前有哪些多种媒体教学资源? A、详细介绍(122占55.7%)B、简单介绍(86占39.3%)C、没有介绍(6占2.7%)

18、您认为本课程的网页教学资源做得如何? A、很好(83占37.9%)占0%)

B、较好(115占52.5%)C、一般(20占9.1%)

D、不好(019、您认为利用网络开展教研活动的效果如何? A、很好(82占37.4%)占0%)

B、较好(101占46.1%)

C、一般(33占15.1%)

D、不好(020、您认为本课程的网上资源对学生自主学习可有帮助?

A、很有帮助(77占35.2%)B、有一定帮助(124占56.6%)C、一般(13占5.9%)

无帮助(1占0.5%)

21、您对市校网上教学资源的意见与建议: 辅导教师对此提出如下意见或建议(依热度排序)(1)希望网上资源做到及时更新。(2)网上资源还不够,需要再增加。

(3)网上资源应大量增加如:案例教学的素材,往年试卷、单元测试、练习题等和其答案或解题思路等内容,以发挥网络效能。(4)资源的形式应多样化,如多一些动画、多媒体等各种课件,以便于使用。

(5)有的辅导教师还建议:合理布局页面、提前上挂资源、注意发挥辅导教师的作用,提出探讨学生使用资源折算成课时、探讨如何调动学生使用资源的方法等问题。

22、您对市校组织的教师培训和教研活动的意见与建议: 辅导教师对此提出如下意见或建议(依热度排序)(1)教研活动的次数应增加并定期。(2)教研活动应依托网络开展。

(3)教研活动的具体安排应与辅导教师协商。

(4)教研活动时应注重发挥辅导教师的作用,关注教研活动的效果,关注重点内容、教学中共性等问题。(5)有的辅导教师还提出:多组织较大型(也可在网上)教研活动、制定统一的课程教学进程计划、加强教学点对辅导教师的管理以起到互相监督的作用等建议。

23、您对组织课程网上实时教学的意见和建议: 辅导教师对此提出如下意见或建议(依热度排序)(1)网上实时教学时间安排应放宽(如2-3天)。(2)网上实时教学的安排应注意与教学点协商时间。

(3)网上教学活动进一步加强实时教学的同时也应加强非实时教学以充实和完善实时教学的内容。(4)网上实时教学应注意及时互动(回帖),注重教学效果,内容要多结合实例,以增加学生学习的主动性和积极性。(5)有的辅导教师还提出:网上实时教学应注意发挥辅导教师的作用、教学内容要注意重点(如结合形成性考核)、解决页面能显示学生所在的教学点、存在前面学生的发贴影响后面学生的思路的问题等。

D、二.关于“学生对辅导教师评价的问卷调查情况”的数据统计

调查专业数总计30 发放调查表数共:1560份 实收调查表数共:1471份

1、本学期本专业各课程的面授辅导课(不包括实验辅导课等)平均教学时数是(每次3学时)?

A、一般不超过3次(260 占 17.68%)B、一般3次至8次(632 占 42.96%)C、一般8次以上(533 占 36.23%)

2、辅导老师在面授过程中是否介绍开放教育的教学模式和学习模式?

A、详细介绍(866 占 58.87%)B、简单介绍(561 占 38.14%)C、没有介绍(36 占 2.45%)

3、辅导老师在面授过程中是否介绍本课程教学实施方案及教学安排?

A、详细介绍(892 占 60.64%)B、简单介绍(539 占 36.64%)C、没有介绍(30 占 2.04%)

4、辅导老师在面授过程中是否介绍形成性考核比例及其构成?

A、详细介绍(925 占 62.88%)B、简单介绍(509 占 34.6%)C、没有介绍(31 占 2.11%)

5、辅导老师在面授过程中是否布置自学的内容和要求?

A、是(834 占 56.7%)B、部分提出(569 占 38.68%)C、没有提出(58 占 3.94%)

6、你认为辅导教师的专业业务水平如何?

A、很好(634 占 43.1%)B、较好(628 占 42.69%)C、一般(197 占 13.39%)D、较差(8 占 0.54%)

7、你认为辅导教师是否具有良好的敬业精神和服务意识?

A、很好(650 占 44.19%)B、较好(598 占 40.65%)C、一般(202 占 13.73%)D、较差(12 占 0.82%)

8、辅导老师在讲课过程中是否运用多媒体进行面授辅导?

A、紧密结合(627 占 42.62%)B、部分结合(710 占 48.27%)C、未结合(128 占 8.7%)

9、辅导老师是否安排课堂讨论,进行互动学习?

A、经常安排(660 占 44.87%)B、偶尔安排(712 占 48.4%)C、从未安排(89 占 6.05%)三.关于“学生对网上教学资源使用和网上教学活动”问卷调查情况的数据统计

调查专业数总计30 发放调查表数共:1560份 实收调查表数共:1471份

1、辅导老师是否介绍中央电大在线平台的相关资源?

A、详细介绍(796 占 54.11%)B、简单介绍(607 占 41.26%)C、没有介绍(55 占 3.74%)

2、辅导老师是否介绍南京电大在线平台的相关资源?

A、详细介绍(798 占 54.25%)B、简单介绍(610 占 41.47%)C、没有介绍(55 占 3.74%)

3、你认为本专业教学资源的更新是否及时?

A、及时(717 占 48.74%)B、一般(680 占 46.23%)C、不及时(60 占 4.08%)

4、你认为本专业的网上教学资源对学习的帮助如何?

A、很好(547 占 37.19%)B、较好(588 占 39.97%)C、一般(303 占 20.6%)D、较差(21 占 1.43%)

5、本学期辅导老师是否安排网上实时教学? 如安排,平均每门课程安排几次?

A、三次(712 占 48.4%)B、两次(501 占 34.06%)C、一次(181 占 12.3%)D、从未安排(61 占 4.15%)

6、你是否积极参加各课程的网上实时教学?

A、积极参加(1105 占 75.12%)B、很少参加(325 占 22.09%)C、从未参加(29 占 1.97%)

7、你认为网上实时教学的效果如何?

A、很好(556 占 37.8%)B、较好(542 占 36.85%)C、一般(333 占 22.64%)D、较差(占 0%)

8、你是否经常浏览南京电大课程教学网页?

A、经常(969 占 65.87%)B、偶尔(464 占 31.54%)C、从不(31 占 2.11%)

9、你是否愿意通过课程BBS栏目与教师、学生进行交流?

A、愿意(1164 占 79.13%)B、无所谓(271 占 18.42%)C、不愿意(28 占 1.9%)

10、你在课程BBS栏目的提问,能否得到教师的及时回复?

A、每次都能得到(492 占 33.45%)B、经常得到(498 占 33.85%)C、偶尔得到(361 占 24.54%)D、从未得到(31 占 2.11%)E、从未主动提问(82 占 5.57%)

11、辅导老师是否会根据中央电大及南京电大的精神进行期末复习?

A、每门课程(919 占 62.47%)B、部分课程(474 占 32.22%)C、从不(51 占 3.47%)

12、期末复习的效果如何?

A、很好(563 占 38.27%)B、好(587 占 39.9%)C、一般(261 占 17.74%)D、较差(29 占 1.97%)

13、你希望课程网上教学资源再增强哪些方面的内容?(可多选)

A、学习指导(757 占 51.46%)B、考试指导(994 占 67.57%)C、实验或实践指导(547 占 37.19%)D、课外扩展知识(490 占 33.31%)E、其他(89 占 6.05%)

14、本学期本专业开设的课程中,以下课程网页制作得较好:

公共基础课程和公共专业基础课程网页都做得较好,如计算机应用基础、英语Ⅰ(1)、英语Ⅱ(1)、邓小平理论和三个代表重要思想概论、开放教育入学指南、计算机应用基础(本)、经济法概论、管理学基础等

本科课程:商法、婚姻家庭法学、公司法、西方经济学(本)、质量管理、货币银行学、人力资源管理、现代教育思想、中国现当代文学名著导读、中国古代文学专题(2)、汉语专题(2)、公共政策概论、公共部门人力资源管理、社会保障学、审计案例研究、财务报表分析、高级财务管理、科学与技术、哲学引论、小学语文教学研究、日语、商务英语写作

专科课程:电子商务概论、Internet和Intranet应用、电子商务法律与法规、经济法学、律师实务、民法学(1)、刑事诉讼法学、个人与团队管理、经济数学基础

12、公共关系学、市场营销学、贸易实务、社会调查与研究方法、办公室管理、应用写作、行政组织学、中级财务会计、电算化会计、管理会计、信息管理系统、建筑材料、建筑制图基础、旅游学概论、旅游英语(1)、汽车文化、汽车电器设备与维修A、汽车故障诊断技术A、汽车发动机构造与维修A、机械制图、土木工程CAD、电工电子技术、机械制造、摄影与摄像、面向.NET XML程序设计、Windows网络操作系统、数据库基础与应用、Dreamweaver网页设计、仓储与配送管理、物流学概论、企业物流管理、物业信息管理、药用分析化学、药剂学(1)、药理学等学生认为网页做得较好。

15、本学期本专业开设的课程中,以下课程网上实时讨论活动的效果较好 :

公共基础课程和公共专业基础课程网上实时讨论活动都做得较好,如计算机应用基础、英语Ⅰ(1)、英语Ⅱ(1)、邓小平理论和三个代表重要思想概论、开放教育入学指南、计算机应用基础(本)、经济法概论、管理学基础等

本科课程:商法、婚姻家庭法学、公司法、质量管理、国际贸易原理、西方经济学(本)、货币银行学、现代教育思想、中国现当代文学名著导读、中国古代文学专题(2)、公共政策概论、公共部门人力资源管理、审计案例研究、财务报表分析、高级财务管理、操作系统、C语言程序设计A、科学与技术、哲学引论、教育社会学、高级英语写作、商务英语、日语等认为网上实时教学活动的效果较好.专科课程:Internet和Intranet应用、企业信息管理、国际贸易理论与实务、经济法学、律师实务、婚姻家庭法学、西方经经济学、公共关系学、个人与团队管理、统计学原理A、资源与运营管理、企业文化、广告方案、广告业务、行政组织学、社会调查与研究方法、办公室管理、电算化会计、财政与税收、审计学原理、计算机专业指南、建筑材料、建筑制图基础、旅游学概论、旅游英语(1)、旅游工作者素质修养、汽车文化、汽车发动机构造与维修A、汽车音响、微积分初步、机械制造、机械制图、摄影与摄像、面向.NET XML程序设计、微机系统管理与维护、Windows网络操作系统、数据库基础与应用、仓储与配送管理、物流学概论、计算机文化基础、中国文化导论、中国文学通论(2)、实用文体写作、药剂学(1)、药物分析化学、药理学(药)等课程学生认为网上教学效果较好。

16、学生对网上教学资源的提出如下几点要求:(1)增加和充实网上资源如增加与考试有关的和联系实际的各种案例内容,提供的充分练习题和其他复习资料

(2)提供的资源要与面授挂钩,内容重点要突出,要实用。

(3)希望教学资源加快更新速度,形式要多样化,如再增加一些动画、直播课堂等。

17、对教师组织的课程网上教学活动学生提出如下建议:

对网上实时教学活动,学生主要提出如下希望:

(1)增加网上实时教学的次数,并延长讨论的时间。

开放数据论文 篇6

★建立“数据特区”

数据特区很方便,如何设置呢?

选中需要建立“数据特区”的区域,单击Excel 2007“开始”选项卡中的“套用表格格式”,打开列表选择喜欢的样式,单击。在如图1对话框中确认“表数据的来源”正确,然后选中“表包含标题”,确定,“数据特区”就出现了(见图2)。

(1)

(2)

★“数据特区”会计算

“数据特区”建立完毕,小刘就可以使用“结构化引用”的方式,在里面执行各种计算。

建立计算行或列

过去为新员工计算养老金较麻烦,如果小刘在图2工作表的第8行增加数据,要将I7单元格中的公式填充或复制到I8才能算出“实增金额”。

Excel 2007增加了一个“计算行”(或“计算列”)功能,凡是在“数据特区”中新增的行可以自动应用其上方的公式进行计算。以在如图2所示的数据特区中建立计算行为例,小刘只需选中第7行中的任意一个单元格,进入“开始→单元格→插入”,选择“在下方插入表行”,此后新增的行就会自动应用其上方的公式。小刘只需在新增的计算行中输入数据,就能自动计算出“实增金额”等内容了。同法,小刘还可以在I等行的左侧或右侧建立计算列,公式使用大大简化,省略了“填充”或“复制”公式的过程。

快速汇总大提速

劳资统计工作需要进行各种数据汇总,例如在如图2中计算“平均实增金额”和“最大现缴金额”等等。对粗通Excel的小刘来说,自行设计公式确实有一定难度。好在Excel 2007提供的快速汇总功能帮了她的忙,她只需选中“数据特区”中的任意一个单元格,选中“表样式选项”中的“汇总行”复选项,表的下方会出现一个汇总行。

如果小刘需要在图2所示表中计算“平均实增金额”,只要选中“汇总”行与“实增金额”相交处的单元格,单击右下角的下拉按钮打开如图3所示的列表,选择要进行汇总的函数“平均值”,就可以得到“实增金额”列的汇总结果了。选择如图3列表中的“其他函数”,可以打开图4对话框选择更多的函数。

(3)

结构引用更直观

图2表使用“结构引用”既方便了领导审查公式,也方便了小刘设计和修改公式。以在I2单元格中设计“实增金额”计算公式为例,小刘只需选中I1单元格,在编辑栏输入“=SUM()”,然后将光标插入公式的括号中间。由于G2和H2单元格是连续的,选中这两个单元格,编辑栏就会显示公式“=SUM(表3[[#此行],[实增个人储蓄]:[企业金额]])”。如果公式需要引用几个不连续的单元格,光标插入公式之后按住Ctrl键选中一个单元格,输入逗号(,)按住Ctrl键再选中另一个单元格,依次类推就能得到类似“=SUM(表3[[#此行],[企业金额]],表3[[#此行],[实增个人储蓄]])”的公式。

(4)

元数据注册开放论坛即将召开 篇7

由ISO/IEC JTC1/SC32主办,国家标准化管理委员会承办的JTC1 2010年会将于2010年5月19~28日在我国昆明市召开。会上,将召开ISO/IEC JTC1/SC32(数据管理与交换)全会、SC32/WG1(电子业务)、SC32/WG2(元数据)、SC32/WG3(数据库语言)、SC32/WG4(SQL/多媒体和应用包)等SC32全会和工作会议。

在SC32全会之前,中国电子技术标准化研究所将于5月1 7~1 8日承办第十三届元数据注册开放论坛(OFMR2010),论坛主题是“元数据和云计算”。目前已有来自于美、英、法、德、加拿大、澳大利亚等国家的1 00余名专家和代表注册参加开放论坛。

大数据推动个人医疗信息开放 篇8

今天上医 院看病基 本上都离 不开“医 疗数据”,国内外医疗服务已走到数据驱动的年代,不管是数据获取,还是诊断、检测及后期的治疗干预。利用最新的云计算和大数据技术进行诊疗越来越常见。然而医疗健康数据的开放至今仍是一大难题,个人是否应该获得自己的医疗数据信息?如何获得其完整的医疗健康数据?目前前景还很模糊,但是充分利用IT技术和医疗相结合,已经是正在发生的事实。

潘多拉的盒子?

在3月27日博鳌亚洲论坛《智能医疗与可穿戴设备》分论坛上,华大基因CEO王俊表示医疗和IT实现完美结合,最重要的基础是数据、数字化,生命中很多体征都是可以被数字化的。他说,“这并不是硅谷型的IT,更多的是以生命为基础的IT。其实生命自己本身又何尝不是建立在代码和基因排序基础上的呢?我们可以用计算机分析众多的数据。比如移动医疗穿戴设备是很好的媒介,可以实时传达和生命、健康有关的信息,和医院实现互联互通。”

大数据与健康的关系日益紧密,用王俊的“基友论”来解释,这也意味着硅基数据对碳基生命越来越重要了。医疗信息涵盖许多,包括CT、核磁共振、血液检测、基因检测结果,接种经历,医生诊断,手术视频……这些数据都是无价之宝。

开放数据的价值,不仅在于病人可以从电子病历中获得数据,他们同样也可以向电子病历提供数据,辅助诊断。

开放数据的价值,不仅在于病人可以从电子病历中获得数据,他们同样也可以向电子病历提供数据,辅助诊断。目前市场上已有一些应用和项目,比如苹果的Health Kit,能够让用户定期提交健康数据,而且苹果已和Cerner和Epic Systems等电子病历系统建立合作,这对用户进行慢性病管理能起到一定作用。除了Health Kit之外,苹果还针对医护人员发布了Research Kit,医学研究者可通过苹果终端收集各类病患的健康数据,辅助诊断疾病。

一些医疗机构还提供一种“以病人为核心”的解决方案,开放公共应用程序接口,帮助人们在不同平台间共享数据。这一项目还努力打造一种保护患者隐私的工具。“如果患者的健康数据需要被应用程序或者其他设备分享,他们能够知情并选择是否同意这种做法”。

据了解,开放医疗数据遇到的阻力既来自医生,也来自医院方面。首先医生担心会提高沟通成本。其次,担心是否会影响医院的“生意”。再次,是否会让患者进行不当的自我诊断/评价。最后,也是最重要的,数据安全性是否有保障。

类似于这样的担心非常多,那么个人医疗数据真的就像打开潘多拉的盒子那样释放魔鬼了吗?答案显然不是,随着近年来医疗事业发展和大数据分析的逐渐增加,业界仍有不少声音在呼吁开放个人医疗数据。

值得一提的是,我国最高人民法院在2014年10月10日公布实施的网络侵权司法解释中,再次强调了对包括基因在内个人信息的保护力度,即任何人不得非法公开。业内人士在分析之后认为,用户行为信息和实时监控信息是典型的大数据信息,只要这些信息在搜集、使用或利用时符合《关于加强网络个人信息保护的决定》规定的合法性、正当性和必要性的基本原则,没有将这些信息公开特定化到个人,那么运用大数据信息的行为不仅不是非法的,甚至应该是得到鼓励的。

如何把数据还给个人?

目前,我国患者难以得到来自不同医院完整的个人健康数据,加之数据格式不一致,难于管理和充分应用,亟待规范。为了推动医疗、健康产业信息开放、共享、开源,国内出现了一些民间非盈利性组织,由国内优秀的相关HIT及医疗健康应用开发商、各类医疗及健康服务机构、医疗器械及健康类消费电子产品生产商、运营商、互联网公司、媒体等相关产业链机构和个人组成。开放医疗与健康联盟(OMAHA)就是这样一个组织。

在今年3月14日OMAHA成立大会上,其筹备会负责人郑杰呼吁,医疗数据应该还给患者。“当前一些机构的健康数据泄露问题是很突出的,比如一些云计算企业经常爆出存在大面积账户数据泄露问题。从安全的角度来看,我们提倡把个人的数据还给个人,个人为自己的数据安全负责。数据大集中管理的方式是双刃剑,虽然会带来一些方便性,但是数据泄露几率也比较高。”

由于国内医院已经实施了不同规范的HIS独立信息化平台,患者个人难以获得、自主管理自身的电子病历等电子健康档案,同时手写病历难以辨认,不方便查询、统计,会影响医患关系和服务质量,要解决该问题,需要完整、统一、普适的电子病历标准,及综合性强的操作平台系统,以及实用性强的运行机制。

因此,医疗信息数据的完整性对患者治疗非常关键,并有助于多专科协作。郑杰介绍,OMAHA联盟将推动数据开放,让老百姓可以用U盘拷取个人健康信息;推动建立源代码开放的电子生物档案,希望整合医院、健康管理机构,甚至包括可穿戴设备收集的数据在内的全民健康数据,构建个人全生命周期的“健康云”。

全世界在健康信息存储和使用方面,价值取向趋同。《美国联邦政府医疗信息化战略规(2015~2020)》中提到,要建立一种电子健康信息存储和使用文化, 营造安全、全面的健康信息交换和使用的环境,使每个人都能受益于简单、及时、公平、高效及恰当的信息获取和分享,并通过鼓励创新和竞争培养优质的医疗信息化解决方案。另外,苹果公司的researchkit就是源代码开放的数据存储模式,数据的使用者要自己解决海量数据的保存及传输问题,数据存储与公司服务器无关,符合美国医疗电子交换法案中关于个人健康信息的隐私保护标准及规定。

据了解,OMAHA联盟将联合健康报社移动健康研究院,在全国范围内征集志愿者,对国内三级以上医院的数据开放情况进行调研,了解患者拿到的数据类型及方式,如纸质病例、打印报告、在线浏览、可下载电子档案等,并了解患者所得数据的完整性及方便性。该调研活动产生的数据结果将纳入健康报社移动健康研究院倡导的“医患友好度”评价体系中,成为该评价体系的一个重要维度指标。

大数据在医疗行业中的应用场景

近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。因此,医疗行业将和银行、电信、保险等行业一起首先迈入大数据时代。

通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定病人的最佳治疗途径。研究表明,对同一病人来说,医疗服务提供方不同,医疗护理方法和效果不同,成本上也存在着很大的差异。精准分析包括病人体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定临床上最有效和最具有成本效益的治疗方法。医疗护理系统实现CER,将有可能减少过度治疗(比如避免那些副作用比疗效明显的治疗方式),以及治疗不足。从长远来看,不管是过度治疗还是治疗不足都将给病人身体带来负面影响,以及产生更高的医疗费用。

大数据分析技术将使临床决策支持系统更智能,这得益于对非结构化数据的分析能力的日益加强。比如可以使用图像分析和识别技术,识别医疗影像(X光、CT、MRI)数据,或者挖掘医疗文献数据建立医疗专家数据库,从而给医生提出诊疗建议。此外,临床决策支持系统还可以使医疗流程中大部分的工作流流向护理人员和助理医生,使医生从耗时过长的简单咨询工作中解脱出来,从而提高治疗效率。

数据分析可以带来业务流程的精简,通过精益生产降低成本,找到符合需求的工作更高效的员工,从而提高护理质量并给病人带来更好的体验,也给医疗服务机构带来额外的业绩增长潜力。

全球政府开放数据运动方兴未艾 篇9

联合行动, 迅速推广

全球开放数据运动始于美国。截至2014年2月10日, 全球已有63个国家加入开放政府合作伙伴组织。

全球开放数据运动始于美国。2009年1月, 美国总统奥巴马签署了《开放透明政府备忘录》, 要求建立更加开放透明、参与合作的政府, 体现了美国政府对开放数据的重视。同年, 数据门户网站Data.gov上线, 美国行政管理和预算局向白宫提交的《开放政府令》获批准, 全球开放数据运动由此展开。

2011年9月20日, 巴西、印度尼西亚、墨西哥、挪威、菲律宾、南非、英国、美国等8个国家联合签署《开放数据声明》, 成立开放政府合作伙伴组织。截至2014年2月10日, 全球已有63个国家加入开放政府合作伙伴组织。

2013年6月, 八国集团首脑在北爱尔兰峰会上签署了《开放数据宪章》, 法国、美国、英国、德国、日本、意大利、加拿大和俄罗斯承诺, 在2013年年底前, 制定开放数据行动方案, 最迟在2015年年末按照宪章和技术附件要求来进一步向公众开放可机读的政府数据。

从目前全球参与开放数据运动的国家来看, 既包括美国、英国、法国、奥地利、西班牙等发达国家, 也包括印度、巴西、阿根廷、加纳、肯尼亚等发展中国家。国际组织欧盟、经合组织、联合国、世界银行也加入了开放数据运动中, 建立了数据开放门户网站。

主动承诺, 逐步开放数据资源

在各国承诺中, 政府都将公众的需求放在重要位置, 通过征求公众意见逐步开放有价值的数据集。

政府收集了大量有价值的数据, 通过开放数据, 可以更好地了解一国的自然资源使用情况、政府开支情况、土地交易和管理情况。正是意识到了开放数据的众多好处, 美国、英国、法国等国政府纷纷发布相应的行动计划, 主动作出开放数据的各项承诺, 逐步开放数据资源。

美国政府在2013年12月5日发布的《开放政府合作伙伴——美国第二次开放政府国家行动方案》中提出, 在成功地实施了第一次行动方案中开放数据承诺的基础上, 在第二次的行动方案中作出承诺, 要让公众能够更方便地获取有用的政府数据。通过这些承诺, 美国政府将按照战略资产来管理政府数据, 对Data.gov门户网站进行改进, 开放农业和营养方面的数据。

英国政府在2013年11月发布的《八国集团开放数据宪章2013年英国行动计划》中作出了6项承诺:一是英国将发布《八国集团开放数据宪章》中明确的高价值数据集;二是确保所有的数据集都通过国家数据门户网站data.gov.uk来进行发布;三是通过与社会、机构、公众沟通来明确应该优先公布哪些数据集;四是将通过分享经验和工具来支持国内外开放数据创新者;五是将为英国的开放数据工作设定一个清晰的前进方向, 所有政府部门将在2014年6月前更新其部门的开放数据战略;六是英国政府将为政府数据建立一个国家级的信息基础设施。

法国政府在2013年11月6日发布《八国集团开放数据宪章法国行动计划》, 作出4项承诺:一是朝着默认公开发布数据的目标前进, 支持高价值数据集的发布;二是建立一个开放平台以鼓励创新和提高透明度;三是通过征求公众和社会意见完善开放数据政策;四是支持法国和全球的开放式创新。

在各国承诺中, 政府都将公众的需求放在重要位置, 通过征求公众意见逐步开放有价值的数据集。

信息公开与数据开放有什么区别 篇10

“政治口号”的含义是不能望文生义地解释,口号的提出都有其特殊的背景,只有联系其背景才能理解口号要突出什么强调什么。没有重大的观念升级没有必要用数据开放去替代信息公开,认真研究更换口号的背景,对于理解新口号的含义是十分重要的。

口号提出的时间很重要,“政府信息公开”是上个世纪末提出的,对应于电子政务的早期环境;“政府数据开放”是2009年提出的新概念,两者有十年的时间差。对于飞速发展的互联网技术而言,十年意味着两个时代,望文生义的解释看不到信息环境根本性的变化,实际上根本性的变化是大数据应用环境的出现,“政府数据开放”是适应大数据时代的口号。

政府信息公开对应于窄带电子政务

电子政务是互联网技术普及催生的政府行为,互联网的出现改变了公众与公众、政府与公众的信息环境,公众信息能力的增强一方面会挑战政府公信力,另一方面也为政府可以通过互联网改善政府服务提供了机会。政府信息公开是提高政府公信力、促进政府与公众合作的重要措施。与此同时政府将越来越多服务搬到互联网上,提高政府的服务效率。政府信息公开与政府的联机服务是前期电子政务重要成果。

但是前期电子政务对应的互联网环境是窄带通信环境,窄带电子政务环境下不可能提出开放政府原始数据的要求,社会愿望总是建立在当时的技术背景之上,公众不可能提出超出技术可行性的数据共享目标。

政府数据开放对应于大数据时代

政府数据开放的口号诞生于2009年,十年间互联网环境已发生了巨大变化,首先是互联网宽带化,从互联网上获取大规模数据已经越来越现实;其次是移动互联与传感器技术升级,使得政府数据规模加速升级;第三是大数据应用技术的发展与普及,使得社会(包括企业与某些个人)的数据处理能力大幅度提升,这种新的互联网环境使得政府的数据资源可以为更多的社会机构与个人再利用,使社会大数据应用创新能力可以借助于政府数据开放得以充分发挥。

政府数据开放是大数据时代的口号,比政府信息公开有一些新要求:

开放原始数据

今天的用户已经具有大数据处理能力,已经不满足看政府的分析结果,用户有能力对政府数据进行创造性的开发,挖掘出更大的社会价值;

数据要可机读

政府信息公开主要是面向公众阅读的,用户通常不需要进行数据处理,政府网页的形式就够用了,但使用原始数据的用户都需要进行数据处理,数据处理机读才方便,原有的政府网站已不适用了,各国都在建立专门的数据网站。

要支持用户的增值服务

数据开放直接的用户是机构和有专业知识的个人,政府原始数据的利用成本很高(时间、技术、设备等),需要有足够的效益来驱动,政府要支持社会利用政府数据资源开展增值服务,优先开放价值高的数据,促进应用的繁荣。

政府数据开放其他要求(如信息安全、隐私保护等)限于篇幅不再赘述。

笼统的提法会忽略观念的升级

我们看到“政府数据开放”与“政府信息公开”的不同内涵,是电子政务在新技术环境下的观念拓展,以“数据”替代“信息”是要强调“原始数据”开放,原始数据开放的成本要高得多(更高的质量要求、更高的维护成本),服务的要求也复杂得多,它要方便用户的数据处理、要支持用户的增值服务、信息安全隐私保护也有更高的要求。

政府信息公开主要是政治上的要求,容易监督与检查,行政手段能够发挥更多的作用,但政府数据开放还需要考虑经济效益,因为政府数据开放需要与社会机构密切合作,要带动社会应用创新,因此数据开放不能一刀切,在兼顾政治效果、开放成本与社会经济效益的前提下,宜选择效益高的数据先开放。

政府数据开放的政治效果容易立竿见影,数据开放将进一步推动政府工作的透明化,改善社会的监督。实现数据开放的经济效益会困难得多,经济效益一方面来自用户利用政府数据分析挖掘的信息改进工作,更多的效益来自利用政府数据开展的增值服务,借助于App服务模式使大众用户也能享受政府数据开放的红利。政府数据开放能够有效推动社会大数据应用创新,推动创新是很多国家政府数据开放的重要目标。

人们可以将“政府信息公开”和“政府数据开放”都归入宽泛的“公共信息资源共享”口号,但是这种归入并非概念创新,人们更容易用十年前的老观念去忽略技术环境变化带来的新挑战与新机会,忽视政府数据开放带来的新思想,失去对新理念的敏感性,因此使用全球通用的、更有针对性的“政府数据开放”口号宣传效果更好。

开放数据论文 篇11

近年来,以互联网、移动互联网为基础的信息化、全球化趋势,已经深入的改变了我们的生活模式、生产模式、竞争模式。随着大数据时代的到来,广告主对于精准营销的需求也正在上升。如何通过技术手段,挖掘大数据下的深层次关系,让营销更准确、有效已经成为营销中的重中之重。

以前的创意团队在小黑屋里苦思冥想,往往能够收获一些意想不到的灵感,从而为企业创造财富。然而这种日子将一去不复返。如今的品牌创意团队所做的不仅是唤醒顾客的品牌意识,同时还要将内容营销真正落实到交易环节中,最大化用户转化率。这就需要他们引用更多的第一手数据或第三方数据,以便获取相对精准的消费者画像以及更多有效决策信息。

作为中国领先的互联网企业,腾讯一直致力于探索大数据在营销中的应用与发展方向。2015年12月,腾讯牵手电通安吉斯集团以及群邑这两家全球领先的传播集团,签署了智慧数据战略合作协议,率先引领整体行业打开数据开放之门。2016年,腾讯再度与全球领先的广告、市场营销以及品牌传播整合营销集团宏盟媒体集团展开合作,通过数据深度挖掘来驱动营销创新,帮助广告主获得更深入的消费者洞察,提高媒体策划和购买效率。

让数据在营销中“活”起来

“互联网+”的时代,“连接”中产生的海量数据成为这个时代最重要的品牌资产,数据的挖掘与智能应用能力决定着品牌的现在与未来。然而,当前大数据领域面临着诸多行业问题,各行各业之间的数据资产仍然处于封闭的管理状态,犹如一座座数据孤岛,缺乏分享、连接与沟通转化。要想让数据在营销中“活”起来,首先需要认清问题所在,腾讯公司副总裁郑香霖在专访中就当前大数据领域面临的问题归纳出了以下三点:

问题一 数据孤岛严重阻碍商业智能效力的提升

具体表现在三个方面:数据不开放,无法有效修正策略;数据非全量,无法有效评估效果;数据不对接,无法提升投放效率。如何打破数据孤岛,释放大数据能量,建立开放、健康的品牌广告数据营销生态是大数据时代每一个营销人内心的渴望。

问题二 缺乏完善的生态与行业标准

任何一个行业的发展都离不开行业标准的制定,中国互联网广告在标准化上与西方成熟市场仍有一定差距,难以形成整体生态,给广告主的投放带来很大的困扰。

问题三 数据价值无法充分发挥

尽管当前大数据在营销中的应用已经愈加普遍,但数据的深度挖掘依然不够,不足以充分洞察消费者需求并指导媒介投放。

作为中国领先的互联网企业,腾讯希望能够从自身做起,率先引领整体行业打开数据开放之门,将数据在营销中使用起来。对广告主而言,腾讯智慧数据强调真实连接,全量接入而非抽样获取,可以深入洞察消费者,实时掌握消费者动态,指导广告主营销策略输出,并能够实现投放效果的可衡量和可监测,使广告主可及时调整投放策略,而且通过多维整合,对实现跨媒体、跨终端、跨平台、跨场景用户行为洞察,还原消费者决策链起到极为重要的作用。

另外,腾讯通过与宏盟媒体集团联手创新数据营销,优化品牌投放ROI,更加深入的对消费者进行分类和洞察,指导广告主营销策略输出,并与八大行业的广告主一道建立大数据模型,从而实现在最佳的媒体环境下让广告精准触达用户。据了解,腾讯将在2016下半年逐渐开放用户画像数据平台,为宏盟媒体集团提供自助查询人群画像分析数据的平台和服务,对还原消费者决策链起到极为重要的作用。

打造开放生态,让数据更有价值

“中国的互联网广告迫切需要建立一个数据生态。我们正在与广告代理和客户一起,致力于建立一个完整的架构,构建一个成熟的数据生态。在这个快速变革的时代,我们要为中国的互联网营销行业树立标准,并走在世界的前列”,在专访中,郑香霖提到,构建完整生态是腾讯的目标,但仅靠腾讯与电通安吉斯集团以及群邑,还是远远不够的。

“互联网行业和广告行业,变化每天都在发生,我们能够做到的,就是把腾讯多平台的智慧数据优势尽量放大。”据郑香霖介绍,腾讯智慧数据是基于大数据的升级,腾讯智慧数据具有标签化、动态化、多元化、开放性和安全性五大基本属性。作为生态构建的源头,腾讯正积极运用智慧数据对营销进行重构,打造开放、共赢的数字营销新生态。

未来,腾讯将本着开放的心态,更广泛地吸纳全行业数据,通过数据共享及战略合作,获取更多腾讯外部数据资源,扩容腾讯数据池,打造更高的数据价值,形成满足各行各业需求的智慧数据服务。

全面布局,推动行业标准的建立

为推动行业标准的建立,在2015年年初,郑香霖就代表腾讯积极响应中国广告协会互动网络委员会的号召,主动参与起草研发了我国首部《中国移动互联网广告标准》,“标准的建立可以让大家进行比较,甚至可以接受小的试错,对合作各方都是极大的保障。

除了构建行业标准,在2015年年中腾讯推出了数据管理平台(DMP),并与尼尔森合作推出数字广告收视率(DAR),共建准确跨屏的衡量体系,更率先在国内发起CPM可见曝光售卖升级,将PC端与移动端打通,率先实现全网资源CPM售卖,“我们希望逐步打造一个更健康、更健全的数据生态。”

郑香霖还透露,后续腾讯还将持续分阶段、分步骤的开放智慧数据,并在SSP、DSP平台上深化发展、全面布局大数据生态,引领整体互联网行业的标准建设,带来更加整合、高效的广告投放效果及绿色、透明的移动互联网营销生态。

开放数据论文 篇12

公开数据让利企业社会

大数据是近年在互联网信息技术行业的流行词汇。它指的是对规模巨大的资料量进行专业化撷取、管理和处理, 使之成为帮助企业和社会发展的有效资讯。有统计说, 目前世界上90%的数据是最近几年才产生的。

大数据在商业领域的应用已经十分普遍, 电子商务公司根据每天的顾客点击量和购买行为记录, 预测未来的潮流趋势。政府部门一直是数据资源的“强势”占有者, 囊括了人口、交通、卫生、社保、税收、城市规划等方方面面。盘活这些资源, 对于转变政府职能、提高行政效能, 大有裨益。

如今, 在世界很多地方, 政府数据公开已被视为经济与社会发展的动力。香港特别行政区政府的一站通网站公布了人口、水资源、空气污染、实时交通、食物与卫生等12大类、上百个动态更新的数据集。其中, 交通信息被市场广泛利用, 衍生出多个智能交通应用程序。

须打破部门“信息垄断”

虽然目前我国基于大数据的信息共享建设取得了一定的成效, 但是, 从总体来看, 跨部门的信息资源利用系统仍局限在小部分的政府业务范围, 而且应用的深度和广度还远远不够, 不能满足当今社会发展的要求。

建立大数据平台的过程中, 一大困难就是有些部门不愿公开数据, 导致数据封闭、“沉睡”, 无法被社会开发利用。历史形成的信息分散在各部门的“割据”局面也阻碍了数据的开发利用。此外, 一些政府部门还常以“保密”“不宜公开”为由拒绝提供和分享信息。

联接和整合各个部门的“信息孤岛”, 是大数据时代公共管理的题中应有之义, 尤其需要克服惰性和守旧习惯, 来一次政府理念的创新、政府职能的转变、政府流程的再造。

不过, 良好的发展势头并不意味着政府相关职能就自然能够乘势顺利转型。相比技术的引进, 政府自身的调试更为重要。几乎每个政府部门目前都建成了比较完备的信息化平台, 但是相关数据因为条块分割, 如一个个信息孤岛, 缺少跨部门的信息整合。买一套房子, 需要填报十几张表格, 每张表格1/3以上的内容是重复的, 让人完全感受不到大数据的便利。其实, 这些都是政府部门拥有的基础数据, 完全可以根据身份证号码自动生成。无论是网络世界还是现实社会, 这些各自为政的信息高墙, 使得互联互通、信息资源共享举步维艰, 成为电子政务未来发展的最大瓶颈。

观念和态度不变, 即使手握利器, 行政效率和服务质量也难提高。谁都知道“九龙治水”弊端多, 即使现在大数据有办法让九龙成天“坐在一起”, 但如果互相谁也不理谁, 水还是治不好。曾有学者研究指出, 每个时代都有那么一群人, 对新技术的到来表现出抗拒甚至恐惧, 这类人群的共同特点就是害怕改变。联接和整合各个部门的“信息孤岛”, 是大数据时代公共管理的题中应有之义, 尤其需要克服惰性和守旧习惯, 来一次政府理念的创新、政府职能的转变、政府流程的再造。对于管理部门来说, 这不仅是上马多少信息技术项目的技术革命, 更是调整自身运作的机制革命。

工业和信息化部信息化推进司副司长董宝青表示, 部门的“信息垄断”必须打破。

上一篇:沈海高速下一篇:英汉语言文化差异