开放数据库

2024-05-10

开放数据库(通用12篇)

开放数据库 篇1

就全球范围来看, 美洲地区和欧洲地区处于数据开放第一梯队, 亚太地区处于第二梯队, 中东、中亚和非洲地区处于第三梯队。

在后信息时代, 数据成为一种新兴资产。政府掌握着大量的核心数据, 让原始的政府数据对社会开放已经成为各国的民主运动的新内容, 数据开放作为提升政府提升透明度、提高国家创新竞争力、提升社会民主程度的重要措施, 在各国受到越来越多的关注和重视。

2011年在美国政府的倡议下, 全球正逐渐形成“数据开放联盟”, 40多个国家和地区纷纷加入该联盟。2013年10月31日, 《开放政府联盟 (Open GovernmentPartnership) 2013峰会》在伦敦举行, 会上互联网之父蒂姆·伯纳斯·李发布了由“开放数据晴雨表项目组”、互联网基金会、开放数据研究会共同编制的《开放数据晴雨 表:2013年开放数据全球报告》 (以下简称《报告》) 。

该《报告》旨在揭示全球不同开放数据计划的渗透性和影响力, 分析全球开放数据发展趋势, 并对各国和地区进行排名。《报告》指出, 数据开放正处在起步成长阶段。

在全球首个政府数据开放平台Data.gov诞生的近五年时间内, 数百个国家和地方政府已经相继建立起了各自的政府数据开放平台, 与此同时, 国际研究机构、非盈利组织和企业等也正在逐步加入到该平台中来。所有的参与者正在以不同的方式探索如何让开放数据的价值得到释放, 进而达到鼓励创新、增加透明度和提升政府责任感。

在数据开放进程加快的时代背景下, 《报告》对全球77个有广泛代表性国家的数据开放情况进行了研究分析, 站在国家层面为全世界提供了政府数据开放的整体“快照”和“印象”。

整体“印象”

《报告》指出, 全球数据开放目前呈现快速发展但发展不均衡的态势。信息化法律的完善程度、数据开放政策的制定、社团组织和专业技术人员对数据开放的需求程 度、政府对数据开放创新应用的支持度, 以及城市或地区数据开放程度等多个要素共同决定区域数据开放程度。

就全球范围来看, 美洲地区和欧洲地区处于数据开放第一梯队, 亚太地区处于第二梯队, 中东、中亚和非洲地区处于第三梯队。

如表1所示, 美洲、欧洲和亚太区在政府开放数据 (Open Government Data) 中政府政策倡议方面得分差距不大;社团和技术人员对数据开放的需求上三者存在明显差异, 欧洲得分最高表示其对数据开放需求最为强烈和迫切;城市或地区的OGD水平也存在明显差异, 欧洲得分最高表明其区域内城市或地区的平均水平增多美洲和亚太区域高, 其在数据开放方面有着良好的基础。

从五个区域整体来看, 五项指标中政府对数据开放创新活动的支持度得分最低, 表明政府在数据开放中所发挥的作用不足, 针对该情况, 《报告》建议政府要加强对在线数据的提供程度。

《报告》还指出, 目前虽然也有一些国家的政府数据开放已经推广到城市一级, 如尼日利亚、日本江户等国家和城市已经在推出全国政府门户网站前推出了城市数据开放门户, 但就世界范围来看, 实施政府数据开放政策的仍主要停留在国家层面, 尚未普及到城市一级。

指标解读

为了更好地对全球数据开放情况进行评估, 《报告》主要从准备度、执行力和影响力三个维度对各国所处开放数据的阶段及其在给经济、政治和社会所带来的影响进行了评估。

准备度是指一个国家是否具备实现开放数据潜力的政策、社会和经济基础, 包括政府、企业、公众与民间团体三方面; 执行力是指政府发布一系列关键数据集以支持社会各界进行创新、对政府的审计问责和改进有关决策的程度;影响力是指开放数据已导致积极的政策、社会、环境和经济变化的程度。

成功的政府数据开放政策倡议需要的不仅仅只是数据集, 更需要的是让中介机构能够很好地利用这些开放的数据, 把这些数据转变成用户可以以不同方式并利用不同设备去访问以及处理的、具有社会价值和经济价值的平台和产品。这就是有时 我们所说的基于政府数据开放项目的核心数据生态系统。

《报告》主要从三个方面考查政府数据开放准备度变量:

在政府准备度方面, 主要考察政府开放数据的能力和政府对数据开放的承诺, 包括政府开放数据的意愿、让数据更加可用的组织能力, 以及如何保证从数据开放中获益。

在公民和社会团体准备度方面, 主要考察公民社会的自由开放度和其在数据开放议程中的参与度, 包括《信息权利法》和《数据保护法》等制度的制定情况。

在企业和公司准备度方面, 主要考察企业公司通过对开放数据资源进行再利用所带来的经济利益及其作为“中介”给社会所带来的“催化”作用, 包括企业的互联网普及率、企业在数据可用性方面的有关培训, 以及政府对开放数据引领创新的支持作用。

什么数据是有用的?答案并不在于政府是否公开数据, 而在于全社会利用其公开的数据在实践应用中所产生的影响如何。有些国家吹嘘自己在网上发布了大量数据集, 但事实上, 如果这些数据并不是公众所需要的, 或者这些数据无法有效提升国家透明度、政府责任意识和社会等, 那其开放的意义对于开放政府数据所希望实现的目的微乎其微。为说明政府开放数据的有效性, 《报告》尝试选择那些既能代表国家不同职能、又是数据再利用者感兴趣的数据类别进行了初步研究。数据可用性是影响数据执行力的 一个重要因素。

在评估数据集的可用性方面, 《报告》选取了地理环境、土地持有、人口、政府预算、政府财政支出、公司注册等共14类数据, 对77个国家的数据开放情况进行了统计分析。

《报告》在评估全球数据开放的影响力时, 主要从开放数据被应用的领域范围, 以及数据在提升政府效率和透明度、环境可持续性和社会稳定、经济增长和企业活力等多方面入手, 具体观察分析了各国数据开放给本国所带来的实质影响。

《报告》通过调查发现, 政府数据开放的影响力更多地集中在对政府的“问责”和企业对数据的创新应用两方面。其中, “问责”对于提升政府的透明度和对社会的责任意识是最为明显的, 而数据开放给公司企业利用数据进行创新应用所带来的影响也是不言而喻的。开放政府公共数据对企业的影响力, 主要表现在利用公开数据开展APP应用竞赛和推出以鼓励开发者进行创新为目的的“黑客日”两个方面。在评估中发现, 多数国家在数据开放对环境和社会包容性的影响力方面考虑较少, 影响作用较弱。

《报告》通过利用准备度、应用度和影响力三个一级指标对全球多个国家数据开放情况进行分析后, 得出结论认为:从整体情况来看政府公共数据开放政策及其影响力正在全球快速蔓延, 许多国家和地区数据开放已经具备了良好的政府、企业和社会环境基础, 但在数据开放的广泛应用、数据开放对政府的影响力、数据发布和使用条款以及使用结果评估等方面, 仍然有很长的路要走。

国家排名

在此次调查的77个国家和地区中, 排名前五的依次为:英国、美国、瑞典、新西兰、挪威和丹麦 (并列第五) 。其中, 英国、美国和瑞典在数据开放的准备度、应用度指标上得分较高, 美国、新西兰在数据开放的影响力指标上表现较为突出, 如下图所示:

在从政府、企业和社会数据开放准度, 数据开放对经济、社会和政治影响作用, 以及数据在企业创新、政府责任意识提升和改善社会政策制定中执行力共9个方面分析后, 《报告》认为英国的数据开放程度位居全球第一。

英国

具体来看, 英国在数据开放进程中准备度得分较高, 表明英国政府对数据公开较为重视, 企业以及社会对数据公开的诉求和数据意识较为强烈。

2009年英国政府将“开放政府”正式提上日程, 2010年开放政府数据政策得以持续推进, 并得到了来自首相的支持。英国政府对数据开放可能带来的潜在价值给予高度重视, 包括成立专门的数据开放研究所以支持对开放数据的商业应用。为保证所有政府部门对data.gov.uk网站数据的及时更新和维护, 政府要求每个部门制定本部门的数据开放战略, 包括详细的数据应用行动计划以及对战略进展情况定期进行书面报告。英国政府还要求地方政府发布一些数据集, 许多地方政府已经建立了数据开放门户网站。

此外, 在英国, 关于数据开放主题的培训越来越多, 并且有频繁的专题和开放数据“黑客日”、数据开放活动和比赛, 以及由政府提供的创新资金专门用于帮助企业利用开放数据进行创新应用。英国还存在大量来自不同领域且关注数据开放的活跃用户社区, 致力于对开放数据的开发应用。

在执行力方面, 英国在不断扩大政府数据开放范围的同时, 也在提升数据的“深度”, 不断提升数据的质量、标准化程度和关联度。目前, 英国现在全力推进一个以保存、发展和提升核心数据为主的“国家信息化基础设施” (National InformationInfrastructure) 项目。但在影响力方面, 英国公开数据在影响力方面表现不是很理想, 数据开放对经济产生的影响力最大, 但对社会所带来的影响并不明显。

美国

在数据开放方面, 美国远远超出美洲地区平均水平。

2009年美国政府作为“第一个吃螃蟹”的国家发布了政府数据开放倡议, 要求政府部门发布机器可读的、标准化的、高价值的数据, 强调数据可能带来的经济价值。2013年5月美国政府再次发力, 发布了要求更高的“Open Data Policy”行政命令, 要求公开教育、健康、财政、农业等七大关键领域数据, 并对各政府机构数据开放时间做出了明确要求, 同时推出“Project OpenData”项目, 向社会开放更多政府API, 让开发者可以各方便地利用政府数据创造潜在经济价值。

与英国相比, 美国数据开放在公众和社团准备度方面略低于英国, 这可能与英国提出的“让公民受益数字化时代”倡议有关, 英国在全国范围内推动“Go OnUK” (全民性的、跨部门联合开展对人们互联网使用的培训) 项目以提升国民的数字化能力。

在执行力方面, 美国政府略逊色于英国, 英国在data.gov.uk上对政府财政收支、各级公务员工资收入情况等进行了完全公开, 而美国却无法有效提供该政府预算和支出等的详细数据, 表明政府利用数据开放提升政府透明度和责任意识表现不足。

在影响力方面, 美国表现尤为抢眼, 美国政府通过数据开放战略在释放经济增长创新力、提升政府透明度和责任意识以及改善社会环境等方面取得了较为显著的成效。

瑞典

排名第三的是瑞典, 在综合各项指标分析后, 《报告》认为, 瑞典的数据开放程度高于欧洲平均水平。

瑞典早在1776年就成为世界第一个形成信息权利法《Right to Information law》的国家, 这为瑞典2012年发布政府数据开放统一门户网站奠定良好的基础。

在数据执行力方面, 瑞典在全国范围内也形成了以鼓励开发者创新为目的的“黑客日”, 而像TrafikLab之类的项目则把与交通有关的公共部门数据和个人数据在一个平台进行整合, 并提供给创新者。

在影响力方面, 瑞典在利用开放数据提升医疗绩效, 利用环境数据以可视化的方式降低环境预算以及有效的防治害虫等方面发挥了积极的作用。

相对于数据开放给经济和社会所带来的积极影响而言, 数据开放所带来的政治影响较低。

中国

从《报告》排名和得分情况来看, 中国位列第61位, 综合得分为11.82, 整体排名较为靠后。

从指标具体情况来看, 在三个维度中, 中国的准备度得分最高, 但也仅为41.72, 与美国、英国等先进国家相比差距较大, 表明我国政府公共数据开放在政策推动、公民意识等准备方面上较为不足。

执行力得分仅为9.41, 表明我国数据开放在推动创新、提升政府透明度和改善社会决策等方面能力明显不足, 数据有效性和价值度、易用性不高, 例如我国政府支出数据只有十分粗略的总数, 几乎不具备可用价值, 而选举数据则完全缺失。

影响力得分为0, 表明我国政府数据的应用潜力未得到有效挖掘, 未来有较大的开发空间。

开放数据库 篇2

政府数据作为国家基础性战略资源,在数据要素市场化配置中起经济治理的作用,对《意见》提及的“提高要素配置效率”“促进...数据资源有效流动”至关重要。而这一作用的发挥依赖于政府数据开放共享,并且需要在政府数据社会化利用的过程中实现增值,拓展至“丰富数据产品”“引导培育大数据交易市场”“培育数字经济新产业”等价值空间。正如美国政府数据开放平台(data.gov)上的声明所言,“政府数据开放共享赋能应用程序的开发”;国家发改委提出“加快全国一体化大数据中心建设”,也只有实现数据的流通与共享,才能激发这种新型基础设施的经济动能。然而政府数据从创建伊始、采集、组织直至开放共享等全生命周期过程,均离不开统一的标准规范作为数据质量和利用水平的保障。

构建政府数据开放共享标准体系是我国国家战略的需要。《促进大数据发展行动纲要》(以下简称为《纲要》)指出“提升政府数据开放共享标准化程度”“制定实施政府数据开放共享标准”“建立标准规范体系”;《2018 年政务公开工作要点的通知》强调“依托政府网站集中统一开放政府数据,探索制定相关标准规范”。《意见》提出“建立统一规范的数据管理制度”“制定数据隐私保护制度和安全审查制度”“推动完善...数据分类分级安全保护制度”,可见标准体系的建设,对营造安全有序的数据要素市场环境十分必要。

构建政府数据开放共享标准体系是破解当前现实难题的途径。我国缺乏统筹兼用的政府数据开放共享标准体系,仅有广东、山东、上海出台了关于数据开放的地方标准和指南共 6 项,国家标准仅有全国信标委大数据标准工作组研制的 3 项,并且还尚待发布。然而这种现状之下,政府数据开放共享的标准化建设依然远未引起重视,只有上海、北京、福州等 9 个城市在其发布的数据开放政策文件中略有提及,如上海市政府发布的《上海市公共数据开放暂行办法》第三十二条“标准体系和技术规范”提到,鼓励不同主体参与制定数据开放标准。正是由于我国政府数据开放共享标准规范的缺失,造成当前 102 个地方政府数据开放平台系统各异、“烟囱”林立,各平台共开放的 71092 个数据集异构分散、难以整合,甚至给我国部分政府部门带来了开放共享后数据价值的流失、数据流通存在安全隐患等隐忧,这既不利于用户的利用,也很难使政府数据成为市场有效流动、交换共享的要素。

因此,亟待构建我国政府数据开放共享标准体系,促进政府数据的综合利用。

我国政府数据开放共享标准体系的构建 为了使我国政府数据开放共享工作有据可依、规范实施,笔者以数据生命周期理论为指导,主要参考了多个开放数据全生命周期模型,如“开放政府数据生命周期”“关联开放政府数据与元数据生命周期”,由此构建了贯穿我国政府数据开放共享全流程的政府数据开放共享标准体系框架(见图 1)。

依据规范化流程的界定,该体系划分成 6 个标准子体系,按照各阶段不同环节涉及的领域、范围、功能和活动,细化形成 23 项标准,并对其覆盖范围、关键内容进行总结,选择重点领域标准进行研制。

(一)数据创建与汇交标准

数据开放原则规定我国政府数据开放共享的最低限度、行动准则和目标指向,具体内容源于国家政策。数据格式标准指明不同领域数据、混合数据应采用的格式类型。数据采集标准从采集原则和方式入手,是获取高质量数据的保证。数据提交标准涉及技术规范,包括提交流程、可用接口及元数据要求;也涉及操作规范,包括提交者的认证方式和数据上传频率。

(二)数据选择与处理标准

数据审选标准在内容上涵盖与数据集相关的法律、安全、技术及元数据的信息,流程上建议遵循“数据集映射、优先级排序、实施选择、主题分类、数据目录发布”的次序。数据安全风险评估标准是针对数据中个人隐私、商业机密、国家安全等敏感信息进行安全影响评估的指标和流程。数据脱敏标准包括处理敏感信息的原则、流程、方法和工具。

(三)数据描述与组织标准

元数据标准用于揭示政府数据的外部特征和内容特征,笔者此前已撰文设计我国开放政府数据元数据元素集方案,并在该版本基础上增设了“共享(Sharing)”元素。数据分级标准的重点是确定分级方法,并限定各等级的数据的开放共享程度。数据目录分类标准是从资源属性、基础信息、主题信息、属地类别、业务属性和授权类别等多个角度建立的类目体系。

(四)数据关联与发布标准

数据开放优先级标准要指明重点开放《纲要》明确提到的 20 个领域,优先开放利于促进公共服务效益、提高政府透明度的数据集。数据关联标准要遵循 W3C 政府关联数据工作组建议的关联数据发布实践、以及《开放数据五星部署方案》中的相关要求,对关联流程、技术原则和衡量关联程度的指标进行统一规范。数据发布标准规定的是有待开放的数据上传至数据开放平台的流程和方式。

(五)数据发现与利用标准

开放许可协议采用兼容性强、应用广泛的《知识共享许可协议》。数据开放平台标准提出建立国家和地方层面政府数据开放门户的底层技术架构、统一数据检索协议,同时明确运营管理规则,以确保各平台的功能一致性、运行稳定性。数据互操作标准侧重于规范数据互操作框架和互操作级别,前者用于统一互操作的原则和条件,后者考虑法律、机构、语义和技术等方面的互操作问题。数据利用反馈标准涉及用户的反馈渠道、方式及主管部门分析反馈结果的方法。

(六)数据管理与评估标准

数据保存标准通过规定数据存储的介质、方式、保存格式和编码方式实现政府数据长期保存。数据更新标准参照地方标准的更新规则和模式进行建立。数据管理标准说明数据管理的主体及其职责、流程与制度,以及针对人口、法人等政府主数据的统筹管理。数据维护标准遵循“定期维护数据和元数据、检查URI、根据用户反馈进行改进”的流程。数据质量评价标准用于评价数据内容质量,涉及具体的指标和流程。政府数据开放共享评估标准包括规范的评价策略、指标和方法。

我国政府数据开放共享标准体系构建的考虑

(一)广泛吸纳国内外实践成果

该体系在设计之初,除借鉴国外的数据生命周期模型,关注国际动态以外,还通过参考我国大数据标准体系的构建思路,注重与大数据标准化工作的协调,其所划分的标准类型均能在该体系中体现,如具有基础特性的数据开放原则、数据方面的元数据标准、技术方面的数据互操作标准、平台方面的数据开放平台标准、管理方面的数据维护标准、安全和隐私方面的数据安全风险评估标准等。

在确定标准的关键内容时,还重视采纳国内外标准、较为成熟的协议和指南的核心内容,如数据格式标准选用爱尔兰《开放数据技术框架》的“开放数据推荐格式”;数据安全风险评估标准的制定根据国际标准《信息技术安全技术隐私影响评估指南》(ISO/IEC29134:2017)的要求;数据脱敏标准规定的原则、流程和方法采用了山东省地方标准《公共数据开放第 2 部分:数据脱敏指南》(DB37/T3523.2-2019)。

(二)立足当前需求与未来发展

该体系围绕我国建立国家政府数据统一开放平台、识别重点和优先开放领域、分级分类开放共享等需求,分别制定了数据开放平台标准、数据发布标准、数据分级标准,旨在贴合国家政府数据开放共享建设的实际要求。同时,该体系还考虑到政府数据开放共享的热点和前沿问题,以期适应未来发展的需要,如数据关联标准着眼于解决关联开放政府数据的发布问题;数据管理标准可为开放共享环境下政府主数据管理的实践提供具体的参考。

(三)面向多个主体的规范应用

该体系所涵盖的多数标准有助于为数据提供方有序开展政府数据的创建、采集、加工、发布等活动提供参考。数据平台标准能对数据平台方解决搭建、管理和运营政府数据开放平台的问题提供具有可操作性的策略。数据利用反馈标准用于帮助数据利用方以规范的行为获取数据、提交反馈信息和对数据进行再利用。政府数据开放共享评估标准有利于引导评估机构开展评测工作。

该体系力求架构完整,界限分明,以及各项标准之间的有序衔接。希望政府部门、标准化机构、高校、企业给予关注,推动该体系在我国试点地区进行验证、实施和应用,加速政府数据开放共享整体进程,从而扩大要素市场化配置范围,健全要素市场体系,激发全社会创造力和市场活力。

评百度开放“大数据引擎” 篇3

百度此举的意义,可能超过百度本身对此的认识。百度主观上是在做技术推动工作,客观上却可能引发一场产权变革。

就“开放”本身来说,业界的一则评论已经很到位:“百度将用互联网的方式来做开放的大数据引擎。它不可能采取与软件方案公司一样的‘一竿子买卖’方式进行合作。而是将大数据引擎做成一个开放平台,形成标准的接口,让每个行业不同企业可以根据自身各取所需。”

进一步引伸其中的深层含义。以往软件“一竿子买卖”的方式,其产权模式以资本专用性为基础。专用性的前提是东西不可复制,而数据是可复制的。把针对“不可复制”的制度设计,套用到可复制的东西上,是不合适的。而互联网的方式,在产权上的创新在于,设计出专门针对可复制性的制度,这就是“将大数据引擎做成一个开放平台,形成标准的接口,让每个行业不同企业可以根据自身各取所需”。比如软件即服务(SaaS),前一个S(软件)不收费,按后一个S(服务)收费。百度此举进了一步,开放这个服务不光是百度自己提供服务,而且是让各行各业分享百度的数据资产(大数据能力)向他们各自的用户提供APP服务。百度可以从各行各业提供APP服务获取的收入中,收取属于自己平台服务的回报。大家实现共赢。

这是自从资产阶级设计产权制度以来,人类又一次在产权制度上的伟大创造,德国和美国把这种产权创新,称为“分享型经济”。这也是百度自身已做出来,但没有讲出来的道理。新产权的创新点在于,将所有权内部的支配权与使用权(即物权法第一句话说的归属与利用)加以分离,前者免费,后者收费。这就是美国当前最火的“以租代买”模式。例如Airbnb(空中食宿)的模式:行驶本对应的归属权免费,驾驶本对应的利用权收费;百度开放分享的大数据能力,相当于车的归属权免费;而各行各业利用这种能力,相当于车的利用权收费。好处是有驾驶本的人不用买车了。经济学上指分享固定成本,只承担边际成本,管理上叫轻资产运作。资产阶级当年设计产权制度时,由于资产不能复制,所有权内部的归属与利用是合一的;如今知本家设计产权制度,利用资产可复制这一点,把资产分为重资产(平台固定投入)和轻资产(应用边际投入)两块,中间由API(所谓“标准的接口”)分开。借助这种制度创新,人们可以象自家办银行、自己印钞票那样,无穷地复制资本(生产资料),租给APP们去提供应用服务。然后按美国当前的市场行情,以三七比例分成。

一位革命家说过,旧社会的死亡,“他在散发着臭气”。我套用这句话说,旧产权制度的死亡,他在冒着傻气!传统企业在冒傻气:同是使用资本,他们只专用一次;而互联网企业却象印钞票那样,无穷地“印制”(COPY)资本。传统企业傻就傻在跟可以印钞票的比谁的资本更充裕。

百度从技术(人与自然关系)方面,腾讯从人际关系(人与人关系)方面,阿里在从生产方式(人与自然+人与人)方面,BAT正在干这种将资本白给大家,然后向赢家收费的事。

基于关联数据开放政府数据 篇4

2009年2月,Tim Berners-Lee在TED大会上提出关联数据,并介绍了其对于数据Web发展的影响。随后,世界各国开始以关联数据的形式公开发布政府数据,如美国、澳大利亚、新西兰、荷兰、瑞典、西班牙、奥地利、丹麦等以及地方政府伦敦、纽约、温哥华等。最具影响力的是2009年5月美国data.gov的启动以及2010年1月由互联网之父Tim Berners-Lee和南安普敦大学人工智能教授Nigel Shadbolt领导开发建立的英国政府开放数据网站data.gov.uk。在国内,政府各部门对信息的需求变得越来越明显,为了解决当前政府“信息孤岛”的问题,把所有可公开的相关数据关联起来,并发布到统一的数据平台上供大家使用,我们将采用W3C标准中的关联数据技术和方法实现数据的开放。为了实现这个目标,我们需要处理的问题有:信息的来源问题,数据的格式问题,数据的相互关联问题以及数据的使用问题等。同时,关联数据作为基础技术,使数据的发布者能满足数据使用者的各种各样的需求,实现数据的最大化应用。

2 Linked Data与国外开放政府数据

Linked Data这个概念来自W3C正式项目———关联开放数据(Linked Open Data,LOD)项目。目前该项目含有50多亿个RDF三元组,该数据还在不断的增加。简单来说,关联数据的三个基石是URI、RDF和HTTP协议,即通过HTTP协议来传递RDF数据,而这个RDF数据是一个遵循特定规则语义数据,这个特定的规则就是使用URI来描述任何资源[1]。关联数据和数据的关系就好比万维网和文件的关系,是语义万维网的一种可行的表达方式,实用且可操作,适用于各种形式的数据,它根据开放标准将数据连接在一起,从中萌发出很多新的事物,比如:在遵循关联数据四项原则的前提下,地理信息系统、移动通信系统、公安信息系统的数据能组合在一起,有效的评估公安系统对某一区域犯罪率的控制。

2009年,美国和英国都分别作出开放数据的承诺,data.gov与data.gov.uk两个政府网站相继启动。5月下旬,由美国联邦首席信息办公室和Vivek Kundra成立的一个美国政府网站data.gov,作为政府数据中央存储库,经过一年的时间从起初的47个数据集已经发展到现在的272677个。其根本目标是,让公众对联邦政府行政部门生成的“高价值”、机器可读的数据集进行访问,使得公众的参与与协作是网站成功的关键。2010年1月项目正式启动的英国政府网站data.gov.uk采用语义网的架构概念、SPARQL的搜索技术,其中地理信息底层采用yahoo用户界面库Yahoo User Interface Library实现[2],该网站就已包含约2500个数据集,这些数据集来自于英国政府部门,既是非私有的,并以相同的格式存在以便重用。总体来看,data.gov.uk拥有超过data.gov的优势,使用关联数据格式发布数据,使得用户更容易使用数据,它使用通用的网络语言使得用户对整个网站的导航比较熟悉,让更多用户也参与进来。但是,这两个网站发展的空间还很大,随着时间的推移,将会变得更流畅,更富成效。

3 国内数据开放存在的问题

政府的信息开放包含三个方面:政府透明度,问责制,以及知情权。当前,来自政府体制内的不同部门利益难以协调,难实现数据的整合、公民对政府的监督和问责。国家信息化办公室的撤销,从一方面显示了国内信息化地位的降低。而对于研究者来说,没有数据,就如“无米之炊”,但并不是所有的政府及科研数据都拿不到,只是拿到的数据精度不高,不成系统,甚至不能用,因此,数据的开放和共享在国内成为了一个瓶颈。另外,还存在一个问题,对于同一种类的数据,不同的部门会采取不同的统计方法,所得出的结果有很大差别,比如说,对于贵州人口统计,我们应该选择哪一个体制的数据,国家统计局(常住人口37623600人)与贵州省公安系统统计的数据(户籍人口39850386人),用户只能是根据自己的需求来选择所需要的数据。2006年1月12日,中国生态系统研究网络的数据正式对外公布,虽然数据在进一步的完善中,但这也是科学界数据共享的一个新的开始。最后,在接下来的数据工作中,除了解决数据分散、信息孤岛,还应有针对数据开放的立法,保证数据的有效使用。

针对中文信息的处理,也存在很多的问题,比如说歧义的自动识别,对于水果类的“苹果”和计算机品牌“苹果”,计算机还不能准确的识别出来;又如目前搜索引擎的主要问题,缺乏智能,用户的输入是关键词的组合,无法准确地表达用户的检索需求,搜索引擎的输出是网页集合,需要用户自己从这些返回的网页中进一步寻找答案,浪费了时间,即使是Google中国,它按照倒排序的方法将用户较感兴趣的网页放在前面,但是最终的选择还得靠人工来选择;由于信息的异构,把信息融合在一起时比较困难;等等。因此,在我们运用Linked Data技术来对国内的数据进行开放处理时,应考虑到具体的国情和中文信息处理方面的问题,只有与现实结合起来,才能更好的做好政府数据开放的工作。

4 开放政府数据

2005年,Izzard,Vincent和Burlat等人在第一届企业软件和应用互操作国际会议中提出了关于企业集成中语义和本体的概述和一个通用的集成处理工作流程[3]。借鉴英美两国开放数据(data.gov与data.gov.uk)的成功案例,根据实际需求和互操作任务,采用Linked Data标准实现政府部门之间数据的共享和开放。这一节将介绍Linked Data技术是怎样应用到国内数据开放的进程中。

采用“从下自上”的方法开放数据,即在取得高层授权后,先把数据放到网上,由使用者集体参与的结果来决定出数据最后的形式,之后再整合。发布开放数据工作流图如图1所示[4,5,6]。

4.1 语义描述

语义描述是为了明确服务的功能和业务数据的语义,包括数据的描述、功能的描述和业务的描述。语义描述数据是整个工作流程中比较难以实现的一个步骤,但是一旦充分的实现了语义描述,将会帮助大众更容易的找到、理解、使用数据。实现语义的描述的过程充分展现了Linked Data技术的优势所在。

4.1.1 标识

使用URIs(Uniform Resourse Identifiers,统一资源标识符)来标识资源。在Linked data环境下,统一选用HTTP URIs,避免使用其他的URI模式(如URNs和DOIs)。选择HTTP URIs命名主要有三个原因:其一是http://是唯一的URI模式,并且绝大多数工具和基础设施都支持;其二是URIs提供了一种简单的方式创造出全球唯一的名字,且不需要集中地管理;其三就是URIs的作用不仅仅是命名,也是Web中处理资源信息的途径。好的资源标识符不仅仅是提供人和机器都可读的描述,也要“Cool”[7],即设计简单、稳定及可管理。

4.1.2 选择URIs

URIs用来命名资源,并连接RDF和Web,在发布关联数据之前,我们应该找出相应资源的URIs。一方面,它们必须是很“好”的命名,能使其他的发布者可靠地把你的资源链接到他们的数据上;另一方面,在恰当的地方建设好支撑技术的基础设施,使得它们能被解引用。要尽量选择在可控情况下发布的URI,另外,最好是选择可以帮助记忆的、稳定的、持久的命名。因为一旦更改URI,就会改变已经建立的链接。由于技术环境制约着URI的选择,所以对URI进行清理也是很必要的工作,可以通过添加URI重写规则到Web服务器的配置中实现。最后,可在URIs中使用关键字确保其唯一性,例如,在处理书籍的URI时,使用ISBN编号作为URI的一部分。如:

http://www4.wiwiss.fu-berlin.de/bookmashup/books/006251587X

4.1.3 选择术语集

为了使客服端应用程序能尽可能简单访问到数据,应使用已经普遍使用的数据集,在现有术语集中没有找到需要的术语时,才定义新的术语。

重用现有的术语集

在语义Web中已有很多著名的术语集:FOAF(Friend-of-a-Friend)、DC(Dublin Core)、SIOC(Semantically-Interlinked Online Communities)、SKOS(Simple Knowledge Organization System)等。这些数据源的URI是解引用的,意味着能从Web中检索到相应概念的描述,并能链接到其他数据源的URIs。

自定义术语

使用RDF词汇描述语言1.0:RDF模式或OWL(Web Ontology Language,Web本体语言)。需要注意的是,最好不要从零开始定义新的词汇,而是在现有的词汇上附加术语来描述资源,最重要的是术语的URIs要能解引用,使得客户能查找到术语的定义。由于人能猜测,但机器不能,在定义过程中不能丢失重要的信息,也不要创建太多的限制,而是保留发展的灵活性。

4.1.4 RDF描述

如果没有对数据的描述,数据是没有多大用处的。对数据的一个描述就是一个固定格式的字节流,譬如HTML,RDF/XML或JPEG。例如,某个同学的成绩单就是一个信息源,它能被描述为一个HTML页面,一份PDF文档或RDF文档。由于单一的信息资源能有很多种不同格式的描述,用一种简单的语言来描述数据集以创建一个Web页面,可以帮助搜索引擎找到数据供给用户使用。在描述中至少应该包括这个资源的标题、说明、出版日期及数据来源等。

4.1.5 链接

在完成了对数据的描述之后,下一步就是实现数据的链接了。

手动链接

一旦定义了特定数据集作为合适的链接对象,就需要手动的搜索想链接到的URI引用,如果数据源没有提供搜索的接口(SPARQL终端或HTML的Web形式),可以使用Linked Data浏览器(Tabulator或Disco)搜索数据集并找到准确的URIs。需要注意的是,数据源可能使用HTTP-303重定向来重定向客户端,从定义非信息资源的URIs到定义描述非信息资源的信息资源的URIs。在这种情况下,请确保所连接到URI引用是定义非信息资源,而不是关于它的文档。

自动生成

这种方法适合于规模不大的数据集,此时,使用自动记录链接算法生成数据源之间的RDF链接是有意义的。

4.2 语义发布

其目的是提供一种方法,使得计算机能理解所发布的信息的结构,甚至是信息的含义,使信息搜索和数据集成更有效率。并将多种不同类型的数据转换为关联数据类型。

如:关系数据库,有一些开源的工具能实现关系数据库到关联数据的转换,如D2RServer,Triplify;电子表格,机构的大量信息以电子表格的形式存在,早期的recovery.gov数据都是以表格的形式发布,部分源表在最上面一行有一个表头,可以导出为逗号分隔文件、CSV;XML,首先把XML数据放到Web中,然后指出这个XML是关于什么的?是什么东西?关系又是什么?再使用一个程序转换XML文件为RDF,等等。

确定了要发布的数据后,维护发布的数据就成了是政府最关心的问题。所以为了保留数据的历史性,应使用版本可控的数据集,以便人们能引用和链接到过去或现在的版本,这些升级的或新的数据集也能索引到旧的数据集。在必要的时候还能提供工具转换旧的数据。因此,如果能在数据中嵌入数据的版本号或是标识符,那就会使得人们使用数据更加便利,顺畅。

4.3 测试及调整数据

在发布作为Linked Data的信息到web后,应该测试信息是否能准确的访问到。一个简单的测试方法就是把多个URIs一同放入Vapour链接验证服务,生成一份详细说明URIs关于HTTP不同要求的报告。另外,就是查看在不同的Linked Data浏览器中信息是否显示准确,浏览器是否能在数据范围内找到RDF链接。

4.4 语义发现

语义发现是发现服务中能够进行有意义的交互的处理过程。通常,语义发现过程依赖于语义描述。语义发现的一个基本要素就是能用额外的信息来扩大对服务的描述,如元数据。服务的提供者也许会采取各种各样的方式来描述他们的服务、访问策略等。尽管如此,很多资源的使用者也会根据他们自己的选择策略来决定他们想要使用的服务,如数据的起源、衍生的服务质量、信誉指标等。在发现服务中使用语义,使得搜索引擎能更好地“理解”特定网页的内容,更准确的搜索想要的信息,同时也可搜索到其他有用的精密信息,同时使得自动化搜索有可能得以实现,更容易集成多个Web服务[8]。

4.5 语义调解

语义调解是异构系统进行交互的构成要素,是在产生冲突的情况下使用的特定实体[8]。其主要作用是利用数据,以创造更高级别的应用程序的信息。使用本体调解技术,如合并、对齐或一体化,语义调解器能识别出数据之间隐含的相似之处。值得注意的是,调解器必须被理想的考虑为第三方,其主要目标是使不同的观点近似,避免可能给予所涉及的当事方之一特权的决定。

当知识表述在一个中立的执行方式中时,可以更容易使用知识,更容易在不同的应用系统中重用知识。使用调解器表示一个源执行的接口要求,并转换到能被目标接口使用的知识库中,并作用于数据和其处理过程,若系统要求数据的语义内容是相同的,需要数据调解器,但是表述的句法是不同的;若共享一个处理过程的语义内容时,就需要处理调解器,但是消息或消息交换模式是不同的[9]。

5 结束语

使用关联数据标准发布数据对于政府来说,提高了政府透明度,实现公民对政府的监督和问责。其中,对于政府数据的发布者来说,关联数据标准意味着能可靠地发布数据,而对于数据的使用者来说,关联数据标准则意味着他能灵活、方便地重用政府数据。政府数据有很多可以使用关联数据的领域,如统计和地理空间信息,但是大多数数据都不是关联数据格式,且数据模式难以理解和重用,对于Web规模的数据集成是封闭的。文中结合国内数据开放所存在的问题以及中文处理过程中的问题,总结出开放并发布政府数据到Web中的工作流程,即在确定所需要的数据源后,从各个部门收集数据,按照先发布后调解的原则,把语义描述好的数据发布到Web中,将各种类型的数据形式统一转换成关联数据形式存储在RDF数据库中,在测试并调整后,语义发现数据及选择需要的服务,在异构系统进行交互的时候使用本体调解技术实现数据的合并、对齐或一体化,增加数据的重用。由于当前国内政府还没有实现数据的开放,关联数据技术仍未得到充分的应用,国外的相关工具在处理中文时时常会产生异常,而国内相应的工具没有开发出来,所以这也是将来需要解决的问题,要使政府数据完全实现关联数据标准,还有很多工作要做的,很多技术需要学习。

摘要:采用Linked Data标准来发布开放的政府数据,可以提高政府数据的透明度,增强公民对政府的监督和问责。该文中结合国内没有实现政府数据开放和共享的原因,总结出适应于国内发布开放的政府数据到Web的工作流程,即在确定所需要的数据源后,从各个部门收集数据,按照先发布后调解的原则,把语义描述的数据发布到Web中,将各种类型的数据形式统一转换成关联数据形式存储在RDF数据库中,在测试并调整后,语义发现数据及选择需要的服务,在异构系统进行交互的时候使用本体调解技术实现数据的合并、对齐或一体化,增加数据的重用。关联数据技术使得政府作为一个中心平台,用来满足来自商业、学术和开发人员对数据的广泛需求,最大限度使用各种类型的数据。

关键词:关联数据,语义,公开,链接,电子政务

参考文献

[1]Christian Bizer,Tom Heath,Tim Berners-Lee.Linked Data-The Story So Far[J].International Journal on Semantic Web and InformationSystems,2009,5(3):1-22.

[2]John Sheridan,Jeni Tennison.Linking UK Government Data[M].London:LDOW Press,2010.

[3]Said Izza,Lucien Vincent,Patrick Burlat.A Unified Framework for Enterprise Integration—An Ontology-Driven Service-Oriented Ap-proach[C].Switzerland:Pre-proceedings of the First International Conference on Interoperability of Enterprise Software and Applications,2005.

[4]Bizer C,Cyganiak R,Heath T.How to publish Linked Data on the Web[M].Germany:ISWC Publishing,2008.

[5]Daniel Bennett,Adam Harvey.Publishing Open Government Data[M].Washington DC:W3C Working Group Press,2009.

开放数据库 篇5

一. 关于“责任教师教学支持服务工作调查表(教师问卷)”的数据统计(219份)

1、您是否参加了本学期市校组织的第一次教师培训会? A、参加(177占80.8%)

B、没有参加(39占17.8%)

2、您是否能通过电话、网络等方式及时联系到责任教师并与其交流?

A、可以及时联系(193占88.1%)B、可以联系但不及时(23占10.5%)C、联系不上(2占0.9%)

3、课程责任教师是否介绍了“人才培养模式改革和开放教育试点”的有关精神和要求? A、介绍明确(191占87.2%)B、介绍不明确(17占7.8%)

C、没有介绍(8占3.7%)

4、课程责任教师是否介绍了本课程教学实施方案的设计思路及实施要求? A、介绍明确(193占88.1%)

B、介绍不明确(23占10.5%)

C、没有介绍(1占0.5%)

5、课程责任教师是否与你们共同探讨教学模式改革创新的思路? A、深入探讨(118占53.9%)

B、简单交流(89占40.6%)

C、没有探讨(10占4.6%)

6、您认为本课程教学实施方案设计得如何? A、很好(96占43.8%)0.5%)

B、较好(109占49.8%)

C、一般(13占5.9%)D、不好(1占

7、课程责任教师是否指导制定教学点的课程教学进度。

A、详细指导(111占50.7%)B、简单指导(96占43.8%)C、没有指导(12占5.5%)

8、课程责任教师的指导对您开展教学是否有帮助? A、很有帮助(116占53%)

B、有所帮助(98占44.7%)

C、帮助不大(5占2.3%)

9、课程责任教师是否指导您组织网上实时教学? A、明确要求(162占74%)

B、一般要求(50占22.8%)

C、没有要求(6占2.7%)

10、课程责任教师是否参加了您组织的网上实时教学? A、参加(174占79.5%)

B、没有参加(20占9.1%)

C、非实时跟贴(17占7.8%)

11、您是否参加了课程责任教师组织的网上实时教学? A、参加(170占77.6%)

B、没有参加(20占9.1%)

C、非实时跟贴(24占11%)

12、您认为本课程的网上实时教学对学生自主学习可有帮助? A、很有帮助(78占35.6%)无帮助(1占0.5%)

B、有一定帮助(112占51.1%)C、一般(26占11.9%)

D、13、您认为课程责任教师设计的形成性考核比例及其构成是否科学,对促进学习是否有帮助? A、很好(96占43.8%)B、较好(100占45.7%)

C、一般(21占9.6%)

D、不好(0占0%)

14、您在教学过程中遇到问题,能否及时得到课程责任教师的帮助?

A、能及时得到帮助(171占78.1%)B、能及时联系但帮助不大(41占18.7%)C、不能(1占0.5%)

15、您认为本课程责任教师的业务水平如何? A、很好(139占63.5%)0%)

B、较好(73占33.3%)C、一般(5占2.3%)D、不好(0

16、您认为本课程责任教师的责任意识和服务态度如何?

A、很好(143占65.3%)

B、较好(68占31.1%)C、一般(7占3.2%)D、不好(0占0%)

17、课程责任教师是否详细介绍市电大本课程目前有哪些多种媒体教学资源? A、详细介绍(122占55.7%)B、简单介绍(86占39.3%)C、没有介绍(6占2.7%)

18、您认为本课程的网页教学资源做得如何? A、很好(83占37.9%)占0%)

B、较好(115占52.5%)C、一般(20占9.1%)

D、不好(019、您认为利用网络开展教研活动的效果如何? A、很好(82占37.4%)占0%)

B、较好(101占46.1%)

C、一般(33占15.1%)

D、不好(020、您认为本课程的网上资源对学生自主学习可有帮助?

A、很有帮助(77占35.2%)B、有一定帮助(124占56.6%)C、一般(13占5.9%)

无帮助(1占0.5%)

21、您对市校网上教学资源的意见与建议: 辅导教师对此提出如下意见或建议(依热度排序)(1)希望网上资源做到及时更新。(2)网上资源还不够,需要再增加。

(3)网上资源应大量增加如:案例教学的素材,往年试卷、单元测试、练习题等和其答案或解题思路等内容,以发挥网络效能。(4)资源的形式应多样化,如多一些动画、多媒体等各种课件,以便于使用。

(5)有的辅导教师还建议:合理布局页面、提前上挂资源、注意发挥辅导教师的作用,提出探讨学生使用资源折算成课时、探讨如何调动学生使用资源的方法等问题。

22、您对市校组织的教师培训和教研活动的意见与建议: 辅导教师对此提出如下意见或建议(依热度排序)(1)教研活动的次数应增加并定期。(2)教研活动应依托网络开展。

(3)教研活动的具体安排应与辅导教师协商。

(4)教研活动时应注重发挥辅导教师的作用,关注教研活动的效果,关注重点内容、教学中共性等问题。(5)有的辅导教师还提出:多组织较大型(也可在网上)教研活动、制定统一的课程教学进程计划、加强教学点对辅导教师的管理以起到互相监督的作用等建议。

23、您对组织课程网上实时教学的意见和建议: 辅导教师对此提出如下意见或建议(依热度排序)(1)网上实时教学时间安排应放宽(如2-3天)。(2)网上实时教学的安排应注意与教学点协商时间。

(3)网上教学活动进一步加强实时教学的同时也应加强非实时教学以充实和完善实时教学的内容。(4)网上实时教学应注意及时互动(回帖),注重教学效果,内容要多结合实例,以增加学生学习的主动性和积极性。(5)有的辅导教师还提出:网上实时教学应注意发挥辅导教师的作用、教学内容要注意重点(如结合形成性考核)、解决页面能显示学生所在的教学点、存在前面学生的发贴影响后面学生的思路的问题等。

D、二.关于“学生对辅导教师评价的问卷调查情况”的数据统计

调查专业数总计30 发放调查表数共:1560份 实收调查表数共:1471份

1、本学期本专业各课程的面授辅导课(不包括实验辅导课等)平均教学时数是(每次3学时)?

A、一般不超过3次(260 占 17.68%)B、一般3次至8次(632 占 42.96%)C、一般8次以上(533 占 36.23%)

2、辅导老师在面授过程中是否介绍开放教育的教学模式和学习模式?

A、详细介绍(866 占 58.87%)B、简单介绍(561 占 38.14%)C、没有介绍(36 占 2.45%)

3、辅导老师在面授过程中是否介绍本课程教学实施方案及教学安排?

A、详细介绍(892 占 60.64%)B、简单介绍(539 占 36.64%)C、没有介绍(30 占 2.04%)

4、辅导老师在面授过程中是否介绍形成性考核比例及其构成?

A、详细介绍(925 占 62.88%)B、简单介绍(509 占 34.6%)C、没有介绍(31 占 2.11%)

5、辅导老师在面授过程中是否布置自学的内容和要求?

A、是(834 占 56.7%)B、部分提出(569 占 38.68%)C、没有提出(58 占 3.94%)

6、你认为辅导教师的专业业务水平如何?

A、很好(634 占 43.1%)B、较好(628 占 42.69%)C、一般(197 占 13.39%)D、较差(8 占 0.54%)

7、你认为辅导教师是否具有良好的敬业精神和服务意识?

A、很好(650 占 44.19%)B、较好(598 占 40.65%)C、一般(202 占 13.73%)D、较差(12 占 0.82%)

8、辅导老师在讲课过程中是否运用多媒体进行面授辅导?

A、紧密结合(627 占 42.62%)B、部分结合(710 占 48.27%)C、未结合(128 占 8.7%)

9、辅导老师是否安排课堂讨论,进行互动学习?

A、经常安排(660 占 44.87%)B、偶尔安排(712 占 48.4%)C、从未安排(89 占 6.05%)三.关于“学生对网上教学资源使用和网上教学活动”问卷调查情况的数据统计

调查专业数总计30 发放调查表数共:1560份 实收调查表数共:1471份

1、辅导老师是否介绍中央电大在线平台的相关资源?

A、详细介绍(796 占 54.11%)B、简单介绍(607 占 41.26%)C、没有介绍(55 占 3.74%)

2、辅导老师是否介绍南京电大在线平台的相关资源?

A、详细介绍(798 占 54.25%)B、简单介绍(610 占 41.47%)C、没有介绍(55 占 3.74%)

3、你认为本专业教学资源的更新是否及时?

A、及时(717 占 48.74%)B、一般(680 占 46.23%)C、不及时(60 占 4.08%)

4、你认为本专业的网上教学资源对学习的帮助如何?

A、很好(547 占 37.19%)B、较好(588 占 39.97%)C、一般(303 占 20.6%)D、较差(21 占 1.43%)

5、本学期辅导老师是否安排网上实时教学? 如安排,平均每门课程安排几次?

A、三次(712 占 48.4%)B、两次(501 占 34.06%)C、一次(181 占 12.3%)D、从未安排(61 占 4.15%)

6、你是否积极参加各课程的网上实时教学?

A、积极参加(1105 占 75.12%)B、很少参加(325 占 22.09%)C、从未参加(29 占 1.97%)

7、你认为网上实时教学的效果如何?

A、很好(556 占 37.8%)B、较好(542 占 36.85%)C、一般(333 占 22.64%)D、较差(占 0%)

8、你是否经常浏览南京电大课程教学网页?

A、经常(969 占 65.87%)B、偶尔(464 占 31.54%)C、从不(31 占 2.11%)

9、你是否愿意通过课程BBS栏目与教师、学生进行交流?

A、愿意(1164 占 79.13%)B、无所谓(271 占 18.42%)C、不愿意(28 占 1.9%)

10、你在课程BBS栏目的提问,能否得到教师的及时回复?

A、每次都能得到(492 占 33.45%)B、经常得到(498 占 33.85%)C、偶尔得到(361 占 24.54%)D、从未得到(31 占 2.11%)E、从未主动提问(82 占 5.57%)

11、辅导老师是否会根据中央电大及南京电大的精神进行期末复习?

A、每门课程(919 占 62.47%)B、部分课程(474 占 32.22%)C、从不(51 占 3.47%)

12、期末复习的效果如何?

A、很好(563 占 38.27%)B、好(587 占 39.9%)C、一般(261 占 17.74%)D、较差(29 占 1.97%)

13、你希望课程网上教学资源再增强哪些方面的内容?(可多选)

A、学习指导(757 占 51.46%)B、考试指导(994 占 67.57%)C、实验或实践指导(547 占 37.19%)D、课外扩展知识(490 占 33.31%)E、其他(89 占 6.05%)

14、本学期本专业开设的课程中,以下课程网页制作得较好:

公共基础课程和公共专业基础课程网页都做得较好,如计算机应用基础、英语Ⅰ(1)、英语Ⅱ(1)、邓小平理论和三个代表重要思想概论、开放教育入学指南、计算机应用基础(本)、经济法概论、管理学基础等

本科课程:商法、婚姻家庭法学、公司法、西方经济学(本)、质量管理、货币银行学、人力资源管理、现代教育思想、中国现当代文学名著导读、中国古代文学专题(2)、汉语专题(2)、公共政策概论、公共部门人力资源管理、社会保障学、审计案例研究、财务报表分析、高级财务管理、科学与技术、哲学引论、小学语文教学研究、日语、商务英语写作

专科课程:电子商务概论、Internet和Intranet应用、电子商务法律与法规、经济法学、律师实务、民法学(1)、刑事诉讼法学、个人与团队管理、经济数学基础

12、公共关系学、市场营销学、贸易实务、社会调查与研究方法、办公室管理、应用写作、行政组织学、中级财务会计、电算化会计、管理会计、信息管理系统、建筑材料、建筑制图基础、旅游学概论、旅游英语(1)、汽车文化、汽车电器设备与维修A、汽车故障诊断技术A、汽车发动机构造与维修A、机械制图、土木工程CAD、电工电子技术、机械制造、摄影与摄像、面向.NET XML程序设计、Windows网络操作系统、数据库基础与应用、Dreamweaver网页设计、仓储与配送管理、物流学概论、企业物流管理、物业信息管理、药用分析化学、药剂学(1)、药理学等学生认为网页做得较好。

15、本学期本专业开设的课程中,以下课程网上实时讨论活动的效果较好 :

公共基础课程和公共专业基础课程网上实时讨论活动都做得较好,如计算机应用基础、英语Ⅰ(1)、英语Ⅱ(1)、邓小平理论和三个代表重要思想概论、开放教育入学指南、计算机应用基础(本)、经济法概论、管理学基础等

本科课程:商法、婚姻家庭法学、公司法、质量管理、国际贸易原理、西方经济学(本)、货币银行学、现代教育思想、中国现当代文学名著导读、中国古代文学专题(2)、公共政策概论、公共部门人力资源管理、审计案例研究、财务报表分析、高级财务管理、操作系统、C语言程序设计A、科学与技术、哲学引论、教育社会学、高级英语写作、商务英语、日语等认为网上实时教学活动的效果较好.专科课程:Internet和Intranet应用、企业信息管理、国际贸易理论与实务、经济法学、律师实务、婚姻家庭法学、西方经经济学、公共关系学、个人与团队管理、统计学原理A、资源与运营管理、企业文化、广告方案、广告业务、行政组织学、社会调查与研究方法、办公室管理、电算化会计、财政与税收、审计学原理、计算机专业指南、建筑材料、建筑制图基础、旅游学概论、旅游英语(1)、旅游工作者素质修养、汽车文化、汽车发动机构造与维修A、汽车音响、微积分初步、机械制造、机械制图、摄影与摄像、面向.NET XML程序设计、微机系统管理与维护、Windows网络操作系统、数据库基础与应用、仓储与配送管理、物流学概论、计算机文化基础、中国文化导论、中国文学通论(2)、实用文体写作、药剂学(1)、药物分析化学、药理学(药)等课程学生认为网上教学效果较好。

16、学生对网上教学资源的提出如下几点要求:(1)增加和充实网上资源如增加与考试有关的和联系实际的各种案例内容,提供的充分练习题和其他复习资料

(2)提供的资源要与面授挂钩,内容重点要突出,要实用。

(3)希望教学资源加快更新速度,形式要多样化,如再增加一些动画、直播课堂等。

17、对教师组织的课程网上教学活动学生提出如下建议:

对网上实时教学活动,学生主要提出如下希望:

(1)增加网上实时教学的次数,并延长讨论的时间。

智慧城市的“数据开放”运动 篇6

大数据全面覆盖智慧城市

当前智慧城市建设,从舆论引导期进入了探索试用期,这是发生了天翻地覆的变化,也就是说过去我们还在讨论智慧城市怎么做,现在就是探讨智慧城市怎么应用。

与智慧城市相关一个很重要的词就是火数据:数据无处不在,处处生产,数据来源呈多样化趋势,大数据的时代特征正在呈现!到2020年全世界将有4万个EB,一个EB相当于1.68亿光盘量,2013年全世界互联网一天产生的流量相当于2001年全世界互联网一年产生的流量;2012年和2013年两年全世界新产生的信息量相当于此前一万年产生的信息量,所以大数据开始全面覆盖。

在大数据时代,开放数据运动成为当今时代最强音。开放数据是一个具有巨大潜力的未开发资源。它有助于建设一个更加强大、更加相互关联、能够更好满足公民需求、激励创新和蓬勃发展的社会。数据即服务,开放才有用。我们还提出一个观点,大数据正在倒逼信息资源所有者开放.当前网上各种创新服务基本上与大数据相关;第二,020的服务也越来越依赖政府和社会数据开发;第三,未来地区或行业经济的竞争力越来越依赖于数据采集加工和整合能力;第四,开放一批数据,创新一批服务,形成一群产业,也就是说政府(包括地方政府和行业部门)如果不开放数据将面临巨大的压力,死守数据自有和封闭观念,未来可能被网络新势力所淘汰。只有对数据的高效处理,我们才能把城市建设智慧。

通过大数据创新政府服务,大数据衍生了服务的新内容,引发了服务的新模式,提高了服务的有效性。如我们开发的数据越多,对解决交通拥堵越有帮助,如果数据不开放,交通拥堵则会越来越严重。

智慧城市非常好,但也面临一些难点。我认为第一是智慧城市还不成熟,技术不成熟:尽管云计算、物联网、大数据说的多么好听,但还是不成熟;其次模式不成熟,建设模式、推进模式、运营模式包含政企合作模式都不成熟;再则管理运营也不成熟,政府在心理上、制度上、团队建设等方面都在探索中。第二是智慧城市的模式创新目标不清,因此解决方案就老是发生变动,项目检验就很难清晰化,各种项目的关联度也说不清。再一个是统筹协调困局,每一个文件都强调统筹协调,但做的最差的还是统筹协调,还习惯于以机构为中心。很多人还有着发散性思维,认为把物联网做好了就是智慧城市建设。最后,还有一个问题就是可持续发展机制存在缺陷,总结其原因是过度依赖政府的投入,那么政府不花钱能不能把智慧城市建没好?因此,不要把智慧城市想得那么简单,那么乐观,建设智慧城市是一个巨大的社会工程,一项运动,还有很多的风险正在显示出来。

智慧城市发展要有“智慧”

智慧城市建设需要更多的智慧。第一是心态,智慧城市是一个建设、发展、成长和应用的过程,要具有“心不急、行不缓”的心态和定力,要敢于打持久战——淡定与定力,坚持与执着。第二是要有好的策略,决策和建设要有大智慧。这就要求具有全局的视角和战略眼光,又必须选择好突破口,不必为暂时落后而焦虑,也不要为前行的风险而悲观;既要敢破,更要善立。第三是要把技术、业务与产业融合发展,构建新兴服务和创新商业模式来提高城市的能力和竞争力,通过智慧城市带动一批新兴产业的发展。第四是处理好制度与技术的关系,中国智慧城市目前面临重大的政策问题,但是要解决制度障碍,需要技术和制度双方来推进。

智慧城市要选择好对策,要根据每一个城市的特点选择好定位。每一个城市的资源、历史特点、人口结构都不一样,如何发挥智慧城市的优势,发掘潜力都是需要考虑的问题,而不是简单地模仿,不可能干城一面。

智慧城市还需要顶层设计。我们提出顶层设计的原则是面向未来、面向问题、面向对象。面向未来就是确保几十年后不落后,面向问题就是面向让市长和市委书记睡不着的问题,面向对象就是面向老百姓关心的问题,把这些问题解决,从这个角度做好顶层设计,智慧城市才能逐渐生效。

那么智慧城市要做好大系统整合,发展创新模式,实现业务高效协同,就要优化智慧城市发展的要素。在此,首先要做好智慧城市的框架整合,要优先开展城市基础设施的智能化;其次是从共享到开发及服务各环节高度重视数据。火数据目前面临着大价值、大机遇和大变革,一个城市在面对大数据时要有清晰的思路,现在就要行动,加强积累和积极开发应用。最后就是要以人为本,服务融合,使百姓能够切实受益。我们的智慧最后就是要让老百姓感知,要做一些能让老百姓可以感知的应用。此外,还要动员火家广泛参与,城市是老百姓的城市,我们要探索开放数据思路,打造政府、企业、公民多方共赢的新模式。

发展智慧城市要立足当前

推进智慧城市建设,要立足当前,着眼未来。智慧城市是新模式新目标,要坚定不移地积极推进;智慧城市建没是一项长期复杂的工程,由于当前在技术、体制、模式等方面还存在着较大的不确定性和瓶颈,因而在推进巾更应该立足当前,着眼未来,先试点,大胆创新,在探索巾前进,在总体目标和原则指引下分阶段实施,有序推进;智慧城市的目标、框架、重点任务等,也需要在实践巾,根据不同时期城市发展战略、技术演进趋势、社会民生需求等的变化不断调整与优化。

智慧城市很美好,智慧城市建设的路很艰巨。未来,需要我们火家的共同努力做好智慧城市建设!

企业数据开放平台建设思路 篇7

1 数据开放平台组成

图1显示了企业数据开放平台功能模块及上下游系统的关系。

从图1可以看到完整数据开放平台的全貌, 最顶层的是上游系统, 上游系统是数据源, 提供基础数据, 通过数据适配层的数据转换, 把数据存储到数据中心。下游系统通过数据开放平台提供的数据同步服务取得数据资源。由此可见数据适配器及数据同步模块起承上启下的作用, 是数据开放平台重点建设的功能模块。

2 数据适配器的设计思路。

由于数据由多个上游系统产生。不同的上游系统提供的硬件设施、网络环境、数据库管理系统, 业务支撑系统、业务规范等很有可能都不一样, 单一的依赖传统系统软件或工具已不能满足数据同步的需求, 迫切需要设计一种企业级的应用解决方案, 能够屏蔽复杂的数据结构和业务关系, 使不同的网元间数据简单顺畅的流动到企业数据开放平台。数据适配器主要功能就是对上游系统提供统一的数据访问接口, 对下直接与企业数据开放平台的数据库交互。

2.1 在系统支撑上数据适配器设计要求包括以下几个原则

与平台无关性:无论上游数据库管理系统处于何种环境, 都能通过调用平台开放的接口, 把数据存储到数据中心。

可扩展性:设计的适配器能满足后续业务的扩展。如:能在不改变现有接口的协议上支持数据中心表字段的增加。

可复用性:设计的适配器除了满足现有的接入的上游系统之外, 能满足后续更多接入的上游系统。

2.2 在业务及管理上数据适配器设计要求包括以下几个原则

支持数据规则的配置。系统能灵活支持不同的上游系统不同的数据过滤规则。数据适配器在接收到上游系统的数据时, 从配置规则里匹对所需要的数据, 只有复合规则的数据才进行入库保存。

支持数据的转换。上游系统通过适配器同步数据时, 对于特殊字段的值能够根据配置的转换逻辑进行个性处理, 以便兼容到上游系统的特殊业务。

支持数据的加工。上流系统同步数据时, 对于不完整的数据, 适配器能够自动根据配置的数据加工逻辑, 对数据进行自动填充处理, 使数据达到完整性。

不能随便变更数据中心的业务约束。业务数据的业务规则应以数据中心的为准。当上游系统与数据中心的业务约束有冲突时, 数据中心应该把这部分数据进行屏蔽或过滤处理。

3 数据同步的设计思路

数据中心的下游系统, 是数据消费者。下游系统通过数据开放平台的同步机制来获取数据, 因此设计可靠稳定及时的数据同步机制是数据同步建设的目标。数据同步建设的思路包括以下几点:

(1) 对于所有下游系统必须经过合法授权才能访问数据。

(2) 对于所有下游系统必须要限定访问数据的范围和访问的频率, 防止不必要的数据传输及过于频繁的请求访问, 造成数据中心服务器压力问题。

(3) 数据中心不允许下游系统反向更新数据, 数据的录入及更新都在数据中心的上游系统执行。

3.1 同步机制的选择, 以下两种是业界常用的数据同步方案

3.1.1 主动同步的方案具体来说由数据中心主动发起同步流程如下

(1) 数据中心向下游系统发通知, 告知下游系统数据有更新;

(2) 下游系统收到通知后向数据更新请求数据;

(3) 数据中心收到请求数据后, 向下游系统发送数据;

(4) 下游系统收到数据后进行入库保存。

3.1.2 被动同步方案具体来说由下游系统主动发起数据同步的请求流程如下

(1) 下游系统向数据中心发起数据更新请求;

(2) 数据中心收到请求后, 向下游系统发送数据;

(3) 下游系统收到数据后进行入库保存。

数据同步模块应该建立监控机制。监控包括性能监控、业务监控、预警等, 主要监控数据请求、数据处理、系统压力三个方面。并提供预警机制, 通过配置相关预警规则、实现业务异常的展现及处理等。

4 规范管理

4.1 制定标准接口协议规范

Web service是一个平台独立的, 低耦合的, 自包含的、基于可编程的web的应用程序, 可使用开放的XML (标准通用标记语言下的一个子集) 标准来描述、发布、发现、协调和配置这些应用程序, 用于开发分布式的互操作的应用程序。对于数据适配器及数据同步接口非常适合采Web service的形式。

4.2 制定全流程管理规范

无论是上游系统、还是下游系统从零开始到成功接入到数据开放平台必定会有涉及以下内容:

(1) 业务评估。对于上游系统, 企业数据开放平台必须充分评估上游系统的数据是否是数据中心需要的数据。对于下游系统, 企业数据开放平台应该协助下游系统, 评估数据中心的提供数据能否满足下游系统的业务要求。

(2) 同步方案的选择。原则上无论是上游还是下游系统, 均以数据开放平台的标准接口协议来实现数据的同步。不允许为了某个下游系统而改变现有的同步机制。但如果某个上游系统过于强势, 已经有成熟的数据同步解决方案时, 可以在数据适配器与此上游系统之间架设一层数据中转后台, 这个数据中转后台等于为此上游系统单独服务的, 用于平滑它的接入, 数据适配器直接对接这个数据中转后台。

(3) 接入配置。系统应该设计有接入方的管理功能, 对于上游系统能够配置数据适配置器的过滤规则、数据的转换规则、容错处理规则等。对于下游系统能够配置数据消费者需要哪些数据、数据消费者的授权码, 数据加密的密钥、消费者IP等等。

(4) 配合上下游系统的开发联调实施。对于上游系统接入, 需要验证上游系统同步过来的数据是否正确入库, 入库的数据能否正常流转到下游系统。如果开放平台还为上游系统独立开发了数据中转后台, 还需要验证上游的业务系统是否正确的把数据同步到数据中转后台。对于下游系统, 一般需要验证数据中心的数据是否正常流转到下游系统, 一般而言开发的联调工作在于下游系统, 但也需要数据开放平台配合实施。

(5) 上线前数据割接。对于上游接入的系统, 需要把上游存量数据做一次割接。上游系统割接数据之后, 数据中心会把数据复制多份给下游系统, 系统顺间暴发巨量的数据同步, 对于数据中心性能会是一个考验。因此割接宜在系统压力最轻的时间段内执行 (如晚上10点过后) 。另外在割接上游系统的数据时务必保证数据的正确性, 如果数据割接存在问题那么造成数据回滚的成本会相当大。对于下游系统, 系统上线前宜采用文件的形式做一次历史数据的全量割接, 这样对数据中心的压力是最小的。

(6) 上线后的运营管理。无论是上游系统, 还是下游系统, 在运营过程中肯定会提出很多优化建议或业务需求。对于这些建议或需求, 在不影响企业数据开放平台架构的情况下, 可以适当的进行功能整改或优化升级。对于数据中心而言, 直接面对的客户就是下游系统, 当客户提出建议时有必要满足他们的诉求。另外在运营过程中如果发现问题, 系统报障或者服务中断等突发事件, 应该要建立一个管理的规范, 其目的就是让接入的系统能按照制定的流程进行处理, 提高沟效率。

摘要:随着企业信息系统的运营及发展, 与外围平台间的数据共享越来越密切, 越来越多的企业信息系统将会开放内部核心数据资源, 提供给第三方系统接入, 便于共同开发数据资源。那么设计一个开放数据提供平台, 把自己的数据资源准确及时的推送给第三方系统尤为迫切。企业数据开放平台的管理系统主要负责系统中各类数据的维护与管理, 其中数据同步模块是企业数据开放平台的重要组成部分。

元数据注册开放论坛即将召开 篇8

由ISO/IEC JTC1/SC32主办,国家标准化管理委员会承办的JTC1 2010年会将于2010年5月19~28日在我国昆明市召开。会上,将召开ISO/IEC JTC1/SC32(数据管理与交换)全会、SC32/WG1(电子业务)、SC32/WG2(元数据)、SC32/WG3(数据库语言)、SC32/WG4(SQL/多媒体和应用包)等SC32全会和工作会议。

在SC32全会之前,中国电子技术标准化研究所将于5月1 7~1 8日承办第十三届元数据注册开放论坛(OFMR2010),论坛主题是“元数据和云计算”。目前已有来自于美、英、法、德、加拿大、澳大利亚等国家的1 00余名专家和代表注册参加开放论坛。

开放数据库 篇9

值得注意的是, 《纲要》提出三大任务:加快政府数据的开放共享, 推动资源整合, 提升治理能力;推动产业创新发展, 培育新兴业态, 助力经济转型;强化安全保障, 提高管理水平, 促进健康发展。其中, 开放政府数据和推动产业创新尤为引人注目。

《纲要》部署了三方面主要任务, 其中政府数据的开放共享被排在首位。

《纲要》提出, 要加强顶层设计和统筹协调, 大力推动政府信息系统和公共数据互联开放共享, 加快政府信息平台整合, 消除信息孤岛, 推进数据资源向社会开放, 增强政府公信力, 引导社会发展, 服务公众和企业。

《纲要》强调要大力推动政府部门数据共享, 稳步推动公共数据资源开放, 统筹规划大数据基础设施建设, 支持宏观调控科学化, 推动政府治理精准化, 推进商事服务便捷化, 促进安全保障高效化, 加快民生服务普惠化。

对此, 中国信息通信研究院技术与标准研究所副所长何宝宏认为, 由于政府所掌握和调用的数据比其他单一行业多, 因此推进政府数据的开放共享能够对全社会形成示范效应, 带动更多行业、企业开放数据、利用数据、共享数据。

何宝宏表示, 数据是信息的原始和底层形态, 因此政府数据的开放共享能够更深入地促进政府信息的公开, “相当于是政府信息开放的升级”。

阿里巴巴研究院高级专家孟晔博士指出政府数据共享和开放的差异:“政府数据的共享指的是各级政府和不同政府部门之间的信息共享, 而政府数据开放指的是将公共服务领域的数据面向社会开放利用。”

DCCI互联网研究院院长刘兴亮表示, 政府数据的内部共享能够解决政府部门之间信息沟通不畅等问题, 避免普通民众在办事时出现需要证明“你妈是你妈”的怪现象。而要实现政府数据的共享, 首先需要解决的便是政府内部的“信息孤岛”问题。

《纲要》提出, 促进大数据发展应以企业为主体, 深化大数据在各行业的创新应用。

刘兴亮认为, 《纲要》强调企业在大数据发展中的主体地位, 一方面是因为大数据的相关技术大多掌握在企业手中, 而且企业掌握着更庞大的数据库;另一方面是因为促进大数据发展能够推动产业和企业的创新发展, 提供更客观而科学的决策参考。

何宝宏认为, 《纲要》首先提出共享和开放政府数据, 这有利于政府与其他行业实现数据交叉、链接和共享, 从而给其他产业带来新的价值增长点。

孟晔认为, 大数据的发展更重要的价值在于将数据资源向中小型企业开放。“如果能让中小企业和大企业站在同一个起跑线上, 就能够更大地发挥它们的创新能力, 以后也将会形成‘大数据平台+中小企业/个人’的创新模式。”

但他也提醒, 大数据最大的效力体现在各行各业的交叉、融合中, 并且需要相互共享和开放。“不光是政府数据的共享和开放, 企业和企业之间, 行业和行业之间的数据也需要共享和开放”。

值得注意的是, 《纲要》提出要强化安全保障, 提高管理水平, 促进健康发展, 健全大数据安全保障体系, 强化安全支撑。《纲要》还明确了大数据发展的政策机制:建立国家大数据发展和应用统筹协调机制;加快法规制度建设, 积极研究数据开放、保护等方面制度;建立标准规范体系, 积极参与相关国际标准制定工作。

孟晔认为, 大数据的利用首先需要保护个人隐私和企业机密, 否则会带来很多法律问题。“只有知道大数据该怎么用以后, 才能用好大数据这个工具”。

如何在大数据发展中保护个人隐私?如何界定数据公开和共享的边界?孟晔认为这需要建立一系列完善的制度来保障, 尤其需要配套相应的管理机制和法规建设, 并尽量统一数据开放的技术标准。

全球政府开放数据运动方兴未艾 篇10

联合行动, 迅速推广

全球开放数据运动始于美国。截至2014年2月10日, 全球已有63个国家加入开放政府合作伙伴组织。

全球开放数据运动始于美国。2009年1月, 美国总统奥巴马签署了《开放透明政府备忘录》, 要求建立更加开放透明、参与合作的政府, 体现了美国政府对开放数据的重视。同年, 数据门户网站Data.gov上线, 美国行政管理和预算局向白宫提交的《开放政府令》获批准, 全球开放数据运动由此展开。

2011年9月20日, 巴西、印度尼西亚、墨西哥、挪威、菲律宾、南非、英国、美国等8个国家联合签署《开放数据声明》, 成立开放政府合作伙伴组织。截至2014年2月10日, 全球已有63个国家加入开放政府合作伙伴组织。

2013年6月, 八国集团首脑在北爱尔兰峰会上签署了《开放数据宪章》, 法国、美国、英国、德国、日本、意大利、加拿大和俄罗斯承诺, 在2013年年底前, 制定开放数据行动方案, 最迟在2015年年末按照宪章和技术附件要求来进一步向公众开放可机读的政府数据。

从目前全球参与开放数据运动的国家来看, 既包括美国、英国、法国、奥地利、西班牙等发达国家, 也包括印度、巴西、阿根廷、加纳、肯尼亚等发展中国家。国际组织欧盟、经合组织、联合国、世界银行也加入了开放数据运动中, 建立了数据开放门户网站。

主动承诺, 逐步开放数据资源

在各国承诺中, 政府都将公众的需求放在重要位置, 通过征求公众意见逐步开放有价值的数据集。

政府收集了大量有价值的数据, 通过开放数据, 可以更好地了解一国的自然资源使用情况、政府开支情况、土地交易和管理情况。正是意识到了开放数据的众多好处, 美国、英国、法国等国政府纷纷发布相应的行动计划, 主动作出开放数据的各项承诺, 逐步开放数据资源。

美国政府在2013年12月5日发布的《开放政府合作伙伴——美国第二次开放政府国家行动方案》中提出, 在成功地实施了第一次行动方案中开放数据承诺的基础上, 在第二次的行动方案中作出承诺, 要让公众能够更方便地获取有用的政府数据。通过这些承诺, 美国政府将按照战略资产来管理政府数据, 对Data.gov门户网站进行改进, 开放农业和营养方面的数据。

英国政府在2013年11月发布的《八国集团开放数据宪章2013年英国行动计划》中作出了6项承诺:一是英国将发布《八国集团开放数据宪章》中明确的高价值数据集;二是确保所有的数据集都通过国家数据门户网站data.gov.uk来进行发布;三是通过与社会、机构、公众沟通来明确应该优先公布哪些数据集;四是将通过分享经验和工具来支持国内外开放数据创新者;五是将为英国的开放数据工作设定一个清晰的前进方向, 所有政府部门将在2014年6月前更新其部门的开放数据战略;六是英国政府将为政府数据建立一个国家级的信息基础设施。

法国政府在2013年11月6日发布《八国集团开放数据宪章法国行动计划》, 作出4项承诺:一是朝着默认公开发布数据的目标前进, 支持高价值数据集的发布;二是建立一个开放平台以鼓励创新和提高透明度;三是通过征求公众和社会意见完善开放数据政策;四是支持法国和全球的开放式创新。

在各国承诺中, 政府都将公众的需求放在重要位置, 通过征求公众意见逐步开放有价值的数据集。

计算机:数据开放提供发展良机 篇11

1、政府数据市场进入高速增长期。

2、数据开放提供发展良机。

2015年9月5日,中国政府网发布《促进大数据发展行动纲要》。市场进入高速增长期,政府数据发展空间大:2014年我国大数据营收规模75.1亿元,环比增长34.7%。预计未来5年,市场营收规模增速将平均保持在36%以上,2018年达到258.6亿元。

从去年大数据市场各个行业投资结构来看,政府行业占比为12.7%,相较于占比15%以上的金融和通信行业,其未来仍存在较大的投资空间。而大数据在政府公共事业的应用同时存在契合度和应用可能性较高,但是成熟度较低的特点,具有很好的发展前景。认为未来5年会是政府数据平台建设、整合更新的持续发展阶段,庞大的工程体量将为各类供应商提供巨大商机。

经济进入新常态,生产力创新成关键:从2010年第一季度起,我国的GDP增速从12.3%一直回落到2015年第一季度的7%,增长放缓持续了20个季度。当前的中国经济增长已经不仅仅是扩大需求、加大要素投入和政府干预的问题,提高生产力、实现技术创新已成为聚焦的重中之重。

开放的变电站综合数据平台 篇12

目前,90%以上的变电站都实现了综合自动化,综合自动化系统的数据来源于保护测控装置。保护测控装置采集的开关场信息一方面供自身装置使用,另一方面通过计算机网络上传至计算机监控系统。

但目前变电站综合自动化系统缺乏一个统一的综合数据平台,数据源配置的复杂性、多重性、非开放性不仅限制了变电站功能的有效扩充,而且增加了变电站的投资,不利于节约高效型社会的建设。

1 变电站综合自动化数据系统现状

变电站综合自动化系统已经建立起完善的数据网络,并拥有完整的数据库,采用了“站控层+间隔层”的集中分布式体系结构,间隔层的二次设备采集开关场的信息,通过网络上传至计算机监控系统,计算机监控系统再通过站际网络与调度中心通信,各级控制命令则按相反方向下发到计算机监控系统,直至间隔层设备,由间隔层设备对开关场的一次设备进行控制,参见图1。

这种结构模式充分发挥了计算机以太网的高速度、高可靠、高自动性等优势,但仍存在一些不足。

不足之一是数据平台缺乏统一性,间隔层的保护测控装置与一次设备采用电缆连接,任何二次设备都要与一次设备建立独立的信息通道,数据采集各自为阵,相互之间不进行横向数据交流。电压、电流互感器要设置多个绕组,开关设备要设置数十个辅助接点,以满足各种二次设备的需要。以电流互感器的配置为例,最早的互感器只需要配置1个保护绕组、1个测(计)量绕组,随着对系统要求的提高,逐渐扩展到5个、7个、9个绕组。例如,继电保护,从起初简单的过流保护、单套配置,逐渐发展到现在复杂的反向比率保护、各侧差动保护,并且一些保护需双套(多套)配置,往往还需要备用一两个绕组,以防后续功能增加。电力系统的功能在不断地扩展与完善,若继续采用此类增加绕组的方法,将难以满足系统的发展,其成本也将越来越高。

不足之二在于数据平台缺乏开放性,二次设备采集数据之后,不能很好地提供给其他二次设备使用,数据无法充分共享。

数据共享不充分的原因首先是网络硬件的问题,目前的交换机和网络通信口在流量和可靠性上还存在技术瓶颈。其次是当前的通信规约缺乏开放性。通信规约是构建网络的纽带,目前变电站自动化系统广泛采用了IEC 60870系列规约。在此系列的规约里面,通信和功能应用是一体的,功能应用直接被编译在通信报文里面,这使得功能应用牵制于具体的网络类型和通信协议,功能的扩展与改变必须牵涉具体报文的调整。此外,对于相同的应用,不同厂商有不用的定义,即使都按照IEC 60870构造的数据模型,不同厂商的模型之间也是无法通用的。这两个因素使得IEC 60870规约缺乏开放性,给变电站的配置带来许多问题。

(1) IEC 60870需要“对点”。“对点”是监控系统中对数据配置和数据维护的俗称。目前,变电站内部采用IEC60870-5-103规约(以下简称103),调度端采用IEC60870-5-104规约(以下简称104),按照103和104打包的报文,其本身只是在通信层面上对帧格式、传输控制、校验等进行了规范,变电站自身的信息模型在报文里只是一个个没有明显含义的数据。对于任何一个数据或一个数据包,需要发送端和接收端事先约定,并一一对应,在工程验收时必须使每一个信息点动作一次,以验证其正确性[10]。一旦有任何微小的调整,比如间隔扩充或改造,从站内监控系统到调度端的每一个数据点都必须作相应的增补和修改,重新约定,对于系统维护而言,是一项永无终结的劳动,而且增加了工程投资。

(2) IEC 60870难以“互操作”。因为IEC 60870报文需要事先约定,不同厂商可以有不同的约定方式,造成不同厂商的设备无法相互操作。当前,为了实现多个厂商设备之间的通信,监控系统需要配置昂贵的规约转换器,然而规约转换器只能对特定的规约进行转换,并且影响了传输速度和信息可靠性。

因此,建立一个统一的、开放的数据平台是十分必要的。

那么,可否利用IEC 60870标准建立数据平台?由于各厂家IEC 60870版本不统一,能不能把各厂商之间的版本严格统一起来,以实现数据平台的统一性、开放性?答案是否定的。IEC 60870的关键问题在于其本身将通信和应用绑定在一起,即使严格统一规约版本,随着电力系统的发展、功能的扩充,仍需要不断更新规约版本,这将是一项永无止境的工作,不适应电力工业的高速发展。

为了适应变电站通信网络和系统的发展,IEC TC 57工作组制定了IEC 61850系列标准[1],该标准具备以下特点:分层的智能电子设备和变电站自动化系统;根据电力系统生产过程的特点,制定了满足实时信息和其他信息传输要求的服务模型;采用抽象通信服务接口、特定通信服务映射以适应网络技术迅猛发展的要求;采用对象建模及面向设备建模和自我描述以适应应用功能的需要和发展,满足应用开放互操作性要求;快速传输变化值;采用配置语言,配备配置工具,在信息源定义数据和数据属性;定义和传输元数据,扩充数据和设备管理功能;传输采样值等。

IEC 61850标准的制定,为搭建一个开放的变电站数据平台带来了曙光。

2 开放数据平台要素之一——标准建模

标准建模是IEC 61850系列标准的核心。IEC 61850对变电站内所有设备按照功能建模,包括过流保护、分合断路器、绝缘监视等涵盖继电保护、自动控制、在线监测在内的所有功能都按照面向对象和面向设备的原则进行建模。模型的标准化非常重要,只有标准的模型才能被相互解释和互操作。在IEC61850-1中明确提出了对数据建模进行标准化的必要性[1]。

IEC 61850-7-2定义了服务器模型(Server),服务器由逻辑设备(Logical Device)构成,逻辑设备也在IEC 61850-7-2中定义,逻辑设备由逻辑节点(Logical Node)构成。逻辑节点是功能的最基本单位,逻辑节点中的数据对逻辑节点本身进行自描述[2],比如继电保护类逻辑节点就包含该逻辑节点的名称、位置、定值、可操作性等属性的自描述。IEC 61850-7-4定义了88个兼容逻辑节点[4],如断路器(XCBR)、差动保护(PDIF)。差动保护又分为线路差动PLDF、不完全接地PNDF、变压器差动PRDF、母线差动PBDF、电动机差动PMDF、比相差动PPDF。图2显示了服务器、逻辑设备、逻辑节点的隶属关系。

这是一个非常清晰的树状结构,对任何数据的访问不再需要像IEC 60870那样事先约定、逐个“对点”,而是按照“服务器→逻辑设备→逻辑节点→数据→数据属性”的顺序逐级分解,顺藤摸瓜,结构清晰、路径简洁。图1的左侧是对变电站模型访问所采取的服务、通过Get Server Directory收集每个数据对象中有多少逻辑设备和文件名,通过Get LD Directory收集每个逻辑设备中有多少个逻辑节点名,通过Get LN Directory收集每个逻辑节点中有多少个数据对象名,通过Get Data Diretory收集每个数据对象中有多少个数据对象属性名,通过Get Data Definition服务分别读取全部或一个数据对象属性定义。通过这样的服务,建立起完整的分层数据库模型[9]。

虽然IEC 61850中只定义了88个兼容逻辑节点,但用户完全可根据需要扩充并定义新的逻辑节点,不过扩充必须按照IEC 61850中规定的逻辑节点类的基本语义和句法进行标准化建模。由此可见,IEC 61850是一个可以不断改进、扩充、完善的标准,这也是IEC 61850的生命力所在。

上述分层数据库模型对各个制造厂的设备用同一种方法进行访问,这种功能方法可用于重构配置,很容易获得新加入的设备名称[9],为变电站的改造、扩充提供了很大的方便,可以从根本上解决“对点”的问题,大大减少了系统维护的工作量。

3 开放数据平台要素之二——通信、应用相互独立

除了标准建模之外,IEC 61850还支持通信和应用相互独立。

电力系统的运行是一个复杂的生产过程,各类不同的子系统、子功能对网络实时性、带宽、可靠性的要求各不相同,并且这种不同总是在不断变化着。IEC 61850根据电力系统生产的特点,总结出电力系统所必需的信息模型和传输服务,定义了抽象通信服务接口ACSI (Abstract Communication Service Interface),它独立于具体的应用层协议,和具体采用的网络类型无关,当需要与具体的网络接口时,只需采用特定的通信服务映射[11]。

首先是“抽象”,ACSI仅建模真实设备和真实功能,同时只对设备间信息交换作概念性的定义,并不定义信息传输时的具体报文编码[2][12]。图1中的ACSI服务,如Get Server Directory,只表明了“获取服务器目录”这一概念,在具体应用过程中该怎么获取,还需根据具体使用的网络类型作特定的映射。

其次是“特定”,模型之间需要交换信息,以获取各自需要的数据,这就需要将“抽象”的通信服务和“具体”的网络相接口。为此,IEC 61850制定了特定的通信服务映射SCSM(Specific Communication Service Mapping)。所谓“特定”,即是将IEC 61850中的模型利用“具体”的“特定”类型网络和“特定”的网络协议进行通信。

目前的IEC 61850版本推荐的主体应用层协议是制造报文规范(Manufacturing Message Specification,MMS)[6,7]。MMS是ISO/IEC 9506标准所定义的用于工业控制系统的应用层通信协议,通过这一“特定”映射,MMS即作为IEC 61850应用层的协议。

表1中列举了典型的IEC 61850对象到MMS对象的映射。

与之对应,各种信息交换服务也随之映射到MMS服务。表2中列举了部分典型的ACSI服务到MMS服务的映射。各种ACSI服务都通过SCSM映射到具体的服务规范和协议规范,在IEC 61850-8-1定义详细的ACSI对MMS及ISO/IEC8802-3的映射办法,通过这一映射,ACSI中各种服务都通过具体的通信协议得到实现。

特定通信服务映射为IEC 61850带来了足够的开放性,若ACSI需要其他的网络类型,只要改变具体的SCSM即可。假如IEC 61850需用另一种协议替换目前的MMS,只要定义ACSI到该协议的SCSM即可,并不需改变IEC 61850已经定义好的各种数据模型。同理,IEC 61850若要对模型进行扩充、升级,也不需要改变已采用的通信协议,提高了网络的适应能力,实现了网络的开放。

4 开放的变电站综合数据平台

IEC 61850通过标准建模,支持应用与通信相互独立,实现了变电站自动化系统的高度开放性,为变电站的扩充、改造以及电力系统的数据维护提供了可靠的基础。

开放的变电站综合数据平台具备以下优点。

(1)可扩充性强。如图2所示,IEC 61850标准数据模型是扩充性及其良好的树状结构,同一节点上的数据体是并联关系,横向模型之间不相互牵连,理论上可随意扩充。

(2)免维护。IEC 61850在开放的数据结构上还具备完善的自描述性,标准数据模型是能被IEC 61850系统中的任意一个设备识别的模型,不需要对点,不需要人工维护。

(3)增加电力系统的综合效益。综合数据平台的搭建,变电站只需要一个数据源,数据的设备只需从数据平台上获取,互感器只需满足数据平台的需求即可,变电站功能的扩展不再受到互感器、开关配置的限制,既增加了系统的可靠性,又增加了系统的经济性,综合效益大大提高。

(4)为数字电网、智能电网的建设提供了基础保障。变电站是构成电力系统的基本要素之一,数量多,变电站综合数据平台将是电力系统基本的数据来源,变电站内数据平台的标准性、开放性无疑是电力系统数据标准性、开放性的保障。而且,IEC 61850在制定过程中已考虑到了这一点,IEC TC57工作组在建立无缝通信系统体系过程中,强调了整个通信体系以IEC 61850为基础,变电站内、变电站到调度中心的接口都使用IEC 61850,IEC 61970 (EMS应用程序接口)在制定过程中都需和IEC 61850的数据模型协调[8,9],保证从SCADA数据库到过程对象的统一建模,实现全系统的开放性。

5 结语

本文分析了IEC 61850对于建设开放的变电站综合数据平台的重要意义,但IEC 61850是一个新兴的国际标准,与中国电力市场的接口还处于起步阶段,虽然国内国际许多著名厂商已经推出了基于IEC 61850的变电站自动化系统(例如国电南瑞科技股份有限公司的NS3000系统、南京新宁光电自动化有限公司的X7000系统、南京南瑞继保电气有限公司的PCS9700系统),国调中心主持的互操作性实验也顺利进行[13],但IEC 61850本身各种模型的细化及细化后的统一还在进一步磨合中。就最核心的应用层协议MMS来说,IEC61850对MMS的SCSM还存在一定的矛盾[14],还需要寻找更多的解决办法。

总之,IEC 61850在构造思路上具备了充分的开放性,为变电站自动化系统的构建提供了一条新颖的变革思路,为电力系统提供了新的发展方向。在IEC 61850的普及过程中,我们应充分重视标准化建设的重要性,充分发挥国际标准的生产潜力。

摘要:20世纪90年代,电力系统领域掀起了微机化革命,变电站建立了变电站综合自动化系统,系统广泛采用了IEC 60870系列规约,但此规约缺乏充分的开放性,使得目前的变电站综合自动化系统综合效益差、维护麻烦,不利于电力系统的高效运行。21世纪初,IEC 61850系列标准进入市场,该标准在标准性、开放性等方面进行了革命性的改进,为建立一个开放的变电站综合数据平台提供了新思路,也为运行开放的电力系统的建设提供了可能。文章深入剖析IEC 60870和IEC 61850的体系结构,分析了建立开放的变电站综合数据平台的方法,总结了开放的变电站综合数据平台对电力系统的综合效益,最后归纳出建立该平台与推行IEC 61850必须注意的问题。

上一篇:三步棋下一篇:企业社会责任倡议书