计算系统[关键词

2024-09-26

计算系统[关键词(精选12篇)

计算系统[关键词 篇1

根据计算机威胁的来源, 笔者将其分为内部威胁和外部威胁两种, 美国曾在2002年对计算机威胁的组成部分进行了分析, 最后发现, 绝大部分的威胁都来自于内部威胁, 很小的部分来自于黑客的恶意攻击。因此, 做好内部关键技术的防范工作, 是防范恶意攻击的关键。

1 计算机安全监控系统的监测对象

计算机为了应对威胁, 需要对系统运行的环节进行监控, 监控的范围主要包括两个方面, 首先是要对经由系统的文件进行扫描, 对于内部含有病毒等其他恶意攻击信息的文件, 及时的发出预警信号, 最终由系统管理员对文件下达阻挡或者删除的指令。其次是对员工的操作进行监控, 监控的内容主要包括操作人员是否采用某种手段对专利、企业内部资料进行复制传播, 并对其操作的流程进行记录, 除此之外, 它能够直接阻挡一些违规的操作。

信息处理效率的加快, 是网络化时代一个显著的特点, 文件作为信息传播的主要形式, 其安全性是监控系统维护计算机安全的主要途径。特别是在一些对信息保密性要求极高的领域, 例如军事、银行等, 就需要全面对文件操作的每一个细节问题进行监控, 无论是文件的新建、文件的修改还是文件的删除都需要对其进行记录, 针对关键文件的复制、修改以及删除指令应提前取得上级的权限, 非法操作应该被阻止。

文本的监控也是计算机监控系统需要重视的环节, 文本是文件中较大的一个分支, 它除了来自于文件之外, 网络也是其传播的重要手段, 是外部威胁用于用户计算机的途径, 针对文本的监控与文件大致相似, 另外, 监控系统应对文本中的文字、数字信息有所了解, 军事、政事等敏感的信息应及时的摘取出来进行剔除。

对于文本、文件的监控相对比较容易, 但是对于人为操作的就显得无力, 局限于人为操作的不确定性, 监控系统的工作目标就难以在编程上有所体现, 只能将监控的目标转向于硬件系统之上, 通过对鼠标以及按键的记录, 将鼠标的点击以及键盘的输入进行组合, 从而分析出员工在对系统进行何种的操作。

2 计算机安全监控的关键技术

2.1 基于文件变更监控的关键技术

2.1.1 Windows API

Windows API是计算机应用程序的重要接口, 它可以为编程人员提供函数应用的数据库, 并且利用数据库中的某些函数可以对外设进行控制。RDCW函数可以向监控系统提供两种监控方式, 一种是同步监控, 另一种是异步监控, 就拿异步监控为例, 它采用的函数主要是回调函数, 回调函数注重的是循环系统的使用, 某一个事件在监控完成之后, 程序并不会就此停止, 当监控还需要继续进行的时候, 系统就会进入到下一个轮回。

2.1.2 API Hook

API Hook是基于拦截模式的系统, 在Windows中也被称为接口的挂接技术, 工作原理是通过对应用程序的监控, 找到需要调动的代码, 然后将代码转移到系统管理者想要嫁接的程序之上, 从而实现对某些文件的阻隔。当系统管理员需要打开某些文件时, 它会提前调动空间中的函数, 然后将参数调用到API函数之中, 之后DLL会自动向系统下达指令, 使操作进入到内核处理的状态。拦截系统的工作原理较为简单, 只需要将代码输入到DLL中, 就可以实现对恶意数据的拦截。

2.1.3 中间层驱动

计算机的驱动程序是文件需要经过的区域, 驱动的主要功能是对计算机正在应用的程序进行交换, 以达到缓冲的目的, 当系统管理员想要调取程序中的某个文件时, 就需要提前将调动代码下达到驱动之中, 如果在驱动之中加入一个中间层文件的监控程序, 就可以实现对某些异常数据的拦截。

Windows API技术构成较为简单, 监控和执行的效率也很不错, 但是没有扩展的能力, 在这个更新速度较快的年代里, 对外在的威胁没有很好的适应能力;拦截系统在覆盖率、执行效率以及扩展程度上都有着不错的效果, 比较明显的缺点是实现起来比较困难;最后, 中间层驱动最明显的优势在于其监控的覆盖范围非常广, 只是由于系统的构成较为复杂, 实现起来有一定的难度, 并且执行的效率相较于上述两种方式而言比较一般。

2.2 基于文本复制监控的关键技术

文本复制的监控是基于剪贴板的来进行设计的, 采用相关的手段掌握剪贴板信息变化的规律, 从而达到文本监控的目的。通过在剪贴板上安装监控器, 并将监控器组建成链条的模式, 当系统管理员在对文本进行复制时, 剪贴板变动的信息就会通过之前设置好的链接转向信息监控的终端, 不过对监控的链条的添加会破坏原有链条的完整性, 因此当剪贴板无明显的变动没有异常时就需要对监控器进行注销, 以便保证链条的完整程度[3]。

2.3 基于人为操作监控的关键技术

键盘和鼠标的监控是实现对人为操作监控的主要方式, 这里所说的并非是对外部的监控, 而是通过相关函数的建立组建一套监控链条, 对信息传输的途径进行监视, 如果信息不存在安全方面的威胁, 就会传送到下一个连接之中。其中采用了挂钩函数, 起初通过函数注册表对Hook进行安装, 并且将回调函数融入到监控程序之中, 事件产生之后会自动顺着之前设定好的程序逐步下移, 当数据处理不存在威胁时, 这一阶段的流程便宣告结束, 下一事件也可以继续开始。无论是键盘还是鼠标都采用了Windows Hook的相关技术, 很好的实现了对人为操作的监控效果。

3 结束语

综上所述, 笔者认为计算机安全监控技术主要集中在文本的变更、复制以及人为操作三个方面, 并对其中较为关键的技术进行了介绍和比较。目的是希望通过相关技术的开发, 能够促进安全监控系统目标的实现。

参考文献

[1]李学志.计算机安全监控系统技术探讨[J].信息安全, 2011 (07) .

[2]于洋.计算机安全监控系统关键技术的研究[J].计算机工程, 2012 (14) .

[3]王小穗.计算机监控系统的应用与发展[J].信息化工程, 2011 (05) .

计算系统[关键词 篇2

摘要:云计算是一种基于互联网的应用模式,能够让计算服务像水、电等公共服务一样,随需取用、按量付费,被视为信息产业的第三次革命,它将是未来社会信息化的主要形式,也是未来国家信息战略安全的主要载体。

舜网讯 浪潮集团正式发布“云海In-Cloud”战略,开始全面推进云计算业务。作为云海战略的重点,浪潮首次定义“行业云”概念,并宣布将于年内推出国内首个自主开发的云计算操作系统,我国在云计算这一战略新兴领域的关键技术空白将因此被填补。

浪潮云计算市场战略布局初步形成

云计算是一种基于互联网的应用模式,能够让计算服务像水、电等公共服务一样,随需取用、按量付费,被视为信息产业的第三次革命,它将是未来社会信息化的主要形式,也是未来国家信息战略安全的主要载体。“云海”战略的正式实施,标志着作为国内IT产业的骨干企业的浪潮集团对中国云计算市场的战略布局已经形成。

作为云海战略的重点,浪潮首次定义“行业云”概念,提出“行业云”作为“公有云”的重要组成部分,是未来中国云计算市场的重要力量,并与山东计算中心签署云计算合作协议,建立国内最大的区域行业云和未来云计算研究中心,作为浪潮云海战略实施的第一个落地的“行业云”项目。

据浪潮集团高级副总裁王恩东介绍,目前,行业用户已经占据了中国信息化市场50℅以上的市场份额,从行业组织的分散性,数据的封闭性等方面看,云计算无疑是实现行业数据和资源共享,推动数据向服务转化的最佳途径。因此,行业云是公有云最具潜力和战略意义的市场,是中国云计算未来的主导力量。而浪潮与山东计算中心签约后将共同完成山东全省13个软件园的资源整合、共享、协同,着力研究开发下一代云计算前沿技术,并逐步丰富云计算的服务。

与此同时,浪潮宣布推出国内首款云操作系统——云海(云OS),填补了我国在云计算基础架构领域里的关键技术空白,成为普遍关注的焦点。

云计算操作系统是云计算的关键平台技术,类似于人体的神经系统,在云计算应用中承担着对大型数据中心、跨数据中心硬件资源的统筹调度、管理的枢纽作用,对云计算的安全和效率有着至关重要的影响。但是,在操作系统领域存在着诸多技术难题,譬如在高并发条件下如何实现服务的持续可用,以及万量级资源管理等,目前尚无国产厂商涉足该领域。业内观察人士认为,“云海”操作系统推出后,浪潮将成为中国首家掌握该技术的厂商,大大缩短了中国与发达国家在该领域的距离,对未来中国云发展具有重要意义。

扫清云计算在中国发展的障碍

我国关于云计算的讨论已经持续了近三年,但由于各个厂商存在着不同的利益点,提出的观点也各不相同,使得客户对云计算的理解陷入误区——只看局部,无视整体;只看细节,忽视架构;只谈概念,忽视落地应用;只照搬国外经验,忽视中国具体国情,给云计算在中国的发展带来了很多障碍。

科技部高新司嵇智源处长说,与欧美、日本等发达国家相比,我国云计算技术起步较晚,呈现出头重脚轻的趋势,一方面众多企业纷纷推出种类繁多的云计算运用,另一方面,由于国外企业对核心技术的垄断,很少有国内企业进行创新芯片以及硬件方面适合云计算的研究和开发。长此以往,我国云计算将一直是空中楼阁,发展前景不容乐观。

王恩东在接受科技日报记者采访时表示,核心技术的缺失将是制约中国云计算整体发展的壁垒。尤其在云计算基础架构核心技术层面,一直以来鲜有国内厂商涉水,大多数都着眼于平台运营与软件服务。事实上,该领域的缺失已经不仅成为制约我国云计算事业发展的最大障碍,更为我国的信息安全埋下了隐患。打造云计算硬件核心装备和云操作系统,是解决云计算基础架构核心技术问题的关键。

工信部电子信息司副司长刁石京表示,云计算的根本在于应用与服务,中国拥有世界上最大的无线网和最大的有线电视网,同时拥有最大的互联网用户人群,为中国云计算发展提供了肥沃的土壤。中国本土IT企业完全有条件在这样的契机下,实现整体突破,成为中国云时代的领跑者。

嵇智源处长说:“浪潮集团在国内率先推出了云计算战略,针对云计算基础架构展开一系列的高效的开发和推广工作,特别是很快就要面世的自主云操作系统将填补我国在这一领域的技术空白。凭借着对自主创新的坚持,我们将在随之而来的云计算时代中,不再受制于国外的技术封锁和垄断,真正将信息领域的相关产业做大做强。”

计算系统[关键词 篇3

关键词:分布式供能系统 冷热负荷 问题 方法

中图分类号:TK01文献标识码:A文章编号:1674-098X(2014)09(a)-0086-02

冷、热负荷计算的准确性是建设天然气分布式供能系统的基础,是分布式供能系统投产后能否安全经济运行的生命线,但从目前大多数分布式供能系统设计方案来看,冷、熱负荷的计算结果往往偏大或偏离运行规律,结果造成分布式供能系统投资偏大、设备闲置较高,经济效益不容乐观。该文旨在通过分析分布式供能系统设计方案中冷热负荷计算的常见问题,并给出相关解决方法,以期为提高分布式供能系统冷热负荷计算的准确性提供一定参考。由于分布式供能系统冷、热负荷计算常见问题集中在区域性公共建筑领域,故该文所阐述的冷热负荷均指该领域设计冷、热负荷的计算。

1 关键问题

1.1 沿用已有设计标准和规范无法满足实际需要

《公共建筑节能设计标准》(GB50189-2005)、《民用建筑供暖通风与空气调节设计规范》(GB50736-2012)以及《实用供热空调设计手册》(第二版)等设计标准、规范、手册是公共建筑冷热负荷计算时最常采用的依据,因此,设计者往往根据这些标准、规范、手册选取单位面积负荷来计算公共建筑冷热负荷。然而,随着国家节能力度的加大、公共建筑围护结构、保温材料等技术的发展以及用户节能意识的提高,原有的单位面积负荷呈现逐渐下降的趋势。如果设计者仍沿用标准的单位面积负荷来计算公共建筑冷热负荷,其结果是设计负荷远超实际运行负荷,这是分布式供能系统冷热负荷计算中存在的核心问题。

1.2 采用的计算方法无法满足实际运行规律的需要

在众多向区域公共建筑供能的分布式供能系统设计方案中,设计者往往以计算的简便为目标,甚至未理解区域公共建筑冷、热负荷计算原则和方法,只是简单地将所有具有相同功能的建筑面积相加后,通过单位面积负荷计算出最大、最小设计冷热负荷,取一个同时系数,得到相同功能公共建筑的设计冷热负荷,然后用相同的方法计算出其它相同功能公共建筑的设计冷热负荷,再将这些已计算出的设计冷热负荷相加后得到一个区域冷热负荷。应该说,这种计算方法在项目论证阶段用来匡算区域最大冷热负荷时尚可适用,但不适用于计算区域平均冷热负荷或全年冷热负荷以及项目可研、初步设计阶段,主要原因是,该计算方法忽视了不同功能建筑运行时间区间、负荷特性等要素,其计算结果往往严重偏离区域负荷实际运行规律,易造成项目决策失误,这是分布式供能系统冷热负荷计算中最主要的问题。

1.3 采取保守测算的导向往往导致设计值偏大

分布式供能系统冷热负荷计算中,较多的设计者为提高计算结果的有效性,防止计算的冷热负荷偏小,造成设计方案不可用。为了使项目通过审查,通过层层加码的方式提高设计冷热负荷,最终造成设计冷热负荷严重超出实际负荷。其中,最为典型的问题是提高负荷同时系数、扩大建筑供能面积、虚化建筑内外区冷热负荷、建筑功能错位、同一功能建筑不同功能区负荷(如地下室负荷与地面建筑负荷相同)等同对待、提高人员密度取值、提高房间使用率等,导致分布式供能系统冷热负荷计算中的设计值往往偏大。

1.4 负荷测算分析过程中容易忽视全年延时负荷曲线

在分布式供能系统冷热负荷计算与分析过程中,应产生区域典型日冷热负荷、区域全年冷热负荷,全年延时负荷等曲线,其中,全年延时负荷直观地反映了区域冷热负荷的大小、特性、分布式供能系统较为客观的年利用小时数以及设计冷热负荷的科学性,是设计分布式供能系统最有效的依据。在冷热负荷计算过程中,设计者往往十分重视区域典型日冷热负荷曲线、区域全年负荷曲线,却忽视了全年延时负荷曲线,造成分布式供能系统设计方案或运行策略设计存在较大偏差。

1.5 系统设计中对负荷模拟简化处理

完整、科学的负荷模拟是优化分布式供能系统设计最为关键的因素,而对于一个以区域公共建筑为主要供能对象的分布式供能系统设计方案而言,最易被简化处理的问题恰恰是负荷模拟。在众多分布式供能系统设计方案中,有不少负荷模拟只是简单地将建筑面积相加后,再利用单位面积空调负荷与建筑面积的乘积,对应气候特征曲线提取出负荷模拟图,忽视了建筑各功能区比例、不同功能建筑工作时段与人员密度、建筑围护结构、保温材料、窗墙比以及区域建筑开发阶段等重要参数,使得分布式供能系统冷热负荷严重偏离其实际变化规律,不能客观反映区域冷热负荷大小和特性,也就根本无从谈起分布式供能系统的优化设计。

2 解决方法

2.1 正确理解冷热负荷计算的重要意义

冷热负荷计算是设计分布式供能系统的基础,将直接影响分布式供能系统设备选型、运行策略、控制方案以及技术经济分析等项目决策问题,因此,冷热负荷在分布式供能系统的设计工作中具有非常重要的地位。

在区域性公共建筑领域,分布式供能系统冷热负荷计算过程也是设备选型及其组合的优化过程,例如,可将多种设计和运行方案根据设备的供应能力加以优化和组合,使分布式供能系统达到不同热力循环联合、不同用能系统整合以及中低温热能的梯级利用,从而实现系统能源利用效率和经济效益最大化的目的。因此,冷热负荷计算也是优化设计分布式供能系统的重要途径。

2.2 掌握科学的冷热负荷计算方法

对于单幢建筑,冷热负荷的计算有当量温差法、谐波分解法、反应系数法、Z传递函数法、辐射时间序列法等多种方法,各种方法均有其优缺点,负荷计算时可因地制宜、因物而异选取相关方法,本文不再赘述单幢建筑的冷热负荷计算方法。

而在以区域公共建筑为供能对象的分布式供能系统冷热负荷计算过程中,由于建筑功能不同,其负荷特性曲线将有很大差异性,即使是具有相同功能的建筑,由于建筑功能分区、工作时段、人员密度,其负荷特性曲线也有一定的差异。因此,笔者认为在区域建筑型分布式供能系统负荷计算中,应在详细了解单幢建筑开发商的需求后(有条件时,亦可根据项目建议书或初步设计文件),单独计算单幢建筑与整点时间相对应的冷热负荷,在此基础上,再将计算得到的区域内单幢建筑冷热负荷按照时间序列对应相加,即可得到区域公共建筑冷热负荷。由于这种计算方法考虑了所有建筑冷热负荷大小和特性,因此,通过该方法计算得到的区域公共建筑冷热负荷最为接近实际运行情况。

2.3 善于利用负荷模拟工具软件

近年来,随着计算机和建筑节能技术的发展,涌现出了较多的空调负荷预测软件,如DOE2.1、Energy-Plus、eQuest、DeST、TRNSYS、ECOTECT、华电源等,这些软件都能够对建筑进行全年负荷动态模拟,并生成相关负荷特性曲线,有助于分布式供能系统的最优设计和运行管理,但每个软件都有其适用范围,由于目前空调负荷预测软件的对比应用案例较多,本文不再详细叙述,实际应用时,应从自身的需求出发,选择相应的软件进行负荷模拟,在提高冷热负荷预测准确性的同时,客观计算出分布式供能系统年运行小时数,并结合负荷特性曲线提出更切合实际的运行策略。

3 结语

当前天然气分布式供能系统设计过程中,其冷热负荷计算仍存在因循守旧、计算方法错误、忽视负荷特性曲线等问题,造成分布式供能系统运行效率低下,节能及经济效益较差。应提高对冷热负荷计算重要性的认识,掌握正确的冷热负荷计算方法,并通过选用相关负荷模拟工具软件进行负荷模拟,提高冷热负荷预测准确性。

计算系统[关键词 篇4

全国计算机等级考试十几年来保持快速、健康的发展,得到社会的普遍认可,单考点数千人的考生规模已经非常普遍,要保证考试组织工作顺利进行,考点工作人员也就面临着更大的压力和挑战。

在等级考试的各个环节中,考场管理基于较为成熟的高校环境,利用现有资源和流程即可,但报名和收费的灵活性就比较大:可以集体报名也可以个人报名;可以填写报名表也可以当面交费;可以与学校教务系统集成也可以自成一体;既有学生也有社会考生,等等。如果组织得好,既可减轻考点工作人员的负担,也可建立考点与考试的威信,树立良好的服务者的形象;反之则会破坏等级考试的声誉,损害考生的利益。

笔者根据报名、收费的特点以及长期等级考试管理工作的经验,设计并开发了网络管理系统,可极大提高工作效率、降低差错率、方便考生报考。

1 系统概述

1.1 背景分析

图1反映了早期手工报名与收费方式的主要流程。

以上过程具有下列特点:

1) 报名表容易造成大量纸张浪费,信息难以修改;

2) 学生手写信息错误较多,部分内容无法准确识别;

3) 收费效率低,易出差错;

4) 原始照片处理困难,转化为电子信息效率低,质量不高;

5) 信息录入与核对工作量太大,易出差错;

6) 上报考生信息后,原始报名资料管理繁杂,查询困难。

为解决以上问题,许多考点开发了自己的报名系统,从功能的角度,基本都实现了报名过程的无纸化。但通过测试和比较可以发现,这类系统并没有实现其核心价值,多数只是用网络替代了报名表,并没有利用计算机对报考信息进行自动化的分析、处理、过滤和归档,所有的操作实际上还是人工完成。只有在学生交费的时候才能真正确定报名信息的逻辑准确性与真实性,但此时修改已晚。因此,网络报名的关键点不在于信息通过何种手段采集,而在于数据采集过程中的分析与处理,其难点在于如何选择科学高效的数据分析与处理方法。

另外一个需要关注的环节是收费。

考生与收费者之间是多对一的关系,考生作为被收费的对象,他需要做的工作并不多,如图2所示。

而收费者的工作量相对来说是比较繁重的:既要核对考生报名信息,又要确定收费标准,还需要出具收费凭据。同时,面对上千的考生,单人的工作效率也是比较低的,采取多个收费员利用网络环境进行分布式收费是比较合理的设计,同时应简化收费的操作流程,尽可能降低收费员的工作量。

一般来说,网络化收费系统的基本工作过程是利用分布的终端进行收费,结合报名信息进行集中的数据汇总和更新。要保证报名及收费信息的同步和真实可靠,关键在于对收费员的权限应详细划分,不能由收费管理员随意更改收费标准及已收费信息,收费凭据及收费标准应该由系统根据报名信息自动生成,减少操作员主观判断的影响。

1.2 系统目标

综合报名和收费的特点,全国计算机等级考试网络报名系统应实现以下目标:

1) 报名信息的有效性过滤和动态维护;

2) 电子照片的网络提交与相片库维护;

3) 收费过程的网络化管理和实时统计;

4) 信息确认过程以及费用凭据的管理;

5) 基于搜索的查询;

6) 报名信息的隐私性保护;

7) 报名数据的自动化导出。

信息有效性过滤达到的目标是在提示用户报名成功后,最终存储到数据库的信息是尽可能准确和无差错的,同时用户可以在特定的时期内进行自主修改(如收费之前);电子照片可以尽可能降低考生报考的成本(不用多次冲洗照片),提高数据采集和转化效率(不用对原始胶片进行数码照片的转化),建立相片库则是进一步体现人性化,为考生提供方便(一名考生可能会多次报名,而且考生的群体可能比较固定);收费过程应基于分布式、多管理员用户的环境,管理员可以在不同的终端及时查询报名、收费的情况并进行核实;信息确认过程应尽可能简单化,在收费后能够方便快捷地产生双方的有效凭据,防止不必要的纠纷;管理员可以通过搜索迅速定位考生信息,继而进行查询、收费、确认等操作;由于网络化报名具有公开性和广泛性的特点,系统必须采取措施保护考生的个人资料(如身份证号、相片等);本系统还应实现数据导出的功能,在报名和收费结束后按照特定的规范导出数据和相片,上交上一级管理系统或者考点。

2 系统实现

2.1 功能模块

全国计算机等级考试网络报名系统主要功能模块如图3所示。

以上模块中,搜索、收费、数据管理、用户管理是面向管理员的,其余的为考生使用。搜索可以单独设计,也可以嵌入在其他模块中。

2.2 实现说明

系统的详细设计需要考虑一些关键环节,处理不好将直接影响系统的目标和运行效果,分别说明如下:

(1) 报名

报名信息大致分为个人身份信息和报考级别信息,前者中较为重要的是身份证号和相片,后者中容易出错的是保留成绩的选择、原准考证号的填写。身份证号可以采取18位身份证号的编码规则进行校验,虽然不能从根本上避免恶意伪造的身份报名,但至少保证真实报考者不会出错,此外,考生不必提供出生日期、性别等信息(可以由身份证号计算)。相片在用户提交过程中应由系统通过其属性获取大小、格式等信息,从而过滤非法文件。对于保留成绩的选择,应在选择界面附近针对不同保留成绩类型进行详细解释,而原准考证号则尽量不要让用户自行输入(根据统计,很少会有人记得或者一次填写正确,而一旦写错,将影响下次考试成绩),可以结合成绩查询系统在后台根据用户填写的身份证号自动获取原准考证号进行呈现。出于隐私保护的需要,报名过程中需要用户自行输入一个密码,后期报名信息的更新需要凭借身份证号和密码操作,考生提交的相片则采用散列码更名存储,避免猜测下载。

为尽可能减少错误信息,报名过程易采用向导式,将考生的操作局限在特定的选项上,避免其主观发挥。而考生自行修改报名信息的权利应仅限于收费之前,收费后信息的修改需要超级管理员核准。

(2) 收费

收费过程的关键点在于信息的防篡改。管理员可分为超级管理员和收费管理员,此时应该严格规定收费管理员的权限,要点如下:

1) 费用信息应由系统根据报名信息自动生成,不能由收费管理员设置;

2) 收费凭据的生成与打印无法人为控制,收费管理员可以完成的操作仅限于“查询”和“确认”,不能修改考生信息,也不能修改收费信息;收费凭据的打印为一式两份,由系统自动生成管理员姓名和打印日期,收费管理员与考生双方签字确认并各保留一份;

3) 收费过后,收费管理员无法修改已收费信息,无法修改考生各项信息,无法撤销收费,确实需要进行上述更改则应向超级管理员申请权限并说明情况;

4) 收费管理员可以在任意时刻查询自己以及总的收费统计信息并作备份;

5) 超级管理员可以由考点技术负责人或者考务负责人担任,一般情况下可以不具备收费管理员的权限;

6) 考生在报名交费之后不能修改自己的任何信息(密码除外);

7) 系统应设置报名起止时间和收费起止时间,并且到期生效。

(3) 数据管理

数据管理主要包括两部分:即报名信息的导出和相片的导出。

目前全国计算机等级考试有成熟的考务管理系统(基于C/S模式),自身提供了数据导入与导出的功能。如果直接生成独立的报名数据库以替代原有考务管理系统的数据是不现实的(难度和风险比较大),合理的方式是生成标准的可供原考务管理系统导入的数据库文件(这个数据库文件的结构是公开的),然后利用其导入功能导入原系统,进而进行处理并生成上报数据。照片的导出类似,可以依据公开的算法(照片的文件名与准考证号有关)对照片进行更名、导出操作。在数据导出成功后应尽可能进行多次核查,防止偶然的错误发生。

(4) 搜索

搜索是不可缺少的功能模块,网络报名系统效率的提升与之密切相关。搜索的价值应这样描述:首先是“找到”,然后才是“操作”,而“找到”通过搜索实现最为快捷。搜索在设计时应该针对不同的应用给用户提供必要的范围选择(如未收费和已收费的考生,学生和非学生考生),同时实现模糊的匹配。呈现信息时尽可能充分(例如可以把相片放置在报名信息附近,本系统采用的是类似于Goolge搜索结果的样式)。

(5) 运行环境和开发技术的选择

全国计算机等级考试网络报名系统采取B/S方式比较能满足需求。开发技术采用asp、Jsp/Java EE、.NET、PHP等均可,但在数据库选择上为保证与原有考务管理系统的兼容性,建议采用与微软平台兼容性较好的数据库。

3 结束语

黄冈师范学院考点全国计算机等级考试网络报名管理系统(http://www.hgnc.net/yuanxi/jsjx/)自开发完毕至今,已经成功承担三次等级考试的报名、收费等工作,版本已升级为2.0版。之前人工报名数据的汇总往往需要5-6人进行4-5天通宵达旦的工作才能完成,而且很有可能会出现部分数据误操作、报名数据丢失的情况。采用优化的网络报名与收费系统之后,虽然报名人数每年都增加了很多,但是同样的工作却只需要两个人一个下午的时间就可以完成(一人进行数据导出,另外一个人负责审核),并且95%以上的报名信息未做二次修改,照片合格率也大大高于人工报名的阶段。该系统正在进行第三次升级,将集成考前培训管理和考务考场管理,真正实现平台的系统化。

总之,网络报名只有真正提高工作效率才能体现其价值,在设计和开发时需要深入了解和全面分析全国计算机等级考试报名与收费的各个环节,找出最关键的地方,保证系统实施时能够满足各方面的要求。

参考文献

[1]高静,裴喜春,兰雨晴.基于UML网络信息资源管理与服务系统建模[J].计算机系统应用,2006,11:10-12.

云计算的关键技术及发展现状论文 篇5

居巍杰

摘要:本文给出了云计算的定义,总结了云计算的关键技术,揭示了云计算是多种新技术的综合发展产物,并详细介绍了云计算的发展现状。

关键词:云计算;数据存储;编程模型;云安全

1. 前言

云计算(Cloud Computing)是一种新近提出的计算模式。云计算将待处理的数据送到互联网上的超级计算机集群中进行计算和处理,把互联网变成一种全新的计算平台,能够在网络上实现按需购买与按使用付费的业务模式。自从云计算的概念提出来以后,立刻引起业内各方极大的关注,现在已成为信息领域的研究热点之一。云计算到底是什么?为什么需要云计算?云计算的关键技术有哪些?云计算的发展现状如何?本文将就上述问题展开叙述。

2. 云计算定义

云计算(Cloud Computing)是由分布式计算(Distributed Computing)、并行处理(Parallel Computing)、网格计算(Grid Computing)发展而来的,是一种新兴的商业计算模型。目前,对于云计算的认识在不断地发展变化,云计算仍没有普遍一致的定义。

IBM公司于2007年底宣布了云计算计划,云计算的概念出现在大众面前。在IBM的技术白皮书“Cloud Computing”[1]中的云计算定义:“云计算一词用来同时描述一个系统平台或者一种类型的应用程序。一个云计算的平台按需进行动态地部署(provision)、配置(configuration)、重新配置(reconfigure)以及取消服务(deprovision)等。在云计算平台中的服务器可以是物理的服务器或者虚拟的服务器。高级的计算云通常包含一些其他的计算资源,例如存储区域网络(SANs)。网络设备,防火墙以及其他安全设备等。云计算在描述应用方面,它描述了一种可以通过互联网Intemet进行访问的可扩展的应用程序。“云应用”使用大规模的数据中心以及功能强劲的服务器来运行网络应用程序与网络服务。任何一个用户可以通过合适的互联嘲接入设备以及一个标准的浏览器就能够访问

一个云计算应用程序。”

云计算是基于互联网的超级计算模式,包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施,进行统一的管理和协同合作。云计算将IT 相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过Internet 获取需要的服务。

通过对云计算的描述,可以看出云计算具有高可靠性、高扩展性、高可用性、支持虚拟技术、廉价以及服务多样性的特点。现有的云计算实现使用的技术体现了以下3个方面的特征[2]:

(1)硬件基础设施架构在大规模的廉价服务器集群之上.与传统的性能强劲但价格昂贵的大型机不同,云计算的基础架构大量使用了廉价的服务器集群,特别是x86架构的服务器.节点之间的巨联网络一般也使用普遍的千兆以太网.

(2)应用程序与底层服务协作开发,最大限度地利用资源.传统的应用程序建立在完善的基础结构,如操作系统之上,利用底层提供的服务来构造应用.而云计算为了更好地利用资源,采用了底层结构与上层应用共同设计的方法来完善应用程序的构建.

(3)通过多个廉价服务器之问的冗余,使用软件获得高可用性.由于使用了廉价的服务器集群,节点的失效将不可避免.并且会有节点同时失效的问题.为此,在软件设计上需要考虑节点之间的容错问题,使用冗余的节点获得高可用性.

3. 云计算关键技术[3][4]

云计算是一种新兴的计算模式,其发展离不开自身独特的技术和所涉及的一系列其他传统技术的支持,并借助SaaS/PaaS/IaaS 等先进的商业模式把这强大的计算能力分布到终端用户手中。

(1)虚拟化技术

虚拟化是实现云计算的最重要的技术基础,虚拟化技术实现了物理资源的逻辑抽象和统一表示,它是指计算元件在虚拟的基础上而不是真实硬件的基础上运行。通过虚拟化技术可以提高资源的利用率,并能够根据用户业务需求的变化,快速、灵活地进行资源部署,实现动态负载均衡;同时与硬件无关的特性带来系统自愈功能,提升系统的可靠性。在云计算实现中,计算系统虚拟化是一切建立在“云”上的服务与应用的基础。虚拟化技术目前主要应用在CPU、操作系统、

服务器等多个方面,是提高服务效率的最佳解决方案。

(2) 数据存储技术

为保证高可用性、高可靠性和经济性,云计算采用分布式存储的方式来存储数据,采用冗余存储的方式来保证存储数据的可靠性,即为同一份数据存储多个副本。这样用户就无需考虑存储容量、数据存储位置以及数据的安全性和可靠性等问题。

另外,云计算系统需要同时满足大量用户的需求,并行地为大量用户提供服务。因此,云计算的数据存储技术必须具有高吞吐率和高传输率的特点。云计算的数据存储技术的主要代表有谷歌的GFS(Google File System)。IBM 的“蓝云”采用的是HDFS(Hadoop Distributed File System)数据存储技术。此外,一些IT 公司也提出了一些数据存储的解决方案。例如:微软公司提出的Skydrive,惠普公司的Upline 以及Sun 公司的Network.com。

云计算的数据存储技术未来的发展将集中在超大规模的数据存储、数据加密和安全性保证以及继续提高I/O 速率等方面。

(3)数据管理技术

云计算系统对大数据集进行处理、分析,并向用户提供高效的服务,因此,数据管理技术必须能够高效地管理大量的数据。另外,如何在规模巨大的数据中找到特定的数据,也是云计算数据管理技术所必须解决的问题。云计算系统中的数据管理技术主要是Google 的`BT(BigTable) 数据管理技术和Hadoop 团队开发的开源数据管理模块HBase。由于管理形式的不同造成传统的SQL 数据库接口无法直接移植到云管理系统中来,目前一些研究在关注为云数据管理提供RDBMS 和SQL 的接口,如基于Hadoop 子项目HBase 和Hive 等。

(4)编程模型

为了使用户能更轻松地享受云计算带来的服务,让用户能利用该编程模型编写简单的程序来实现特定的目的,云计算上的编程模型必须十分简单,必须保证后台复杂的并行执行和任务调度向用户和编程人员透明。当前比较有代表性的是Google 和Hadoop 项目。Google开发了java、Python、C++ 编程工具Map/Reduce,它不仅仅是一种编程模型,同时也是一种高效的任务调度模型,主要用于数据集的并行运算和并行任务的调度处理。这种编程模型并不仅适用于云计算,在多核

和多处理器、cellprocessor 以及异构机群上同样有良好的性能。

(5)云安全

云计算是一种基于互联网的计算模式,提供服务的时候也就不可避免地出现像安全漏洞、信息泄露、恶意攻击和病毒侵害等普遍存在于既有信息系统中的共性安全问题。云安全经过样本收集和MD5 端匹配技术发展阶段,目前已发展到了第三代的可信云安全。可信云安全的特点是网上自动安全检测和防御,客户端可以优化到很小,以提高性能、减少资源消耗。

4. 云计算发展现状

目前,亚马逊,微软,谷歌,IBM,Intel等公司纷纷提出了“云计划”。例如亚马逊的AWS (Amazon Web Services)[5]、IBM和谷歌联合进行的“蓝云”计划等。这对云计算的商业价值给予了巨大的肯定。同时学术界也纷纷对云计算进行深层次的研究。例如谷歌同华盛顿大学以及清华大学合作,启动云计算学术合作计划(Academic Cloud Computing Initiative),推动云计算的普及,加紧对云计算的研究。美国卡耐基梅陇大学等提出对数据密集型的超级计算(DISC:Data Intensive SuperComputing)进行研究,本质上也是对云计算相关技术开展研究。

IDC的调查显示,未来五年云计算服务将急速增长,预期2012年市场规模可达420亿美元。目前企业导入云计算已逐渐普及,并且有逐年成长趋势。估计在2012年,企业投入在云计算服务的支出将占整体IT成本的25%,甚至在2013年提高至IT总支出的三分之一。由此可见,在各大公司以及学术界的共同推动下,云计算技术将会持续发展。

目前中国云计算的讨论多数集中在早期云计算的概念、技术和模式上。早期的云计算是一种动态的、易扩展的、通过互联网提供虚拟化IT 资源和应用的一种计算模式。用户不需要了解云技术内部的细节,也不必具有云内部的专业知识,更不需要直接参与、投入、建设、维护和控制就能直接按需使用并按用量付费。2008 年,IBM在无锡建立了中国第一个云计算中心,在北京IBM中国创新中心建立了第二个云计算中心—IBM大中华区云计算中心。2009 年初,在南京建立国内首个“电子商务云计算中心”。世纪互联推出“CloudEx”产品线,包括完整的互联网主机服务“CloudExComputing Service”、基于在线存储虚拟化的“CloudEx StorageService”等云计算服务。

随着云计算的升温,国内的电信运营商也都积极投入到云计算的研究中,以期通过云计算技术促进网络结构的优化和整合,寻找到新的赢利机会和利润增长点,以实现向信息服务企业的转型。中国移动推出了“大云”(Big Cloud)云计算基础服务平台,中国电信推出了“e云”云计算平台,中国联通则是推出了“互联云”平台。我国企业创造了“云安全”概念,通过网状的大量客户端对网络中软件行为的异常监测,获取互联网中木马、恶意程序的最新信息,在服务端进行自动分析和处理,再把解决方案分发到客户端。瑞星、趋势等企业都推出了云安全解决方案。

随着云计算的发展,互联网的功能越来越强大,用户可以通过云计算在互联网上处理庞大的数据和获取所需的信息。从云计算的发展现状来看,未来云计算的发展会向构建大规模的能够与应用程序密切结合的底层基础设施的方向发展。不断创建新的云计算应用程序,为用户提供更多更完善的互联网服务也可作为云计算的一个发展方向。

5. 结束语

综上所述,云计算是一种新型的计算模式。它的最主要特征是系统拥有大规模数据集、基于该数据集,向用户提供服务。它使用大量的普通商用机来构建系统,通过冗余存储的方式确保整个系统的可靠性和可用性。与传统超级计算机在底层编程不同,数据密集计算的云系统上使用基于Map-Reduce的高级编程模式。这使得编程人员可以不用考虑底层的并行化方式,专心与程序的逻辑实现。普通用户经过简单的学习,可以编写出满足自身需要的简单程序。

越来越多的IT厂商提出了自己的“云”计划,并投入大量资金推动云计算的发展。这恰恰为云计算提供了良好的发展机遇。虽然现在的云计算并不能完美地解决所有的问题,但是在不久的将来,一定会有越来越多的云计算系统投入实用,云计算系统也会不断地被完善,并推动其他科学技术的发展。

参考文献:

[1] Boss G,Malladi P,Quan D,Legregni L,Hall H.Cloud computing.IBM White Paper,2007.http:

//download.boulder.ibm.corn/ibmdl/pub/soRware/dw/wes/hipods/Cloud_computing_wp_final_80ct.pdf

打造量子计算机,钻石是关键 篇6

两组研究人员发现量子信息(量子比特)可以使用钻石晶体或者纯硅存储。这两项研究发现意味着科学家在研制量子计算机的道路上向前迈出重要一步。量子计算机将永远改变这个世界。

目前,科学家正在研制高性能量子计算机。这种计算机在短短几分钟内完成的复杂运算相当于当前性能最高的超级计算机几年时间里进行的运算。量子计算机利用的是亚原子粒子的一种神秘特性,捕获之后可立即存在于两个不同位置。现在,小规模的量子计算机已经问世,存在于实验室的控制环境下。目前,科学家还没有找到让量子计算机存在于现实环境的方式。

现在,科学家正不断推动非真空状态下固态介质存储信息时间的极限。一支研究小组研制出一款立基于超纯净硅的装置,在温度低于2开氏度(零下275摄氏度)情况下存储数据的时间超过3分钟。另一支研究小组利用钻石晶体,在室温环境下的数据存储时间达到1.4秒。硅基系统由加拿大西蒙-弗雷泽大学物理学家麦克·瑟瓦特和牛津大学以及柏林的科学家共同研发。瑟瓦特表示:“这是固态存储系统的一个纪录。几年前,人们还认为无法做到这一点。它开启了使用固态半导体——例如硅作为量子计算基础的新方式。你可以做人们此前认为的只能在真空环境下做的事情。”

计算系统[关键词 篇7

1 何为云计算

自从云计算的概念被提出以后, 对于云计算的定义一直都有着各种各样的说法。而就目前的情况看来, 最能够被接受的一个定义是这么说的:云计算就是通过网络提供可伸缩的廉价的分布式计算能力。在这里的云是运用了一种比喻的手法, 它主要是代表了一种动态的可扩展网络应用基础设施, 这种可扩展网络应用的核心是一种虚拟化的技术, 运用这种技术实现低成本的目标。

从对于云计算应用的方面的解读来说, 云计算是利用现有的网络平台, 组建出一种能够满足人们的不同层面需求智能化的服务。而这种服务是需要充分地利用这些软件和硬件资源才能够建立的。

从云计算的技术层面上来说, 云计算是将传统的计算方式与互联网中的一些虚拟化的运算进行结合提出的, 它是一种新型的商业计算的模型。

2 云计算有哪些关键技术

云计算的关键技术包括云计算的编程与计算、数据存储技术、虚拟机技术以及数据处理技术。下面笔者就针对这四个方面进行详细的介绍。

2.1 云计算中的编程与计算

云计算的编程一般都是十分简单易学的, 只有这样, 才能够保证使用云计算的用户能够熟练的使用这些编程来达到自己的目的。就目前来说, 由谷歌提出的Map Re-duce这种编程的计算模型是非常适合进行云计算的。在这种模型的形式下, 用户只需要简单地将自己所编写的Map和Reduce这两种程序提供给计算机, 计算机就能够对于数据进行处理, 帮助客户完成目的。

2.2 云计算的数据存储技术

目前, 云计算采用的是分布式的数据储存方法, 这样做的原因就是为了保证数据能够在满足多数人的需求的同时, 又能够保证这些数据具有很高的实用性和可靠性。而分布式的存储方式具有较高的容错性这样能够保证云计算中数据的高吞吐率高传输率的特点。

2.3 云计算中的虚拟机技术

云计算中所提到的虚拟技术就是服务器的虚拟, 它是在云计算过程中的最重要的一部分。云计算之所以与传统的计算方法不同, 就表现在云计算能够对于数据进行虚拟化的计算。它通过将一个比较复杂的资源换算成多个虚拟的资源或者是将一些闲散的资源整合成一个比较大的资源的方式对于数据进行计算。这样不仅仅能够将闲置的资源进行利用, 还能够使降低计算的成本, 提高对于资源的利用。

2.4 云计算中数据的处理技术

在现在的发展中, 人们对于数据处理的要求越来越高。云计算在处理数据的时候一般会采用并行计算的计算方法来对于数据进行处理, 这样就能够最大限度上满足人们对于数据效率的要求。运用并行计算这种方式来进行数据的处理是一种比较科学高效的处理手段。它通过将复杂问题进行分解, 然后运用不同的计算资源对于这些问题进行计算, 最后再将结果进行转化, 这样就使得计算机处理数据的速度加快了。

3 云计算在电力行业内部信息网络中的应用

由于电力系统本身就是一个超级的系统, 但是由于电力本身是不能够进行储存的, 因此这就要求电能在进行生产和控制的时候一定要保证它的实时性、可靠性以及自然分布特性都达到一个较高的标准。而云计算技术拥有强大的信息计算和储存能力, 它的系统能够进行动态的扩展, 各种计算资源能够进行共享等优点。因此, 云计算在电力行业内部的信息网络中的应用是非常大的。因此在电力系统智能云应运而生。

现阶段, 在我国的电力行业内部都在使用智能电网来进行对于电力的控制。对于智能电网来说, 主要就是利用先进的信息技术以及通信技术, 站在电网的数字化以及自动化的方向, 对于电力的各个环节进行数据的采集、传输、存储以及使用, 以实现电力数据的各个环节的自动化和科学化。但是由于电力系统的计算量是非常大的, 就目前而言, 我们只能够在离线的时候才能够对于电力系统进行一个系统的分析。而一旦停电对于电力系统的恢复来说也是一个非常复杂的问题。因此随着云计算技术的不断发展, 人们将云计算技术运用到电力系统中去, 形成了电力系统的私有云系统, 我们将它称作为智能云。对于电力系统来说, 智能云在实际的电力系统的智能化进程中是不可或缺的存在。在智能电网中运用云计算不仅仅能够使企业内部的各种资源进行一个整合, 也能提高各种资源的配置效率, 也能够为电力系统提供一个信息交流的平台, 促进电力系统中的各个子系统的良好协作。

由于信息技术的不断发展, 目前我国的电力企业的自动化水平越来越高。在电力系统中, 为了保证电力系统的正常运行, 在电力系统的每个业务中都有其专属的软硬件设备以及存储设备, 但是这种方式造成了严重的资源浪费, 而且对于软件的维护来说也是非常困难的。而智能云技术的应用就解决了这样的问题。在电力系统中, 运用智能云可以将电力系统内网中庞大的计算拆分成比较小的计算块, 将这些计算块交给多台的服务器进行处理, 最后再将处理结果给客户进行一个反馈。这样就能够使得智能云在极短的时间内处理比较巨大的信息。在电力系统中使用智能云进行处理数据的时候, 电力系统的智能云能够根据相关的应用进行一个资源的切换, 能够为电力系统中的一些复杂的计算问题, 提供一个新的解决的途径, 实现对于电力系统的实时分析与控制。

4 结语

作为一种新的网络计算方式, 我们可以断定, 在将来, 云计算技术一定有着更大的发展, 电力系统是智能电网进行智能云计算的一个重要的平台, 它主要就是与各类的信息系统进行一个组合集成, 在保护好现有的投资的基础上, 对于当前的电力系统信息网络的物流构架进行最大限度的利用。就目前的发展形势来看, 电力系统中智能云的提出, 为整个电力系统的信息交互计算及储存都带来了比较大的影响。因此, 在将来的电力系统中, 我们将不断的通过对于智能云的建立, 在保证不改变电力系统内网以及设备的情况下, 将电力系统的计算能力以及储存能力发挥到最大的性能。

参考文献

[1]李析, 廖志恒.云计算的关键技术及发展现状[J].九江职业技术学院学报, 2011.

[2]段春乐.云计算的关键技术及系统实例的实现[J].电脑知识与技术, 2011.

计算系统[关键词 篇8

关键词:云计算,Hadoop,HDFS,Map Reduce

1. 引言

食品是人类赖以生存和发展的最基本的物质条件。建设食品安全检测信息化平台, 目的是为了提高检测机构实验室的管理水平, 将分割的业务流程整合起来, 管理和控制检测工作的业务流程, 提高业务操作水平和工作效率。本文着眼于解决食品安全检测中心的信息化平台中的关键技术问题 , 包括海量数据的管理、信息服务的质量保证、全局性的流程监控等核心难点 , 为检测中心的信息化平台建立良好的技术支撑。我们考虑将云计算运用到信息化平台当中 , 通过搭建一个相对低成本、充分利用各机构富余的软、硬件资源的云计算服务中心 , 解决食品安全检测的信息共享和互动平台的建设问题 , 提供高层次、多方位的解决方案。因此 , 研究基于云计算的分布式处理框架不仅顺应了技术发展的潮流 , 也具有很强的商业价值和实用意义。

2. 设计目标

基于云计算的食品安全检测信息化平台所要实现的目标是 : (1) 建立运行稳定、安全的食品安全检测中心信息化平台。 (2) 建立高质量的系统操作体系 , 规范业务流程 , 降低质量风险。 (3) 提高企业在信息化管理上的水平, 推动企业往技术创新方向发展。 (4) 采用Hadoop架构 , 极大的降低了硬件配置成本 , 使得存储、查询大量信息数据方便快捷。 (5) 实现可以在任何地方进行操作而不用安装任何专门的软件 , 只要可以连入互联网 , 任何PC机、移动终端、手机终端都可以通过登陆该平台。

3. 系统功能模块介绍

本系统系统设计遵循以下原则:实用性原则、分层管理原则、可扩展性原则、安全性原则。在数据库设计上, 要求数据具有一致性、完整性、安全性, 可读性的原则。通过关键字和程序中的判断来设置并提示用户在使用时避免数据的重复、命名规范便于维护及字段冲突等情况。

该平台划分为几个模块 , 分别是系统管理、检测任务、业务科室信息管理、数据查询统计分析、专家库等。下面对系统的主要功能实现部分按模块进行详细分析说明。

(1) 检测任务管理。检测任务管理包括政府通知和待办事宜模块。检测任务管理模块 : 上级部门下发及委托检测任务 ; 编辑查询安排日常检测和专项检査计划 ; 编辑查看相关文件、通知。

(2) 检验科信息管理。包括主检检测信息、协检检测信息、主检复核信息、协检复核信息、主检退回检品信息和协检退回检品信息等。

(3) 业务科室信息管理。此模块主要负责录入检品信息 , 包括检品编号、名称、委托单位信息、生产单位信息、受检单位信息、检品基本信息 , 并将检品信息递交给某科室进入业务流 , 还包括对检品复核信息、回退信息 , 报表、补样信息的管理等。

(4) 数据查询统计分析。此模块方便用户查看采集的历史数据。由于随着时间的推移 , 历史数据会越来越多 , 这里可以计入一个界面实现选择你要查询的时间段 , 避免数据过大查找比较麻烦的问题 , 为不同层级的用户提供灵活条件的查询、统计分析。

(5) 检测数据管理。检测数据管理模块为相关检测部门提供食品抽检数据汇报 , 便于上级部门监督比对产品抽验情况。系统提供产品抽检数据导入、在线填报、重点检测数据管理、问题产品检测数据管理 , 数据上传下载等功能。

4. 体系结构设计

(1) 总体架构。平台采用B/S体系的三层结构 , 如图所示 , 即表示层、业务逻辑层、数据访问层。表示层是应用程序和用户之间的接口部分 , 为用户和应用程序创造条件 ; 业务逻辑层是应用程序的主体 , 负责处理具体的业务 ; 数据层对底层数据访问操作进行封装 , 负责管理对数据库数据的读写。

(2) 云平台总体设计。云计算平台是通过Hadoop源框架实现的 , 在对系统的设计过程中 , 使用HDFS分布式文件系统来存储分布式文件 , 把Map Reduce计算框架运用到对HBase数据库的查询当中。整个设计过程中 , 运用面向对象的设计理念 , 对各个功能模块进行封装 , 并给出相互之间交互的接口。设计中采用了拆分和融合的方式 , 对处理数据拆分成不同模块分布进行处理 , 然后再对数据进行集中处理 , 融合到缓存区内 , 在空闲的时候可以删除长时间内未使用过的数据 , 以节省磁盘空间。

(3) Map Reduce模块设计。Map Reduce计算框架实现了程序的并行化处理 , 它可以将程序设计人员所关注的业务逻辑层和底层的分布式计算的实现细节 , 对数据进行处理时 , Map Reduce把任务分成多个子任务 , 每个子任务分被处理要查询的各项数据 , 最后由Reduce过程负责对各段数据处理所得结果进行综合分析。

(4) 数据库设计。数据库的设计是整个信息化平台实现的基础 , 良好的数据库设计能够使系统的存储管理更加高效稳定。HBase是一个面向列、可伸缩的分布式存储系统 , 它的映射表反应数据间的不同映射关系 , 通过主键 , 或者主键 + 时间戳 , 来定位一行数据。每一行的记录由关键字、时间戳、列和值组成。

结束语

本文对基于云计算的食品安全检测信息化平台建设的关键技术进行了深入研究 , 并给出了相应的系统总体设计和初步的实现成果 , 不仅让Hadoop云计算平台的优势充分发挥到食品安全检测信息化平台当中 , 解决检测中心目前信息量大、工作繁杂等问题 , 也让Hadoop云平台的应用领域加深 , 并提升了食品安全检测中心的信息技术水平。但在很多方面仍需要进一步的改善 , 主要体现在以下几方面 :

(1) 目前实现的系统功能和服务还未能尽善尽美 , 只实现检测中心最基本的功能要求 , 一些扩展功能还需进一步完善。

(2) Hadoop的计算框架Map Reduce能够实现对分布式操作 , 但在某些算法方面还需要一些改进 , 以实现Hadoop云平台运转更加高效。

参考文献

[1]李乔, 郑啸.云计算研究现状综述[J].计算机科学, 2011.

计算系统[关键词 篇9

随着智能电网[1]建设工作的快速推进,电网中将引入数量庞大的智能电表、电网友好型设备等终端,以实现电网侧与用电侧的双向互动,这将为智能电网带来规模庞大的数据,并对大规模数据的管理、 分析和响应技术提出了巨大的挑战[2]。

根据国家电网公司对用电信息采集系统“全覆盖、全采集、全费控”的统一要求,未来国家电网公司用电采集系统所涉及的用户规模将呈现爆发式的增长,单个省级电力公司的终端用户规模将达到数千万。终端用户数量的指数级增长给用电信息采集系统带来巨大的冲击,原有系统在海量数据的采集、 存储、查询、并行计算分析等全生命周期的数据处理能力方面存在明显的技术瓶颈,且不能进行有效扩展,已经无法满足当前用电信息采集体系及其未来可持续发展的需求。

云计算技术可以通过利用分布式的软硬件资源和信息,提供按需分配的高质量服务,并在搜索引擎、社交网络、通信等众多领域中得到了成功的应用。全球各大IT公司也竞相进入云计算领域,以占据新一代信息技术的制高点。我国也将云计算技术视为是信息技术及其应用实现创新突破、跨越式发展的战略机遇,并在“十二五”规划纲要中明确提出了加强云计算服务平台建设的重要性。在智能电网信息化建设领域,云计算所独具的大规模数据高效存取和并行计算能力,使之能够为包括用电信息采集系统在内的信息系统提供高质量的数据处理服务,为智能电网时代的信息化体系提供坚实的技术支撑。

本文深入地研究了用电信息采集系统的应用问题,提出了以云计算为核心技术的新一代用电信息采集系统整体架构和运行机制。基于云计算的新一代用电信息采集系统能够实现大规模用电数据的高吞吐采集和存储,可以有力地支撑大规模数据的计算、分析处理等需求,并能够通过动态扩展来实现系统存储和计算能力的线性提升。

1 相关研究工作

云计算与智能电网的结合吸引了学术界和工业界的广泛关注。文献[3] 讨论了云与智能电网的协调问题,分别对电网网络、数据网络进行了建模,并对优化协调问题进行了形式化建模,提出了一种利用云计算技术提高电网的健壮性和负载平衡能力的方法;文献[4] 提出了一种基于云计算的快速需求侧响应方法;文献[5] 提出了一种基于云计算的电网决策支持系统以及相应的软件实现方法;文献[6] 针对智能电网中电力营销系统面临的问题与考验,提出了包括基础设施层、应用接口层、应用服务层和用户接口层在内的基于云计算的智能电网营销管理系统; 文献[7] 则提出了一个面向电网SG-ERP系统的云计算技术框架,包括信息网络、资源管理、平台服务、 业务应用、接入服务5 个层次。

现有研究工作主要着眼于云计算与智能电网的协同工作,或针对营销、决策支持、ERP等生产类系统,缺乏对我国智能电网用电信息采集系统的深入分析和对云计算应用的架构设计。

2 智能电网用电信息采集系统概念模型

智能电网的用电信息采集系统通过居民智能电表或者专变采集终端等设备,对电力用户的用电信息进行采集,并进行实时监控和数据处理,实现用电信息的自动采集、计量异常监测、电能质量监测、用电分析和管理、相关信息发布、分布式能源监控、智能用电设备的信息交互等功能。

用电信息采集系统需要整合其他业务系统的数据,进行以用电数据为中心的数据分析和处理,整合生产管理系统、GIS系统、配电自动化系统和营销系统数据,为电网管理用户以及用电用户等提供基础数据和增值服务。智能电网用电采集系统概念模型如图1 所示。

在智能电网时代,采集终端的指数级增长与用电信息采集系统的现有IT架构之间产生了突出的矛盾,具体表现如下。

1)海量数据的存储与查询性能受传统技术方案的约束。终端数量的剧增导致数据采集入库、存储的压力剧增,大规模数据查询的效率亟待提高。基于小型机关系数据库集群的方案受限于关系数据库的束缚,不能有效利用分布式资源扩展系统能力,无法满足高通量数据存取和查询需求,服务质量无法保障。

2)大规模数据的分析计算能力严重不足。随着营销业务的不断深化,用电信息采集系统的计算任务日趋复杂,现有用电信息采集系统难以在规定的时间内完成海量数据的分析和统计等工作。随着需求响应、有序用电等工作的开展,用电信息采集系统计算能力已经成为整个智能用电体系的性能瓶颈之一。

采用云计算技术能够有效提升数据存储、查询和计算的性能,但仍需要按照用电信息采集系统的概念模型,处理好基于云计算的用电信息采集系统与传统应用之间的关系,支持智能电网用电信息采集系统向云平台的平滑过渡。

3 系统总体结构

用电信息采集系统从功能上大致可以分为采集集群、云数据存储环境、并行ETL环境、并行分析计算环境、数据查询组件、前端接口以及用于开发的映射工具。系统总体架构如图2 所示。

采集集群周期性地从用户终端中采集信息,并通过调用存储接口将数据存储到云存储与查询环境中;数据存储与查询环境负责对采集到的信息进行高并发的存储,并向上提供用电数据索引和高效查询功能。

并行ETL环境负责原有关系型数据库中档案信息与云计算环境的数据交换;开发用户需要利用ETL管理工具建立数据表映射关系以及任务的执行策略,系统通过并行ETL工具对关联系统中的数据进行实时跟踪、获取和一致性校验。

并行分析与计算环境负责运行用电信息采集系统的应用算法。提供丰富的任务调度和监控工具, 以实现整个环境的运行时优化。

前端接口包括类SQL接口、Web服务、客户端包等,面向外部系统提供查询和分析计算的服务。

映射工具采用了基于查询重写的SQL到Map/ Reduce的优化技术[8],将原有SQL转化为查询图, 并利用重写规则演变为多种形式,实现原有存储过程形式的应用程序向云计算环境的辅助迁移、正确性验证和性能优化,能够大幅度降低关系型数据库应用到云计算的迁移成本,提高开发效率,提升并行计算的总体性能。

4 系统实现与性能分析

在某省级电力公司用电信息采集系统验证应用项目中,使用6 台服务器搭建云计算环境,进行海量用电信息数据的并行分析实验,主节点为双核16 G内存的服务器,数据节点为双核32 G内存服务器, 运行环境为Hadoop 0.30.2。对比试验为2 台HP 8 核64 G小型机构成的硬件环境,运行Oracel 10G RAC,以验证由Oracle关系型数据库为存储主体架构的计算环境转型至云计算平台环境的可行性、正确性以及云计算的实际性能。

此次实验选取了4 个典型的真实用电业务应用场景,分别是低压数据完整率统计、终端通信流量统计、低压日电量计算和用户负荷查询,数据样本为3 个月的电量数据(7.326 亿条)。用电信息采集系统优化效果比对如图3 所示。

通过结果对比,4 个场景的计算或查询延迟分别下降到了原来的17.4%、10.1%、17.3% 和7.1%,系性能平均提升近8 倍,验证了基于云计算技术的系统平台的性能优势。

5 结语

计算系统[关键词 篇10

基于计算机视觉的作物营养诊断方法所涉及的技术问题主要包括:图像分割、冠层图像特征提取与分析、建立诊断模型。本文在对这些关键技术的研究现状进行深入分析的基础上, 指出现有技术所存在的主要问题以及未来的研究方向, 以期为优质农作物生产中的无损实时生长监测及智能调控提供技术途径。

1 作物冠层图像分割方法的研究现状及分析

已提出的作物冠层图像分割方法大体上可分为三类, 即:单纯的基于颜色特征的分割方法, 基于复合特征 (颜色、几何、纹理特征等) 的分割方法, 其它分割方法。

1.1 单纯的基于颜色特征的分割方法

这是最直观的图像分割方法, 在作物冠层图像分割中被广泛使用。该方法适合用于将图像分割为土壤背景和绿色植被两部分, 早期的作物图像分割经常采用这种方法。常用的颜色特征包括:图像的R (红色) 、G (绿色) 、B (蓝色) 颜色值, H (色度) 、S (饱和度) 、I (亮度) 值, 以及各种颜色特征的组合 (例如R/G) 。

1996年, Ling和Ruzhitsky将传统的Otsu两类分割方法扩展为多类分割方法, 并利用扩展的Otsu方法根据冠层图像灰度值将其分割为三部分:冠层、土壤、培养基[7]。1999年, Lukina等人根据像素的R、G、B颜色值, 采用固定阈值法分割冬小麦冠层图像[8]。2000年, Adamsen等人采用固定阈值法根据像素R或G值将油菜冠层图像中的无关背景去掉, 只留下与花朵有关的黄色和白色部分[9]。2003年, Clement 和Vigouroux提出了使用图像的RG二维直方图、直方图多级分析技术和距离分类器将图像分割为土壤和植被[10]。同年, Aitkenhead等人采用G/ (R+G+B) 特征和固定阈值法分割图像中的绿色植被和土壤, 然后将图像的颜色值作为反传神经网络 (Back Propagation Neural Network, BPNN) 的输入, 用训练后的BPNN区分作物和杂草[11]。2004年, Kavdir将向日葵冠层图像的R、G、B颜色值作为BPNN的输入, 成功分离了图像中的杂草、土壤和向日葵[12]。

2000年, 陈佳娟等人将田间玉米图像的R、G、B 值作为遗传神经网络的输入, 实现了大田玉米和背景图像的正确识别[13]。同年, 赵春江等人采用灰度直方图阈值化技术成功去除了单株小麦图像中的土壤背景[14]。2001年, 陈佳娟等人为了分离图像中的棉花和土壤背景, 采用最小错误分割方法和像素的颜色值求取图像的最佳分割阈值, 完成了图像分割[15]。同年, 纪寿文等人在识别玉米苗期田间杂草时, 采用双峰法寻找图像绿色直方图最佳阈值, 实现了绿色植被和土壤背景的分割[16]。2004年, 王人潮等人对封垄前和封垄后的小麦冠层图像采用不同的颜色阈值, 根据其R、G、B值以及H、I值, 完成了小麦冠层图像的分割[17]。

这类方法中有一种比较特殊的方法——基于颜色指数的方法。该方法将各种颜色指数作为分割依据, 采用阈值法实现图像分割。常用的颜色指数有:正规差分指数 (Normalized Difference Index, NDI ) , 超绿度指数 (Excess Green Index, ExG) , 超红度指数 (Excess red index, ExR) , 以及植被提取颜色指数 (Color Index of Vegetation Extraction, CIVE) 。其中最为有效且使用的最多的是超绿度指数ExG。国外的Perez、Kataoka、Neto 以及Bakker等人分别采用NDI、CIVE、ExG-ExR和ExG区分作物图像中的绿色植被和土壤背景[18,19,20,21]。国内的单成钢、袁左云、于国英、刘洪见等人在分割小麦、大豆、玉米等作物的冠层图像时也采用了ExG指数[22,23,24,25,26,27]。

1.2 基于复合特征的分割方法

作物冠层图像比较复杂, 采用单纯的颜色特征往往达不到理想的分割效果, 无法正确分割图像中的杂草和农作物, 并且这种方法很难要区分图像中农作物的不同部位。因此, 研究者在进行图像分割时, 除了颜色特征以外, 还会提取其它的特征, 例如几何特征、纹理特征等等。

2000年, Perez等人采用主轴长度、圆形度、面积等区分杂草和作物[18]。2001年, Hemming 和Rath利用H、S、I三个颜色特征以及面积、面积周长比、长宽比等8个形态学特征分割图像中的作物、土壤和杂草[28]。2002年, Cho等人利用圆形度、长宽比等8个形状特征, 分别采用3层BPNN和判别分析方法区分图像中的杂草和小萝卜[29]。2003年, Aitkenhead等人采用周长和面积特征区分作物和杂草[11]。2004年, Shrestha等人从玉米图像中提取冠层投影面积、作物在图像行向的长度以及从作物行均值位置到植株中心的距离三个特征, 根据这三个特征以及颜色特征, 采用修正的Otsu和极大似然估计方法区分图像中的玉米、杂草和土壤[30]。2007年, Laliberte等人利用颜色、尺寸、形状特征和基于对象的图像分割方法区分作物冠层图像中的土壤、阴影、绿色植被、衰老植被[31]。同年, Tallaeche等人根据图像中各个小单元的连通区域个数、每个连通区域的面积等特征以及作物行位置, 区分杂草和作物[32]。2008年, Gee根据每个区域中像素相对于作物行的位置判断该区域属于作物还是杂草, 完成图像分割[33]。

1.3 其他分割方法

除了以上两种方法以外, 研究人员正在不断积极探索新的分割方法。例如, 英国Silsoe研究所Onyango和Marchant于2001年提出了一种基于物理反射模型的分割方法[34]。该方法使用光源向量及其法线在RGB空间定义一个分割平面, 将该平面的角度作为阈值分割图像中的绿色植被和土壤。2003年, Onyango和Marchant又提出了一种新的分割图像中的作物和杂草的方法[35]。该方法使用双变量高斯分布模型建立作物像素相对于作物中心点的概率分布模型, 利用灰度形态学操作和条件概率方法分割作物和杂草。

2 冠层图像特征提取与分析技术的研究现状及分析

目前, 研究者所提取的作物冠层图像特征以颜色特征居多, 也有部分研究者使用纹理、冠层覆盖度等特征。大部分研究者都采用相关分析技术分析所提取的特征与作物营养状况之间的密切程度。

1996年, Casady等人从单株水稻冠层图像中提取植株高度、宽度、面积等特征, 并利用这些特征分析作物的生长状况[36]。同年, Ahmad和Reid分析了不同颜色空间中的颜色分量与玉米生长状况之间的关系, 结果表明:含水量、含氮量、生长时间、叶形与图像颜色值均具有相关关系, 其中红色值与作物水胁迫状况关系密切[1]。2002年, Scharf和Lory的研究结果表明:图像的绿色和蓝色值与最佳施氮量之间具有明显的相关关系[2]。2003年, Kataoka等人利用植被覆盖度估计了作物高度和干物质含量[19]。同年, Gautam等人采用作物冠层图像的纹理和统计特征预测了作物的硝酸盐含量[3]。

2000年, 赵春江等人从单株小麦图像中提取叶片长宽比、叶片与主茎夹角、株高、叶龄、叶色等信息, 并采用这些信息估计了小麦苗期的营养状况[14]。2004年, 雷咏雯等人采用B/ (R+G) 作为棉花氮素营养诊断指标[4]。同年, 吴富宁等人采用主成分分析技术 (Principal Components Anaiysis, PCA) 对30幅小麦冠层图像在三种常用的颜色模型中的9个颜色特征进行了分析, 提取出了表征小麦颜色特征的3个主成分指标[37]。2007年, 刘洪见等人建立了玉米冠层图像的R+B、 (R-G) / (R+G+B) 等颜色特征与不同生长时期玉米氮营养状况之间的定量关系模型[5]。同年, 王晓静等人采用R/ (R+G+B) 和B/ (R+G+B) 诊断棉花铃期氮素营养状况, 并采用R、G、B、G/ (R+G+B) 等颜色特征预测作物的产量和施氮量[6]。

除了从作物冠层图像中提取颜色、纹理等特征之外, 也有研究者使用植被指数表示作物的营养状况[11][38]。比较常用的是正规化差分植被指数 (Normalized Difference Vegetation Index, NDVI) 和绿色植被指数 (Green Vegetation Index, GVI) 。1999年, Lukina等人分析了NDVI与植被覆盖率、干物质、总氮含量之间的关系, 结果表明, 它们之间具有相关关系, 相关系数分别为0.8, 0.7, 0.8[8]。2004年, Moges等人分别分析了绿色NDVI和红色NDVI与作物产量和生物量之间的关系, 结果表明它们之间的相关系数均大于0.7[39]。该方法对输入设备的要求较高, 要求输入设备 (例如数码照相机) 不仅能够获取作物的可见光谱反射值, 而且能够获得在近红外波段的光谱反射值。

3 诊断模型建立方法的研究现状及分析

目前, 利用遥感数据 (包括近地面遥感数据, 例如冠层图像数据) 估计作物农学参数大多采用统计方法中的回归分析和相关分析方法, 所建立模型以线性模型居多, 也就是说在建模时, 大多数研究者都忽略了输入输出关系中的非线性部分。同时, 大部分研究者所建立的模型都是针对一种指标进行建模, 即所建立的模型是单输出模型。

1999年, Lukina建立了冬小麦冠层图像的NDVI与植被覆盖率、干物质、总氮含量之间的线性回归模型, 植被覆盖率的相关系数r2>0.8, 生物量的r2=0.35~0.8, 总氮含量的r2=0.42~0.82[8]。2002年, Scharf和Lory建立了玉米冠层图像的相对绿色和相对蓝色值与最佳施氮量之间的线性回归模型, 最佳情况下的相关系数分别为0.7和0.79[2]。2003年, Kataoka使用回归分析方法建立了植被覆盖率与作物生长状况之间的数学模型, 分别采用Gompertz生长曲线和指数函数进行建模, 但模型的预测精度不高[19]。2004年, Moges建立了GNDVI以及RNDVI与氮含量、产量、生物量之间的指数关系模型, r2>0.7[39]。2005年, Cartelat等人采用回归分析方法建立了叶绿素计SPAD-502读数与叶片叶绿素含量之间的二阶多项式模型, r2=0.91[40]。2006年, Babar等人建立了不同光谱指数与春小麦产量之间的线性回归模型[41]。2007年, Wu等人建立了修正的土壤校正植被指数与玉米以及马铃薯作物的叶面积指数之间的线性回归模型, 均方根误差RMSE为0.63和0.79[38]。

2004年, 雷咏雯等人建立了棉花冠层颜色特征值B/ (R+G) 与施氮量之间的线性回归模型, r2=0.64[4]。2007年, 刘洪见等人基于颜色特征和覆盖度建立了氮肥施用量线性诊断模型, r2为0.82[5]。同年, 王晓静采用统计分析的方法分析了棉花冠层图像的颜色特征与施氮量之间的关系, 结果表明R/R+G+B与施氮量和产量均为负相关, B/R+G+B则与之呈正相关, G/R与植株全氮以及生物量显著相关[6]。

由于ANN具有自适应性、良好的学习能力和容错能力, 部分学者尝试采用ANN进行建模。1996年, 金亚秋采用三层BPNN建立了小麦冠层遥感数据与含水量、干物质、土壤湿度、冠层高度之间的数学模型, 采用线性插值方法解决采样数据稀疏问题[42]。2003年, Gautam等人分别采用BPNN和径向基函数 (Radial Basis Function, RBF) 神经网络预测植株硝酸盐含量, 但没有指出如何处理数据稀疏问题[3]。

4 结论

移动战略是企业抢滩云计算的关键 篇11

事实上,这两者之间存在着密切的联系。专业性的企业流程管理方案,需要完备的云计算平台做支撑。黑莓企业移动解决方案无论在邮件推送、网页浏览还是BBM社交等应用方面都有良好的表现,因为RIM公司拥有一个庞大的全球化云计算平台。

那么,企业应当如何制订适合自己的移动战略?事实上,在信息化建设之初,很多企业由于缺乏全局观念和长远规划,致使信息化系统与企业业务流程脱节,特别是在牵涉多个业务部门协作的流程管理上效率更是偏低。在这种情况下,盲目升级系统或是采购新设备只会事倍功半。

面对困局,企业应当进行战略调整。首先,企业IT部门需要不间断地对流程管理系统进行实时监控、综合分析以及针对性地改进。这些环节环环相扣,缺一不可。

实际上,大多数企业的CIO或IT主管对移动战略的概念并不陌生,但令他们困惑的是,究竟应该如何规划完整的移动战略?在RIM公司看来,一套完整的移动战略必须包含3个基本要素:完整的移动应用平台、完整的移动安全策略和完善的终端管理与支持系统。

企业参与流程管理的信息化系统形式多种多样。除了常见的电子邮件系统、视频通话系统、企业内网外,还包括ERP、SCM、CRM、OA等系统。然而,在很多企业中,这些系统原本都是基于有线网络设计的,如今要实现从“有线”向“无线”的延伸,对于这些企业来讲并非易事。企业仅仅凭借一部终端和几款软件难以实现这种转变,因此还要考虑如何解决所有应用以及使用者之间平衡与优化问题,而这需要一套强大的移动应用平台做支撑,并且该平台要能够实现与现有信息化系统的无缝对接。

然而,移动战略只是企业信息化的一种延伸与补充。建立移动战略的目的不是取代企业原有的信息化系统,而是要与之融为一体,从而共同为企业的流程管理服务。因此,移动应用平台的安全策略必须与整个信息化系统保持一致。

事实证明,大部分企业员工会在外出时使用移动终端参与流程管理,而在此期间出现任何问题,都必须通过远程管理的方式来解决。好的管理系统应该可以实现用户远程管理终端阅览信息,调整终端的安全设置,控制终端可使用的功能,甚至在必要时还能远程修正或删除终端上的数据。因此,移动终端的管理与维护显得格外重要。

由此可见,完备的移动战略,能够帮助企业最大限度地提高流程管理的效率,从而带动整个企业的运营速度。而终端管理与支持系统是否完善,很大程度上是取决于其对终端的控制能力。这要求企业对服务对象的移动流程管理和战略之道十分了解。例如服务于世界500强企业的RIM公司,在根据不同企业现状提供针对性方案的同时,兼具了较强的灵活性,实现了与企业原有流程管理系统的无缝对接。改变了原来只能在电脑PC上进行流程处理的历史,实现了手机终端的流程管理操作,方便了外出或旅途中处理公务的人士的各种需求。

同时,在电子邮件被司法机构频繁作为证据而采信的今天,世界上越来越多的国家也在相应的法规中明确了黑莓企业电子邮件的电子发现与法规遵从方面的条款。美国塞班斯法案中就提出,要求上市公司保留包括电子邮件在内的所有业务记录至少5年;保留与审计工作报告和财务管理相关的电子邮件至少7年。这说明,电子邮件的管理与保存已经成为企业信息安全的一项重要内容。现在,黑莓企业移动解决方案已经得到塞班斯法案认可,它能为企业提供电子邮件管理服务,降低企业的合规风险。

专业的移动解决方案能帮助企业在即时性、生产效率和直接成本节省等方面的价值回报迅速实现。黑莓企业移动解决方案,正是基于这个考虑,从企业本身出发,为其运营提速、提供高效的移动管理流程,从而成功抢滩云计算领域。■

谢国睿

现任RIM中国区总裁。2005年,担任美国信息产业机构(USITO)北京办事处总裁兼执行董事。

计算系统[关键词 篇12

1)答疑是学生进行系统学习的有益补充,同时也是学生巩固知识的重要途径,无论学习的形式如何变化,答疑对于学习活动来说是必要且不可或缺的,在网络坏境下,及时、有效地获得解答是学生远程学习的基本需求。

2)通过对学生所提问题的记录分析,可以统计出学生普遍存在的知识薄弱环节,为教师进一步改进教学方法提供参考,成为辅助教学的有效工具。

3)在网络环境下的智能答疑系统采用了友好自然的自然语言接口,学生可以轻松自如地提问,及时解决学习过程中遇到的难题,使远程教学真正起到用户良师的作用,对于远程教学方式在我国的进一步普及,具有不可估量的重大意义。

4)将功能良好的智能答疑系统应用于国家大力发展的远程教学支撑平台中,具有很大的社会价值。

5)为自然语言理解以及信息检索技术的应用发展提供了一个方向,可以推动该技术领域的发展。

如何让计算机理解用户提出的自然语言描述的问题,检索到目标问题,并自动的返回答案,这是智能答疑系统的关键。本文讨论怎样根据用户问题去匹配目标问题的思想及其算法,这也是智能答疑系统的最终目的。

1 问题关键词匹配度计算

一个问题中含有一个或多个关键词,但是每个关键词在句子中的地位是不一样的,有的起决定性的作用。该类关键词就是要重点考虑的关键词,它与问题的匹配度为1。如:“编译原理是什么?”,含有关键词“编译原理”、“编译”,在这个问题中学生要问的是“编译原理是什么”,因而“编译原理”是要重点考虑的关键词。但是“编译”也属于《编译原理》这门课程的专业词,匹配时也可以考虑,因为这将有利于问题答案的检索。如果学生问的“编译是什么?”,若FAQ中没有该匹配对,不能检索到相同的问题则检索近似的问题。

例如:编译原理是什么?

起决定性作用的关键词,它与该问题的匹配度为1,不起决定性的关键词与问题的匹配度为0.5。

采用这种策略,可以实现简单的语义分析。

例如:“编译原理是什么?”与“什么是编译原理?”是同一个问题。如果用户输入的是这两个问题,则检索到的都是同一个问题。

如果问的是“编译是什么?”(假设FAQ中没有该问题与“编译”的匹配度为1的匹配对),则检索到近似的“编译原理是什么?”,然后返回其答案。这样系统用一个近似的问题及其答案来回答学生所问问题,从所返回的答案中学生能有所启发。

2 基于问题关键词匹配度的相似度计算

系统根据用户所问问题去检索相应的问题及其答案,即根据用户问题去匹配目标问题。匹配到的目标问题是否与用户问题对应,相似程度有多大?这将涉及到相似度问题。

句子相似度计算在自然语言处理中有着广泛的应用,例如,在基于实例的机器翻译中的源语言检索,面向常问问题集的自动问答系统中的问句检索等领域。在不同的具体应用中,相似度的含义也有所不同。例如,在基于实例的机器翻译中,相似度主要用于衡量文本中词语的可以相互替换使用而不改变文本的句法语义结构的程度;在信息检索中,相似度更多的是反映文本与用户查询在意义上的符合程度。

目前常见的两种句子相似度的计算方法:(1)基于词向量空间模型的TF-IDF相似度计算方法;(2)基于语义词典的相似度计算方法。

本文在这两种相似度计算方法的基础上提出了一种新的相似度计算——基于问题关键词匹配度的相似度计算:

当用户问题中的关键词与目标问题的匹配度为1且句子类别一致时,则认为目标问题与用户问题完全相似,相似度为1。

当用户问题中的关键词与目标问题的匹配度为0.5且句子类别一致时,则认为目标问题与用户问题近似相似,相似度为0.5。

当用户问题中的关键词与目标问题的匹配度为1或0.5但句子类别不一致时,则认为目标问题与用户问题低相似,相似度为0.25。

利用这种相似度计算方法,相似度在系统实现中不用单独计算,它的计算隐含在问题匹配中。

在实际的系统实现中,一般只要考虑前两种。这种方法是一种非常有效的相似度计算方法,在实际的系统中能大大提高系统的效率,减少了传统的相似度计算的复杂统计及计算。

3 问题匹配算法

利用本文中提出的相似度计算来完成问题的匹配——用户问题与目标问题的匹配。

利用FAQ库进行用户问题解答的基本计算流程如下图所示:

3.1算法程序代码

while(rsl1.next())//判断CutWord表是否为空即是否切到了关键词;AND判断是否遍历完;(技巧:只要能进入循环就不是空即切到了关键词;于是随即就可以进行遍历)

4 结束语

本文阐述了智能答疑系统的作用,介绍了一种基于问题关键词匹配度的相似度计算,然后利用该思想来完成问题匹配,并给出了问题匹配算法的流程图以及程序代码。

摘要:答疑是教学中不可或缺的环节,传统面对面的答疑浪费时间和精力,因而开发高效、准确、智能化的自动答疑系统是必要的。系统返回答案的准确性在一定程度取决于问题匹配的相似度。该文介绍了智能答疑系统中传统的相似度计算,然后在传统的相似度计算的基础上提出了一种新的相似度计算方法——基于问题关键词匹配度的相似度计算,同时给出了该思想在系统中的实现算法。

关键词:智能答疑系统,相似度,匹配度

参考文献

[1]侯丽敏.基于网络的智能答疑系统的研究与实现[D].河南:河南大学,2005.

上一篇:安全防范安全教育下一篇:引爆能源