在线算法(共7篇)
在线算法 篇1
在线考试过程中, 利用计算机自动选题、组卷是实现考试规范化科学化的重要措施。自动组卷是按照一定的要求, 采用一定的算法由计算机自动地从试题库中选择试题, 组成符合要求的试卷。由此可见, 组卷问题是一个在一定约束条件下的多目标参数优化问题, 组卷的效率和质量取决于试题库的设计以及组卷算法的设计, 因此选择科学的算法是自动组卷的关键。
1 确定试题属性
题库中的试题所具有的属性项有很多, 我们可以根据实际需要有选择的使用, 在这些属性中, 主要考虑的试题属性有如下几个:
1.1 试题编号:试题的编号, 用来唯一标识试题。
1.2 科目:试题所属的课程。
1.3 知识点。某道题所属课程的知识点。
1.4 题型:区分试题的类型, 如选择题、判断题、简答题等。
1.5 难度系数:难度系数[1]是表示某一试题的难易程度, 通常用未通过率来表示, 即一次考试中未答对某道试题的考生数在其总体中所占的比例。
1.6 区分度:是反映试题区分应试者能力水平高低的指标。
1.7 分值:试卷中某题所占的分数。
1.8 答题时间:完成某题估计所需的时间。
2 常用组卷算法[2]概述
2.1 随机选取法。该方法的核心是利用计算机的随机函数, 依据控制指标, 由计算机不断抽取符合控制指标的试题放入试卷中, 此过程不断重复, 直到组卷完毕, 或再也无法从题库中抽取满足控制指标的试题为止。随机组卷方法简单, 对于单道题的抽取运行速度快, 但对整个组卷过程来说组卷效率低, 有时还会进入无效操作的死循环, 导致组卷失败。即使组卷成功, 花费时间较长, 尤其是当题库中状态类型平均出题量较低时, 容易造成组卷失败。
2.2 回溯试探法。此方法将随机选取法产生的每一状态类型纪录下来, 当搜索失败时释放上次纪录的状态类型, 然后再依据一定的规律变换一种新的状态类型进行试探, 通过不断的回溯试探直到试卷生成完毕或退回出发点为止, 这种有条件的深度优先算法, 对于状态类型和出题量都较少的题库系统而言, 组卷成功率较好, 但是在实际到一个应用时发现这种算法对内存的占用量很大, 程序结构相对比较复杂, 而且选取试题缺乏随机性, 组卷时间长。
2.3 遗传算法[3]。遗传算法由密执安大学教授Holland及其学生于1975年创建。该算法以morgan的基因理论及eldridge与gould间断平衡理论为依据, 同时融合了mayr的边缘物种形成理论和bertalanffv一般系统理论的一些思想, 模拟达尔文的自然界遗传学:继承、进化、优胜劣汰。实质上是一种把自然界有机体优胜劣汰的自然选择、适者生存的进化机制与同一群体中个体与个体间的随机信息交换机制相结合的搜索算法。运用此算法求解问题首先需将所要求解的问题表示成二进制编码, 然后根据环境进行基本的操作:选择, 交叉, 变异……这样不断的进行所谓“生存选择”, 最后收敛到一个最适应环境条件的个体上, 得到问题的最优解。
3自动组卷算法研究
通过对以上三种组卷算法的分析和研究, 本课题采用一种优化算法, 提出了自动组卷策略。自动组卷策略是按一定的测评标准, 针对题库设计, 结合考试规范要求, 从试题库中抽取符合要求的试卷[4]。
3.1建立自动组卷数学模型。假设一套试卷中包含m道试题, 需要从题库中抽取这m道试题, 而每一道试题所要考虑的属性有:试题编号、试题编号、科目、知识点、题型、难度系数、区分度、分值、答题时间, 其所对应的值分别是b1、b2、b3、b4……b8, 则一套试卷就决定了一个m×8的矩阵S:
矩阵S就是问题求解中的目标矩阵, 其中bi1、bi2、bi3、bi4、bi5、bi6、bi7、bi8分别表示试卷中第i道题的题号、科目、知识点、题型、难度系数、区分度、分值、答题时间。从矩阵中可以看出自动组卷是一个多重约束目标的问题求解, 其目标状态并不唯一。
3.2控制指标的设置。针对试题属性, 结合考试的规范要求, 建立组卷控制指标、题型控制指标、知识点控制指标, 以构成试卷局部的约束条件, 而局部约束条件的集合将构成全局约束条件, 满足全局约束条件, 寻求最优化解, 以最大满足用户要求。
3.3自动组卷约束条件。组卷是从试题库中抽取试题, 实现根据用户要求生成的组卷模式。所以选题是有一定限制的, 并不是试题库中所有的试题都有参与选题的资格, 只有那些满足一定条件的试题才能参与选题。因此, 选题组卷过程是在一定的约束条件下进行的。本文针对题型、难度、区分度及知识点制定了约束条件, 其中各项约束条件的内容如下:
题型约束条件公式:
式中:Fi——第i题的分数 F——试卷总分
难度约束条件公式:
式中:Qi———第i题的难度系数
区分度约束条件公式:
式中:Di———第i题的区分度
3.4自动组卷算法。基于自动组卷策略进行组卷时, 根据组卷过程中所设定的控制指标及约束条件进行抽题, 即可抽取满足条件的m道试题, 生成标准试卷, 试卷内容由试题向量B={b1, b2, ……, b}组成。本算法容易在计算机上实现, 生成的试卷能够满足控制指标及约束条件等各项指标要求, 即使生成的试卷内容可能有些偏差, 但通过试题库调整和教师手动调整, 可及时修改试卷, 使生成的试卷更加合理化、科学化。
结束语
本论文在组卷过程中对传统自动组卷方法及遗传算法进行了分析和研究, 在此基础上, 采用了组卷策略进行自动组卷, 并在数据库设计时考虑到组卷的控制指标和参数, 按相应的算法从题库中抽取满足参数要求的最优解, 取得了一定的效果。
摘要:介绍了在线考试系统中自动组卷的方法, 着重分析了传统组卷算法, 并在此基础上提出了自动组卷策略, 能加强读者对在线考试系统中自动组卷功能的理解, 并能应用于在线考试。
关键词:试题属性,数学模型,控制指标,组卷算法
参考文献
[1]李涛.网络在线考试系统研究与实现[D].昆明:昆明理工大学, 2007:24-26, 33-35
[2]张亚军.构建基于B/S模式网络考试系统[D].天津:天津大学, 2006, 5-17
[3]陈英学.ASP深入编程[M].北京:北京希望电子出版社, 2001:23-68.
[4]孙卫.基于Web的网络考试系统的设计与实现[D].南京:河海大学, 2007:37-44.
[5]段锦.通用试题库系统的设计方法研究[J].长春光学精密仪器学院学报, 2001:46-50
[6]钱灵.基于.NET的网上考试系统的设计与实现[D].天津:天津大学, 2005.
在线算法 篇2
导航电子地图的真实坐标必须加密转换成国家测绘局要求的加密坐标才可以出版和发布,形成了以自主导航为代表的离线位置服务模式。现有模式下导航电子地图从测绘、审查、加密到发布需要耗费至少半年时间,造成导航数据现势性较差,实时交通等数据难以立即更新和发布到手持终端上,远远未能满足用户对实时数据的要求。为适应目前已经逐步形成的在线导航新模式,同时保证国家安全,有学者提出了在线模式下的电子地图坐标加密算法,刘爱龙[1,2]等提出地图数据网络分发的混合加密算法和散列组合加密算法,将坐标等数据与密钥混合后传输,增加了数据的安全性;张姗姗[3]、Zheng Liangbini[4]研究了矢量地图在异地传输的数据加密方法,并采用混合加密的方式来保证网络环境下矢量图形数据的安全性;闵连权[5]、钟尚平[6]等分别尝试了基于混沌序列的数据加密算法,并在电子地图网络传输中使用;潘伟洲[7]等利用训练后的 BP 网络来预测新的百度坐标所对应的 GPS 坐标。这些前人的研究成果一定程度上促进在线导航模式下加密算法的研究进程,但这些算法存在需要耗费大量运算时间等问题,而对于要求电子地图信息迅速更新的在线导航模式,往往难以满足实际应用的需求,为此,本文提出基于非对称加密算法的在线导航应用随机参数插入加密算法,该算法具有计算量小、加密效率高、隐秘性强等优点,适用于数据更新和发布迅速的在线导航服务。
1 非对称密码算法(RSA)
非对称密码算法是目前公钥密码的国际标准,其基础是数论的欧拉定理,安全性依赖于大数的因式分解的困难性[8,9],其计算步骤为
1) 选取2个素数p和q,计算n=pq。
2) 计算φ(n)=(p-1)(q-1),式中: φ(n)为欧拉函数。
3) 随机选取整数e,满足gcd(e,φ(n))≡1,其中1
4) 求出能满足ed≡1(mod φ(n))的整数d,并且1
通过欧几里得算法的对数运算,可求出整数d,进而求取整数e。其中:e为公开值;d为非公开值。计算可得公开密钥k=(e,n)以及秘密密钥k′=(d,n)。明文m满足0≤m≤n,则其加密算法为: c=Ek(m)=me(modn);解密算法为: m=Dk(Ek(m))=cd(modn)其中加解密运算速度取决于模幂运算,安全性则取决于模n的素数分解。
2 随机参数插入算法
为避免智能手机等手持终端所安装的防火墙等网络安全工具对加密坐标信息的拦截和窜改,保证在线导航应用符合国家在电子地图应用相关规定的同时,满足在线导航实际应用中对坐标信息通信隐秘性、准确性和可靠性的需要,设计一种具有用户针对性的随机参数算法,使在线导航应用中涉及国家安全的加密坐标信息能准确传输并进行有效解密。
为了使嵌入的隐藏信息不容易被发觉,需要对待隐藏的信息进行随机化。随机后的待隐藏信息无论是在信息的内容还是信息的结构上都消除了原有的特征。攻击者就是提取出隐藏信息,也会因隐藏信息是一堆无法识别的乱码而不能确认是否存在隐藏通信,同时服务端也能够发现隐藏信息是否遭受篡改[10,11,12]。
随机参数的获取方法是,在线导航服务器和移动终端之间共享一个密钥种子S,在在线导航服务器向移动终端发送加密坐标的同时通过随机数函数R(x)生成隐藏的加密/解密密钥K,其中K=R(S)。为增加加密坐标在传输和使用过程中的安全性,解密密钥的使用必须与移动终端的注册名相关,其结果是,手持终端每次使用在线导航服务请求时,将产生不同的随机密钥种子,在使用结束后,密钥种子自动失效。
3 基于非对称加密算法(RSA)的随机参数插入算法
非对称加密算法保证了加密坐标信息的安全,而随机参数算法则满足了信息通信隐秘性、准确性和可靠性的需要,将二者优点的结合,在在线导航实际应用中可满足国家政策,并保证在线导航服务的快速、准确与可靠。
基于RSA的随机参数算法的流程见图1:
信息点的实际坐标需要进行坐标加密从而变换成可进行商业运营的加密坐标,并在进行加密变换后将加密坐标信息变换成符合RSA加密算法要求的数据格式;在手持终端请求在线导航服务时,在线导航服务器将以密文方式,发送经过RSA加密的变换坐标信息以及随机加密信息,在与用户名相关确认后,手持终端可获取加密坐标,接受在线导航服务。
4 实验及结果
以HTC One X手持终端结合在线导航服务器进行实验。需要说明的是,HTC One X是预装Android操作系统的智能手机,其硬件带有GPS模块,支持与服务器之间以GPRS方式进行通信,并在扩展内存卡上预装基础地图。在线导航服务器可向应用手持终端提供POI查询与定位、位置共享、自驾路径规划等服务内容。本文以自驾路径规划服务为例,通过对比RSA加密模式以及基于RSA的随机参数插入加密模式在加/解密时间、安全性、误码扩展性等方面进行对比,说明本文提出的算法的实验结果。
表1是RSA加密模式以及基于RSA的随机参数插入加密模式在HTC One X上选取相同起始点和终点的自驾路径规划的实验结果。其中在线导航应用RSA加密模式以及基于RSA的随机参数插入在线导航应用加密模式则是在在线导航服务器支持下进行的在线自驾路径规划服务,可支持实时路况下的导航服务。
由表1可见,2种模式都可以得到准确的解密,基于RSA的随机参数插入加密模式的加/解密时间明显地要比RSA加密模式要长,但由于RSA加密模式并没有与用户注册名进行关联,解密后坐标信息实际上可以共用于不同用户,而基于RSA的随机参数插入加密模式由于采用的服务端与应用端的共享密钥种子,仅支持唯一的注册用户使用。
表2是RSA加密模式以及基于RSA的随机参数插入加密模式在同一手持终端以及服务器上的安全性实验结果对比。
由于RSA加密模式的应用已经相当广泛,其抗穷举攻击的能力在信息技术的飞速发展下已经不断被削弱,而基于RSA的随机参数插入加密模式由于采用了与用户名相关的随机参数插入算法,使加密信息的隐秘性增强,抗穷举攻击能力得到了一定提升。
5 结束语
为保证电子地图在应用中的坐标安全问题,同时满足在线导航对实时信息的发布要求,本文提出了基于RSA的在线导航应用随机参数插入加密算法。该算法在利用经典的RSA算法对坐标信息进行加密的同时,引入与用户注册名相关的随机参数插入加密算法,手持终端每次使用在线导航服务请求时,将产生不同的随机密钥种子,增加了加密数据的隐秘性,提高了坐标的抗穷举攻击能力,在实验中得到较好的结果。本文算法效率高、保密性好、简单及具有较小的误码扩散性的特点,能满足于在线导航服务对坐标信息安全保密的实际应用需求。
参考文献
[1]刘爱龙,张东,陈涛,等.地图数据网络分发的混合加密算法[J].计算机工程,2008,34(18):186-188.
[2]刘爱龙,张东,田雁,等.地图数据网络分发中数据加密算法的研究[J].测绘科学,2007,32(4):32-35.
[3]张姗姗.矢量图形数据的网络传输加密算法研究[D].武汉:武汉大学,2005.
[4]Zheng Liangbin,You Fucheng.A fragile digital water-mark used to verify the integrity of vector map[J].Conputer Engineering and Application,2010,46(26):99-101.
[5]闵连权.矢量地图数据的加密算法[J].海洋测绘,2005,25(2):55-57.
[6]钟尚平,高庆狮.网络环境下地图的混沌加密实用算法[J].计算机辅助设计与图形学学报,2004,16(2):238-242.
[7]潘伟洲,陈振洲,李兴民.基于人工神经网络的百度地图坐标解密方法[J].计算机工程与应用,2013(3):1-4.
[8]杨德山,陆魁军.一种改进的RSA加密算法设计与实现[J].计算机应用与软件,2007,24(10):188-190.
[9]Verma A,Srivastava A.Integrated routing protocolfor opportunistic networks[J].International Journalof Advanced Computer Science and Applications,2011,2(3):85-92.
[10]Scheneier B.应用密码学协议、算法与C源程序[M].北京:机械工业出版社,2000.
[11]邹昕光,金海军,郝克成,等.基于HTTP协议多维随机参数插入通信隐藏算法[J].计算机工程与应用,2006(34):127-130.
在线考试系统自动组卷算法研究 篇3
智能组卷是网络考试系统的一个重要组成部分,而如何保证生成的试卷能最大程度地满足用户的不同要求,并具有随机性、科学性、合理性,是组卷的一个难点。
1 智能组卷
1.1 自动组卷问题分析
组卷就是按照给定的组卷策略,从题库中抽取适当的题目组成一份符合要求的试卷。为了考核学生对知识的掌握情况,每道试题主要设置如下属性 :知识点、题型、教学要求度、难度系数、区分度、估计答题时间、题分。因此,组一份n道试题的试卷就是从题库中抽取n道试题,每道试题的这些属性满足用户指定的试卷的总体要求,也就是 :各篇章所占的分数、试卷中各种题型的题数、反映不同教学层次要求的试题所占的分数比例、各种难度的试题所占的分数比例、各种区分度的试题 所占的分数比例、所有试题的估时总和、所有试题的分数总和这几个指标都应等于用户指定的要求,或者误差最小。
因此,组卷问题可被描述为一个约束的组合优化问题,该问题被定义为一个目标函数与一组约束条件的组合。
1.2 组卷问题中试卷的重要指标
1.2.1 试题的难度
难度通常就是指被试者完成题目或项目任务时所遇到的困难程度。试题库中试题的难度值在试卷中起着很重要的作用,它的确定不仅和老师的主观经验有关,还与不同能力的学生的答题情况有关。难度值的确定,可以用考生的得分率表示。
对于每一份试卷,在难度上应该满足以下要求 :
其中 :Σf(Wi) 表示Wi的题分
假设试题总分为100分
(2)根据均值公式, 试卷的平均难度值可以表示为 :
其中 :d(Wi) 为Wi的难度,K为试卷的总题数,p表示整个试卷的平均难度值。
试卷的平均难度将影响考试成绩的分布状态,当试卷的难度为0时,所有的考生都得零分 ; 当试卷的难度为1时,所有的考生都得满分。在这两种情况下,所有的分数都集中到0分或100分上,不能得到分数的合理分布。因此,试卷的难度过大或过小都会造成考试成绩偏离正态分布,而且使成绩的离散程度变小。故为了保证生成的试卷有合理的难度,试题库中各类试题的难度必须有一个合理的分布,一组试题中简单题与难题都应该占有一定的比例。
1.2.2 试题的区分度
试题的区分度是指试卷对被测试人群的区分能力。如果题目的区分度高,那么水平高的被试者在该题目上的得分就会高,而水平低的被试者得分就低,这样就可以把不同水平的被试者区分开来。
全卷区分度的数学表达式为 :
式中Qj—第j题的区分度 ;
Wj—第j题的满分值 ;
M—全卷的满分值,通常是100分。
由于试卷的区分度是指整个试卷对优劣学生的鉴别和区分的能力。所以一份区分能力较强的试卷,应是学习好的学生得高分,学习差的学生得低分。从而优劣学生的考分差距就大,即考分的标准差就大。
一般Q>0.3为好区分 度的试卷, 0.2≤Q≤0.3的试卷为良区分度试卷, Q<0.2的为差区分度试卷。
1.3 自动组卷问题数学模型的建立
根据以上对组卷约束条件的分析,可以构建组卷问题的数学模型。
组卷中决定一道试题,就要决定n项指标,这里我们考虑n维向量 ( 题型al, 知识点a2, 难度a3,区分度a4…),ai相当于第i项指标,决定一份试卷,就相当于决定一个m×n的矩阵。其中,m是试卷所含的题目数,n为试题控制指标的数目。
组卷问题求解的目标状态矩阵
S中的每一行由某一试题的控制指标组成,如知识点、题型、难度等,并且这些属性指标都进行编码表示成二进制形式, 而每一列是题库中的某一指标的全部取值。这些控制指标可大致分为以下七项 : 题型、难度、区分度、知识点、教学要求度、分数、答题时间等。
1.4 自动组卷的算法研究
自动组卷是用户根据试卷的要求,首先设置试卷的整体信息,包括考试时间、试卷整体难度,试卷整体区分度、试卷分数等。然后用户分别设置各种题型 (单选、多选、填空、判断、问答、计算)的数量、总分数,然后提交即可完成自动组卷的参数设置。系统按照用户设置的参数,利用遗传算法从试题库数据表中查找满足条件的试题,并将该试题的信息写入到试卷内容数据表中,完成试卷的自动组合。
1.4.1 染色体编码方法
题库中的待选试题数量为R,从R道试题中选出满足约束条件的试题组成试卷,可用一个长度为R的字符串表示,每一位的取值为0或1,0表示未选中某题, 1表示选中了某题,这样,每一道试题就对应一个0或1从而组成R位长字符串,成为染色体,这就形成了染色体的编码。
1.4.2 适应度函数的计算
(1)目标函数
在遗传算法中,以适应度函数的大小来区分群体中个体的优劣。一般情况下, 适应度函数是由目标函数变换而成的,其值越大,个体越好。
(2)适应度函数
本算法在实现时,将最小值问题转化为最大值问题,
1.4.3 产生初始种群
这里以随机方式产生初始种群,种群中每个个体的子染色体位串中“1”的数量固定为组卷条件中设置的对应题型的试题数量。
1.4.4 遗传算子设计
(1)选择算子
选择的目的是为了从当前群体中选出优良的个体,使它们有机会作为父代产生后代个体。判断个体优良与否的标准就是各自的适应度。显然这一操作是借用了这样一种进化原则,即个体的适应度越高,其被选择的机会就越多。
(2)交叉算子的设计
在选中用于繁殖下一代的个体中,对两个不同个体相同位置的基因进行交换, 从而产生新的个体。首先要确定交叉概率Pc,交叉概率Pc控制着交换操作的频率。一般情况下,交叉概率Pc可取0.4-0.6。简单的交叉(即单点交叉)可分两部进行 :首先对配对库中的个体进行随机配对,并按预先设定的交叉概率Pc确定交叉对,然后在确定的交叉对个体中随机地选择交叉点,个体彼此交换交叉点前后的信息。
为了保证新的后代仍旧满足约束,改进单断点交叉算子,在交叉时采用相同题型段整体交叉。设计题型段交叉时采用在1到6整数内(一共有六种题型)按均匀分布产生一个随机整数作为交换的题型段。
(3)变异算子的设计
变异概率Pm是增大种群多样性的重要因素。Pm太小,不会产生新的基因块 ;Pm太大,会使遗传算法变成随机搜索。一般变异概率Pm取0.001 - 0.01。
为了保证染色体变异后产生的新个体仍能满足约束条件,在设计变异算子时,对变异算子采用在一个题型段内一次变异两位,即 :一位从1到0,另一位是从0变1,称之为段内两位变异。
1.4.5 遗传运算终止条件的设计
本算法中,终止条件是达到规定的迭代次数或者检查适应度值没有变化或变化很小时,令计算终止。
1.5 遗传算法的改进
本算法采用精英保留策略对遗传算法进行改进。精英保留策略也称为最佳个体保留策略,是指将当前解群体中的适应度最高的个体结构完整地复制到下一代种群中。其主要优点是进化过程中某一代的最优解可不被交叉和变异操作所破坏。 遗传算法终止时得到的最后结果一定是历代出现的最高适应度的个体。在算法实现时,让适应度最高的个体直接进入到下一代中,并将其设为种群中的第一个个体,其它不足种群数量的个体通过轮盘法进行选择,直到达到原始种群的数目。这种方法既可以保证能够使优良品种的个体得到更多的繁殖机会,又可以防止少数几个优良品种由于过度繁殖而控制整个种群,使得算法陷入到局部最小。
2 结论
在线考试系统的组卷算法研究 篇4
基于网络的在线考试系统的组卷问题是整个考试系统的核心问题,要求用户根据考试要求设置相应的组卷条件,然后使用合适的组卷算法,从原来做好的试题库中抽取满足条件并且按照最优组合的方式生成一份合格的考试试卷。如何组成试卷是在特定的多约束条件下的许多目标参数的如何组合优化问题。在这当中,组卷的算法问题是基于网络的在线考试系统能否成功设计并应用的核心问题。下面介绍目前最为流行的四种组卷算法。
1 回溯试探法
回溯试探法是在考试系统随机抽取试题的时候,首先验证一下系统所选择的试题是否满足给定的条件,然后再做决定看是否抽取此试题。如果没有满足给定条件的试题,并且考试试卷又未完全生成,考试系统回溯试探,舍掉刚才所做的一部分操作,然后重新再组卷。因为只是舍掉了一小部分的操作,大大降低了无用组卷的次数。回溯试探法组卷的成功率虽然高,但这是在消耗了大量的时间的基础上的。回溯试探法是下面将要介绍的随机抽题方法的一种改良算法。
回溯试探法在随机抽题法的基础上抽取试题,如果搜索失败,就会舍掉该状态掉,重新开始下一轮的试卷组成。回溯法的工作流程如图1所示。
考试系统如果采用回溯法来抽取试题,则会造成整个程序的结构设计非常复杂,抽取的试题随机效果不明显,生成的试卷时间较长,与许多考试系统生成试卷的要求不符,但是对一些小型的考试系统效果还是比较好的。
2 随机抽题法
目前大部分的考试系统都在使用随机抽题法作为考试系统的算法。此算法是采用随机函数对题库中的满足条件的题目逐一的抽取出来,组成试卷。使用这种组卷算法实现起来比较简单,而且使用也比较广泛。此算法要求建立两个数组,一个数组用来存储试卷的状态空间,一个数组用来存储试卷题目,是空数组。第一步把试卷的某些控制参数存放到试卷状态的数组里面,如题目的难易程度、题目类型、题目分值等等。第二步由考试系统根据数组试卷的控制参数,随机抽题。第三步把抽出来的题目放到空数组里面。如此反复的抽取题目,直到试卷最终生成为止。需要注意的是,考试系统每当抽取完一道题目,需要设置抽取标识,表明该题目已经被抽取,防止下次再被抽到。以下是抽取题目的公式。
抽取试题的公式:
公式中的N表示的是试卷中的试题数,M表示的是在试题库里面符合条件的题目数,而rand则表示的是随机函数。
其实在现实的情况里,组卷要对题目的抽取有着某些特定的要求。那么怎样才能合理地使用rand随机函数,能够在相同的题库中组成适合不同要求的试卷呢?显然rand函数并不能解决所有的问题,但却能够创造出一个良好的组卷环境,在这个环境里rand函数利用计算公式和算法来组成适应不同要求的试卷。而这种环境是由两个方法来实现的,一个是修改表的结构,另一个是建立一个界面,来适应不同要求的试卷抽取条件。
现在的大多数的网络考试系统是现场抽取题目的,采用刚才介绍的算法来随机抽取,题目是不同的,当然也有的网络考试系统中的题目是提前抽取的,所有考生的题目都一样,只是题目的顺序不同而已。对于这种方式,实现起来也比简单,先用随机抽题法抽取一套试题,然后再利用随机函数从抽出来的题目里再重新抽取,这样题目的顺序就不同了。
随机抽题法适合那些比较简单的网络考试系统,对试卷的组成要求不是很高的考试系统。此算法比较容易实现,而且组卷速度快,因为它没有最优化的思想在里面。但是此算法的缺点是,随着题目一步一步的被抽取出来,它很难再界定剩下哪些区域适合再次抽题,从而进入了死循环,试卷最终无法生成。此算法抽取的题目重复率比较高,成功率也低,智能性较差。
3 启发式搜索法
此种方法是在存放试题状态空间的数组里,首先对每个搜索位置进行测评,找到一个最好的最合适的位置,然后在此位置继续进行搜索,直到找到目标为止。使用此种算法能够省去一些无用的工作量,大大提高了组卷工作效率。在这种算法里,对每个位置的测评是重中之重,用不一样的方法测评会得到不一样的效果。那么测评是如何表示出来的呢?启发式搜索法的测评用的是测评函数。f(n)=g(n)+h(n),在这里f(n)是n的测评函数,而g(n)是在状态空间数组里从初始节点到n节点的实际路径,h(n)则是从n到目的节点的最佳的测评路径。在这个函数里面,h(n)主要体现了搜索的启发的信息,在这当中g(n)是已知的。
启发式搜索法相比起回溯试探法和随机抽题法,它的成功率要比后两者高,适合需要抽取各种复杂题目的网络考试系统。但是使用启发式搜索法设计开发程序比较的复杂,花费的时间长,所以生成试卷的效率不如后两者算法好。
4 遗传算法
遗传算法是在1975年美国密歇根州大学由John H.Ho Uand教授第一次提出来的算法。此算法是模拟自然界的生物进化过程的自由随机搜索的方法,它是一种新型的优化算法。遗传算法利用比较简单的编码表示各式的复杂结构,而且用编码来表示一些遗传操作,再利用优胜劣汰的自然选择指导搜索方向。此算法是一种群体式的操作方式,把所有个体作为操作对象。它的三个主要操作运算分别是遗传、交叉、变异。进行完操作运算后下一代种群就保留了上一代的优良个体基因,体现出符合自然界规律的“自然选择、适者生存”的生存原则。
首先进行选择操作,它的作用是大大提高了种群的平均适应值,但是这个操作只是选择,并没有产生出新的个体,所以在种群中最好的适应值并没有改进。第二步交叉是把在交配池当中的个体进行随机的配对,再把配对好的个体用特定的方式来相互交互一部分的基因,此操作产生出新的个体,因此它决定了整个算法的搜索能力的强弱。第三步变异是针对个体的,把个体中的某个或者某部分基因按照特定的较小概率,进行改变,从而产生了新的个体的辅助方法。第二步交叉和第三步变异互相配合操作,从而完成了整个遗传算法的全局搜索能力。
遗传算法的主要的操作步骤如下:
A. 开始生成初始的种群;
B. 计算出种群当中个体的适应度值是多少;C.
C对种群当中的个体使用遗传操作,比如说选择、交叉、变异;
D. 当符合条件时,叠代就停止,输出结果,得到解决问题的的最优解;如果不满足条件,则继续转向步骤C,如此反复。2
遗传算法流程图,如图2所示。
在整个遗传算法当中,“生成+检测”的搜索算法运用在迭代过程里。用一些编码方案表示出空间里的一个一个的个体,并且把目标函数的值转变成适应的值。用它来评价每个个体的优劣,以此当做遗传的依据。
种群方式搜索是遗传算法采用的搜索方法。此方式能够搜索出空间里面的多个区域,所以它具有内在并行性的特点,它可以解决程序计算量比较大的问题,从而提高了效率。适者生存,还有比较简单的遗传操作让遗传算法不再受到搜索空间的限制,搜索过程不会轻易的陷入局部的最优点。因此,遗传算法组卷的效率比较高,操作起来比较简单。但是遗传算法也有两个较为明显的缺点。第一,对一些特殊情况遗传算法计算的速度比较慢。第二,比较容易产生试卷早熟的情况。正因为有这两个缺点,所以很多专家提出了一些改良方案。比如编码改进方案、交叉算子或者变异算子的自适应改进等等。
5 结束语
在线算法 篇5
随着电力系统电网结构的日益庞大与复杂,电网安全稳定分析存在一定的困难,调度员们迫切需要一种能分析系统稳态特性、分析系统动态特性、判断当前系统的状态、给出近期操作指导的辅助工具。由于计算机性能、网络和通讯技术的迅猛发展,在电力工程领域建构大规模的计算机群进行高速运算、获取广泛区域的测量数据成为可能,从而为在电力系统应用和推广在线稳定监测预警系统(Online Dynamic Security Assessment System,DSA)[1]提供了条件。
电力系统在线稳定监测预警系统是一个基于当前电力系统运行状态、对系统安全稳定性进行全面分析和评估、对潜在威胁向调度人员提供预警和指导的分析系统。在线稳定监测能对当前时间断面进行各种静态、动态稳定的监测,提醒运行人员各种可能的安全威胁,给出基于当前运行状态的操作指导,在线传输极限分析便是其中重要的方面。
1 传输极限
电力系统的传输极限(TotalTransferCapability,TTC)指在保持电网稳定运行的前提下联络线上所能承担的最大功率,是决定可用传输能力(AvailableTransferCapability,ATC)的基础[2],是调度员进行调度决策的重要依据。
长期以来,计算电力系统的极限被认为是电网设计或运行计划阶段的工作,属于离线研究范畴。分析人员采用重点考察的方式,保留所研究的联络线等设备,对系统其它部分进行简化等值,并用暂态稳定计算校核[3],以求出研究对象的近似暂稳极限。事实上,离线研究不可能研究在线运行可能出现的所有情况,只能采用比较保守的算法,用离线计算出来的极限值指导运行可能降低设备的使用效率。随着现代互联电力系统的发展和系统规模日益庞大,由于经济性的驱动和其它社会因素的影响,迫使系统经常接近极限运行。如何引导调度员正确操作,使电网始终处于各种稳定约束之内成为在线稳定监测预警系统(OnlineMAPS)及其它安全评估系统[4,5]急须解决的问题。
分析静态电压稳定的连续性潮流方法(ContinuationPowerFlowmethod,CPF)出现后,有学者用它计算系统在静态电压稳定约束下的传输极限[6,7],通常都是用发电机功率虚拟增长的方式进行,即给定某种负荷的增长方式,增加系统中现有的发电机出力,得到系统在更高负荷量下的运行点。传统的连续性潮流算法有如下特点[8,9]:a.系统中至少有1台机组功率不设限,以承担无法预计的网络损耗增长量;b.只要系统中任一点电压到达电压崩溃临界值,系统即到达功率极限,发电机出力和负荷功率自动减小,进入潮流的低电压解部分。有的学者在每得到连续潮流一个新的运行点后即进行暂稳校核和小干扰稳定校核,得到系统的综合稳定极限[10],这在离线研究的情况下有一定的合理性。
现有的在线分析软件沿袭了离线分析的方法,一般基于多个模块:专用于分析暂态稳定的TSAT,分析电压稳定的VSAT,分析小干扰稳定的SSAT。各分析模块独立工作,分别求出满足该种失稳方式下的稳定极限,系统的稳定极限被认为是各分析模块所得结果的交集[4,11]。
从协助调度员操作的角度看,现有的稳定裕度计算方法,存在如下缺点:
a.分析采用的运行方式是虚拟的。需将考察元件外的系统进行简化等值,或者使系统出现越过功率极限的机组。用该分析结果指导运行,必须乘以较大的可靠系数,作为调度员参考的可操作性差。
b.分析方法是孤立的。将多条联络线分别考察,或者用不同的方式分别计算极限。前者没有顾及到各条联络线极限之间的相互制约,后者可能使计算结果过于保守。
2 在线稳定监测预警系统
中国电力科学研究院建构电网在线稳定监测预警系统总体结构如图1所示。
电网能量管理系统(EMS)和广域相角量测系统(WAMS)的在线数据(电压、电流、功率、相角、开关位置、变压器分接头档位等)与离线数据(元件模型、参数等)相结合,形成完整的描述电网运行状态的信息,经在线分析及预决策系统内部总线和支持平台,提供给顶层应用模块使用。图模一体化支持环境用于实现人机交互、计算设置等功能。历史数据库存储近期历史数据和有价值的长期统计数据。
在安全评估模块中,集成了电力系统分析综合程序PSASP中主要的稳定分析功能,同时进行N-1静态分析,用暂态稳定评估、静态电压稳定评估和小干扰稳定评估来获取系统的全局安全稳定性。在发现系统稳定水平不足时,对不同的稳定问题,及时启动相应的辅助决策支持模块,为调度员提供运行方式调整的决策支持,包含如下内容:
a.系统的稳定性(稳定或不稳定)。
b.系统的稳定程度或不稳定程度(稳定裕度)。
c.稳定裕度对主要变量的灵敏度分析。
d.预防/紧急控制措施。
传输极限模块利用在线稳定监测系统强大的计算能力、稳定的底层平台、丰富的在线和离线数据,为调度人员提供操作指导的联络线传输极限。
3 基于DSA系统的在线传输极限计算算法
一般情况下调度员对其管辖设备的理论极限兴趣不大,主要关注当前运行条件下电网设备能承担的功率,应该采取什么操作,确保系统工作在极限范围内。对大型电力系统而言,进行适当的失稳后调整是必要的,局部发生失稳并不意味着达到了全系统的稳定极限,将该失稳情况处理后,能获得全系统负荷更高的运行点。例如,研究国家电网的传输极限而发现负荷增长到某个水平时,西北网出现电压失稳,若以此为依据,认为整个国家电网已达到运行极限则是明显错误的。事实上,适当减少西北网电压崩溃点的负荷,使其维持在临界状态以上,东北、华东等区域的负荷可能还有很大的增长空间。当全网负荷达到最大时,对应各联络线的功率就是该联络线的传输极限。尽管从单条联络线或单个输送断面看,将网内负荷和发电重新分配,可能获得更高的传输极限,但整个系统的可用率没有全网负荷最大值高。基于此,开发了在线传输极限的算法,其核心思想:同时获取系统总所有联络线的传输极限,指导调度人员获得该极限。
该算法的主要计算过程如下:
a.利用历史数据信息进行负荷预测,建构当前运行状态、最有可能出现的潮流增长方式。
b.在获得的每一潮流运行点进行暂态稳定、电压稳定、小干扰稳定、静态安全稳定和频率稳定校核。
c.当发生失稳故障时,寻找与其最相关的设备,通常考虑发电机、负荷和联络线等常用操作对象,并对其进行调整,调节方式为减小和限制该元件的出力。
d.系统恢复稳定后,继续增长其它区域或元件的功率。
e.当系统中无可增加功率的机组、负荷或联络线,即认为已达到系统稳定极限。
由上述可知,获得尽可能真实且总功率高的潮流调整方案在整个算法中处于核心地位。
该算法能实现以下2种重要功能:
a.中长期极限计算。系统的运行方式和检修计划无重大变化时,极限值无需重新计算,启动间隔可能比较长,对应的计算时间也允许长些。在这种应用中,发电机组处于运行或备用,负荷超过限值后的过度增长对最终结果都没有影响。只要机组可用,在计算过程中会根据需要决定其是否投入运行,增长过快的负荷在调整中会被限制住。
b.短期运行指导。由于该算法每一步中间结果都可输出只要计算速度快于电网中负荷的实际增长速度,就可以为调度员下一步的操作提供依据。
4 潮流增长方案
由于潮流方程在接近电压稳定极限点时雅可比矩阵奇异、连续潮流方法(CPF)成为获得尽可能高的极限功率的有力工具[12]。该算法潮流调整方式采用改进后、考虑电压静态稳定、连续型潮流方法,即运行点远离临界点时采用正常潮流算法;接近临界点时采用连续潮流算法以渡过雅可比阵的奇异点;调整功率采用正常潮流算法。
4.1 数据准备
a.建构详细的离线和在线数据库。
b.形成计算用数据。包括3部分:SCADA采集并处理后的在线运行数据、设备备用或检修信息、由离线数据库中提取的动态设备数据及备用设备数据。
c.根据给定的开机次序或调度规则形成各区域的开机次序表(含旋转备用)。
d.根据预测形成电网的负荷增长方式。
4.2 潮流计算
a.由负荷增长方式和开机方式进行区域功率增长平衡计算。依次对每个负荷区域统计单位步长本区域的负荷增长量,然后采用宽度优先搜索,找到所有能送电给本负荷区域的发电区域,确定满足本负荷区域的功率增长、该发电区域单位步长必须增加的出力。最终根据开机次序表决定应该开出的机组及出力增加的速率。
b.采用分布式潮流算法[13],由所有出力增加的机组共同承担系统损耗的增加部分,真实模拟系统的运行状态,避免出现理想机组。
在功率增长过程中,全系统有功功率平衡方程
式中,第一部分代表发电功率的增长,Ng为全系统发电机台数;Pgi为第i台发电机的额定出力;λ为负荷、发电协同增长因子;βi为第i台发电机承担有功负荷增长的参与因子,当第i台发电机功率不能增加时,该值为0;Kg为全系统机组承担系统损耗增加的公共因子;γi为第i台发电机承担系统损耗增加的参与因子。
式(1)第二部分代表有功负荷的增长,Np为全系统负荷数,pli为第i个负荷初始有功值,即在当前运行状态下的值;αi为第i个负荷的增长系数。在区域功率增长平衡计算中保证如下关系式成立
若上一时步计算中系统达到有功平衡,则有
式(3)第二部分为全网有功损耗增量,第一部分为发电机为承担该损耗增量而增加的出力。
系统中各节点有功方程
式中,fi(x)为各节点网络方程的实部;x为电压V和相角θ。
系统各节点的无功方程按节点性质,除考虑PQ节点无功增量及外,其它与普通潮流算法相同。
如果为分布式正常潮流,则迭代过程中λ为定值,只多出一个变量Kg,需补充一个方程。本算法中指定1台能调节有功的机组作为相角参考,设为j号机,则新增方程
若进行分布式连续潮流算法,则按连续潮流算法增加与相应的补充方程。
其它问题的处理均和连续潮流算法[8,9]相同。
4.3 潮流计算中的调整
a.进行常规的变压器分接头调整,以及投切电容器和发电机无功限制等电压调整。
b.发电机有功达到极限后,将其出力固定在限值并新开机组。此时,到达有功极限的发电机节点有功方程
即使所有发电机节点有功均为固定值,也可通过变量使系统方程获得平衡。
c.发电机电压自调整功能。系统中发电机的机端电压并不是一成不变的,各厂运行人员发现本厂机组带的无功太多,一般会减小励磁给定,避免转子过热;若发现承担的无功过少,通常会增加励磁给定,确保有功能顺利送出。在计算中,就是在PV和SLACK机中利用各机组的无功承担量改变电压给定。
4.4 稳定判断
出现电压失稳后,停止引起电压崩溃的节点负荷功率增长。为搜索最近的平衡点,略微减轻该节点对后继负荷增长的限制,先将该点负荷增长方向变为负值切除部分负荷被调节点的有功功率方程变为
搜索到最近的平衡点后,将被调节点的负荷增长系数设为0。
该算法以电压下降最大的部分节点作为调节对象。如果该点为负荷,就直接调节;若为联络线端节点,则降低通过联络线的功率,将联络线受端区域的负荷作为调节对象。若该节点不属于上述类型,则继续搜寻下一个调解对象。被调节节点的功率方程发生变化后,均进行区域功率平衡计算。当系统中再无可增加功率的发电机、负荷或联络线,即认为系统已达到极限。此时各联络线上的功率即为该联络线的极限值。
5 算例
采用该算法对黑龙江省网采用的东北电网2007年某运行数据进行只考虑电压稳定性的稳定裕度(即潮流调整)计算。该网总共有249台机,其中149台运行,100台备用。采用该算法从其备用机组(含备用容量超过50MW的旋转备用机组)中开出86台机,负荷采用均匀增长方式。图2为对全网发电和负荷的综合统计。
负荷有功功率(PLOAD)初始值为29.171 2GW,不采用电压失稳后调节措施时,功率增长第14步出现第一个电压失稳临界点`FIRSTCRITIC',此时全网总有功负荷为42.1735GW,有功负荷裕度为13.0023MW。调整后,在22步、25-32步、35-37步均出现电压失稳临界点。到38步,可调手段用尽,仍不能继续增加负荷功率,即认为系统中各潮流断面传输容量均达到极限。故第37步为最后一个电压失稳临界点`LASTCRITIC',此时全网有功负荷为43.982 4 GW,有功负荷裕度达到14.811 2GW。
全网无功损耗(QLOSS)和无功发电(QGEN.)在第1步和15步均出现明显减少。因为在第1步进行发电机端电压调整,使无功负荷更多的就地平衡,减少远距离传输,因而总无功损耗大减。第15步,为寻找最近的平衡点,切除了电压崩溃点的部分负荷,使系统无功损耗明显减少,有功负荷(PLOAD)和无功负荷(QLOAD)继续增长。
选取黑龙江东部联络线断面潮流(cut1)和吉黑东部联络线断面潮流(cut2)如图3所示。
第一次达到电压失稳临界点时,断面1的有功为4.309 2GW、无功为0.357 1GW,断面2的有功为4.414 3GW、无功为0.482 1GW。到达最后一次电压失稳临界点时,断面1的有功为4.418 0GW、无功为0.418 3GW,断面2的有功为4.529 7GW、无功为0.557 5GW,略有增加。由此可见,越过电压极限后,全网负荷的增加通常以限制甚至减少联络线功率的传输为代价。
将断面1送端电压监测点黑方正500kV母线(V1)和断面2送端电压监测点黑牡二220kV母线(V2)电压变化曲线绘于图4,当第一次接近电压崩溃极限点时,电压急剧下降,经切除部分负荷后,电压回升,才能继续增加负荷。此后又经历数次波动,最终到达全系统极限。在负荷增长起始处,由于发电机电压的调整,监测点电压略有上升。这与系统实际运行中由于负荷增加,各机组增大励磁的做法一致。
由算例结果可知,利用该文构建的潮流调整方案,能获得在所给负荷增长方向上尽可能高的潮流值,为最终确定各联络线的传输极限提供方便。
6 结论
该算法利用在线稳定监测预警系统强大的资源优势,建构出当前运行状况最合理的传输极限,其优越性在于:
a.未做简化等值或采用理想机组假设,可直接用于指导运行。
b.可同时确定多个联络断面的极限。
c.在失稳后进行调整计算,以获得全系统更高的传输极限。
d.用简单的方式搜索电压失稳后系统稳定运行点。
可以预见,利用大规模并行计算平台,在算法中加上暂态及其它形式失稳的校核与调整,该传输极限算法必将成为大型电网调度员的有力助手。
摘要:电力系统的传输极限是大电网调度人员进行决策的重要依据之一。由于计算能力的限制,以前电力系统的传输极限是通过对单个联络线进行研究,然后把它应用到电网中,这将难免会出现大量错误的结论。然而随着IT业的发展使得建立大型计算平台并从平台上获得大量电网数据成为可能。在线稳定监测预警系统的目的是实现对电网进行在线分析与评估并向调度人员提供指导的系统。在线稳定监测预警系统有很强的实用性并能给调度人员提供指导,通过它可以用一种新方法来计算电网中所有联络线的传输极限。
在线算法 篇6
疾病诊断在计算机应用中,主要以概率作为判别分析方法,依据病人的症状、各种疾病的特点、地域差别等信息作为判别依据,最后给出诊断结果。但是要确定上述信息与疾病之间的关系需要日积月累大量的病例结果分析作为保障。病例结果的收集越多,对得出诊断的准确性也越高。
在判别分析方法中,我们可以用概率统计中的贝叶斯(Bayes)算法,其准确性要比普通算法都要高。贝叶斯算法的实用性比较高,所以应用比较广泛。
贝叶斯算法是统计模型决策中的一个基本方法,其基本思想是:(1)已知类条件概率密度参数表达式和先验概率;(2)利用贝叶斯公式转换成后验概率;(3)根据后验概率大小进行决策分类。
贝叶斯公式:设B1,B2,……,Bn为样本空间S的一个划分,如果以P(Bi)表示事件Bi发生的概率,且P(Bi)>0(i=1,2,…,n)。对于任一事件Bi,P(Bi)>0,则有:
所以,把贝叶斯算法用在疾病诊断中,对n种症状对应m种疾病,则第i种疾病出现第j种症状的概率为P(Aj,Bi),同时第i种疾病的发病率为P(Bi),i∈[1,2,…,n],j∈[1,2,…,m]。根据这些收集的条件用上述公式化简就可以求出在病人出现n种症状时疾病Dj的发病率P(Bi/A)了。
2 基于贝叶斯算法的诊断系统在手机网络上的实现
2.1 数据库的建立
建立症状信息表(Symptom Information)、诊断表(Diagnosis)和发病率表(Disease)和结果(Result)4张表,库结构如图1所示。
用户选择包括症状Symptoms、年龄Age、性别Gender、地区Region在内的信息。知识库D1表中Rate1表示了某种疾病在某个地区的发病率(上文中的P(Bi))。知识库D2表储存了在不同地区某种疾病所产生的症状表象的可能性Rate2(上文中的P(Aj,Bi))。
诊断结果表Result(Name,Rate)表用来储存和表示通过患者输入的信息所得出的疾病名称及该诊断结果的正确性Rate3。
2.2 贝叶斯算法应用探索
通过输入或者选择症状、地区等信息,再通过经过累积收集搭建的疾病知识库得出发病率的P(Aj,Bi)和P(Bi)计算得出P(Bi/A),即患者在输入自己所患症状后得出自己可能患的疾病。
上文中所提到的对发病率P(Aj,Bi)和P(Bi)的数据收集,也就是对D1表和D2表的建立是一项长期而艰巨的任务。对数据收集的样本越多,所得的数据越精确。
在运用贝叶斯定理进行疾病诊断时要注意的是:一是必须有准确的数据,科学地编测疾病诊断预测表P(Aj,Bi);二是要准确预测某一种疾病的发病概率P(Bi)并且与相关的资料进行比较,使其更准确、更合理。
2.3 贝叶斯算法的设计实现
对于实现疾病智能诊断的贝叶斯算法,其设计采用了.net平台与Access数据库相结合。在该平台上使用了由模型层(Model)、数据访问层(DAL)以及业务逻辑层(BLL)构成简单的三层架构来实现了算法和整个网站的搭建。
在模型层中对上文中所述的4张表分别建立类SymptomInformation、类Disease、类Diagnosis和类Result来获取各个字段的值。如对于类Symptom Information中的Symptoms字段有:public class Symptom Information
public string Symptoms//用户选择症状Symptoms并把症状信息返回供其它层调用;
通过类Symptom Information中各函数返回的字段值。第二步,在DAL层中通过对症状的描述来获取在误差范围内的概率Rate2(贝叶斯算法中的P(Aj,Bi))所对应的疾病名字(Name)。其部分设计代码如下所示:
其中rate为误差范围,而表Diagnosis是科学地编测的疾病诊断预测表。这样就获得了可能对应的M种疾病名字(Name)。
然后根据根据累积收集搭建的疾病诊断知识库,即发病率表(Disease),通过M种疾病的名称和用户的地域信息(Region),可以知道这M种疾病在用户地区发病的可能性Rate1,即贝叶斯算法中的P(Bi)。
到这一步,贝叶斯算法中的P(Bi)和P(Aj,Bi)都已求出。最后,在业务逻辑层中方法Get Result(Rate)通过数据库中表与表之间的连接从知识库D1和D2中得到Rate1和Rate2的值P(Bi)和P(Aj,Bi),然后调用贝叶斯公式得到值最大的P(Bi/A),而最大的P(Bi/A)在表Result中对应的Name即为诊断结果。其中Bi为确定的某种疾病(Name),A为患者症状(Symptoms)。对于每一种可能患的疾病(Name)可以通过函数方法Get Result(Rate)来得到发生概率,其具体设计如下:
//根据用户输入信息及知识库的数据求各种可能患病的概率,根据最大值确定患者所得疾病
当Rate值最大时诊断出用户患的病(Name)。
2.4 WAP站点的搭建
WAP(Wireless Application Protocol)把因特网扩展到了无线环境,由WAP客户端、无线网、WAP网关、IP网络和Web服务器组成。WAP客户端和WAP网关间通过无线网,使用WML(无线标记语言)来传输数据WAP网关在WML数据和HTML数据之间进行转换,在有线网和无线网之间传递数据并和Web服务器通信。
利用Visual Stdio 2005构建基于ASP.NET的WAP站点,通过贝叶斯算法在各张数据表间建立起关系。当用户输入或者选定某个症状后通过访问数据库来寻找与用户输入的信息相匹配的数据,如图3所示。
另外,不得不考虑的是,无论是WAP还是Web网站,都会不定期的遭受到类似于黑客的非法攻击。所以一个WAP站点的安全稳定与否决定了这个网站的好坏。在设计该网站时主要从规范用户输入信息、Form(窗体)身份验证技术以及网站防刷等3方面入手。
3 结束语
基于贝叶斯算法的手机在线中医疾病诊断系统将中医诊断与手机网络相融合,是3G时代中医现代化模式的一种新的尝试,系统经相关中医领域的专家的论证及普通用户的试用,效果基本令人满意。
参考文献
[1]郭兴峰,陈建伟.ASP.NET动态网站开发基础教程(C#)篇[M].北京:清华大学出版社,2006.
[2]王珊,萨师煊.数据库系统概论(第4版)[M].北京:高等教育出版社,2006.
[3]胡碧松,冯丹.基于贝叶斯算法的移动式疾病智能诊断系统[J].计算机应用,2008(6).
[4]严蔚敏,吴伟民.数据结构(C语言版)[M].北京:清华大学出版社,2007.
[5]姜楠,王健.移动网络安全技术与应用[M].北京:电子工业出版社,2004.
在线算法 篇7
电压稳定是电力系统稳定的一个重要方面,它由负荷和系统两部分决定[1,2,3]。随着PMU在电力系统中的广泛应用,通过对部分重要节点的电压和电流向量的测量,根据系统实时运行状态,对系统戴维南等值参数进行跟踪,成为判断电压稳定的一种重要方法[4,5,6]。目前,戴维南等值参数估计方法大多采用最小二乘法、曲线拟合法以及一些智能算法[7,8,9,10,11],然而最小二乘法和曲线拟合法都可能存在参数漂移,而智能算法计算时间较长,很难满足在线实时估计,常用于离线估计。电网在运行过程中,其网络的拓扑结构、发电机以及负荷的模型都不断发生变化,戴维南等值参数也将随时间发生变化。文献[12]提出对戴维南等值参数进行实时跟踪;文献[13]提出了数据采集的误差对等值参数的影响,并使用相关性检验对数据进行处理;文献[14]指出了参数0/0模型的漂移问题。以上文献从不同的方面对现有的方法进行了改进,但有些方法在速度和精度上仍不能满足在线辩识要求。文献[4]则提出了戴维南等值参数跟踪算法,该算法利用因子K*在前一次等值的基础上进行修正,从而解决了参数漂移的问题。
本文在文献[4]的基础上,针对戴维南等值参数的在线跟踪提出了一种基于偏差量修正的迭代算法,并用一致性检验对初值进行选择。文献[4]提出使用因子K*进行变量的修正,指出K*越大,收敛速度越快,而波动也越大,然后凭经验给出K*在0.01%~0.1%之间。然而算法中将戴维南等值的电阻R忽略,在高压输电网中,输电线路的电阻相对于电抗较小,可以忽略。但对从某一负荷节点往系统看进去的戴维南等值阻抗而言,其电阻是否一定还存在可以忽略的条件,值得慎重。因为戴维南等值阻抗除了包含各种输电线路、变压器、电抗器、电容器等元件参数的影响外,还受到系统中其他负荷及各种受控电源的影响,负荷的等值电阻不可忽略。戴维南等值阻抗中同时包含了电阻较小和电阻不可忽略的成分,是两方面综合作用的结果。实际分析发现,许多情况,戴维南等值阻抗的电阻成分不一定很小,有时数值较大,甚至还有出现等值负电阻的现象。
本文首先推导出所估计参数的表达式以及参数的修正量,并根据实时变化的数据判断修正量的变化方向,进而对参数进行迭代修正,得出实时估计的参数值。文献[4]由于忽略电阻,使整个估计和修正都是标量运算,本文为了更加精确估计等值参数,仍对戴维南等值电阻估计,这样使得整个估计都在向量空间进行。另外,文献[4]将变量的初值定为最大值和最小值的平均值,但根据Emax=Vlcosθcosβ,若β初始值较大,Emax也会很大,这样便会影响到收敛速度。本文只需对初值进行一次选择,而不需对所有的采样点进行校验,节省了采样数据处理时间。因此,迭代法只需一个工频周期的采样值就能达到较好的跟踪效果,具有很好的实时价值。
1 戴维南等值参数估计的数学描述
戴维南等值电路如图1所示。由图1可得,倘若通过PMU装置,便可得到一系列实时的,然而该方程有两个未知变量,如果在戴维南等值参数不变的情况下,只需两组数据就可估计出的等值。当然,也可采用最小二乘法利用多组数据对其进行估计,但要想保持戴维南等值参数不变却很困难,尤其是在扰动的情况下,戴维南的等值参数是实时变化的。
戴维南等值向量图如图2所示。以电流向量的方向为参考方向,将图2中的向量写成代数形式如式(1):
式(1)中,如果Eth的向量值估计出来,便可得到R和X的估计值。
由文献[4]和附录的推导可以得到式(2);式(2)由于以电流向量作为参考,则电流的向量形式可以表示为标量形式,得到式(3)。
从附录推导可知:(1)等值阻抗中,阻抗估计值偏差的相角和等值电势偏差的相角相同。(2)另外,由于PMU的采样速度很快,因此算法中假设第i次和第i-1次采样之间,戴维南的等值参数保持不变。在此情况下,当负荷阻抗的幅值Zl和估计出的戴维南等值阻抗Zth有相同的变化方向,那么等值电势幅值有减小的趋势,否则会增加。
2 戴维南参数估计的算法分析
由式(1)可知,方程中有四个未知量需要估计。在估计出Ei-1th和βi-1th、Ri-1th和Xi-1th后,若本次采样值为Vil和Iil,则定义*Rith和*Xith分别为本次的Vil和Iil以及上次的估计值Ei-1th和βi-1th通过式(2)计算出的预测值,而以阻抗预测值*Zith与上次估计值Zi-1th之间的偏差量,来预测Eith和βith的变化方向。定义三个变量:
改进算法的流程如下:
1)首先估计出E0th和β0th的初始估计值。
2)通过式(1),计算出R0th和X0th。
3)利用本次的采样值Vil和Iil以及上次的估计值Ei-1th和βi-1th,计算出等值阻抗的预测值*Rith和*Xith,并根据式(5)和式(6),计算出φ和B。
4)判断等值电势变化的方向。
如果Zil>Zi-1l,即负荷阻抗增加,那么
如果B>0,则;
如果B≤0,则。
如果Zil
如果B>0,则;
如果B≤0,则。
如果Zil=Zi-1l,即负荷阻抗增加,那么。
5)由求得的偏差量和式(7)计算出Eith和βith。
6)由式(1)计算出Rith和Xith的估计值。
7)进行下一次的数据采集,i=i+1,返回到3)。
可以看出,这种迭代法一旦开始,就可以随着PMU实时采集的数据不断进行下去,从而对戴维南参数进行跟踪估计。
其中一个问题是ε∠φ中的ε的选择,文献[4]中指出,比例因子K*在0.01%~0.1%之间,效果很明显,本文通过大量实验仿真,发现ε与K*的选择具有相似的特点,ε过大会造成等值数据波动太大,过小不能达到快速跟踪的效果,而选择ε在0.005%~0.05%之间的效果很好。
另一个重要的问题是E0th和β0th初始值选择。由式(1)可知,任意两组数据便可确定Eth和βth的初始值。然而为了避免两组数据比较接近,从而产生0/0的漂移,本文采用一致性检验方法对其进行选择,首先选用具有代表性的一组U和I。由式(1)可以得到
由于一般情况下Rth≪Xth,并且|Zl|>|Zth|,当|Zl|=|Zth|时,达到电压崩溃点。因此可得到:Zth=0时,即时,得到βmaxth =θl;|Xth|=|Zl|时,有。此时通过式(1)计算出R0th和X0th,如果计算值满足 R0th≪X0th ,那么认为是可靠的,可以继续进行实时计算。否则重新选择初始运行点。
3 算例分析
本文对IEEE14节点系统的5号母线进行仿真,并设该母线装有PMU装置进行实时检测。仿真时,系统以各节点的有功功率同比例增加的方式,得到一组连续潮流的采样值,将其作为PMU实时采样的数据,设采样的周期为工频周期。仿真中均采用标幺值,并假定采样的数据中没有噪声。得到仿真结果如图3和图4所示。
仿真采用100组数据,采样周期为0.02 s,得到随时间不断变化的戴维南等值参数,取其中具有代表性的14组进行分析,结果如表1所示。
由图3可以看出,随着有功功率的增加,负荷阻抗和戴维南等值阻抗将逐渐接近,当二者相等时,线路的传输功率达到最大,达到电压崩溃点,所得结果均与文献[7]中仿真结果一致。此外,从表1中还可看出,该算法可以利用一个工频周期的采样值对戴维南等值参数实时更新,在采样时间为1.5 s附近,此时传输功率达到最大,这与连续潮流的分析结果一致[15]。
另外,考虑在系统扰动的情况下,也必须保证戴维南等值参数能够实时跟踪,并且在系统恢复稳定后,等值参数也必须恢复稳定。采用EPRI7节点系统某母线进行仿真,取2 000个数据点仿真,假设系统在第100个点处发生大扰动,仿真结果如图5和图6所示。
从仿真的结果可以发现,本文的改进算法能够很好地跟踪戴维南等值参数,并且在扰动情况下,也能保证实时跟踪并且快速到达稳定。另外,也能看出,选择ε在0.005%~0.05%之间时,因子ε的不同值,等值的阻抗基本相同,而等值电势略有不同,但是误差很小,能够满足等值的精度要求,因此ε在此范围内选择具有一定的合理性。
4 结论
基于已解决参数漂移问题的戴维南等值参数跟踪方法,本文提出了采用偏差量对变量进行修正,在修正时对方向进行判断,使得参数估计误差减小,进而能够快速有效地跟踪估计戴维南等值参数。尤其在扰动情况下,也能使估计值快速稳定,另外迭代法只需一个工频周期的采样值就能达到很好的跟踪效果,具有很好的实时性。本文所提出的改进算法有望在实际工程中得到应用。
附录:
根据文献[4],将所有的标量式转换成向量的形式,首先重新定义符号,表示参数估计的误差。并假设PMU采集数据的电压和电流没有误差,则有式(1)~(4)成立。
假设在两次采样时,负荷阻抗不变化,那么无法得知测量的误差,此时等值的参数保持不变,无需对等值参数修正,所以误差量也不必得到。如果负荷阻抗变化但此时保持等值的电动势的测量误差保持不变,那么可以得到阻抗的变化所造成阻抗误差的偏差量,从而根据偏差量进行修正,则有:
从式(8)可以看出,如果以电流向量作为参考方向,那么的角度与的角度是一样的,从而得到结论:(1)阻抗估计值偏差的相角和等值电势偏差的相角相同。另外,由于PMU的采样速度很快,因此算法中假设第i次和第i-1次采样之间,戴维南的等值参数保持不变。在此情况下,由式(7)可以看出,当负荷阻抗的幅值Zl增加时,为负值,如果增加,即变化方向为正方向,如图1所示,但是此时为负值,那么第i时刻的电势的变化为负方向,即会有向E1变化的趋势,也即电势幅值有下降的趋势;如果减小,那么变化方向为正方向,但是此时为负值,那么第i时刻的电势的变化为正方向,即会有向E2变化的趋势,也即电势幅值有上升的趋势。同理,当负荷减小也同样可以推出。(2)总之,当负荷阻抗的幅值Zl和估计出的戴维南等值阻抗Zth有相同的变化方向,那么等值电势幅值有减小的趋势,否则会增加。
结论(2)表明了算法中对等值参数修正的方向,当式(7)中产生误差,则可根据图1所设的正方向,得到等值电势修正的方向。
摘要:针对戴维南等值参数的在线跟踪提出了一种基于偏差量修正的迭代算法,并用一致性检验对初值进行选择。推导了估计参数的表达式及参数的修正量,根据实时变化的数据判断修正量的变化方向,并对参数进行迭代修正得出实时估计的参数值。同时计及了戴维南等值电阻的估计,使整个估计都在向量空间进行。算例结果表明,该方法能够快速有效地跟踪估计戴维南等值参数,并只需一个工频周期的采样值就能达到跟踪的效果。