自适应学习(共12篇)
自适应学习 篇1
互联网给学习者提供许多课程, 为学习者创造了可以自行控制的学习环境。但是, 有些课程虽然给出单元数、学时数、学习目标, 却缺乏适当的导航系统, 比如, 没有建立帮助学习者了解学习本课程应具备的知识水平、自己的知识层次、学习进度和学习方法的系统;课程的组织是线性的, 不是层次状或网状的, 也不支持学习单元之间的查询、检索, 学习单元间切换只能靠前进、后退或从头开始实现, 不便跳跃性学习;不能记录学习者的学习路径、学习心得, 一旦中断学习进程, 学习者只能靠记忆确定自己的学习位置, 或重新从头开始进入;没有便捷的检索方式帮助学习者使用网上课程资料;缺少课程学习的帮助系统, 学习者只能按自己的上网知识来进行操作。使一些学习者无所适从, 降低学习效率, 影响学习信心。这就严重影响了网络课程学习系统的使用与推广, 因此导航系统十分重要。
应该指出, 网络上许多课程已经注意了学习导航, 但是, 大量的学习导航还处于静态水平上, 未实现动态的个性化的服务。存在主要的问题有:
(1) 不能灵活建构学习内容和学习过程。现有各种导航组织是固定的、线性的, 很难做到学习个性化和学习模式的多样化;
(2) 缺乏足够智能性, 一般的课件导航只是方便用户浏览内容, 很少具有用户行为分析、知识联想、学习推荐等智能导航策略;
(3) 缺乏个性化服务, 大部分的课件在不同的用户面前呈现的内容是一样的, 都是按课程本身的组织方式呈现, 没有根据不同用户的学习状况和爱好展示不同的学习内容, 也没有区别个体提供不同的服务;
针对以上问题, 本文认为导航系统建设需要考虑:个性化学习内容的结构应超越传统的目录结构, 能够根据领域知识结构和学生的认知结构来灵活建构;有效的智能导航策略不仅提供学习单元状态提示与内容漫游功能, 还具有用户行为分析、知识联想、学习推荐等多种功能;系统能为每一个用户达到的学习目标设计一定的任务和实施环境并给出相应的测试与评价。
只有达到了这些要求, 学习系统才能真正担负起"教"与"学"的双重功能, 为用户通过电子课件学习提供一个良好的环境。
一、系统设计目标分析
自适应网络课程学习系统主要提供了网上学习的平台, 其主要功能如下:
1、通过用户注册初步了解用户基本信息, 同时初始化用户学习状态与用户学习记录。
2、进入系统, 系统通过用户记录展现了用户的学习级别及与该级别相匹配的难度的知识点, 从而实现了用户进行网上学习的个性化与自适应性特征, 同时通过教学大纲导航, 用户可以进行学习, 并可通过在线测试了解对知识点的掌握程度。
3、通过测试结果改变用户的学习状态与学习记录, 对用户的状态进行管理。当用户再次登录时, 系统会自动进行更新, 实现用户学习的个性化。
4、通过知识点链接导航使用户在页面之间轻松跳转, 不至于在浏览过程中迷失方向, 从而提高学习效率, 促进学习进度。
5、在用户进行某一知识点的学习时, 有相应的知识点分类导航对用户进行指导。这些知识点和用户所学知识具有相同的关键字, 它们之间可能存在某些关联与联系。这样便于用户对此类知识的查找, 同时也会扩大用户的知识面。
6、通过知识点搜索导航, 用户可以直接进行所要学习知识点的查找。对所要查找的知识点了解较少时可以模糊查找, 而了解较多则可精确查找。
二、用户模型的介绍
用户模型可以记录所有不同用户的特征以及不同学习行为信息。设计用户模型的目的是为了给用户提供自适应的个性化服务。本系统用户模型的特点是模型分为动态和静态两部分, 两部分相互作用共同完成建构个性化的学习内容和动态导航的任务。用户模型可分为以下四部分, 用户模型下级分为三个组成部分个人信息、互动信息和学习记录。
三、系统导航功能模块介绍
在系统分析的基础上, 结合用户的学习特征和学习状态, 得出本系统的功能模块结构图, 此模块共分为三层结构, 各结构之间紧密相连, 共同建构了自适应网络课程学习导航系统。具体功能模块如图1。
四、系统详细设计与实现
4.1 系统工作原理介绍
本系统采用B/S结构 (Browser/Server, 浏览器/服务器结构) 和基于Web服务两种模式, 是一个适用于Internet环境下的模型结构。只要用户能连上Internet, 便可以在任何时间和地点进行学习。
系统的工作流程包括以下一些关键环节:
(1) 用户注册。用户使用该课件前需注册, 系统会将用户输入信息记录到用户模型中。
(2) 用户登陆。用户输入用户名和密码后, 系统验证正确性及用户能否进行学习。
(3) 个性化学习内容自动生成。根据用户注册时输入的学习特征和学习过程中的学习记录, 从用户模型和知识领域模型中读取相应信息合成网页内容。
(4) 用户信息管理。其中包括对用户信息的查询和修改, 系统会根据修改后的用户信息重新自动合成网页内容。
(5) 在线浏览。这是用户学习课件内容的主要方式, 浏览中的动作主要是点击网页中的超链接, 系统会动态跟踪用户的行为更新网页内容和导航提示。
(6) 导航搜索。为帮助用户更快更方便的找到所需知识点, 系统根据知识点不同的特征, 比如说作者不同, 主题不同或关键字不同等进行搜索, 使用户一步到位, 直接找到所需知识点。
以上各个环节相互联系, 前后影响。对于用户的每一操作, 系统都会自动读取数据并更新其中用户数据, 并将更新后数据通过课程学习系统网页呈现出来。
4.2 系统数据流图
数据流图能精确地在逻辑上描绘系统的功能、输入、输出和数据存储等, 摆脱了物理内容, 是描绘系统逻辑模型的最主要的工具。经过系统详细调查及用户需求分析, 我们得到了新系统的数据流图。如图2、图3:
4.3 系统的实现算法
4.3.1 用户信息初始化算法
该算法中牵涉的数据有:用户数据库中的用户信息管理表、用户特征表、用户学习表。算法主要功能是通过接收用户输入或选择的信息初始化用户模块中有关信息。
4.3.2 检索导航算法
登录后, 用户可根据知识点搜索进行检索。知识点搜索主要从知识点主题、知识点类别和知识点的关键字三方面进行。三方面的共同限制可使用户查找到较精确的知识点。在该导航实现过程中, 用到的数据有文章知识表, 内容是从文章知识表数据库中调出。
4.3.3 知识点关联导航算法
知识点关联导航是当用户浏览某知识点时, 与此知识点相关的知识点将显示在相关知识点栏目中。这些知识点的相关性是根据关键字进行判断的。用户点击任一知识点, 只要与此知识点具有相同关键字的知识点都会显示在页面上。这种自适应性方便了用户对一些相关知识点的查找与阅读。
4.3.4 网络课程知识点显示算法
用户登录成功后, 页中知识点的内容是根据用户学习级别进行判断的, 用户学习级别不同决定了不同内容。这种根据用户学习情况自适应的显示, 有利于用户对知识点的掌握, 同时随着学习不断推进, 用户可以相应改变自己学习级别, 来学习更高级的知识点, 直到对整个课程知识点有了深刻的了解与认识。
4.4 前端页面的设计与实现
在后台数据库建立与整体设计的基础上, 前端页面的设计与开发尤其重要, 对于自适应网络课程学习导航系统来说, 主要包括的页面模块有:用户注册模块、热点学习模块、推荐学习模块、知识点搜索模块、知识点分类导航模块、主题分类导航模块和讨论区模块等。
4.4.1 系统公用页面
在本系统中, 将会有些公用页面, 即每个文件或部分文件都会用到的文件, 在使用这些文件时, 只需一个包含语句即可, 这样减少了代码的冗余, 也使编码简单, 减少了工作量。主要公用文件包括:syscode_article.asp、conn.asp、function.asp、config.asp等。
(1) syscode_article.asp:该文件是对系统栏目和文章专题与章节的整体管理。它包括文章内容与知识点的如何显示, 以及用户的阅读权限, 栏目的显示效果, 文章的分页效果, 最新文章显示函数, 推荐文章显示函数, 最热文章显示函数等。此文件基本上贯穿了整个系统, 它包含在各文件中, 是系统的主要部分与精髓。
(2) conn.asp:该文件对于程序中建立数据库连接和关闭数据库连接的操作, 最好放在一个包含文件中, 这样便于维护和修改。前面一部分为建立数据库连接的语句, 其中conn为建立数据库连接的对象, connstr为数据库连接字符串, 它表明了数据库连接的物理路径以及采用的数据库类型, 采用的是ACCESS数据库。用这种方法连接数据库的目的是防止程序被移植后, 数据库的路径出现问题或是还得设置数据源。
(3) function.asp:该文件是各种函数的集合文件, 主要包括检查email地址合法性函数Isvalidemail () , 求字符串长度函数Strlenth () , 显示错误提示过程WriteErrMsg () , 显示本站公告信息过程ShowAnnounce () , 显示用户登录表单过程Sho UserLogin () , 显示知识点搜索表单过程ShowSearchForm () 等。这些函数或过程放在同一个ASP文件里, 便于其他asp文件的调用, 同时易于修改和管理。
(4) config.asp:该文件是各种常量的声明文件, 这样做的目的是可以在程序的任何部分使用该常量来代替某一特定的数值, 从而方便了编程。
4.4.2 用户注册页面
用户注册界面如图4所示。带*号的为用户必须填写的内容, 这便于对用户的管理以及用户的安全性。用户注册页面的信息是用户进入系统的有利凭证。该页面涉及的主要asp文件为user_reg.asp。
4.4.3 分类导航模块
分类导航的简单设计使用户一目了然, 他们带有不同的超链接, 不同页面显示不同的主题内容。分类导航提供了两个框架:主题分类和知识点分类。两种导航操作起来都比较简单, 适合各种层次的用户使用和操作。
此主题分类导航模块包含了各种知识点, 知识分类清晰可见, 主要由showspecial () 函数和showclassnavigation () 函数来编译, 其中showspecial () 函数用来编译专题栏目, 而showclassnavigation () 函数用来编译栏目导航。其中涉及到的其它文件还有syscode_article asp、function.asp、conn.asp。
知识点分类导航模块方便了用户的多方面查询, 使用户可以在某一知识点下了解到更多的相关知识, 扩充自己的知识面, 同时了解自己在其他知识点中的不足。此模块涉及到的ASP文件有syscode_article.asp, function.asp和conn.asp。
在syscode_article.asp中, 主要涉及的函数为showcorrelative () 函数, 此函数是知识点显示的主要函数。在showcorrelative () 函数中包含了function.asp中的gottopic () 函数, gottopic () 函数是一截取字符串的函数, 返回值是截取后的字符串。同时为了数据库建立连接, conn.asp是必不可少的。
4.4.4 检索导航模块
本模块功能:方便用户搜索所要学习的知识点, 快速定位。本模块是在选择知识点分类的基础上根据知识的各个关键字进行搜索。
其主要的ASP页面有:
(1) conn.asp页面, 此页用来与数据库连接, 便于其它页面对数据库进行查询时使用
(2) article_search.asp页面, 对于知识点搜索的结果将显示在此页面中。
涉及到的主要函数有:showsearchform () 函数, 此函数是用来显示知识点的搜索表单, 即模块中所显示的内容。showsearchresult () 函数, 分页显示搜索结果的函数, 此搜索结果将显示在article_search.asp所显示的页面中。
4.4.5 推荐学习导航与热点学习导航模块
推荐学习导航和热点学习导航主要是管理员进行管理的, 管理员根据最近比较好的知识点文章对用户进行推荐, 并将最受用户欢迎的知识点显示在热点学习栏目中。
4.4.6 讨论区页面
讨论区页面主要功能是方便用户之间的交流与讨论, 用户可以在交流中不断发现问题, 解决问题, 同时不断增加自己的知识面。
讨论区主要用到文件有:chat.asp、announce.asp、particular.asp、re_announce.asp、count_hit.asp。
结语
网络学习导航系统成功的关键在于导航界面的清晰, 简单设计、导航系统的全面性、导航系统的自适应性和系统的易管理性这四个方面。
本系统的大部分模块已经实现, 并符合以上几个特性。但一个完整的系统靠短时间的分析、设计来开发是远远不够的, 它需要更长时间来测试并完善。随着研究的进行, 可能还会有其他一些问题, 需要继续努力, 改善本系统。
摘要:现代信息技术的发展, 使得基于WEB技术的网络教育平台成为现代教育技术改革与发展的方向。本文介绍了用ASP+ACCESS技术开发该系统的子系统自适应网络课程学习导航系统。该系统主要利用了ASP强大的网络数据库访问技术, 实现了网络学习的自适应性。
关键词:ASP,ACCESS,网络教育,导航,自适应性
自适应学习 篇2
自适应的知识与编程无关,关键在于配置文件的修改,自适应的内容包括:语言、屏幕、平台。今天就来说一下如何自适应国际化言。
internationalization (国际化)简称:i18n,因为在i和n之间还有18个字符,localization(本地化 ),简称L10n。
一般用语言_地区的形式表示一种语言,如:zh_CN表示简体中文。
操作方法:
为了支持国际化语言,我们只要在res/目录下在重新新建文件夹为:values-国家编号,如values-zh-rCN表示简体中文,values-zh-rTW表示繁体,values-jp表示日语等。
注:配置选项包括语言代号和地区代号。表示中文和中国的配置选项是 zh-rCN; 表示英文和美国的配置选项是en-rUS。其中,zh 和 en 表示中文和英文;CN和US表示中国和美国;前面的r是必须的。
举例:支持中文简体的国际化
操作如下:
现在新建一个Android工程Android_i18n,默认在res/values/strings.xml中的代码如下:
复制代码
1
2
3
4
5
6
7
8
复制代码
不做任何修改,直接在手机上运行程序,默认的效果如下:
声明:我的手机默认的语言是设置为中文的:
其实无论手机设置成什么语言,运行的效果都是一样的,因为我们还没有进行国际化设置嘛。那现在开始来设置吧。
现在来加一个中文简体的国际化:在res/目录下新建一个文件夹代表中文简体:values-zh-rCN,目录结构如下图所示:
注:如果想再加一个英语的国际化,新建的文件夹为values-en即可。
修改res/values-zh-rCN/strings.xml的代码,如下:
复制代码
1
2
3
4
5
6
7
8
复制代码
此时运行程序,效果如下:
因为手机设置的是中文语言,此时加载的字符串是res/values-zh-rCN/目录下的资源,
大功告成。
问题一:
现在我并没有添加繁体中文的对应的资源,如果我将手机的语言设置为繁体中文,运行程序会是什么现象呢?
答案:此时,如果没有定义繁体中文的资源,那默认加载的就是res/values/目录下的资源。
问题二:
现在定义一个字符串,只在res/values-zh-rCN/下定义,而不在res/values/定义,运行程序会是什么现象呢?
答案:
现在我们在activity_main.xml中添加一个按钮:
1
2 android:layout_width=“match_parent”
3 android:layout_height=“wrap_content”
4 android:text=“@string/login_button”/>
第04行代码:按钮显示的名字引用了字符串login_button
此时,让res/values/strings.xml的代码保持不变:
复制代码
复制代码
在res/values-zh-rCN/strings.xml中加一行login_button的声明:(第07行代码)
复制代码
1
2
3
4
5
6
7
8
9
复制代码
效果:
activity_main.xml的视图如下:
运行程序,如果手机的语言设置为英文,效果如下:(非正常显示)
如果手机的语言设置为中文,效果如下:(能正常显示)
自适应英语学习平台的设计与探索 篇3
【摘 要】当今社会处于信息技术浪潮中,社会的发展也离不开信息技术。尤其是互联网技术,不但加快了信息传递的速度,而且繁衍了新生事情,并在不同领域中引起变革。在英语学习中,利用信息技术,涌现出了各种各样的在线学习平台。然而,一般的英语在线学习平台并不能在短时间内对用户进行大幅度的英语能力提升。本文主要进行了在英语学习平台中融入自适应项目反应理论,从而达到用户在短时间内通过自适应测试进行英语能力提升的初探。
【关键词】信息技术; 互联网技术;学习平台;自适应项目反应理论
一、国内学习平台的现状
在线学习已经深入到各个行业与领域,对于英语也不例外。英语作为一种世界性交流语言,各国在沟通交流中都需要应用英语。为此,世界大部分非英语作为母语的国家,英语在其国家用户的学习中举足轻重。而很多出国留学的用户,英语能力也作为非常重要的测评考核。但对于大部分的英语学习者来说,传统的英语学习方式一方面花的时间多,另一方面通过多年的学习,并不能很好的掌握和大幅的提升英语。互联网顺应时代潮流,为英语学习者提供了各种各样的在线学习平台[1]。相对于传统的学习方式,在线学习具有开发性、灵活性和资源共享等优点,在一定程度上吸引并能提高学习效率。然而,要在短时间内进行英语的大幅度提升,目前一般的在线学习平台还不能达到。主要存在以下问题:
(1)系统缺乏交互性。很多学习平台主要都以材料呈现为主,用户大多数都是以被动接受为主,并以最后的测评通过表明内容的掌握。
(2)系统学习资源多而杂。系统资源样式多种多样。如图片、视频、音频、声音、动画随处可见,并加入不同的级别如幼儿英语,小学英语,初中英语,高中英语,大学英语,研究生英语,托福雅思英语,四级、六级、八级英语。用户在学习过程中没有计划盲目的使用各种资源,请对资源缺乏有效的管理和引导。资源的混杂,使得用户什么都想学但可能什么都学习不好,出现了信息迷航。
(3)缺乏先进的学习理论指导。大多数的学习系统在设计上仍然遵循先呈现材料,再进行用户反应,最后进行信息反馈的方式,使得学习效果不理想。由于没有进行个性化学习制定,无法了解个别用户的能力及不同水平用户所需要的不同的学习内容,导致有多用户在学习一段时间后,没有兴趣坚持学习。
二、自适应英语学习平台的设计
本学习平台的总共对听力、语法、词汇、阅读理解进行了自适应设计。选择听力自适应[2]设计如下:
题型难度分为低、中、高三个等级,对应的分值分别为0.25、0.5和1分。用户测试时先呈现10道中等难度的题,即第二难度等级,分值0.5。如果该等级的题累计错5道,则降为低难度的题,即第一难度等级,分值0.25。如果低难度的题累计5次回答正确,则又呈现中等难度的题,如果累计5次答错,则停止这部分的考试,其总分根据答对题目的总分值累加;如中等难度的题累计5次以上答对,则呈现第三难度,即分值1分等级的题, 累计5次答错或答对,都停止这部分的考试,其总分根据答对题目的总分值累加;总之每个等级累计5次回答错误,则停止这部分的考试。其总分根据答对题目的总分值累加。分值累计不超过10分。如果用户难度为低的全部做错,则建议学连接到静态网页进行薄弱环节练习,练习时则呈现听力原文。可以显示用户上一次的学习位置并进行断点续学。对应流程如图1:
本功能图的核心模块是自适应测试,分别对听力、语法、阅读理解和词汇根据自适应规则来设计,系统根据测试每一步的测试结果,会根据用户的英语水平进行智能决策其英语水平并推出对应的习题从而达到个性化的学习。
三、系统运行实例分析
根据系统分析及设计,本平台的首页实现了听力练习、语法练习、阅读理解、翻译训练等功能。
通过单元测试和集成测试[3]来验证了自适应项目反应英语学习平台满足核心功能需求,即自适应听力、语法、词汇、阅读理解功能,学生通过练习,达到了提高学习兴趣和提升了英语能力。由于是B/S架构,可以上线运行。
本平台采用J2EE开发,具有JAVA的高效、跨平台、稳定的特点。从技术角度尝试改善教学过程中的差生现象,并对传统的评价方法做出了改进。尤其是本台融入了自适应技术,实现了用户个性化[4]、全面、公平的学习。由于该平台目前仅针对四川省二级考试作自适应测试的尝试,上线通过学生的反馈,将来可以向其他级别进行二次开发。
参考文献:
[1]吴虹,曹伟,汤明.高校在线学习平台建设的思考与探索[J].中国校外教育:理论, 2009(2):41-41.
[2]刘志勇.基于本体的自适应学习方法及应用研究[D].吉林大学,2010.
[3]单锦辉, 姜瑛, 孙萍.软件测试研究进展[J].北京大学学报(自然科学版), 2005.
[4]赵蔚,杜欣,梁明.基于用户模型的个性化本体学习资源推荐研究[J].中国电化教育,2010(05).
作者简介:
自适应学习系统发展研究综述 篇4
《2016新媒体联盟中国基础教育技术展望:地平线项目区域报告》中明确指出,在未来“四至五年”,自适应学习技术将成为对中国基础教育极具重要影响潜力的技术之一[1]。报告中对自适应学习技术进行了概括,即自适应学习技术是指适应个体学生学习需要的软件和网络平台。由此可知,尊重学生个性发展、支持自适应的网络学习平台正是当下以及未来教育信息化的前进方向,也是创新型人才培养的主要阵地之一。
二、国外研究现状
自适应学习是一种“复杂的、数据驱动的、很多时候非线性方法的教学与辅导。它根据学习者的交互及其表现水平而调整,并随之预测学习者在某个特定时间点需要哪些学习内容和资源方能取得进步。”总的来说,国外对自适应学习的研究较国内的研究要早,其中美国的研究开启了自适应学习研究的大门,起到了领头军的作用。美国对自适应学习的研究起源于匹兹堡大学Brusilovsky于1992年提出的智能授导系统——ITEM/IP,这是一个支持学习与授导的整合智能系统,其中,学生模型存储学生的学习记录,使用人工智能技术用以适应每个学生的知识水平和学习风格。1996年,Brusilovsky深入研究了有关自适应超媒体系统的方法与技术,指出自适应超媒体系统在与用户交互过程中,建立了一个包含单个用户目标、偏好和知识的用户模型来适应用户需求。自适应超媒体系统适应性地向用户呈现信息和链接,实现导航自适应,推送最相关的链接或者是隐藏不相关链接。1998年,Brusilovsky,澳大利亚悉尼科技大学John Eklund,德国卡尔斯鲁厄大学Elmar Schwarz共同提出基于网络的教学系统下的创作工具——Inter Book,简化了自适应网络电子课本的开发。2001年,为了实现自适应系统的通用性,Brusilovsky、德国弗莱堡大学Weber提出了一个智能交互教育系统——ELM-ART,该系统整合了覆盖模型和插话式学生模型,可以提供自适应导航支持、过程序列化、学生解决方案的个性化诊断以及基于实例的问题解决支持。2003年,Brusilovsky,意大利国家研究委员会Riccardo Rizzo提出在封闭和开放的语料库超级空间中,使用地图和地标来进行导航,这是一种使用语义信息空间地图的基于地标的导航方法。基于这种方法,开发了Knowledge Sea来帮助用户在讲义与相关教程页面之间以及多个相关教程页面之间进行导航。2006年,Brusilovsky等指出智能教育系统缺少一种允许教师创作智能内容的智能创作支持工具,并相应开发了ELDIT系统来支持自适应词汇习得系统中语言内容的创作。2008年,Brusilovsky和Rosta Farzan共同开发了Annotat Ed系统,该系统将网页注解与自适应导航整合成一个单增值服务,更好地拓展了作为超文本系统的网页的功能。2013年,Brusilovsky等提出了一种交互式可视化方法,将个性化和探索性搜索方法有机结合,并介绍了Adaptive VIBE工具,以提升网络信息检索的精度和效率。2015年,Brusilovsky等介绍了自适应教育系统的基于主题的个性化方法,主题是具有粗粒度的知识单元,用户建模和自适应都以主题为基础。基于网络教育服务系统Quiz Guide,Brusilovsky等人详细阐述了基于主题的个性化技术,并对其进行了相应评价。作为美国,乃至世界自适应学习研究的先驱Brusilovsky对促进自适应学习理论与技术的不断发展与完善起了巨大的作用,他的研究仍在继续。
此外,意大利、荷兰、德国、英国、澳大利亚、爱尔兰、希腊、印度尼西亚、韩国等国家对自适应学习也做了大量的研究。其中,德国汉诺威大学Mohammad Alrifai等人于2012年对欧洲计划TERENCE进行了深入研究,在此基础上详述了自适应学习系统的用户和领域模型。韩国釜山国立大学Jaemu Lee于2013年开发了基于任务—特征—处理交互理论的自适应学习系统。印度尼西亚日惹国立大学Didik Hariyanto于2014年提出将m-Learning和e-Learning结合的自适应学习系统的新思想,进一步拓宽了自适应学习的研究道路。
三、国内研究现状
国内对自适应学习的研究比国外起步要晚,但近几年对自适应研究的热度持续上涨,也取得了不少研究成果。其中,以东北师范大学赵蔚、姜强,西华师范大学陈仕品,浙江大学张剑平,华南师范大学陈品德,北京师范大学余胜泉的研究为重要代表。余胜泉开启了我国对自适应学习研究的时代。2000年,他指出适应性学习是远程教育发展的趋势,强调个别化学习,将自适应测试、人工智能等先进技术纳入远程教育技术体系中,并且提出了适应性学习模式,指出该模式的关键环节是:学习诊断、学习内容的动态组织、学习策略[2]。2002年,陈品德、李克东对适应性超媒体系统的模型、方法与技术进行了相关研究,对适应性超媒体体系结构:领域模型、用户模型、适应模型、适应性引擎四方面展开了论述。2007年,陈仕品、张剑平对智能教学系统开展了相关研究,他分析了智能教学系统的基本架构:专家模型、学生模型、导师模型,深入对比各个时期的智能教学系统,得出研究热点,并指出了智能教学系统的发展趋势,为以后的研究指明了方向。2008年,陈仕品、张剑平设计出了基于EAHAM模型(Enhanced Adaptive Hypermedia Application Model,增强适应性超媒体应用模型)的适应性学习支持系统的体系结构,该体系结构能够实现根据学习者在知识基础与认知风格等方面的个体差异提供适应性学习支持,并且使系统的实现具有良好的可操作性[3]。同年,他们共同提出远程学习的双向适应机制,认为完整、有效的适应机制应包括:学生主动适应远程学习方式以及系统为学习者提供适应性支持两个方面的内容[4]。2010年,陈仕品、张剑平又从学生模型构建、学生模型初始化及学生模型动态更新三方面对适应性学习支持系统的学生模型开展了深入研究,为学生模型的进一步完善发挥了重要作用。同年,他们关注了学习内容组织策略,提出了适应性学习内容动态组织过程模型,从基于认知状态的适应性学习内容组织策略,基于学习风格的适应性内容表示策略,基于学习风格的适应性导航策略三方面详述了学习内容适应策略,为适应性学习系统动态生成适合学习者个体特征的学习内容提供了一种切实可行的方法。此外,2009年,东北师范大学黄伯平、赵蔚、余延冬从DM方面特点、模型各自特点、所具特性三方面对自适应学习系统主要参考模型:AHAM、LAOS、XAHM、Web ML进行了对比分析,为自适应学习系统的架构体系构建提供了参考指南。2012年,东北师范大学张舸、周东岱、葛情情围绕学习者特征模型,总结了几种典型的建模方法,并且分别论述了国内外自适应学习系统中学习者特征模型所采用的建模方法,通过比较,分析优劣,促进了自适应学习系统的本土化研究。同年,北京交通大学曹双双、王移芝提出泛在学习中自适应学习系统模型,拓宽了自适应学习系统的应用领域。
随着自适应理论及技术的不断发展、完善,我国自适应学习研究已自成一派。其中,赵蔚、姜强的研究对国内自适应学习的深入发展起到了不可磨灭的促进作用。由可查文献,笔者发现赵蔚、姜强较早提及“自适应”一词是在2004年共同发表的《基于电子学档的网络学习评价系统设计与开发》一文中,文章介绍了一种网络学习评价系统——电子学档,能实现自适应的学习反馈,指导学生个性化的学习。此后几年,他们对此又进行了进一步研究。到2010年以后,两人开始对自适应学习进行深入、全面的研究,自此,我国自适应学习在理论与技术方面快速发展。理论方面,将FelderSilverman量表用于用户学习风格模型研究,设计出了自适应学习系统中用户模型和知识模型本体参考规范,提供了自适应学习系统的优化机制,关注自适应学习系统中的双向适应交互,提出了基于大数据的个性化自适应在线学习分析模型,提供了自适应学习系统中以学习者为中心视角的评价模型、方法及变量,提出了知识资源个性化推荐的教学模式。技术方面,提出基于用户模型的个性化本体学习资源推荐,设计了基于GALSRM模型(自适应学习系统通用参考模型)的自适应学习系统体系结构,研究了多元化媒体资源适应性推送及可视化序列导航,将本体技术应用于用户及课程知识的表示,通过OWL(Ontology Web Language)实现本体存储和读取,运用贝叶斯网络法挖掘网络学习行为,更新学习风格模型,使用协同过滤技术实现学习信息的动态适应推送,开发了面向“服务”视角的自适应学习系统(SOALS)。姜强副教授与赵蔚教授基于SOALS的设计、开发、使用与完善进行了一系列的研究,成功实现理论与实践的结合,推动了我国自适应学习研究的发展,也为国内学者“身体力行”地研究作出了榜样。
四、研究现状分析
(一)自适应学习系统核心组件:用户模型
国内外对自适应学习都进行了深入的研究,也达成了一定的共识。通过分析国内外研究成果,不难看出,大家一致认为用户模型是自适应学习系统的核心组件。因而,对用户模型的研究也成为了自适应学习研究的热点。然而,大部分用户模型的研究将用户学习风格与认知水平分裂开来看待,仅从用户学习风格或者是认知水平单方面构建用户模型,导致构建的用户模型不够全面,自适应性能不高。
(二)自适应对象:学习资源、学习路径的适应性
呈现
自适应学习系统根据用户特征差异,主要将学习资源、学习路径动态适应地呈现给特定用户,以满足个性化学习的需要。国内外对学习资源的建设也给予了重视,发布了Dubiln Core、IEEE LOM、CELTS-3:学习对象元数据等学习资源建设标准,为实现学习资源的共享、重用作出了贡献。
(三)自适应模式:用户主动适应系统与系统主动适应用户的双向适应机制[5]
以往大多数的研究只关注系统如何建立用户模型、领域模型,根据用户模型中的用户学习风格或认知水平,主动向用户推荐学习资源和学习路径。然而,对于用户主动制定学习计划、选择学习过程、运用学习策略以及自主评价方面却较少考虑,这无疑降低了用户对自适应学习系统的使用感受。因而,建立双向适应的自适应模式无疑是必要之举。
(四)自适应学习理论应用于具体实践不够
对自适应学习在理论方面的研究,国内外都取得了比较深入的研究成果,然而,将这些理论运用于具体实践中的实例很少,尤其是在国内研究中。因而,在基于各种自适应理论基础上,实现自适应学习系统在当下自适应学习研究中极其重要。
参考文献
[1]2016新媒体联盟中国基础教育技术展望:地平线项目区域报告[EB/OL].http://www.ict.edu.cn/uploadfile/2016/0115/20160115102109968.pdf.
[2]余胜泉.适应性学习——远程教育发展的趋势[J].开放教育研究,2000,(03):12-15.
[3]陈仕品,张剑平.基于EAHAM模型的适应性学习支持系统体系结构[J].电化教育研究,2008,(11):53-57,82.
[4]陈仕品,张剑平,江玲.远程学习的双向适应机制研究[J].远程教育杂志,2008,(03):18-21.
自适应学习 篇5
自适应学习系统(adaptiveleanringsystem),是指针对个体学习过程中的差异性(因人、因时)而提供适合个体特征的学习支持的学习系统。自适应学习系统本质上是一种个别化的学习支持系统,它能够提供一个适应用户个性化特征的用户视图,这种个性化的学习视图不仅包括个性化的资源而且包括个性化的学习过程和策略。由于个体的差异性是多方面的,因此适应的功能特征也是多种多样的,自适应学习系统主要研究:
①如何为学生提供:适应性导航支持;适应性内容呈现;适应性测试;适应性帮助。
②学习系统的结构模型;
③领域知识库的构造方法;
④用户模型的表示和用户建模方法。
自适应超媒体系统,指通过在用户模型中反映用户的某些特征,并应用这个模型将系统中不同的可见方面适应于不同用户的所有超文本和超媒体系统。换句话说,这个系统应该满足3个准则…:
①是一个超文本或超媒体系统;
②应该有一个用户模型;
③使用这个用户模型向超媒体系统提供自适应性(即同一个系统对有着不同的用户模型的用户来看是不同的)。
自适应超媒体技术适用于有着不同目标和知识水平的用户、且用户访问的信息空间比较大的系统。这类用户可能对展示在一个超媒体页的不同信息片断感兴趣,可能会使用不同的链进行导航。用户模型则是支持这种特殊性的知识结构。自适应超媒体系统有两个关键技术:自适应技术与用户模型。自适应技术包括自适应展示和自适应导航,自适应展示是内容级的自适应;自适应导航则属于结构级的自适应。用户模型是反映用户个人特征的模块,它考虑到的用户特征有:用户的知识水平、目标,背景与经验、偏好。其中用户的知识水平是最重要的用户特征,几乎所有的自适应展示技术将用户的知识水平作为提供自适应的主要依据之一。
1.2自适应超媒体系统是计算机辅助教学发展的新方向
将自适应技术与超媒体技术结合起来形成的自适应超媒体技术是超媒体系统研究的新方向,可以看作是超媒体学习系统与智能导师系统相结合的产物。传统超媒体学习系统以其图文并茂的界面和以学生为中心的交互风格受到广泛的欢迎,但却因为易造成学生迷航而受到批评;后者因其理解领域知识,了解学生状态,能因材施教而倍受青睐,但枯燥呆板的界面,过多的程序控制往往无法激发学生学习的主动性和维持学生动机,而将两者结合则弥补了各自的缺点,发挥了各自的长处,在技术上不但可行而且也是教学上的必要。前者更多地关注知识获取,后者则更多的关注知识的应用,因此自适应超媒体学习系统覆盖了教学的全过程,这也是自适应超媒体学习系统成为研究热点的原因之一。
自适应学习系统是知识丰富型(Knowledgerich)应用,其设计相当困难。虽然经过10多年的研究已经取得了一些成就,但直到现在,仍然没有形成完整的理论与设计原理,例如如何建造理想的学生模型,有效的知识表示,如何把多媒体技术与自适应技术结合起来等,多数学习系统仍然处于试验阶段,只有少数系统能为用户提供自适应的学习环境。
目前普遍存在的教育软件尽管可以满足教学某一方面的需求,但是由于开发者缺少一定的教育教学理论使得这些教育软件缺乏先进的教学和学习理论指导,从而很难为教学提供完整的指导。为适应教学发展的`需要,就必须在现代教学理论的指导下研究并实现新型的自适应学习系统。本文在教育思想和现代教育技术的双重指导下,设计实现高师计算机专业课程《计算机辅助教学与多媒体课件设计》的自适应超媒体学习实验系统,为课程学习的自适应性和多媒体学习环境作一些尝试,进行一些探讨。
2系统设计思想及系统结构
2.1设计思想
高等师范院校的学生,肩负着培养新一代的重任。为了充分发挥计算机特别是多媒体计算机辅助教学方面的优势,高师院校的学生不但要了解计算机应用于教育领域的广泛性,同时还要了解计算机应用于教育领域的具体方面,形成应用计算机辅助教学的意识。《计算机辅助教学与多媒体课件设计》是计算机科学与技术专业的一门重要必修课程,教学计划安排在大学本科三年级开设。本文所设计实现的学习系统便是以该课程的教学内容为蓝本。
高师三年级的学生已经有了一定的教学概念和计算机基础知识,对计算机教育应用已有了初步的认识,需要对计算机应用于教育领域的具体内容和形式加以掌握。处于这一群体的学生心理发展到相对成熟的年龄阶段,能够形成有意注意,且他们的智力水平较高,有较强的自学能力,对新鲜刺激有浓厚的兴趣,喜欢轻松、活泼的学习环境。但是他们个体之间也存在着学习方式的差异:有的倾向于引导性的学习方式,通过逐步引导达到学习目标;有的倾向于建构型或探索性的学习方式。
系统的设计思想是以我国传统的教学模式为蓝本的设计思想。教师所掌握的和学生所熟悉的教学模式是:课堂教学、作业(练习)、测试、结合成绩综合评价学生,这是最普通的教学模式。在这个过程中,教师的教和学主的学,双边互相了解,逐步达到教学相长的目的。根据这些想法,学习系统模拟了一般的教学过程并增加了特定的功能:学生在学习了一定的知识后进行测试,系统根据学习成绩(好、坏),接收学生的反馈信息,并针对不同情况的学生提供下一步学习的建议和意见。对于已掌握已学知识的学生,系统可以提供进一步深入学习的课程;而对未掌握已学知识的学生,系统则建议其重修或提出相应的教学意见,另外,针对个别有特殊性的学生系统还可以生成不同的教学方案,从而建立一套对不同学生因材施教的教学方法和教学策略。
教学过程的自适应性是系统的特点之一,在实际教学过程中的表现就是因材施教。更具体地说,教学系统在教学过程中的自适应性表现就是教学策略因人而异的适应性调整。教学策略的调整引起教学内容调整、重组和教学策略的重新选择,这一系列的变化是系统适应实际教学过程的智能化表现,这一点说明了系统模拟教师教学活动的适应性功能。
2.2系统的结构及工作流程
本文设计和实现的实验性学习系统(CDCAI系统)包括不同的功能模块及其子模块,其基本结构如图1:
3CDCAI系统的实现
3.1系统功能模块的实现
封页:封页是一个过渡,当启动系统时首先启动封页,封页加入了画面背景和音乐并附本学习系统的一些开发信息。封页的出现是进入学习状态的前奏,它使得系统一开始就对学习者产生吸引力以激发学习者的兴趣。
主控页面:主控页面负责界面的控制工作,处理学生与系统的交互,启动各个功能模块,提供各功能模块之间通讯方法。各模块的启动采用下拉菜单的方式出现,简单明了。系统对学生和教师进行限定,即未登录前两者都为灰色,按照类型正确登录后相对应的菜单项变亮,且每次只能一种人员类型进行登录。
超文本/超媒体学习页面:在学习内容方面系统采用了大量的超文本/超媒体方式,学习内容按章、节、知识点的方式进行划分,为防止学生迷航还设置了大量的导航按钮。在学习系统中选择哪些学习内容方面也采用超文本/超媒体技术。
当装载本窗口时,会同时装载超文本/超媒体。此时学习者通过目录可以直接实现从一个学习主题到另一个学习主题之间的跳转,实现跳跃学习。双击右侧学习内容则可以全屏显示教学内容且教学内容也以超文本/超媒体形式出现。
试题管理:实验系统采用非标准化考试形式。
试题种类多种多样,没有规范统一的形式,在采用计算机管理题库时系统将传统题目类型加以归纳、总结,按照试题类型进行管理。
3.2题库及测试模块实现
为了使题库系统成为评测学生学习效果的有效评测工具,题库中所有储备的题目为有意义的题目,即具备一定评测能力,符合一定的参考指标。在试卷的命题过程中,针对不同的考试对象、不同阶段的考试,命题难度也不同,所以在试题库中增加难度系数,这也是几乎每一个试题库所要考虑的结构。实验系统中Weight就是根据题目所定义的难度系数值。难度分为标准难度和经验难度,经验难度是由教师根据题目内容涉及面和预测答题时间等因素推测出的难度系数,该难度系数需经过多次实际考试后与标准难度进行加权才能逐渐趋近于实际的难度系数。实验系统题库采用“难度系数”作为衡量题目难度的评测指标。这样做的目的是更加反映出学生的真实学习水平。ScoreWeight是题目在满分情况下同该题难度系数相乘的结果。CommenceWeight是该题目被测试并给出成绩后与该题难度系数相乘的结果。
3.3自适应学习实现
《计算机辅助教学与课件设计》是一门理论与实践相结合的课程,学生在实践操作前应该具有一定的理论基础,所以本系统在学生学习实践操作之前要先检测学生的基础理论知识情况。我们把学生的基础理论学习程度分为5个等级(A、B、C、D、E),A级的学生已掌握基础理论知识可以直接进行实践操作的学习;B、C两级的学生基本掌握基础理论知识,学生即可以继续巩固基础理论知识,也可以学习实践操作部分,系统提供选择;D、E两级的学生我们认为其基础理论知识还不足以指导实践操作,所以系统让其继续学习基础理论知识。
系统的自适应性主要体现在:第一,当学生登录后学生可以根据自身的情况自主选择入门学习的等级和内容;第二,如果学生已经掌握了部分知识也可以先进行测试,通过测试等级反映该生对基础理论知识的掌握情况,这时系统根据学习诊断的结果反馈给学生学习建议,推荐学习内容,这些学习内容是与当前学生能力最接近的。同时系统将该部分知识要求掌握的要点和程度也呈现给学生;第三,教师可以根据不同学生的特点选取合适的教学内容,或根据提示信息从补充知识中选取合适的教学信息,从而实现个别化教学。
例如,系统给学生反馈的知识程度信息及教师选取适合该生学习内容的界面(图2)。
教师根据学生的不同情况从左边的选框中选择出适应性的学习内容,通过“添加”按钮将被选择的内容添加进中间框中;选中中间框内的教学内容通②学生也可以先进行测试,通过测试反映对基过“删除”按钮可将该项删除;且已选择的内容项不础理论知识的掌握情况,系统会根据学习结果反馈能重复被加进来;右边框则为选择好的教学内容展学习建议,推荐学习内容,呈现知识要点;示区。当教师选择好学习内容并确定后,学生可以教师可以根据不同学生的特点选取合适的教学看到教师建议的学习内容。内容,或从补充知识中选取合适的教学信息,从而实现个别化教学。
4小结
自适应超文本与超媒体学习系统的开发是一项复杂的系统工程,其复杂性主要体现在:
①开发内容的复杂性。一个具有一定适应性的完整学习系统需要涉及到学校教学的许多方面且这些方面相互交错,互相影响,系统开发必须综合考虑。
②学生的不同需求。自适应学习系统本质上是一种个别化的学习支持系统,因此系统开发时应考虑到不同特征的用户需求。
③技术手段。计算机辅助教学是涉及计算机技术软硬件、通信技术、多媒体技术、自适应技术、人工智能技术、教育学、心理学等多学科的交叉研究领域,因此在开发系统时如何综合掌握和运用这些技术是开发者所面临的一个重要任务之一。
本文所研究和实现的“自适应超媒体学习系统(CDCAI系统)”体现了教学设计的思想,根据学习者可能的学习风格设计了不同的学习方式;在学习内容上采用了超文本/超媒体的形式,运用图形图像、声音和动画等多媒体元素构成友好的学习界面,以利于学习者的认知建构。
CDCAI系统在一定程度上体现了自适应特点,基本满足了自适应超媒体系统的3个准则:是一个超文本或超媒体系统;有一个用户模型;使用这个用户模型向超媒体系统提供自适应性。系统的自适应性主要体现在:
自适应网络存储体系 篇6
在传统IT系统中,主机系统既负责数据的计算,也在通过文件系统、数据库系统等手段对数据进行逻辑和物理层面的管理。然而,由于历史发展的原因,各种系统拥挤在用户环境中,使数据被分割成杂乱分散的“数据孤岛” (data island)。因此,从90年代后期,人们开始寻找存储网络化和智能化的方法,通过提高存储自身的数据管理能力,独立于主机系统之外,以网络方式连接主机和存储系统,以设备资源透明的方式为计算提供数据服务。基于光纤(FC)协议的SAN和基于IP以太网技术iSCSI相继成为了广大行业客户首选的最新存储技术。
独立存储关键特性
在计算与存储分离的实践中,人们逐渐发现,性能、容量这些比较明显易见的存储系统要求,并不是对一个独立存储系统的全部要求,甚至不是主要要求。要达到存储系统独立的数据管理目标,对存储系统的特性有如下几个方面的要求,按照重要性排列分别是:
1、可靠性 Availability:
数据集中到存储系统中,必然对系统设备的可靠性提出更高的要求。同时需要建立数据备份、容灾系统进行配合,提高数据安全性。
2、可扩展性 Scalability:
网络时代业务发展的不确定性和数据的高速膨胀,对独立于计算系统之外的存储系统,必然提出高可扩展性的要求。这种扩展性并非是简单的容量扩展,同时还必须包括数据处理能力、数据交换带宽和数据管理功能的扩展。
3、兼容性 Compatibility:
虽然存储系统已分离于计算系统之外,但今天主机系统对数据的使用方式,仍旧以文件系统、数据库系统为主要手段。存储系统要适应各种主机系统的数据I/O要求,就必须能够兼容各种操作系统、文件系统、数据库系统等各种传统数据管理手段。
4、可管理性 Management:
支持各种主流的管理协议和管理架构,能够与网络、计算等各种设备统一管理和集中管理,能够在各种复杂的环境中实现方便统一的设备和数据管理功能。
5、性能 Performance:
能够根据不同应用类型要求,提供带宽、IOPS(IO Per Second,每秒IO操作数)、OPS(Operations Per Second,每秒并发操作数)、ORT(Overall Response Time,总响应时间)等不同指标侧重点的性能服务。高端系统还应能够对系统性能进行动态的扩展和调整。
6、功能 Function:
各种数据迁移、数据分发、数据版本管理、数据复制、在线扩容等数据管理功能。
新一代自适应网络存储体系
而现在我们又有了更新、更智能、更自如的选择:Neocean自适应网络存储体系。它以IP存储技术、WSAN(广域SAN)技术、网格存储技术、虚拟存储技术、数据应用服务技术五大技术群,构建了新一代自适应网络存储体系。
Neocean自适应网络存储架构的特点集中表现为:
业务自适应——与用户的业务同步增长和同步调整。在基础设施建设的投资风险和预留充裕扩展空间的矛盾中,Neocean依靠IP技术和自适应存储技术的灵活、智能和开放性,既能够降低用户初次采购的成本,又能够预留出足够的扩展和升级空间。甚至在今天的GE产品体系中,都已为下一步的10GE和infiniband预留了接口,以保证未来能够自动向下一代产品过渡而无需损失初期投资,并提供性能、功能的横向扩展。
应用自适应——用户IT环境中往往是多种应用并存的。一般包括数据库、文件服务、多媒体服务、WEB、EMAIL、资料存档等多种应用方式。不同应用对数据存取的需求差异很大。Neocean自适应存储架构能够针对每种不同的应用方式,定制不同性能、功能、可靠性的组合方式,以满足应用需求。
系统自适应——无论是刚刚开始搭建集中存储架构的用户,还是已经使用FC-SAN/NAS/SCSI系统的用户;无论是使用PC服务器的Windows用户,还是基于开放平台的UNIX用户;无论是使用高速带宽的高端用户,还是分散在WAN中的低带宽用户,Neocean自适应存储架构都能以其出色的功能和产品组合提供最适合用户的解决方案。
自适应学习 篇7
近年来,人脸表情识别作为一种生物特征识别技术,已成为多媒体信息处理、人机交互、图像处理与模式识别等领域的重要研究课题[1,2]。在人脸表情识别过程中,样本标记起到了重要的作用,但是并不容易获取。由于半监督学习[3]能够利用少量的标记样本和大量的未标记样本构建学习模型,研究者将其应用于人脸表情识别领域以解决标记样本不足的问题,提高人脸表情识别的实用性。
半监督学习的目的是借助大量的未标记样本参与训练以弥补训练样本不足的缺陷。然而,专业数据库中人脸表情图像数量的不足限制了半监督学习在表情识别中的发展。因此,需要寻找一种方案来解决数据量不足的问题,以便更好地完成半监督学习在人脸表情识别中的应用。解决问题的思路有两个:其一是将多个数据库放在一起使用,进行多数据库联合实验。该方法具有以下两个优点:第一,能够收集大量的未标记样本,方便研究者复原实验过程,使得在该数据库上得到的实验结果更具有说服力;第二,在实际生活中,我们面对的人群是多种多样的,多数据库有利于我们模拟实际情况。所以使用多数据库进行半监督学习实验的做法,具有很大的优势。其二是将多姿态图像作为样本,参与半监督人脸表情识别。该方法对于在现实环境中识别多姿态的人脸表情图像具有重要的实际意义。
目前,针对多数据库、多姿态表情识别的半监督学习的研究还处于起步阶段。针对多数据库条件下的表情识别问题,文献[4]提出了一种新的迁移子空间学习算法,在JAFFE、CK和Feedtum数据库两两组合成的数据集上取得了一定的效果。对于多姿态条件下的表情识别问题,主要通过改进特征提取方法来提高样本识别的正确率。文献[5]采用了张量脸结合流形学习的方法来解决多姿态条件下的人脸识别问题。文献[6]提出了基于正交鉴别向量的算法来克服人脸姿态变化对识别造成的干扰。文献[7]将基于子空间的人脸表征看作一个回归问题,因此采用了岭回归和线性回归的方法来处理人脸的姿态变化问题。文献[8]使用嵌入式马尔科夫模型方法处理人脸的不同姿态,获得了比传统的基于构件的分类器更好的识别率。
为进一步提升多数据库、多姿态条件下的表情识别率,本文引入了迁移学习自适应提升(Tr Ada Boost)[9]算法中的知识迁移方式,提出了一种新的基于半监督学习的自适应提升(SSL-AdaBoost)算法。选择引入Tr Ada Boost算法有以下两点原因:其一,该方法是迁移学习理论的代表性算法,既能保证知识迁移效果,又具有结构简单、便于操作的优点;其二,该方法以Ada Boost算法为基本框架。而在半监督学习中出现了不少基于Ada Boost框架的算法,如Semi Boost[10]算法、ASSEMBLE[11]算法以及RegBoost[12,13]算法等,为Tr Ada Boost算法改进为半监督学习算法提供了可能性。
1 算法原理分析
1.1 Tr Ada Boost算法原理
Tr Ada Boost算法的基本原理如下:
设Xs表示源域内和目标域数据分布相同的样本,Xd表示源域内和目标域数据分布不同的样本。令X=Xs∪Xd,Y={0,1}表示样本标记,c表示将X映射到Y的布尔函数,c(x)表示样本x的标记。
输入样本为两个已标记样本集合Td和Ts以及未标记样本集合S。其中,测试集为S={(xit)},xit∈Xs(i=1,2,…,q),q为测试集样本的大小。训练集由两个已标记样本集合Td和Ts组成,Td={(xid,c(xid))},xid∈Xd(i=1,2,…,n),表示与测试集数据分布不同的训练样本集合,Ts={(xis,c(xis))},xis∈Xs(i=1,2,…,m),表示与测试集数据分布相同的训练样本集合,n和m分别表示Td和Ts的大小。初始化参数设置如下:基础分类器为Weak Learn,整数N表示最大循环次数。权重向量W1=(w11,w21,…,w1n+m),其中权重上标1表示第1次循环。令,t=1,2,…,N。
如果符合t≤N、εt<0.5的条件,算法开始循环:
(1)令第t次循环时,Tr的样本分布为;
(2)依据分布Pt,采用Weak Learn得到样本的分类结果ht:X→Y;
(3)计算样本的错误率;
(4)设参数βt=εt/(1-εt);
(5)更新权重向量:
如果达到收敛条件,算法结束,否则继续执行。
最后,输出最终分类器hf(x):
其中,是上取整函数,表示不小于N/2的整数中最小值。
Tr Ada Boost算法通过调整每个样本对应的权重来实现分类效果的提升。如果样本xi分类正确(ht(xi)=c(xi)),就认为该样本内的信息有利于辅助Ts进行训练,算法不会降低该样本的权重;如果样本xi分类错误(ht(xi)≠c(xi)),就认为该样本可能和Ts是矛盾的,算法通过降低样本权重的方式抑制了错分类样本对训练的干扰,并以此实现知识迁移过程。虽然Tr Ada Boost算法具有良好的迁移能力,但是该算法并不适合直接用于半监督表情识别之中。
1.2 SSL-Ada Boost算法原理
本文提出的SSL-Ada Boost算法在保留Tr Ada Boost算法的知识迁移能力的同时,对Tr Ada Boost算法进行两方面的改进:一方面,Tr Ada Boost算法属于监督学习算法,算法需要训练样本的标记信息,而SSL-Ada Boost算法是一个半监督学习算法。按照半监督学习的要求,训练集由标记样本和未标记样本组成。因此,需要选取一定比例的训练样本为未标记样本,余下的为标记样本,从而兼顾了半监督学习的要求和算法的分类性能。为了进一步消除未标记样本对分类的不利因素,借助Semi Boost和AS-SEMBLE等算法的处理方式,利用训练集中的已标记样本,通过近邻计算求出训练集中未标记样本的类别。另一方面,Tr AdaBoost算法用于解决二类分类问题,而人脸表情识别却需要完成多种表情的识别任务。由于Tr Ada Boost算法可以看作Ada Boost算法的扩展,而Ada Boost算法是二类分类方法,本文可以借助一种用于实现多类分类任务的Ada Boost算法,即Ada Boost.M1算法,完成样本的多类识别。
SSL-Ada Boost算法的基本原理如下:
令Xs表示源域内和目标域数据分布相同的样本,Xd表示源域内和目标域数据分布不同的样本。令X=Xs∪Xd。
输入样本为两个部分标记的样本集合Td和Ts以及未标记样本集合S。其中,测试集S={(xit)},xit∈Xs(i=1,2,…,q),q为测试集样本的大小。训练集Tr由两个已标记样本集合Td和Ts组成。Td={(xid)},xid∈Xd(i=1,2,…,n),表示与测试集数据分布不同的训练样本集合,Ts={(xis)},xis∈Xs(i=1,2,…,m),表示与测试集数据分布相同的训练样本集合,n和m分别表示Td和Ts的大小。则训练集Tr={(xi)}被定义为:
令yi∈Y={1,2,…,l};i=1,2,…,n+m表示样本标记。集合Tr包含了标记样本和未标记样本。初始化参数设置如下:基础分类器为Weak Learn,整数N表示最大循环次数。权重向量W1=(w11,w21,…,w1n+m),其中权重上标1表示第1次循环。令,t=1,2,…,N。本文采用欧式距离最近邻法,依靠训练集Tr内的已标记样本,计算Tr内未标记样本的标记。
如果符合t≤N、εt<0.5的条件,算法开始循环:
(1)令第t次循环时,Tr的样本分布为;
(2)依据分布Pt,采用Weak Learn得到样本的分类结果ht:X→Y;
(3)计算样本的错误率,[π]表示如果条件π成立,则[π]=1。否则[π]=0;
(4)设参数βt=εt/(1-εt);
(5)更新权重向量:
如果达到收敛条件,算法结束,否则继续执行。
最后,输出最终分类器hf(x):
2 实验结果及分析
本文实验以人脸表情识别为应用背景,共分为两部分:多数据库条件下的半监督学习实验和多姿态条件下的半监督学习实验。
2.1 多数据库人脸表情识别实验
多数据库条件下的半监督学习实验采用180幅日本女性人脸表情数据库JAFFE(Japan Female Facial Expression)[14]的图像、240幅美国卡内基梅隆大学动作单元编码数据库CK(CohnKanade AU-Coded Database)[15]的表情峰值图像以及荷兰内梅亨大学人脸数据库Ra FD(Radboud Faces Database)[16]的57个成年人的342幅正面像。待分类样本分别具有生气、厌恶、恐惧、悲伤、高兴和惊奇表情,各数据库中每种表情的图像数量基本相等。因为要进行多数据库联合实验,所以在获取人脸图像后,对所有人脸图像进行尺度归一化,将图像大小设为168×120。然后,采用直方图均衡的方法对图像进行光照补偿。最后,通过PCA将数据维数降至40维,运用LDA实现对表情图像的特征提取。
为验证SSL-Ada Boost算法的效果,实验采用Ada Boost.M1算法、ASSEMBLE算法、Reg Boost[12]算法和标号传递(LP)算法[17]作为基线算法。实验以k近邻分类器作为Ada Boost.M1、Reg Boost和SSL-Ada Boost算法的基础分类器。设k值为11,算法的最大循环次数为10次。
首先,以JAFFE数据库为源域、CK数据库为目标域开展分类实验。按照表情类别,随机选取r比例的目标域样本和源域样本组成训练集,其中r分别取10%、20%、30%、40%和50%。因为实验采用180个JAFFE样本和240个CK样本,所以选取的目标域样本数量为r×180,余下的240-r×180个目标域样本组成测试集。令训练集中标记样本和未标记样本的比例为1。每个比例的样本数据各生成10组,算法识别率取10次实验的平均结果,实验结果如表1所示。从表1中可以看出,SSL-Ada Boost算法在不同比例下的平均识别率高于Ada Boost.M1和Reg Boost算法。再以CK数据库为源域、JAFFE数据库为目标域进行对比实验,结果如表2所示。从表2中可以看出,各算法的识别率普遍不高,原因在于JAFFE数据库中的表情个体为日本女性,民族和性别情况单一,对同一种表情的表达强度近似。CK数据库中的个体以欧美人群为主,民族及性别情况十分复杂,对同一种表情的表达强度不一。所以将CK数据库作为源域,极大地增加了识别难度,但是本文提出的SSL-Ada Boost算法仍在10%~30%的比例下保持了最高的平均识别率。
其次,以JAFFE数据库为源域、Ra FD数据库为目标域开展分类实验,结果如表3所示。从表3中可以看出,在不同的数据库下,SSL-Ada Boost算法在不同比例下的平均识别率高于基线算法。再以Ra FD数据库为源域、JAFFE数据库为目标域进行对比实验,结果如表4所示。实验结果表明,表3和表4的识别率高于表1和表2,原因在于JAFFE数据库和Ra FD数据库的民族比较单一,前者为日本女性,后者为白种人。相比之下,CK数据库包含了世界各地的民族,所以数据的特征空间和数据分布不一致的问题更严重,干扰了半监督学习算法的识别效果。
最后,以CK数据库为源域、Ra FD数据库为目标域开展分类实验,结果如表5所示。再以Ra FD数据库为源域、CK数据库为目标域进行对比实验,结果如表6所示。实验结果表明,SSL-Ada Boost算法在40%和50%比例下,相对于基线算法在识别率上仍具有优势。CK数据库和Ra FD数据库均以西方人为主,西方人对同一种表情的表达方式比较丰富,因此增加了识别的难度。
综上所述,SSL-Ada Boost算法在一定程度上克服了不同数据环境下的个体差异性对表情识别的干扰,有效地实现了对未标记样本的训练。与基线算法相比,SSL-Ada Boost算法在多数情况下具有更好的鲁棒性和识别率,对比实验证明了算法的有效性。
2.2 多姿态人脸表情识别实验
多姿态条件下的半监督学习实验选择Ra FD数据库和BHU数据库为实验对象。前者选取了57个人的6种基本表情、3个水平旋转角度(正面、135°和180°)的人脸图像,每个角度的图像数量为342幅。后者选取了8个人的两种表情(生气、高兴)、2个水平旋转角度(正面和水平旋转30°)的人脸图像。每个角度的图像数量为480幅。每种表情的图像数量相同。
首先,实验依靠图像处理软件,通过人工切分的方法,以前额发迹线到下颚为人脸的纵向切分范围,获取人脸图像,所有人脸图像的大小归一化为64×64。其次,通过直方图均衡化方法,对图像进行光照补偿。预处理后的实验样本如图1和图2所示。其中,图1从上到下分别为正面、135°和180°旋转角度的Ra FD数据库的表情图像;图2从上到下分别为正面和30°旋转角度的BHU数据库的表情图像。最后,采用LDA算法作为样本的特征提取算法。
实验采用Ada Boost.M1算法、ASSEMBLE算法、Reg Boost算法以及LP算法作为基线算法。分别以k近邻分类器(k-NN)或反向传播神经网络分类器(BP-NN)作为算法的基础分类器。从中选取识别率高的分类结果作为最终的实验结果。算法的最大循环次数设为10次。
首先,以Ra FD数据库的正面样本为源域、135°样本为目标域开展分类实验。采用k-NN作为基础分类器,设k值为3。随机选取r比例的目标域样本和源域样本组成训练集,其中r分别取10%、20%、30%、40%和50%。因为实验采用了正面及135°样本各342个,所以选取的目标域样本数量为r×342的整数,余下的342-r×342个目标域样本组成测试集。令训练集中标记样本和未标记样本的比例为1。每个比例的样本数据各生成10组,算法识别率取10次实验的平均结果,实验结果如表7所示。
其次,以Ra FD数据库的正面图像为源域、180°图像为目标域进行对比实验。实验采用BP-NN作为基础分类器。实验结果如表8所示。
表7和表8的实验结果表明:一方面,算法识别率随着偏转图像在训练集中比例的增加而提高。既说明了特征空间和数据分布相同的样本在分类中起到了很大作用,也说明了在样本特征空间和数据分布不同的情况下,基线算法仅依靠抑制误分类样本无法获得更好的识别效果。而SSL-Ada Boost算法依靠知识迁移,有效地运用正面图像的表情特征,克服了样本特征空间和数据分布差异对半监督学习造成的干扰,在大部分比例下取得了比基线算法更高的识别率。另一方面,偏转造成了人脸器官的遮挡以及大量表情信息的缺失,严重影响了算法的识别效果。基线算法在信息缺失与噪声干扰的情况下,仅依靠少量偏转图像的表情特征不能更好地完成半监督学习任务。SSL-Ada Boost算法通过知识迁移,将正面图像的表情特征迁移到偏转图像的分类器构建之中,降低了信息缺失造成的干扰。在多姿态条件下,SSL-Ada Boost算法具有较好的鲁棒性。
最后,以BHU数据库的正面图像为源域、30°图像为目标域开展分类实验。实验设置与表7相同。实验结果如表9所示。从表9中可以看出,在BHU数据库上,SSL-Ada Boost算法依然在识别率上保持了优势。多姿态条件下的实验结果证明了SSL-Ada Boost算法的有效性。
3 结语
本文提出一种新的半监督学习自适应提升算法。该算法借助迁移学习理论中的知识迁移方法,在多数据库条件下将数据分布不同的样本表情特征迁移到分类器的构建中,在一定程度上克服了不同数据环境下的个体差异性对表情识别的干扰,有效地实现了对未标记样本的训练。此外,在多姿态条件下将正面图像的表情特征迁移到偏转图像的分类器构建中,降低了信息缺失造成的干扰。实验结果表明,本文算法在多数据库条件下有效地提高了算法的表情识别率;在多姿态表情图像上取得了比基线算法更高的识别率。
摘要:针对半监督人脸表情识别算法在表情来源多样、姿态不一时准确率低的问题,在迁移学习自适应提升算法的基础上,提出一种新的半监督学习自适应提升算法。该算法通过近邻计算由训练集中的已标记样本求出未标记样本的类别,并借助Ada Boost.M1算法分别对多数据源的人脸表情样本和多姿态人脸表情样本展开识别,实现样本的多类识别任务。实验结果表明,与标号传递等半监督学习算法相比,该算法显著提高了表情识别率,且分别在多数据库和多姿态数据库上获得了73.33%和87.71%的最高识别率。
自适应学习 篇8
随着大数据 (Big Data) 技术和数据密集型科学的发展, 数据已经渗透到各个行业和业务功能中, 并已成为生产的一个重要因素。美国国家科学基金会提出了教育大数据研究的目标[1]:更好地了解人们在智慧环境中学习;通过对创新技术的教学设计和教学工具的学习过程, 提高学习和测试方法;将大数据融入学习环境中。在教育大数据理论的机遇到来时候, 带来了更多困难和挑战, 最突出的挑战是如何获得广泛的教育数据来源。随着成熟的信息技术环境的大数据技术, 学生的学习和评价不仅要关注学生成绩的评价, 而且要更加重视学生的形成性评价。文献2中的“促进与信息技术整合的教学建议部分”, 认为对智能化教学环境的建设, 提供优质数字教育资源、鼓励评价软件工具的发展。
二、国内外研究现状
学习经历 (Learning Experience) 指的是在学习过程中发生的任何一种互动或其他经验, 涉及课程, 程序或其他教学参与者。既可以在传统的学习环境中发生, 例如学校、课堂, 也可以在非传统的学习环境, 更能在像学习者的直接请教老师、教授传统的交互式教学情况或非传统的像通过学习游戏和互动应用学习的互动教学情境中。
通过现实生活中的复杂的社会系统的数据的开展探测挖掘, 例如使用包括传感器、GPS定位、智能手机等移动终端收集数据, 识别用户的日常社会背景的活动, 然后将实时数据和历史数据关联, 可以做人际关系的物联网。学习经验得到的数据更接近于“相关性”的实时数据流和历史数据, 这些数据将“数据流”在高地产的形式, 同时综合环境信息协会还需要获取和记录的数据流, 实现环境及个人信息空间。传统意义上的学习经验数据采集通常忽略环境信息的处理, 个人信息的数据主要是从描述性的反馈、绩效信息等任务完成的教育测量方式。
三、教育大数据个性化自适应学习模型
为了实现个性化自适应学习评价数据模型, 我们综合评价内容和评价结果的两个评价过程, 在此基础上, 建立个性化评价模型和自适应评价模型。通过学习活动来确定对学习者的学习行为通过个人评价内容评价的主要信息点, 对评价的个性化的学习过程和结果的基础上的层次评价模型评价和个性化评价的结果, 确定其学习水平。
1. 通过学习和学习活动为支撑的学习行为评价模型, 包括信息的学习行为和学习内容分割聚类分类系统分析不同功能的学习行为的研究内容分析个体学习评价模型的行为, 从而建立一个个性化的学习评价模型。该模型的内容包括四个部分:学习评价、评价、评价、考核和评价, 以及课外资源的评价。该模型的评价过程涉及到学生的正式学习和日常学习活动, 评价内容包括学科知识评价和非学科知识评价, 评价方法涉及定量评价和定性分析。
2. 基于大数据支持的仪器面板、报表和可视化工具的分析大数据个性化自适应分析方法。
学习仪表板提供了数据和报告的可视化分析, 方便个人做出关于教学和学习的决策。学习仪表板包括四个用户视图:学习者的观点, 教育者的观点, 研究者的观点, 以及组织视图。不同的视角是不同的, 但都是相互关联的。根据不同利益相关者的需求, 提供不同的数据显示。
四、结论
综上所述, 教育大数据的环境下, 论文详细分析了网络在线学习环境中师生学习经历数据的获取、识别、分析及交流与生成等基本的计算的理论和方法;阐述了大数据分析技术在网络在线学习模式中学习绩效评价需要解决的关键科学问题;根据研究成果构建了在线学习中学习绩效评价系统。
参考文献
[1]Dean J, Ghemawat S.Map Reduce:Simplified Data Processing on Large Clusters.Proc of 6th OSDI.San Francisco:USENIX Association, 2004:137-150.
[2]Dean J, Ghemawat S.Experiences with Map Reduce:an abstraction for large scale computation Proc 15th Inter-Conf on PACT.Washington DC, 2006:1-2.
[3]Dean J, Ghemawat S.Map Reduce:a flexible data processing tool.Communications of the ACM, 2010, 53:72-77.
自适应学习 篇9
随着Internet的快速发展,网络资源成为巨大的知识库,搜索引擎已经成为网络用户获取各种信息的一种重要手段。目前如Google、Baidu等大多数是面向所有信息的搜索引擎,可以称之为通用搜索引擎。随着信息多元化的增长,适用于所有用户的通用搜索引擎已经不能满足特定用户更深入的查询需求,他们对信息的需求往往是针对特定领域和面向特定主题的,此时通用搜索引擎的搜索效果难以满足有特定需求的用户。针对这种情况,一个分类精确、数据全面、更新及时的面向主题的搜索引擎——垂直搜索引擎应运而生。
聚焦爬虫是一个自动提取网页的程序,它为垂直搜索引擎从万维网上下载网页,是垂直搜索引擎的重要组成部分。它根据抓取目标有选择地访问网页和相关的链接,并获取所需要的信息。与通用搜索引擎的爬虫不同,聚焦爬虫并不追求大的覆盖,而将目标定为抓取与某一特定主题内容相关的网页,为面向主题的用户查询准备数据资源。本文从基于分类器的聚焦爬虫出发,以提高聚焦爬虫的爬行能力为目的,展开一个基于增量学习的自适应聚焦爬虫的研究,并把该研究应用于农业领域。
1 基于分类器的聚焦爬虫原理
基于分类器的聚焦爬虫是具有代表性的聚焦爬虫的早期研究之一,目前大多数的聚焦抓取都采用了类似的工作流程,其系统结构如图1所示。
根据一个主题目录和用户指定的初始点(如书签)来描述抓取目标,并在用户浏览过程中,将用户标注的感兴趣网页放人相应的主题目录,修改主题样本。系统的两个主要部分是网页分类器(classifier)和网页选择器(distiller)。网页分类器负责学习抓取目标的特点,计算网页的关联度,并过滤网页。选择器负责计算网页的重要程度,发现中心型网页,并由此动态决定网页的访问顺序。
早期的聚焦爬虫不考虑链接主题相关性分析,直接在网页分类器主题相关性分析后把保留下来的正向链接放到链接排序模块等待爬行url优先队列,提供给爬虫继续爬行。一般采用以PageRank[2]和HITS [3]为代表的基于网页链接结构的搜索策略,通过分析网页之间的相互链接关系来确定网页的重要性,进而决定链接访问顺序。该方法考虑了链接结构和网页之间的相互链接关系,但忽略了页面与主题的相关性。大量研究表明,PageRank算法只适合于发现权威网页,不适合发现主题资源;在某些情况下HITS会出现搜索偏离主题的“主题漂移”问题。
2 增量自适应聚焦爬虫设计
在基于分类器聚焦爬虫的基础上,为提高爬虫高效、准确的领域爬行性能,仅考虑链接重要性是不够的。本系统添加一个在线学习链接分类器对链接的主题相关性进行分类,它能通过学习来改进链接主题相关性的判断能力。并在链接排序模块采用TopicalRank考虑页面主题相关性和正向链接主题相关性相结合的url优先排序策略。
增量自适应聚焦爬虫系统由四个主要模块组成:爬行模块、基础网页分类器、在线增量学习自适应链接分类器、链接排序模块。其系统结构设计如图2所示。
图2中u初始时为种子,进入爬行后,是网页主题相关度和网页重要度都大且已经有效爬行了的页面。v指u网页指向的正向链接网页,v的网页可是主题相关或不相关。
2.1 爬行模块
从优先待下载的url队列中选择要优先爬行的url并抓取该url所指网页。爬行模块采用开源网络爬虫Heritrix框架来实现,它的出色之处在于可扩展性,通过扩展它的组件来实现自定义的抓取逻辑。爬行模块在抓取中可以获取完整、精确的站点内容包括文本和非文本信息,将内容存储到爬虫数据库。爬行模块采用多线程技术,以提高系统的处理速度。
2.2 基础网页分类器
基础网页分类器通过农业领域知识库来指导训练,这里设计的是一个Naïve Bayes分类器。研究表明Naïve Bayes是较快的一种分类方法,效果也较好,理论上错误率最低。该方法对于文本di,求条件概率P(cj|di),条件概率最大的那个类别作为最终选择类别,计算时引入Term独立性假设。
Beyes公式如下:
其中
从系统结构图上看新抓取下网页u,分析其正文内容,计算pr(c*|u)的概率,看u的主题相关性是不是大于设定的主题相关性阈值对u分类。内容分析时,分词采用中科院Java版分词工具ictclas4j。如果大于设定的阈值,则记录新页面的正向链接信息,如果小于阈值则放弃新页面正向链接信息。假设V是u所有正向链接的集合V=(v1,v2,…,vn)。基础网页分类器只是通过u的相关性大小来决定V的去留。现实中在一个网页上会有很多不相关的链接,如果只是不加处理地把所有链接都放到爬行对列中,会在下一轮爬行中爬出大量主题不相关的网页,虽然爬虫会对他们进行主题相关性分类处理Pr(c*| vn),并且不相关就不会再爬行这些不相关网页的正向链接,但是对这些网页进行主题相关性分类处理的过程显然会降低爬虫的爬准率。
2.3 在线学习链接分类器
为提高爬虫高效、准确的领域爬行性能,不能只靠u主题相关性来产生待爬行url优先对列。本系统中在基础网页分类器之后,再添加一个网页在线链接分类器。在线学习网页分类器是基于Naïve Bayes 分类模型的分类器,原理如基础分类器的分类模型一致,此处不再复述。本文关注的是其链接分类器提取特征的获取和在线自适应学习的实现。
2.3.1 链接分类器提取特征获取方法
文献[4,5,6,7] 链接分析方法,链接分类器提取的特征主要包括锚文本、链接上下文本、url地址。其中锚文本和url地址信息在网页中的位置处在链接附近有标签标记容易抓取到,考虑提高分析链接主题相关性的准确性,链接上下文的获取相对复杂一些,下面介绍一下链接上下文本的获取方法。
在计算链接主题相关性时,用HTML文档的标签树或者文档对象模型(DOM)结构来获取链接上下文。传统的链接上下文的提取原则是以链接标签为根的子树下的所有文本,作为链接上下文。现采用文献[4]提供的方法:以链接标签的祖先为根的子树中所包含的所有文本,作为链接的上下文。该根结点为聚合节点,即链接及相应上下文都在其子树下,因此当聚合节点为链接节点的父节点时,相关信息足够并且质量高。
2.3.2 在线自适应学习
在考虑自适应学习的链接分类器之前,系统用一个训练好的分类模型对链接进行分类。现实中时间的推移,爬虫爬行出来的链接会与最初链接分类模型的特征差别越来越大,系统爬到的网页会越来越少。很多时候不是说这些链接的主题相关性真的是越来越弱,而是因为该链接分类模型已不能最大、全面地体现该领域主题的特征,很可能把属于该领域的链接都过滤。本系统中采用的在线自适应学习链接分类器,能在一定程度上改变这种状况。
在爬虫爬行初期,爬虫数据库中只有少量已爬行的页面和这些页面的正向链接信息,此时的数据相关性比较大,但是数量比较小,在线自适应学习链接分析器没有足够的训练数据。因此,最初系统只是通过基础网页分类器获取正向链接提供给爬行模块去爬行,但这个状态非常的短暂,在线自适应学习链接分析器训练数据很快就能收集到。系统选取爬虫数据库中爬行到的主题相关度高前2000名的页面,和其对应的正向链接信息组成2000个实例作为在线自适应学习链接分类模型的训练数据。在这些链接有主题相关的,也有主题不相关的。链接分类器一旦训练完成,就可以对新产生的链接进行主题相关度分析。而且其自身可以通过爬虫数据库新进的主题相关度高的页面和页面的正向链接信息不断修正,提高其链接主题相关性的判断能力。
2.4 链接排序模块
在文章前部分提到基于网页链接结构的搜索策略:一般采用以PageRank和HITS。通过分析网页之间的相互链接关系来确定网页的重要性,进而决定链接访问顺序。这类方法考虑了链接结构和网页之间的相互链接关系,但忽略了页面与主题的相关性。
现参考一种将网页分类器和网页选择器合并考虑的搜索策略,将网页本身的主题相关程度融合到主题重要性TopicalRank[10]的计算中,网页在主题重要性的计算方法:
式中Rj(v)表示链接与领域的主题相关程度,这个数值由在线自适应链接分类器计算其链接相似度取得;O(u)表示网页的出度,这在基础网页分类器可以统计获得;α和β分别代表链接结构和链接主题相关性的权重系数,实验表明α为0.5,β为0.5时比较合适。公式中u初始时为种子,进入爬行后,是网页主题相关度和网页重要度都大且已经有效爬行了的页面,u指v网页的反向链接网页。
3 实验与结果分析
在农业信息化的时代,大量的农业信息分布在网络上,很多农民朋友的检索技巧不高,加上通用搜索引擎返回的搜索结果数量巨大,且主题相关性差的现实情况,通用搜索引擎往往很不易满足农民朋友想从网络上获得信息以解决现实农业相关问题的要求。建立一个农业领域垂直搜索引擎,让农民朋友快速、简捷、高效地获取分布在网络上的农业信息资源成了迫在眉急的任务。本实验设计定向抓取农业领域相关网页资源的聚焦爬虫,以期为农业领域垂直搜索引擎提供更多领域主题相关的资源。
现基于增量学习的自适应聚焦爬虫的设计思想,设计农业领域聚焦爬虫实验。把领域知识库改称农业领域知识库,用农业领域知识库训练分类器。农业领域聚焦爬虫负责从网络上下载农业领域相关的网页,并且保持与网络上资源变化的同步,它是农业领域垂直搜索引擎的基础。
评价爬虫的指标包括:爬准率和爬全率。爬准率是已爬行主题相关的网页数量/已爬行的网页总数量。爬全率需要爬行网站主题相关网页的条数,这个与爬行器的设置与终止条件以及是否使用穿越tunnel的技术都有关系,比较难以统计。本文主要考虑爬虫的爬准率。
现实中大量实践表明了聚焦爬虫比普通爬虫在领域主题相关性爬行性能优越[8,9],本试验不再进行两者之间的比较。本实验设计比较原始基于网页分类器聚焦爬虫(以下简称基础聚焦爬虫)与本文设计的农业领域聚焦爬虫的爬行性能。初始网站seeds为表1中的四个网站。选用的四个网站在农业领域中有一定的权威性,发布的信息质量高。
考虑分析规模,设定搜索深度为4,线程数10,初始种子为表1中的四个url,聚焦爬虫相关度阈值为0.2。待两爬虫正常运行一段时间后,随机分别抽取两聚焦爬虫同一时间段10分钟内的爬行结果如表2所示。
结果表明:在相同的实验条件下,两聚焦爬虫爬行的网页数量相差不多,但是农业领域聚焦爬虫爬行相关网页数量多,这主要是因为基础聚焦爬虫仅基于链接重要度分析的链接排序模块导致在url优先爬行队列中待爬的url比较多,这时需要分析处理很多主题不相关的网页,所以会出现爬得多但主题相关性反而少,最终使得爬准率也低的情况。
在实际系统应用中爬行规模会设置成搜索深度为20,线程数为80。当还使用表1中的站点作种子站点时,农业领域聚焦爬虫的到达爬行边沿的时间是3天,爬行的网页数量是211217,而基础聚类爬虫爬行的时间是3天,爬行的网页数量是200427。这表明在爬行相同种子站点,农业领域聚焦爬虫的爬行网页数量也是胜出一筹。
综合分析比较可知农业领域聚焦爬虫的主题爬行效果比基础聚焦爬虫好,在爬行农业领域主题相关网页中是有优势的。
4 未来工作
1) 研究聚焦爬虫的重爬策略,目前还只是人工查看爬虫何时到爬行边缘(不再下载或很少量下载),这对最后实现系统自动化是个障碍,所以研究爬虫自动重爬技术是未来的工作。
2) 基于领域本体知识的网页分类器。本文设计的网页分类器是基于Naïve Bayes 的分类器,未来考虑将领域本体概念分析方法放入分类模型中,将网页中的关键词在通过与领域本体对应的词典作规范化转换之后,进行计数和加权,算出与所选领域的相关度,这是分析网页相关度的另一个思路。
3) 本文增量学习的自适应聚焦爬虫的设计应用到农业领域,未来的工作还包括把这一体系结构扩展到如工业、服务业领域,期望通过改变领域知识库、分类器模型等来配置聚焦爬虫的爬行领域,具体实现方法还要进一步研究。
参考文献
[1]Chakrabarti S,Van DEN BERG M,Dom B.Focused crawling:A new approach to topiespeeifie web resource discovery[A].Proceedings of the Eighth International World-Wide Web Conference[C],1999.
[2]Page L,Brin S,Motwani R,Winograd T.The PageRank Citation Rank-ing:Bringing order to the Web[EB/OL].http://www-db.stanford.edu/~backrub/pageranksub.ps,January,1998.
[3]KLE1NBERG J.Authoritative sources in a hyperlinked environment[A]TARjAN RE,et al.ed.Proceedings of the9th ACM-SIAMSympo-sium on Discrete Algorithms[C].New Orleans:ACM Press.1997:668-677.
[4]Jingru Dong,Wanli Zuo,Tao Peng.Focused crawling guided by link context[J].Artificial Intelligence and Apphcations,2006,2(2):365-369.
[5]Lan Nie Brian D,Davison Xiaogumlg Qi.Topical link analysis for web search[C].Washington:SIGIR’06,Seattle,2006.
[6]Mohsen Jamali,nassan Sayyadi,Babak Bagheri Hariri,et al.A method for focused crawling using combination of link structure and content similarity[C].Washington:IEEE Computer Society,2006.
[7]Haveliwala TH.Topical-sensitive pageRank[M].Hawmi:In Proceed-ings ofthe Eleventh International World Wide Web Conference.Honolu-lu,2002.
[8]周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969.
[9]李刚,周立柱,等.领域相关的Web网站抓取方法[J].计算机科学,2007,34(2):137-140.
自适应学习 篇10
关键词:模型未知,神经网络,鲁棒,自适应
在有些系统控制实际应用中存在着这样的问题:被控对象解析模型完全未知或者是部分未知。在这种情况下,实现对系统实时的控制,一直是控制领域研究的焦点。网络自学习鲁棒自适应控制器为模型未知的,需要实时控制的系统提供解决手段。
1 网络自学习鲁棒自适应控制器
网络自学习鲁棒自适应控制器是一个复合控制结构,利用神经网络的学习能力和非线性映射能力,解决传统自控制系统中模型在线辨识和控制器在线设计问题,以达到对不稳定非线性系统的高精度输出的实时控制[1]。控制结构如图1所示,图中NNC与ANNM分别为神经网络控制器与辨识器,RC为比例控制器,在初期作为主要的控制器。
NNC与ANNM均为多层前馈神经网络。网络自学习鲁棒自适应控制器采用了典型的正逆模型建模法[2]:NNC作为逆模型与被控对象串联,作为控制器,网络的输入作为系统的期望输出,训练误差采用系统的期望输出与实际输出之差,NNC通过在线学习逼近系统的逆动力模型,并产生一个前馈控制信号,使系统的输出按要求的精度跟踪任意给定的输入。ANNM作为正模型网络与被控对象并联,作为辨识器,通过被控对象的输入输出进行学习,用来逼近被控对象的前馈动力学,ANNM作为误差信息反向传播的通道,用来训练NNC。
为了保证系统控制初期的稳定性和控制效果,实时控制器由一个神经网络和一个RC鲁棒控制器的加权组成,系统的控制输出为两个控制器的输出加权:
其中:un(k)为NNC的输出;ur(k)为RC控制器的输出,γ反应的是ANNM的辨识精度,称之为鲁棒因子。鲁棒因子的取值随着ANNM精度的变化而自适应的变化,变化规律可以用下面的式子表示:
其中:τ是鲁棒因子的变鲁棒系数;Em为ANNM输出与系统实际输出差的平方:
Em=21(ym-y)2(3)
这里采用RC控制器为固定增益比例控制器,其控制方程为:
γ有两种临界值:当γ=1,Em=0,表示ANNM辨识精度很高,可以准确的反应被控对象的特征。当γ=0,Em趋向∞时,说明此时ANNM辨识精度很差,不能作为控制器设计的依据。
2 存在的问题及其改进
1)由式(2)可以看出,鲁棒因子γ是一个介于(0,1)之间的变量,当γ∈(0,1)的时候,被控对象的输入为RC控制器与NNC的加权,信号经过并联的结构之后,输出的为混合信号,增加了神经网络自学习的难度。针对这个问题,调整鲁棒因子γ,变化规律为:
ε称为临界因子,当临界因子确定之后,鲁棒因子也就可以确定,即可确定当前时刻哪个控制器起作用。
2)另外在控制初期,是RC控制器在起作用,RC控制器的性能将决定系统的性能。当只有比例增益的时候,系统会存在稳态误差。另外,如果系统存在有较大惯性组件(环节)或有滞后组件,会使控制系统在克服误差的调节过程出现振荡甚至失稳。为了消除稳态误差,抑制震荡,在控制器中必须引入“积分项”和“微分项”。按照偏差的比例(P)、积分(I)、微分(D)进行控制的PID控制器,通过对比例、积分和微分系数设置可以消除稳态误差,克服震荡。然而,经典PID对复杂的非线性系统往往不能满足控制性能要求[3],这就要求PID参数能在线调整,以满足实时控制的要求。参考文献[4]提出了一种利用非线性特性来改进经典PID调节器以提高其适应性和鲁棒性的方法。
鉴于自适应PID控制具有的这两大优势:既能够自动整定控制器参数、适应被控过程参数的变化,又具有常规PID控制器结构简单、鲁棒性好、可靠性高、为现场工作人员和设计工程师们所熟悉的优点[5],文中采用自适应PID来替代RC控制器。
3)由式(2)可以看出,γ的值只与Em有关,Em为ANNM输出与系统实际输出差的平方。而NNC是用系统的期望输出与实际输出之差来进行训练的。如果控制器的切换仅仅与Em有关,是很不全面的。令:
er为系统的期望输出与实际输出之差。
控制器的切换由θ决定:
θ称为关键因子。当θ=1时,NNC进行控制;当θ=0时,PID进行控制。
3 改进控制器的性能分析
改进后的控制器如图2所示。图中两个开关的关闭将决定哪个控制器起作用,同一时刻只能有一个开关可以闭合。开关的关闭由θ决定。
在控制初期,ANNM处于学习的初级阶段,尚未收敛,精度较差,Em较大,对系统起作用的为PID控制器,PID可以自适应来保证系统的稳定性及控制精度。
在控制期,工作过程由三步组成:
(1)PID自整定,NNC控制β=1;
(2)NNC自学习,PID控制β=0;
(3)PID与NNC相互切换,交替作用。假定控制器:0表示控制效果好;1表示控制效果不好。控制过程如表1所示。
分析表1中的各种情况,大多数经过一两步的调整,就可以达到理想状态。即使是需要多步调整的状态,也是在具有自适应能力的PID与具有自学习能力的NNC的控制下,因为PID与NNC都可以自适应的调整自身的参数,控制状态将会越来越好。
4 结语
文中对模型未知已有控制器系统进行改进,选用的具有自适应能力的PID替代固定增益比例的RC控制器,并对控制方式进行调整。改进后的控制系统,NNC与PID所起的作用同样重要。控制器始终在具有自适应能力的PID与自学习能力的NNC之间切换,使改进后的控制器鲁棒性更好,控制精度更高。对于自适应PID与NNC来说,目前的研究很多,可以根据工程的需要,选择PID的自适应方法与NNC的学习方法。
参考文献
[1]何玉彬.神经网络控制技术及其应用[M].北京:科学出版社,2000.
[2]飞思科技产品研发中心.神经网络理论与mathlab7实现[M].北京:电子工业出版社,2005.
[3]王伟,张晶涛,柴天佑.PID参数先进整定方法概述[J].自动化学报,2000(3).
[4]韩京清.非线性PID控制器[J].自动化学报,199420(4):487-490.
交换端口自适应模式引发传输不稳 篇11
事件回放
某办公室最近组建了一个规模不大的局域网,网络中只有六台笔记本电脑,一台文件服务器,这些电脑和服务器全部通过六类双绞线连接到一台H3CS3050接入交换机中,并通过该交换机进行上网访问。由于网络规模不大,网络管理员也没有进行VLAN划分设置,所有计算机全部位于一个网段中,平时它们上网访问十分稳定,而且速度也是很快的。
最近,办公室中的一位员工尝试从自己的笔记本电脑中,拷贝一个大约10M的文件到文件服务器中时,居然耗费了几分钟的时间,这在以往的话,最多只要1分钟左右就能搞定。后来,他尝试与相邻的一台笔记本电脑进行文件传输操作时,发现网络传输速度也很慢,使用ping命令测试对方计算机的IP地址时,发现数据传输存在延迟现象。
排查故障
上面这种网络故障,在局域网环境中十分常见,造成这种故障的原因主要包括物理连接线路不稳定、局域网中遭遇病毒攻击、参数配置不当以及交换机负荷过重等因素,对于这些可能的因素,需要进行逐一排查。为了判断网络连接是否通畅,网管员使用ping命令测试了文件服务器的IP地址,发现这项操作响应时间还是比较短的,显然这种响应行为还是很正常的;在其他几台笔记本电脑中进行测试时,ping命令测试操作也很正常,这说明物理连接线路在连通性方面没有任何问题。后来,网管员怀疑局域网可能遭遇到了病毒攻击,于是从网上下载专业抓包工具,来进行数据抓包分析,结果发现网络中的数据流量没有什么异常的地方;使用超级管理员账号进入交换机后台系统,扫描查看每个交换端口的数据流量时,看到它们的输入数据包、输出数据包以及广播数据包都正常,这就意味着局域网中不存在蠕虫病毒攻击或黑客攻击的可能,而且局域网中也不存在网络环路现象。
联想到网络中使用的传输介质是六类双绞线,网管员怀疑问题出在这里,毕竟六类双绞线目前的布线成功率不是很高,那么究竟如何判断六类双绞线链路是否存在问题呢?思来想去,网管员决定找来一根连通性正常的超五类双绞线进行替代连接,毕竟局域网中的交换机、服务器、笔记本电脑使用的都是超五类端口;要是普通的超五类双绞线连接笔记本电脑与文件服务器以后,文件传输速度能够被快速提升的话,那就意味着六类双绞线的确存在问题。不过,当网管员替换使用超五类双绞线连接后,发现网络传输文件的速度还是和以前一样缓慢,显然问题与六类双绞线一点关系也没有。由于网络传输文件缓慢的故障现象在每台笔记本电脑中都出现,网管员:认为局域网中的交换机可能存在:问题,因为交换机工作时间长了之后,很容易发生系统缓存错误或者超负荷运行的情况,这些情况也容易造成网络传输文件很慢的故障;对于类似交换机这样的情况,往往通过重新启动交换机后台系统的方法就能解决问题。但是网管员尝试进行重启操作时,竟然没有一点效果。
返回到故障笔记本电脑系统,打开系统设备管理器窗口,从中展开网络适配器节点,用鼠标右键单击目标网卡设备,执行右键菜单中的“属性”命令,弹出目标网卡设备的属性对话框,在常规标签页面中网管员看到网卡的运行状态显示为正常,切换到高级标签设置页面,发现网卡设备的工作模式处于100M全双工状态(如图1所示),这种设置也没有明显的错误;在检查网卡设备绑定了哪些协议时,网管。员看到许多用不到的协议默认都被绑定到了网卡设备中,会不会是这些无效的网络协议干扰了网络连接稳定性呢?为了尽可能排除干扰,网管员立即将一些无关的网络协议全部卸载掉,再重新启动了一下计算机系统,但是故障现象依然存在。
解决故障
在万般无奈之下,网管员只好将目光再次聚焦到连接了所有计算机和服务器的交换机上。仔细观察每个端口的信号灯状态时,发现黄色的信号灯处于点亮闪烁状态,而正常情况下,应该是绿色的信号灯处于点亮状态呀,为什么会出现这种情况呢?重新进入交换机后台系统,查看相关端口的状态信息时,发现各个端口都处于UP状态(如图2所示),这种状态说明交换端口正处于工作状态;在查看其他一些状态信息时,网管员偶然看到交换端口基本都被设置成了自适应模式。
联系到之前查看到的网卡设备均处于100M全双工状态,按理来说,交换机端口与它相连的网卡设备应该使用相同的工作模式才对呀,会不会是交换端口自适应模式引发了网络传输不稳故障呢?尝试将交换端口的工作模式修改为100M全双工状态后,再在故障笔记本电脑中进行上网测试,结果发现文件传输速度立即恢复到了正常状态;继续在其他几台笔记本电脑中测试,发现以前的故障也都已经消失了,这说明上述问题的确是由交换端口自适应模式引起的。
揭密原因
上述问题虽然解决了,但让网管员感到十分疑惑的是,交换机端口之前一直处于自适应模式状态,为什么以前局域网传输很稳定,现在会出现这种问题呢?经过询问办公室员工了解到,他们当中有人在前几天上网查看资料时,偶然知道网卡端口的数据吞吐量在全双工状态下比半双工状态下高两倍;为了能将网速提得高一些,大家都跟着自行修改了网卡的工作模式,强行将端口自适应模式调整为了100M全双工模式,不过,调整之后,不但网络传输速度没有见快,而且还带来了传输不稳定的麻烦。
弄清楚了故障产生根源之后,网管员还是有点纳闷,即使网卡端口处于100M全双工模式状态,但由于与之相连的交换端口处于自适应模式,在该模式下网络传输应该不受影响才对呀?经过上网一番搜索后终于了解到,当交换端口处于自适应模式时,它一般会智能调整为和网卡端口同样的工作模式;要是网卡端口也被设置成自适应模式的话,那么交换端口便会和它进行自动协商,协商的顺序按照100M/全双工、100M/半双工、10M/全双工、10M/半双工模式进行,直到相互之间都工作于同样的传输模式为止。不过,如果网卡设备被设置成100M/全双工模式,那么交换端口的自适应模式,只能工作在10M/半双工状态,因为在这种通信情形下,网卡设备不会主动提供端口模式信息给交换端口,而交换端口由于
无法了解网卡设备的模式信息,于是会默认选择半双工模式进行工作,这样一来,交换端口与网卡端口的模式就会不匹配,最终造成了网络传输文件不稳定的故障了。
管理经验
为了不让交换端口影响整个网络的传输性能,我们有必要加强对交换端口的控制与管理,确保目标端口始终能够稳定运行。
控制端口流量
为了防止网络中的突发大流量“顶死”交换端口,很多用户会启用交换端口的流量控制功能,不过当同时启用了本地交换端口、对方交换端口的流量控制功能后,如果本地交换机意外发生了信息堵塞毛病时,本地端口就会智能向对方端口发送广播消息,及时提醒对方端口此时此刻不要继续向本地端口发送数据报文,而对方端口一旦收到对应的提示信息后,就会立即暂停向本地端口发送数据报文,如此一来就可以有效控制数据报文频繁丢失故障的出现。同样地,如果对方交换端口存在信息堵塞毛病时,对方端口也会智能向本地端口发送广播消息,来及时提醒本地交换端口此时此刻不要向对方端口继续发送报文,而本地端口在收到对应的提示消息后,也会立即暂停向对方端口发送数据报文。
在H 3C系列交换机中,要启用某个端口的流量控制功能时,只要先以系统管理员权限登录交换机后台系统,使用类似“interface e0/6”之类的命令,切换到目标交换端口的视图模式(如图3所示),同时在该模式下输入“flow-control”命令,按回车键后,那么我们就能成功启用目标交换端口的流量控制功能了,只是在缺省状态下,所有端口的流量控制功能都处于未启用状态。在流量控制功能正常运行的时候,如果用户想临时停用某个交换端口的流量控制功能时,可以先进入指定端口视图模式下,输入“undo flow-control”命令,按回车键就能达到停用目的了。
控制端口类型
以太网上网端口一般有trunk、access、hybrid等三种链路类型,其中trunk类型的端口既能属于一个Vlan,也能同时属于多个Vlan,甚至能属于所有Vlan,这种类型的交换端口正常用于连接类似交换机、路由器之类的重要网络设备,它可以同时接受和发送多个V1an的数据报文。相比而言,access类型的端口只能同时属于1个Vlan,该类型的端口往往只能用于连接一般的计算机设备。而hybrid类型的交换端口既能属于一个Vlan,也能同时属于多个Vlan,也可以同时接受和发送多个V1an的数据报文,这种类型的端口既能连接交换机、路由器之类的重要网络设备设备,也能用于连接普通计算机系统。在同一台交换机设备中,前面几种类型的交换端口能够同时共同存,只是hybrid类型端口与trunk类型端口相互之间无法直接切换,所以网管员可以先将指定交换端口设置为access类型,之后再调整为其他类型,缺省状态下所有交换端口的类型都被设置为了access类型。
在配置H3CS3500系列交换机端口的具体类型时,可以先进入交换机后台系统,使用“system”命令进入系统全局视图模式,通过“interfacee0/6”命令切换到指定端口视图模式,输入“port link-typeaccess”命令,按回车键后目标交换端口类型就被强行调整为access了,该交换端口一般只用于连接普通计算机系统。要将某个交换端口调整为hybrid类型时,只要在目标端口视图模式下输入“port link-typehybrid”命令,按回车键就能达到目的了,该端口既可以连接重要网络设备,又能连接普通计算机;如果输入“port link-typetrunk”命令,可以直接将指定交换端口类型调整为tnmk。
善于重启端口
交换机设备上正常会存在若干个交换端口,由于安全方面的原因,那些已经被开启了的交换端口如果工作状态不正常或暂时用不到的话,应该及时将这些端口工作状态停用掉,以防止恶意攻击通过该端口威胁整个网络的运行安全。一般来说,在指定端口视图模式下使用shutdown命令,就能临时停用目标交换端口的工作状态。比方说,在停用交换机第9个端口工作状态时,只要在交换机后台系统依次输入“system”、
“interfacee0/9”命令,进入第9个端口的视图模式,在该状态下执行“shutdown”命令就能停用指定交换端口的工作状态了,这时目标端口就无法正常转发数据报文了。
在实际管理、维护H 3CS3500系列交换机产品的时候,网管员应该善于使用“shutdown”命令,暂停使用一些流量不正常的交换端口,以避免整个网络出现流量堵塞故障,从而造成整个单位局域网无法稳定运行。日后,需要重启指定交换端口工作状态时,只要使用“undoshutdown”命令,恢复指定交换端口的设置即可,这时指定交换端口又可以正常转发数据报文了。在这里,建议大家日后在配置交换端口时,尽量不要开启运行所有的交换端口,平时需要几个端口就开启几个端口,如果轻易将所有端口全部开启的话,可能会拖累交换机运行性能,甚至还会影响整个网络的运行稳定性。
控制端口回路
在规模稍大一些的网络中,回路现象总是不可避免;要是出现这种故障,轻则导致上网速度缓慢,重则造成整个网络无法正常工作。而回路故障因为具有一定的隐蔽性,网管员在排查故障的时候很容易走弯路。为了快速排查网络回:路故障,现在不少型号的交换机都支持网络回路监控功能,善于使用这项功能,可以大大地提升网络管理效率!
自适应学习 篇12
在知识“爆炸性”增长的当今时代,各国教育的改革均把着眼点和立足点放在培养学生的素质、提高学生的能力上,由于学习者学习基础参差不齐,在学习的方法、能力、进度和效率上各有不同,这就决定了对于不同的学生教学过程、教学方法以及教学内容都应有所区别。传统的以课堂教学为主、面对面的教学模式因为受到时间和空间等诸多因素的限制,已日渐不能满足知识更新极快的现代教育发展的需要,而基于Web的远程教育采用异步交互学习方式,具有时空自由、资源共享、系统开放、便于协作等优点,打破了教育的时空限制,满足了学习的多媒体化需求,向学生提供开放式、自主式的虚拟学习环境。
1. NET简介
Visual Studio.NET是Microsoft公司推出的具有战略性发展的新一代开发平台,它将Microsoft公司所有编程语言的开发环境统一起来,可以创建、配置和运行Web应用程序和XML Web Service。在.NET框架中,所有的编程语言编写的程序都将生成托管代码,并且可以一次编写,随处运行。用.NET开发环境创建的Web应用程序和XML Web Service具有安全性、可伸缩性、高可用性以及与设备无关性的特点,通过使用XML Web Service,应用程序可以共享数据并调用其它应用程序。为此,我们在研究.NET平台支撑技术的基础上,结合SQL Service数据库系统,开发出基于.NET的自适应学习系统,给学习者创造一个良好的学习环境。
2 基于.NET的自适应学习系统总体设计
2.1 系统设计目标
基于.NET的自适应学习系统其总体目标为:在研究个性化网络多媒体教育关键技术的基础上,实现个性化、自适应的web学习环境。它集课程构建和学习、考试和测验、个性化学习策略和评估等功能为一体,为通过Internet学习的用户构建了功能完备,体现个性化特征的学习平台。
2.2 系统学习机制
自适应学习系统采用B/S模式构建,如图1所示。系统分为前台和后台,前台主要提供给学生进行学习,学生可依据自己的水平和需求选择相应的学习模式:知识点学习和案例学习。每次学习过程结束都会进入测试或考试模块,系统自动根据测试成绩对学习的状况进行评估,给学生提供下一步学习的参考学习策略。后台主要提供给教师进行常规的数据维护,包括对学生信息、教师信息、知识库、试题库、出题策略库、学习策略库等的数据的增减、修改、保存等。
2.3 系统功能结构
自适应学习系统其功能模块主要包括知识学习系统、测验考试系统、学习策略决策系统和数据维护系统四大功能模块,如图2所示:
1)知识学习系统提供学生进行学习的资源。它包含知识点学习和案例学习两种学习方式以及相关的练习和模拟实验。在知识点学习模式下,学习内容的组织由一系列相对独立而同时又具有内在联系的知识点组成,每个知识点都包含与本知识点相关的文本、图形图象、动画、视频等资源,学生可按传统学习方式进行学习;对于案例学习模式,模拟真实的实验环境,演示各种典型案例及其操作步骤,同时配以文字说明,学生可在观摩案例演示的基础上,自已动手进行实验,并对实验进行相关扩展。两种学习模式可以随时转换,互为补充。
2)测验考试模块的主要功能是对学生已学过的知识进行测试(针对知识点)或考试(针对整门课程),从而获得学生对所学知识的掌握情况。在这个模块中主要解决的是试题的抽取、试卷的组卷、试卷收集以及考试成绩分析等功能。
3)学习策略决策模块主要对学习的个性化信息进行分析与管理,向不同学生呈现不同的学习策略。当学生首次注册时,通过预先设定的测试,了解学生对本课程知识的掌握情况,从而安排学生对本课程的学习计划。在后续的学习过程中,通过对学习日志中所学知识点、访问时间频率、访问时间段、停留时间、访问行为等进行动态分析,了解学生的学习进程,而通过测试结果的分析,了解学生的学习效果,从而制定相应的学习策略,安排学生下次学习的内容。
2.4 数据库设计
在整个学习系统中包括了四个数据库,分别为:学习库、知识库、试题库和策略库。
1)学习库中主要包含与学生相关的信息表,如:学生基本信息表、学生学习情况表、学生测试情况表等。
2)知识库中主要包含与课程、案例相关的信息表,如:知识点表、知识点关联表、案例表、知识点案例关联表等
3)试题库中主要包含与试题相关的表,如:试题表、试题知识点关联表、试题答案表等
4)策略库主要包含与系统策略相关的表,如:组卷策略表、学习策略表、学习日志表等
3 系统关键技术及实现
3.1 组卷策略的自适应调整
测试卷的自适应组卷策略是指在测试的实施过程中,根据每一位学生在学习过程中的实际水平自动调节一份试卷中试题的类型、数量和难度,为每位学生提供与学生能力相适应的测试试卷。
针对各知识点的要求,把单知识点组卷策略按由易到难分为多个级别,事先存储在组卷策略库中。学生首次进行测试时任选一个组卷策略,并将组卷策略及学生的测试成绩保存到学习日志中。当学生对同一知识点进行多次测试时,若上次测试没有达到学习标准,选择低一级难度的组卷策略。若上次测试达到学习标准,则可选择高一级难度的组卷策略。
由于不同的组卷策略选取的题目难度不同,学生测试所得分数的比重也不相同,因此在计算学习测试成绩时应将学生测试所得分数乘以组卷策略对应的分数因子,才是学生真正的测试成绩。
3.2 试题难度系数的自适应调整
试题难度系数可由教师根据经验在录入时进行设定。此后可根据试抽题次数及学生答题正确的次数自动调整试题的难度系数。
设某试题难度系数分为E级,设定该试题抽取数达到n后对其难度系数进行调整,则该试题在达到抽取题数n的正确率p为:
其中,n A为累计正确答题的次数,n为试题的抽取次数。
若在n次答题后学生答题的正确率在30%-80%的范围之内,此时该题目的难度系数比较合适,否则需要调整其难度系数的值。调整方法为:
若p<0.3,题目较难,难度系数E+1
若p>0.8,题目较容易,难度系数E-1
每次难度系数调整过后,我们均将试题的抽取次数和正确答题的次数的值做清0处理。
随着考试次数的增加,本系统靠自学习不断调整试题的难度系数,使其能够适应考试群体的变化。
3.3 学生学习策略的自适应调整
在学习系统中,对每个学生我们将应学的知识点按知识点之间的联系进行动态拓扑排序,根据学生对知识点的掌握情况确定在拓扑序列中各知识点的状态,确定该学生的学习策略。
设所有知识点为Z0,Z1,…,Zn,知识点Zi对应的状态为Ri,对应测试成绩为Ti,则:
1)学生初始登陆后,创建学习拓扑序列S,将初设的知识点Z0加入到T中,R0=0。
2)若对S中的任一ZI,都有Ri≠0,则学生已学完所有知识点,可以进行课程考试。否则将S中所有R≤0的知识点按拓扑序列呈现给学生,由学生自由选择其中之一进行学习。
3)设学生选择Zm进行学习后,测试成绩为Tm,则:
若Tm≥60,修改Rm=-1,并将Zm的所有直接后继加入到S中,同时将所有加入结点的R值置为0。若Tm≥80,修改Rm=1。
若Tm<60且测试次数达五次以上,则在S中找到Zm的所有前导知识点,并将这些知识点的R置为-1。
4)返回2。
通过以上的算法,就可以自适应地针对学生对知识掌握程度,向学生呈现个性化的教学内容,保证了学生对每一个教学内容的掌握。
4 结束语
根据以上系统分析,我们采用Visual Stodio.NET 2005设计平台+SQL SERVER 2000数据库作为系统开发环境,开发出《Visual Basic程序设计》自适应学习系统,并在教学中加以应用,学生学习成绩普遍有所提高,师生反映良好。基于.NET的自适应学习系统是一种新的教学模式,有着较高的研究价值。今后除了根据学生每次学习测试的结果来确定其掌握知识点的情况来对应调整学习策略外,还可以收集、整理学习过程中产生的各类信息如学习时间,学习内容、学习频度,学习习惯、学习效果等,采用统计学、模糊数学、控制科学中的相关理论和算法进一步实现对学习数据的挖掘,自动获取学习过程中的动态信息,并以此对学习策略进行自适应调整,让学生更好地完成学习目标。
参考文献
[1]丛春瑜,刘家勋,于滨.一个基于Web的自适应学习系统[J].微型电脑应用,2004.2(9).
[2].王华波,朱亚平,王经.基于Internet的自适应测试系统的设计和开发[J].实验室研究与探索,2005.24(5).
[3].李一波,张溶溶.试题得分概率和答题时间概率分布自适应学习整定[J].计算机工程与应用,2005,17.