社会化标注系统

2024-08-06

社会化标注系统(精选5篇)

社会化标注系统 篇1

0 引 言

社会化标注将基于标签的信息组织理念应用于社会化软件, 通过标签在标注者和资源之间直接建立关联, 同时通过资源关联到资源作者, 通过使用行为关联到资源的使用者, 由此形成一个复杂的关系网络, 即社会化标注系统。它是社会网络服务理念在Web2.0环境下的拓展与延伸, 所有的网络资源都可以用它进行标注, 随着用户持续的需求和新技术手段的加盟, 目前成为海量网络资源的研究热点。

在社会化标注系统中, 构建合理的资源模型, 准确、客观地反映资源内容和特征, 是高质量信息检索得以实现的必要保障。资源模型构建的要求是能真实反映资源的内容, 以及资源与标签的关系, 资源模型包括了标签及权重两个部分, 传统资源模型中, 一般用较为成熟的文档权重计算方法TF/IDF为标签赋值, 由于资源的标签集描述了资源的基本语义[1], 权重的计算方法应该体现出网络的结构特征, 所以TF/IDF的简单结构不能有效地反映标签的重要程度和分布情况。为改善权重计算的不足, 本文用熵权重的方法对权重计算函数进行了改进。

1 TF/IDF方法

TF/IDF方法倾向于过滤掉常见的词语, 保留重要的词语, 在该方法中关键词的地位与社会化标注系统中标签的作用十分相似, 所以一般方法是用标签代替关键词, 将TF/IDF方法引入到社会化标注系统中, 进而给出标签在资源中权重的计算方法[2]。

在社会化标注系统中, 将TF理解为标签频率, 代表标签在资源中的标注次数, IDF通过统计标注系统中含特定标签的资源数, 以及系统中的资源总数, 来计算标签对资源的区别程度。因此, 对某一特定资源中的标签, 根据其标注次数及这些标签在其他资源中的出现情况, 通过TF/IDF方法计算其权重:

tf (i, j) =Ρ (i, j) i|Τ|Ρ (i, j) idf (i, j) =lg (|R|ni+0.01)

其中, P (i, j) 表示标签Ti在资源Rj中出现的频数, i=1|Τ|Ρ (i, j) 表示资源Rj中各标签Ti出现的频数之和, |Τ|表示标签的数量。|R|表示资源的数量, ni为包含标签Ti的资源数目。标签的重要性随着它在文件中出现的频数成正比增加, 但同时会随着它在整个资源集中出现的频数成反比下降。

使用TF/IDF算法的前提, 是假设对区别资源最有意义的标签应该是那些在资源中出现频率高, 而在其他资源中出现频率低的词语, 同时认为一个标签出现的资源频数越小, 它区别不同资源的能力就越大。以TF和IDF的乘积作为特征空间坐标系的取值测度, 用IDF完成对权值TF的调整, 调整权值的目的在于突出重要标签, 抑制次要标签。

在本质上IDF是一种试图抑制噪音的加权, 并且单纯地认为频数小的标签就越重要, 频数大的标签就越无用, 显然这并不是完全正确的, 实际上如果一个标签在一个资源中频繁出现, 则说明该标签能够很好地代表这个资源的特征, 这样的标签应该给它们赋予较高的权重, 并选来作为该资源的特征词以区别于其它资源。IDF的简单结构并不能有效地反映标签的重要程度和特征词的分布情况, 使其无法很好地完成对权值调整的功能, 所以TF/IDF法的精度并不是很高。

2 熵权重定义

在社会化标注系统中, 对于资源的收藏次数是无法在传统的文件特征提取中找到对应的行为, 有研究指出, 对于资源的收藏次数也的确影响到了标签的重要性[3]。在构建资源模型的过程中, 我们可以将用户标注的所有资源的主流标签进行加总后, 再进行归一化处理, 就能得到更为精致的模型。

本文利用信息熵概念对权重计算进行定义, 完善语义标注方法, 以便标签集更准确地表示资源语义, 权重定义由三个部分组成, 这样权值更接近于自然语言中标签与资源之间的关系。

2.1 局部权重

局部权重记作Pw (i, j) 并定义为:

Pw (i, j) =log2 (P (i, j) +1) (2)

其中, P (i, j) 表示标签Ti在资源Rj中出现的频数, “+1”是为防止出现P (i, j) 为0的情况。取对数方法能够很好地避免出现频率过高的标签掩盖出现频率过低的标签对生成潜在语义空间的贡献。

2.2 标签全局权重

单凭权重Pw (i, j) , 不能完全代表标签在资源集中的语义信息, 还需要有一个权重来衡量标签分辨资源的能力, 这里称之为标签全局权重, 通过计算标签在某资源中出现的情况下, 在其他资源中出现的可能性来衡量标签对判断资源相似性的影响。本文用条件熵来定义标签全局权重, 将资源集看作一个符合某种概率分布的信息源, 资源和标签为两个随机变量, 依靠资源集的信息熵和标签的条件熵之间信息量的增益关系确定标签在资源中所能提供的信息量。由此可以计算出标签确定的情况下, 其对应资源的条件熵, 定义标签全局权重Tw (i) 为:

Τw (i) =1+Η (R|Τi) =1-jΡ (Rj|Τi) log2Ρ (Rj|Τi) =1-j (Ρ (i, j) j=1|R|Ρ (i, j) ) ×log2 (Ρ (i, j) j=1|R|Ρ (i, j) ) (3)

其中, |R|表示资源的数量, j=1|R|Ρ (i, j) 表示标签Ti在整个资源集中出现的频数之和。H (R|Ti) 有可能为0, 在公式中“+1”, 是为了使Tw (i) >0。

2.3 资源全局权重

在社会化标注系统中, 资源的语义是通过它的标签集的语义来标注和解释的, 因此标签间的语义关系对资源的语义有非常重要的影响。根据互信息理论, 可以通过与标签伴随出现的其他标签来帮助确定其语义, 这里称之为资源全局权重, 用以描述资源集对标签所能提供的信息量。定义资源全局权重为:

Rw (j) =1+Ι (Rj, Τ) =1+Η (Rj) +iΡ (Rj|Τi) log2Ρ (Rj|Τi) =1+Η (Rj) -Η (Rj|Τ) =1+Η (Rj) +i (Ρ (i, j) i=1|Τ|Ρ (i, j) ) ×log2 (Ρ (i, j) i=1|Τ|Ρ (i, j) ) )

由于H (Rj) =-P (Rj) log2P (Rj) 为常数, 所以可以将1+H (Rj) 视为一个常数, 所以:

Rw (j) 1+i (Ρ (i, j) i=1|Τ|Ρ (i, j) ) ×log2 (Ρ (i, j) i=1|Τ|Ρ (i, j) ) (4)

其中, |Τ|表示标签的数量, i=1|Τ|Ρ (i, j) 表示资源Rj中各标签Ti出现的频数之和, I (Rj, T) 有可能为0, 所以在公式中“+1”, 是为了使Rw (j) >0。

2.4 权重公式

根据以上的分析, 权重函数可以由式 (2) 、式 (3) 、式 (4) 构成, 定义为:

W (i, j) =Pw (i, j) ×Tw (i) ×Rw (j) (5)

该权重公式的优点在于它把社会化标注系统当作了一个整体对待, 每个资源可被视为以标签为维度的空间中的一个点, 每个标签也可被视为以资源为维度的空间中的一个点。

3 验证分析

为验证提出的资源模型的可行性及效果, 笔者以Delicious系统为例, 抓取近20万条标注数据, 数据清洗后获得165个资源、1454个标签和12512个用户, 根据用户、标签、资源关系网络, 用上面讨论的两种权重定义式 (1) 和式 (5) 分别计算权值, 构建资源模型, 模型三维图形如图1、图2所示, 其中X坐标为资源, Y坐标为标签, Z坐标为权值。

用这两个资源模型分别进行两组标签检索实验, 并对实验结果进行分析。查全率和查准率是衡量检索性能的两个重要的指标, 它们可以反映检索效果, 首先由检索结果计算查全率和查准率并以横坐标为查全率, 纵坐标为查准率, 作查全率/查准率图 (图3) , 从图中可以直观地发现用熵权重公式计算权值的资源模型检索性能更佳。

再用查准率直方图比较两个检索实验的性能, 计算公式为:

RPA-B (i) =RPA (i) -RPB (i) (6)

其中, RPA表示基于熵权重的资源模型的标签检索查准率, RPB表示基于TF/IDF权重的标签检索查准率, 如RPA-B=0表示两个算法有相同的性能, RPA-B>0表示前者有较好的性能, RPA-B<0表示后者有较好的性能。计算RPA-B (i) 的值, 并据此画出直方图 (图4) , 由图可以发现, 前者检索性能在资源个体上也明显优于后者。

4 结束语

本文综合考虑标签在某个资源中的权重 (局部权重) 、标签在所有资源中的权重 (标签全局权重) 以及资源对标签权重所能提供的信息量 (资源全局权重) , 提出熵权重定义公式, 改进资源模型构建, 更贴切的反映了标签和资源的语义。并以Delicious系统为例, 对该资源模型进行了分析比较, 证明用改进的资源模型进行标签检索, 效果明显改善。

参考文献

[1]刘昌钰, 唐常杰, 于中华, 等.基于潜在语义分析的BBS文档Bayes鉴别器[J].计算机学报, 2004, 27 (4) :566-572.

[2]Niwa S, Doi T, Honiden S.Web Page Recommender System Based onFolksonomy Mining for ITNG’06 Submissions[C]//Proceedings ofthe Third International Conference on Information Technology:NewGenerations.Las Vegas, USA April, 2006:388-393.

[3]Razikin K, Goh D H, Cheong E KC, et al.The Efficacy of Tags in So-cial Tagging Systems.LNCS:Asian Digital Libraries.Looking Back10 Years and Forging New Frontiers.Springer Berlin/Heidelberg, 2007, 4822/2007:506-507.

社会化标注系统 篇2

用户逐渐成为互联网资源贡献的主体,由此导致互联网上的资源迅速增长,如何有效管理和组织这些资源逐渐成为用户面临的一个难题。协作标注系统(Collaborative Tagging Systems),即一种允许用户按照自己的理解和喜好选择特定词汇来标注资源、方便用户组织和分享互联网资源、基于Web的互联网系统,就逐渐进入人们的视野,那些被选择的词汇就被称为标签(Tags)[1]。协作标注系统是从2004年初开始发展起来的,比较著名的协作标注系统有Delicious、Flickr、Cite Ulike等[2]。

关于协作标签系统研究的一个重要问题,是系统中资源上的标签分布问题。Golder和Huberman通过研究实际的协作标注系统Delicious中实际运行的数据后发现,不同用户对某一资源上的标签使用情况会在一定的运行时间后达成一致,并且这种一致性会一直随着系统的发展而持续、稳定的存在。Valentin Robu等通过对现实的协作标注系统Delicious中收集到的数据分析,同样发现并验证了协作标注系统上的标签分布是典型的幂律分布,同时利用信息论中的KL距离验证了标签幂律分布产生的动态过程[3]。对于标签分布稳定性出现的机制研究,Harry Halpin等基于已被学界认可的标注三元组理论(UserTag-Resource) 模型[4,5],提出了用户标注行为的一个生成模型,认为用户在对资源做标注时,一方面要考虑自身的组织和检索资源的需求,另一方面也要受其他用户对于该资源所做的标签的影响,但该模型仅仅是在理论上可以解释,缺乏必要的数据分析验证模型本身的合理性[6]。

对于协作标注系统标签分布产生的内在机制,已有的研究或从数据统计分析角度验证了协作标注系统标签分布各种规律的存在,或是提出一些理论模型对各种规律进行解释,但对于基础和关键的用户标注行为并没有做深入的研究。Agent建模的方法,能够将复杂的模型简单化,通过设置一定的交互机制,较好的对现实世界中复杂的模型建模和分析难题。本文结合Agent建模仿真的方法,将仿真程序获取的数据分析结果与现实的协作标注系统收集的数据分析结果进行对比,从而验证本文提出的用户标注机制模型的合理性,以求为以后的相关研究提供一个新的思路。

2 协作标注系统中用户标注机制建模

2.1 信息值模型和优先连接模型

用户在标注具体资源时,综合考虑信息值模型和优先连接模型。

信息值模型是用标签信息值的大小来确定其在用户个人资源集合中检索目标资源的能力大小的模型,针对的是用户个人资源集和个人标签集,其值为0 到1 内的数,值越大则表示该标签在该用户使用空间中检索目标资源的能力越强。该模型相应的假设如下:

(1) 若一个标签t能检索出用户资源集合中的所有资源,则认为该标签的信息值I为0 ;

(2) 若一个标签t不能检索出用户资源集合中任意一个资源,则认为该标签的信息值I为0 ;

(3) 若一个标签t能够检索出用户资源集合中的n个资源,则认为该标签的信息值I为1/n ;

(4) 用户标签集合中不同的标签有着不同大小的信息值,当用户采用联合标签检索用户资源时,联合标签的信息值不等于各个分标签的信息值之和。

下面用一个抽象例子来说明信息值模型的应用。

在本文前面提到的信息值模型中,用户标注行为可以解释为:用户Ux1用标签ty来标注了,其实质就是用户通过一系列的标签来获得一系列的资源。遵从著名的“最小努力理论”,用户往往会在保证检索效率的前提下,注意控制个人空间中标签的总数,因为标签越多管理越费力。在前述例子中,用户u2想用一组标签来检索目标资源r2。在用户标签集合中,标签t1 和t5 都只能检索出唯一的资源,所以二者的信息值I(t1)=I(t5)=1,标签t3 能够检索出数据集中所有的资源,所以其信息值为0,即I(t3)=0,标签t2 和t4 能够分别检索出资源r1、r2 和r2、r3、r4,所以二者的信息值分别为1/2、1/3,即I(t2)=1/2、I(t4)=1/3,而标签t2 和标签t4 联合使用能够唯一检索出资源r2,故I(t2,t4)=1>I(t2) 和I(t4),即说明了联合标签的信息值并不等于各个分标签的信息值之和,见图1。所以,在该例中,用户使用标签t2 和t4 联合检索的效率最高,能够唯一检索出目标资源r2。

注:虚边及虚箭头代表了可能的选择,实边及实箭头代表了特定用户在对阴影资源检索实例的检索行为。

优先连接模型即“富者越富模型”,用户在为资源做标注时,往往会受到该资源上已有标签的影响,并优先选择那些使用次数较多的标签,这样会导致本来使用次数较多的标签使用次数会继续不断增加,已有标签和资源之间的联系会被不断加强。优先连接模型是导致标签出现幂律分布的主要原因。

基于对上述两个模型的理解,本文从用户的标注行为出发,综合考虑信息值模型和优先连接模型,提出了基于用户标注行为的用户标注机制模型,见公式(1):

式(1) 的前半部分体现了信息值模型的作用:用户在为资源做标签时,首先考虑的是自己组织和检索资源的需求, 表示用户空间中特定标签x检索资源能力的大小,其值等于标签x在用户空间中能够检索出的资源数目的倒数,其取值为0 到1 内的数;式(1) 后半部分体现了优先连接模型的作用:用户的标注行为还要受到其他用户对该资源已有的标注标签的影响,即在选择已有标签进行添加时,会在一定程度上受到他人标注情况的影响,具体到某一个标签x可能被标注的概率,R(x) 表示用户空间中已有的对标签x的标注次数,∑ R(i) 表示用户空间中所有的标签的标注次数,P(R(x)/ ∑ R(i)) 表示标签x被选择使用的概率。λ表示平衡参数,调节两个模型之间的比重,使其能够最合理地解释用户的标注行为机制。

2.2 用户标注机制模型框图

在现实的协作标注系统中,用户往往会使用2 到10 个标签来标注一个资源,为简化模型我们假设用户对一个资源只使用1 个标签标注。基于上面的分析,我们提出了用户标注机制模型程序框图( 图2)。

在图2 中用户的一次典型标注过程具体如下:程序每次随机选择一个用户Ui,该用户随机选择一个资源Rj,首先根据资源上的标签维度属性( 资源类的属性为标签)判断该资源是否被标注:

(1) 若该资源Rj从未被标注过,则随机从与资源无关的标签集( 即未标注过该资源的标签集合) 中随机选一个标签k,计算并确认标签k在该用户资源空间Ui中的信息值大于设定的最小信息值,则用该标签k标注该资源Rj,即表示完成一次标注;若该标签在该用户资源空间中的信息值不满足条件,则重新从无关标签集中选取一新标签并加以判断,直至满足条件为止;

(2) 若该资源Rj已被标注过,则分别有一定的概率选择新标签和旧标签,用随机数r表示。

若r>p,则选择旧标签,首先取出标注该资源的标签集合,然后根据模型公式(1) 计算集合中各个旧标签被添加的概率,随机取概率值较大的一个标签k,计算并确认标签k在该用户空间中的信息值大于设定的最小值,则用该标签k标注该资源Rj,即完成一次标注;否则,重新从标签集合中取,直至取得满足条件的标签为止;

(注:与资源无关的标签即为资源的“新标签”)

若r<p,选择新标签,则从与该资源无关的标签集合中随机选取一个标签k,且标签k在该用户空间中过的信息值满足条件,则用该标签k标注该资源Rj ;否则,重新从该无关标签集中选择,直至取得满足条件的标签为止。

基于图2,我们采用JAVA语言编程实现该程序,并获取运行数据用于仿真分析。

3 仿真分析及模型验证

本文设计的仿真程序的参数初始化为:100 个资源、200 个标签、50 个资源、λ 和p取一系列不同的值,分析得到的仿真数据,与获取的现实运行的协作标注系统中的数据分析(Delicious中数据) 结果进行对比。本文从标签幂律分布规律的检测角度对所提出的用户标识机制模型的合理性进行了验证。

在现实的协作标注系统中,占标签系统比例最多的是“非热门标签”,尤其存在很多属于用户私人的、标注次数很少的标签,这些大量的“非热门标签”是协作标签系统不可分割的一部分,对标签系统分布规律的形成有着重要的作用。因此,探讨这些“非热门标签”在标注过程中对标签分布所起的作用及其分布规律,能够验证我们提出的模型的合理性。

图3 表示Delicious中500 个资源的标注次数随时间变化的曲线,即500 个资源上的标注次数总体上都是不断增加的,其中有少部分增加趋势比较明显,这取决于资源本身的特性和其所处的环境不同[3],而对应的仿真程序中由于设定其资源是同质的,且资源选择时又是随机的,所以在运行足够多的步骤数后,每个资源被选中的累积次数是相近的,所以反映在图5 中为一条较为规律的递增曲线。 图4 中,程序一开始热门标签标注次数占标注总次数的比重很大,随着标注次数和标签数目的不断变化,曲线在横坐标为10 的点斜率发生急剧变化,在之后曲线变化规律趋缓,最终趋于一个稳定值,且该稳定值不会随着系统中标签数目和标注次数变化而发生变化。而对应的仿真程序数据分析图6 中,曲线虽然整体上不如图4 中的变化规律明显,但也能看出以横坐标为21 的点为界,前后两部分斜率也存在较大的差异,也能得出热门标签所占标注总次数的比例会随着时间变化而趋于一个稳定值的结论。总之,在上组图中,将图3 和图5 作为对照、图4 和图6 作为对照,分别从标签系统中标注次数比例随时间变化的规律和其中热门标签的标注次数占总标注次数比例随时间变化规律的角度,基于仿真实验数据和真实获取的统计数据的对比分析,验证了本文提出的用户标注模型的合理性。

4 结语

本文针对近年来涌现的协作标注系统进行研究,从用户的标注行为出发,借鉴该领域已有的研究成果,提出了一个用户标注机制模型,并结合Agent仿真建模方法,通过将对模型程序运行得到的数据分析结果与现实的协作标注系统Delicious中数据分析结果对比分析,验证了本文提出的模型合理性,为协作标注机制的相关研究提供了一种新的思路。

摘要:从协作标注系统的用户标注行为出发,提出综合信息值模型和优先连接模型,并建立一个新的用户标注机制模型,同时验证用户标注机制模型的合理性,为进一步开展相关科研工作提供一个新的角度。

关键词:云计算,协作标注系统,用户标注机制模型,Agent仿真

参考文献

[1]Au Yeung,C.M.From User Behaviours to Collective Semantics[D].UK:University of Southampton,2009.

[2]Tony Hammond,Timo Hannay,Ben Lund,et al.Social bookmarking tools(ll):A general review[J].D-Lib Magazine,2005,11(4).

[3]Valentin Robu,Harry Halpin,Hana Shepherd.Emergence of Consensus and shared vocabularies in collaborative Tagging Systems[J].TWEB,2009,3(4):1-34.

[4]C.Marlow,M.Naaman,D.Boyd,et al.Position paper,tagging,taxonomy,flickr,article,toread.In Collaborative Web Tagging Workshop[M].UK:Edinburgh,2006.

[5]P.Mika.Ontologies are us:A unified model of social networks and semantics[C]//In Proc.Of the 4th Int.Semantic Web Conference(ISWC'05).Springer LNCS,2005,3729.

无人机球面全景图像标注系统研究 篇3

无人机全景图像在应用中都需要对相关目标物进行标注,以达到在超大视野中快速查询目标物体的目的。无人机全景图与普通平面图不同,传统标注方法不再适用。本文采用射线拾取以及求交方法将计算机屏幕上的二维标注点精确标注在球面全景图的三维坐标上并进行标注渲染,使用球体外包装盒方法实现了无人机全景图片以球体形式展现给用户,该方法已研发成功并应用于相关领域。实践表明该方法标注精确度较高、操作简单,在相关领域发挥了重要作用。

1 无人机全景图像特征

1.1 无人机球面全景图像数据表达

球面全景图像是空间球面图像,球面上每一个位置都可表达为球坐标形式。对于球面全景图像来说,球面的半径可认为是一个常数,经常认为球面全景图像是半径为1的球体表面,所以球面像素的位置就由水平角和垂直角两个角度来表达。如果以水平角为横坐标、垂直角为纵坐标表达球面全景图像,则可将球面全景图像以平面形式重新表达,这种表达方式不会破坏像素间的相邻关系[1]。这样表达的球面全景图像水平角度为360°,垂直角度为180°,宽高比为2∶1。

全景图像由全景相机拍摄,360°的视角连续弯曲到平面图像上,x轴对应全景垂直方向角度,也可以称为全景图像的经线[2];y轴对应水平方向的角度,可以称为全景图像的纬线。

1.2 平面图像与球面图像变换

为了与球面全景图像区分,平面图像转换为球面图像后水平角度用α表示,垂直角度用β表示。

其中u0、v0表示图像的中心坐标,f为焦距。

将平面图像变换到球面如图1所示,其中球面的半径为1,是一个归一化后的单位球面[3]。根据公式可得到每个像素变换到球面后对应的角度。将平面图像进行球面变换后的结果如图1所示。

2 无人机全景图像标注算法设计

2.1 球体外包装盒的构造算法

为了图像显示更为逼真,本系统选择的外包装盒类似地球球体。OpenGL中所有的三维图像都由三角形构成[4],球体也由许多三角形构成。

对于球上任意一点P的坐标,可通过球形坐标来表示(用半径r、垂直角θ和水平角α来表示):

球的属性至少包括球心、球的半径、球体在水平方向的分块数目、球体在竖直方向的分块数目、球体网格顶点、球体网格中三角形索引。本系统通过定义索引来绘制三角形网格,在定义索引时按照先横向、后竖向原则循环。

2.2 射线拾取以及求交算法

OpenGL本身支持基于图像空间的拾取,这里指的是几何拾取,即由屏幕点击触发一条射线,然后和场景中的物体求交,进而得到交点。

OpenGL中的拾取是对OpenGL图形管线的应用[5],所以OpenGL中的拾取并不像D3D一样采用射线交叉测试来判断是否选中一个目标,而是在图形管线的投影变换(Projection Transformation)阶段利用拾取矩阵[2]来实现,如图2所示。

OpenGL利用投影变换中归一化视体操作来实现拾取操作。OpenGL会自动剪裁掉目标归一化视体之外的物体,如果把选择物体的方框转换为投影时的视体,OpenGL会自动将剩余的东西扔掉。OpenGL提供了选择模式glRenderMode(GL_SELECT),当进行拾取时,先进入这个模式,然后设定好选择框的大小,再为要选择的物体命名。接下来操作和投影变换就有异曲同工之妙:先把这个选择框归一化为边长为-1到1的正方体,然后移动到原点,最后放大到窗口大小(这时OpenGL把已选目标以外的东西剪裁掉了,如果这时要显示投影矩阵中的内容,就会只看到选择的东西,并且放大到和窗口一样大)。OpenGL会把选中的物体信息记录在一个叫做SelectBuffer的一维数组缓冲中,这个缓冲保存着名字栈中名字的个数,目标物体的最小最大深度值,也就是z的值,范围是0~1之间的值,也就是离视点最近的为0,最远的为1。SelectBuffer是个整型数组,所以保存的深度值是SelectBuffer乘以0xFFFFFFFF后的值。当然最重要的是储存了选择到的目标物体名字,这样,只要在程序中判断选择物体的名字,就可以判断是否选择到了要选择的目标物体。拾取过程如图3所示。

图3左边的正方体是已经归一化的视体,拾取时就在这个空间中进行操作。红色的小框是选择框,里面的红色就是选择到的物体一部分。要把这个小框转变为目标视体,目标物体才不会被OpenGL删除。首先,把选框移动到观察坐标系原点,接着,再进行归一化操作,这样,整个视体中就只有选中的目标物体了。图3(b)正方体展示了这个过程。目标视体外的东西已经被OpenGL删除了,选中的记录保存到SelectBuffer中。这些操作是在选择模式下完成的,因此看不到选择过程。如果非要将选择过程显示出来,就会看到图3(c)正方体的样子。在OpenGL中提供了这个设置拾取框函数:

其中x、y为鼠标点击到窗口上的横纵坐标,width和height分别是这个拾取框的长和宽,viewport是拾取框窗口大小。调用该函数后,OpenGL创建了一个拾取矩阵。

OpenGL的拾取过程就是利用图形管线中的投影变换实现拾取操作。系统中的拾取射线是球心在坐标系中的点发出的一条射线OA,OA与球会有一个交点B。因为图像附在这个球上,所以B也会在球上,由此实现三维图像的精确标注。

3 无人机全景图像标注系统设计

在设计无人机全景图像标注系统时,系统既要实现自身的特有功能,又能与其它侦察系统集成。因此,本文将系统自身的特有功能设计为可重用的功能模块,提供接口与外部系统进行连接,实现系统间信息交互。全景图像获取和显示流程为:1无人机全景图像获取;2无人机全景图像预处理;3浏览显示;4图像标记。

对该流程细化,根据各步骤设计功能模块。在无人机全景图像获取阶段,获取场景的不同造成全景图像数据描述属性值不同,为了通用性考虑,需要对全景图像数据属性值规范化描述。在全景数据应用阶段,根据不同应用功能具体划分应用模块。无人机的全景图像标注系统包括:无人机全景图像的外包装盒构建模块、无人机全景图像数据获取模块、无人机全景图像数据处理模块、无人机全景图像数据显示模块、无人机全景图像标注模块等。

4 系统运行

4.1 系统运行效果

图4为系统主界面。左上角为水平坡度仪,右上角为指南针,左下角为当前地图,中间图片为当前位置的全景图,下方为各个功能按钮,从左至右依次为:上下左右移动、缩小、放大、做标注、删标注、全屏、右自动旋转、左自动旋转、拼图以及导出flex文件。

图5是标注图,图6是标注后渲染效果。

4.2 系统优势

系统选择OpenGL进行渲染,相比于Direct3D更强大,支持更多平台,同时效率较高[6]。表1对比了当球体半径不同时,OpenGL与Direct3D渲染全景所需时间。

系统采用射线拾取及求交方法进行标注,理论交点与实际交点及误差如表2所示。

5 结语

本文在学习和借鉴国内外无人机全景图像标注技术和产品成果基础上,对全景图像标注技术作了深入研究,设计实现了无人机全景图像标注系统。具体研究内容包括以下两个方面:

(1)针对无人机全景图精确标注需求,提出射线拾取及求交方法,实验表明,该方法可以达到精度要求。利用OpenGL技术进行图形渲染,能满足效率要求。

(2)开发了无人机全景图像标注系统。介绍了系统框架结构和模块设计,展示了相关效果,验证了本文在全景标注和渲染过程中相关方法的正确性和可行性。

摘要:针对无人机全景图精确标注需求,分析了传统平面标注方法的局限性,从无人机全景图自身特点出发,提出了几点改进意见:1综合无人机全景图特征,使用球体包装盒将无人机全景图形象展现给用户;2考虑无人机全景图特征,将射线拾取及求交方法应用到标注中,达到精确标注;3使用OpenGL技术进行图形渲染,大幅度提高渲染效率。实验表明:上述改进适合对无人机全景图的标注。

关键词:无人机,全景图标注,OpenGL,图形渲染

参考文献

[1]CHEN YIGUO,PAN RIMING,SHEN SHEN.Design and realization of an image and GPS data acquisition system for UAV[J].Microcomputer&Its Applications,2012(1):40-42.

[2]邓廷起.无人机空中三角测量研究与应用[D].武汉:武汉大学,2011.

[3]邱起荣.矩阵论与数值分析[M].北京:清华大学出版社,2013.

[4]赖特.OpenGL超级宝典[M].张琪,付飞,译.北京:人民邮电出版社,2010.

[5]MARK J KILGARD.The OpenGL utility toolkit programming interface[EB/OL].Http://www.opengl.org.

[6]BRODTKORB A R,HAGEN T R,SAETRA M L.Graphics processing unit programming strategies and trends in GPU computing[J].Journal of Parallel and Distributed Computing,2013,73(1):4-13.

[7]NEHE.Blending[EB/OL].http://nehe.gamedev.net/data/lessons/lesson.aspolesson=08.

[8]SHAH R,NARAYANAN PJ.Interactive video manipulation using object trajectories and scene backgrounds[J].IEEE trans on circuits and systems for video technology,2013,23(9):1565-1576.

[9]MA CX,LIU YJ,FU QF,et al.Video sketch summarization interaction and cognition analysis[J].Science China Information Sciences,2013,43(8):1012-1023.

社会化标注系统 篇4

近些年来,依赖于在线的特征需求获取系统来进行抽取、分析和管理用户需求变更的软件开发项目的数量逐渐增加[1,11,12]。尤其针对大量网络化软件,一方面为项目管理者及时有目的的更新软件提供强有力的需求来源。另一方面,在线特征请求管理系统提供让用户提出自己的想法、提交自身需求的机会,让用户能够参与软件产品的更新和迭代。这种方式可以有效地激励用户参与到需求工程的过程中去,获取用户对产品真正的需求,进而开发出用户更加喜欢和需要的软件产品。

在线特征需求获取系统中,提供用户手工添加特征需求标注的功能,用户可使用他们认为具有代表意义的词来描述和分类所提出的特征需求。这些标注词可以被用来检索、描述、鉴别和分类不同的特征需求[2],是管理特征需求有效的工具。然而,我们在对一些特征需求获取平台的数据分析中发现,有很多的特征需求没有被用户手工进行标注,从而影响对这些特征需求进行有效的组织、检索和分类。主要原因是手工标注会增加用户的工作量,因此很多用户不愿意进行手工标注。

针对以上问题,本文设计并实现了一个特征需求自动标注系统,该系统可自动抽取特征需求中的标注词,一方面可以对没有被手工标注的特征需求进行标注词的补充,另一方面可以对用户新提出的特征需求进行推荐,减少用户手工标注的工作量。通过这个系统既可以提升特征需求检索的效果,同时使用标注词进行特征需求分类,帮助需求工作人员有针对性的分析,提高工作效率。

1 相关工作

1.1 在线特征需求获取平台

近些年来,在线特征需求获取平台已经成为收集用户需求的有效工具,它在软件系统的演化过程中发挥着十分重要的作用。随着利用在线特征需求获取平台来管理用户需求的软件产品越来越多,用户在线提出的特征需求数量越来越大,对特征需求领域的研究也在逐渐增加。在特征需求方面的研究领域,很多内容是围绕着如何针对大量的用户特征需求数据,高效地进行管理,以方便用户进行检索和讨论,同时方便需求分析人员进行需求抽取和分析而展开的。

J.Cleland-Huang[9]等希望通过对特征需求进行聚类来提高需求人员的工作效率。他们在现有开源社区中,对特征需求的讨论组进行分析,发现目前通过用户的经验来对特征需求进行归类不是十分有效。为此,他们提出了一种自动社区管理(AFM)的方法来对特征需求进行可靠、高质量的聚类。通过这种自动化的聚类方法,可以帮助开源社区对特征需求进行有效的管理,提高需求人员的工作效率。

Carlos Castro-Herrera[10]等利用推荐技术方便用户快速找到他们关注的内容,推荐一些新的特征需求给用户展开讨论,同时也提出利用数据挖掘的方法对产品的相关信息进行主题提取,将这些主题词的信息推荐给项目管理者进行进一步的分析。

与上面的研究不同的是,本文利用特征需求的标注信息对特征需求进行高效的管理。标注信息在特征需求获取平台中是常见的元素,被用来对特征需求进行检索、分类及内容描述。由于在平台中存在大量没有被标注的特征需求而降低了标注的作用。我们提出了一种针对特征需求的自动标注系统,一方面可以对没有标注的数据进行标注的补全,另一方面可以对新提出的特征需求进行标注词推荐,降低用户标注的门槛和工作量。通过这种方式提高标注在特征需求管理方面的作用。

1.2 文本自动标注

在特征请求获取系统中,用户提交的特征需求绝大多数都是以文本形式呈现。因此,对特征需求进行自动标注,其实是分析特征需求的文本,再对文本进行自动化标注的过程。文本的自动化标注是一个被广泛研究的课题,国内外已有很多的研究学者提出了自动化的文本标注方法。

文本关键词提取[4,5]是一种无监督的文本自动标注方法。这种方法的基本思想是计算每个词在文本中的重要程度。然而,关键词从某些方面来说与标注是有差别的。一些标注词可能不是简单的从统计的重要程度而挖掘出的“重要词”。协同过滤是一个被广泛用于推荐系统中的模型[6]。这个模型也被引入到了文本自动标注的方法中[7,8]。协同过滤的主要想法是相似的文本具有相似的标注,这个模型倾向于使用相似文本中出现频率高的标签,忽略了目标文本本身的特性。这个问题导致协同过滤导出的一些泛化的标注,同时可能导出一些与目标文本内容不符的信息。

上述方法都比较适合传统的文本标注,如文档、微博等。这些传统的文本往往在涉及内容较多,主题分布发散。而特征需求的文本倾向于集中描述一个特征内容,而这个特征内容是由多个关键词共同决定。因此,上述方法在特征需求自动标注方面不能取得很好的效果。

特征需求集中描述一个特征内容的特性,通常使用相关性模型[3]进行建模,另一方面考虑到相似的文本倾向使用相似标签的本质特性,本文将协同过滤模型和相关性模型相结合,采用一种协同相关性模型(CRM)的混合模型。这个模型首先通过协同过滤算法从整个训练集中找出与目标特征需求相似的文本和标签集合,然后基于过滤后的集合使用相关性模型进行自动标注。

2 系统分析与设计

2.1 系统总体功能分析

目前大部分的特征需求获取系统都是采用在线的形式,以方便用户提出自己的想法和需求,在线进行有效交流。为了方便日后集成到特征需求获取系统中,我们将系统设计为B/S结构,包括前端展示和后台处理两个模块。前端展示部分主要用于用户或需求工作人员输入新的或未被标注的特征需求文本信息,以及返回自动标注的结果。后台处理部分主要负责对特征需求相关信息的处理,包括数据抓取和数据库的建立、数据预处理、协同过滤模型获得相似集合以及相关性模型获得标注词等步骤。

系统的整体功能设计如图1所示。

2.2 特征需求数据库的设计

目前特征需求获取平台有很多,我们需要选择能够提供可靠数据的特征请求获取平台。同时自动化标注特征需求需要可靠的训练集,因此需要一个有标注信息的平台做依托。

通过爬虫程序在特征需求获取平台上抓取特征需求数据,每条数据包含如下信息:

1)特征需求基本信息:ID、题目、发布时间、标注信息、回复次数、浏览次数、URL;

2)特征需求内容及评论信息:ID、用户、特征需求内容、评论内容、发布时间、回复次数;

3)用户信息:用户名、注册时间、发表特征需求个数。

本文的工作只用到了特征需求的题目、内容和标注信息,其他的数据是为了以后的工作做进一步扩展而准备。

2.3 数据预处理

数据预处理包含对特征需求题目和内容的切词以及对标注信息的切分两个步骤。对于训练集合中的每一条特征需求的题目和内容进行词切分,对于英文数据直接通过英文特有的空格将词进行切分,对于中文数据可以采用中文分词工具ICTCLAS来完成分词功能。通过分词步骤,对于每一个特征需求产生一组描述信息的词向量D={w1,w2,…,wm}。对于标注集合的切分,一般标注集合各个词之间使用逗号隔开,因此可以根据逗号方便的对标注词进行切分。通过对标注集合的切分,每一个特征需求也产生了一组标注信息的词向量A={a1,a2,…,an}。

2.4 自动化标注过程

通过对特征需求文本的分析,我们发现特征需求有两个方面的主要特点:

1)与文档、微博、电影描述这种传统文本相比,特征需求倾向于集中描述一个或两个特征,而突出的特征是由很多关键词共同决定的;

2)存在文本所拥有的共同特点:相似的特征需求倾向于使用相同的标注。

针对第一个特点,通常使用相关性模型来解决,这个模型目前主要应用于图片标注领域。而针对第二个特点,文本标注领域倾向于采用协同过滤模型。因此,本文将协同过滤和相关性模型结合,提出了一种协同相关性模型CRM来对特征需求进行自动标注。我们将CRM应用于自动标注系统中,使得整个系统的标注效果有了明显的提升。

2.4.1 获得相似集合

获得相似集合阶段主要使用协同过滤(CF)的方法,找出与目标特征需求文本相似的特征需求数据,构成下一阶段依赖的数据集合。这一阶段的作用在于,一方面减少训练数据的数量,从而降低下一步中相关性模型执行的复杂度。另一方面,过滤掉与目标特征需求无关的数据,避免无关数据会带来的噪音,从而提升模型的准确性和有效性。该过程大致可以分为以下几个步骤:

1)对于每一个未标注的特征需求或用户输入的新的特征需求,按照上一节中数据预处理的方法,对其题目和文本进行分词;

2)针对所有特征需求中的每一个词,计算词在文本中的重要程度。本文采用传统的TFIDF算法来计算每一个词的权重;

3)将训练集合中的每一条特征需求依次与目标特征需求进行文本相似度计算。基于步骤2)中词的权重,采用传统的空间向量模型(SVM)进行相似度计算;

4)按照相似度从大到小进行排序。提取出排在前面λ个特征需求的文本和标注信息放入相似集合T'中,为下一步执行相关性模型的计算提供集合。

2.4.2 获得标注词

基于上面步骤中获得的相似集合T',我们采用相关性模型(RM)进行标注词的导出[3]。RM在自动标注过程中,希望通过计算获得标注词与内容文本共同出现的联合概率。根据这个联合概率值对每个候选标注词进行排序,从而返回固定数目的标注词。RM在概率值计算公式推导的过程中,使用了一元语言生成模型和独立性假设。

在此基础上,我们将协同过滤的思想引入模型中。本文假设在RM中每一个特征需求模型,在所有数据集中抽取出来的概率是正比于它与目标特征需求的相似度。同时,如果特征需求模型与目标特征需求不相似,则其被抽取的概率会很小而被忽略。因此我们可以将标注词与内容文本共同出现的联合概率公式写为:

这里,M代表相似集合中的每一个特征需求,即为一个特征需求模型,‖T‖代表训练集合T的大小,‖M‖代表文本中的词和标注词总共的数量和。N(w,M)代表词w在M中出现的次数,N(w,T)为训练集T中包含词w的数据条数。N(t,M)和N(t,T)与N(w,M)和N(w,T)有相似的含义。α和β是两个平滑参数,我们通过实验对α和β的不同组合进行验证,通过优化正确率和召回率来筛选出最有效的平滑参数组合。

根据上面的公式计算出每个标注词出现的概率。根据概率对标注词进行排名,将排在前面的k个词作为自动标注的结果返回给系统。这样就完成了整个自动标注系统的流程。

2.5 系统应用流程展示

我们将使用这个系统的用户分为两种角色:一类是提出特征需求的用户,一类是需求工作人员。当用户在特征需求获取平台上提出一个新的特征需求的时候,会使用到该系统对新提出的特征需求进行标注词推荐,降低用户的工作量;当需求工作人员需要对部分或所有的特征需求进行标注词提取的时候,会使用该系统对选择的特征需求进行自动标注。同时,两种用户都可以使用系统通过标注词进行相关特征需求的检索和查看。

用户在提出新的特征需求时,可以通过右侧的文本框填写特征需求的题目和内容信息。为了降低用户手工标注的工作量和门槛,在输入完特征需求的信息后,用户点击工具右上方的“标注”按钮,则系统会进行自动标注,返回五个结果标注词给用户。用户可以选择他们认为合适的标注词提交给系统,或者手工输入其他标注词。用户选择和输入完毕后,点击“提交”按钮完成标注过程。图2展示的是提出特征需求的用户使用工具时的情况。

需求工作人员用户进入工具时,页面的左侧先展示的是目前平台上用户提出的所有的特征需求的题目和内容,如果特征需求被用户手工标注,则右侧会展示标注信息,没有标注信息的特征需求不展示特征需求。需求工作人员可以通过每个特征需求右下角的选择框来选择需要进行自动标注的特征需求,可以对已经手工标注的特征需求进行选择表示需要系统从新自动标注。或者点击“全部选择”按钮来选择所有特征需求。需求工作人员选择好需要自动标注的特征需求后,点击“标注已选”按钮,则可以完成自动标注。返回的标注词在每个特征需求的右侧展示,同时附带该标注词在整个集合中被使用的次数。需求工作人员可以点击标注词查看所有和该标注词有关的特征需求,详细介绍在图4给出。图3展示的是需求工作人员使用自动标注工具的情况。

图4显示的是通过标注词检索相关特征需求的工具页面。用户或需求工作人员可以通过图2或图3中点击标注词进入该页面,或直接进入该页面进行标注词的键入和搜索。对于确定的词,系统返回使用这个词进行标注的所有的特征需求。用户或需求工作人员可以通过点击返回结果中每一条信息查看特征需求的详细内容。

3 实验结果与分析

为了验证系统的有效性,本文从IPS Community平台的数据库中抽取了418条用户提出带有标注信息的特征需求进行实验。IPS Community平台是产品Poweramp的在线用户社区,这个社区拥有13 178个注册用户,提供用户进行在线讨论、提交特征请求、提交bug等功能。通过对实验数据集合进行信息统计,用户自行标注的词数量总计864个,平均每个特征需求有标注2.067个。我们对存在标注的418条特征进行人工分析,对特别不合理的标注词进行修改和删除,产生标准的数据集合,提供训练和测试。

3.1 评测指标

为了方便地进行特征需求自动标注效果的评测,本文采取正确率(P)、召回率(R)、F值(F)对自动标注结果进行评测,公式为:

对于每个测试目标特征需求,Nc代表自动标注的结果与原标注相同的个数,Np代表自动导出的标注词的数目,Nt为实际特征需求所有的标注数量。模型在测试集合上的效果是通过对每一个测试数据的指标进行加和平均得到的。

我们将平滑参数设置为α=0.7以及β=0.2,参数λ设置为λ=50。我们根据实验得出在这样的参数设置下CRM取得最好的效果。在我们的实验中,自动标注的词的个数Np分别取值1到5来进行实验验证。对比标准数据集,我们采用十折交叉验证,即将数据集随机平均分为十份,在每一次的训练测试过程中,选择九份作为训练集合,剩下的一份作为测试集合,过程反复十次,最后将每一次的指标进行加和平均,得到最后的实验结果。

3.2 实验结果与分析

为了说明协同相关性模型的有效性,我们实现了一系列文本自动标注模型作为比较。TFIDF[4]是一个具有代表性的关键词提取方法。协同过滤(CF)[7]是一个典型的使用广泛的自动标注方法,它基于的假设是相似的文本倾向于使用相同的标签。RM[3]是传统的相关性模型。

在图5中,我们展示了TFIDF、CF、RM和CRM在标准数据集上的正确率—召回率的曲线图。在图中,曲线图中的每一个点分别代表自动标注词的不同数目,Np的取值从1到5。对于每一个曲线,代表Np=5的点在曲线图的左上方,而代表Np=1的点相反在图的右下方。方法的效果越好,则曲线就越接近整个图的右上方。从图5我们可以看出:

1)CRM的效果对比其他模型有明显的提升。我们的模型与表现最差的RM相比效果约提高了15%,与表现最好的基线模型CF相比效果也提升了约10%。这充分证明了CRM方法在特征需求自动标注方面的有效性。

2)在对比实验中,RM的效果比较差,而CRM的效果最好,CF的效果次之。这说明在自动标注过程中,只特征需求集中描述的特点是不够的,相似的文本倾向于使用相同的标注这一特征十分重要。

为了进一步说明CRM和其他基线的效果,在表1中,我们展示了在标准数据集上5个模型的正确率、召回率和F值。我们选择Np=2的情况作为例子,因为平均每个特征需求存在的标签数目接近2个。

4 结语

本文将研究范围定位在特征需求的标注领域,设计了一种针对特征需求的自动标注的系统,对未被标注和用户新提出的特征需求进行自动化的标注,以提高标注对特征需求有效的检索和管理的作用。我们对特征需求的文本特点进行了细致的分析,得出特征需求的文本存在两方面的特性:特征需求倾向于集中描述一个或两个内容,而这些内容是由文本中很多的关键词共同决定的;相似的文本倾向于使用相同的标注词。根据特征需求的这两个文本特性,我们将协同过滤方法和相关性模型结合,提出一种协同相关性模型(CRM)。与传统的相关性模型RM不同,对于目标特征需求,CRM首先使用CF过滤出与目标特征需求相似的数据组成集合,基于这个集合使用RM进行标注词出现的概率计算,从而导出自动标注的集合。我们采用一个真实的数据集合进行试验,与其他传统的文本标注的模型相比,CRM的效果明显优于其他模型方法,准确率最高可提高15%,最低提升10%。通过对比实验证明了我们的系统在特征需求自动标注方面的有效性。

当然,我们的系统也存在着一些不足。对于经常被提到的特征需求,由于存在大量相似的训练数据而使得自动标注的效果较好。而对于较少被提到的特征需求,因为缺少足够的相似文本作为参考,使得模型得出的标注效果较差。系统十分依赖训练集的质量,如果训练集中的数据本身标注质量不高,则系统得出的效果会受影响。对于训练集中没有出现的标注词,系统不会导出,即协同相关性模型只会使用训练集中出现过的词进行标注。这些方面都是是以后值得考虑改进的方面。

参考文献

[1]Fitzgerald C,Letier E,Finkelstein A.Early failure prediction in feature request management systems[C]//Requirements Engineering Conference(RE),2011 19th IEEE International.IEEE,2011:229-238.

[2]Xia X,Lo D,Wang X,et al.Tag recommendation in software information sites[C]//Proceedings of the Tenth International Workshop on Mining Software Repositories.IEEE Press,2013:287-296.

[3]Jeon J,Lavrenko V,Manmatha R.Automatic image annotation and retrieval using cross-media relevance models[C]//Proceedings of the26th annual international ACM SIGIR conference on Research and development in informaion retrieval.ACM,2003:119-126.

[4]Turney P D.Learning algorithms for keyphrase extraction[J].Information Retrieval,2000,2(4):303-336.

[5]Salton G,Buckley C.Term-weighting approaches in automatic text retrieval[J].Information processing&management,1988,24(5):513-523.

[6]Sarwar B,Karypis G,Konstan J,et al.Item-based collaborative filtering recommendation algorithms[C]//Proceedings of the 10th international conference on World Wide Web.ACM,2001:285-295.

[7]Mishne G.Autotag:a collaborative approach to automated tag assignment for weblog posts[C]//Proceedings of the 15th international conference on World Wide Web.ACM,2006:953-954.

[8]Sood S,Owsley S,Hammond K J,et al.TagA ssist:Automatic Tag Suggestion for Blog Posts[C]//ICWSM,2007.

[9]Cleland-Huang J,Dumitru H,Duan C,et al.Automated support for managing feature requests in open forums[J].Communications of the ACM,2009,52(10):68-74.

[10]Castro-Herrera C,Cleland-Huang J.Utilizing recommender systems to support software requirements elicitation[C]//Proceedings of the 2nd International Workshop on Recommendation Systems for Software Engineering.ACM,2010:6-10.

[11]Maalej W.An Overview of Recommender Systems in Requirements Engineering[J].Managing Requirements Knowledge,2013:315.

社会化标注系统 篇5

技术变革教育, 技术的创新对教育的发展有着至关重要的影响。20世纪末, 关于数字视频技术的教学研究逐步兴起, 各种基于视频的方法被用于促进教师教育的发展。教师在课后对自己的课堂教学活动进行深刻的探究、反思与总结, 以及获得专业人士对自身教学行为的诊断、点拨与建议是提高教师专业技能的重要途径。但是传统的课堂诊断受到时间、地点、人力、物力等诸多因素的制约, 不便于对教师的课堂教学做出及时而又确切的判断。随着技术的不断进步, 研究者逐步探寻出一种新的课堂诊断方法———课堂教学视频远程诊断, 实践证明, 教学视频技术以及视频标注技术对教师教育发展做出了巨大贡献。

本文主要介绍了课堂远程诊断系统, 视频标注技术以及视频标注技术在课堂远程诊断系统中的应用设计, 希望为广大的教师和教育工作者提供一个便捷实用的评课诊课、互动交流、资源共享的平台。

1 课堂远程诊断系统

“课堂诊断”也称“课堂教学诊断”, 一般是指诊断者通过对课堂教学全过程的看、听、问等手段, 在理性思考的基础上, 探究与发现执教老师的教学经验与特色, 并发现与研究教学过程中存在的问题, 及时提出相关的改进策略的教研活动[1]。课堂诊断是以课堂现实情境为研究对象, 在观摩教学的基础上对各个教学环节深入分析, 从教学目标、教学内容、教学手段、教学策略、教学效果、教学反思等方面分析教学亮点和问题, 针对存在的问题提出具体可行的解决方案, 帮助教师改进教学中的不足。而传统的课堂诊断存在的不足已然制约了其应有功能的发挥, 课堂诊断缺乏具体性和专业性, 教师同事之间的互评缺少纵向上的专业引领, 使得课堂教学急需得到专家的点评和指导。然而专家进入课堂参与教学诊断容易引发课堂的非真实性, 而只有基于真实课堂的研究和分析才能保证诊断的效果[2]。

课堂诊断的研究不断深入, 已有研究者设计出基于web的课堂教学远程诊断系统, 专家和教师通过网络对课堂教学视频诊断反馈和学习反思。随着3G、4G网络的大范围覆盖, 智慧教育逐渐成为现实并不断发展, 学习已不再仅仅发生在固定场所, 人们对泛在学习的需求日益扩大。因此, 本文所研究的“课堂远程诊断”, 是运用移动开发技术, 设计开发出可以在移动终端 (例如手机、平板等) 上使用的“课堂远程诊断系统”客户端, 其工作流程是:教师采集、上传教学视频—专家诊断、反馈—教师获得反馈、进行教学反思 (如图1所示) 。

2 视频标注技术

最早使用视频标注的网站是全球最大的在线视频网站You Tube, 在其Flash Player (8.5) 版本中增加了视频标注的功能, 可以使上传视频的用户有权给自己的视频加标注信息, 内容可以是文字、链接和图片。视频标注方便了用户记录浏览心得、共享给其他用户或者方便自己查看和反思, 因此, 众多学者在视频标注工具的开发和应用方面投入了较多的精力, 在教育应用领域方面, 国内外研究成果不在少数。

目前国外一些大学开发了许多视频标注工具, 比如, MEDIATAGGER、ANVIL、VIDEOTRACES、MEDIANOTES、VAST、VITAL、STUDIOCODE、DIVER、VAT、IVAN和TRANSANA等[3], 这些视频标注工具在传送模式、标注方式、协作和相关数据链接等方面有所区别, 在传送模上分为单机版、网络版和单机应用上传网络;标注方式包括自创标签添加注释和体统提供标注标签;协作方面, 有的不支持协作, 有的支持多用户标注同一视频;数据连接功能方面部分平台可链接相关资源, 部分平台不支持链接其他数据。用户可以异步或者同步观看视频, 对视频进行诊断或者评论, 在具体点上精确的同步反馈。有些软件还支持通过网络上传标注过的视频, 与其他反思者共享, 而别人也可以对其展开进一步的评论, 从而共同建构反思。

国内很多学者和在校研究生在此基础上也纷纷设计和开发出各种视频标注小系统用于课堂教学视频分析, 比如华东师范大学姜晓辉2011年的硕士论文, 研究的是教学视频共享平台中视频标注工具的应用研究, 旨在将视频标注工具合理应用在教学视频共享平台中, 结合相关机制的设计, 将标注工具的视频评价、共享、排行、搜索等功能用于实现教师反思、教师交流等教师教育中。

3 视频标注技术在课堂远程诊断系统中的应用

就目前的研究来看, 教学视频标注工具的开发和应用大多还处于web版本, 本研究是基于android设计的课堂诊断系统, 教师不仅可以上传事先录制好的教学视频, 还可以实时采集传输课堂教学情况, 实现教师的教学与专家的诊断同步进行。视频标注技术的功能设计主要体现在四个方面, 包括专家对教学视频的诊断, 教师根据专家反馈进行反思, 教学资源 (包括视频、教案) 的共享以及数据的自动化统计。

3.1 专家诊断

课堂远程诊断系统的主要功能是实现专家对教师课堂教学行为的远程诊断。由于是应用在移动终端上, 界面大小有限, 所以设计上力求方便简洁。专家在观看视频时, 针对其中有问题或精彩的时间点和时间段进行诊断评价。诊断流程如下图。

(1) 标注方式

系统设计支持两种标注方式, 一是文本标注, 二是语音标注。通过事先定义的编码, 标签与特定的视频片断联系在一起, 信息标注后会保存在相应的点上, 当时间滑过时便会自动弹出或者显示。一个标注点包括一系列信息:标注的时间点和诊断内容。此外, 视频标注技术不仅可以对诊断的视频添加标注点, 还可以对于标注过的提示点进行修改和删除, 确保诊断的准确性。利用视频标注技术, 专家对教学视频中的某一时间点或时间段添加诊断信息, 针对性较强, 不同问题标注不同的点提示, 一方面便于教师理解诊断内容, 另一方面便于教师自身的回顾反思。

(2) 多专家诊断

现实教学中, 专家进入课堂对教师的教学实践进行指导的机会非常少, 而利用课堂远程诊断系统则可以解决这一问题, 不仅可以让专家“亲临”真实性的课堂, 还可以实现多位专家诊断同一视频, 即“会诊”。在诊断的过程中, 专家可能跟前者相对同一个点有相同或者不同的建议, 因此, 为了避免专家间意见的相互干扰, 使诊断结果更加客观, 利用元数据标注技术, 每个人看到的视频是原始视频。诊断完毕后结果反馈给教师, 教师能够独自审视或共同协作审视多个被标注的视频, 根据不同专家的诊断意见, 对自己的教学实践做出深刻的反思, 扬长补短。

(3) 数据链接

课堂远程诊断系统允许用户在观看视频时嵌入诊断或者反思的相关链接, 这些链接可以是平台内部的内容也可以是外部的地址, 形成有效资源的相关联。通过超级链接, 可以将课堂教学背景信息、教师的教案与反思、课程标准相关材料与视频建立链接, 有助于教师对视频的“情境化”理解[5], 为教师的反思和分析自己的教学提供充实的证据和支持。教师的发展取决于将反馈与确切的实例连接来。没有事实根据的反馈很少能够产生持续的效果[6]。多方优质相关资源的链接, 有助于教师理解诊断反馈, 更好的借鉴他人经验和反思自身的教学实践。

3.2 教师反思

对教师的课堂教学进行诊断, 主要目的是经过专家的专业指点教师能够明确快速的发现自身教学的不足, 反思自己的教学实践。也针对课堂视频中的内容, 嵌入一段已标注的相关视频片断作为参考。通过课堂远程诊断系统, 教师可随时随地观看专家的诊断反馈, 在观看的同时, 利用视频标注技术把得到启示或思考用不同的标记符号标注在相应的时间点或者片段上, 这样, 不仅便于后期与专家的交流讨论, 而且便于形成逻辑体系完整的教学反思。课堂远程诊断系统鼓励教师在观看视频反馈的过程中进行思考。视频标注技术支持协作反思, 鼓励教师分享已标注的视频, 用户可以评论和借鉴已分享的教学视频。

3.3 统计自动化

大数据时代的到来, 在教育领域产生了革命性的影响, 教育思维从演绎转向归纳, 教育信息的真实性凸显, 促使教育工作者找到真正影响教育的重要因素。教师在使用课堂远程诊断系统后会产生大量的数据, 视频标注技术支持对这些标注进行复杂的数据挖掘, 可自动完成数据记录、分类管理、统计分析、概括信息的图形化呈现等任务。这些数据对教师的成长有重要影响:

(1) 实现发现教师课堂教学实践背后的主要影响因素, 对教师的专业发展作多元性评价。

(2) 实现优化教师的学习方案、学习路径、学习兴趣以及社会关系。

(3) 实现过程性评价, 发现教师的常态。及时记录教师的学习动态, 可视化了解教师的活动信息, 对教师的成长有了更丰富的认知, 对其发展提出更加科学的建议, 促使教师反思。

(4) 实现教师学习轨迹的积累。通过数据外显教师的学习轨迹, 对教师的成长进行发展性评价。在发展性评价的过程中, 视频标注技术使评价的焦点更加清晰化, 这增强了教师评价的意义, 为研究教师的发展提供了科学可靠的数据支持, 对教师的考核提供精确的数据参考。

4 结束语

教育信息化带动教育现代化, 技术的进步为专家走进真实性课堂提供了便捷的途径。利用视频标注技术, 专家通过课堂远程诊断系统可随时随地的对教师的课堂教学进行诊断, 为教学研究提供了极大的便利。同时, 创新了教师学习反思的平台, 强化和扩展了教师的反思实践, 但是其存在的挑战也不容忽视, 如何更好地利用这一技术为教育服务, 仍需进一步研究。

参考文献

[1]张伟.课堂诊断:贴近教师成长的学校科研[J].基础教育, 2008 (11) :41.

[2]潘玉霞, 汪颖, 张露丹.真实性课堂远程诊断系统的创新设计与开发[J].现代教育技术, 2011 (7) .

[3]王佳莹, 郭俊杰.视频标注工具:支持教师的教学反思[J].中国电化教育, 2013 (7) :111-117.

[4]Rich, P.J., Recesso, A., Allexsaht-Snider, M., &Hannafin, M.J.The use of video-based evidence to analyze, act on, and adapt preservice teacher practice[C]//Paper presented at the annual meeting of the American Educational Research Association.Chicago, 2007.

[5]张志祯, 喻凡, 李芒.课堂教学视频分析软件的设计与实现[J].中国电化教育, 2010:113-116.

[6]Arter, J.Performance Criteria:Assessment Integrating and Instruction[J].High School Magazine, 1999, 6 (5) :24-28.

[7]Barber, L.Self-assessment[A].J.Milman&L.Darling-Hammond.The new handbook of teacher evaluation:Assessing elementary and secondary school teachers[C].Newbury Park, CA:Sage, 1990, 226.

[8]offrey A.Wright.How does video analysis impact teacher reflection-for-action?[D].Doctoral dissertation:Brigham Young University, 2008.

[9]教育信息化十年发展规划 (2011-2020年) [J].中国教育信息化, 2012, 08:3-12.

上一篇:悲剧成因下一篇:外语教师