眼动实验

2024-07-03

眼动实验(精选12篇)

眼动实验 篇1

互联网时代的到来,使人们越来越倾向于在博客、微博、论坛等网络媒体上分享自己的观点和感受[1]。这一点,在网络购物方面表现得尤为突出,越来越多的人乐于在媒体上表达他们的购物经历,在线评论是其中最明显、最有代表性的一种形式。这些在线评论往往对人们的网络购物活动产生重要的影响。2014年零售商的调查报告发现62%的消费者承认在社交媒体上的互动促进了他们的购物行为[2]。CNNIC(2009)针对在线评论对消费者网购行为的调查结果显示,43.3%的消费者表示在线评论是购买决策前最重要的信息来源之一[3]。另有研究报告(2011)称有90%的消费者浏览这些评论,更重要的是83%的消费者承认他们受到了在线评论的影响[4]。由此可见,在线评论对消费者购买行为的影响深远而广泛。

一、相关文献综述

在线评论的影响已经被大量的实证研究所证实。在这些研究中,负面评论常常被认为比正面评论更能对消费者产生作用[5]。这可能是由于负面评论更容易传播,且更有影响力的缘故。但有研究则认为相对于负面评论,正面评论的影响更大[1];也有研究认为正面评论与负面评论在产品销量方面的作用一样[6]。Sorensen等(2004)研究发现负面评论对产品销售的作用会受到其它因素的影响[7]。如Chatterjee(2001)认为如果消费者和网络卖家认识,或者会得到他们的优惠,则负面评论的影响是很小的[8];Chiou等(2003)的研究表明,负面评论对低知名度品牌的伤害要大于对高知名度品牌的伤害[9];Sen和Lerman(2007)在一项对奢侈品和实用品的调查中发现,负面评论对二者的影响是有显著性差异的[10]。而Berger等(2010)则指出负面评论也可以产生积极的效果,他们发现,负面评论可以帮助改善公司产品的知名度,从而提高消费者的购买意向[11]。

电子商务环境下,男女之间的表现存在着明显差异,但是,性别因素对在线评论作用影响的研究还不多。Awad等(2008)的研究表明,在评论质量对信任的影响方面,男女间存在差异,男性比女性要强;而在信任对在线购物行为的影响方面,女性表现得比男性要强[12]。Zhang等(2014)的研究发现包含正负情感倾向的评论对情感信任和购买决策间关系的中介作用在女性条件下更强[13]。而李宏等(2011)则发现,女性的购买选择受到负面评论的影响要小于男性[3]。

商品品牌是电子商务领域关注的一项重要因素,消费者对于品牌的选择决定了企业的收入,进而对企业的经营发展产生重大影响。Hodac等(2013)指出,现在互联网背景下,品牌与评论有着十分紧密的关系,具有一定的交互作用[14]。郑春东等(2015)指出高质量的负面评论可以通过高水平的品牌归因来降低消费者的购买意愿[15]。还有研究发现,对于品牌声誉高的商品,正向评价比负向评价更有用;对品牌声誉低的商品,极性评论比中性评论更有用[2]。Cleeren等(2006)指出,品牌可以减少负面性事件的影响作用[16];廖俊云和黄敏学(2016)发现品牌可以减少评论分值对商品造成的负面影响,也可以通过增强评分正面作用的方式来促进企业商品的销售[17]。

分析国内外研究文献发现以下几个方面的不足:第一,在线评论的正负情感倾向对其它消费者购买决策过程的影响既是巨大的也是非常复杂的。尤其是负面评论产生的影响作用,学者们目前得出的结论并不一致。同时,学者们对此的研究往往是通过单独的正面评论或者负面评论进行研究,对存在矛盾性的正负混合评论的研究还较少。第二,对于性别因素和品牌因素对在线评论作用影响的研究存在不足。从整体来看,性别因素和品牌因素都会对在线评论的作用产生影响,但目前缺少矛盾在线评论背景下对这二者因素影响作用分析的研究。

因此,本文从正负评论混合的矛盾角度出发来展开研究。具体讲就是将评论设置成正面评论和负面评论混合的形式,这主要是因为在现实的网络购物环境中,消费者面临的大都是包含着正面评论和负面评论的矛盾评论[18]。因此,从矛盾评论的角度展开研究有着重要的实际意义。

此外,本文采用眼动追踪技术进行实验研究。Watson和Inglis(2007)认为测量预览效果的最佳方法是眼动实验,因为眼动实验可以实时捕捉消费者在浏览商品及评论时的位置、轨迹和视线焦点移动情况,从而为考察消费者的认知加工过程提供依据[19]。目前有研究[4]发现消费者会对商品描述中嵌入的在线评论进行关注,并且这种关注能够对消费者的购买行为产生影响,但该研究没有对在线评论的正负情感倾向进行研究。

二、实验模型及研究假设

(一)实验模型构建

本研究采用Komiak等(2006)提出的Trustbased Acceptance模型[20]来研究消费者的在线购买决策过程,并据此设计认知实验。Trust-based Acceptance模型认为,消费者的认知信任、情感信任和购买决策之间存在着相互联系。消费者的认知信任会促进情感信任,然后进一步促使消费者购买意愿的产生。当消费者处于在线评论的环境中时,在线评论会对情感信任和购买意愿之间的关系产生影响。认知信任是消费者的信任倾向,表示网络商家所具有的值得消费者依赖的特性,分为能力、诚实、善意三个方面[21],实验中主要由网络商家的首页来体现。情感信任是消费者对网络商家的情感估计,情感信任不需要由特定的刺激引起,它是随着认知信任的变化而变化,由认知信任引起。实验中通过商品细节和性能的展示来进一步增强消费者的认知信任,以提高消费者的情感信任。其后是由正面评论和负面评论混合组成的在线评论页面,被试浏览完这些评论后做出购买决策。本实验研究主要关注以下三个问题:矛盾评论是如何影响消费者情感信任和购买行为之间关系的;性别差异是否会对这个过程产生影响,商品品牌是否会对这个过程产生影响。

(二)研究假设

非一致性信息往往导致个体采取整体性的信息处理过程。因此,在本研究中,非一致的矛盾评论也会产生类似的效果。以往研究表明高水平的信息处理会调节态度和行为意图之间的关系,正性信息和负性信息会在不同方向上加强个体的行为。当消费者处于正面评论中时,会产生新的情感信任,增加购买商品的可能性;当消费者处于负面评论信息中时,会减少情感信任,降低购买商品的可能性。基于理论行为假设,消费者会更在意评论中的负面评论。因此,当面临正负数量相等的矛盾评论时,消费者会对负面评论投入更多的关注。根据以上分析,本文提出假设1。

假设1:矛盾评论背景下,评论的正负会对兴趣区注视点总数、兴趣区总注视时长具有显著影响。

个体的信息加工方式存在性别差异。MeyersLevy等(1991)的选择假设理论[22]认为女性是全面信息处理者,而男性是选择性信息处理者。即女性在做出判断前倾向于了解所有信息,对信息进行整体性的精细加工;男性在处理信息时常采用一种基于启发式和选择性的策略,将自己的选择判断建立在对所有信息中一部分进行加工的基础上。因此,我们认为在矛盾评论背景下,男女所受到的影响是不同的。根据以上分析,本文提出假设2。

假设2:性别因素对兴趣区平均回顾次数具有显著影响。

消费者进行购物选择时,品牌往往起着非常重要的作用。品牌可以作为评估商品质量优劣的指标,能够降低消费者的购买风险。那么,消费者购买有品牌的产品就应该比购买无品牌产品带来的风险要低。目前,在淘宝网站等在线购物平台上,以无品牌商品和小品牌商品为主。因此,在本研究中,将商品设计成有品牌和无品牌两种类型。那么,消费者对两种情况下商品评论的关注则是不同的。基于以上分析,提出本文的假设3。

假设3:矛盾评论背景下,品牌因素会对首次注视兴趣区时长、兴趣区平均回顾次数、兴趣区注视点总数、兴趣区总注视时长具有显著影响。

三、实验方法

(一)实验被试

实验分为有品牌组和无品牌组进行,每组被试均为随机选取。有品牌组共选取被试39人(相关统计表明国内外研究中普遍以30人为样本量),其中男性19人,女性20人;无品牌组共选取被试36人,其中男性17人,女性19人。所有被试年龄在20-30岁。被试者为从河北省某高校招募的在校学生(本科、硕士为主),熟悉网上购物流程,视力或矫正视力正常,色觉正常,均为右利手,此前从未做过类似实验。学生作为被试进行商业实验已被证明是可行的,其作为被试在商业行为实验中的态度与其他人没有本质区别。被试在实验前阅读了实验指导语,并签署了实验知情同意书,实验完成后获得适当报酬。

(二)实验设备

本研究实验仪器采用SMI公司的桌面式眼动仪(Red500),频率为500HZ。实验材料由惠普计算机(19英寸纯平显示器)呈现。显示器的分辨率设置为1 024×768像素。使用i View X软件收集实验数据,利用Be Gaze软件记录分析实验数据。

(三)实验材料

实验图片背景为白色,大小为1 024×768像素,RGB色彩模式,JPG格式。实验材料分为有品牌组和无品牌组,除品牌信息外其余全部相同。实验设计中购买的商品定为手表,购买环境基于淘宝购物平台。每一组实验材料包括消费者购买手表网店页面、手表详细信息和展示页面、消费者评论页面三部分。有品牌组的实验材料中标明品牌名称卡西欧,无品牌组的实验材料中不显示品牌名称,手表网店简单命名为乐达手表专卖店。实验材料中展示详情的手表为一款中性手表,经事前检验确定符合实验要求。消费者评论页面中的评论来自于真实的网络购物环境并进行简单的处理,正面评论和负面评论数量相等,内容简洁易懂,不会造成语义理解困难或歧义,字数大体上相等。实验材料中隐去了历史销量、信誉等影响因素,并对价格因素进行了控制。

(四)实验设计

实验采用2(评论:正面、负面)×2(性别:男、女)×2(品牌:有、无)三因素混合实验设计。其中,评论的正负为被试内因素,性别和品牌为被试间因素。将正面评论和负面评论分别划为兴趣区,且兴趣区大小相同。自变量为:评论性质、性别、品牌;因变量为:购买决策、眼动指标。其中,眼动指标包括首次注视兴趣区时长、兴趣区平均回顾次数、兴趣区注视点总数、兴趣区总注视时长。

(五)实验过程

实验中,实验材料依照设计方案顺序呈现。每一张图片的呈现时间由被试控制,被试确定浏览完毕后按键进入下一页。被试与显示器中心距离约为65cm。实验开始后,要求被试在实验过程中尽量保持头部位置固定不动。实验最后要求被试做出自己的购买决策并进行记录。实验过程中,外部对被试没有声音、光线、触觉和其它因素的干扰。

四、统计结果分析

(一)配对样本检验

本实验在设计过程中,评论的正负为被试内因素,因此,对正面评论和负面评论兴趣区的实验数据要使用SPSS的配对样本T检验进行分析。

首先对配对的两组数据分别进行单样本K-S检验,其结果如表1所示。

注:表中α取值为0.05,*表示p<0.1,**表示p<0.05(下同)。

由表1可以看出,负面评论兴趣区各指标的单样本K-S检验P值均大于0.05,表明其服从正态分布。而在正面评论兴趣区指标中,首次注视兴趣区时长、兴趣区平均回顾次数的P值小于0.05,不服从正态分布;兴趣区注视点总数、兴趣区总注视时长的P值大于0.05,服从正态分布。

1. 配对样本T检验。

由于配对样本中,只有兴趣区注视点总数、兴趣区总注视时长两个指标的实验数据服从正态分布,因此只能对这两个指标的数据进行配对样本T检验。结果显示,评论的正负对兴趣区注视点总数有显著影响(P=0.000<0.05,t=5.061),对兴趣区总注视时长有显著影响(P=0.000<0.05,t=4.363),这与假设1相符。

将评论的正负对显著影响的因变量进行均值比较,结果如图1。

由图1可以看出,正面评论兴趣区的注视点总数、总注视时长都低于负面评论兴趣区,说明负面评论更能引起消费者的关注,消费者在负面评论上面所做的认知努力更多。

2. 非参数检验。

由于配对样本中,首次注视兴趣区时长、兴趣区平均回顾次数两个指标的数据不服从正太分布,因此,使用非参数检验中的两个相关样本检验的方法进行分析,其结果如表2所示。

由表2可以看出,首次注视兴趣区时长、兴趣区平均回顾次数两个指标的P值均大于0.05,表明配对的两个样本来自于同一个分布总体,具有相同的分布特征,可以认为没有显著性差异,这与假设1相符。

(二)负面兴趣区的方差分析

由表1可知,负面评论兴趣区的实验数据均服从正态分布,对其进行方差分析结果如表3。

1. 单因素方差分析。

由表3看出性别因素只对兴趣区平均回顾次数具有显著的影响作用。品牌因素对兴趣区平均回顾次数、兴趣区总注视时长具有显著影响作用,这与假设3部分内容相符。

将性别和品牌因素对显著影响的因变量进行均值比较分析,结果如图2,可以看出,男性在兴趣区平均回顾次数上的均值大于女性,表明男性在负面评论认知加工过程中比女性更易受到外界其它因素影响。男性在浏览负面评论过程中,还会较多地关注其它部分信息;而女性则较易锁定在负面评论,对整个负性评论进行精细加工,体现出男女在信息认知加工过程方面的差异。

由图2可以看出,有品牌情况下,消费者在兴趣区平均回顾次数上的均值大于无品牌的情况,表明有品牌情况下,消费者更易受到外界信息的影响;在有品牌情况下,消费者在兴趣区总注视时长上的均值均大于无品牌的情况,表明品牌促进了消费者对负面评论的加工和认知。

2. 交互作用方差分析。

从表3可以看出,性别和品牌的交互作用对首次关注兴趣区时间、首次注视兴趣区时长、兴趣区平均回顾次数、兴趣区注视点总数、兴趣区总注视时长均没有显著的影响作用。

(三)正面评论兴趣区的数据分析

1. 方差分析。

由表1可知,兴趣区注视点总数、兴趣区总注视时长两个指标的实验数据服从正态分布,进行单因素方差分析后的结果如表4所示。

由表4可以看出,性别、品牌以及性别与品牌的交互作用对兴趣区注视点总数、兴趣区总注视时长两个指标没有显著的影响作用。

2. 非参数检验。

由表1可知,首次注视兴趣区时长、兴趣区平均回顾次数两个指标的数据不服从正态分布,因此使用非参数检验中的两个独立样本检验方法进行检验。其Mann-Whitney U检验的具体结果如表5所示。

由表5第一行可以看出,首次注视兴趣区时长的P值大于0.05,表明以性别分类的两组数据来自于同一分布,可以认为其不存在显著性差异;兴趣区平均回顾次数的P值小于0.05,表明其来自于不同的分布总体,可以认为存在显著的差异。由表5第二行可以看出,兴趣区平均回顾次数的P值大于0.05,表明以品牌分类的两组数据来自于同一分布,不存在显著性差异;首次注视兴趣区时长的P值小于0.05,表明其不服从于同一分布,具有显著性差异。具体数值分析结果如图3所示。

(四)行为数据分析

行为数据是被试做出的购买与不购买的决策,在SPSS中运用列联表进行分析。结果显示在不考虑品牌因素的情况下,男性中36.1%选择不购买,63.9%选择购买;女性中59.0%选择不购买,41.0%选择购买,表现出较大的差异,统计学意义上也表现为显著性差异(X2(1)=3.920,P=0.048<0.05)。说明性别因素对最终的购买决定产生了显著的影响作用。在不考虑性别因素的情况下,有品牌组中35.9%选择不购买,64.1%选择购买;无品牌组中61.1%选择不购买,38.9%选择购买,表现出较大的差异,统计学意义上也表现为显著性差异(X2(1)=4.768,P=0.029<0.05)。说明品牌因素对最终的购买决定产生了显著的影响作用。

五、讨论与分析

从对配对样本的分析结果可以看出,评论的正负对兴趣区注视点总数、兴趣区总注视时长具有显著的影响作用,与假设1相符。这表明消费者对正面评论和负面评论的关注存在明显的不同。消费者在观看在线评论的过程中常常被负面评论所吸引,在负面评论上面花费的时间和精力更多,认知加工程度更深,受到负面评论的影响也更大。因此,在矛盾评论对消费者情感信任和购买行为关系的影响过程中,负面评论起主要作用。这已被研究所证实(Verhagen等,2013)。本实验是在客观的眼动数据基础上对这一结论的进一步验证。

从对性别因素影响作用分析结果看,性别只对兴趣区平均回顾次数有显著影响作用,且这一点对于负面评论和正面评论都是相同的,与假设2相符。这表明,男女确实存在认知上的差异。根据选择假设理论,女性是全面信息加工者,对信息的整体加工过程往往使其注意力锁定在兴趣区范围内,忽略了周围其它的信息。而男性是选择信息处理者,处理信息时采用启发式和选择性策略,将判断建立在对部分信息加工的基础之上,因此,男性在浏览兴趣区评论时,会选择其认为有价值和感兴趣的信息,同时还会不断地关注外界的其它信息,存在与外部信息的交流,以确定其建立在部分信息基础上的判断是可靠的。通过对路径图的回放发现,男性在观看矛盾性评论时存在正面评论兴趣区和负面评论兴趣区的交叉浏览,说明男性对矛盾性评论中的正面评论和负面评论进行了对比分析;而女性在观看矛盾性评论时,虽然也有一定的交叉式浏览,但是采用这种方式的次数不如男性的次数多。但是性别因素对兴趣区其它指标的影响是不显著的,说明男女对混合评论的认知程度是一致的,男女同样对负面评论更感兴趣。行为数据分析的结果表明,男性比女性更倾向于选择购买。这说明,男女之间的这种差异使得男性受到负面评论的影响比女性要小,对情感信任与购买行为之间关系的影响也小。

从对品牌因素的分析结果来看,品牌对负面评论兴趣区的平均回顾次数、总注视时长有显著的影响作用,对正面评论兴趣区则只有首次注视兴趣区时长起影响作用,与假设3部分相符。这个结果说明,品牌因素不仅影响了消费者对矛盾性评论的认知努力程度,也影响了消费者对矛盾性评论的认知方式,而且这种影响在正面评论和负面评论上是不同的。具体分析看,首先,有品牌组的消费者对矛盾性评论的认知努力程度比无品牌组要高。对于负面评论,消费者的兴趣区总注视时长均值比无品牌组要高,说明在品牌因素的影响下,消费者对负面评论的认知程度更深,这可能是由于品牌的影响力在前面的浏览过程中已深入到消费者心中,消费者看到负面评论时反而更能引起关注;而对于正面评论,消费者仅有首次关注兴趣区时长的均值比无品牌组要高,说明品牌对正面评论的影响仅仅体现在最初的注意上,这也正说明负面评论比正面评论更容易受到消费者的关注。其次,品牌因素也影响了消费者的认知加工方式,但是这种影响仅仅体现在负面评论上。对于负面评论,消费者的兴趣区平均回顾次数均大于无品牌组,说明有品牌组的消费者在浏览负面评论时,还会关注其它的信息。这表明,因为品牌的影响,消费者对于负面评论的评价已不仅仅单独地依靠评论本身,而是会通过与其它信息结合起来综合分析,来更客观地认识负面评论。行为数据分析结果表明,有品牌的情况下,消费者更倾向于选择购买,而无品牌情况下,消费者更倾向于选择不购买。这说明品牌因素有助于降低负面评论对消费者产生的影响,间接提高消费者的情感信任,进而提高消费者的购买倾向。这一点,对于商家提高品牌意识有着重要的意义。

六、结论

1.在矛盾性在线评论对消费者情感信任和购买行为关系的影响过程中,消费者主要关注负面评论,在负面评论上付出更多认知努力,受负面评论影响更深。

2.男女确实存在认知上的差异。在网络购物过程中,男性会对矛盾性在线评论中的正面评论和负面评论进行一定的对比分析,而女性浏览在线评论时,这种对比分表现的则较少,不如男性明显;但是男女对在线评论的认知努力程度是一样的,同样更加关注负面评论。男女性别间的这种差异使男性受到负面评论的影响比女性要小,对情感信任与购买决策之间关系的影响也小。

3.品牌会对在线评论对消费者购买决策的认知过程产生影响。品牌因素不仅可以影响消费者对矛盾性在线评论的认知程度,还会影响消费者对在线评论的认知努力过程,而且这种影响在正面评论和负面评论上是不一样的。品牌因素有助于降低负面评论对消费者产生的不良影响,从而间接提高消费者的情感信任,进而提高消费者的购买倾向。

眼动实验 篇2

一、首先要树立意识:遵循常规,尊重用户

要打造一个优秀的网站,必须要正视这个现实,也就意味着要做到:遵循网站常规、尊重用户习惯。

所谓网站常规,也就是在长久的磨合和锤炼以来,网站所沉淀下来的惯用做法,用户已习以为常不以为意,就像吃饭喝水一样自然。这种常规,遵守了的利益不明显,打破它的代价却会有点大——用户到你的网站上找不到自己想找的东西,拔脚走人。

网站常规如下:

显而易见的菜单栏,贯穿页面顶部

网站徽标位于所有页面左上角

搜索输入框位于所有页面右上角

登录、注销位于所有页面右上角

功能导航位于页面顶部或最下面,比主导航略小或视觉感觉略弱。

优秀页面的成功要点:

简洁:(1)控制内容数量,(2)控制风格种类,风格一致便于识别:信息较多时要呈现一致的格式。(3)善用空白区、内容框和色彩有助于用户看到,

要勾划出这些区域,不要让内容太杂乱。注意一点,色彩会提升彩色框中内容的重要性。所以,要善用,不能滥用。

清晰:(1)标题让人一目了然:每个版块都要有标题。(2)清晰的图片引人注目,模糊的图片会被无视。

二、然后从分析自己、分配版面开始

好网站的第一步:

明确优先级:明确用户来网站的任务Top10,明确各内容模块的优先级

合理分配版面,突显最重要元素:划分页面的优势区,把最高优势区分给最高优先级,一一对应

然后就是遵循以上说到的“简洁”和“清晰”原则。

有时也难以避免失败(用户找不到要找的东西、页面主要图片成了用户回避的对象),失败通常有如下原因:

低级错误是网站方面的设计失败:优势错配以至于给用户完成任务碍事了;术语不清晰以至于用户视而不见

有些问题是用户方面的原因:广告盲(用户已习惯忽视貌似广告的一切东西);用户类型(搜索型还是浏览型);惯性行为(用户个人特点)

三、具体研究,对症下药

对具体网站的眼动研究

设定任务后,对每个任务可采集的定量数据

c 任务完成时间

a 用户体验评级

b 任务完成成功率

c 任务完成时间

d 错误路径

研究方法

a和b可以结合起来评定网站是否基本可用。再加上c可以说明网站是否高效好用。d可以解释c为何冗长。发现d问题以后也可就出错点进行轨迹图分析。

研究要点

对被访者的仔细观察

对其视线转换的清晰解读

对网页布局的全面了解

眼动实验 篇3

关键词:中原服饰文化;文化传播;眼动实验;社会服务

中原地区乃国之中、城之源。在历史发展的长河中,积淀了厚重物质和精神的文化。长期以来便利的交通和大量的人口流动孕育出融合的多元服饰文化。在当今,伴随城镇化进程,社会的发展越来越需要文化的创意驱动。随着河南人文城市建设的不断推进,中原服饰文化有必要在广度和深度上积极地与科学技术相融合,寻求更多的延展可能,更好地进行社会服务。

1 眼动实验的原理与过程

眼动实验也被称作眼动测试,主要是依托视线追踪技术,针对受测试者注视特定目标时的眼睛运动与注视方向进行监测和分析。眼动技术以非接触、非侵入的方式了解内心世界主要用来了解真实的认知与感受习惯。进行眼动实验的主要设备是眼动仪。它能够在完全自然的状态下记录人们眼动轨迹。在运用眼动仪进行实验的过程中主要针对以下几个点进行观测和数据分析。主要是注视点的数目、注视时间和关注次数,关注点越多表明关注内容越丰富,目标提取就越困难。首次关注时间越短说明关注内容越引人注目或是关注内容浅显易懂。关注次数越多关注内容越吸引人。当然在多次数关注的情况下,总的关注时间越长说明关注目标越吸引人或是关注内容越难以理解。这些数据与定向访谈结果进行组合,得出的研究结果极具说服力。在这三个主要观测点之下,还存在一些小的观测内容,比如,扫视距离、回视率及回视路径时间。这些信息可以更加准确的分析受测者接受信息的数量和效果。将眼动实验引入到中原服饰文化传播的研究中有助于分析社会人群的实际需求,进一步对中原服饰文化的社会服务模式进行以人为本的创新性研究。

2 中原服饰文化传播的眼动实验规划

文化的传播是指多年形成的一种习俗习惯从一个区域传到另一个区域,从一群体到另一群体的互动现象。文化传播主要包括三个阶段,即接触与显现、分析与选择、采纳与融合。在这三个阶段中由于每个环节都会出现不同的问题。因此,文化的传播也分为直接的采借和间接传播。由分析和选择形成一种新的文化的形式叫“刺激性传播”也就是我们今天所提提倡的创新性传播。文化传播主要是通过人迁移和流动产生的,所以也有纵向传播和横向传播之分。中原服饰文化很难界定是物质性还是非物质性,因此中原服饰文化的传播必定是一种集多种形态的传播方式。随着传播媒介的不断发展,中原服饰文化需要不断引进先进的思想和技术手段,促使其更好地为现代社会需求服务。

2.1 中原服饰文化的接触性认知

在上述文化传播过程理论中,我们提到文化传播的过程中第一个环节就是接触与显现。这也是对信息进行认知的过程。认知观点主张将注意力集中在外观直觉上。在这个过程中进行眼动实验需要关注的是对中原服饰文化的关注点数量和关注时间。

对中原服饰文化的接触性认知的一致性与创新性。中原服饰文化更多的是历史传承下来的传统文化,它的显现是符合历史中的某个时代特征。而在现代文明的时代中,这种文化在传播过程中,必定会出现与社会情境的冲突。那么问题就出现了,这会使承载这种文化的社会及人大伤脑筋,从而失去原本的精神与品质。同时这种优秀的传统文化也会渐渐地退出历史的舞台。在试验中出现的次数和时间总和必定会显示出不协调性。但是在有些情况下,这种冲突与矛盾的不协调性反而对接触性认知是一种刺激。一旦刺激产生就会根据现实环境中的审美与需求形成改良或摒弃。通过眼动实验数据和一定范围内的访谈结果进行综合分析,必定会寻找出达到认知一致和平衡的途径,此外也会产生出刺激性的创意认知,为中原服饰文化的社会服务创新提供研究基础。

2.2 中原服饰文化的符号化互动

中原服饰文化传播过程中在认知的基础上,根据不同的传播媒介会形成一些符号化的元素。中原服饰文化符号有语言和非语言两种,语言符号包括口头表达和文字,非语言符号包括声音、图像。这些元素通过特定的形式进行编码为受众传递信息。从一般意义上而言,服饰符号属于非语言符号。这种符号的外在表征非常丰富。包括传播情境中除言语外的一切由人类和环境所产生的刺激,这些刺激对于信息发出者和接受者都具有潜在的价值。从社会心理学的角度讲,不同人群价值观是不同的,同一人群不同环境下价值观也是不同的。这种情况下,同样需要借助眼动实验,为中原服饰文化和社会服务之间的充分有效沟通提供帮助,不断巩固社会对中原服饰文化价值的认知和维持。只有这样,中原服饰文化才可以为人文城市的建设添砖加瓦。

3 眼动实验对中原服饰文化社会服务的影响

3.1 提高中原服饰文化教育服务的效果

教育服务不等同于一般的产业服务,不能使用经济效益和市场发展的眼光来看待,我们今天所指的教育服务完全是为了满足学习者的心理需求而实施的一系列行为过程,同时也是为学习者扭转错误心理需求和认知的过程。长期以来进行教育的人和场域都缺乏服务的意识,单单只作为传播媒介出现,例如,有些教师不能很好地做到了解学生的实际需求,以人为本的展开有层次有步骤的引导和传授,无法帮助有需求的学习者解决问题。在缺乏服务意识的教学过程中学生的兴趣无法被了解,那么学习的过程将会漫无目的,长此以来教育的针对性和效果就会大打折扣。面对这样的现状,在中原服饰文化进行教育服务的过程中引入眼动实验,准确观测学习者的兴趣方向及渴望的需求,在知识传授者与接受者之间进行充分的交流,有益于教育服务意识的提高和教育服务效果的提升。可将学校的中原服饰文化研究平台、公共文化场域与相关产业,积极开多方合作,提高社会服务能力,形成产、学、研、用一体化的教育服务模式,吸纳学生参与科研项目的开发,有效提高学生的科研能力和社会实践能力。培养适应社会发展需求的综合型人才。同时,根据眼动实验结果分析也可以针对不同学习人群进行多样化的教育服务形式创新,实现全民教育服务和终身教育服务。

3.2 提升中原服饰文化创作服务的价值

进入21世纪,创意经济逐渐成为发达国家和地区的发展趋势,给人们的生活工作带来了深远的影响。文化创意产业是指依靠创意人的智慧、技能和天赋,借助于高科技对文化资源进行创造与提升,通过知识产权的开发和运用,产生出高附加值产品,是一个具有创造财富和就业潜力的产业。中原服饰文化之所以能世世代代流传下来,一个重要的前提条件就是它需要在一种相对封闭的环境下世代相传。随着自然和社会环境以及物质精神文化的不断改变,中原服饰文化面临着现代化快速发展所带来的异常深刻的革命。近年来,河南省文化创意产业快速发展,尤其是河南省提出“建设中原经济区”宏伟目标以后,文化产业的地位在河南全(下转第页)(上接第页)面发展中得到进一步提升,文化创意产业迎来大发展。在中原服饰文化创意产业发展过程中,当“材美、器丽、工巧”的“天工开物”,全部变成了规模化的工业大生产时,我们应该审慎思考,在高速发展中,是否在一些做法上,有违了我们发展文化创意产业的初衷。中原服饰文化的创作就是运用这些文化元素产生新事物。在“内容为王”的时代,创作激发的“差异”和“个性”根据消费者和市场需求而产生的,也是文化创作产业的核心之道。基于眼动实验的中原服饰文化创作,能够在很大程度上引导消费者对文化创作作品产生认知,继而形成对产品的追求和维护,赢得更多消费者的认同形成坚固的市场价值。实施眼动实验可以在感情层面上了解消费者的诉求,有助于促进相关自主创新创意能力,增强市场竞争力,有利于加快中原文化创作服务产业额,提升城市的文化软实力,进一步巩固河南的文化强省地位。我们做中原服饰文化产品一定要做出特色,做出自己的东西,并结合市场实际需求进行开发设计,接受市场的检验,既有极大的文化价值,又有极高的经济价值。

3.3 优化中原服饰文化传承服务的模式

从文化的层面来说,中原服饰文化影响了人们的社会心理、价值观念、道德标准、审美追求、存在范式。中原服饰文化之所以能世世代代流传下来,传统的文化传承机制之所以能有效运转,一个重要的前提条件就是它在一种相对封闭的环境下世代相传的。随着自然和社会环境以及物质精神文化的不断改变,新的生活方式和观念必然会使现代文化元素与中原民俗文化元素发生碰撞和相互交融。面对现状我们应采取相应措施对其进行保护和传承。在市场经济和旅游业快速发展的今天,如不加以控制和改进中原服饰文化的传承必定会影响和阻碍当地经济的发展。眼动实验的实施可以帮助相关科研机构、学术单位组织人员在全省范围内开展大规模服饰文化的调查,收集记录的过程中,进一步明确挖掘的方向与目标。通过了解不同人群的喜好以及所能接受的程度进行引导和宣传。有效地将沉寂的中原服饰文化和困苦的民间艺人与社会需求相融合,通过公共信息服务平台、文化旅游窗口展示和文化城市建设的介质,打造多渠道的传承模式。

4 结语

党的十八届三中全会明确提出要加快构建现代公共文化服务体系,突出公共文化服务体系建设的时代性、创新性和开放性要求。通过引入眼动实验帮助中原服饰文化在现代人文城市建设的今天,进一步认清楚社会发展对文化的需求和大众对文化的认同。进行立足实际、改革创新的探索实践大力拓展中原服饰文化社会服务的影响范围与创新模式。通过先进新颖的传播形式和服务模式把控中原传统文化的传播主动权、主导权和衍生力。帮助大众树立正确的道德观和价值观,提升中原服饰文化影响力,加快推进我省的人文城市建设。

参考文献:

[1]邵丹,朱莉思.基于眼动实验的服装品牌风格意象认知探析——E品牌上装风格案例研究[J].东华大学学报(自然科学版),2013(2):23-25.

[2]Susan B.Kaiser .社会心理学[M].李宏伟,译.北京:中国纺织出版社,2003.

[3]梁福金.“教育就是服务”理念遭遇为问题与困惑[J].资教通鉴,2011(9):9-10.

桌面式眼动跟踪系统研究 篇4

人眼是人获取外界信息的主要渠道,人眼的注视区域通常包含了人感兴趣的信息,眼动跟踪系统通过跟踪人的视线来获取人的感兴趣区域,它在虚拟现实、人机交互[1,2]等方面都有应用。

当前的眼动跟踪系统大都是基于视频图像的,也就是通过摄像头来获取相应的图片进行处理分析,按照硬件构成不同,可以将眼动跟踪系统分为头戴式和桌面式两类[3]。文献[4]中作者对头戴式眼动跟踪系统进行了深入研究,实现了基于标记点检测的注视点估计方法,与传统的头戴式眼动跟踪系统相比,该方法不需要借助额外的辅助设备来实现视线跟踪。Wang和Eric Sung[5]等人使用单圆法来估计人的注视方向,该方法的缺点是需要事先计算得到内外眼角的三维坐标、人头部的姿态以及所使用的摄像机参数等信息。

本文设计并实现了一种简单的基于桌面的眼动跟踪系统,此系统硬件构成简单,而且不与人接触,使得人机交互更加自然,将数据处理分为四个部分,使用虹膜中心坐标来估计用户的注视点。

1 桌面式眼动跟踪系统硬件构成

桌面式眼动跟踪系统的构成如图1所示,硬件组成包括一台摄像机、一台PC机和一个注视屏幕。摄像机用于获取实时的图片,PC机接收摄像机拍摄的图片,并对其进行处理,同时计算相应时刻人眼在注视屏幕上的注视坐标,并将其显示在屏幕上。

桌面式眼动跟踪系统的硬件构成

2 桌面式眼动跟踪系统数据处理流程

图2给出了桌面式眼动跟踪系统的数据处理步骤,数据处理可以分为四个步骤:人脸检测和定位、人眼检测和定位、人眼特征点提取以及注视点的标定。

图2桌面式眼动跟踪系统数据处理流程(参见下页)

桌面式眼动跟踪系统数据处理流程

2.1 人脸检测

进行人脸检测的原因有两个,一是因为桌面式眼动跟踪系统将数据采集设备放在桌面上,这样采集到的原始图片可能会包含复杂的背景或者根本不包含人脸,因此,有必要先对采集到的图片进行人脸检测;二是为了减少后续数据处理的范围,提高数据处理速度。文章采用肤色和Adaboost相结合的人脸检测算法,首先使用基于YCbCr颜色空间的肤色模型分割得到人脸的候选区域,然后在候选区域中Adaboost算法进行人脸检测。

使用YCbCr颜色空间的原因是在该空间中,肤色像素的(Cb, Cr)值具有较好的聚类[6],可以用来排除大部分的非肤色区域,提高人脸检测的速度。图3给出了肤色像素在CbCr空间上的分布,可以看到,肤色像素的(Cb, Cr)较好地符合高斯分布,因此,可以考虑在YCbCr颜色空间下,使用高斯模型来判断像素是否属于肤色像素,式(1)用来判断某像素是否为肤色像素。

肤色像素在CbCr空间上的分布情况

2.2 人眼检测

采用的人眼检测方法是基于人眼的灰度特性。人脸图像中,人眼区域相对人脸其他部分要暗[7,8]。根据这一特性计算人眼候选点,进而获得人眼候选区域,获取人眼候选区域之后,再根据区域的大小和位置等信息,对干扰区域进行排除,确定真正人眼区域,从而实现对人眼位置的准确定位。

对于像素点p,计算p周围8个像素点(如图4所示)的灰度值,得到关于点p的8个灰度值,这8个值中如果比点p的灰度值小的个数超过某个阈值,则可认为p为人眼区域候选点,对图像中的每个像素点进行类似处理,我们可以获得人眼的候选点。

如果有人眼候选点是相连的,则可以把它们连在一起,形成人眼候选区域,接下来主要是对这些人眼候选区域进行处理,排除干扰区域,找到真正的人眼位置,这里我们主要通过以下几步排除干扰区域:

(1)排除过大的候选区域。如果候选眼图区域过大,比如候选区域的宽度或者高度大于某个阈值,则认为该区域不是眼图候选区域,可以排除;

(2)排除稀疏的人眼候选点,如果某个人眼候选点周围一定范围内没有足够多的其他人眼候选点,则认为该人眼候选点为干扰点,可以排除。

图5给出了上述处理的结果。

(a) 原图,(b) 人眼候选点,(c) 排除过大候选区域的结果,(d) 排除稀疏人眼候选点后的结果

利用式(2)(3)对图5(d)进行一次膨胀处理,然后再进行一次筛选,去掉过大和过小的候选区域,图6给出了处理结果。

(a) 膨胀操作结果,(b) 去除过大和过小区域之后的结果

我们主要基于以下几个公式来确定人眼位置:

其中,(xi, yi)表示第i个人眼候选区域的中心坐标,dij表示第i个和第j个人眼候选区域中心坐标的欧式几何距离。如果人眼候选区域中有两个区域的中心坐标满足式(2~4),则认为这两个区域为人眼区域,图7给出了人眼定位的结果。

人眼定位结果

2.3 人眼特征点提取

文章中用到的人眼特征点为眼图中的虹膜中心,虹膜中心定位主要分为眼图预处理、提取虹膜边界、虹膜边界拟合以及计算虹膜中心坐标。眼图预处理主要包括图像灰度化、灰度直方图均衡化、图像二值化、图像形态学处理和图像边缘检测等操作,进行灰度直方图均衡化是为了增强图像的对比度,图8给出了眼图预处理的结果。

眼图预处理结果,(a)人眼原图,(b)直方图均衡化后的结果,(c)二值化后的结果,(d)图像形态学操作后的结果,(e)图像边缘化后的结果

图8(e)中的边缘图像不仅包含了虹膜的边界,还包含了眼睑的边界,这些不必要的边界会对后面虹膜边界椭圆拟合造成干扰,因此,在进行拟合之前,有必要先去掉这些干扰边界。

对图8(d)分别使用式(5)、(6)做水平和垂直投影,投影结果如图9所示。

其中,H和W分别表示图像的高和宽。

(a) (b) (c) (参见右栏)

(a) 眼图投影结果,左上为原图,右上为水平投影结果,左下为垂直投影结果,(b) 排除干扰边界后得到的虹膜边界,(c) 虹膜边界在原始眼图中的位置

分析图9(a)我们发现眼图中的虹膜区域位于垂直投影方向的峰值区域和水平投影方向的峰值区域,我们可以认为只有位于这两区间确定的区域内的边界才是真正的虹膜边界,提取这部分区域内的边界作为虹膜边界,图9(b)和图9(c)给出了去除干扰边界之后的结果。

得到虹膜边界特征点之后,可以使用这些特征点进行虹膜边界椭圆拟合,拟合方法采用最小二乘法,拟合得到的椭圆中心即为虹膜中心。

2.4 注视点标定

要将眼动跟踪系统运用于人机交互,就必须给出用户注视计算机屏幕时的具体位置坐标。人的注视点可以看作是人眼球中心和虹膜中心的连线与注视平面之间的交点[5],当人的头部静止不动时,眼球中心的位置是不变的,这时唯一在动的就是虹膜中心,映射到眼图中,可以认为虹膜中心在眼图中的位置和注视点在注视平面上的位置是一一对应的。文章实现的人眼注视点估计方法就是基于这一点:在真正开始计算人的注视点前,先让用户注视几个校准点,获取对应时刻眼图中的虹膜中心坐标,计算得到注视点和虹膜中心坐标的映射关系,之后,可以利用这个映射关系,实现注视点的标定。

使用了九个校准点,如图10所示,可以认为虹膜中心坐标和注视点坐标之间满足二阶多项式关系[9]:

其中,(x0, y0)表示注视点坐标,(xe, ye)表示相应时刻虹膜中心在眼图中的坐标。校准开始后,用户需保持头部静止,然后按提示依次观看这九个图标。计算机会实时记录人眼注视点坐标和相应时刻图片中的虹膜中心坐标,用于映射函数的计算。

图10用于校准的注视点在注视屏幕上的位置分布 (参见下页)

令A = [a0 a1 a2 a3 a4 a5]T,B = [b0 b1 b2 b3 b4 b5]T。给定n个样本点对,用(xei, yei)、(xoi, yoi)分别表示第i个样本点对的虹膜中心坐标和注视点坐标,那么使得式(7)和(8)取最小值的参数A,B就是我们要求的映射函数的参数。

用于校准的注视点在注视屏幕上的位置分布

3 实验结果

3.1 人脸检测和定位

使用Georgia Tech face database人脸数据库进行人脸检测实验,该人脸数据库共包含有50个人,每个人都有15张在不同状态下拍摄得到的图片,图片共有750张,大小均为640×480。表1给出了实验结果,使用文章的方法,成功检测到人脸的有725张,漏检的有25张,检测率为96.67%,平均检测时间为11.13ms,与Adaboost方法相比,平均检测时间提高了17.1%。

3.2 人眼检测和定位

使用摄像头获取图片,利用上述方法进行人脸定位,然后在人脸范围内进行人眼检测和定位,实验共截取200帧视频图像进行人眼定位,成功定位到人眼的图片有187张,人眼定位准确率为93.5%,和文献[10]的方法相比,本文提出的方法定位人眼具有更高的精度。文献[10]使用椭圆肤色模型预处理图像,对图片进行分割得到肤色区域,然后在肤色区域内使用Adaboost进行人眼检测,文献中作者使用242张图片做测试,测试结果人眼定位的准确率为90.0%。

3.3 虹膜中心定位

截取200帧人眼进行虹膜中心定位,其中,准确定位到虹膜中心的有182张,准确率为91%,图11给出了部分定位成功的结果。

虹膜中心定位结果

3.4 注视点标定

注视点校准阶段,依次注视图10中的九个校准点,对于每个校准点,采集20个样本点用于计算映射函数。

定义视觉误差为估计的注视点坐标位置和真实的注视点坐标位置之间的距离:

其中,(x0, y0)表示真实的注视点坐标,(x0', y0')表示估计的注视点坐标, d越小,说明估计的注视点位置和真实的注视点位置之间的距离越近。为了说明文章使用方法的准确性,我们让用户依次观看图12中的16个图标,提取相应时刻虹膜中心坐标,然后用映射函数估计注视点,利用式(9)计算估计的注视点和真实注视点之间的误差。表2给出了实验结果,每个位置我们会采集5组数据,表中给出的估计注视点坐标是利用这5组数据估计得到的注视点坐标的平均值。

用于测试的注视点的位置分布

图13给出了用户注视这16个图标时注视点估计值的位置分布,图14表示估计注视点的误差累计,分析图表可知,当可容忍的误差距离不超过40个像素时,映射的准确率超过80%。

估计的注视点位置分布

4 小结

本文实现了一个简单的桌面式眼动跟踪系统,首先给出了系统的硬件构成,然后介绍了系统数据处理过程,注视点标定使用了基于映射的方法,认为虹膜中心和注视点坐标之间存在某种映射关系,通过校准过程获取映射函数,之后,利用这个映射关系计算用户的注视点,实验证明,在可容忍的误差距离不超过40个像素时,估计的准确率超过80%。

摘要:眼动跟踪技术作为一种新的人机交互方式,已受到越来越多人的关注,现有的眼动跟踪系统大都是头戴式的,它的硬件设备复杂,对人干扰较大,而且价格昂贵。文章实现了一个简单的基于桌面的眼动跟踪系统,本系统硬件构成简单,而且不与人直接接触,使用虹膜中心坐标来估计用户的注视点。实验表明,当误差距离不超过40个像素时,系统估计的人眼注视点准确率超过80%。

眼动实验 篇5

本文旨在解释眼动跟踪(Eye tracking) 如何与传统的可用性测试结合使用, 文中会主要介绍针对三个电子商务网站的两项测试任务。从这两项任务的结果中,我们发现眼动跟踪所得出来的数据,是可以用来更好的理解使用者在网页上如何开始搜寻他们要找的目标链接或信息。该数据包括用者对兴趣区域(Area of Interest – AOI)的视觉注意的频率、持续时间以及顺序;对网站设计和理解用者心理期望很有帮助。

简介

多年以来,眼动跟踪在用户测试是常用的辅助工具之一。当中以驾驶仓设计 (Fitts, Jones & Milton, 1950) 为先驱。该类研究替眼睛移动与认知活动订下一些假设,甚具价值。例如:视觉注视的l率c操控有P,注视持续的rg长短tc理解信息的难度有关等。

近年眼动跟踪与网页应用的用户测试的概念逐渐融合起来(详情可参考 Duchowski, 2003;Dadach and Deubei;2003)。独立的研究团体或专业人士这些年来一直在尝试发现眼动跟踪在网页设计可用性方面的应用。这些研究项目涉及到用户浏览网页时,来发现对界面的不同部分的视觉注意力的具体目标、或找出他们的兴趣区等。所得出来的数据可以使用不同的方法比较,当中包括先后次序、数量和对每个兴趣区注视持续的时间。

为继续调查眼动跟踪对可用性测试的贡献,研究人员收集了三个不同的电子商务网站的眼动跟踪的数据,并对这些数据根据在屏幕上兴趣区的不同进行分析,进而来了解用户如何和这些界面打交道。

方法

本次研究的参与者共有三十六名,他们来自唯芝达国立大学(Wichita State University)的本科生或研究生。其中二十六名为女生,其余十名为男生,百分之七十二的参与者年龄介乎十八至二十六岁。他们使用配备了Pentium IV中央处理器的计算机,其显示屏为96 dpi、十七迹解像度为1024 * 768。显示屏幕与Tobii 1750眼动跟踪系统接连。该眼动跟踪仪并不是头戴式的,而是安装在显示屏上的,这样使用者使用的时候感觉很自然。眼动跟踪仪每20毫秒(即50赫兹的频率)对眼球的位置取样一次,来探测并搜集使用者在测试时眼球移动的数据,测试的三家专门销售教育类玩具的电子商务网站,分别是Mastermind Toys, Toys to Grow On和Wonder Brains。

结果

我们在三个维度上来比较测试得到的数据:任务需时多久、经过多少页数才能完成任务和困难度(1=最容易 5=最困难)。在测试当中,从记录眼球移动得出来的数据,可得知在不同的网站的首页,测试者对不同兴趣区注视的次数以及注视持续时间等的数据。以下便是考察使用者完成两项任务的可用性测试的结果。

任务一:寻找联系信息

这是一项简单的任务,测试者要在网页上搜寻玩具公司的联系信息。结果是网站二(MastermindToys.com)在使用时的困难度最大 (F(2.33)=5.459, p.=.009),所使用的时间亦最长 (F(2.33)=9.841, p.<.001). 见表一。

表一. 任务一不同网站的可用性量度

量度网站 1 (Toystogrowon)网站 2 (MastermindToys)网站 3(WonderBrains)难度1.08 (0.29)1.81 (0.60)1.67 (0.77)任务时间(秒)40.12 (10.59)61.94 (17.1)42.66 (10.84)

每家公司在他们的网站首页都置有联系信息的链接,但位置不同。网站二(MastermindToys.com)将链接与其它链接放在右方,反观网站一(Toytogrowon.com)则放置在网站的底部。网站三(WonderBrains.com) 将络我们的链接放在网站首页内多位置-顶部和底部。根据结果发现,测试者在网站二(MastermindToys.com)所需的r间^多,困y度也^大。显示出用户的心中已有特定的位置放置某些特定的链接。如果链接没有在预期的位置出现,用户的表现便相应地较差,这正好与(Bernard, 2001;Bernard 2002)的研究同出一辙。

这个眼动跟踪任务是测试用户如何在不同的首页里找出一个特定链接。我们考察了每一个兴趣区眼睛注视的平均时间,在网站一(Toytogrowon.com),用户是先开始搜寻网页的中心位置,然后移向网页的边缘地带,例如位于网页顶部的购物车、左面的导航条等等。

图 1. 任务一的注视顺序 (Toystogrowon.com)

同样地,在网站二(MastermindToys.com)我们察觉到有另一种偏向。用者是在网页的顶部先开始搜寻,这显示链接的位置与一般用户的假设并不相符,情况就如网站一(Toytogrowon.com)一样 (图 2)。

图2. 任务一的注视顺序 (MasterMindToys.com)

Clearview眼动跟踪件能显示出用粼谄聊坏哪男┣域韧A舻r间更多和吸引用糇⑹痈多,该结果用不同颜色表示。颜色愈红,表示这个位置被注视时间愈长。

透过检视这些‘热点’,结果显示用户在网站一(Toytogrowon.com)和网站二(MastermindToys.com)的眼睛移动是一种非常分散的模式。这证明用户在眼球的注意力不是集中在一个需要找的链接的位置,而是数个位置。无论何种原因,正是在这些位置上是他们花费最长的时间、搜寻最多次的地方,他们在这些位置上最终发现要找的链接。

图3. 任务一的首页注视热点 (MasterMindToys.com)

图4. 任务一的首页注视热点 (Toystogrowon.com)

另一方面,当用户在网站三(WonderBrains.com)进行测试时,数据显示热点比较集中在要找的链接所在的位置,也就是网页的顶部或底部。

图5. 任务一的首页注视热点 (WonderBrains.com)

任务二:以年龄分类购物

这项任务目的是要求用者购买一份适合五岁或以上的小童的拼图游戏。数据显示,三个网页的结果有很大分别-困难度(F(2.33)=3.593,p.=.039) (参考表二)。网站一(Toytogrowon.com)的得分最高,表示用户在按年龄分类购物时网站一(Toytogrowon.com)的设计较其它两个网站逊色,使用时较困难,

这些分析综合了对本次任务的兴趣区数据的考察。

表2. 任务二不同网站的可用性量度

量度网站 1 (Toystogrowon)网站 2 (MastermindToys)网站 3 (WonderBrains)难度2.58 (1.08)1.72 (1.00)1.67 (0.65)任务时间(秒)108.09 (36.59)61.31 (27.4)67.54 (45.64)页数8.00 (4.11)5.08 (1.5)5.17 (0.94)

本次任务按照两种方法进行: (1) using 在左面的导航条设有分类项目,用者可在此处搜索拼图游戏并在此将搜索范围收窄; (2) 或使用网站首页上的按年龄购物的链接功能。 在网站一(Toytogrowon.com),按年龄购物功能只在网页内按一条链接,其间只有一位用户发现并使用。而据数据指出,该功能链接并不设在优先的定像范围内,用者需要在较后的时间才可找出链接的所在地(图六)。

图6. 第一注视点的顺序 (Toystogrowon.com)

透过观察网页的热点,注视位置和逗留的时间长短可以对该项任务的结果分析有帮助。左面的导航条最能够吸引用者的注意力,而位于顶部的年龄购物链接功能却不是很特出,并不显眼,只有一个用户使用了该链接。用者需要以较长的时间及多次触及这个位置才能成功作出行动,这表明意味粲没未能充份把握清楚确定链接的功能,所以没有很快地选取链接。亦要归因于链接并无独有的图像包装,未能引起用者的注意力。

图7. 表现了任务二吸引最多注意力的首页上的热点图

在网站二(MasterMindToys.com)的大部份的测试者(其中有两位除外)都能使用按年龄购物的链接,该链接位于网页上方导航条的左侧,点击后按照不同年龄范围给出链接列表,我们发现用者的视觉注意力主要集中在网页的这个范围 (见图八)。尽管这不是眼动跟踪的优先定像范围,用户仍能成功选取,没有影响他们的表现。在此网页某些项目是没有用途的,却吸引了用户们的注意力。网页中的商店内部照片及其旁边的一些链接并没实质的用处,却分散了注意力,令用户无法在短时间内完成任务。但总体的设计和链接的位置效果不错,是促成任务成功的要素,眼动跟踪收集来的数据显示了这一点。

图8. 任务五首页注视点 (MasterMindToys.com)

网站三(WonderBrains.com)的用户在使用‘按年龄购物’选项时的视觉注意的分布较为均匀,尽管这个选项的位置比在该网页上方的标准玩具分类(图九)在吸引注意力方面较为逊色。实际上,通过检视这个热点分布图,可以发现在执行一项任务时,网页上直接最吸引视觉注意力的部分,基本上就是相关的链接—无论是分类浏览还是按年龄购物,别的都不太吸引视觉注意力。这表明网站三的主页对于购物来说对用户的引导性最好(至少对于执行本任务来说),最不容易分散用户的视觉注意力。

图9. 任务二首页注视热点 (WonderBrains.com)

讨论

通过比较网页不同区域的视觉注意力,我们了解到很多关于用户体验的特性。特别是用户眼动跟踪数据可以帮助可用性专业人士来找出哪些兴趣区是潜在的:

注意力集中点

资料集中点

最容易被忽略的地方

最分散注意力的地方

这种方法不但可以检视用者能否在网页上顺利寻找数据,而且还可以找出他们如何以及从何处找出他们心目中的链接和信息。这给标准的可用性测试补充了很多有用的信息,尤其在用户期望方面和提供设计建议方面。

本次研究侧重于如何解释眼动跟踪数据对于上述网站的可用性测试的重要性。在日后的研究里,兴趣区眼动跟踪不仅可以在网站的单个网页或单个屏幕上使用,还可以在一个网站的不同页面上广泛使用(参考Pan等人在发表的文章),网站内不同的地点亦可比较 (参考 Josephson和Holmes在发表的文章),甚至在进行可用性测试时,作不同阶段的比较。此外,对于同一网站不同版本的重复研究时,以及对不同网站的对照研究时,也可以进行上述比较。

参考文献

Bernard, M. (2001). Developing schemas for the location of common web objects. Usability News 3.2. [Online]. Available: psychology.wichita.edu/surl/usabilitynews/3W/web_object.htm

Bernard, M. (2002). Examining user expectations for the location of common e-commerce web objects. Usability News 4.1. [Online]. Available: psychology.wichita.edu/surl/usabilitynews/4S/web_object.htm

Duchowski, A. T. (2003). Eye tracking methodology: theory and practice. London: Springer.

Fitts, P. M., Jones, R. E. & Milton, J. L. (1950). Eye movements of aircraft pilots during instrument-landing approaches. Aeronautical Engineering Review, 9(2), 24-29.

Hyönä, J., Radach, R. and Deubel, H. (2003). The mind’s eye: Cognitive and applied aspects of eye movement research, Amsterdam: Elsevier Science.

Josephson, S. and Holmes, M. E. (2002). Visual attention to repeated images on the World-Wide Web: Another look at scanpath theory. Behavior. Research Methods, Instruments, & Computers, 34(4), 539-548.

Pan, Hembrooke, Gay Granda, Feusner & Newman, (2004). Determinants of web page viewing behavior. An eye-tracking study, Proceedings of the Eye tracking research & applications symposium on Eye tracking research & applications, 2004, San Antonio, Texas.

基于眼动分析的GUI设计探析 篇6

GUI在微机领域的应用极大的提高了工作效率,而如今,相较于发展更为迅猛的移动端APP,其GUI的设计显得尤为重要。我们应用客观定量性的眼动试验研究分析,提升APP的使用体验品质,同时所得出的结论也推广应用至更多界面设计当中,有效的将科学的研究方法有效应用于实际创新设计领域。

GUI的发展历程与现状

20世纪80年代苹果公司首先将图形用户界面(Graphical User Interface)引入微机领域,推出的Macintosh以其全鼠标、下拉菜单操作和直观的图形界面,引发了微机人机界面的历史性的变革。人们从此不再需要记忆和键入繁琐的命令,使得用户获取简单的消息比命令行花上更少的计算能力,不仅提高了工作效率也极大地方便了非专业用户的使用。而后微软公司推出了Windows系统,从Windows 3.0发展到Windows 10,使得GUI被应用于用户面更广的个人计算机平台。

如今这个大数据信息时代,APP的使用呈现出前所未有的热潮, APP的设计也带动了一个领域的发展。人们的生活、工作无不与此息息相关。GUI是APP的视觉呈现部分,其设计的优劣对于信息的传递效率、人们的情感与情绪体验直至用户是否会选择使用都起着至关重要的作用。国内外对于网页设计体验有一些相关研究,但对于当今应用更广泛,发展更迅速的移动端APP其客观定量性实验研究很少。在应用环境与支持技术发生变化的前提下,再移用早几年的网页布局、流程与审美已经满足不了APP的使用需要了。

GUI的眼动分析

1.GUI应用眼动分析的意义

眼动研究成果已经在心理研究,可用性测试、医疗器械设计和广告效果测试等众多领域发挥了重要作用,而对web设计的重要程度自然不言而喻。

我们的眼动实验可以测试网页或手机APP的布局是否符合预期;重点内容是否有效地被关注到;眼睛的视觉流以及页面跳转的过程是否与最优路径相等。通过眼动仪测试可以发现很多页面布局和逻辑问题,对测试后的路径图和热点图加以分析,对界面的交互设计更有益处。

使用先进的眼动实验手段对发展更为迅速的移动端GUI做客观定量性试验研究,具有视觉信息传递主观评价不可比拟的科学说服力。分析作为GUI的设计参考,对于提升APP的使用体验品质,指导APP的流程与GUI设计方向与细节具有重要意义。

2.基于眼动分析的GUI设计研究内容

研究用户在不同条件下对移动端界面设计的注意度以及界面本身的信息传递效率。

本研究通过设计眼动实验,并对实验得出的视线跟踪技术参数进行分析,测试用户对于移动端界面主题元素、图标、配色、导航工具的注意程度,对用户在界面上的各个注视点的空间和时间信息,以及用户的瞳孔尺寸变化信息等进行分析,对生成的眼动热点图(heatmap)、视线轨迹图(gazeplot)、集簇图(cluster)、蜂群回放(bee swarm)等等进行对比,研究出用户浏览的兴趣区以及使用习惯,在视觉布局、切换、图标等方面提出合理设计建议,从而更好的进行最后移动端的界面设计。

3.相关的设计要素与原则

简洁——突出重点,让用户能在移动端小屏幕上聚焦内容。

高效——避免键盘输入,有效的触动,更少的页面跳转能增加页面的连贯性,减少用户记忆负担。

一致性——它可以让产品更加易用,降低用户的认知成本,从而带来整体体验的提升。

反馈——即时、有效、清晰的反馈能让用户知道自己的行为正在被后台程序响应和处理。

情感化——情感化设计能带给用户愉悦舒心的感受。

移动化——做移动端产品就要从PC的思维逻辑中跳出来。

研究过程与设计建议

1.实验设备及材料

题目:针对手机、Pad、车载等移动端的GUI作为研究对象,圈选合适兴趣区,利用热点图、轨迹图等指标,在视觉布局、配色、图标等方面提出对于GUI的合理设计建议。

被试者:从沈阳航空航天大学随机选取5名男生、5名女生,所有被试视力正常,裸眼视力0.8以上,均无色盲、色弱,且为自愿参加。在人机实验室排除其他物理因素干扰条件下进行实验。

仪器:美国ASL Results + GM眼动仪一台、微机两台(一台呈现实验材料,一台执行控制命令和处理数据)。

实验方法:待测试的被试不能与已经完成的被试交流。被试依次进入实验室佩戴眼动仪,实验组人员对其进行眼校准。被试保持正确舒适的坐姿,根据提示语完成实验。同类多组材料应用控制变量法,实验结果使用平均值法。

实验材料:1.沈航官网首页再设计界面2.沈航设艺官网首页再设计界面3.智能家居easy life主页界面4.即刻健身App返回页面(由沈阳航空航天大学设计艺术学院2012届UI工作室提供)。

2.实验过程

被试进行调整。(2)呈现提示语。(3)被试清楚要求后自己按键开始测试。 (4)阅读完毕后按键结束,实验组人员记录被试眼动信息。

实验结果:

(1)视线轨迹图(视觉布局)

(2)眼动热点图(配色方案)

(3)眼动热点图(配色方案)

(4)眼动热点图(图标设计)

3.实验结果分析及设计建议

(1)根据对被试浏览三组仅有搜索框位置不同的界面时的视线轨迹追踪,可以看出当搜索框位于界面右方时,被试能更快速地找到,而且视觉流畅。

(2)根据眼动热点图可以看出,在第一组材料中被试注视点停留在次要内容(背景)的时间较长,在第二组材料中被试注视点停留在主要内容的时间较长。

(3)根据眼动热点图可以看出,对于三组不同配色方案的同一产品,被试注视点集中停留在浅色系配色方案上。

根据实验结果给出设计建议

(1)充分考量平台环境的一致性,避免用户在使用上的不习惯。

(2)在浏览过程中适时的弱化一些干扰项,做到内容优先,让内容最大化。

(3)出色的视觉效果(配色方案)是产品令人愉悦的基础。

结论

将眼动分析应用在GUI设计中,不仅可以弥补视觉信息传递主观评价对用户认知过程中不足,同时能够通过大量眼动分析数据,发现好的GUI在眼动分析方面更符合使用需求和拥有更高的使用效率,并且运用数据可以发现用户在使用APP过程中的习惯、特征以及兴趣点等。在实验中,我们更深地了解到GUI使用图形或图标来表达信息对象,建立了一种基于心理学的识别功能。通过这些结论来优化人机关系,为人与界面之间建立交流互动的桥梁。以此提升APP的使用体验品质,并指导APP的流程与GUI设计方向与细节,设计出更为出色的和更为人所接受的GUI产品。同时我们实验所得出的结论也会推广应用至更多界面设计当中,有效的将科学的研究方法有效应用于实际创新设计领域。

眼动技术在广告研究中的应用 篇7

关键词:眼动,广告,应用

眼动技术是心理学研究方法的一种, 它可以通过测量眼动轨迹等来很好的观测人们的注意力情况。广告是产品宣传的必要手段, 其效果的好坏直接影响产品被大众的熟悉度以及销售量。利用眼动技术来测量人们观看广告时的注意情况, 可以为广告设计提供有效的建议, 增加广告的效度。

一、眼动技术的发展

视觉系统是人类获取外部信息最重要的通道, 在实验心理学的早期历史中心理学家就开始注意到眼动特征及其规律的心理学意义, 利用眼动技术 (eye movement technique) 探索人在各种不同条件下的信息加工机制也成为当代心理学研究的重要范型, 其研究规模和涉猎领域在国内外都迅速扩展。

1. 眼动技术的来源

19世纪末20世纪初, 心理学家开始使用简单的眼动记录技术考察人在图形扫描和文字阅读中的眼动轨迹, 以及这些眼动轨迹与视觉信息加工之间的关系。在20世纪中期以前, 研究者就为心理学研究开发出许多眼动记录技术, 只不过这些眼动记录技术都存在误差大、操作难和对被试眼动带来较大负担等缺点。20世纪中期以后, 摄像技术的引人, 特别是计算机技术的运用推动了高精度眼动仪的研发, 极大地促进了眼动研究在国际心理学及相关学科中的应用。

2. 眼动技术介绍

眼动有三种基本方式:注视 (fixation) 、眼跳 (saccades) 和追随运动 (pursuit movement) 。1.注视:是指将眼睛的中央窝对准某一物体的时间超过100毫秒, 在此期间被注视的物体成像在中央窝上, 获得更充分的加工而形成清晰的像。但注视不等于眼球的静止, 注视中常常伴随着三种形式的极为细微的眼动:自发性的高频眼球微颤、慢速漂移 (slow shifts) 和微跳 (microsaccades) 。这些细微眼动是视觉信息加工所必须的信息提取机制。一般认为, 慢速漂移使目标逐渐离开中央窝的中心, 而由微小跳动纠正这个偏差, 以保持正确的注视状态, 这就使得被注视物体在视网膜上的成像位置不断发生变换以克服网膜适应导致的视像消失, 而眼球震颤则可将刺激信息调制成交流信号以便能穿过视觉通道。2.眼跳:是注视点或注视方位的突然改变, 这种改变往往是个体意识不到的。眼跳的速度很快, 最高可达每秒450度, 眼跳的幅度则可以从2分度到20度。眼跳过程中可以获

取刺激的时空信息, 但几乎不能形成刺激的清晰像, 所以眼跳可以实现对视野的快速搜索和对刺激信息的选择。3.追随运动 (Pursuit movement) :当被观察物体与眼睛存在相对运动时, 为了保证眼睛总是注视这个物体, 眼球会追随物体移动;追随运动常常伴随较大的眼跳和微跳, 它是“由运动目标的速度信息输人到中枢神经系统, 眼睛为了追随这个目标而引起的一种连续反馈的伺服运动。

上述三种眼动方式经常交错在一起, 目的均在于选择信息、将要注意的刺激物成像于中央窝区域, 以形成清晰的像。眼动可以反映视觉信息的选择模式, 对于揭示认知加工的心理机制具有重要意义。研究发现, 两眼的跳动几乎完全一致, 这为眼动研究提供了诸多便利。

3. 现在眼动技术研究所适用的领域 (1) 视觉信息加下心理机制的研究

视觉信息加工是心理学基础研究的重要课题, 眼动信息可以在细微方面反映信息提取和选择方面的过程与规律。

(2) 动机与态度的研究

在相同情境下, 记录被试的眼动信息, 可以探测到被试对信息的选择取向, 从而研究不同个体在相同情境下的动机与态度取向。

(3) 发展心理学的研究

认知发展是儿童心理发展的核心成分, 通过记录不同年龄的儿童的青少年在各种不同条件下的眼动信息, 可以探测其信息加工能力、学习能力的发展水平。

(4) 教育心理学的研究

此方面的研究是国内外当前眼动研究的主要领域, 特别是在阅读的眼动研究方面成果丰富。在阅读一个材料时, 我们的眼睛移动到文章的不同位置以获取必要的信。

(5) 消费心理学的研究

利用眼动研究可以精细地研究不同产品、产品包装、产品陈列方式等引起消费者的关注程度, 以及广告设计策略等。

(6) 工程心理学的研究

工程设计中经常考虑人的因素的制约性, 比如视觉信息搜索的速度、范围及其快捷性等, 利用眼动研究可以探测人一机交互作用中的视觉信息提取及视觉控制问题。

(7) 交通心理学的研究

眼动的交通心理学研究主要涉及驾驶舱内的表盘设计问题、道路建设及路标设置间题、驾驶者在驾驶过程中的视觉信息搜索及其培训问题等等。

(8) 体育心理学的研究

在各种体育运动过程中, 视觉信息的提取是其基本的心理支持, 而视觉信息提取的不同模式可能正反映了高水平运动员与一般水平运动员或新手之间的运动能力的差异性。所以, 记录不同水平运动员在运动训练或比赛过程中的眼动模式, 有利于提供对新手进行有效训练的模式和策略。

(9) 病理心理学的研究

不难假设, 面对同样的视觉图景, 具有病理心理特征的观察者, 与正常状态下的观察者相比, 必然具有不同的眼动模式。所以, 可以采用眼动技术进行病理心理学的研究和制订更为可靠的病理心理筛选的眼动标准。

二、广告研究中眼动技术的应用

自从20世纪20年代Nixon (1924年) 以眼动为指标用肉眼观察研究广告到现在用精密仪器——眼动仪来进行广告研究, 已有大量的成果问世。研究的范

围从报纸杂志以及黄页等印刷媒体广告到Internet广告, 内容从广告的大小、颜色、位置、独创性、广告成分 (标题、图片、文字、商标) 以及广告重复呈现到消费者的因素动机、熟悉、卷入等。随着眼动技术的迅速发展, 广告心理学的眼动研究无论是在数量上和质量上都了巨大的进展。下面是对近年来国外学者在广告领域利用眼动指标进行研究的概括和总结。

1. 广告的外源性 (exogenous) 影响因素的眼动研究

广告的外源性影响因素是指广告本身的特征, 例如, 广告的外在物理特征如尺寸、形状、颜色、位置、广告的成分等, 这些特征能迅速地捕获人们对广告的注意, 而且几乎是自动地引起注意, 即使消费者没有主动搜寻这些特征。

(1) 广告的尺寸

已有研究表明广告的尺寸影响人对广告的注意。Lohse (2001) 对中国的黄页广告进行了眼动研究, 结果发现, 广告的大小影响人对广告的注视情况。大幅广引起的注视次数多, 注视时间长, 而且广告的尺寸也影响人对广告的注视顺序, 大幅广告在小幅广告之前注意到。

(2) 广告的图案

有研究表明广告有无图案会影响注视情况。Lohse (2001) 的中国黄页广告研究发现被试注视了84%的有图案的广告, 但是有无图案的广告之间的注视没有差异, Lohse认为可能是存在“天花板效应” (ceiling effect) 。然而图案对广告的注视顺序有影响, 有图案的广告比无图案的广告先注意到。所以Lohse认为很难确定有图案的广告比同等大小的无图案广告受到的注意多。

(3) 广告的颜色

研究表明, 广告的颜色对人们观看广告时的眼动情况有影响。一般来说, 彩色广告比黑白广告的注视时间要长, 注视次数要多, 因为颜色广告通过使目标信息更容易吸引注意来降低视觉搜索的难度。颜色对于注视的先后顺序没有产生影响。

(4) 广告的位置

已有研究发现, 一页中广告的位置对于人们是否观察广告有较大的影响, 即使是这个位置上的广告没有什么商业产品信息。一般来说, 页面上方的广告注意的较多, 页面底部的广告很少被注意。

(5) 广告的独创性

有人认为广告独创性是广告效果的核心, 因为它抓住消费者的注意并且使广告更加好记。有研究结果表明: (1) 广告熟悉性水平提高会降低对广告的注意, 而广告独创性提高则引起对广告注意的增多; (2) 广告熟悉性提高引起的注意减少不能通过提高广告独创性来缓解, 而广告熟悉性的较高水平能增加广告独创性对品牌注意的积极影响; (3) 独创性的广告能够吸引更多的注意, 而那些既独创的又熟悉的广告引起对广告品牌的注意最多。

(6) 广告的重复呈现 (Repetition)

广告重复出现在消费者的视线内, 既有积极的作用, 也有消极的作用。其积极作用是: (1) 消费者的购买习惯可以通过不断重复该商标商品的广告逐渐形成, 只要该商品的特性能够满足消费者的需求; (2) 在大众不太熟悉商品的场合下, 比如一个新产品的出台, 频率高的广告不仅强化大众对它的学习过程, 而且高频

率本身就可能成为该商标的一个优势指标; (3) 对于著名的品牌, 广告的重复作用主要是防御性的, 即旨在巩固消费大众已经建立了的重复购买习惯即认牌购买。广告重复的消极作用: (1) 过度重复由于没有新内容而导致厌倦的产生; (2) 随着重复次数继续增加以至于把认知活动转移到其他的无关信息, 其结果难以产生态度改变, 甚至导致消极态度。

2. 广告的内源性 (endogenous) 影响因素的眼动研究

广告的内源性影响因素是指人的因素, 例如产品的卷入 (product involvement) 、动机 (product motivation) 、已有知识 (prior knowledge) 和品牌熟悉度 (brand familiarity) 等, 已有研究表明这些内源性因素影响人观察广告时的眼动情况。如Pieters (2004) 研究认为高卷入产品的广告受到更多的注意, 熟悉的广告较少被注意。

3. 广告眼动的性别差异和文化差异研究

由Starch电视广告部对1972-1979年的工作日报纸上的2628个广告进行调查, 结果指出有女性倾向的产品广告被女性识别比男性识别要高60%, 而有男性倾向的产品广告男性评分比女性高77%。Campbell研究了8个被试 (4男4女) 观看5幅广告 (均包括图案和文字两个成分) 的眼动情况。广告用索尼电视机呈现, 用ISCAN记录眼动, 并在眼动记录结束后让被试完成一份问卷调查, 该问卷包括五个问题, 用来测验被试对广告细节的注意和短时记忆。结果发现: (1) 男性能写出更多的公司名称; (2) 男性比女性注意文字的时间要长, 但是两者之间没有显著性差异; (3) 文字的位置是影响文字是否被阅读的一个指标; (4) 文字上的注视时间与图案上的注视时间没有差异。

Geertz、Hofstede和Kerne认为眼动反映了内在信息加工的特点, 不存在文化上的差异。Lohse把2001年中国黄页广告的结果与他在1997年对美国黄页广告的结果进行了比较, 结果发现中国与美国黄页广告注视时间没有差异。1/4页面广告平均注视时间中国是5.7秒, 美国是6.4秒;1/16页面广告的注视时间中国是4.5秒, 美国是4.4秒;列表广告的注视时间两者均为1.2秒。然而Whitelock和Chung (1989) 的一项跨文化研究发现人们对印刷媒体广告的注视存在一些差异。Cutter和Javalgi (1992) 也指出, 比起相似性来说存在更多的国家文化差异。不同国家的人对广告的注视情况是否有差异还需要进一步的研究。

4. 不同类型广告的眼动研究

目前为止, 进行眼动研究的广告不仅包括印刷体广告——报纸广告、杂志广告、黄页广告, 而且还涉及了Internet广告的眼动研究。CNET使用眼动追踪技术测验了32个网络使用者对于网站上广告的尺寸、位置和类型的反应, 考察了他们的首次注视点、注视时间并让被试选出喜爱的广告, 结果发现, 人们喜欢摩天大楼图片广告胜过旗帜广告、大广告胜过小广告、生动的互动性的广告胜过静态的广告, 因此说更大更生动的广告效果更好。不过Sandra Marshall认为网络读者习惯于避开网上的旗帜广告, 即使这些广告越来越大, 越来越生动。

参考文献

[1].Gorn, G., Pham, M.T., Sin, L.Y..When arousal influences adevaluation and valence dose not (and vice versa) .Journal of ConsumerPsychology, 2001, 11 (1) :43-55.

[2]Rayner, K., Rotello, C.M.Stewart, A.J.et al.Integrating textand pictorial information:Eye movements when looking at printadvertisements.Journal of Experimental Psychology, 2001, 7 (3) :219-226.

[3]Wedel, M., Pieters, R..Eye fixations on advertisements andmemory for brands:A model and findings.Marketing Science, 2000, 19 (4) :297-312

[4]闫国利, 田宏杰:眼动记录技术与方法综述.应用心理学, 2004, 10 (2) :55-58

[5]王克芹:平面广告不同排版方式的眼动研究, 上海师范大学, 硕士学位论文, 2005

[6]闫国立, 白学军:广告心理学中的眼动研究和发展趋势.心理科学, 2004, 27 (2) :459-461

面向人机交互的眼动跟踪方法研究 篇8

在各种领域的眼动跟踪研究有助于了解人类的行为和对视觉刺激的反应[1]。此外,特别针对患有残疾的人们,眼动跟踪还被研究运用于电脑界面的输入设备上。早期,基于机械式和光学的直接安装在巩膜接触透镜或者眼睛上的一些眼睛运动检测方法(如Duchowski)已经能达到非常高的精度,然而其强烈的侵入性会对用户造成不良的使用感。[2]后来,由Young和Sheena[3]提出的眼电图法(Electro-Oculogram),同样具有侵入性,且精度较低,噪声较大。

目前大多数商业视线检测使用红外(Infrared Radiation)相机和主动红外照明的方法来实现高精度的视线方向评估。然而,阳光和用户所佩戴的眼镜会一定程度上降低红外图像跟踪方法的可用性和准确性,同时长时间的红外光照射也会对眼睛产生一定程度上的伤害。为了解决这个问题,可见图像跟踪方法在过去的几年中得到了大量的研究。不同于基于眼图中瞳孔和角膜反射坐标的红外图像跟踪方法,可见图像法直接映射眼睛虹膜中心(Iris Center)的位置到目标平面显示器屏幕。Daugman[4]提出一种使用积分-微分算子(Integro-Differential Operator)在目标形状模型下提取眼图像中圆形虹膜边界(Iris Boundary)的方法,其缺点在于,模型的参数需要迭代或手动调整,不适合实际应用。Valenti and Gevers[5]提出一种基于特征的跟踪方法,使用等照度线特征(比如同等强度下的曲线连接点)来确定虹膜的中心,这种方法的不足之处在于当眼睛区域的特征数目不够多时经常会检测到眉毛或者眼角而不是虹膜中心。Takeshi Takegami等人[6]提出了利用Hough变换拟合椭圆的算法来定位瞳孔,但由于椭圆的参数有5个,参数空间过于庞大,因此拟合效率很低,满足不了实时要求。后来,Lin等人[7]提出基于最小二乘法的椭圆拟合方法,但是由于瞳孔在边缘检测过程中容易受到干扰点的影响,拟合出来的椭圆与真实结果相比往往具有较大偏差。

本研究以椭圆法线法为基础,引入瞳孔边缘像素点的灰度梯度方向特性,利用最小二乘法,运用改进的椭圆拟合方法来检测视线点,开发一套便携移动式眼动跟踪系统。

1 眼动跟踪方法框架

标准的实时眼动跟踪的算法流程图如图1所示。

2 眼动图像处理

通过视屏摄像头采集用户眼睛图像后,需对图像进行滤波,二值化等图像预处理,为后续眼动跟踪提供基础。

2.1 图像滤波

选取合适的滤波方法对后续的图像处理至关重要,经过多次对比测试,在均值滤波,高斯滤波、中值滤波和双边滤波这四种主流滤波方法中,本研究选取中值滤波进行图像预处理,选取参数为9×9的核大小。

滤波后的瞳孔图像如图2所示。

2.2 图像二值化

因为自然光的条件下,瞳孔与虹膜,眼白等其他眼组织反射的光线有比较明显的色差,在采集的图像中,瞳孔呈现黑色,因此本研究可以运用一个比较合适的低阈值对图像进行二值化处理,即可得到灰度值比较低的瞳孔区域的图像。但自然光线与环境的变化会对采集到的图像中瞳孔的灰度值有较大的影响,所以不适宜设置固定不变的阈值来进行二值化处理,在本研究中,本研究运用最大类间方差法来选择最佳阈值[8],具体算法如下:

设图像中灰度为i的像素素数为ni,灰度范围为[0,L-1],则总的像素数为:

则各灰度值出现概率为:

对于pi,有:

把图中的像素用阈值T分成两类C0和C1,C0由灰度值在[0,T-1]的像素组成,C1由灰度值在[T,L-1]的像素组成,则区域C0和C1概率分别为:

区域C0和C1的平均灰度分别为:

其中:μ—整幅图像的平均灰度,且:

两个区域的总方差为:

让T在[0,L-1]范围内依次取值,使总方差获得最大的值的T便是最佳区域分割阈值。

二值化后的瞳孔图像如图3所示。

3 瞳孔中心定位

在普通自然光线下,不同人的瞳孔大小在一个特定的范围内变化,因此本研究采用了一种基于霍夫圆变换的算法进行瞳孔中心的定位,该算法在噪声、遮挡和变化照明的不利情况下有较好的稳定性。

3.1 累加阵列计算

高梯度的前景像素点被选定作为候选像素点,并且可以在累加阵列中进行“表决”。在经典霍夫圆变换执行中,候选像素在周围形成的固定半径的完整圆周围进行投票。描述了一个候选像素坐落在实际圆(实心圆)和经典霍夫圆变换对该候选像素进行表决的模式如图4(a)所示。

3.2 圆心定位

属于一个图像中圈的候选像素的表决往往积聚在相应于圆的圆心累加器阵列仓中。因此,圆的圆心通过检测累加器阵列中的峰值得到定位。候选像素们(实心点)坐落在实际圆上(实心圆圈)和它们的表决模式(虚线圆圈)-与实际圆的中心重合如图4(b)所示。

本研究运用以上方法对瞳孔图像逐帧进行图像处理,以确定瞳孔中心。检测到的瞳孔中心示意图如图5所示。

4 注视点标定

本研究使用均匀分布在屏幕上的25个圆点来完成标定的程序。每一次只有一个点以随机的方式出现,每个点每次显示2 s,从而提供给研究人员足够的标定数据。并且,为了最大程度上增加测试者的注意力,屏幕上显示的圆点的半径依次逐渐减小。屏幕上的标定点如图6所示。

在完成标定程序之后,测试者要观察一组数量为25个的在屏幕上随机出现的圆点,这样每一次实验都能拥有一组既随机又唯一的测试点。这些测试点将用来检测标定技术是否达到功能要求。

本研究采用基于二阶模型的标准标定方法来进行验证。一个标准标定算法通常会设置一组5个,9个或者25个的标定点。最简单的线性标定模型只考虑5个标定点(即图中的点:1,5,13,21,25)。本研究用如下的方程来取得屏幕坐标和测量结果之间的映像:

式中:(SxSy)—屏幕坐标,(x,y)—瞳孔-眼的角向量,a0,a1和b0,b1—未知系数并能通过最小二乘法求得。

二阶多项式标定方程需要用到9个标定点(图中点:1,3,5,11,13,15,21,25,23)或者25个点(图中所有点)。该多项式如下所示:

式中:a0-a1,b0-b1—未知系数,并能通过最小二乘法求得。

标定完成之后,注视点的坐标可通过插值算法求得。比如,假设屏幕坐标和用于标定的眼角到瞳孔角向量在点集P1和P2中是相对独立的,即{(sx1,sy1),(x1,y1)}和{(sx2,sy2),(x2,y2)}。那么在测量眼角到瞳孔的角向量(x,y)之后,屏幕坐标可由以下方程式求得[9]:

标定误差的平均映射误差可由以下公式计算得出:

式中:E—标定误差;i—测试点代号;ei—单个测试点的映射误差;(xei,yei)—测试点的实际坐标;(xmi,ymi)—对应映射瞳孔//眼角向量的坐标。

5 实验评估

为了评估系统的准确性,本研究招募了15名测试者来完成最终的测试,各个测试者视力情况均正常。笔者分别测量了每名测试者的注视点,并在水平和垂直两个方向上评估了视线检测误差。为保证实验测试质量,本研究测试环境固定为白天光线充足的室内,避免了光线过于强烈的室外和光线组成较复杂的夜晚。

5.1 测试系统的组成

为了验证本研究提出的眼动跟踪系统,本研究设计开发了一个原型系统,其硬件如图7所示。

基于树脂镜架的载具方便用户进行佩戴,并且与眼睛保持相对固定的位置,在镜架右眼的位置,本研究运用3D打印技术设计了一个CCD摄像头采集工具,通过镜面反射,可以拍摄到整个眼球区域。CCD摄像头品牌为昌斯特,最高分辨率为1 200*800,图像采样频率为30帧/秒,焦距为0~10 cm,数据输出口为USB2.0,可与电脑直接连接。整个系统轻便体积小,不会给用户带来大的干扰。

5.2 试验结果和评估

本研究分别测量了每名测试者的注视点,并在水平和垂直两个方向上评估了视线检测误差。运用上文提出的标定算法后,本研究得到了其中一名测试者的初始视线数据和标定后的矫正数据,如图9和图10所示。

该测试者的映射测试数据如图11所示。

空心圆点—实际的测试点;空心圆点—视线数据

5.3 视线点的检测误差

本研究将15名测试者随机分成5组,测试结果取每组五名测试者的平均值,表1和表2即为5组测试者的视线检测误差和垂直与水平方向的眼睛注视检测的结果。研究人员可以明显地看出,水平方向的检测误差明显小于垂直方向的检测误差。在实际测试过程中,A,B,D和E这4组测试者的数据显示,垂直方向检测的误差超过了30(像素),大于水平方向检测的误差。

(单位:pixel)

对5组测试人员的测试数据进行对比分析发现,水平方向误差明显大于垂直方向的误差,而同一名测试者的每次测试数据也有不同程度的差异,但是在合理范围内。原因总结如下,在日常生活中,瞳孔(眼球)的水平方向运动范围明显大于垂直方向的运动范围,造成水平方向的测试精度大于垂直方向的测试精度。

本研究中CCD摄像头的分辨率设置在640*480的中等分辨率以增加系统的检测跟踪速度,图像跟踪帧率达到12 fps,基本满足了系统速度的要求。误差除以摄像头水平与垂直方向的总像素后即得到系统的水平方向视线检测误差和垂直方向视线检测误差,分别是3.74%和5.34%,具有较高的精度,并且与其他的单摄像头视线检测方法有同等级别的表现。考虑到本研究所提出的系统硬件配置简单,便于携带,具有更高的性价比。本研究提出的方法与其他眼动跟踪方法(VE[10]、IP[5])的精度对比如表3所示。

6 结束语

本研究提出基于梯度值和圆特性的改进椭圆拟合算法进行对眼球瞳孔中心进行检测跟踪,通过基于二阶模型的标定对注视点进行标定,实验测试结果表明,该系统在水平与垂直方向的检测误差分别为3.74%和5.34%,精度较高,满足了人机交互系统功能性的需求。同时本研究运用3D打印技术辅助设计了一套便携移动式眼动跟踪装置,通过个人电脑和普通CCD摄像头在自然光下获取眼动图像,结构简单、便于佩戴,有较大应用前景。

在下一步的工作中,笔者将改进眼动跟踪算法,提高检测精度,完善系统硬件,将这一系统投入真正实际的眼动输入应用中。

参考文献

[1]AUN K A H,JEFF P,JUAN C.Lightweight,low-cost,side-mounted mobile eye tracking system[C].Image processing workship c WNYIPN,New York:IEEE,2012:1-4.

[2]DUCHOWSKI A T.Eye tracking methodology:theory and practice[M].London:Springer,2003.

[3]LAURENCE R,YOUNG,DAVID S.Survey of eye movement recording methods[J].Behavior Res.Methods Instrument,1975,7(5):397-429.

[4]JOHN D.How iris recognition works[J].IEEE Transactions on Circutts&Systems for Video Technology,2004,14(1):21-30.

[5]VALENTI,R.GEVERS.T.Accurate eye center location through invariant isocentric patterns[J].IEEE Trans actions on Pattern Analysis&Machine Intelligence,2012,34(9):1785-1798.

[6]TAKEGAMI T,GOTOH T,OHYAMA G.An algorithm for model-based stable pupil detection for eye tracking system[J].Systems and Computers in Japan,2004,35(13):4,21-31.

[7]XIANG L,JENNIFER C,SIMON D et al.Accurately measuring the size of the pupil of the eye[D].Auckland:University of Auckland,2003.

[8]OTSU N.A threshold selection method from gray-level histogram[J].Systems Man&Cybernetics,1979,9(1):62-66.

[9]MEHRUBE M,LINH M P,HUNG T L,et al.Real-time eye tracking using a smart camera[J].Applied Imagery Pattern Recognition Workshop(AIPR),2011(10):1-7.

眼动技术在飞行安全中的应用概述 篇9

心理学认为眼球运动是视觉过程的直接反映,反映了多种人类认知活动,受到多种认知因素的影响;飞机驾驶是高度依赖于视觉的任务,飞行员既要靠细致的注视来完成精确的控制动作,又要靠眼睛快速地对环境的扫视获取飞行的情景意识。以眼动技术为研究手段,考察飞行员在驾驶过程中的眼动指标,分析飞行员完成任务时的眼动模式,可为人机界面的设计、机场道路环境建设、驾驶员的选拔培训以及确保驾驶安全等方面提供依据。

1 在驾驶舱人机界面设计中的应用

随着飞机性能的提高和显示信息的增多,人机界面沟通顺畅与否同驾驶安全的联系愈发紧密。Williams, K.W.和Ball, J.D.[1]运用眼动技术研究了在目视和仪表程序下通用航空驾驶舱不同类型显示器对飞行绩效和工作负荷的影响,客观地证明了GPS、MFD显示器的可用性。康卫勇[2]等在飞机座舱视觉显示界面设计阶段,利用三种脑力负荷评价方法,对脑力负荷进行综合评价,进而确定最佳的座舱设计方案。其中的生理测量法选用眨眼率、眨眼时间和瞳孔大小等三个眼动指标作为评价脑力负荷的眼动参数。此外,人机显示界面中的文字和位置编码也是学者们关注的领域[3],利用眼动仪对被试者完成任务过程中的眼动状态进行测量,根据其眼动数据分析文字和位置编码对信息辨识的影响,为显示界面的优化设计提供科学依据。

2 机场道路环境建设中的应用

2.1 滑行道的线型设计

滑行道的线性设计包括平面线的曲率设计等。眼动技术的发展为滑行道线性设计提供了一个新的途径和依据。利用眼动技术的相关理论,在研究驾驶员视觉搜索模式的基础上,通过实验,确定滑行道线性条件与驾驶员视觉搜索模式的相关性,进而设计出更为安全、更加宜人的滑行道线性。

2.2 机场滑行道、停机坪道路的安全评价

通常,航空器自行或经牵引车牵引通过滑行道在停机坪和跑道之间移动。因此,停机坪和滑行道的安全性直接影响着航空器以及地面车辆的行驶安全。丁立等[4]利用驾驶模拟器建立了对公路道路进行安全评价的主客观模型,其中眼动评价法作为客观评价方法的一种,利用眼动仪对驾驶员眼动情况进行测量,以此判断人的工效。目前,飞行区道路安全评价的研究成果鲜见于报端。

2.3 机场滑行道、停机坪标线标牌设置

航空器在地面滑行过程中,除了听从塔台指挥和地面牵引车的牵引,道边标牌以及地面标线也是驾驶员感知交通信息的重要途径。以眼动技术为基础可以研究驾驶速度与标志文字高度对驾驶人视觉搜索广度、注视持续行为及视角分布的影响[5]。以此可以制定对安全最为有利的文字高度,或者在文字高度一定的情况下制定最为安全的行驶速度。此外,以眼动仪为研究手段的研究发现,道路交通中的指路标志信息量与视认反应时间存在定量关系[6]。美国FAA在2009年计划将75个最繁忙机场的滑行道中线升级为新的线型模式[7],以增强飞行员和机动车驾驶员的情景意识。而作为一种测量手段,眼动技术以其便捷性、准确性和客观性势必会在机场滑行道、停机坪标线标牌设置研究领域占有一席之地。

2.4 夜间飞行时,滑行道、停机坪上的照明设计

良好的机场照明能使驾驶员产生较好的视觉功效,从而有利于夜航飞机的安全起降。研究表明[8], 在其它条件一定的情况下, 人眼的视觉功效是由瞳孔大小决定的: 瞳孔收缩能提高视觉功效;而瞳孔放大会降低视觉功效。应用眼动技术研究地面道路照明对驾驶员瞳孔大小影响可得出道路照明亮度的适宜范围[9]。运用眼动技术测量飞机驾驶员夜间不同照明亮度下的瞳孔面积,可以为机场照明的设计提供依据,为机场照明数据的获取开辟了一条新的途径。

2.5 机场飞行区道路的外部环境

通过对航空器驾驶员在地面滑行阶段的眼动数据分析,可以得知驾驶员的生理和心理状态。在充分考虑驾驶员动态视觉特性的条件下,设计机场飞行区道路的总体外部环境,包括机场内草坪、树木的设计,指示标牌的分布等,以达到最佳的景观宜人性和安全性,做到既使人心情愉悦,又不致分散驾驶员的注意力。

3 驾驶员培训中的应用

3.1 飞行中情景意识的培养

情景意识对于飞机驾驶员的航空器操纵来说是至关重要的[10],并且可以通过训练来获得[11]。眼动技术为情景意识的测量提供了新的研究手段,以客观生理指标为基础,避免了以往测量方法主观性过强[12]的弊端。Williams, K.W.在研究驾驶舱显示器对飞行员情景意识的影响[13]时,应用眼动仪测量了模拟飞行中飞行员观看机舱外部时间的比率,比较了其与飞行员完成飞行任务表现的关系。国内学者利用眼动技术研究发现[14]使用Top-down机制来启动眼动,有利于情景意识的形成,使驾驶员有目的地获取他所需的关键信息,进而提高判断和操作的准确性。在日常的飞行训练中可以有意识地培养驾驶员运用Top-down机制启动眼动,从而有利于更好地获取情景意识。

3.2 飞行员的飞行绩效考核

在研究飞行员的眼睛运动规律时发现不同熟练水平的飞行员的眼动模式存在明显差异,且眼动模式和飞行绩效相关,因此可以利用眼动模式诊断操作缺陷和评价飞行绩效[15]。我国学者柳忠起等[16]基于BP神经网络利用眼动数据建立了飞行绩效评价模型,实现了飞行绩效的客观评价。此外,还可将眼动技术应用到飞行训练中去。研究发现,专家和新手的飞行绩效和眼动模式存在明显差异[17]。通过对比专家和新手模拟飞行着陆中的眼动模式,不仅可以为评价飞行员绩效提供参考,亦可为制定飞行学员的培训计划提供依据。

4 飞行驾驶安全中的应用

4.1 飞机驾驶员的疲劳检测

飞行员驾驶航空器,往往需要长时间集中精力监控驾驶舱的各种仪表,极易引起脑力疲劳,进而造成操作失误,引发安全隐患。因此,疲劳特别是脑力疲劳成为当前国内外学者研究的热点问题。脑力疲劳的评定主要有主观和客观两种方法[18]。主观评定的结果受记忆和个人能力影响较大;眼动技术作为客观评定法的一种具有携带方便、可在真实环境中测量而不影响被试者完成既定任务的优点,因而受到研究者关注。Zainal Arief等[19]在比较学生早晚两个时间点的眼跳参数时发现,眼跳速度和持续时间存在明显差异,由此可推断出视觉肌肉的疲劳对眼跳速度和持续时间有直接影响。目前国内外学者对眼动测量疲劳的指标尚未形成一致的结论,还有待于专家学者继续探讨研究。

4.2 驾驶员工作负荷的测量

随着民用航空器自动化程度的提高,飞行员需要处理的信息量也不断增加,这就加重了飞行员的工作负荷,对飞行安全的威胁极大[20]。飞行员工作负荷过大或过小都对飞行安全不利[21]。为了确定一个合理的工作负荷阈值,需要对工作负荷进行准确地测量。当前国际上常用的测量方法是任务负荷指数等级方法(TLX)[22],它是主观评定法的一种,存在着主观性过强的缺陷。国外研究发现,眨眼的频率和工作任务的难度存在正相关性[22]。对于航线飞行员来说,多任务的眨眼频率比单一任务的眨眼频率高。眼动技术能够从生理学的角度客观地反映飞行员的工作负荷。

4.3 驾驶员驾驶分心的测量

飞机驾驶中的分心的情况包括与搭档或空管员的交谈、驾驶舱中仪器仪表警报声响等。驾驶分心的测量方法主要分为直接测量和间接测量两类[23]。眼动测量法是直接测量方法中的一种。飞机驾驶员的视线长时间地离开相关仪表是驾驶分心最为直接、有效的指标,运用眼动仪捕捉驾驶员的眼动过程,在驾驶分心的早期及时发现并纠正之。

5 结论

眼动技术在航空领域主要有四个方面的应用:驾驶舱人机界面设计、机场道路环境建设、驾驶员培训以及飞行驾驶安全。

(1)目前,眼动技术在驾驶舱人机界面设计中的应用在国内主要在军事航空领域中开展,在民航领域的应用甚少。当前我国民航制造业正处于大型民航客机设计和制造的攻坚阶段,利用眼动技术对驾驶员的眼动模式进行研究有助于优化驾驶舱的人机界面设计。

(2)目前眼动技术在道路建设中的研究集中在地面交通运输领域,机场道路建设的眼动研究开展较少。但利用眼动技术测量眼动数据具有一定的客观性和真实性,因而其在机场道路环境建设中的优势是不言而喻的。未来国家将继续加强机场建设,对飞行员在滑行过程中的眼动数据进行研究可为新建机场的道路环境设计提供借鉴。

(3)眼动技术应用在驾驶员培训中主要有情景意识的培养和飞行绩效考核两个方面。应用眼动技术对情景意识的研究在国外开展得较多,国内此方面的研究仅见于军事航空领域。飞行员情景意识的培养以及飞行绩效的考察在未来驾驶舱自动化水平不断提高的大背景下意义尤为重大,眼动技术的应用无疑会使测量的结果更加真实可靠。

(4)飞行安全领域的眼动研究重要集中在驾驶员疲劳检测、驾驶员工作负荷以及驾驶员驾驶分心的测量等三个方面。眼动技术以其客观性和真实性的特点,与常用的主观测量方法相比有不可比拟的优势。

摘要:近年来,眼动技术开始广泛应用在道路交通、广告设计、军用飞机飞行员眼动模式的研究中。本文介绍了国内外眼动技术的应用现状,从飞机驾驶舱人机界面设计、机场道路环境建设、飞机驾驶员培训和飞机驾驶安全等四个方面阐述了眼动技术在民航飞行领域中的研究现状及应用前景,为眼动技术在民航飞行领域的应用研究提供借鉴。

眼动实验 篇10

另一方面, 罗夏墨迹测验自1921年创立以来, 一直是临床心理学界使用最广泛的心理测验之一, 20世纪四五十年代它几乎成了临床心理学的同义语[6]。该测验的创始人Rorschach采纳了格式塔学派的观点, 将测验当成一种知觉任务, 认为对象完成这一知觉任务的结果体现了其心理机能[7]。在20世纪60年代, 罗夏墨迹测验每年被使用100万次, 用时500万小时, 花费25亿美元, 这足以说明它受重视的程度[8]。但是, 关于罗夏墨迹测验的争议自其创立就从未停止。罗夏墨迹测验发展至今一直存在着一些客观性问题, 这些问题正是质疑罗夏墨迹测验的根本原因[9]。将罗夏墨迹测验与眼动技术相结合, 对其客观性进行探讨, 可以为罗夏墨迹测验的完善与发展提供更多的客观依据。国外对罗夏墨迹测验的眼动研究多针对精神分裂症患者进行, 研究发现精神分裂症患者不同于正常人的眼动特点为:精神分裂症患者的眼跳幅度、注视点数目均比正常人少, 但精神分裂症患者的注视时间要长于正常人[10]。目前, 我国除有少数学者尝试使用罗夏墨迹测验外, 多数人则持观望态度[11]。而我国将罗夏墨迹测验与眼动技术相结合的研究更是有限, 截止到2013年3月5日, 在CNKI上检索到的国内关于罗夏墨迹测验的眼动研究只有5篇, 其中与抑郁有关的只有1篇。

在这种大的背景下, 本研究希望通过对抑郁障碍患者眼动特征的探究, 为抑郁障碍的识别诊断提供更多的客观证据, 现报告如下。

1 资料与方法

1.1 一般资料

随机选取2012年6月-2013年6月在乌鲁木齐市精神病医院就诊的15例抑郁患者, 其中男6例, 女9例, 平均 (38±9) 岁。入组标准符合《中国精神障碍分类与诊断标准》对抑郁障碍的诊断标准。即患者至少具有下列9项症状中的4项症状: (1) 兴趣丧失、无愉快感; (2) 精力减退或疲乏感; (3) 精神运动性迟滞或激越; (4) 自我评价过低、自责或有内疚感; (5) 联想困难或自觉思考能力下降; (6) 反复出现想死的念头或有自杀、自伤行为; (7) 睡眠障碍, 如失眠、早醒或睡眠过多; (8) 食欲降低或体重明显减轻; (9) 性欲减退。在病程上, 患者的症状必须至少持续两周[6]。同时根据患者的年龄、性别、职业以及受教育程度在社会人群中选择相对应的15例非抑郁患者做正常对照组。以上所有对象视力或矫正视力均大于1.0, 且排除色弱或色盲。

1.2 检测仪器

罗夏墨迹测验原版 (日本片口安史版) 扫描后的10张图片, 其中5张为黑白图片 (1、4、5、6、7) , 墨迹深浅不一, 2张 (2、3) 主要是黑白图片, 加了红色斑点, 3张 (8、9、10) 为彩色图片。这10张图片都是对称图形, 且毫无意义。另还有一张黑白墨迹图作为实验预备图;图片的分辨率均为1024×768。

德国SMI公司研发的SMI i View XTMRED遥测式眼动仪, 呈现实验材料并记录对象的眼动数据。对象使用该仪器时无需佩戴头托与头套, 使其能在较为自然的环境中进行实验。

1.3研究方法

检测在具有隔离功能的实验室中进行, 两组对象均需完成相同的检测程序。为保证检测数据的准确性, 要求对象在选好舒适的坐姿后头部尽量保持不动, 首先对对象的眼睛进行定标, 然后向对象宣读指导语:“下面将请您观看电脑屏幕上呈现的10张图片, 这些图片都是由墨迹偶然制成的图案。您在图片上看到了什么, 就请您说出什么, 如果您觉得对某张图片已经没有什么可说了, 请说下一张。在整个实验过程中请保持固定的姿势, 目光不能离开电脑屏幕。”先给对象呈现实验预备图, 之后进入正式试验。正式试验分为两个部分, 第1部分为自由反应阶段, 第2部分为提问阶段。10张图片按照罗夏墨迹测验原来的顺序在两个反应阶段分别呈现一次, 并且均不限定时间。在检测过程中, experiment centre软件会自动记录眼动数据。

1.4 统计学处理

采用SPSS 18.0软件对所得数据进行统计分析, 计量资料用 (±s) 表示, 比较采用t检验, 计数资料采用x2检验, 以P<0.05为差异有统计学意义。

2 结果

从注视点数目、总注视时间、眼跳数目以及平均眼跳幅度四项眼动指标对30名对象的眼动数据进行分析。结果显示, 其中在第1、第2和第6张罗夏墨迹图上, 两组对象的注视点数目、总注视时间、眼跳数目以及眼跳幅度均差异有统计学意义 (P<0.05) , 对抑郁-正常个体的区分度最好;对于第3和第4张图片, 除了眼跳幅度其他3项眼动指标均差异有统计学意义 (P<0.05) ;第5、第9和第10张图片只有眼跳幅度差异有统计学意义 (P<0.05) ;第7张图片只有总注视时间差异有统计学意义 (P<0.05) ;而对于第8张图片, 两组在4项眼动指标上均差异无统计学意义 (P>0.05) , 可能是由于两组对象在连续观看了4张相对简单的黑白图片后, 突然面对抽象复杂的彩色图片均需要投入更多的心理能量造成的, 见表1~4。

ms

°

3 讨论

国内以往关于罗夏墨迹测验的眼动研究主要是截取对象第一反应之前的眼动数据进行探讨[2,10,13]。而本研究截取了对象整个自由反应阶段的眼动数据, 能够更全面地了解抑郁患者在眼动特征上与正常个体的差异。

抑郁患者在自由反应阶段的注视点数目、总注视时间和眼跳数目均显著小于正常个体, 而眼跳幅度则显著大于正常个体, 说明正常个体在观看图片时愿意投入更多的心理能量, 这与抑郁患者对事物失去兴趣、思维或注意能力降低的特征相吻合。另有研究也表明与正常组相比抑郁组的凝视点数 (NEF) 显著降低, 这与本研究得出的抑郁患者的眼动特征趋势相一致[14,15]。

因此, 尽管罗夏墨迹测验本身的抑郁指数对抑郁症的鉴别效度只有0.14[15]。但若把该测验与眼动技术相结合并借助于大量的询证医学证据, 相信将会大大提升该测验对抑郁症患者的临床诊断价值。

摘要:目的:研究抑郁障碍患者的眼动特征, 为抑郁障碍的鉴别诊断提供更多证据。方法:研究拟将罗夏墨迹测验与眼动技术相结合, 对抑郁障碍患者与正常人在罗夏墨迹测验自由反应阶段的眼动特征进行了对比分析。结果:抑郁障碍患者的注视点数目、总注视时间、眼跳数目均明显小于正常人, 平均眼跳幅度明显大于正常人 (P<0.05) 。结论:抑郁患者具有不同于正常人的眼动特征, 将罗夏墨迹测验与眼动技术相结合可以为抑郁障碍的临床诊断提供更多的依据。

眼动实验 篇11

关键词:眼动追踪;键盘记录:MTI;翻译教学:策略能力

进行翻译过程研究,窥探译者大脑这个“黑匣子”里发生了什么,更深入地理解译者的认知机制,其根本目的之一是将研究成果转化到译员培训和翻译教学中。以过程为取向的翻译教学模式为翻译理论融入翻译教学找到了更合适的依托点。在翻译教学中关注翻译过程,引导学生更好地观察、分析和反思自己的翻译过程,可以有效提高学习者的翻译能力(Tirkkonen-Condit 2005)。国际学界较早就开始探讨以过程为取向的翻译教学模式(如Fox2000;Alves 2005;Pym 2010等),国内近年来也开始倡导围绕翻译过程开展教学,引导学生更积极主动地关注翻译过程(朱玉彬、许钧2010)。教学实践中也有运用有声思维法(如李德超2008)、学习日志(如吴青2014)和评注式翻译(如柯平、李小撒2012)的大胆尝试。近20年来,眼动追踪和键盘记录这两种先进的实证研究方法推动了认知翻译过程研究往纵深发展,但国内尚未见到将上述两种方法运用到教学实践中的尝试。本文将简要介绍眼动追踪和键盘记录方法,探讨它们在翻译教学中应用的可行性,通过一项教学实验论证二者对培养学生策略能力的积极作用,并阐述其实施原则和实施方法。

一、理论依据

语言服务行业对翻译人员能力和素质的要求常常主导着翻译研究和教学,设立以“培养适应国家经济、文化、社会建设需要的高水平、应用型、专业性口笔译人才”(任文2012:46)为目标的翻譯硕士专业学位(MTI)是国内翻译界对这一挑战的直接回应。翻译教学的宗旨是培养学生的学习能力、思考能力和翻译能力,使学生通过训练成为具有专业能力(expertise)的职业译员。而提高学生,尤其是初学者的翻译能力,“教师首先需要着力关注培养他们处理问题的认知资源、思路与方法,其次才是具体译法”(吴青2014:45)。在这一语境下,翻译教学正逐渐从翻译技能培训转向翻译职业教育和译员素质教育。而提高译员专业能力和专业素质的核心是提高他们的“策略能力”(strategiccompetence)(PACTE 2005:G6pferich2009)。策略能力在翻译过程中“负责解决问题(solving problems),并保证翻译过程富有效率。它根据翻译项目来规划翻译过程,对翻译过程和己获得的阶段性成果进行评估,激活其他子能力以弥补不足,发现翻译问题并予以解决”(PACTE2005:610),起着统摄和协调其他子能力的作用。为更好地提升学生的策略能力,MTI教学正从以教师为中心、以译作为取向的传统教学模式转向为以学生为中心、以过程为取向的教学模式。将眼动追踪和键盘记录方法用于教学实践,引导学生更多地关注翻译过程,便是以过程为取向教学法的体现。其理论支撑是建构主义的学习理论,即知识的掌握是一个过程,学生面对复杂问题或任务时,需要自己去发现解决问题或完成任务所需要的基本知识和技能。

二、眼动追踪和键盘记录法

眼动追踪法是利用眼动仪记录眼球活动,从而推断个体的内在认知过程的一种心理学研究方法。当代的眼动仪利用瞳孔和角膜反射的视频记录法,以毫秒为单位追踪记录受试的眼球活动,从眼动轨迹的记录中提取诸如注视点、注视时间、注视次数、眼跳距离、瞳孔直径等数据,揭示视觉注意力及内部认知加工机制(Duchowski2007)。近十年来,眼动追踪法已被广泛应用于认知翻译过程研究中,极大地深化了我们对翻译认知过程的理解(冯佳、王克非2016)。

将眼动追踪用于翻译教学,用眼动仪记录学生翻译过程中的眼球运动,完成记录后,利用眼动仪的动态视频回放功能,重现翻译过程中的眼球运动数据,请学生观看自己的翻译过程。回放中,眼动仪会将相关的眼动数据(如注视点)叠加在对应的源文本或目标文本上。文本的上方会呈现叠加的注视点,即半透明的红色圆圈。圆圈出现的位置即是眼睛注视的位置,每个圆圈代表一个注视点。圆圈直径越大,表明注视时间越长。回放的速度快慢可调节。回放过程中,可暂停,或通过拖动时间轴指针快速定位到任一时间点。

键盘记录法利用键盘记录软件实时、客观地记录翻译过程中的全部键盘活动。认知翻译过程研究中,应用最广泛的键盘记录软件是Translog(Saldanha and O'Brien 2013)。Translog记录译者进行的键入、删除(删除和回车)、导航(光标活动)、复制/剪切和粘贴、回车、鼠标操作活动(Carl 2012)。记录的同时为所有键盘活动打上准确的时间标签,并记录键盘活动问的时间差。

将键盘记录法用于翻译教学中,利用键盘记录软件记录学生翻译过程中的键盘活动,完成记录后,利用其动态视频回放功能,回放翻译过程中的所有键盘活动,请学生观看自己的翻译过程。回放速度快慢可调节。Translog II可连接眼动仪,同步记录译者的键盘和眼动数据。若连接眼动仪(如本实验),回放时,学生可同时观察到任一时刻的键盘活动及当时视觉注意力之所在。

三、教学实验

1.实验设计

为检验眼动追踪和键盘记录方法在MTI教学实践中的应用,笔者设计了一项教学实验,共邀请36名MTI专业一年级学生参加实验。他们的第一语言是汉语,第二语言是英语。在翻译过程中,利用眼动仪和键盘记录软件同时记录他们的眼动和键盘数据。本实验使用TobiiT120遥测式桌面眼动仪采集眼动数据,通过Translog II键盘记录软件呈现实验材料和记录键盘活动数据。Translog II操作界面分为上下两部分:上半部呈现源语篇,下半部分供译者键入目标语篇。

本实验在眼动实验室进行。实验正式开始前,教师为学生介绍实验室环境和即将使用的眼动仪和键盘记录软件。学生阅读指令,明确实验任务。首先进行一个英译汉和一个汉译英句子翻译的练习任务,之后在教师指导和讲解下观看翻译过程的回放,熟悉工作环境、电脑键盘和实验流程,理解眼动和键盘数据的呈现形式,掌握基本的数据解读方法。然后进入正式实验。请学生完成英译汉和汉译英两个翻译任务。实验文本如下:

A.练习任务源文本一英译汉

I always ask my friends to visit me in London,because there are many historic spots to see.

B.练习任务源文本一汉译英

虽然在国外念书,我还是时常自己煮家乡菜。

c.正式任务源文本一英译汉

At universities in England,May is the monthof exam.A student is lying On the grass in front of theexamination hall.His two friends are sitting near him.Thethree of them are first year students at university.All threeof them are sitting their first year exam.

D.正式任务源文本一汉译英

有一个人,他很不满意自己现在的样子,于是到处去拜访成功的人,请教他们改变自己的方法。他听到了许多成功的故事,发现这些人成功的方法,都是一样的。那就是:不断地学习和创造,生命就会不断地改变。

翻译过程中不设时间限制,请学生按照平常的习惯进行翻译,但不可进行资料和字典查阅。每个翻译任务完成后,通过眼动仪的回放功能再现翻译过程,請受试观看回放,并同时进行回溯式口语报告。两项任务间休息5分钟。最后,请受试完成一项不记名问卷调查,并对部分受试进行了单独访谈。本实验共发放问卷36份,收回有效问卷34份。问卷由25个问题组成,内容涵盖眼动追踪和键盘记录方法在教学中应用的可能积极作用,其中22个问题为评判式封闭问题,选项为李克特五级量表,3个问题为问答式开放问题。

2.应用眼动追踪法的积极作用

实验结果显示,在翻译教学中应用眼动追踪有明显的积极作用。总的来说,观看眼动追踪回放增强了学生的自我反思意识和对自身翻译行为的监控意识,如问题七“观看眼动追踪的回放增强了我的自我反思意识”,41.18%的受访者表示“非常赞成”,50.00%“赞成”;问题八“观看眼动追踪的回放增强了我对自身翻译行为的监控意识”,35.29%“非常赞成”,44.12%“赞成”。具体而言,其积极作用主要体现在以下几个方面。

(1)有助于学生更了解自己的翻译过程,如问题一“通过观看眼动追踪的回放,我更了解自己的翻译过程”,所有受访者均表示赞成。其中,55.88%“非常赞成”,44.12%“赞成”。在访谈中,有学生认为眼动数据回放“让我的翻译过程可视化”。通过观看眼动数据回放,可以更直观、深入地了解翻译过程;观察到任一时刻的视觉注意力所在,对任一时刻的认知加工对象有更清楚的认识。同时,能帮助学生更好地了解翻译过程中注意力的转换和切换,如问题二“通过观看眼动追踪的回放,我了解到翻译过程中任一时刻的注意力所在点以及注意力的转换和切换”,47.06%“非常赞成”,47.06%“赞成”。

(2)帮助学生更多地关注翻译过程中碰到的问题以及解决问题的过程,如问题四“通过观看眼动追踪的回放,我更多地关注到翻译过程中我碰到的问题”,41.18%“非常赞成”,41.18%“赞成”;问题五“通过观看眼动追踪的回放,我更多地关注到翻译过程中我解决问题的过程”,32.35%“非常赞成”,47.06%“赞成”。同时,对解决问题所使用的翻译策略更好地关注,如问题六“通过观看眼动追踪的回放,我更多地关注到翻译过程中我解决问题所使用的策略”,17.65%“非常赞成”,32.35%“赞成”。

认识到翻译过程中的问题,是进一步反思和提高的前提。专家译者的共同点之一是对翻译过程中碰到的问题更敏感、对自己的表现能有意识地进行监控和评估(Tirkkonen-Condit2005:407)。正因如此,专家译者的专业能力随着他们的每一个翻译活动而不断提升,但学生译员常常无法做到这一点。观看眼动数据回放可以提高学生对翻译过程中问题的敏感度。例如,当眼动数据中出现直径相对较大的注视点时,通常是译者碰到问题的标志,表明译者较长时间地注视某一词语。而眼动数据中,注视时间越长,注视点直径越大。大量研究表明,注视时间越长,认知加工越深、认知负荷越大(Holmqvist et al 2011:Rayner 1998)。另一个碰到问题的标志是大量的回视行为(backtracking)(Carl&Dragsted 2012),即重新阅读已经翻译过的源文本或目标文本,在这些文本中寻找信息或提示以完成后续的翻译。在本教学实验的英译汉任务中,大部分学生在翻译最后一句“All three of them are sitting theirfirst year exam.”时碰到问题,尤其是对sitting…the exam的翻译有问题。回放中,这句话的眼动数据呈现出多次回读。

(3)有助于学生更好地了解翻译过程中的时间分配和时间管理,进而更好地了解、监测和反思自己的翻译风格,如问题三“通过观看眼动追踪的回放,我更了解自己在翻译过程中的时间分配和时间管理”,41.18%“非常赞成”,47.06%“赞成”。研究发现,专家译者在利用时间和分配精力上更有“策略性”:如他们不在细枝末节上花费太多时间,而将时间更多地用在更重要的地方,如标题、关键词或文章中反复出现的词语上(如Tirkkonen-Condit2005:407)。

翻译认知过程通常被划分为“熟悉阶段”“起草阶段”“修订和监测阶段”(Jakobsen2002:192)。借助眼动追踪的回放,学生可了解自己在三个阶段的时间分配,并反思这一分配方式是否有效。此外,还可进一步了解各阶段的翻译风格。如在熟悉阶段,有的译者是“直接开始型”(head-starters),即任务开始就马上开始翻译。有的是“快速规划型”(quick.planners),即只阅读文章开头的几个词或句子就开始翻译。有的是“浏览型”(scanners),即快速浏览原文后开始翻译。还有的是“系统规划型”(systematic-planners),即通读全文后才开始翻译(Dragsted&Carl 2013)。在起草阶段,译者的在线规划(online planning)也呈现出不同风格。有的是“宽语境规划型”,即需要阅读很长的下文(如好几句话)才可以进行正在处理的翻译;有的是“窄语境规划型”,即只往下阅读几个词就可以翻译。

3.应用键盘记录法的积极作用

实验结果显示,在翻译教学中应用键盘记录法有明显的积极作用。总体来说,观看键盘记录回放增强了学生的自我反思意识和对自身翻译行为的监控意识,如问题十八“观看键盘记录的回放增强了我的自我反思意识”,32.35%“非常赞成”,41.18%“赞成”;问题十九“观看键盘记录的回放增强了我对自身翻译行为的监控意识”,26.47%“非常赞成”,52.94%“赞成”。其积极作用主要体现在以下几个方面。

(1)有助于学生更好地了解自己的翻译过程,尤其是译文生成和修订的过程,如问题十二“通过观看键盘记录的回放,我更了解自己的翻译过程”,44.12%“非常赞成”,44.12%“赞成”;问题十三“通过观看键盘记录的回放,我更好地了解到自己翻译过程中的修订过程”,全部受访者表示赞成,其中44.12%“非常赞成”,55.88%“赞成”。翻译中的译文产出属于线上(online)的文本产出活动,包括译文的草拟和可能进行的数次修订。在键盘记录工具诞生前,只能借助翻译成品(即译文终稿)和/或译文修订记录来回忆自己的翻译过程,而这种回忆未必准确和完整。键盘记录的回放将译文产出和修订过程完整、准确地再现出来,学生还可观察到期间的若干临时译文(interim versions),并借此推断翻译过程中译者的各种“临时决定”(interim decisions)和“监测机制”(monitoring mechanism)。通过观察翻译过程中的各种斟酌、权衡行为,反思在取舍过程中的各种考量和决策理据,从而在意识构建、习惯养成等方面有所进步。

(2)认识译文产出和修订过程中的“认知节律”(cognitive rhythm)

(Schilperoord1996:5),即译文产出和修订活动的速度和节奏,有助于学生了解翻译过程中的时间分配和时间管理,进而认识、监测和反思自己的翻译风格。如问题十四“通过观看键盘记录的回放,我更了解自己在翻译过程中的时间分配和时间管理”,26.47%“非常赞成”,50.00%“赞成”。研究显示(Jakobsen 2002),专家译者的“认知节律”更富有效率,他们能在熟悉、草拟和修订三个阶段有效分配时间和精力。以译文的修订活动为例,一种类型是在译文起草阶段进行的线上修订(online revisions),即一边起草译文一边修订;另一种是最终修订(endrevisions),即在译文起草完成后,在最终的修订和监测阶段进行(Dragsted&Carl 2013)。学生可以借助回放观察自己的修订行为,了解自己哪种修订行为更多,分析这种翻译风格和时间分配模式是否有效。

(3)通过对键盘活动,尤其是键盘活动之间停顿的观察,提高学生对翻译过程中问题的敏感度,使他们更多地关注翻译过程中的问题,以及更多地关注解决问题的过程。如问题十五“通过观看键盘记录的回放,我更多地关注到翻译过程中我碰到的问题”,29.41%“非常赞成”,50.00%“赞成”;问题十六“通过观看键盘记录的回放,我更多地关注到翻译过程中我解决问题的过程”,14.71%“非常赞成”,64.71%“赞成”。停顿是“认知过程中注意力状态的改变在行为上的体现”(Schilperoord1996:39),是反映工作记忆容量、认知努力和认知负荷大小的有效指标。通常来说,停顿时间越长,认知努力和认知负荷越大(如Schilperoord 1996;O'Brien 2006等)。在翻译活动中,出现停顿时,受试暂停文本产出活动,可能是在长时记忆中提取信息以进行下一步的文本产出,也可能在对先前产出的文本片段进行监测和评估。所以,在出现较长时间的停顿时,通常是译者碰到问题的标志。学生可以观察停顿出现时自己碰到问题的类型,进一步分析解决问题的过程,以及使用的策略是否有效。通过观察停顿,学生还可以进一步认识自己的认知切分和翻译单位。通常来说,专家译者的翻译单位更大,平均停顿时间更短,翻译单位多在小句/句子层面。他们很少以单个单词为翻译单位,有较多的超长翻译单位(即包含60个连续文本输入的键盘活动或包含10个以上单词的翻译单位)。相反,学习者译员的翻译单位多在词/短语层面,由单个单词组成的翻译单位较多,超长翻译单位很少(Dragsted 2005)。

四、实施原则和实施方法

本文的教学实验同时使用了眼动仪和键盘记录软件,但在实际教学中,也可以单独应用眼动仪或键盘记录软件。在翻译教学实践中使用眼动追踪和/或键盘记录,具体实施方法可大致分为以下几个阶段:

(1)準备阶段:教师讲解眼动追踪和/或键盘记录方法的工作原理,帮助学生熟悉使用方法,理解回放数据的呈现形式,掌握数据基本解读方法。

(2)记录阶段:通过眼动仪和/或键盘记录软件记录翻译全过程。

(3)回放阶段:学生观看眼动数据和/或键盘记录数据的动态视频回放(还可选择在观看的同时让学生就其翻译过程进行回溯式口语报告)。

(4)反思和总结阶段:学生报告观看回放获得的发现,分享心得体会。报告可采取多种形式,视具体情况而定:口头或书面形式均可、个人独立报告或小组报告均可。教师就学生的体会和发现给出反馈和总结。

在实施过程中,反思和总结阶段是关键。有效的反思和总结需要认知翻译过程研究的理论支撑。首先需要教师对该领域的研究成果有较好的掌握,了解学生翻译能力发展和习得的过程,熟悉学生和专家译员在翻译能力上的差别及其体现。在教学实践中,根据教学的具体目标及翻译文本的具体情况,提前给学生进行相关的讲解和培训,这样学生才能更有的放矢、更有效地进行观察和反思。在观看回放期间,教师可根据具体教学目标,提前设定一个或几个观察重点,设计相应的观察记录表,让学生着重观察并记录相关重点。除了观看自己的翻译过程,还可让学生观看专家译员的翻译过程,以学习其有效的翻译策略和翻译风格,或观看其他学生的翻译过程,比较异同,取长补短。

在翻译教学中使用眼动仪有一定的特殊要求。首先需要教学单位配备眼动仪。其次,为保证采集数据的质量,眼动仪的操作通常需要在教师指导下、在眼动实验室里完成。相对而言,键盘记录软件的使用性更广,可大规模地用于学生日常翻译操练中,作为学生开展自主学习的一种有效方式。Translog是共享软件,可免费下载。其安装和操作步骤简单易懂,学生可根据使用说明快速安装并掌握其使用方法。安装Translog后,学生可以像在普通电脑上完成翻译训练一样,随时借助键盘记录软件来记录翻译过程并通过回放来观察、总结和反思自己的翻译过程。

五、结语

智能相机在实时眼动识别中的应用 篇12

当下最尖端的眼动识别系统主要是通过PC组合Web camera来进行视觉处理[5,6]。然而PC用作主要计算处理单元体积过于庞大, 不足以满足实际应用的环境要求, 仅能作为实验环境测试之用。由此头盔式的眼动识别设备应运而生, 这类产品虽能够部分解决无法携带的问题, 但是使用者的舒适感较差, 更重要的是运算的速度和准确度却大大降低。

而智能相机以其嵌入式、低功耗的处理器, 使快速算法成为可能, 尤其在自动化检测应用中其优越和稳定的性能, 配合小巧紧凑的结构, 非常适合于实时眼动识别应用程序的执行。

1 眼动识别算法提出

Fleck等提出在智能相机中使用FPGA模块, 通过粒子滤波器模型来实时识别跟踪[7], 这个方法需要用大量的样本, 环境越复杂, 描述后验概率分布所需要的样本数量就越多, 算法的复杂度就越高。另外, 重采样造成的样本有效性和多样性的损失, 会导致样本贫化现象。本文在虹膜识别应用的基础上[8], 设计开发了应用在智能相机中的软件来完成眼动识别的功能, 包括模板匹配、边缘检测、识别和标识黑眼球中心位置等。在一般的眼动识别算法中, 进行眼动识别前, 首先要对人脸进行检测, 以提高眼动识别追踪算法的精确度[9]。本文提出直接选定左眼为感兴趣区域的方法, 快而准确, 然后在感兴趣区域内匹配黑眼球相对眼睛的位置, 不同位置标明不同眼动方向, 以此识别当前眼动状态, 若随时间变化实时检测就能起到眼球运动识别的效果。

2 基于智能相机的眼动识别设计

2.1 眼动识别方法流程分析

将摄像头设定为连续检测眼动信息的状态, 进行图像采集和检测。图1所示为实时眼动识别算法的流程图。

(1) 图像获取:用图像传感器获取测试对象的图片, 设置光圈、曝光时间和增益。

(2) 图像预处理:将原始图像转换成灰度图像。设计目标是每秒数十帧的实时检测, 灰度图足以表现面部为主图像的边缘和特征, 能够快速进行大量的模板匹配算法。

(3) 眼部检测:预先设计制作眼部区域的模板。因为人类眼睛在生理上具有双眼旋转运动协调特性, 故单眼模板兼具速度和可信度。运用模板匹配的方法在当前帧图像中检测与模板相似的部分, 设置相似度的度量值, 由于制作模板民实际检测时光照条件不完全相同, 还存在图像的形变, 根据测试通常将最小阈值设定在600左右最佳 (最大为1 000) 。

(4) 前视模板、左视模板和右视模板:对感兴趣区域依次匹配黑眼球位置的模板, 默认常态下眼睛处于前视状态, 若不匹配则再尝试匹配左视和右视模板。在三个模板的匹配范围内都不符合时, 记录为无匹配方向。无匹配方向的意义, 例如用于行车安全系统中, 可认为视线脱离安全驾驶状态。

(5) 确定眼球方向:将第 (4) 步中识别到的匹配模板对应返回一个眼动方向, 并记录、显示于屏幕上。

(6) 记录眼睛坐标:计算黑眼球的中心坐标。正视时取正圆的圆心, 左、右视时取椭圆两焦点的中点, 作为当前眼睛的坐标点。

(7) 标识当前位置:将第 (6) 步的坐标作为坐标系原点, 创建坐标系, 并叠加于图像的图层上, 完成当前帧图像的检测, 开始下一帧采集。

这种方法可以应用于各种类型的智能相机上, 并可运用各种编程语言来实现。本文采用“G”语言 (图形化的程序语言) , 它提供了仪器编程和数据采集的便捷途径, 在进行原理研究、设计、测试并实现仪器系统时, 可以大大提高工作效率。

2.2 硬件平台设计

通过NI 1772 SMART CAMERA和触控屏 (或显示屏) , 即可独立完成实时眼动识别的图像采集、图像处理、图像分析和信息反馈等步骤。系统非常精简, 大大降低了可以应用场合的限制。

NI 1772智能相机使用Intel Atom Z530 (1.6 GHz处理器) , 内有512 MB的RAM;图像传感器为Kodak KAI-0340S单色CCD (分辨率640×480 (VGA) , 最大可用帧速率114 f/s) 。通过RS232串行连接动态地控制照明, 通过千兆以太网I/P和TCP/IP协议, 实现与触摸屏 (HMIS) 相连接进行人机交互, 完成配置调整和检测图像和参数实时反馈。

2.3 软件设计与实现

如图2所示, 根据图1所示流程算法, 设计了软件程序。

VBAI编译的算法程序分两个步骤, 首先要规划子模块的次序, 合理布局分支的结构, 降低帧率的损失, 提高程序可读性便于修改。然后对应每个子模块的作用, 完善各个模块的功能。

由箭头相连接的为子模块, 方框内是具体每个模块的子函数。子模块acq实现采集图像, 子模块Inspect center、Inspect left、Inspect right完成寻找眼部感兴趣区域 (本文中使用左眼为ROI) , 并对该区域进行多次匹配, 确定当前眼球所处状态, 显示对应状态的反馈提示;子模块Inspect 2提示处理检测过程中的错误信息, 与用户显示界面进行信息传递等。

(1) acq (图像获取) 中子函数:

Acquire Image:通过智能相机的图像传感器获取单帧图像, 图像为灰度图。

(2) Inspect center、Inspect left、Inspect right (正视检测、左视检测、右视检测) 中分别有以下4个子函数:

(1) Eye Match Pattern:眼动匹配。在调试阶段预先设置好匹配模板, 分左视模板 (椭圆形模板) 、正视 (圆形模板) 、右视 (椭圆形模板) 3个。测试检测时, 先匹配感兴趣区域, 减少需要处理的图像范围, 然后在感兴趣区域内依次匹配3个模板, 找到与某个模板的灰度特性相似的区域 (设置在±45°范围内旋转的区域都符合识别范围) , 个数指定为最多一个。若没有匹配对象也进行第 (2) 步。

(2) Set Coordinate System:构建坐标系统。计算第 (1) 步中匹配区域的大小, 并记录该区域中心点位置 (正圆的圆心或椭圆两焦点的中点) 和匹配区域与模板对比倾斜的角度。对没有匹配对象的帧跳过当前步骤。

(3) Create Region of Interest:建立感兴趣区域。以第 (2) 步的中心点位置为坐标原点, 将感兴趣区域设置为匹配到的眼动区域, 用圆标记出眼球的位置。没有匹配对象的帧则跳过当前步骤。

(4) Draw Eye & Track:标识眼动检测结果。在采集到的实时图像上覆盖一个图层, 将眼球区域的中心点标记在该图层上。程序只记录所有成功匹配的帧, 此时匹配状态值为真, 在程序前面板上将匹配到的模板用对应的“LEFT”、“CENTER”、“RIGHT”指示进行标识。

(3) Inspect 2 (检测统计) 中有以下3个子函数:

(1) Calibrate Image at Eye Match Pattern:校正图像坐标。

(2) Set Inspection Status:检测状态反馈。反馈此帧图像是否顺利进行了眼动信息识别, 检测过程中有无报错, 若值为“FAULT”则此帧检测结果无效。

(3) Update Eye-tracking Result:自定义一个前面板, 即用户界面。显示实时采集到的图像、检测状态、注视方向、标识眼球位置等。

3 眼动识别实验分析

3.1 实验方法

考虑到眼动识别应具有应用的广泛性, 需要能够在不同光照环境下工作, 因此需要在不同光照条件下可以通过调整曝光时间来获取较高质量的检测图像, 测试环境越暗, 曝光时间越长, 帧率越低。反之, 光线越好的环境下帧率越高。实验中, 模拟驾驶时眼部及头部的自然状态, 对实时眼动识别算法进行应用实验。

以1 min内获得的实时数据作为分析样本, 分别测试了系统在无干扰测试状态、头部左右转动干扰 (左右各45°以内) 、面部角度倾斜干扰和特殊情况 (佩戴眼镜等局部遮挡) 条件下的准确性。每个测试条件分别在光线环境不同处, 分40 f/s、50 f/s、60 f/s、80 f/s、100 f/s、112f/s (max) 6种不同图像采集的速度进行对比, 并在帧率最高的情况下统计检测100帧图像的效率。

3.2 实验数据与分析

在“Set Inspection Status”的值为真的条件下, 若识别到的眼动状态 (左视、正视、右视、其他区域) 与实际眼动的状态相符, 则认为是一次成功的检测, 反之亦然。1 min内测试正确率的数据整理后如表1所示。

在理想条件下, 眼动状态的识别准确性平均值为96.42%, 即使在帧率达到饱和值时也能保证在94.99%以上;当眼睛相对于镜头平面倾斜时正确识别率仍能保持在平均95.67%;实验中通过佩戴眼镜来测试特殊情况, 检测到的准确率平均在92.33%;头部转动的干扰最为明显, 由于采集到的眼图变形较大, 准确率降低到78.63%上下。解决头部转动的干扰是智能相机用于眼动识别系统中有待解决的重点问题。

作为实时系统, 眼动识别的速度是关键, 在帧率最高的条件下, 对测试对象连续100帧进行测试, 计算其检测速度, 统计结果如表2。

由表2可知, 平均对100帧图片进行识别需要约40 ms, 每帧仅需要0.4 ms, 模板匹配部分作为识别检测的重点占80%, 实时性好, 接近使用高性能的PC进行图像运算, 完全能够应用于实时在线眼动识别检测。

本文设计搭建了一个基于智能相机的实时眼动识别系统, 拓宽了眼动识别能够应用的场合, 并自主设计了在该硬件系统平台上可以运行的眼动识别软件, 进行了大量不同环境和条件下的实验。反复大量的数据分析结果显示, 该方法和系统有较高的准确性和非常出色的实时性。在无外界干扰、脸部角度倾斜和部分遮挡的条件下都达到了过九成的准确率, 尤其在脸部角度倾斜条件下, 仍有平均95%以上的良好表现。

由于头部转动对识别准确率的影响较大, 今后可以进一步对该因素带来的问题进行研究。另外可以在头部无较大移动条件下, 将本文中的眼球坐标归一到同一坐标中, 绘制眼动轨迹进行分析, 应用于其他眼动识别的场合。

摘要:对基于智能相机的眼动识别系统和方法进行了研究和设计, 并对该系统在常见的各种测试条件下进行了大量的实验和应用分析。基于智能相机的眼动识别系统结构小巧紧凑, 检测速度快, 准确度高, 较基于PC的检测系统和头盔式检测设备的性能有大幅的提高。

关键词:眼动识别,模板匹配,智能相机,嵌入式系统,应用开发

参考文献

[1]FRANGESKIDES A L.A hands-free non-invasive human compuer interation system[J].Advances in Systems, Computing Sciences and Software Engineering, 2006:235-242.

[2]Lu Wanxuan, Li Mi, Lu Shengfu, et al.Impact of information Overload for Visual Search on Web Pages:An Eyetracking Study[C].Proc.2010 IEEE/ICME International Conference on Complex Medical Engineering.Gold Coast, Australia, July 2010:13-15.

[3]JAVIER Orozco, F.XAVIER Roca, JORDI Gonzàlez.Realtime gaze tracking with appearance-based Models[J].Machine Vision and Applications, October, 2009, 20 (6) :353-364.

[4]KIRCHER J C, COOK A E, HACKER D J.Deception detection using oculomotor movements[J].United States Patent Application Publication, Dec.23, 2010:US 2010/0324454 A1.

[5]GARG R, GUPTA V, AGRAWAL V.Efficient iris recognition method for identification[C].in Proc.ICUMT, 2009:1-6.

[6]PEREZ C A, LAZCANO V A, PABLO A.Estévez, et al.Held.Real-time iris detection on faces with coronal axis rotation[C].in Proc.SMC (7) 2004:6389-6394.

[7]FLECK S, LANWER S, STRABER W.A smart camera approach to realtime tracking[C].13th European Signal Processing Conference, EUSIPCO, 2005.

[8]MEHRUBEOGLU M, BUI H T, MCLAUCHLAN L.Realtime iris tracking with a smart camera[C].Proceedings of SPIE, vol.7871, Real-Time Image and Video Processing.N.Kehtarnavaz and M.F.Carlsohn, Eds.787104, EI, Feb.2011.

上一篇:复合创新型下一篇:显微镜红细胞计数检验