Alipay UED ? Blog Archive ? 浅谈眼动仪在可用性测试中的应用

来源:百度文库 编辑:神马文学网 时间:2024/04/29 20:02:58

(本文涉及的研究内容系本人在浙江大学现代工业设计研究所攻读硕士期间参与完成,且包含其他师生的研究成果。未经同意,请勿转载,谢谢)

我很幸运,读研期间所在的实验室拥有很多令兄弟院校垂涎的实验设备,其中就包括iefen让我介绍的眼动仪,分别为美国ASL的Eye Tracker 6000摄像头式眼动仪和头盔式眼动仪(具体型号我不记得了,因为我就“玩”了两次,没有做过具体的实验,对它的数据处理并不太了解,sigh~)。在此我仅对摄像头式眼动仪在可用性测试中所起的作用做一些粗浅的介绍,算是给还未接触过眼动仪的童鞋们“扫扫盲”。

图1 美国ASL的Eye tracker 6000摄像头式眼动仪

在可用性测试中为何要使用眼动仪?

由于传统的可用性评估在实际应用中,尤其在进行用户界面评估时,存在很多局限性,如很多测试方法都是建立在主试与被试的交互上,主试的言语、行为、表情甚至期望都会对被试及其活动产生影响。当存在多位主试时,就更难排除主试的影响。测试结果的客观性不高。因此,多年以来,在进行可用性评估时,眼动仪是常用的辅助工具之一。

眼动仪在可用测试过程中常用的参数

当前的眼动仪多是运用红外线捕捉角膜和视网膜的反射原理,来记录用户的眼动轨迹、注视次数、注视时间等数据。从近年来发表的研究报告和资料种可分析出,利用眼动仪进行可用性测试常用的资料或参数包括:

(1)总注视次数(频率):数被认为是与搜索绩效相联系的指标。注视次数越多,表明低绩效的搜索,可能源于显示元素的糟糕的布局。但也应该考虑注视次数和任务时间的关系(如:任务时间越长需要的注视次数也越多)。

(2)平均注视驻留时间:反映的是提取信息的难易程度。持续时间越长往往意味着被测试人员从显示区域获取信息越困难。

(3)注视点序列:注视点在兴趣区之间的转换,能够度量用户界面布局的合理性。

(4)第一次到达目标兴趣区的时间:在显示区域搜索特定的目标时,第一次到达目标区域的时间。也是用户界面布局合理性度量的一个重要指标。

(5)每个感兴趣区域的凝视比率(时间比):被试眼睛注视特定显示元素(设计者感兴趣区域) 的时间比例。在此应该分清被试在显示元素上的凝视频次和凝视的时间,驻留时间反映信息提取的难度,频次反映显示区域的重要性。

(6)每个感兴趣区域注视点数:此指标与凝视比率密切相联系,可以用来研究不同任务驻留时间下注视点数量。特定显示元素(感兴趣区域)的注视点数量反映元素的重要性,越重要的元素则有更多频次的注视。

眼动仪在可用性测试中的实际应用

讲完了理论知识,我列举三个我参与过或实验室同学主导的实验,让大家对眼动仪有个具象的认识。

实验一:客户管理软件的导航可用性评估

测试目的:通过眼动仪对两个不同版本的客户管理软件的导航可用性进行评估。

测试任务:在旧版设定页面上找到“产品组排序”功能;在新版找到“管理产品序列”功能。

测试方法:在视觉评价的实验室研究中,要求被试分别观看两张不同的版本的同一页面,图片呈现10s,眼动仪(ASL EYE TRACKER 6000眼动仪,采样频率120Hz)记录他们观看图片时眼睛的注视点、注视频率、注视时间,完成时间等指标,以考察观看者对哪一版本的导航更符合用户的习惯和时间短,,并在看完图片之后再填一份对两个版本的喜好度评价问卷(被试按5点量表对它们进行喜好度评价,1表示最喜欢,5表示最不喜欢,2、3、4介于中间)。参与测试的人数为10人。

图2 眼动仪测试实验室

(1)眼动注视点轨迹分析

经过对测试用户眼动轨迹的分析,可以明显发现测试用户在使用两个版本在眼动注视轨迹区别(图3,图4):用户在使用旧版系统时,眼动的轨迹比较杂乱,测试用户的眼动轨迹区别明显;用户在使用新版系统时,眼动轨迹比较有规律的,测试用户的眼动轨迹呈现相似性。

图3 旧版系统测试轨迹图

图4 新版系统测试轨迹图

(2)眼动注视时间分

10名测试用户的注视时间统计见表1,可以明显发现两个版本在眼动注视时间区别:用户在使用旧版的系统时,注视的时间比较长,两个版本在瞳孔直径的变化比较大(主要测试时间较长,眼睛疲劳造成瞳孔变小)。通过注视时间和方案评价等级的对比分析(图5),可以得出评估等级越低(数值越低表示满意度越高),用户眼动注视时间越短,用户在较短的时间内能找到想要的功能,页面影响用户的干扰越小。

表1 注视时间参数表

图5 注视时间与评价等级的关系

(3)眼动注视频率分析

10名测试用户的注视频率统计见表2,两个版本在眼动注视频率有明显区别:用户在使用旧版系统时,注视次数频率比较高,无规律性。将注视频率和方案评价等级的对比分析(图6),可以看出评估等级越低,用户在页面搜寻的频率相对越少,用户在较短的时间内能完成制定的任务,用户注视轨迹相对越有相似性。

表2 注视频率参数表

图6 注视频率与评价等级的关系

综合测试评估的几个纬度分析结论,改版后的系统相对旧版的系统在导航的信息流设计和工作流等设计方面有了很大的提高,符合现在用户的使用习惯,减少无效的信息对用户操作的干扰。

实验二:网站首页的可用性对比测试

这是对某网站改版前(图7)和改版后的主页(图8)进行可用性对比测试,通过让用户浏览首页(不做任何点击)判定网站的主旨和类型,来捕捉用户注视点的轨迹图和记录用户在不同位置注视时间,对比网站主页改版前和改版后信息传达的有效性。

图7改版前的首页测试轨迹图

图8 改版后的首页测试轨迹图

经过对采集到的数据进行分析,可发现用户在浏览改版前的页面时,眼动轨迹混乱,扫描路径长且很多相互交叉,注视点序列分散排布,用户注视点变换快,无明显的兴趣点,如图这些数据表明改版前的网站首页布局不够合理,没有重点。

实验三:索爱W958c手机界面的可用性测试

此实验是通过让用户完成具体的任务(表3),来测试用户对索爱W958c手机界面的信息结构的洞察程度,界面布局,界面元素表征含义对于用户的搜索策略的影响,从而全面的衡量手机界面的可用性水平。该实验的评价指标包括注视时间、注视点数、任务完成率、多余翻页偏差度。限于篇幅,在此对这些指标不做具体的分析,仅推出热点图的概念。热点图反映了注视点和视线活动在屏幕上的总体情况。它是通过统计多名被试的视线活动情况的数据而绘制出来的,颜色越深,则表示关注度越高。

表3 基于眼动追踪的手机界面可用性测试的典型任务

图9 索爱W958c原型在完成任务2时的热点图

图 10 索爱W958c原型在完成任务6时的热点图

总结

眼动仪作为一个高科技产品,可以让可用性测试更直接和高效,但仍需注意,眼动研究本身都还存在着一定的不足之处,如当采用非头盔式系统时,会有10 %到20%眼动数据丢失,且对被试的运动有一定限制,所以在使用眼动仪进行可用性测试的时候,通常要加以其它测试方法来收集更多的实验数据,并通过结合分析来得出更多、更有效的结论