Alipay UED ? Blog Archive ? 浅谈眼动仪在可用性测试中的应用

来源:百度文库 编辑:神马文学网 时间:2024/04/29 08:33:57

 

浅谈眼动仪在可用性测试中的应用

锦心 发表于2008-11-21,17:40 3,579 Views

(本文涉及的研究内容系本人在浙江大学现代工业设计研究所攻读硕士期间参与完成,且包含其他师生的研究成果。未经同意,请勿转载,谢谢)

我很幸运,读研期间所在的实验室拥有很多令兄弟院校垂涎的实验设备,其中就包括iefen让我介绍的眼动仪,分别为美国ASL的Eye Tracker 6000 摄像头式眼动仪和头盔式眼动仪(具体型号我不记得了,因为我就“玩”了两次,没有做过具体的实验,对它的数据处理并不太了解,sigh~)。在此我仅对摄像头式眼动仪在可用性测试中所起的作用做一些粗浅的介绍,算是给还未接触过眼动仪的童鞋们“扫扫盲”。

图1 美国ASL的Eye tracker 6000摄像头式眼动仪

在可用性测试中为何要使用眼动仪?

由于传统的可用性评估在实际应用中,尤其在进行用户界面评估时,存在很多局限性,如很多测试方法都是建立在主试与被试的交互上,主试的言语、行为、表情甚至期望都会对被试及其活动产生影响。当存在多位主试时,就更难排除主试的影响。测试结果的客观性不高。因此,多年以来,在进行可用性评估时,眼动仪是常用的辅助工具之一。

眼动仪在可用测试过程中常用的参数

当前的眼动仪多是运用红外线捕捉角膜和视网膜的反射原理,来记录用户的眼动轨迹、注视次数、注视时间等数据。从近年来发表的研究报告和资料种可分析出,利用眼动仪进行可用性测试常用的资料或参数包括:

(1)总注视次数(频率):数被认为是与搜索绩效相联系的指标。注视次数越多,表明低绩效的搜索,可能源于显示元素的糟糕的布局。但也应该考虑注视次数和任务时间的关系(如:任务时间越长需要的注视次数也越多)。

(2)平均注视驻留时间:反映的是提取信息的难易程度。持续时间越长往往意味着被测试人员从显示区域获取信息越困难。

(3)注视点序列:注视点在兴趣区之间的转换,能够度量用户界面布局的合理性。

(4)第一次到达目标兴趣区的时间:在显示区域搜索特定的目标时,第一次到达目标区域的时间。也是用户界面布局合理性度量的一个重要指标。

(5)每个感兴趣区域的凝视比率(时间比):被试眼睛注视特定显示元素(设计者感兴趣区域) 的时间比例。在此应该分清被试在显示元素上的凝视频次和凝视的时间,驻留时间反映信息提取的难度,频次反映显示区域的重要性。

(6)每个感兴趣区域注视点数:此指标与凝视比率密切相联系,可以用来研究不同任务驻留时间下注视点数量。特定显示元素(感兴趣区域)的注视点数量反映元素的重要性,越重要的元素则有更多频次的注视。

眼动仪在可用性测试中的实际应用

讲完了理论知识,我列举三个我参与过或实验室同学主导的实验,让大家对眼动仪有个具象的认识。

实验一:客户管理软件的导航可用性评估

测试目的:通过眼动仪对两个不同版本的客户管理软件的导航可用性进行评估。

测试任务:在旧版设定页面上找到“产品组排序”功能;在新版找到“管理产品序列”功能。

测试方法:在视觉评价的实验室研究中,要求被试分别观看两张不同的版本的同一页面,图片呈现 10s,眼动仪(ASL EYE TRACKER 6000眼动仪,采样频率120 Hz)记录他们观看图片时眼睛的注视点、注视频率、注视时间,完成时间等指标,以考察观看者对哪一版本的导航更符合用户的习惯和时间短,,并在看完图片之后再填一份对两个版本的喜好度评价问卷(被试按5点量表对它们进行喜好度评价,1表示最喜欢,5表示最不喜欢,2、3、4介于中间)。参与测试的人数为10人。

图2 眼动仪测试实验室

(1)眼动注视点轨迹分析

经过对测试用户眼动轨迹的分析,可以明显发现测试用户在使用两个版本在眼动注视轨迹区别(图3,图4):用户在使用旧版系统时,眼动的轨迹比较杂乱,测试用户的眼动轨迹区别明显;用户在使用新版系统时,眼动轨迹比较有规律的,测试用户的眼动轨迹呈现相似性。

图3 旧版系统测试轨迹图

图4 新版系统测试轨迹图

(2)眼动注视时间分

10名测试用户的注视时间统计见表1,可以明显发现两个版本在眼动注视时间区别:用户在使用旧版的系统时,注视的时间比较长,两个版本在瞳孔直径的变化比较大(主要测试时间较长,眼睛疲劳造成瞳孔变小)。通过注视时间和方案评价等级的对比分析(图5),可以得出评估等级越低(数值越低表示满意度越高),用户眼动注视时间越短,用户在较短的时间内能找到想要的功能,页面影响用户的干扰越小。

表1 注视时间参数表

图5 注视时间与评价等级的关系

(3)眼动注视频率分析

10名测试用户的注视频率统计见表2,两个版本在眼动注视频率有明显区别:用户在使用旧版系统时,注视次数频率比较高,无规律性。将注视频率和方案评价等级的对比分析(图6),可以看出评估等级越低,用户在页面搜寻的频率相对越少,用户在较短的时间内能完成制定的任务,用户注视轨迹相对越有相似性。

表2 注视频率参数表

图6 注视频率与评价等级的关系

综合测试评估的几个纬度分析结论,改版后的系统相对旧版的系统在导航的信息流设计和工作流等设计方面有了很大的提高,符合现在用户的使用习惯,减少无效的信息对用户操作的干扰。

实验二:网站首页的可用性对比测试

这是对某网站改版前(图7)和改版后的主页(图8)进行可用性对比测试,通过让用户浏览首页(不做任何点击)判定网站的主旨和类型,来捕捉用户注视点的轨迹图和记录用户在不同位置注视时间,对比网站主页改版前和改版后信息传达的有效性。

图7改版前的首页测试轨迹图

图8 改版后的首页测试轨迹图

经过对采集到的数据进行分析,可发现用户在浏览改版前的页面时,眼动轨迹混乱,扫描路径长且很多相互交叉,注视点序列分散排布,用户注视点变换快,无明显的兴趣点,如图这些数据表明改版前的网站首页布局不够合理,没有重点。

实验三:索爱W958c手机界面的可用性测试

此实验是通过让用户完成具体的任务(表3),来测试用户对索爱W958c手机界面的信息结构的洞察程度,界面布局,界面元素表征含义对于用户的搜索策略的影响,从而全面的衡量手机界面的可用性水平。该实验的评价指标包括注视时间、注视点数、任务完成率、多余翻页偏差度。限于篇幅,在此对这些指标不做具体的分析,仅推出热点图的概念。热点图反映了注视点和视线活动在屏幕上的总体情况。它是通过统计多名被试的视线活动情况的数据而绘制出来的,颜色越深,则表示关注度越高。

表3 基于眼动追踪的手机界面可用性测试的典型任务

图9 索爱W958c原型在完成任务2时的热点图

图 10 索爱W958c原型在完成任务6时的热点图

总结

眼动仪作为一个高科技产品,可以让可用性测试更直接和高效,但仍需注意,眼动研究本身都还存在着一定的不足之处,如当采用非头盔式系统时,会有10 %到20 %眼动数据丢失,且对被试的运动有一定限制,所以在使用眼动仪进行可用性测试的时候,通常要加以其它测试方法来收集更多的实验数据,并通过结合分析来得出更多、更有效的结论

  1. nino

    真是好东西啊,我也要。之前看过DISCOVERY,这东西也用在超市等,可以测试超市商品的摆放位置是否合理。。。。

    Mail (will not be published) (required)
    - -还有这个,直接和NAME一样写REQUIRED就可以了嘛- -前面还要加一句- -刚才没仔细看以为是WILL NOT REQUIRED- -真是。。提交后才提示。。。

  2. 3gp转换器

    这个主题好可爱,不知道哪里有下载啊?

  3. wangjg

    呵呵,支持下,想问下你们具体实践中有用到吗?

  4. avenger

    哪里有卖这种东东啊?

  5. 小谈blog的排版

    [...] 上周支付宝UED blog发表了一篇《浅谈眼动仪在可用性测试中的应用》,我在Reader读的时候发现文章的排版相当差:段内文字没有行距,首行缩进只有一格半,整体看 着非常不舒服。我直接访问那篇文章的地址,看起来不算太难看,不过查看源代码时就发现,太多垃圾代码,显然是从word中写好直接贴上去的。 [...]

  6. 锦心

    恩,发表的文章的当天我就听李斯提起这个事情了。在知道后的第一时间对版面进行了调整,谢谢指教^_^

  7. iefen

    是的,我们正打算启用这个方法来做一些细节的设计研究。毕竟它是反映用户眼球和鼠标行为之间联系的直接仪器,其实也是一个做设计研究蛮基础的一个方法。很多公司都已经在启用啦。

  8. wangjg

    检验我们的设计,或者说进一步的改良我们的设计~但是与投入的成本好像不是很成比例(个人见解)~,是否能有其他的作用什么的
    希望能深入的交流下~

  9. geng

    用户本身的习惯是很难用仪器进行捕捉的。
    是个作为依据的好东西。

  10. Jill

    呵呵,看来我们用到的仪器以及一些理论(例如六顶思考帽),都比较相似啊!不过专业不一样咯。

  11. Emma

    nino
    11月 22nd, 2008 at 01:30
    真是好东西啊,我也要。之前看过DISCOVERY,这东西也用在超市等,可以测试超市商品的摆放位置是否合理。。。。

    麻烦问一下,这期的题目叫什么??想看

  12. Saya

    在百度上搜搜居然搜到了学长……我是工业设计本科的,今天就去参观了这个仪器,还试用了一下~~~

  13. 什么是眼动跟踪(Eye Tracking)? | 耿人杰的网络日志

    [...] 浅析眼动仪在可用性测试中的应用:http://ued.alipay.com/?p=497 [...]

  14. 从游戏中学习情感设计 | iamNotU

    [...] 体验是近些年常常去讲的一个词,当我在上学期课间和研究情绪调节的某老师谈起当今设计行业的UE盛行时,她便马上和自己的情感研究联系起来聊的不亦乐乎, 后来想想体验的本质和核心要素似乎就是可以理解为用户在接触产品前、中、后产生的与产品相关的情感状态,一种微妙的爽与不爽的连续体。而认知和行为则在各 种条件下通过各自的途径对这种状态产生着或有或无,或多或少的影响。体验本身的量化性比较差的原因,也正是由于其本质是定义模糊的情感状态,而不是量化程 度更好的认知或者行为,我们可以用眼动来测试认知部分的注意方位和兴趣区,也可以用鼠标点击次数或行为发生频次来推测和衡量用户的基本态度,当然按照现在 的技术和研究逻辑,目前来考察产品线上的情绪最靠谱的就是录下使用全程并分析用户面部表情,通过表情这种外部特征分析来确定用户的情绪情感状态好坏,用各 种代表特征“皱眉,咧嘴“等出现的频次来进行量化支持。 [...]

回复评论

NOTICE: You should type some Chinese word (like “你好”) in your comment to pass the spam-check, thanks for your patience!


上一篇: 《css实现简单圆角效果》下一篇: 《六顶思考帽培训有感现有的交互设计》

  • 文章列表

    • 2009年09月
    • 2009年06月
    • 2009年05月
    • 2009年03月
    • 2009年02月
    • 2009年01月
    • 2008年12月
    • 2008年11月
    • 2008年10月
    • 2008年09月
  • 分类

    • 交互设计 (12)
    • 前端技术 (20)
    • 团队活动 (1)
    • 流程规范 (1)
    • 用户研究 (5)
    • 视觉设计 (4)
  • 链接

    • 19楼UED
    • 口碑网UED
    • 支付志
    • 淘宝UED
    • 蓝色理想
    • 阿里巴巴(国际站)
    • 阿里软件UED

    标签云

  • web标准 hover flash css alipay 黄金比例 页面布局 职能 网格设计 方法 工作内容 学习笔记 图片缩放 前端开发 交互设计

    delicious

    • 40个轻量级JavaScript脚本库 2009-08-30
    • Goodbye to CSS Hack - 岁月如歌 2009-08-29
    • Comparison of JavaScript frameworks - Wikipedia, the free encyclopedia 2009-08-16
    • 在线javascript美化压缩工具 2009-08-13
    • Introducing "mini" - James Padolsey 2009-08-11
 

Alipay UED © All Rights Reserved  • 因为信任  所以简单

Powered by wordpress   UED team  加入我们 登录 订阅