ISO 9241-11(附件B 可用性测量的案例)

来源:百度文库 编辑:神马文学网 时间:2024/04/29 02:55:38
附件B 可用性测量的案例
附件B(仅供参考)
可用性测量的案例
B.1 全面可用性
为了详述或者测量可用性这个目标,需要对有效性、效率和满意度进行测量。详述可用性的测量结果可能是为了全部的目标(比如生成一封信),或者有限的目标(比如执行查找和取代)。选择了那些为了最重要的用户目标而做的可用性测量时,可能意味着忽视了很多功能,但是这样做更可能接近最实际的应用。在表格B.1中给出了一个合适的测量的案例。
表格B.1 可用性测量的案例

B.2 产品期望特性的测量
对于一些能够有益于产品的可用性的特殊需要属性,可能需要进行额外的测量。在表格B.2中,给出了一些上述的属性和额外的深入测量。另外,在表格B.1中的一些测量也适用于在表格B.2中给出的可用性的目的。
表格B.2 产品期望特性的的测量的案例

B.3 选择可用性标准
选择用以测量可用性的标准是依据于产品的需求和组织的需要的。可用性的目的可以是关于主要目标的(比如一封信),或者关于子目标的(比如查找和取代),或者关于次要目标的(比如易学习性或者适应性)。关注最重要的用户目标的可用性目的可能会意味着忽视许多功能,但是这样可能更接近实际。为了详述一些子目标而设定可用性目的,这样做可能会引起在研发过程中评估的提前。
为了实现最低可接受度的可用性和目标级别的可用性,可能有必要详细说明标准。
当为了一个用户组设定标准值时,标准可能会取平均值(比如,完成一项任务的平均时间不得高于10分钟),或者是针对个人而言的(比如全部的用户可以在10分钟内完成任务),或者一定数量百分比的用户(比如,90%的用户能够在10分钟内完成任务)。
B.4 测量的类型
可用性的测量应该是基于数据的,这些数据是反映了用户与产品或者工作系统交互的结果的。而这些数据有可能通过一些客观的方法来收集,比如对输出进行测量、工作的速度、或者发生一些特定的事件。还有些可供选择的数据也许能够通过主观反应来获得,比如用户所表达的感觉、信仰、态度或者选择。客观的测量结果能够直接提供有效性和效率的指导,同时主观的测量结果也能够直接与满意度关联。
需要注意的是:从客观测量或者主观测量都可以获得有关可用性的每一个组成的数据。比如说,满意度可以通过用户行为的主观测量来推断,有效性和效率的估计可以从客观评价中得到,这些客观评价可以是用户对他们的工作和输出的表达。
需要收集数据以预测当一个产品被实际使用的时候其所达到的可用性等级,而这些数据的有效性是依赖于用户、任务和使用背景表示了真实情况的程度,以及所选测量方法而定的。一种极端的测量方式是以一个完全现实的工作状态为基础,并在此基础上评价产品可用性。另外一种方式是在实验室环境中,以一种可以控制的的方式,重现具有代表性的相关使用背景,在此背景下评价产品的特定方面。使用实验室方式的优势在于,它能够提供这样的机会:尝试在更大范围内控制那些预期能够对可用性等级有显著影响的变量,并可以得到更加精确的测量结果。而这种方式的劣势在于这个人造的实验室环境会产生不真实的结果。
得到的评价会随着测量方式而有所不同,而测量方式是依赖于用来测试的产品的完成情况和所要调查的问题的。测量方法以及测试环境的选择,将会依赖于设计周期中的测量活动的目标和目标之间的关系而定。
B.5 有效性和效率的测量
B.5.1 测量有效性
有效性的定义为:用户完成指定目标的准确度和完成度。
为了测量准确度和完成度,有必要生成一个为了成功达到目标的操作的标准说明书。这个说明书根据输出的质量和数量来表达,比如说一个输出文档的格式要求的说明书包括文档的长度和数量。
准确度可以通过输出品质与指定标准之间的符合程度来测量,完成度可以通过完成目标数量的比例来测来测量。
如果需要做一个单独的有效性测量,则有可能联合测试准确度和完成度。比如说,完成度和准确度可以百分比来计算,并用两者的乘积作为百分比值代表有效性[2, 12]。除非由于完成度而替换精确度不合适,那么应该认为这两个测试是独立的。
B.5.2 测量效率
效率可以通过达到有效性等级与相关消耗资源的比来测量。瞬时效率可以定义为:达到特定目标时的有效性测量结果与达到这个结果所消耗的时间的比值。这是在特定背景下的瞬时效率测量值。类似的还有些效率可以用相关智力消耗、体力消耗、原料消耗或者资金消耗来计算。
B.6 满意度的测量
满意度(定义为使用的可接受性和舒适感)是用户使用产品时候的主观反应。通过主观或者客观地测量可以评定满意度。客观的测量可以基于对用户行为的观察(比如,身体姿势,身体动作,),或者检测用户的心理反应。
满意度的主观测量是通过量化用户主观表达的反应、态度、意见来进行的。量化的过程可以用几种方式来完成,比如,可以通过询问用户在某个特定时刻的感觉度数值,或者通过让用户将产品按照偏好来排名,或者使用基于问卷的态度比例值。
态度比例值,当设计适当的时候,具有快速应用的优势,并且可靠性已知,无需特殊技能即可应用。根据心理学方法设计的态度问卷可以了解并量化对可靠性和有效性的估计,并且能够抗御类似于欺骗、积极偏好、消极偏好和社会期望的因素。同时也可以使得测量结果是可以与过去已建立的标准进行对比。QUIS [3,16]和SUMI [10,11]是态度问卷的案例。
B.7 感知工作量的测量
工作量包括任务的体力和智力两方面。体力工作量是由运动、行走、搬运等等,也包括由于强迫处于某种姿势引起的工作量。“感知工作量”包括那些智力类型(理解,信息处理,思考等等)的劳动。计算机硬件的设计应当重视由于高速输入和持续活动引起的物理需求。在一些情境下,感知需求中的交互对话结果能够对软件产品的有效性产生显著的影响。
测量用户的感知工作量是可能的。感知力是一种在与用户达到目标的完成度和准确度相关的活动中消耗的资源,因此感知力也对效率测量有影响的。然而,感知工作量有一些特殊的属性,比如过低或者超负荷的工作量都回导致效率低下。一项任务中应用智力太少的话可能会直接导致效率的降低,因为这样会导致厌倦和警惕缺乏,也就是直接降低了有效性。过多的感知工作量可能会导致有效性低下,信息丢失和产生错误。在安全设施处于临界时,上述情况就是一个非常重要的问题,比如交通控制和进程控制。感知工作量的测量可以用来预测这几类问题。
有两个问卷的案例:主观智力工作问卷[19](Subjective Mental Effort Questionnaire (SMEQ) [19])和任务工作量索引[13](Task Load Index (TLX) [13]),这两个问卷已经被证实在测量智力工作和感知工作需求方面有效。鉴于TLX区别了工作需求的六个方面,比较而言SMEQ[19]是比较肤浅的。