Tullis 和 Stetson (2004)发现简短而简单的系统可用性量表(SUS)在心理测量上优于其他主观量表,包括著名的 QUIS。大多数 SUS 项目似乎与可学习性或记忆性有关,还有一些与效率有关。但是,我不会尝试将其分解为子量表。所有项目都高度相关,表明该量表测量的是单个基础结构。
我怀疑您是否可以单独测量尼尔森的每个尺寸。用户可以告诉您产品是否“难以”使用,但他们更难进一步分解它。他们知道做某事需要做很多工作,但这是因为他们想不出更简单的方法(易学性)吗?或者也许他们在之前的任务中学到了更好的方法,但忘记了(记忆力)?或者这就是它必须的方式(效率)?用户将没有足够的信息来进行区分。
如果您对 Nielsen 的每个维度分别特别感兴趣,请分别直接评估它们。您可以通过记录错误的数量或点击之间的时间来粗略地衡量可学习性,并精确地通过用户学习规范交互序列所需的试验次数来衡量可学习性。为了提高效率,在你训练用户完成规范的交互序列之后,记录他们完成它需要多长时间。您还可以使用诸如 GOMS-KLM 之类的分析方法得到一个很好的答案。为了便于记忆,请在一周左右后带上相同的用户,并将他们的表现与效率测量试验的表现进行比较。
与几乎所有主观量表一样,SUS 主要用于比较不同产品的整体主观体验。如果没有可以比较的东西,很难知道从单个分数中得出什么。这些量表不会说明产品有哪些具体问题或为什么会出现这些问题(例如,帮助您确定改进)。为此,最好进行定性观察和汇报测试参与者。