十種可用性研究方法
![](http://image.woshipm.com/wp-files/img/56.jpg)
當(dāng)你選擇可用性研究的度量方法時,你應(yīng)該考慮很多的問題才有可能獲得想要的結(jié)果,這其中包括研究目的,用戶目標(biāo),技術(shù)上收集和分析數(shù)據(jù)的可行性,以及項目預(yù)算和交付的時間問題。因為每一個可用性研究具有獨特的屬性,我們不能確切地規(guī)定每種類型的研究應(yīng)該用什么度量方法。
相反,我們能夠定義的,是已經(jīng)確定的是十種可用性研究類型,以及就每種度量類型提出的參考建議。我們提供僅僅是簡單的就如何去執(zhí)行一個具有相似特性的可用性研究實踐過程時的建議。反之,對你的研究來說必不可少的度量指標(biāo)可能沒有出現(xiàn)在項目列表當(dāng)中。同時,我們強烈建議你深入挖掘你手中的原始數(shù)據(jù)找到新的度量數(shù)據(jù),這對項目目標(biāo)意義重大。
十種常用的可用性研究情景在表中羅列出來了。常用的或者適合每個可用性研究情景的度量方法都顯示了出來。以下章節(jié)將就這十種情景來分別討論。
1.完成一筆交易
很多可用性研究的目的是使交易盡可能順利完成。交易的形式多樣,可能需要一個用戶完成一次產(chǎn)品的購買,注冊一個新的軟件,或者出售一只股票等。交易通常有一個界定明確的開始和結(jié)束點。例如對于一個電子商務(wù)網(wǎng)站來說,用戶將看中的物品放到購物車?yán)飼r,交易可能就已經(jīng)開始了,當(dāng)他在屏幕上確認(rèn)完成了購買時,交易也隨之結(jié)束。
也許你想收集的第一個可用性度量是任務(wù)是否成功完成。每個任務(wù)是成功了還是失敗了,這顯需要有一個明確的結(jié)束狀態(tài),例如確認(rèn)交易達(dá)成說明任務(wù)成功了。
報告參與者的交易成功率是評估交易總體有效性的一個好的的措施。如果交易涉及到某個網(wǎng)站,一些網(wǎng)站的在線度量,如交易的流失率,也是非常有用的。通過了解用戶量是在哪個環(huán)節(jié)流失的,這樣你就能夠把注意力集中在交易中問題最嚴(yán)重的步驟上了。
計算問題嚴(yán)重程度可以幫助聚焦與交易相關(guān)的特定可用性問題的原因。通過為每個可用性問題匹配不同的嚴(yán)重等級,你能夠?qū)W⒂谔幚砣魏谓灰字谐霈F(xiàn)的優(yōu)先級高的問題。兩種類型的自我報告式度量也很有用:返回的可能性和用戶期望值。在這些情況下,用戶可以選擇在哪里進(jìn)行交易,重要的是要知道什么他們的體驗如何。
最好的了解方法之一就是詢問參與者是否會再次使用這款產(chǎn)品,該產(chǎn)品是否達(dá)到或超過了他們的預(yù)期。當(dāng)用戶不得不多次重復(fù)完成同一交易的時候,那么效率就是一個合適的可用性度量。效率是通過單位時間的任務(wù)完成量來衡量的。
2.產(chǎn)品比較
知道你的產(chǎn)品與競爭對手或以前的版本相比差異在哪里是非常有用的。
通過對比,你可以準(zhǔn)確把握產(chǎn)品的優(yōu)勢和劣勢所在,判別改進(jìn)后的版本是否真的比前一個版本有了提升。使用各種可用性度量是比較不同的產(chǎn)品或版本優(yōu)劣的最好方式。你選擇的度量方法應(yīng)基于產(chǎn)品本身特征。一些產(chǎn)品的目的是最大限度地提高效率,而另一些則試圖創(chuàng)造極致的用戶體驗(這都是不同的)。
對于大多數(shù)類型的產(chǎn)品來說,我們建議通過三類可用性度量來對可用性建立一個整體意義上的認(rèn)知。
首先,我們建議關(guān)注一些成功任務(wù)采用測量方法。能夠正確地完成一個任務(wù)對大多數(shù)產(chǎn)品而言是必不可少的要求。效率同樣需要著重關(guān)注。效率包括任務(wù)完成的時間,頁面瀏覽數(shù)量(就一些網(wǎng)站而言),或操作步驟的數(shù)目。通過對效率的查看,你會對該使用產(chǎn)品用戶需要耗費多少努力有一個感性的認(rèn)知。
一些自我報告的滿意度度量為用戶的整體體驗提供了一個很好的總結(jié)。滿意度測量最有意義的地方在于,它可以說明用戶使用產(chǎn)品時在哪些地方會做出什么選擇。最后,比較產(chǎn)品間可用性最好的方法就是進(jìn)行整合和比較式的可用性度量。這讓我們從可用性的角度對不同的產(chǎn)品有一個清晰全面的了解。
3.對同一產(chǎn)品的使用頻率進(jìn)行評估
許多產(chǎn)品是基于使用頻率的多少來設(shè)計使用的。
例如微波爐,dvd播放器,Web應(yīng)用程序等,它們都是作為工作的一部分來使用,甚至還有我們寫這本書都要依靠的軟件程序。這些產(chǎn)品需要易于使用并且具有高效性??啼沝vd或用微波爐蹦爆米花所需的工作量被保持在最小限度。我們大多數(shù)人都不想浪費時間在很難用的產(chǎn)品上,而且也沒那個耐心。
我們建議的第一個可用性度量是任務(wù)持續(xù)時間。測量完成一系列的核心任務(wù)需要的時間將揭示任務(wù)所需要的工作量。對于大多數(shù)產(chǎn)品來說,完成任務(wù)所用時間越少越好。由于某些任務(wù)本質(zhì)上就比其他的任務(wù)更復(fù)雜,因此比較參與者與專家用戶的完成時間是很有用的。其他與效率相關(guān)的可用性度量,如操作步驟的數(shù)量或網(wǎng)頁頁面的數(shù)目(度量一些網(wǎng)站的情況)也是有用的。每一步的操作時間可能很短,但要完成一項任務(wù)需要作出的決策卻會很多。
易學(xué)性度量評估的是達(dá)到最大效率需要的時間和工作量。易學(xué)性也可以采取以前使用過的隨著時間推移的效率度量的形式。在某些情況下,可以考慮自我報告式的可用性度量,如意識程度和實用性。通過測定用戶的意識程度和自我感知的有用性之間的區(qū)別,你就能確定,應(yīng)該優(yōu)化或突出產(chǎn)品的哪些方面的特質(zhì)。
例如,用戶可能對產(chǎn)品的某些部分意識不到,但一旦他們使用它,就會發(fā)現(xiàn)這些部分是非常有用的。
4.評估導(dǎo)航和/或者信息架構(gòu)
很多可用性研究著眼于提高導(dǎo)航和/或者信息架構(gòu)。這可能在網(wǎng)站、軟件程序或電子消費品中比較常見。
研究可能包括確保用戶可以快速和容易地找到他們想要的東西,很容易地在產(chǎn)品不同板塊間切換,知道他們自己處于哪一信息層級,有哪些選項可供選擇。通常情況下,這些研究涉及到線框的使用或部分功能的原型,因為導(dǎo)航和信息機制、信息架構(gòu)的設(shè)計非常重要,幾乎是進(jìn)行任何其它設(shè)計的基礎(chǔ)所在。
評價導(dǎo)航最好的可用性度量之一是任務(wù)成功率。通過給參與者設(shè)定任務(wù),讓其找到關(guān)鍵信息(像是在玩“尋寶游戲”),你就可以了解導(dǎo)航和信息架構(gòu)是否在任務(wù)中起到作用。搜索任務(wù)應(yīng)該觸及產(chǎn)品的各個區(qū)域。用于評估導(dǎo)航和信息架構(gòu)的一個效率度量就是迷失度,將參與者完成任務(wù)所需的步驟數(shù)(例如,Web頁的訪問步驟)與相對完成任務(wù)最低步驟數(shù)相比。
卡片分類是了解用戶對信息組織方式的一個特別有用的方法。有一種卡片分類研究被稱為封閉式分類,就是參與者將卡片歸類到已經(jīng)預(yù)定義好的類別之下。從封閉型卡片分類研究中衍生的一個有用的可用性度量是:放置到正確的類別項目下的卡片與卡片總數(shù)的百分比。這種可用性度量顯示了信息架構(gòu)的直觀性所在。
5.提高認(rèn)知
并不是每一個設(shè)計進(jìn)行可用性評估的目的都是讓產(chǎn)品使用起來更容易或更有效率。一些設(shè)計改良的目的是增加特定內(nèi)容或功能的認(rèn)知性。這種做法對在線廣告來說是十分必要的,但這對于具有重要功能但沒有得到充分利用的產(chǎn)品來說也是可用的??赡苡泻芏嘣?qū)е乱恍┕δ懿槐蛔⒁饣蚴褂?,這其中包括一些視覺、標(biāo)簽、或放置位置方面的設(shè)計。
首先,我們建議監(jiān)控有問題元素的的交互次數(shù)。這也并非萬無一失,因為參與者可能注意到了一些東西只是沒有點擊它或著只是在某種程度上進(jìn)行了交互。相反,產(chǎn)生了交互,但是自己沒有注意到這種相反的現(xiàn)象也不會發(fā)生。因此,數(shù)據(jù)可以幫助確認(rèn)認(rèn)知度,但不能表明缺乏認(rèn)知度。有時自我報告式的度量中關(guān)于參與者是否注意到或意識到一個特定的設(shè)計元素的數(shù)據(jù)也是有用的。
測定顯而易見性的方法是向參與者指出特定元素并詢問他們在任務(wù)進(jìn)行的過程中是否注意到了這些元素。認(rèn)知度度測量包括詢問參與者在研究開始前他們是否了解產(chǎn)品的某個功能。然而,目前還不清楚這些數(shù)據(jù)的可靠性如何。因為并不是每個人都有很好的記憶力,有些人試圖挽回面子,說他們看見了,盡管事實并非如此。因此,我們不建議這是你唯一的評估方法,你應(yīng)該搜集其他數(shù)據(jù)源來補充你的結(jié)果。
記憶是另一個有用的自我報告式的可用性度量。例如,你可以為參與者展示幾個不同的元素,實際上里面只有一個元素是他們之前看到的,然后讓他們選擇哪一個是他們在任務(wù)中見過的。如果他們注意到了這個元素,他們的記住的可能性要大于猜測。但如果您有可用的技術(shù),也許用來評估意識的最好的方式是測量行為和生理數(shù)據(jù),如眼動跟蹤數(shù)據(jù)。使用眼動跟蹤技術(shù),你可以測定花費在尋找一個特定的元素上的平均時間,有多少比例的參與人員在看它,甚至是第一次注意到是花費的平均時間。
在評估網(wǎng)站時候,另一個要考慮的度量數(shù)據(jù)是在線的網(wǎng)站數(shù)據(jù)變化。觀察不同的設(shè)計中的流量模式變化,將幫助您確定其相對于認(rèn)知之間的關(guān)系。在直播網(wǎng)站上替代設(shè)計的同步測試(A/B測試)是一個越來越普遍的方式,用來測量小的設(shè)計變更是如何影響用戶行為的方法。
6.發(fā)現(xiàn)問題
發(fā)現(xiàn)問題的目的是確定主要的可用性問題。在某些情況下,您可能沒有任何先入為主的想法,不知道產(chǎn)品上哪個可用性問題是最重要的,但是你想知道是哪里惹惱了用戶。這種方法往往是針對現(xiàn)有的,但還不曾經(jīng)過可用性測試的產(chǎn)品而言的。
發(fā)現(xiàn)問題式的研究也可以用于周期性檢查用戶是如何使用產(chǎn)品,他們之間是如何進(jìn)行交互的。問題發(fā)現(xiàn)式研究與其他類型的可用性研究有所不同,因為它通常是開放性的。
問題發(fā)現(xiàn)式研究中的參與者可能會完成他們自己的任務(wù),而不是你所指定的具體的任務(wù)。盡可能保持真實性對于研究也是很重要的。這經(jīng)常涉及到用戶正在使用的產(chǎn)品和用戶通過自己的賬戶去完成一些只與他們自己相關(guān)的任務(wù)。它也可能包括對參與者使用產(chǎn)品時所處環(huán)境的評估,如在家中或工作場所。
因為他們可能正在完成不同的任務(wù),使用情景可能不同,因此對各個參與者進(jìn)行比較可能是一個挑戰(zhàn)?;趩栴}的度量可能是最合適于問題的發(fā)現(xiàn)。假設(shè)你捕獲了所有可用性問題,那就很容易將這些數(shù)據(jù)轉(zhuǎn)換成頻率和類型。例如,您可能發(fā)現(xiàn)40%的可用性問題涉及到高級別的導(dǎo)航,20%的問題與混淆的術(shù)語有關(guān)。
盡管每個參與者所遇到的具體問題可能是不同的,你仍然可以概括到一個更高層次的問題范疇中。檢查頻率和具體問題的嚴(yán)重程度將揭示有多少重復(fù)的問題正在被發(fā)現(xiàn)。這是一個一次性的事件還是屬于反復(fù)出現(xiàn)的問題?通過編目所有問題及其嚴(yán)重程度,你能夠得到一個快速優(yōu)化設(shè)計的列表出來。
7.關(guān)鍵產(chǎn)品的可用性最大化
雖然有些產(chǎn)品是力求易用和高效,如手機、洗衣機等產(chǎn)品,而有些產(chǎn)品時必須易于使用,且具有高效性,如電擊器,投票機,或者飛機上的緊急出口指示。關(guān)鍵產(chǎn)品與非關(guān)鍵產(chǎn)品的區(qū)別就在于,關(guān)鍵產(chǎn)品存在的全部理由就是為用戶完成一個非常重要的任務(wù)。沒有完成任務(wù)將會帶來十分嚴(yán)重的負(fù)面后果。
對于任何關(guān)鍵的產(chǎn)品來說可用性測試是必不可少的。但只是在實驗室中進(jìn)行少量用戶測試還是不夠的。基于目標(biāo)的用戶使用性能測量是很重要的。任何不能滿足其可用性目標(biāo)的關(guān)鍵產(chǎn)品都需要進(jìn)行重新設(shè)計。由于這些數(shù)據(jù)要有相當(dāng)?shù)目尚哦?,所以你可能需要邀請大量的用戶參與研究。一個很重要的可用性度量是用戶錯誤。這可能包括在執(zhí)行特定任務(wù)時的錯誤或誤操作的次數(shù)。錯誤并不總是容易界定的,所以如何去定義錯誤需要特別關(guān)注的。最好是很明確的定義出什么是錯誤的,什么不是錯誤。
任務(wù)是否成功也是重要的評估依據(jù)。在這種情況下,我們建議使用一個二進(jìn)制的方法來處理。例如,對一個便攜式電擊器的最真實的可用性度量的目標(biāo)就是有人能夠獨自成功地操作使用。
在某些情況下,你可能希望任務(wù)成功是通過不止一個度量來評估,你可能希望任務(wù)在一個特定的時間內(nèi)無差錯地完成。其他與效率有關(guān)的可用性度量同樣有用。還是以電擊器為例,只是正確地使用它是一回事,能否在有限的時間內(nèi)快速及時地完成又是另外一件事了。自我報告式的指標(biāo)是相對于關(guān)鍵產(chǎn)品而言不那么重要。用戶自己想如何使用他們手中的產(chǎn)品并不重要,重要的是他們實際上真的使用成功了。
8.創(chuàng)造具有整體性的積極的用戶體驗
對于一些想努力創(chuàng)造杰出用戶體驗的產(chǎn)品來說,只具備可用性是遠(yuǎn)遠(yuǎn)不夠的。這些產(chǎn)品需要既能吸引用戶,又能發(fā)人深省,而且具有娛樂性,甚至可以讓用戶稍微上點癮。
iPod和TiVo就是我腦海里能想到的兩種產(chǎn)品。這些產(chǎn)品,你和朋友即便是在一個聚會上談?wù)撍矡o傷大雅。這種產(chǎn)品的知名度通常以驚人的速度上升。盡管產(chǎn)品好的用戶體驗特征是非常主觀的,但他們?nèi)匀皇强蓽y量的。
雖然某些性能度量可能是有用的,但是真正重要的是用戶的想法,感覺以及如何來描述他或她的使用體驗。在某些方面,這與測量一個關(guān)鍵產(chǎn)品的可用性方法相比恰好相反。如果起初用戶使用地并不順利,這可能還不是產(chǎn)品的末日。真正重要的是有多少用戶在當(dāng)天使用結(jié)束后的感覺是什么。當(dāng)測量用戶的整體使用體驗的時候,自我報告式度量是必須考慮的。
滿意度也許是最常見的自我報告式度量了,但它可能并不是最好的一個。只是“滿意”通常是不夠的。我們使用的最有價值的自我報告式度量之一是用戶期望。最好的體驗是那些超出用戶期望的體驗。當(dāng)參與者說產(chǎn)品比他之前預(yù)想的更容易,更高效,更有趣時,你就知道你做到了。
另一種自我報告式度量涉及到將來的使用。例如,您可能會問這樣一些問題:購買的偏好是什么,是否會推薦給朋友,或者以后還會不會用等問題。另一個有趣的可用性度量涉及到用戶可能會有的潛意識反應(yīng)。例如,如果你想確保你的產(chǎn)品是吸引人的,你可以觀察一下用戶的生理數(shù)據(jù)。瞳孔直徑的變化可以用來測量喚醒水平,或者如果你想盡可能多的消除應(yīng)力,你可以測量心率和皮膚電導(dǎo)率變化。
9.評估微小改動的影響
不是所有的設(shè)計改動都會對用戶行為產(chǎn)生顯著影響。
一些設(shè)計改動是非常小的,對用戶行為影響也不是很明確。但是即使是微小的改動,只要具備足夠多的用戶量,同樣可以產(chǎn)生巨大的用戶群體影響。這種微小的改動可能是視覺設(shè)計的不同方面,如字體和尺寸的選擇,元素位置變化,視覺對比度,顏色和圖像選擇等。非視覺元素,如內(nèi)容或術(shù)語的細(xì)微的變化,也會對用戶體驗產(chǎn)生影響。
也許衡量微小的設(shè)計改動影響的最好方式是通過網(wǎng)站A/B測試的實時在線度量。A/B測試涉及到原設(shè)計與替代設(shè)計的比較。對于網(wǎng)站來說,這種方法通常是轉(zhuǎn)移一部分網(wǎng)絡(luò)流量給替代設(shè)計,然后對比度量數(shù)據(jù)結(jié)果,例如將網(wǎng)站流量或產(chǎn)品購買量與原設(shè)計對比。一個擁有較大用戶量的在線可用性研究也可以是非常有用的。如果你不具備進(jìn)行A/B測試或在線研究所需的技術(shù)條件,我們建議你使用電子郵件和網(wǎng)上調(diào)查的方式,從盡可能有代表性的參與者那里得到反饋信息。
10.替代設(shè)計比較
最常見的可用性研究類型之一,就是多個替代設(shè)計方案的比較。通常情況下,這些類型的研究都發(fā)生在設(shè)計過程的早期,在任何一個設(shè)計得到充分優(yōu)化之前完成。
(我們通常稱這些為“設(shè)計烘焙”)不同的設(shè)計團(tuán)隊一起完成多功能的原型的設(shè)計,我們依據(jù)預(yù)定義的可用性度量來評估每一個設(shè)計。進(jìn)行這樣的研究有一個小技巧。因為設(shè)計方案往往是相似的,因此從一個到另一個設(shè)計之間用戶可能具有很高的學(xué)習(xí)效應(yīng)。讓同一參與者在不同的設(shè)計里執(zhí)行同樣的任務(wù),通常不會產(chǎn)生有價值的信息,即使是特意對設(shè)計方案和設(shè)計任務(wù)的順序進(jìn)行了平衡也無法抵消。
對這個問題有兩種解決方案。你可以設(shè)定研究是在純粹的不同設(shè)計主體之間進(jìn)行,即讓每個參與者只使用一個設(shè)計。這能夠獲得一個免于干擾的數(shù)據(jù)集,但需要更多的參與者加入?;蛘呔褪牵憧梢砸髤⑴c者使用一個主要設(shè)計來完成任務(wù)(平衡設(shè)計方案),然后顯示其他的設(shè)計方案,并詢問他們的偏好。這樣你可以得到從每個參與者關(guān)于所有設(shè)計的反饋。
當(dāng)比較很多設(shè)計方案時,最合適的度量是基于問題導(dǎo)向的度量。比較高、中、低三種問題嚴(yán)重程度不同的設(shè)計方案將有助于揭示哪種或者哪些設(shè)計更有用。理想情況是,最終設(shè)計應(yīng)該是整體問題較少,且嚴(yán)重程度較高的問題較少的設(shè)計。
任務(wù)成功率和任務(wù)完成時間的度量也是有用的,但由于樣本量通常較小,這些數(shù)據(jù)往往價值有限。兩種自我報告式的度量特別有用。一是要求每個參與者選擇他們最愿意在將來使用的設(shè)計原型(作為一個被迫選擇的比較)。同時,要求每個參與者依據(jù)不同評價維度,如易用性和視覺吸引力等來進(jìn)行評估,也能夠幫助發(fā)現(xiàn)問題。
本文摘自《Measuring The User Experience》,作者:Tom Tullis和Bill Alibert,由江南大學(xué)設(shè)計學(xué)院研究生劉兆峰翻譯。
via:曉生
- 目前還沒評論,等你發(fā)揮!