如何做好體驗評估(測試)工作?下面這些方法打包交給你!
編輯導(dǎo)語:產(chǎn)品設(shè)計交付給開發(fā)后并不意味著設(shè)計師的工作結(jié)束了,直到產(chǎn)品實際發(fā)布上線前,設(shè)計師仍需要配合項目組,尤其是測試人員進(jìn)行最后的測試和評估??捎眯栽u估的特性就用戶調(diào)研活動一樣,沒有哪一種方法是完美的,不同的方法存在不同的瑕疵,需要互相配合使用才能讓產(chǎn)品達(dá)到最理想的體驗狀態(tài)。
「產(chǎn)品可用性的定義:特定用戶在特定使用場景下,為了達(dá)到特定的目標(biāo)而使用某產(chǎn)品時,所感受到的有效性、效率及滿意度。
——《ISO 9241/11》中對可用性的描述」
一、產(chǎn)品為什么需要可用性評估
產(chǎn)品設(shè)計交付給開發(fā)后,是不是設(shè)計師的工作就算結(jié)束了呢?并沒有!從設(shè)計稿的交接開始,一直到實際發(fā)布上線前,設(shè)計師仍需要配合項目組,尤其是測試人員進(jìn)行最后的測試和評估。設(shè)計的過程結(jié)束了,但新的起點又開始了。
正常來說,評估會有專業(yè)的測試或運(yùn)維工程師來執(zhí)行,不過本著負(fù)責(zé)任的態(tài)度來說,設(shè)計師自己設(shè)計的作品是否滿意仍需要自己把關(guān)。畢竟在作品的體驗細(xì)節(jié)上,測試運(yùn)維工程師并不具備相關(guān)的知識儲備和評估方向。
那么,該如何對產(chǎn)品進(jìn)行評估呢?難道是運(yùn)用像素眼對著設(shè)計稿檢查一遍像素誤差嗎?還是說檢查字體字號大小的問題?其實以上都有,但實際的可用性評估不僅限于這些問題。
評估的范圍往大了講可以上升到整款產(chǎn)品的全部體驗內(nèi)容,比如可用性、易用性和易學(xué)性等。
下面,本節(jié)將圍繞可用性評估,詳細(xì)說說一款產(chǎn)品該如何進(jìn)行評估活動。
相信有很多讀者認(rèn)為:一款產(chǎn)品如果真的不好用,那也太菜了吧。這算不算是一種極端情況?確實,不可用的情況確實屬于極端情況之一,但是從過程上來看,大部分項目一開始的目標(biāo)確實是奔著“可用”去的,然而隨著研發(fā)的不斷推進(jìn),結(jié)果卻會朝著“能用”方向發(fā)展。雖然只差了一個字,但是產(chǎn)品使用起來的體驗效果卻有了天壤之別,舉幾個常見的例子:
例子一:用戶在某網(wǎng)站上進(jìn)行注冊。為了認(rèn)證實名信息,需要填寫20多項內(nèi)容,而且每項內(nèi)容都有嚴(yán)格的格式規(guī)范,比如生日格式必須是xx-xx、手機(jī)號前綴需要自行填寫地域區(qū)號、身份證號碼必須采用間隔符“-”隔開等等。
好不容易用戶全部填寫完畢,碰巧此時網(wǎng)絡(luò)出現(xiàn)錯誤,頁面跳出下圖提示。待用戶調(diào)試完網(wǎng)絡(luò),刷新頁面后,發(fā)現(xiàn)之前全部的已填信息早已清空重置了。
網(wǎng)絡(luò)連接錯誤導(dǎo)致頁面失去響應(yīng)
例子二:在某搜索引擎輸入“BOOK”(英文)關(guān)鍵詞,檢索出來的信息卻只是針對大寫B(tài)OOK的展示——搜索引擎忽略了小寫book的字母檢索。
未找到搜索結(jié)果
像這類例子還有很多很多,雖然從產(chǎn)品使用角度而言功能是具備了,也確實能用,但站在用戶體驗角度,這樣的產(chǎn)品可以說是“極其不好用,甚至根本沒法用”。試想一下如果你碰到這樣的問題會不會奔潰,也許當(dāng)場就關(guān)掉,以后再也不用了。
現(xiàn)在明白為什么設(shè)計師要對產(chǎn)品進(jìn)行可用性評估了吧。因為這些體驗項目并不在測試工程師的職能范圍之內(nèi)——他們只負(fù)責(zé)產(chǎn)品數(shù)據(jù)和邏輯方面的問題。只有用戶體驗設(shè)計師從體驗角度出發(fā),才能發(fā)現(xiàn)這些產(chǎn)品體驗的優(yōu)劣所在。
二、什么是產(chǎn)品可用性
了解了對產(chǎn)品進(jìn)行可用性評估的理由,那么接下來就詳細(xì)地說說產(chǎn)品可用性具體是指什么?哪些又稱得上是可用性測試的范疇?
在國際標(biāo)準(zhǔn)ISO 9241/11中把產(chǎn)品可用性定義為:特定用戶在特定使用場景下,為了達(dá)到特定的目標(biāo)而使用某產(chǎn)品時,所感受到的有效性、效率及滿意度。
首先是有效性,是指產(chǎn)品能夠為用戶提供想要的功能,從而達(dá)成相應(yīng)的目標(biāo)的一種指標(biāo)。從某種程度上來說,有效性是包含在可用性之中的,比如李明通過電商平臺(A)買到了《卓有成效》,此時A對于李明而言就具備了有效(可用)的價值;反之如果買不到,則說明A對于李明而言失去了特定價值,變得不可用。該例子是站在銷售視角來評估的,換做是產(chǎn)品本身功能的使用也是同樣的道理。
因此一款產(chǎn)品只有滿足了有效性這個大前提,后續(xù)的效率和滿意度才發(fā)揮特定價值。
其次是,是指用戶使用一款產(chǎn)品時的輕松程度。還是買書的例子,如果李明輕松三步就買到了《卓有成效》,那說明A用起來還是比較輕松的,效率很高;反之如果用戶這點點那翻翻都沒有買到,則說明A對于用戶而言存在使用難度過大,效率不高的問題。
說白了就是用戶完成某項任務(wù)的完成度,如果完成度過于低效的話,問題性質(zhì)就會上升到有效性層面。
最后是滿意度,是指用戶使用一款產(chǎn)品后所進(jìn)行的一種全方位評價,比如在書店看書,環(huán)境很安靜,書香氛圍濃厚,那么相應(yīng)的體驗感和滿意度就會大大增加;反之如果邊上的書友吵鬧,外邊的工地還在施工,那么相應(yīng)的體驗感和滿意度就會大打折扣,甚至逼迫讀者離開書店。
所以,滿意度是一種“全方位”評價,它不會因為某個單點的特殊情況而影響整體滿意度。類似于宜家的體驗地圖,它就是一種全方位的滿意度評價——會盡量在各個細(xì)節(jié)上服務(wù)到位,如果所有細(xì)節(jié)都滿意了,自然整體滿意度就會上去。當(dāng)然咯,峰終定律在其中也起到了關(guān)鍵作用。
宜家體驗地圖其實就是對“峰終定律”的運(yùn)用
以上三個維度是在主觀場景下所提出的一種參照標(biāo)準(zhǔn),產(chǎn)品如果同時滿足這三個維度,就可以稱得上“實現(xiàn)了可用性”。然而在實際工作中,這三個維度的重要程度和優(yōu)先級是不同的——有效性是核心也是基礎(chǔ),效率和滿意度只是為了驗證有效性的一種指標(biāo)而已。
三個維度也有優(yōu)先級的排序
所以在設(shè)計產(chǎn)品時,請優(yōu)先滿足有效性,然后在時間和資源允許的情況下再去優(yōu)化效率和滿意度,這才是保證產(chǎn)品最終可用的“標(biāo)準(zhǔn)工序”。
三、評估和測試方法
那么,有哪些方法可以對產(chǎn)品的可用性進(jìn)行評估呢?憑借感覺來?說句實話,感覺這個方法也不是不行,只不過我們得把感覺評估進(jìn)階一下,讓它形成系統(tǒng)性的評估方法或標(biāo)準(zhǔn),就像合意性研究,其實就是依據(jù)使用感受來對產(chǎn)品進(jìn)行的情緒評價。
縱觀市面上比較流行的評估方法,系統(tǒng)地講,可以大致分成“形成性評估”和“總結(jié)性評估”兩大類。
評估方法的類別
- 形成性評估主要是在產(chǎn)品初期和中期所執(zhí)行的一種可用性評估方法,目的是為了挖掘產(chǎn)品的設(shè)計思路,在挖掘過程中加入可用性檢查法對產(chǎn)品進(jìn)行可用性測試。
- 總結(jié)性評估顧名思義,就是一種總結(jié),適用于產(chǎn)品完成后(后期)所進(jìn)行的一種可用性評估方法,比如跳出率、瀏覽率和滿意度等就是在產(chǎn)品完成后才能測出的數(shù)據(jù)指標(biāo)。
下表列舉了一些常用的可用性評估方法。細(xì)化到如何選擇評估方法則需要根據(jù)產(chǎn)品的開發(fā)周期、預(yù)算和針對性問題進(jìn)行合理選擇。無論是采用情緒板、低保真原型、紙質(zhì)原型、口頭闡述還是完整的產(chǎn)品演示等,筆者都建議對產(chǎn)品的評估應(yīng)該盡早執(zhí)行,嘗試多進(jìn)行幾次,積小勝為大勝,積跬步才能致千里。
評估方法總結(jié)
(詳細(xì)的評估介紹會在筆者個人主頁逐步更新,本文是對市面上常用、常見的方法所進(jìn)行的總概。)
1. 可用性檢查
可用性檢查一般會由專家或具備專業(yè)知識的人來進(jìn)行檢查,是一種有固定模板或思路的檢查方法。它最大的好處是不需要借助用戶就可以直接對產(chǎn)品進(jìn)行可用性評估。能以低成本、更快速的方式找到明顯可用性問題的方法。
讓專家來進(jìn)行評估可以提升整體效率,但是專業(yè)知識的人常常會因為“近朱者赤,近墨者黑”的經(jīng)驗之談錯過某些問題,所以可用性檢查可以考慮加入用戶來揭示這些問題。所以,可用性檢查應(yīng)配合可用性測試一起為產(chǎn)品的體驗做出更全面細(xì)致的優(yōu)化。
2. 啟發(fā)式評估
啟發(fā)式評估中有個極具代表性的方法,那就是“尼爾森可用性十大原則”。起初的啟發(fā)式評估是作為一種可以“打折扣”策略的可用性評估法被引入到評估體系中的。
何為折扣?顧名思義就是節(jié)省金錢或節(jié)省時間的一種“打折式可用性評估”,它可以在一般的辦公室場景下進(jìn)行,無需多少資源即可達(dá)成可用性評估目的。
根據(jù)啟發(fā)式評估中著名的“可用性十大原則”(下稱啟發(fā)式原則)指出,產(chǎn)品在進(jìn)行檢查的時候理應(yīng)遵循十個啟發(fā)式原則來保持良好的用戶體驗設(shè)計。具體的執(zhí)行流程是:
團(tuán)隊組織3~5名專業(yè)的體驗設(shè)計師,參照啟發(fā)式原則對產(chǎn)品進(jìn)行單獨評估。在一開始會制定一個明確的目標(biāo)或特定任務(wù)以走查這項任務(wù)所經(jīng)歷鏈路的體驗問題,并需要找出任何違反啟發(fā)式原則的細(xì)節(jié)。然后這些評估人員會聚到一起,將所有的評估內(nèi)容匯總形成一份總結(jié)報告,在其中概述體驗中遇到的問題,以及如何為后續(xù)體驗優(yōu)化提供相應(yīng)的優(yōu)化建議。
值得注意的是,在評估過程中沒有硬性要求每個要素都必須遵從十大原則,畢竟這些原則其本身也多少存在悖論關(guān)系。因此,本著遵循原則的態(tài)度,在對每個要素進(jìn)行評估時應(yīng)盡最大程度地符合原則,如果出現(xiàn)評估意外也是允許偏離原則的。
言歸正傳,如果真的有一款產(chǎn)品全部滿足了啟發(fā)式十大原則,也并不意味著能和用戶體驗100%對等,但想來結(jié)果也不會差到哪去。
3. 認(rèn)知走查法
認(rèn)知走查法和啟發(fā)式評估一樣,都是一種按照固定模板或套路所執(zhí)行的評估方法,屬于形成性評估法的一種。
它和啟發(fā)式評估最大的不同在于認(rèn)知走查法是從特定任務(wù)出發(fā),而啟發(fā)式則站在產(chǎn)品整體角度來評估的,這也是認(rèn)知走查法常常被運(yùn)用在產(chǎn)品早期的根本原因——因為它可以幫助設(shè)計師驗證產(chǎn)品方向是否正確,好及時作出相應(yīng)的調(diào)整策略。
認(rèn)知走查法的執(zhí)行方式和用戶調(diào)研活動中常用的“給定用戶一個目標(biāo),然后用戶為完成這個目標(biāo)而使用產(chǎn)品的方法”大同小異,只是執(zhí)行者從用戶換成了設(shè)計師自己而已。
雖然節(jié)省了用戶成本,但是認(rèn)知走查法會讓設(shè)計師容易陷入自我思維中無法自拔,因此走查法對具體的執(zhí)行流程提出了一些建議:
建議團(tuán)隊組織3~6人組成一個預(yù)期用戶組。為了提高有效性和評估數(shù)據(jù)的可靠性,建議這些專業(yè)人士在完成某項特定目標(biāo)時,要考慮到各種各樣的使用因素,并且使用的范圍一定要超出預(yù)期用戶的使用范圍,這樣才能增強(qiáng)捕獲問題的可能性。
同時,專業(yè)人士在進(jìn)行評估時,需要比較用戶操作和自己操作的區(qū)別,并且將這些內(nèi)容記錄下來方便后續(xù)和其他組員進(jìn)行匯總。也就是說白了,專業(yè)人士不僅要把自己當(dāng)做是用戶,還要把自己當(dāng)作是設(shè)計者,一人分飾兩角來評估產(chǎn)品的可用性問題。
4. 可用性測試
可用性檢查的最大好處是不需要借助用戶,同時這也是該方法最致命的缺陷所在,正因為此才有了檢查和測試相互配合的現(xiàn)象,這樣才能讓產(chǎn)品的可用性評估更加全面。
可用性測試是指測試項目必須借助用戶,讓用戶在特定場景中嘗試使用產(chǎn)品完成某項特定任務(wù)或一系列任務(wù)的方法,而設(shè)計師的職責(zé)就是對用戶使用過程和行為進(jìn)行觀察和記錄。是不是聽著和觀察員的工作很像,沒錯,在可用性測試中,設(shè)計師,即主持人就是觀察員!
但在一些工作職責(zé)上存在些許差別,比如設(shè)計師不會給予用戶任何的提示和指引,唯一的工作只有觀察用戶行為并且記錄相關(guān)數(shù)據(jù)。其中,所記錄的數(shù)據(jù)包含但不僅限于是否完成任務(wù)、完成任務(wù)的時間、任務(wù)結(jié)果、是否中斷、中斷位置、跳出率等等。
除此之外,當(dāng)用戶使用完第一款產(chǎn)品時,還會讓用戶使用其它產(chǎn)品,并要求完成相同的任務(wù)目標(biāo),這樣才能在多個產(chǎn)品之間進(jìn)行直觀對比,從而確定可用性問題所在。
為了保證數(shù)據(jù)的準(zhǔn)確性,在可用性測試中還會要求用戶配合使用出聲思維法對當(dāng)下的思考和行為進(jìn)行闡述,這樣可以方便設(shè)計師及時了解用戶當(dāng)前的意向。(該做法和焦點小組中的流程式訪談類似,因此流程式訪談屬于可用性測試的一種衍生。)
可用性測試和檢查不同,檢查是發(fā)現(xiàn)問題后優(yōu)化,再由同一組專業(yè)人員進(jìn)行再評估。而測試因為加入了用戶因素,因此必要時候需要開發(fā)人員及時配合,對產(chǎn)品進(jìn)行快速迭代(畢竟用戶不等人)。也就是說,根據(jù)每一輪測試的反饋結(jié)果,團(tuán)隊需要對原型或者產(chǎn)品進(jìn)行新的增刪改,然后快速投入到下一輪的測試中去。(該做法和焦點小組中的迭代式訪談類似,因此迭代式訪談也屬于可用性測試的一種衍生。)
從場景上來細(xì)分可用性測試,可大致分為戶外和室內(nèi)測試:
4.1 戶外測試
戶外測試和實地調(diào)研類似,不過沒有實地調(diào)研的調(diào)研成分,目的很單純,就是為了讓用戶置身于生態(tài)效度下提高測試的真實性,即將產(chǎn)品置入到實際場景中,可以發(fā)現(xiàn)更多需要在特定場景才能發(fā)現(xiàn)的問題。
4.2 室內(nèi)測試
室內(nèi)測試和戶外測試正好相反,是將用戶帶到辦公室、會議室、家等室內(nèi)場景執(zhí)行測試的一種方法集合。雖然室內(nèi)場景缺少生態(tài)效度,不過這樣可以保證所有用戶都處在測試產(chǎn)品的同一起跑線,避免由于受外部環(huán)境影響而產(chǎn)生的數(shù)據(jù)誤差。
Tips:生態(tài)效度指模仿或置身于真實世界的環(huán)境。
室內(nèi)測試中,有一項測試活動比較出名,那就是“眼動追蹤”。
4.2.1 眼動追蹤
眼動追蹤需要借助相應(yīng)的儀器才能進(jìn)行測試。它首次應(yīng)用是在認(rèn)知心理學(xué)領(lǐng)域,后被衍生到醫(yī)療等專業(yè)領(lǐng)域,再后來經(jīng)過在HCI行業(yè)的衍生應(yīng)用,眼動追蹤才開始逐漸踏入“研究人眼在哪里尋找信息”的目的,比如用戶在瀏覽界面時,會盯著哪個位置看以及界面信息的捕獲頻率等。
各種各樣的眼動儀
眼動追蹤的具體執(zhí)行過程如下:
需要通過眼動儀記錄用戶注釋點和掃視點之間的運(yùn)動軌跡,然后創(chuàng)建熱力圖。如果用戶目光在某塊區(qū)域上關(guān)注時間越長,則說明該區(qū)域的關(guān)注度強(qiáng),在熱力圖上會顯示紅色;反之關(guān)注時間越短則說明該區(qū)域用戶一掃即過,關(guān)注度弱,在熱力圖上會顯示綠色(或藍(lán)色),至于沒有看到的地方則屬于“視覺盲區(qū)”,顯示黑色。
眼動追蹤儀下的熱力圖
設(shè)計師可以通過這個方法來了解用戶在成品界面上尋找信息和關(guān)注點區(qū)域的熱度,然后直觀地得到要對頁面調(diào)整的方向,嘗試通過熱力區(qū)域讓一些想要被用戶關(guān)注的信息更容易被吸引到,比如Airbnb設(shè)計團(tuán)隊就是利用的熱力圖建立出了一個簡潔的視覺層次,用以傳遞特定信息的區(qū)域被精準(zhǔn)定位(吸引用戶注意力),下面這張圖就是Airbnb的Z子型布局如何吸引和引導(dǎo)注意力的熱力圖:
Airbnb的Z子型布局
總的來說,眼動追蹤的目的是為了通過熱力圖的方式來了解用戶在哪個位置尋找信息,這樣可以了解到用戶是否發(fā)現(xiàn)目標(biāo)位置或正在處理什么問題。
不過,在用戶執(zhí)行眼動的過程中切忌讓用戶采用出聲思維來配合表述。因為和觀察員談話或者回憶思索容易改變眼睛的注視點(人在回憶和思考時,眼神容易渙散),這會將熱力圖的數(shù)據(jù)打亂,不利于后期的數(shù)據(jù)整理。
那么觀察員又該如何知道用戶在執(zhí)行期間的想法呢?建議可以采用回溯性出聲思維,在事后通過向用戶展示熱力圖、眼動軌跡和一起錄制好的視頻,讓用戶嘗試采用回憶的方式來陳述當(dāng)時的想法。
ips:回溯性出聲思維指給參與者播放或展示當(dāng)時的視頻或行為,并要求說出他們當(dāng)時的所思所想。
5. 合意性研究
合意性研究不僅可以滿足可用性測試的要求,同時還可以滿足易用性和易學(xué)性要求。
在《設(shè)計心理學(xué)》中,唐納德·諾曼曾提出“美觀的產(chǎn)品實際上更有效”的觀點,這句話中的美觀不能狹隘地理解成是“外部的美觀”,其實應(yīng)該考慮更深層次的“心理美觀”,即ISO 9241/11中所以到的“滿意度”。
所以,合意性研究并不是測試產(chǎn)品某項功能或某項任務(wù)的具體情況,而是在評估產(chǎn)品是否可以讓用戶產(chǎn)生預(yù)期的情緒反應(yīng)。也就是說,合意性研究關(guān)注的是人的情緒而非產(chǎn)品的實際效用,如果說產(chǎn)品的實際效用好了,即產(chǎn)品可用性高,那么用戶自然而然就會產(chǎn)生一種積極的情緒反應(yīng)。
關(guān)于合意性研究的執(zhí)行流程,是需要在用戶已經(jīng)使用完產(chǎn)品的前提下,設(shè)計師向用戶提供提前準(zhǔn)備好的情緒卡片(卡片上寫著不同的情緒形容詞),要求用戶選擇出其中“你認(rèn)為符合當(dāng)前使用后心情”的卡片來描述使用產(chǎn)品時的感覺(卡片描述內(nèi)容不全,也可以允許用戶自行添加)??梢允钦w感覺,也可以是在使用的過程中的情緒波動(強(qiáng)烈建議選擇這個方式),然后參照卡片分類法,創(chuàng)建親和力圖。這樣可以更加直觀地觀察到用戶在使用過程中的情緒波動,方便設(shè)計師創(chuàng)建體驗地圖來發(fā)現(xiàn)痛點,挖掘機(jī)會點。
情緒體驗地圖
6. 快速迭代
快速迭代測試法其實有很多同類型的理念,比如敏捷開發(fā)、精益設(shè)計、精益創(chuàng)業(yè)等等,這些方法都算是一種小步快跑、快速迭代的科學(xué)工作和做事的一種方法論。
相對于眼動和合意性研究的總結(jié)性評估而言,快速迭代屬于一種形成性評估方法。它不同于傳統(tǒng)的可用性測試目的是為了發(fā)現(xiàn)大量且細(xì)節(jié)的可用性問題,快速迭代的目的是迅速確定重大可用性問題,也就是前文所說的極端或接近極端情況的問題,然后快速優(yōu)化。
“迅速發(fā)現(xiàn)問題”是快速迭代法的其中一個核心環(huán)節(jié),重點在于“快速”。其次“迅速迭代”是另一個核心環(huán)節(jié),重點在于“迭代”,即一部分人發(fā)現(xiàn)問題,然后再由另一部分人同步進(jìn)行優(yōu)化,如此循環(huán)往復(fù)直至完善。為了避免“閉門造成”的情況發(fā)生,建議在快速迭代法的執(zhí)行期間,多配合其他方法進(jìn)行觀察和測試,避免產(chǎn)生資源內(nèi)耗。
細(xì)心的讀者會發(fā)現(xiàn),快速迭代其實和迭代式訪談類似,所以嚴(yán)格意義上來將迭代式訪談完全是快速迭代的一種衍生。
7. 灰度測試
灰度測試通常和我們常說的“版本內(nèi)測”概念相似,是指軟件要在不久的將來推出一個全新的功能或者是重大改版之前,都會先進(jìn)行一波小范圍的內(nèi)外部測試工作,然后由小范圍逐漸放量,直至這個新功能覆蓋全部用戶,這個過程就是灰度發(fā)布,而逐漸覆蓋的過程就叫滾動發(fā)布。
從顏色上來理解的話,就是從白(未知)到黑(已知)的過程中間會有個灰度區(qū)間,這個灰度區(qū)間就是用來過渡的。
在這個過渡區(qū)間,團(tuán)隊會通過逐步的放量過程發(fā)現(xiàn)產(chǎn)品在使用期間的問題,包含但不僅限于bug、體驗問題,只要是產(chǎn)品問題都會在灰度測試期間被不斷改進(jìn),也就是常說的查漏補(bǔ)缺,逐步完善,這樣才能為產(chǎn)品正式發(fā)布之前打下堅實基礎(chǔ)。
8. AB測試
從人機(jī)交互的角度來看,AB測試屬于灰度測試的一種細(xì)分方法,是總結(jié)性的評估方法。其中AB測試的目的是為了通過對比兩個方案,看出哪個方案更好的一種方法,比如通過點擊率、感知力度、眼動追蹤等方式對結(jié)果進(jìn)行評估。
在AB測試中,會生成兩種不同的方案,而這兩個方案的唯一變量有且僅有一個(單因素設(shè)計法),比如紅變綠、大變小等,然后將兩組方案同時投放給對應(yīng)的兩組用戶(A、B組,這就像初高中的化學(xué)實驗一樣,一組為對照組、一組為實驗組)進(jìn)行測試(同時投放是為了控制未知變量對用戶的影響),接著通過日志分析、眼動追蹤等評估方法來對比兩個方案在數(shù)據(jù)上的優(yōu)劣勢。
不過在實際工作運(yùn)用中,AB測試由于要出兩套方案,所以這是一種雙倍成本的測試方法,所以在使用的時候一般只會是很難決策的內(nèi)容才會考慮采用AB測試。
更何況,AB測試是一項極其復(fù)雜的集數(shù)據(jù)設(shè)計、測試和分析工作為一體的測試方法,它不僅要涉及到開發(fā)內(nèi)容,還要掌握一定的數(shù)據(jù)分析基礎(chǔ),比如對流量、域、層、桶、同層互斥分配和分層流量正交分配的設(shè)計等等,這對于用戶體驗設(shè)計師而言跨度比較大。這些工作在大型企業(yè)中往往會由專業(yè)的數(shù)據(jù)分析師擔(dān)任,而在小公司,則會由產(chǎn)品經(jīng)理兼顧,不過產(chǎn)品經(jīng)理畢竟不是數(shù)據(jù)分析專業(yè)方向,也僅僅只是兼顧,因此對AB測試的數(shù)據(jù)分析僅流于于表面,更多深層次的數(shù)據(jù)分析還是需要依賴專業(yè)程度更高的數(shù)據(jù)分析師。
根據(jù)結(jié)果顯示,用戶對整體內(nèi)容的框架理解,版本B明顯優(yōu)于版本A
四、總結(jié)
從上述所介紹的諸多可用性評估方法可以看出,無論是檢查還是測試,它們都同時具備了和用戶調(diào)研一樣的活動目的——用戶調(diào)研注重對未知功能的挖掘,然后設(shè)計它;而可用性評估則注重在前者完成的基礎(chǔ)上不斷尋找不足之處,然后嘗試完善它。
因此,可用性評估的特性就像調(diào)研活動(這里主要指的是用戶調(diào)研活動)一樣,沒有哪一種方法是完美的,不同的方法存在不同的瑕疵,需要互相配合使用才能讓產(chǎn)品達(dá)到最理想的體驗狀態(tài)。
作者:大圣;公眾號:叨叨的設(shè)計足跡
本文由 @大圣 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 pexels,基于 CC0 協(xié)議
沒有哪一種方法是萬能且完美的,要綜合運(yùn)用不同的方法,靈活處理,隨機(jī)應(yīng)變。
對的,利用不同的方法來補(bǔ)足優(yōu)缺點。
如何做好體驗評估(測試)工作?這篇文章的干貨實在是太太……太棒了吧,收藏收藏,必須收藏。
感謝認(rèn)可