可用性測試的權(quán)衡之道
對于可用性測試,業(yè)內(nèi)人士存在一些普遍認(rèn)可的原則。它們神圣地如同自然科學(xué)里的理論,似乎我們只能對其言聽計(jì)從、俯首稱臣才能踐行出“好的可用性測試”。其實(shí),即便是科學(xué),它的一個(gè)特征也是“可證偽性”——理論的正確性總是存在前提條件的。真理再向前一步就成為謬誤!
可用性測試中的原則同樣如此,需要根據(jù)目的、資源、環(huán)境的不同,靈活把握、權(quán)衡取舍,而非一味恪守某一個(gè)或某幾個(gè)原則,也許這才是可用性從業(yè)人員經(jīng)驗(yàn)重要性的體現(xiàn)。
一.任務(wù)設(shè)置:精細(xì) VS 寬泛
制定的任務(wù)過于精細(xì),一般原則上是反對的。理由很清楚,如果你的任務(wù)精細(xì)到一步一步“引導(dǎo)”用戶進(jìn)行操作,那太不符合用戶現(xiàn)實(shí)中的使用情境,平時(shí)沒有人在旁邊“引導(dǎo)”用戶的每一步操作;而且過于控制用戶的操作步驟,用戶缺乏真實(shí)使用時(shí)的靈活性。
是不是我們設(shè)置的任務(wù)只能是寬泛的,不能細(xì)化呢?這就必須根據(jù)研究的目的來做抉擇。如果產(chǎn)品處在設(shè)計(jì)的初期,我們需要關(guān)注一些宏大的問題(如:網(wǎng)站的整體架構(gòu)、導(dǎo)航和分類的合理性、頁面的邏輯關(guān)系),此時(shí)就需要通過寬泛而有彈性的任務(wù),來查找宏觀層面的問題。如果產(chǎn)品的設(shè)計(jì)已經(jīng)非常完善,開始進(jìn)行細(xì)節(jié)的修改迭代,此時(shí)就需要通過設(shè)置相對具體的任務(wù)來查找特定的細(xì)節(jié)問題(如:對某個(gè)命名的理解、按鈕的使用、鏈接的點(diǎn)擊、表單的填寫)。按照《Don’t Make Me Think》一書的觀點(diǎn):一般用戶使用互聯(lián)網(wǎng)產(chǎn)品時(shí)滿足于能用就行,不會尋求最好的使用方法;只掃描網(wǎng)頁,不會仔細(xì)閱讀。所以,如果完全寬泛有彈性地設(shè)置任務(wù),雖然更吻合實(shí)際使用情況,但是很可能用戶直接跳過你想考察的細(xì)節(jié)。
實(shí)際工作中,由于時(shí)間和資源的限制,無法做到每個(gè)產(chǎn)品從設(shè)計(jì)初期到上線前后進(jìn)行多次可用性測試。可能在一次的可用性測試中即需要同時(shí)關(guān)注宏觀方面和細(xì)節(jié)上的問題。此時(shí),還是需要和產(chǎn)品經(jīng)理、交互設(shè)計(jì)師反復(fù)溝通,確認(rèn)測試的主要目的,同時(shí)通過對任務(wù)設(shè)置精細(xì)程度的權(quán)衡把握,使次要目的也盡量得以滿足。
不過,即便是想考察細(xì)節(jié)的任務(wù),也要盡量避免“直接指導(dǎo)操作”式的語言描述方式,這樣能讓任務(wù)與真實(shí)使用情境不會相距太遠(yuǎn)。例如:想考察豆瓣讀書頁面【想要】按鈕是否能被看到、是否具備可點(diǎn)擊感。下面列出兩種表述方式,以作對比:
A.請找到您喜歡的那本書,并在該頁面點(diǎn)擊【想要】。(×)
B.請找到您喜歡的那本書,并在該頁面對其作個(gè)標(biāo)記。(√)
二.任務(wù)數(shù)量:多VS少
任務(wù)數(shù)量的多少與可用性測試考察范圍有關(guān),與任務(wù)的精細(xì)程度也有關(guān)。如果對網(wǎng)站全站進(jìn)行考察和只對其中某個(gè)頁面、某個(gè)操作流程進(jìn)行考察,所需的任務(wù)數(shù)量自然不一樣。在同樣的考察范圍下,如果任務(wù)設(shè)置得越精細(xì),所需任務(wù)數(shù)量也就越多。
Lindgaard和Chattratichart(2007)的研究發(fā)現(xiàn)任務(wù)數(shù)量與發(fā)現(xiàn)可用性問題比例存在顯著的相關(guān)關(guān)系(r=0.82,p<0.01)。為了盡可能多地發(fā)現(xiàn)可用性問題,我們就盡量多地設(shè)置任務(wù)給用戶嗎?
此時(shí)要考慮任務(wù)數(shù)量過多可能帶來的弊端:學(xué)習(xí)效應(yīng)和疲勞效應(yīng),尤其是靠后的任務(wù)更可能會受影響。心理學(xué)實(shí)驗(yàn)中處理此問題的方法是順序平衡,抵消影響。但是可用性測試中設(shè)置的場景和任務(wù)存在特定的先后次序,不適合采用順序平衡的方法。基于我們的經(jīng)驗(yàn),還是通過對測試的任務(wù)數(shù)量進(jìn)行控制,確保正式測試環(huán)節(jié)最多不超過1小時(shí),加上前后的歡迎語、訪談、問答等,整個(gè)過程不超過1.5小時(shí)。
此外,任務(wù)數(shù)量的多少還會間接影響到測試所需參與者數(shù)量的多少。
三.用戶人數(shù):5個(gè)足夠VS 5個(gè)不夠
Nielsen的研究發(fā)現(xiàn),5個(gè)用戶可以發(fā)現(xiàn)80%以上的可用性問題。這個(gè)結(jié)論得到許多人的推崇,因此稱之為“魔法數(shù)字5”。這個(gè)結(jié)論的來源依據(jù)是每個(gè)用戶平均可以發(fā)現(xiàn)30%的可用性問題,且假設(shè)所有問題都有同等被發(fā)現(xiàn)的概率。不過,當(dāng)設(shè)置的任務(wù)數(shù)量過多,且任務(wù)的精細(xì)程度和難度多種多樣時(shí),這個(gè)前提有可能不成立。
Lindgaard和Chattratichart(2007)的研究發(fā)現(xiàn)測試用戶數(shù)量與發(fā)現(xiàn)的可用性問題比例并不存在顯著的相關(guān)關(guān)系。這個(gè)結(jié)論似乎又支持我們選擇少量用戶進(jìn)行測試即可。
其實(shí),在用戶招募階段,比用戶數(shù)量更需要重視是用戶的代表性的問題。能否招募到有代表性的用戶將直接影響可用性測試的成敗。如測試一個(gè)醫(yī)療軟件產(chǎn)品,招募到醫(yī)護(hù)人員和患者作為測試用戶,那5個(gè)用戶可能就足夠了;但如果只招募到醫(yī)學(xué)實(shí)習(xí)生來測試,就必須超過5個(gè)以上的用戶(即便這樣,也未必能推論到整個(gè)產(chǎn)品的用戶群)。
由此看來,招募用戶的人數(shù)和任務(wù)的數(shù)量、精細(xì)程度、用戶的代表性也是息息相關(guān)的。參考Tom Tullis(2009)和本人經(jīng)驗(yàn):當(dāng)可用性測試范圍限定在一定的范圍(20個(gè)任務(wù)內(nèi)、或30個(gè)網(wǎng)頁之內(nèi)),且招募到很強(qiáng)代表性的用戶,那么5個(gè)足夠了。如果存在著差別較大的亞群體,爭取做到每個(gè)亞群組有5個(gè)左右的代表性的用戶(當(dāng)然,目標(biāo)用戶的特征及分類應(yīng)該是在可用性測試之前的用戶調(diào)研階段就解決的問題);一次測試最多不會超過12個(gè)用戶。
四.用戶表現(xiàn):行為VS言語
在可用性測試中強(qiáng)調(diào)對用戶操作行為的關(guān)注,是毋庸置疑的。因?yàn)椋?/p>
1.用戶的行為指標(biāo)更明確、具體、客觀,易觀察和記錄。
2.如果完全把關(guān)注點(diǎn)放在用戶的操作行為上,那么就無需跟用戶進(jìn)行多余的(指導(dǎo)語之外的)語言交流。類似于心理學(xué)研究規(guī)范,對實(shí)驗(yàn)或測試中的指導(dǎo)語進(jìn)行統(tǒng)一,對一切無關(guān)變量(包括主試的語言、體態(tài)表情)進(jìn)行控制,以減少對研究過程的干擾。
3.即便你直接詢問用戶某些問題,也極可能得到錯誤的答案。30年前Richard Nisbett和Timothy Wilson的實(shí)驗(yàn)、2年前Peter Johansson在《science》的文章,都證實(shí)了某些情況下人們無法解釋清楚自己行為的真正原因。另外,用戶還可能揣摩主試的喜好,回答他們認(rèn)為主試期望的答案。
因此,有必要強(qiáng)調(diào)在可用性測試過程中關(guān)注的重點(diǎn)永遠(yuǎn)應(yīng)該是用戶的操作行為,而且盡量減少任何無關(guān)變量的干擾。但這個(gè)原則被有些人引申到極端,認(rèn)為只有觀察用戶的操作行為才有意義,其他信息都是無需關(guān)注的,甚至輕率地懷疑用戶的話都是不可信的。
可用性測試的主要目的雖然是發(fā)現(xiàn)問題,但也需要了解問題背后的原因,而僅僅依靠觀察用戶的操作行為是無法獲悉所有問題背后的原因的,此時(shí),我們就希望用戶能采用“出聲思維法”,出聲思維就是集中于如何與產(chǎn)品進(jìn)行交互的意識流。如果測試中的氛圍比較平等、自然、融洽,用戶又特別愿意表達(dá),那么用戶就會在進(jìn)行任務(wù)操作同時(shí),表達(dá)他們想做什么、打算如何做、背后的原因是什么。此時(shí),不僅是操作行為、用戶表達(dá)出來的想法和原因、以及語言中透露出的疑惑、失望、不滿、驚訝、猶豫等情緒同樣是需要我們加以關(guān)注的。但是,有些用戶比較內(nèi)向,不善于主動表達(dá)自己的想法,此時(shí)就需要主試跟他進(jìn)行簡單的交流,以引導(dǎo)用戶說出背后的原因(注:不是引導(dǎo)用戶說出你期望得到答案)。
所以,在實(shí)際的可用性測試,基本應(yīng)該以關(guān)注用戶的行為為主,少量、適時(shí)地進(jìn)行詢問交流也是需要的。但這個(gè)度如何把握呢?
1.當(dāng)用戶出現(xiàn)猶豫、驚訝、任務(wù)失敗(過程節(jié)點(diǎn)上出現(xiàn)自然而然地稍微中斷/暫停)的時(shí)候才進(jìn)行簡單的詢問。
2.詢問采用一般疑問句的句式,重復(fù)用戶剛才的行為表現(xiàn)(要具體客觀):“你剛才沒有……,是嗎?”——雖然沒有直接問“為什么”,但暗示了希望聽到他進(jìn)一步的解釋。
3.如果用戶沒有自己主動說出原因,可以“順便”問一下“為什么?”或通過身體前傾、目光注視等非語言方式來暗示用戶你希望能聽到更多內(nèi)容。若用戶很快、堅(jiān)定地說出原因,則該理由的可信度較高;如果用戶猶豫、或難以說出原因,就不要繼續(xù)追問。
除了上述的語言、情緒、行為都需要得到關(guān)注,還有一種特殊情況是需要聽懂用戶“沒有說的”語言。例如,我們預(yù)計(jì)網(wǎng)站的某二級導(dǎo)航標(biāo)簽和一級導(dǎo)航標(biāo)簽存在分類邏輯上的不合理;但用戶在測試中,導(dǎo)航相關(guān)的操作步驟進(jìn)行得很流暢,用戶也什么都沒說。這通常表明用戶認(rèn)為這些是理所當(dāng)然的、不影響操作的——此時(shí)你需要聽懂用戶“沒有說的”語言。如果你簡單粗暴地打斷用戶并詢問:“你覺得這兩個(gè)導(dǎo)航標(biāo)簽如何?”,則變成了一種誘導(dǎo)性地提問。
總結(jié)一下關(guān)于此部分內(nèi)容的實(shí)踐應(yīng)用:
1.用戶的操作行為永遠(yuǎn)是可用性測試的重點(diǎn)。
2.鼓勵用戶采用“出聲思維法”。
3.適時(shí)、少量地向用戶提問,禁止對同一個(gè)問題反復(fù)追問“為什么”。
4.采用真正地“傾聽”技術(shù)保持和用戶的交流狀態(tài),而非通過過多的話語。
5.開放、不預(yù)設(shè)立場地觀察、傾聽用戶“沒有說的”語言。
在可用性測試中考慮需要遵循的原則時(shí),一定要理解它的適用條件,以及它和其它原則之間的互相影響,并結(jié)合本次用戶研究的目的、資源、環(huán)境綜合考慮,以盡可能形成一個(gè)最優(yōu)方案。由于博文長度所限,先總結(jié)這么多,在下次的文章中會繼續(xù)總結(jié)其它幾方面的原則。
#p#
繼續(xù)討論可用性測試中各種原則的靈活運(yùn)用和注意事項(xiàng)。
五.發(fā)現(xiàn)問題:真的 VS 假的
判斷發(fā)現(xiàn)問題的真假,初看上去似乎不是個(gè)困難。多數(shù)或全部參與者都遇到的問題毫無疑問是明顯的可用性問題。或許有人會建議,根據(jù)參與者中發(fā)現(xiàn)該問題的人數(shù)比例來判斷:比例高是真問題,比例低是假問題。前半句話可以接受,后半句話則有待商榷。
雖然可用性測試是相對嚴(yán)謹(jǐn)?shù)挠脩粞芯糠椒ǎ瞧鋵o關(guān)變量控制的嚴(yán)格程度和真正的心理學(xué)實(shí)驗(yàn)還是有一定的差距;并且心理學(xué)實(shí)驗(yàn)對每組參與者數(shù)量的最低要求是30人,這樣得出的結(jié)論(數(shù)量比例)才具有推論至一般的意義。而可用性測試一般才8人左右的參與人數(shù)(盡管招募的參與者在質(zhì)的方面非常具有代表性),但卻無法把可用性測試中出現(xiàn)的所有數(shù)量比例簡單推論至一般。8個(gè)參與者中有1人發(fā)現(xiàn)某個(gè)問題,不代表現(xiàn)實(shí)中出現(xiàn)同樣問題的真實(shí)用戶只有12.5%,更不代表這個(gè)問題不是真正的/嚴(yán)重的可用性問題。
問題的真假除了根據(jù)問題出現(xiàn)的次數(shù)比例,還有很重要的考慮點(diǎn)是:用戶“錯誤行為”背后的認(rèn)知/思考方式是否合乎邏輯?
這里順便借用一下諾曼《設(shè)計(jì)心理學(xué)》里談到的理論:概念模型——系統(tǒng)表象——心理模型。概念模型可認(rèn)為是產(chǎn)品設(shè)計(jì)人員對產(chǎn)品的設(shè)計(jì)思想;系統(tǒng)表象可認(rèn)為是產(chǎn)品展現(xiàn)出的交互界面;而心理模型則是用戶按照既往經(jīng)驗(yàn)對如何操作該產(chǎn)品的設(shè)想。從這個(gè)角度來認(rèn)識,可用性問題則是“概念模型、系統(tǒng)表象、心理模型”三者的不吻合或矛盾。
通過分析用戶行為背后的認(rèn)知是否符合邏輯,來判斷發(fā)現(xiàn)的問題的真假,主要體現(xiàn)在以下幾點(diǎn):
1.“概念模型、系統(tǒng)表象”的不一致
產(chǎn)品設(shè)計(jì)人員突然發(fā)現(xiàn),界面的交互形式根本沒有反映出他原先的設(shè)計(jì)思想!
2.“系統(tǒng)表象、心理模型”的不一致
(1)用戶的思維方式受已有的同類產(chǎn)品的影響,并內(nèi)化接受,而新產(chǎn)品的“系統(tǒng)表象”和已有同類產(chǎn)品并不一致。
(2)用戶在日常生活經(jīng)驗(yàn)中形成了許多并不科學(xué)地通俗理解世界的方式(比如通俗物理學(xué)、通俗心理學(xué)),但產(chǎn)品設(shè)計(jì)人員沒有意識到用戶在以這樣一種“自認(rèn)正確”的錯誤方式來理解和使用產(chǎn)品。
如果發(fā)現(xiàn)的可用性問題屬于以上情況,那么即使只有一個(gè)參與者碰到,它也非常可能是一個(gè)真正的可用性問題。
例如:讓用戶登錄購彩網(wǎng)站,查看自己上次購彩結(jié)果。大多數(shù)用戶點(diǎn)擊【個(gè)人中心】去查看,有2個(gè)用戶點(diǎn)擊【開獎公告】去查看,發(fā)現(xiàn)只有開獎號碼,沒有任何購彩結(jié)果信息后,再去點(diǎn)擊【個(gè)人中心】。僅2個(gè)人出現(xiàn)了稍微的偏差,而且很快就找到了正確的頁面,這貌似應(yīng)該不算什么問題。
但若追究其行為背后的邏輯,并與其他用戶的反饋(“我上次買的號碼沒有直接顯示出來?”“這里看不到開獎的號碼啊?”)聯(lián)系起來,可以判斷用戶的心理模型和產(chǎn)品的系統(tǒng)表象不一致。用戶希望能同時(shí)對照著開獎號碼和自己買的號碼很方便地核對,而網(wǎng)站卻割裂兩部分放在不同的頁面,因此需要將這2個(gè)用戶碰到的問題當(dāng)作真正的可用性問題來對待。
六.研究方法:定性 VS 定量
可用性測試,很多時(shí)候被認(rèn)為是一種定性研究方法;但也有人說它是一種定量研究方法。究竟是怎么回事呢?
個(gè)人認(rèn)為,可用性測試實(shí)質(zhì)上結(jié)合了定性和定量兩種方法的特點(diǎn),到底哪種成分更多,要看你的使用目的以及細(xì)節(jié)上如何操作。
定量研究的思路是基于對一定數(shù)量樣本的測量,以將研究所得的結(jié)論推廣至總體。除了強(qiáng)調(diào)樣本的代表性,還對樣本的數(shù)量有具體的要求,同時(shí)會考慮抽樣誤差、置信度、置信區(qū)間的度量。并且定量研究過程中非常注重對某些自變量操控、及無關(guān)變量的控制。
而定性研究重視對主觀意義的理解(如背后隱藏的原因),采用解釋建構(gòu)的方法,比如訪談法等。
平時(shí)工作中以“形成式可用性”測試為主,即便它稍微偏向于定性研究,但在允許的范圍內(nèi),我個(gè)人還是盡可能地遵循著定量研究的方法去實(shí)施。這樣整個(gè)測試過程的嚴(yán)謹(jǐn)性能得到保證,結(jié)論的客觀程度相對更高(近幾個(gè)世紀(jì)來,量化研究一直是科學(xué)研究的主要范式,也正是這個(gè)原因)。具體做法如下:
1.在任務(wù)的設(shè)置上:因?yàn)閰⑴c者可能存在差別較大的亞群體,不可能要求完成完全相同的任務(wù)。但必定會設(shè)置大部分基本的、都需要完成的公共任務(wù),再針對不同亞群體設(shè)置少量的特殊任務(wù)。在后期統(tǒng)計(jì)分析的時(shí)候,基本的公共任務(wù)則可以進(jìn)行數(shù)量化的統(tǒng)計(jì),并橫向比較。
2.在測試過程中:關(guān)注參與者完成任務(wù)時(shí)的相關(guān)行為,用數(shù)字來記錄(以0、0.5、1分別表示失敗、幫助/提示下成功、成功)。主試盡量少地言語及體態(tài)姿勢的干擾,只在必要時(shí)進(jìn)行適當(dāng)?shù)匮哉Z交流。
3.在報(bào)告呈現(xiàn):對任務(wù)完成情況(效率、完成率)統(tǒng)計(jì)呈現(xiàn),對不同任務(wù)的完成情況進(jìn)行比較,對亞群體間的任務(wù)完成情況進(jìn)行比較,對所有可用性問題按數(shù)量化指標(biāo)進(jìn)行排序等。或者比較迭代前后獨(dú)特問題的頻次是否減少,以及嚴(yán)重程度高的等級里面可用性問題數(shù)量的變化情況。
4.測試過后,我們通常還會收集用戶自我報(bào)告式的數(shù)據(jù),作為“感知可用性”的一個(gè)總體反映。
(1)推薦使用系統(tǒng)可用性量表(SUS),因?yàn)橛醒芯勘砻鱏US在少量樣本時(shí)即可產(chǎn)生較為一致的評分結(jié)果。
(2)為減少用戶在填寫這些量表時(shí)的反應(yīng)心向,不要求填寫任何個(gè)人信息,且主試最好暫時(shí)回避。
(3)只統(tǒng)計(jì)分析所有參與者SUS量表總分的平均值,切勿再拆分比較亞群體之間的差異,因?yàn)榧幢阈判Ф仍俑叩牧勘恚?dāng)樣本量極小時(shí)都會變得很不靠譜!
七.問題優(yōu)先級:單指標(biāo) VS 多指標(biāo)
除了在可用性測試過程中,最終報(bào)告也必須體現(xiàn)出量化、客觀地特點(diǎn)。例如,報(bào)告發(fā)現(xiàn)的可用性問題的列表,我也會以量化的方式排列出問題的優(yōu)先級別。
這樣做的好處在于:首先,發(fā)現(xiàn)的可用性問題肯定有一些比另一些更嚴(yán)重;其次,考慮到產(chǎn)品和設(shè)計(jì)人員的精力和資源總是有限的,必須幫助他們梳理出最亟需整改的問題。站在別人的角度考慮問題,這樣他們才能更“友好地”接受我們的報(bào)告。
可用性問題列表的排序,涉及到采用單指標(biāo)還是多指標(biāo)、以及指標(biāo)分為幾級的問題。
先就量化的客觀性而言,“出現(xiàn)頻率”指標(biāo)是最客觀、最易量化的;而其它三個(gè)指標(biāo)都需分析人員的主觀判斷。
就指標(biāo)的代表意義而言,“嚴(yán)重程度”、“出現(xiàn)頻率”與用戶體驗(yàn)最相關(guān),與用研人員的職責(zé)也最相關(guān)。另兩個(gè)指標(biāo)可能更多地是產(chǎn)品人員的職責(zé)。
就指標(biāo)的價(jià)值而言,多個(gè)指標(biāo)的綜合顯然比單一指標(biāo)更有價(jià)值。
基于上述考慮,實(shí)際工作中我會選擇“嚴(yán)重程度”和“出現(xiàn)頻率”兩個(gè)指標(biāo)的綜合,作為可用性問題的優(yōu)先級指標(biāo)。“嚴(yán)重程度”分為3級,而不是5級(分析人員主觀判斷時(shí),3級指標(biāo)的誤差率要低于5級指標(biāo));“出現(xiàn)頻率”采用計(jì)算的具體數(shù)值,而非4級分類。這兩個(gè)指標(biāo)合并時(shí),采用1:1的權(quán)重,具體公式為:
問題優(yōu)先級=嚴(yán)重程度的級別+出現(xiàn)頻率的具體值×3
八.報(bào)告呈現(xiàn):優(yōu)點(diǎn) VS 問題 VS 建議
當(dāng)產(chǎn)品設(shè)計(jì)人員辛辛苦苦做出的產(chǎn)品卻被你報(bào)告上羅列的各種問題批評得一無是處時(shí),即便理智上認(rèn)可你的成果,情感上也很難接受。因此報(bào)告中列出哪怕一條最重要的優(yōu)點(diǎn),也會讓產(chǎn)品設(shè)計(jì)人員感到欣慰、感受到你中立的態(tài)度,增加對報(bào)告的接納程度。列出優(yōu)點(diǎn)的另一個(gè)好處是,在測試中被參與者多次自發(fā)提及的優(yōu)點(diǎn)確實(shí)帶給用戶某種驚喜;當(dāng)你在報(bào)告中再次強(qiáng)調(diào)時(shí),可以避免在后期迭代開發(fā)中丟失掉原本的優(yōu)點(diǎn)。
問題的列舉肯定是報(bào)告中非常重要的部分,但切勿羅列出清單就草草了事,因?yàn)椋?/p>
1.某個(gè)(些)問題和另一個(gè)(些)問題是有關(guān)聯(lián)的,但是報(bào)告中的問題列表部分卻割裂了這些聯(lián)系。
2.產(chǎn)品設(shè)計(jì)人員無法一直參與旁聽/觀察可用性測試的過程,導(dǎo)致對報(bào)告中文字描述的問題缺乏感性認(rèn)識。
3.只提問題卻不提供解決方案,就不是“建設(shè)性地提問”!
因此,我們需要在可用性測試報(bào)告的后半部分提出針對重要問題的解決方案。其目標(biāo)并非是強(qiáng)迫產(chǎn)品設(shè)計(jì)人員一定要采納我們提出方案,而是:(1)把一些相關(guān)問題聯(lián)系起來看,(2)加深報(bào)告閱讀者對于問題的感性認(rèn)識和背后原因的理解,(3)使整個(gè)報(bào)告的思路更清晰、完整,(4)我們還可學(xué)到一些交互設(shè)計(jì)和產(chǎn)品的知識。
總之,可用性測試施行起來既簡單又復(fù)雜。簡單是因?yàn)椴还苣闳绾问┬校K究能發(fā)現(xiàn)一些問題;復(fù)雜則在于發(fā)現(xiàn)可用性問題的質(zhì)量、重要性、對測試的利用效率、對產(chǎn)品設(shè)計(jì)人員的幫助程度可能相距甚遠(yuǎn)。一次成功的可用性測試體現(xiàn)在從前期策劃、測試過程、后期報(bào)告等整個(gè)過程中是否遵循了這些原則,并在某些難以兩全的原則面前做到合理的權(quán)衡取舍。


























