HMI設(shè)計(jì)島:車載語(yǔ)音之形象設(shè)計(jì)別有洞天

6 評(píng)論 9094 瀏覽 40 收藏 17 分鐘

#本文為人人都是產(chǎn)品經(jīng)理《原創(chuàng)激勵(lì)計(jì)劃》出品。

提到語(yǔ)音助手你會(huì)想到什么?是小愛(ài)同學(xué)、天貓精靈、亞馬遜Alexa、還是蔚來(lái)NOMI?想必對(duì)于你來(lái)說(shuō),車載語(yǔ)音也不陌生。語(yǔ)音識(shí)別技術(shù)的發(fā)展日新月異,如今的我們,只要喚醒語(yǔ)音助手,就能實(shí)現(xiàn)一系列的操控指令,滿足我們身處駕駛艙內(nèi)的需求。

一、VUI概念解讀

1. VUI釋義及簡(jiǎn)史

VUI(Voice User Interface)意為語(yǔ)音用戶交互界面,可以解釋為計(jì)算機(jī)或移動(dòng)設(shè)備上的語(yǔ)音控制應(yīng)用程序。其發(fā)展歷史大概可以劃分為兩個(gè)階段/時(shí)期。

VUI第一個(gè)時(shí)期的出現(xiàn)標(biāo)志是交互式語(yǔ)音應(yīng)答(Interactive Voice Response, IVR)系統(tǒng)的誕生,IVR系統(tǒng)可以通過(guò)電話線路理解人們的談話并執(zhí)行相應(yīng)的任務(wù)。

比如:我們撥打移動(dòng)通信運(yùn)營(yíng)商10086或10010時(shí),可以與出現(xiàn)的語(yǔ)音客服系統(tǒng)直接溝通,繼而查詢?cè)捹M(fèi)或套餐業(yè)務(wù)。語(yǔ)音客服系統(tǒng)除了在移動(dòng)通信運(yùn)營(yíng)商中廣泛應(yīng)用,各類航空公司、銀行、酒店也紛紛普及。

我們現(xiàn)在所處的時(shí)期是VUI的第二個(gè)時(shí)期。現(xiàn)今市面上存在Amazon Echo、小米智能音箱、天貓精靈等語(yǔ)音助手,其部分型號(hào)僅能提供語(yǔ)音信息,與此同時(shí),Siri、Google Now、Cortana等綜合了語(yǔ)音和視覺(jué)信息的App也同樣占據(jù)市場(chǎng)份額。

在我們所處的第二時(shí)期,雖然很多事情已經(jīng)可以被當(dāng)前的語(yǔ)音助手處理,但同時(shí)還有很多事情語(yǔ)音助手無(wú)法完成,所以目前我們同時(shí)也處于下一階段的初期,可以盡情期待VUI發(fā)展的未來(lái):當(dāng)我們開(kāi)著車行駛在路上,駕駛艙內(nèi)的車載語(yǔ)音助手根據(jù)我們每個(gè)人的喜好主動(dòng)告知我們哪里的商場(chǎng)今天正在進(jìn)行打折,哪家羅森目前還能買到經(jīng)常斷貨的小蛋糕;又或是當(dāng)我們情緒不好,主動(dòng)做出緩解我們情緒的行動(dòng)或提供建議。

2. VUI設(shè)計(jì)師的工作內(nèi)容

一如互聯(lián)網(wǎng)UX設(shè)計(jì)師專注于用戶和App/手機(jī)之間的流暢體驗(yàn)一樣,VUI設(shè)計(jì)師專注于與用戶和語(yǔ)音程序之間的交互體驗(yàn)。

《語(yǔ)音用戶界面設(shè)計(jì)》一書中這樣說(shuō)道:“VUI設(shè)計(jì)師思考的是在系統(tǒng)和終端用戶之間從開(kāi)始到結(jié)束的整個(gè)對(duì)話過(guò)程。他們思考正在解決的問(wèn)題以及用戶需要什么來(lái)達(dá)成他們的目的?!?/p>

VUI設(shè)計(jì)師的工作流程與UX通用設(shè)計(jì)流程類似,同樣包含:用戶研究、角色創(chuàng)建、原型設(shè)計(jì)、用戶流程創(chuàng)建、可用性測(cè)試和迭代設(shè)計(jì)。

但VUI設(shè)計(jì)和界面設(shè)計(jì)有很大的不同,語(yǔ)音交互設(shè)計(jì)師必須考慮語(yǔ)音的復(fù)雜性,需要了解人們對(duì)聲音的情感反饋和不同聲音之間的區(qū)別,涉及心理學(xué)、社會(huì)學(xué)、語(yǔ)言學(xué)等領(lǐng)域。

總結(jié)來(lái)說(shuō),VUI設(shè)計(jì)師的工作內(nèi)容分為四個(gè)部分,依次分別是:用戶研究、設(shè)計(jì)階段、場(chǎng)景數(shù)據(jù)收集、迭代優(yōu)化。

二、車載語(yǔ)音形象

沒(méi)有人格的語(yǔ)音用戶界面是不存在的。

——Cohen, Giangola and Balogh , 2004

正如Cohen, Giangola 和 Balogh 在《語(yǔ)音人機(jī)界面》中所說(shuō),如果你不給你的VUI設(shè)定人格化特征,那么你的用戶就會(huì)(腦補(bǔ))。所以更好的做法是,我們?cè)谠O(shè)計(jì)的初期就確定好自己的VUI人格。

好的VUI體驗(yàn),本質(zhì)上就是一次好的交談。而一場(chǎng)好的交談自然離不開(kāi)交流的對(duì)象、內(nèi)容、語(yǔ)氣、音色等復(fù)雜性因素。車載語(yǔ)音形象可分為可視化部分(視覺(jué)部分)和聽(tīng)覺(jué)部分。在大多數(shù)車載語(yǔ)音里,車載語(yǔ)音視覺(jué)通道是車載語(yǔ)音聽(tīng)覺(jué)通道的理想載體,二者相互結(jié)合,相輔相成。

1. 語(yǔ)音視覺(jué)形象

1)車載語(yǔ)音視覺(jué)形象類型

語(yǔ)音形象分為傳統(tǒng)型(具象型)、抽象型、擬人型。

移動(dòng)端手機(jī)、家庭音箱類語(yǔ)音多為抽象型形象,新勢(shì)力車多為擬人型形象,概念車多為傳統(tǒng)型形象。

這三種類型類型之間有分界線,但也會(huì)有一些融合。下面,我來(lái)介紹一下三種類型的具體特征和例子。

① 傳統(tǒng)型(具象型):二維、扁平、顏色簡(jiǎn)單、動(dòng)效簡(jiǎn)單、聲音波型 、麥克風(fēng)造型。

② 抽象型:三維、形狀不規(guī)則、色彩豐富、流動(dòng)感、光效、球體、炫酷(例:Google語(yǔ)音助手Cortana)。

③ 擬人型:卡通、五官明顯、表情豐富、IP化、生動(dòng)活潑(例:小鵬語(yǔ)音助手小P)。

2)車載語(yǔ)音視覺(jué)形象風(fēng)格演化

車載語(yǔ)音視覺(jué)形象風(fēng)格由傳統(tǒng)型向抽象型/擬人型演化。

通過(guò)下圖Siri的視覺(jué)變化過(guò)程圖,我們能夠明顯看到Siri的視覺(jué)形象由一開(kāi)始的擬物化麥克風(fēng)造型,逐步變?yōu)槌橄笮偷陌殡S著光效變化波動(dòng)的圓。Siri是一個(gè)典型的由傳統(tǒng)型向抽象型演化的例子。

3)視覺(jué)類型占比

通過(guò)下圖我們可以看到傳統(tǒng)型、抽象型、擬人型語(yǔ)音視覺(jué)形象在移動(dòng)端和車極端的大致占比。

可以發(fā)現(xiàn):在移動(dòng)端目前占比最高的是抽象型視覺(jué)形象,在車載端,目前占有最高比例的是傳統(tǒng)型語(yǔ)音形象,隨著新能源車占有比例升高和科技的發(fā)展,這一數(shù)據(jù)也會(huì)在未來(lái)隨之變化。

擬人化的視覺(jué)形象是VUI的常見(jiàn)表現(xiàn)形式,但不是所有的VUI都需要擬人化視覺(jué)設(shè)計(jì),比如Sir和Cortana的視覺(jué)形象就是一個(gè)活動(dòng)的發(fā)光的圓圈。對(duì)于一個(gè)好的語(yǔ)音交互來(lái)說(shuō),擬人形象并不是必不可少的條件。

4)語(yǔ)音形象的多樣性

語(yǔ)音形象不僅限于展示語(yǔ)音的基礎(chǔ)狀態(tài)(喚醒聆聽(tīng)?wèi)B(tài)等),同時(shí)也體現(xiàn)播報(bào)態(tài)語(yǔ)音形象的多樣性。拓展方向?yàn)椋?/p>

  1. 語(yǔ)音形象與不同形象結(jié)合;
  2. 語(yǔ)音形象與不同情緒、個(gè)性化(如生日)結(jié)合;
  3. 語(yǔ)音形象與不同智能場(chǎng)景結(jié)合(天氣、小憩模式)。

2. 車載語(yǔ)音形象設(shè)計(jì)流程

車載語(yǔ)音形象設(shè)計(jì)流程包含人格特征、表現(xiàn)層、基礎(chǔ)狀態(tài)、聲音設(shè)計(jì)幾個(gè)方向,每個(gè)方向又包含若干設(shè)計(jì)模塊。

  • 表現(xiàn)層:形象設(shè)計(jì)、動(dòng)效設(shè)計(jì)、顏色、表情;
  • 聲音設(shè)計(jì):音色、語(yǔ)調(diào)、語(yǔ)氣、話語(yǔ)節(jié)奏;
  • 基礎(chǔ)狀態(tài):識(shí)別解析、喚醒聆聽(tīng)、結(jié)果反饋。

3. 如何得到語(yǔ)音的人格特征

當(dāng)我們著手VUI設(shè)計(jì)時(shí)候,我們需要得到符合自己項(xiàng)目品牌的語(yǔ)音助手人格關(guān)鍵詞。

我們可以在公司內(nèi)部開(kāi)展workshop或去品牌4S店進(jìn)行調(diào)研,得到語(yǔ)音關(guān)鍵詞,再根據(jù)用戶的使用場(chǎng)景逐個(gè)分析推導(dǎo)。VUI設(shè)計(jì)師創(chuàng)造的聽(tīng)覺(jué)形象需要符合自身產(chǎn)品屬性。

4. 語(yǔ)音聽(tīng)覺(jué)形象(兩組調(diào)研)

普羅大眾喜歡什么樣的語(yǔ)音聽(tīng)覺(jué)形象呢?此處我們來(lái)看兩個(gè)國(guó)內(nèi)外團(tuán)隊(duì)的研究結(jié)果。

第一份是來(lái)自于百度智能駕駛團(tuán)隊(duì)投放在百度地圖活動(dòng)專區(qū)的的調(diào)研結(jié)果,來(lái)自于3745份有效樣本,該團(tuán)隊(duì)將聽(tīng)覺(jué)形象細(xì)分為基礎(chǔ)屬性、性格特質(zhì)和聲音特質(zhì)三個(gè)維度,根據(jù)三個(gè)維度的調(diào)研喜愛(ài)結(jié)果,組成了四種具體語(yǔ)音形象,分別是:甜美女生、溫和御姐、活潑女孩和爽朗男性。

根據(jù)其調(diào)研結(jié)果,在基礎(chǔ)屬性中,喜歡女性聲音形象的人占據(jù)最多的人數(shù),大于80%的用戶青睞18-32歲的偏年輕的語(yǔ)音形象。超半成的用戶希望語(yǔ)音產(chǎn)品成為自己的助手,低于半數(shù)的用戶希望語(yǔ)音產(chǎn)品為主播/主持形象。

在性格氣質(zhì)層面,用戶偏好活潑、開(kāi)朗的多血質(zhì)形象(依據(jù)心理學(xué)體液氣質(zhì)理論)。

在聲音特質(zhì)方面,用戶更喜歡甜美的音色和隨和親切的語(yǔ)氣。其次穩(wěn)重、細(xì)膩的性格特質(zhì)也被多數(shù)用戶所喜歡。

看了百度智能駕駛團(tuán)隊(duì)有趣的調(diào)研結(jié)果,再讓我們看一下德國(guó)Michael Braun博士團(tuán)隊(duì)的調(diào)研思路。

前期研究階段:Michael Braun設(shè)計(jì)了8種語(yǔ)音助手人格,包含“主導(dǎo) / 順從”和“敵對(duì) / 友好”幾個(gè)人際交流間的基本維度,并在 6 個(gè)駕駛場(chǎng)景(3 個(gè)與駕駛相關(guān),3 個(gè)與娛樂(lè)相關(guān))下,邀請(qǐng) 19 名非 HCI 專業(yè)人員分別與 8 名助手進(jìn)行對(duì)話,了解他們對(duì)語(yǔ)音助手人格特征的需求偏好。

基于以上研究,Michael Braun對(duì)語(yǔ)音助手的人格特征設(shè)計(jì)進(jìn)行調(diào)整,設(shè)計(jì)出 4 種新的人格模型,分別為朋友、傾慕者、阿姨、仆人。

現(xiàn)實(shí)場(chǎng)景駕駛實(shí)驗(yàn):實(shí)驗(yàn)共邀請(qǐng)了 55 名年齡在 23-60 歲的被訪者者,其中有 45 名男性和 10 名女性,被訪者中超過(guò)一半的人在日常生活中使用過(guò)語(yǔ)音助手。

被訪者駕駛中級(jí)轎車在慕尼黑的某路段上開(kāi)始測(cè)試,按照駕駛場(chǎng)景的順序,被訪者者分別與匹配到的個(gè)性化助手和默認(rèn)人格助手交互完成兩次駕駛實(shí)驗(yàn)。在每次駕駛實(shí)驗(yàn)后,被訪者口頭評(píng)價(jià)本次交互體驗(yàn)的好壞。

實(shí)驗(yàn)結(jié)果分析:在用戶與助手人格匹配過(guò)程中,55 個(gè)被訪者里有 21 個(gè)與朋友人格匹配,16 個(gè)與仆人人格匹配,15 個(gè)與阿姨型人格匹配,3個(gè)與傾慕者人格匹配。

結(jié)論:

  1. 語(yǔ)音助手人格與用戶個(gè)性的正確匹配至關(guān)重要,如匹配到適合自己的助手人格時(shí),能夠獲得更高的滿意度和喜愛(ài)度,相反則容易引起不滿。
  2. 非駕駛場(chǎng)景下(如娛樂(lè)場(chǎng)景),用戶更喜歡適合自己的個(gè)性化人格;安全相關(guān)駕駛場(chǎng)景下,默認(rèn)人格更受青睞。

習(xí)典有言:“履不必同,期于適足。”意思就是說(shuō),每一個(gè)人的鞋子大小不必相同,關(guān)鍵是要適合自己的腳。

語(yǔ)音聽(tīng)覺(jué)形象亦是如此,適合用戶的,才是最好的。每款汽車都有自己的用戶定位,作為VUI設(shè)計(jì)師,應(yīng)當(dāng)根據(jù)自己產(chǎn)品的用戶人群,來(lái)選擇最合適的語(yǔ)音人格調(diào)研方法,才能得到最適合的語(yǔ)音聽(tīng)覺(jué)形象。

此外,可能會(huì)有同學(xué)好奇,語(yǔ)音助手聲音是如何合成的

方法之一是找聲優(yōu)錄上百條關(guān)鍵話術(shù),根據(jù)聲音的關(guān)鍵信息,提取出來(lái),然后合成的。

三、謹(jǐn)防用戶“跌落恐怖谷”

當(dāng)用戶在使用語(yǔ)音助手的時(shí)候,容易觸發(fā)一些不良體驗(yàn),例如:恐怖谷狀況。我們?cè)谶M(jìn)行VUI設(shè)計(jì)時(shí),要避免陷入這一境地。那么,什么是恐怖谷理論呢?

恐怖谷理論:

恐怖谷理論由日本機(jī)器人專家森昌弘在1970年提出??植拦壤碚摰慕忉尀椋?strong>當(dāng)我們看到一個(gè)和人類極為相似但不完全相像的事物時(shí),我們會(huì)由衷地感到恐懼。例如上圖中位于谷底的僵尸,雖然同為人類外形,但本質(zhì)大有區(qū)別,于是引發(fā)我們的恐懼。

避免恐怖谷狀況的方法之一是在我們的設(shè)計(jì)中減少人類特征設(shè)計(jì),或者使用卡通/動(dòng)物形象。

四、結(jié)語(yǔ)

未來(lái)已來(lái),將至已至。腦機(jī)接口、元宇宙,各類新名詞充斥著我們的生活,科技的發(fā)展速度超乎想象。

語(yǔ)音技術(shù)亦是如此,各家公司持續(xù)迭代自己的語(yǔ)音系統(tǒng),針對(duì)下一個(gè)世代的智聯(lián)網(wǎng)進(jìn)行布局。我們應(yīng)做好準(zhǔn)備,迎接智能時(shí)代新的設(shè)計(jì)挑戰(zhàn)。

References

  • 《語(yǔ)音用戶界面設(shè)計(jì):對(duì)化式體驗(yàn)設(shè)計(jì)原則》
  • https://zhuanlan.zhihu.com/p/78890262
  • https://www.researchgate.net/profile/Michael-Braun-20
  • https://zhuanlan.zhihu.com/p/78890262
  • https://mp.weixin.qq.com/s/8Y8vj4NCeIJ2Oq5dWX626Q

 

作者:刃魚;公眾號(hào):HMI設(shè)計(jì)馬克筆

本文由 @刃魚 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

本文為人人都是產(chǎn)品經(jīng)理《原創(chuàng)激勵(lì)計(jì)劃》出品。

題圖來(lái)自Pexels,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. Google語(yǔ)音助手Cortana?

    回復(fù)
    1. sorry,寫錯(cuò)啦,感謝指正!

      回復(fù)
    2. 差點(diǎn)就懷疑自己了,于是點(diǎn)開(kāi)了win的Cortana看了一眼笑哭

      來(lái)自四川 回復(fù)
  2. 我個(gè)人還是挺喜歡理想汽車那個(gè),感覺(jué)很靈動(dòng)

    回復(fù)
  3. 實(shí)習(xí)生的產(chǎn)品體驗(yàn)報(bào)告

    回復(fù)
    1. 對(duì)于我們這種剛?cè)腴T的人來(lái)說(shuō)還挺開(kāi)眼的

      回復(fù)