HMI語(yǔ)音設(shè)計(jì)探索-入門篇(一)

6 評(píng)論 4007 瀏覽 26 收藏 14 分鐘

編輯導(dǎo)語(yǔ):語(yǔ)音交互是未來的一大趨勢(shì),HMI語(yǔ)音設(shè)計(jì)也有其背后的邏輯。這篇文章以介紹語(yǔ)音交互內(nèi)容為基礎(chǔ),并結(jié)合作者的實(shí)際工作項(xiàng)目經(jīng)驗(yàn),提出了一些想法和思路,一起看看吧。

一、前言

開頭必須來一句,我相信語(yǔ)音一定是未來,我非常確認(rèn)。

這篇HMI的語(yǔ)言探索以介紹語(yǔ)音交互內(nèi)容為基礎(chǔ),結(jié)合我的實(shí)際工作項(xiàng)目經(jīng)驗(yàn),輸出總結(jié)關(guān)于語(yǔ)音設(shè)計(jì)的內(nèi)容,最后在結(jié)合案例,在對(duì)話設(shè)計(jì)中會(huì)進(jìn)行深度的探索,并提出個(gè)人的想法和思路,因?yàn)橛械臅r(shí)候深度去思考覺得我們項(xiàng)目還可以有很多優(yōu)化的點(diǎn)。

進(jìn)入我們今天的正題:

在說語(yǔ)音交互之前,先給大家講一下題外話,關(guān)于人機(jī)交互(Human Computer Interaction)簡(jiǎn)稱HCI,可能日后我想去攻讀這個(gè)碩士學(xué)位,簡(jiǎn)單來說就是指人與計(jì)算機(jī)之間通過使用某種對(duì)話語(yǔ)言,以一定的交互方式,為完成確定任務(wù)的人與計(jì)算機(jī)之間的信息交換過程。

語(yǔ)音助手最初的載體是手機(jī)APP,通過與用戶之間的對(duì)話方式,能夠幫助用戶來解決問題的,隨著我們現(xiàn)在人工智能的研發(fā)技術(shù)不斷發(fā)展,包括讓機(jī)器學(xué)習(xí),語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言處理、智能搜索等一系列。

語(yǔ)音交互運(yùn)用的很普遍了,不僅僅只是智能手機(jī),現(xiàn)在涉及到的領(lǐng)域是越來越多了,如智能家居、汽車、可穿戴設(shè)備、就連商場(chǎng)普遍也有機(jī)器人語(yǔ)音對(duì)話。

二、HMI語(yǔ)音介紹

我這邊就不打算講語(yǔ)音的發(fā)展歷史了,不然又是水了一大堆內(nèi)容,我可是一個(gè)講干貨的小作家呢,如果我的小粉絲們需要的話,就私信我,我會(huì)在微信公眾號(hào)更文。

語(yǔ)言是傳遞信息重要方式,對(duì)于我們用戶來說,語(yǔ)音交互也是學(xué)習(xí)成本相對(duì)較低、容易掌握的,語(yǔ)音交互設(shè)計(jì)簡(jiǎn)稱為 VUI。

新能源汽車不斷的發(fā)展,智能車載系統(tǒng)也是我們最看重的。隨著語(yǔ)音交互的的普及,語(yǔ)音識(shí)別開始走入人們生活,憑借其實(shí)用性和準(zhǔn)確性得到了用戶的認(rèn)可,因此在發(fā)展的過程中摒棄了傳統(tǒng)的、繁雜的手動(dòng)操作,提高安全駕駛屬性和更高效的處理問題的能力,但是,在現(xiàn)階段的新能源汽車發(fā)展過程中還不能完全替換掉手動(dòng)操作。

現(xiàn)在為什么用戶在駕駛車的過程中,還是不會(huì)常用到語(yǔ)音交互,首先提到的就是用戶習(xí)慣,根據(jù)數(shù)據(jù)調(diào)查,在使用語(yǔ)音交互的人群中,年輕人占了主力軍,其余年齡段的人由于常年駕駛都是通過硬按鍵來操控車內(nèi)空調(diào)、電話、音樂、電臺(tái)、內(nèi)置導(dǎo)航。

其實(shí)就算是蘋果手機(jī)中的siri都很少用到, 在使用初期因?yàn)榧夹g(shù)的不成熟,再加上冰冷的對(duì)話方式使得用戶不對(duì)他這個(gè)買單,像我現(xiàn)在生活中,用到的siri頻率也會(huì)很少,最多就是定一個(gè)鬧鐘,app實(shí)在找不到就會(huì)使用到,還有無聊的時(shí)候和他進(jìn)行無聊的對(duì)話,嗯就這樣子。

國(guó)內(nèi)做語(yǔ)音頭部公司有我們熟悉的科大訊飛,還有和多家車企合作的思必馳、云知聲,對(duì)內(nèi)服務(wù)的百度,搜狗,騰訊,阿里這些大咖都有自己的語(yǔ)音技術(shù)。

再講一下語(yǔ)音的基礎(chǔ)原理內(nèi)容,這一塊比較難懂一點(diǎn),首先你要說出你需要解決的需求、要處理什么事情,通過車載系統(tǒng)設(shè)備收到指令的語(yǔ)音、自動(dòng)語(yǔ)音識(shí)別 (ASR)、將指令轉(zhuǎn)化為文本、自然語(yǔ)言處理 (NLP)、了解用戶需要解決什么問題、通過Skill(普及一下知識(shí):SKill 是一個(gè)腳本語(yǔ)言 運(yùn)行在cadence的設(shè)計(jì)環(huán)境,是cadence設(shè)計(jì)工具的API,好了不啰嗦了),將處理好的結(jié)果處理成回復(fù)文本,最后再通過TTS 播報(bào)形式,形成回復(fù)音頻,通過車載系統(tǒng)回復(fù)給用戶解決結(jié)果,聽起來是不是有點(diǎn)復(fù)雜了,我相信我是全網(wǎng)說的最細(xì)的了。

如何去定義一個(gè)產(chǎn)品的語(yǔ)音的好壞?我覺得吧,能夠讓用戶對(duì)于這個(gè)語(yǔ)音系統(tǒng)的滿意度達(dá)到一個(gè)高標(biāo)準(zhǔn),首先能夠讓系統(tǒng)能夠聽懂你所說的內(nèi)容,并且給出相對(duì)應(yīng)的解決方案,語(yǔ)音系統(tǒng)運(yùn)用的簡(jiǎn)而易用即可,如何做到以上的要求,我會(huì)再下面對(duì)話設(shè)計(jì)中會(huì)著重講解深挖的。

如何去定義一個(gè)產(chǎn)品的語(yǔ)音的好壞?我覺得吧,能夠讓用戶對(duì)于這個(gè)語(yǔ)音系統(tǒng)的滿意度達(dá)到一個(gè)高標(biāo)準(zhǔn),首先能夠讓系統(tǒng)能夠聽懂你所說的內(nèi)容,并且給出相對(duì)應(yīng)的解決方案,語(yǔ)音系統(tǒng)運(yùn)用的簡(jiǎn)而易用即可,如何做到以上的要求,我會(huì)再下面對(duì)話設(shè)計(jì)中會(huì)著重講解深挖的。

三、車載語(yǔ)音交互(VUI)基本原則

車載場(chǎng)景下的語(yǔ)音交互核心基本原則有三點(diǎn):

1. 首先是安全

駕駛過程中,司機(jī)的眼睛、耳朵和手占據(jù)了大部分多任務(wù)操作,如果一些功能還需要通過眼睛和手來操作的話,會(huì)降低安全駕駛的系數(shù),所以車載語(yǔ)音交互更有助于輔佐司機(jī)安全駕駛,減少注意力的分散。

2. 其次是便利

語(yǔ)音交互設(shè)計(jì)之初,一定要考慮便利、快捷,盡量的減少每一個(gè)任務(wù)的對(duì)話次數(shù)、快速響應(yīng)、將對(duì)話流程簡(jiǎn)單化,從而打破VUI對(duì)于用戶的一個(gè)心理障礙(便利這塊內(nèi)容我會(huì)在后面對(duì)話設(shè)計(jì)中著重講解)。

3. 最后是愉悅

為什么要談到愉悅,因?yàn)槭袌?chǎng)上最初的語(yǔ)音對(duì)話交談,都是冷冰冰的,幾乎沒有情感可談,像極了和機(jī)器人對(duì)話,并且有的時(shí)候無法處理任務(wù)就會(huì)說,超出能力范圍,這是一個(gè)很不好的用戶體驗(yàn)。

現(xiàn)在市場(chǎng)上可以看到,導(dǎo)航軟件也有語(yǔ)音包可以選擇,這也是增加了情感化設(shè)計(jì),這是其中的一個(gè)點(diǎn)。還有一個(gè)小點(diǎn)就是自然的對(duì)話交流,很流暢的完成用戶提出的每一項(xiàng)任務(wù),盡可能的規(guī)避對(duì)話中的錯(cuò)誤,讓整體的對(duì)話過程達(dá)到一個(gè)愉悅的感覺。

四、用戶語(yǔ)音的目的

用戶在語(yǔ)音交互的時(shí)候,絕大多數(shù)都是帶有明確指示任務(wù)指令的,也有可能是閑聊狀態(tài)。

任務(wù)狀態(tài)下任務(wù)式對(duì)話中,用戶需要盡快的得到想要反饋和解決方案,并且快速的完成,此類任務(wù)的反饋要求還需要清晰、簡(jiǎn)單明了。

閑聊狀態(tài)下:我們經(jīng)常也會(huì)問Siri一些無聊的問題,比如:“siri給我來一段Rap” 通常這類的任務(wù)帶有的目的性不是很強(qiáng),但是對(duì)于趣味性要求會(huì)高。

五、市場(chǎng)現(xiàn)狀(VUI+GUI)

語(yǔ)音是最舒服的交互形式,但是他不能完全取代GUI,相互協(xié)作才是更佳的方案,所以現(xiàn)在市場(chǎng)上的車載系統(tǒng)大多數(shù)都是以語(yǔ)音(VUI)和 圖形用戶界面(GUI)相組合的,也有少部分車加入其他交互方式譬如手勢(shì)交互。

語(yǔ)音與圖形的交互是交叉處理,從而形成了多模,多模態(tài)在我第二篇文章也有講到,第一次看我文章的同學(xué)們可以回顧一下,用戶在對(duì)車載系統(tǒng)發(fā)送一個(gè)指令的同時(shí),設(shè)備會(huì)有多種的反饋方式,首先你可以聽到系統(tǒng)虛擬形象給你做出回答,其次你看到圖形界面的變化,舉一個(gè)例子,你說:“我要聽周杰倫的七里香”系統(tǒng)就會(huì)處理講頁(yè)面跳轉(zhuǎn)到音樂界面,并且播放周杰倫的七里香,如果聲音小了,你可以說:“聲音大一點(diǎn)”

大家是不是發(fā)現(xiàn)一個(gè)問題呀?我在前面說系統(tǒng)首先會(huì)做出回答,然后界面才會(huì)發(fā)生變化,但是實(shí)際情況,系統(tǒng)語(yǔ)音形象沒有做出任何多余的回答,而是直接聽取到用戶的需求,直接反饋出結(jié)果,播放了周杰倫的 #七里香#,這就是我準(zhǔn)備在下面會(huì)重點(diǎn)講到的“對(duì)話設(shè)計(jì)”。

再說對(duì)話設(shè)計(jì)之前,我們先了解一下VUI設(shè)計(jì)師,想必大家頭一次聽說,還有語(yǔ)音(VUI)設(shè)計(jì)師嘛,國(guó)內(nèi)不太注重培養(yǎng)VUI設(shè)計(jì)師,大家可以去招聘平臺(tái)搜索一下語(yǔ)音交互設(shè)計(jì)師,很少有公司專門針對(duì)這個(gè)職位去招聘的,就算有,也是招聘算法等研發(fā)崗的職位,VUI設(shè)計(jì)師的工作任務(wù)一般都是公司的產(chǎn)品經(jīng)理或者交互設(shè)計(jì)師代勞了,這會(huì)肯定就有產(chǎn)品經(jīng)理或者交互設(shè)計(jì)師想出來吐槽了,哈哈哈。

語(yǔ)音交互方式給用戶聽和說兩個(gè)動(dòng)作,相信大家也有聽過7±2法則,因此在聽到的信息設(shè)計(jì)發(fā)面需要考量,因?yàn)橛脩袈牭揭槐閮?nèi)容之后就消失了,除非這款車機(jī)語(yǔ)音系統(tǒng),有再次復(fù)述上一段話的功能,不然在語(yǔ)音設(shè)計(jì)的時(shí)候,千萬(wàn)不要讓用戶產(chǎn)生的認(rèn)知負(fù)荷,更不要挑戰(zhàn)用戶的短時(shí)間的記憶力,最強(qiáng)大腦除外,我們大多數(shù)人可不是什么最強(qiáng)大腦是不是。

再次強(qiáng)調(diào)一下,就算擁有復(fù)述這個(gè)功能,也要注意設(shè)計(jì)的語(yǔ)音內(nèi)容,該功能點(diǎn)只是加分項(xiàng)而已,不能打破底線,將語(yǔ)音設(shè)計(jì)的原則拋之腦后。

文章中如有不足之處,歡迎補(bǔ)充交流,我們下期見。

下期文章預(yù)告:HMI語(yǔ)音設(shè)計(jì)探索-實(shí)際案例篇(二)

 

本文由@設(shè)計(jì)界的影帝 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議嗎

專欄作家

設(shè)計(jì)界的影帝,微信公眾號(hào):king設(shè)計(jì)研究所,人人都是產(chǎn)品經(jīng)理專欄作家。專注于車載HMI領(lǐng)域,想讓更多的設(shè)計(jì)和關(guān)注到這個(gè)行業(yè),將自己所學(xué)到、看到的知識(shí)都通過以文章形式展現(xiàn)給大家看。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 文章的結(jié)構(gòu)非常好,對(duì)這個(gè)概念也介紹的非常詳細(xì)

    回復(fù)
  2. 期待大佬更新下一篇!

    來自廣東 回復(fù)
  3. 之前出門全靠吼,現(xiàn)在各種語(yǔ)音助手的上線確實(shí)方便了許多。

    來自山東 回復(fù)
  4. 寫的好!準(zhǔn)備跟著這系列文章去一一學(xué)習(xí)了,期待下一篇!

    來自云南 回復(fù)
  5. 之前關(guān)于人機(jī)交互的概念和運(yùn)用都不太清晰,看完這篇文章才是恍然大悟

    來自江西 回復(fù)
  6. 語(yǔ)音交互要是能搞好,真的很不錯(cuò)啊,期待有一天可以直接對(duì)話

    來自云南 回復(fù)