AI 時(shí)代地圖語(yǔ)音助手的體驗(yàn)進(jìn)化
語(yǔ)音是人們?nèi)粘I钪凶畛S玫慕换シ绞剑S著AI技術(shù)的發(fā)展,也被逐漸應(yīng)用車載產(chǎn)品中,語(yǔ)音助手有助于駕駛過(guò)程中解放用戶的手眼,提升駕駛安全性。本文從語(yǔ)音助手的概念出發(fā),對(duì)當(dāng)前語(yǔ)音助手的體驗(yàn)設(shè)計(jì)趨勢(shì)進(jìn)行了梳理與說(shuō)明,與大家分享。
人們?nèi)粘3鲂性絹?lái)越依賴地圖進(jìn)行導(dǎo)航指路、查路況以及找附近興趣點(diǎn)。而用戶在開(kāi)車途中用手操控或視線瀏覽屏幕,具有很大的安全風(fēng)險(xiǎn)。語(yǔ)音助手的出現(xiàn)極大解放了駕駛過(guò)程中用戶的手眼,提升駕駛安全性。它不僅支持全程語(yǔ)音喚醒,還能快速精準(zhǔn)理解用戶指令,提出有效解決方案。
01 語(yǔ)音助手概念
語(yǔ)音助手是指在硬件設(shè)備或 APP 軟件上植入人機(jī)對(duì)話程序,輔助用戶通過(guò)語(yǔ)音方式使用宿主設(shè)備或程序上的功能。完整的人機(jī)對(duì)話包括聲音信號(hào)的前端處理、將聲音轉(zhuǎn)為文字供機(jī)器處理、在機(jī)器生成語(yǔ)言之后,用語(yǔ)音合成技術(shù)將文本語(yǔ)言轉(zhuǎn)化為聲波,從而形成完整的人機(jī)語(yǔ)音交互。
02 語(yǔ)音助手體驗(yàn)趨勢(shì)
AI技術(shù)的發(fā)展以及硬件升級(jí),賦予智能設(shè)備越來(lái)越多感知通道,也不斷增強(qiáng)通過(guò)各種媒介進(jìn)行信息輸出的能力。感知和輸出層之外,情感計(jì)算能力的提升使機(jī)器在認(rèn)知層得到質(zhì)的飛躍。它們遠(yuǎn)比之前更懂用戶,也遠(yuǎn)比之前更會(huì)表達(dá)。基于設(shè)計(jì)理解與實(shí)踐,我們認(rèn)為語(yǔ)音助手體驗(yàn)在交互通道、交互對(duì)象方面正呈現(xiàn)三個(gè)趨勢(shì):
- 信息服務(wù)的表達(dá)融合多通道體驗(yàn)
- 對(duì)話貼近人的自然本能
- 具備情感交互能力
2.1 信息服務(wù)的表達(dá)融合多通道體驗(yàn)
除語(yǔ)音通道外,AI計(jì)算機(jī)視覺(jué)技術(shù)拓展了人臉、隔空手勢(shì)等交互通道,而傳統(tǒng)觸控、旋鈕等交互方式在操作精度、信息輸出效率以及技術(shù)成本方面還有自身優(yōu)勢(shì)。多通道融合能發(fā)揮不同通道的優(yōu)勢(shì)和場(chǎng)景適用性,對(duì)信息服務(wù)的表達(dá)更自然,效率最大化。
2.1.1 地圖語(yǔ)音交互形態(tài)重構(gòu)
基于觸屏手機(jī)設(shè)備的地圖語(yǔ)音,視覺(jué)信息的協(xié)同輸出能有效彌補(bǔ)語(yǔ)音無(wú)形、線性、不易記憶等缺陷,增進(jìn)用戶對(duì)語(yǔ)音交互體驗(yàn)的理解。在近場(chǎng)交互時(shí),觸屏還支持信息快速回復(fù)。
形態(tài)是地圖語(yǔ)音不可或缺的重要通道。
初次引入語(yǔ)音交互能力,為了減少認(rèn)知成本,地圖語(yǔ)音的交互形態(tài)沿用業(yè)界通用的封閉式對(duì)話流。而這種形態(tài)也隨著語(yǔ)音支持的地圖功能擴(kuò)展而產(chǎn)生局限性:
(1) 形態(tài)獨(dú)立封閉且與場(chǎng)景不融合,會(huì)對(duì)導(dǎo)航產(chǎn)生干擾,影響駕駛安全。
(2) 不能利用地圖原有的信息表達(dá),需要在對(duì)話流中單獨(dú)呈現(xiàn)結(jié)果。不僅影響算路等復(fù)雜需求的拓展,還會(huì)增加設(shè)計(jì)與開(kāi)發(fā)的維護(hù)成本。
為真正適合地圖場(chǎng)景,語(yǔ)音助手形態(tài)完成向非模態(tài)、任務(wù)伴隨式面板的重構(gòu):利用地圖原有的信息功能做展示,同時(shí)支持語(yǔ)音和觸控兩種回復(fù)方式,提升多輪對(duì)話效率。區(qū)別于封閉式對(duì)話流,伴隨式面板不跳脫當(dāng)前場(chǎng)景,帶給人更輕量的感受。
語(yǔ)音形態(tài)的簡(jiǎn)化在一定程度削弱了語(yǔ)音狀態(tài)的表達(dá),為了確保用戶對(duì)語(yǔ)音狀態(tài)的強(qiáng)感知,面板信息框架的頭部在語(yǔ)音進(jìn)程中持續(xù)展示小度頭像動(dòng)效和文案提示。
2.1.2 地圖語(yǔ)音結(jié)果VUI與GUI協(xié)同
在檢索地點(diǎn)等任務(wù)場(chǎng)景中,用戶通常注重效率。VUI結(jié)果話術(shù)的設(shè)計(jì)首先以目標(biāo)為中心為原則,在精確檢索單個(gè)結(jié)果時(shí),引導(dǎo)用戶進(jìn)行下一步行動(dòng);而在模糊檢索有多個(gè)結(jié)果時(shí),向用戶詢問(wèn)選擇或推薦可能最感興趣的地點(diǎn)并引導(dǎo)行動(dòng)。
配合VUI話術(shù),GUI也做相應(yīng)的協(xié)同展現(xiàn):數(shù)字序號(hào)匹配VUI的問(wèn)詢和用戶選擇,而推薦結(jié)果的高亮和標(biāo)簽使VUI推薦地點(diǎn)映射GUI,增強(qiáng)結(jié)果的表達(dá)效率。
2.2 對(duì)話貼近人的自然本能
連續(xù)對(duì)話且可隨時(shí)打斷,符合日常交流本能意識(shí),但目前絕大多數(shù)產(chǎn)品語(yǔ)音交互仍不夠自然:發(fā)起對(duì)話需要在安靜環(huán)境下,先喚醒再發(fā)出指令,并且以“一問(wèn)一答”為主。隨著全雙工免喚醒等語(yǔ)音技術(shù)的出現(xiàn),通過(guò)上下文信息對(duì)用戶指令的預(yù)測(cè)和判斷,可以免去中間喚醒環(huán)節(jié),實(shí)現(xiàn)更為自然流暢的多輪對(duì)話。
在實(shí)現(xiàn)自然對(duì)話前,有效的認(rèn)知教育是降低用戶使用語(yǔ)音門檻的必經(jīng)途徑。
2.2.1 地圖語(yǔ)音認(rèn)知教育體驗(yàn)創(chuàng)新
由于語(yǔ)音信息“隱形”特性,存在技能可發(fā)現(xiàn)性弱的缺陷,導(dǎo)致用戶時(shí)常忽略使用。同時(shí),經(jīng)地圖語(yǔ)音基礎(chǔ)調(diào)研發(fā)現(xiàn),不習(xí)慣操作方式是用戶不使用語(yǔ)音的首要原因。
地圖語(yǔ)音基礎(chǔ)調(diào)研_不使用語(yǔ)音原因
語(yǔ)音技能在不斷擴(kuò)充的同時(shí),需要解決如何增強(qiáng)語(yǔ)音可感知,加強(qiáng)用戶學(xué)習(xí)并培養(yǎng)使用習(xí)慣。入口觸達(dá)和場(chǎng)景化引導(dǎo)是增強(qiáng)語(yǔ)音可感知必不可少的手段:在用戶未形成語(yǔ)音喚醒習(xí)慣時(shí),入口作為用戶在觸屏感知功能的意符必不可少,而它還是語(yǔ)音喚醒效果不佳時(shí)的有效補(bǔ) 充。另外,語(yǔ)音作為自然高效的交互模式,需要基于語(yǔ)音優(yōu)勢(shì)場(chǎng)景強(qiáng)化引導(dǎo),激發(fā)使用動(dòng)力。
技能中心是進(jìn)行語(yǔ)音集中用戶教育的特有場(chǎng)所。市面上絕大多數(shù)產(chǎn)品的技能中心,都是以說(shuō)明書(shū)的文本方式進(jìn)行教育,本質(zhì)上仍是閱讀為主。而認(rèn)知研究表明,而我們的大腦為語(yǔ)言而非閱讀而設(shè)計(jì)。說(shuō)話和理解口頭語(yǔ)言是自然的人類活動(dòng),但閱讀不是。為了追求最真實(shí)的學(xué)習(xí)效果,地圖語(yǔ)音通過(guò)線上真實(shí)環(huán)境以聽(tīng)說(shuō)的方式完成沉浸式新手教育。
在用戶的心智模型里,語(yǔ)音的工具概念決定了用戶在有意圖時(shí)才會(huì)使用,這對(duì)學(xué)習(xí)以及習(xí)慣養(yǎng)成所需的實(shí)踐頻次和規(guī)律性都難免造成影響。因此,地圖語(yǔ)音技能中心提出小度成長(zhǎng)概念,完成每日任務(wù),用獎(jiǎng)勵(lì)幫助小度成長(zhǎng),用戶在潛移默化之快速學(xué)習(xí)技能,培養(yǎng)使用習(xí)慣。
任務(wù)主要在個(gè)性化、熱度、等級(jí)等維度進(jìn)行組織,比如個(gè)性化方面,優(yōu)先展示用戶容易出錯(cuò)的指令任務(wù),通過(guò)反復(fù)學(xué)習(xí)解決指令的表達(dá)問(wèn)題。
2.3 具備情感交互能力
語(yǔ)言是人類智能的象征,用戶對(duì)語(yǔ)音產(chǎn)品會(huì)產(chǎn)生“移情”效應(yīng)。情感計(jì)算可以使產(chǎn)品通過(guò)情緒分析等機(jī)器學(xué)習(xí)算法處理相關(guān)數(shù)據(jù),如人的面部表情、肢體動(dòng)作以及各種心理參數(shù):心跳、脈搏、腦電波等,結(jié)合外界環(huán)境信息,最終計(jì)算出人的情感狀態(tài)。再?gòu)挠布用妗UI及VUI層面給予立體的情感反饋,實(shí)現(xiàn)情感交互。
當(dāng)前地圖語(yǔ)音主要基于導(dǎo)航駕駛環(huán)境的數(shù)據(jù)來(lái)主動(dòng)提供服務(wù)與建議。
2.3.1 地圖語(yǔ)音主動(dòng)服務(wù)
地圖語(yǔ)音主動(dòng)服務(wù)當(dāng)前主要包括安全建議、路況以及目的地服務(wù)等三個(gè)主要場(chǎng)景。比如在用戶高速長(zhǎng)時(shí)間駕車時(shí),提供最近休息服務(wù)區(qū);路段出行擁擠時(shí),建議合適路線;而在臨近目的地時(shí)推薦方便停車點(diǎn)。在駕車過(guò)程中的關(guān)鍵觸點(diǎn)提供有價(jià)值的主動(dòng)服務(wù),提高駕駛安全性,建立可信任的情感聯(lián)系。
隨著未來(lái)透過(guò)更多傳感器來(lái)獲取人體相關(guān)數(shù)據(jù),能準(zhǔn)確把握用戶情緒狀態(tài),在導(dǎo)航中提供有利于情緒安撫和安全駕駛的主動(dòng)服務(wù)。
寫在最后
AI時(shí)代,語(yǔ)音助手本身將有機(jī)會(huì)成為唯一的服務(wù)主體而存在。
受益于語(yǔ)音能力的進(jìn)一步進(jìn)化,信息與服務(wù)圍繞用戶而非介質(zhì)持續(xù)流動(dòng)。人對(duì)自然、情感、個(gè)性化的訴求比以往任何一個(gè)時(shí)代更為凸顯,語(yǔ)音體驗(yàn)將更加實(shí)時(shí)多變。進(jìn)化的另一面,用戶隱私與商業(yè)競(jìng)爭(zhēng)將會(huì)影響這一理想愿景的實(shí)現(xiàn)。
參考文章:
[1] 《2020年中國(guó)智能語(yǔ)音行業(yè)研究報(bào)告》
[2] 《2019AI人機(jī)交互趨勢(shì)研究》
本文由 @Du Design 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
- 目前還沒(méi)評(píng)論,等你發(fā)揮!