一龍雙太子,星紀(jì)元和智界語音能力如何?

0 評(píng)論 599 瀏覽 2 收藏 14 分鐘

在人工智能技術(shù)迅猛發(fā)展的今天,汽車行業(yè)正不斷加大在車輛AI能力提升上的投入。然而,不同品牌和型號(hào)的車輛在AI技術(shù)運(yùn)用上展現(xiàn)出參差不齊的性能。針對(duì)星紀(jì)元ES和智界S7這兩款極為相似的車型,本文將以語音助手為切入點(diǎn),探究這些智能語音特性如何具體影響用戶在出行安全和駕乘體驗(yàn)方面的實(shí)際提升。

語音助手的設(shè)計(jì)初心在于簡化人們的日常操作與互動(dòng)。

它讓用戶即使在忙碌或視線受阻的情況下,也能輕松執(zhí)行各種任務(wù),極大提升了車與人的交互效率。

對(duì)于汽車制造商而言,語音助手不僅是座艙用戶體驗(yàn)的一張王牌,更是實(shí)現(xiàn)個(gè)性化服務(wù)與產(chǎn)品獨(dú)特性的核心所在。

對(duì)消費(fèi)者而言,語音助手代表著便捷、前沿科技和個(gè)性化表達(dá)的象征,它不僅迎合了智能車生活的趨勢(shì),也能在確保行車安全與便捷性方面發(fā)揮著重要作用。

因此,車載語音助手已成為現(xiàn)階段新能源汽車領(lǐng)域中不可或缺的重要功能。

一、工作流程

智能座艙的語音系統(tǒng)(VOS)是智能座艙的一個(gè)重要組成部分,它基于語音交互技術(shù),為用戶提供車內(nèi)環(huán)境下的語音控制服務(wù)。

VOS系統(tǒng)包括語音識(shí)別(Automatic Speech Recognition, ASR)、自然語言理解(Natural Language Understanding, NLU)、對(duì)話管理(Dialogue Management, DM)、語音合成(Text-to-Speech, TTS)等技術(shù),可以代替實(shí)現(xiàn)車輛控制、地圖導(dǎo)航、音樂及多媒體應(yīng)用、系統(tǒng)設(shè)置等功能的多種人車觸摸式交互。

語音指令的使用可以解放手指,無需偏移視線,提高行車安全。并且整個(gè)系統(tǒng)包括車端系統(tǒng)、云端系統(tǒng)、語音運(yùn)營管理平臺(tái)和訓(xùn)練與分析模塊,可通過運(yùn)營平臺(tái)和訓(xùn)練分析,對(duì)系統(tǒng)進(jìn)行優(yōu)化和改進(jìn)。

二、競(jìng)品選擇與分析

1. 競(jìng)品選擇

首先,語音助手在爭奪用戶關(guān)注方面的重要性日益凸顯。

從2019年至2023年1-9月,車載語音的裝配數(shù)量和裝配率持續(xù)攀升。2023年前三個(gè)季度,前裝車載語音的搭載量接近1200萬輛,裝配率高達(dá)80%。

此外,下圖也清晰地展示了近幾年汽車語音交互領(lǐng)域?qū)@麛?shù)量的激增。

其次,從公開技術(shù)信息來看,華為的盤古大模型于2023年9月發(fā)布,擁有千億級(jí)別的參數(shù)規(guī)模,特別強(qiáng)化了對(duì)中文語言的理解。

而科大訊飛的星火大模型于2023年5月推出,雖然具體參數(shù)規(guī)模尚未公開,但側(cè)重于特定場(chǎng)景下的實(shí)際應(yīng)用效果。

且截至2024年2月,星紀(jì)元ES和智界的全國銷售量分別為482和784輛,市場(chǎng)反響相當(dāng)。

而奇瑞作為資深國產(chǎn)汽車制造商,華為作為互聯(lián)網(wǎng)技術(shù)巨頭,以及科大訊飛作為語音識(shí)別行業(yè)的領(lǐng)導(dǎo)者,三者在不同商業(yè)模式下的合作催生了兩種截然不同的車型。

從車輛定位到產(chǎn)品賣點(diǎn),它們各有特色。

因此,本文將基于智界S7與星紀(jì)元ES這兩款車型的語音助手,探討在實(shí)際功能應(yīng)用上的表現(xiàn),以及語音助手將如何發(fā)揮其作用。

2. 定位分析

智界S7與星紀(jì)元ES均由奇瑞所打造,不同點(diǎn)在于智界所搭載的車載系統(tǒng)是華為最新的鴻蒙座艙系統(tǒng),而星紀(jì)元ES搭載的是奇瑞聯(lián)合科大訊飛共同研發(fā)的大模型車載系統(tǒng)LION OS。

3. 語音部分能力分析

在筆者本人的用戶畫像的基礎(chǔ)上,結(jié)合語音助手的必要性與功能性,筆者簡單挑選了幾個(gè)主要場(chǎng)景類別,并進(jìn)一步細(xì)化到具體的使用場(chǎng)景

這些場(chǎng)景涵蓋了語音助手的核心能力項(xiàng),旨在評(píng)估智界S7與星紀(jì)元ES的語音助手在實(shí)際應(yīng)用中的表現(xiàn)。并通過對(duì)這些細(xì)分場(chǎng)景,筆者將設(shè)計(jì)出一套體驗(yàn)測(cè)評(píng)項(xiàng)目,并制定相對(duì)應(yīng)的評(píng)分標(biāo)準(zhǔn),以實(shí)現(xiàn)對(duì)語音助手體驗(yàn)的量化評(píng)估。

語音助手基本能力項(xiàng)

4. 評(píng)分標(biāo)準(zhǔn)

  • 交互使用便利性:確保用戶通過語音助手進(jìn)行交互的便利性,使其操作比傳統(tǒng)的觸摸操作更為簡單快捷。這一指標(biāo)衡量的是語音助手能對(duì)用戶所說的話給予反饋用戶在使用語音助手時(shí),能否以更少的步驟和更高的效率完成任務(wù)。
  • 指令翻譯準(zhǔn)確性:優(yōu)秀的語音助手必須能夠準(zhǔn)確理解用戶的語音指令,這包括對(duì)語句意思的準(zhǔn)確把握。這一指標(biāo)衡量的是語音助手能夠明白用戶的意圖。
  • 指令執(zhí)行完整性:除了理解指令,語音助手還應(yīng)當(dāng)能夠徹底執(zhí)行用戶的指令,并在任務(wù)完成后提供明確的反饋,讓用戶知道操作結(jié)果。這一指標(biāo)衡量的是語音助手能對(duì)用戶所說的話給予反饋。
  • 指令結(jié)果可用性:是指指令執(zhí)行后產(chǎn)生的結(jié)果是否符合用戶的預(yù)期。這一指標(biāo)衡量的是用戶對(duì)語音助手的信任度和滿意度。
  • 語音助手?jǐn)M人化:主要是為了提升用戶體驗(yàn),使語音助手具備擬人化的特質(zhì),讓用戶愿意與之交流,并在人與車的交互中更愿意使用語音助手。這一指標(biāo)衡量的是用戶使用語音助手的意愿程度。
  • 可持續(xù)發(fā)展性:通過集成先進(jìn)的AI技術(shù),語音助手可以實(shí)現(xiàn)長期的發(fā)展,使助手能夠?qū)W習(xí)并適應(yīng)用戶的習(xí)慣,實(shí)現(xiàn)與用戶的共同成長。這一指標(biāo)衡量的是語音助手的自我迭代。

以上評(píng)判標(biāo)準(zhǔn)具體量化標(biāo)準(zhǔn)劃分采用5分滿分制,設(shè)置三個(gè)等級(jí),分別為:及格(3分)、良好(4分)、優(yōu)秀(5分)。在后續(xù)的體驗(yàn)中會(huì)以該標(biāo)準(zhǔn)對(duì)語音助手進(jìn)行評(píng)分,最后匯總得出結(jié)果。

三、產(chǎn)品體驗(yàn)

1. 體驗(yàn)過程

筆者對(duì)智界S7與星紀(jì)元ES的語音助手進(jìn)行了多次的實(shí)車體驗(yàn),累計(jì)制作了約7GB的視頻素材,通過模擬日常使用場(chǎng)景,詳細(xì)記錄了語音助手的工作流程和互動(dòng)體驗(yàn),體驗(yàn)記錄部分截圖如下:

2. 體驗(yàn)小結(jié)

盡管兩款車型在技術(shù)基礎(chǔ)上有所共通,但在實(shí)際應(yīng)用中,即使是同一車型,其語音交互功能的穩(wěn)定性與表現(xiàn)力也是參差不齊,具體表現(xiàn)如下

  • 便利性:兩車在基礎(chǔ)語音喚醒和車控指令執(zhí)行上均達(dá)到行業(yè)標(biāo)準(zhǔn),但在處理語音助手無法直接執(zhí)行的功能時(shí),智界S7的觸摸操作邏輯更為用戶友好,提供了更友好的保底策略
  • 準(zhǔn)確性:星紀(jì)元ES可能得益于科大訊飛的技術(shù)背景和芯片算力,在語音指令的NLU理解和執(zhí)行速度上稍優(yōu)于智界S7,但兩者均屬于實(shí)用級(jí)別;
  • 完整性:產(chǎn)品定義上的差異導(dǎo)致兩車在完整性方面表現(xiàn)不同。智界S7相對(duì)保守,對(duì)于復(fù)雜指令的執(zhí)行和反饋不夠充分。相反,星紀(jì)元ES展現(xiàn)出更全面的“助理”角色,能夠準(zhǔn)確執(zhí)行并給予用戶明確反饋;
  • 可用性:在指令執(zhí)行結(jié)果的可靠性方面,智界S7更為穩(wěn)妥,僅執(zhí)行確認(rèn)能夠完成的任務(wù),避免了錯(cuò)誤執(zhí)行。星紀(jì)元ES雖然會(huì)嘗試執(zhí)行所有指令,但有時(shí)會(huì)導(dǎo)致結(jié)果偏離用戶本意。
  • 擬人性:星紀(jì)元ES在擬人性方面顯著領(lǐng)先,提供豐富的語音助手形象,而智界S7的語音助手形象較為單一(筆者在體驗(yàn)過程中意外發(fā)現(xiàn)銀河E8的語音助手還可以更換人物聲音)。
  • 發(fā)展性:星紀(jì)元ES的語音助手能夠根據(jù)用戶使用習(xí)慣推薦高頻指令,并調(diào)整推薦內(nèi)容,顯示出較強(qiáng)的學(xué)習(xí)和發(fā)展能力。相比之下,盡管智界S7屬于后發(fā),但在發(fā)展性上并未體現(xiàn)出明顯優(yōu)勢(shì)。

綜上所述,星紀(jì)元ES在準(zhǔn)確性、完整性、擬人性和發(fā)展性方面占優(yōu),而智界S7在便利性和可用性上表現(xiàn)出色。

四、總結(jié)與改進(jìn)

在深入體驗(yàn)了導(dǎo)航、車輛控制及多媒體的語音交互功能后,我發(fā)現(xiàn)智界與星紀(jì)元在語音交互設(shè)計(jì)上均展現(xiàn)出一定程度的“擰巴”,但各自的策略差異使這種“擰巴”呈現(xiàn)出不同面貌。同時(shí),二者在提高人車交互效率方面也展現(xiàn)出不相上下的實(shí)力。

智界的“擰巴”主要表現(xiàn)為過于嚴(yán)謹(jǐn)?shù)牟僮鬟壿?,有時(shí)顯得不夠智能。例如,盡管用戶記住了復(fù)雜菜單下的指令關(guān)鍵詞,系統(tǒng)卻無法直接執(zhí)行,仍需用戶手動(dòng)導(dǎo)航至相應(yīng)指令層級(jí)界面再語音操作,但語音助手在處理同級(jí)頁面其他操作時(shí)卻又可以直接響應(yīng)。在收藏地點(diǎn)的過程中,智界雖支持通過語音助手設(shè)置收藏地點(diǎn),但卻缺少執(zhí)行指令后的反饋。并且智界擁有華為支付優(yōu)勢(shì),但鴻蒙系統(tǒng)在第三方應(yīng)用支付流程上的優(yōu)化仍有待提升。

而星紀(jì)元的“擰巴”則體現(xiàn)在其語音助手的過度主動(dòng)上。雖然其提供了類似nomi的擬人化交流體驗(yàn),符合“伴我成長”的產(chǎn)品理念,但有時(shí)會(huì)擅自更改用戶指令,導(dǎo)致執(zhí)行結(jié)果與用戶初衷背道而馳。

在新能源汽車迅猛發(fā)展的當(dāng)下,智界與星紀(jì)元的“擰巴”現(xiàn)象,在我看來,是完全可以理解的,因?yàn)檫@些在體驗(yàn)過程中遇到的問題,大多可以通過后續(xù)的OTA升級(jí)得到解決和優(yōu)化。

但從產(chǎn)品完成度來看,星紀(jì)元在產(chǎn)品定位、運(yùn)營宣傳以及具體功能實(shí)現(xiàn)上都略勝一籌,這也讓我對(duì)其語音系統(tǒng)更加青睞。

而對(duì)于兩車未來的發(fā)展方向,我認(rèn)為星紀(jì)元應(yīng)著重加強(qiáng)自然語言理解(NLU)的培訓(xùn),以提升對(duì)用戶意圖的精準(zhǔn)識(shí)別能力。至于智界,則應(yīng)當(dāng)在對(duì)話管理(DM)和文本轉(zhuǎn)語音(TTS)技術(shù)方面注入更多人性化的元素,從而使得交互體驗(yàn)更加自然和流暢。

本文由@Siom 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!