日韩精品无码综合网，国产三级片在线免费观看，yellow精品在线观看免费观看视频，国产欧美在线一区二区三，丁香久久精品视频三区，无码日韩精品国产av，中文字幕熟妇视频在线，精品视频在线无码免费

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊 | 登錄

語音喚醒技術(shù)哪家強(qiáng)？

大龍

2022-03-24

3 評論 2731 瀏覽 12 收藏

7 分鐘

隨著語音交互技術(shù)的日漸成熟，越來越多的智能硬件都選擇增加語音能力作為產(chǎn)品賣點(diǎn)之一。但是，設(shè)備在進(jìn)入語音交互工作狀態(tài)的時(shí)候，需要先進(jìn)行喚醒操作，而喚醒操作則各有不同。本文通過綜合對比市面上各家提供的語音喚醒技術(shù)相關(guān)指標(biāo)，幫助大家快速掌握語音喚醒技術(shù)的情況。推薦感興趣的小伙伴閱讀交流～

一、語音喚醒技術(shù)的相關(guān)核心指標(biāo)

1. 喚醒率

語音喚醒的主要目的既然是激活設(shè)備進(jìn)入交互工作狀態(tài)，那么，喚醒率的高低就顯得額外重要了。理論上，最好的狀態(tài)就是我只要說一次喚醒詞，設(shè)備就能立即響應(yīng)。不過，受說話人與設(shè)備距離、發(fā)音標(biāo)準(zhǔn)、噪聲等各種各樣的因素，實(shí)際工作中比較難達(dá)到次次響應(yīng)的完美工作狀態(tài)。

一般來說，在近距離的安靜場景下，市面上的技術(shù)都能夠做到喚醒率在95%以上。

不過，消費(fèi)者的實(shí)際使用場景是較復(fù)雜的，因此，需要模擬不同的應(yīng)用場景進(jìn)行實(shí)測，才能得到最后的喚醒率指標(biāo)。

2. 誤喚醒率

指設(shè)備被非喚醒詞喚醒的概率，誤喚醒率越高，效果越不好。

大家在日常生活中可能會(huì)經(jīng)常碰到，放在家里的智能音箱，大晚上莫名其妙答一句“我在”，把人嚇個(gè)半死；還有如果家里用的智能電視，喚醒手機(jī)語音助手的時(shí)候，不是同一個(gè)喚醒詞，電視也會(huì)蹦出一句“我在”。

這就是典型的誤喚醒場景，一般用24小時(shí)被誤喚醒多少次來衡量。

3. 響應(yīng)時(shí)長

主要是指用戶說完喚醒詞后，設(shè)備給出反饋的耗時(shí)，一般越短越好。

而反饋的形式則比較多樣，可以通過語音應(yīng)答響應(yīng)、也可以通過亮屏或者指示燈閃爍響應(yīng)。統(tǒng)計(jì)來看，如果是亮屏或者指示燈閃爍響應(yīng)，控制在200ms以內(nèi)用戶體驗(yàn)較好；如果是語音應(yīng)答響應(yīng)，太快反而體驗(yàn)不好，一般控制在500ms左右更佳。

4. 功耗

主要是針對電池供電設(shè)備，理論上越低越好，這樣，設(shè)備的使用時(shí)長不會(huì)受到太大的影響。

因?yàn)閱拘训墓ぷ髟硎菚?huì)持續(xù)檢測聲音中是否包含喚醒詞的特定片段，所以，會(huì)持續(xù)耗電。

為了進(jìn)一步降低功耗，部分產(chǎn)品也會(huì)采取DSP來完成語音喚醒，再通過AP層兜底的模式，保證喚醒和功耗的均衡。

總結(jié)：語音喚醒的技術(shù)指標(biāo)，除了與算法相關(guān)之外，還與智能硬件的結(jié)構(gòu)設(shè)計(jì)、芯片算力、使用場景等息息相關(guān)。最后的實(shí)際效果，則應(yīng)以實(shí)際測試效果為準(zhǔn)，參考下圖：

二、語音喚醒技術(shù)對比

該對比信息均從互聯(lián)網(wǎng)公開渠道獲取，相關(guān)信息來源于提供商官網(wǎng)公開信息，如其官網(wǎng)有更新，請以更新信息為準(zhǔn)。（PS：百度搜索?“語音喚醒”）

從上面的對比上來看，我們可以發(fā)現(xiàn)幾點(diǎn)信息：

大部分服務(wù)商都會(huì)提供喚醒詞評估服務(wù)。
在系統(tǒng)支持上，安卓和iOS比較主流。不過，越來越多的語音喚醒功能開始應(yīng)用在了穿戴設(shè)備上，是否支持Linux和Rtos系統(tǒng)也至關(guān)重要。
在喚醒詞上，基本都支持中文喚醒詞，畢竟，大部分的產(chǎn)品都是面向國人，中文普通話是主要的語言。不過，也有服務(wù)商，能夠額外支持英文、數(shù)字、方言喚醒詞，市場更加細(xì)分。
喚醒指標(biāo)上，近場喚醒率基本都在95%以上。不過，正如前面分析的那樣，喚醒跟很多因素相關(guān)，最后在產(chǎn)品上的實(shí)測值才具有代表性。

三、喚醒詞的區(qū)別

喚醒詞的定義實(shí)際是比較廣泛，至少包含了四種使用場景：品牌喚醒詞（如，小飛小飛）、離線命令詞（如，我要聽周杰倫的歌）、云端命令詞（如，我要聽周杰倫的歌）、免喚醒詞（如，下一首、暫停）。這些使用場景，實(shí)際上都是使用了喚醒詞的原理，只是喚醒后執(zhí)行不同的動(dòng)作。

四、語音喚醒項(xiàng)目實(shí)施要點(diǎn)

1. 喚醒詞評估

大部分服務(wù)商都提供了喚醒詞評估服務(wù)，不過，有部分服務(wù)商對喚醒詞有一定的限制。因此，在選擇喚醒詞的時(shí)候，需要充分考慮品牌、發(fā)音特點(diǎn)、詞語等因素，綜合確定最終的喚醒詞。

2. 確認(rèn)測試環(huán)境和工具

以以往交付的喚醒項(xiàng)目來看，主要測試的環(huán)境包括：外噪場景測試、自噪場景測試、安靜場景測試和誤喚醒測試。

3. 聲音采集

根據(jù)產(chǎn)品主要面向的使用人群，采集真人發(fā)音音頻。

示例：【某某投影儀音頻采集需求】

采集人數(shù)200人，總音頻2000句
男女比=1:1
一人10句
語速快：中：慢=1:3:1
年齡兒童：青年：中年=1:3:1
區(qū)域：北上廣深
普通話

4. 測試音頻處理

包括去除破音的音頻、去除時(shí)長>1.7s的測試音頻、音頻幅度歸一化。

5. 數(shù)據(jù)記錄表

根據(jù)實(shí)測結(jié)果，如實(shí)填寫表格中對應(yīng)測試結(jié)果，完成項(xiàng)目驗(yàn)收。

以上是本次分享的主要內(nèi)容。

本文由@大龍原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自 Unsplash，基于CC0協(xié)議

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

大龍

科大訊飛AI交互業(yè)務(wù)部商務(wù)合作經(jīng)理

1篇作品 2731總閱讀量

小紅書電商：擴(kuò)張中的亂象

10-184096 瀏覽

妙鴨相機(jī)推出AI修圖，修圖軟件們慌了嗎？

12-122132 瀏覽

除了好友／群成員收費(fèi)，企微還有哪些服務(wù)是要錢的？

05-104029 瀏覽

東南亞MCN生態(tài)里，達(dá)人成長面臨挑戰(zhàn)

04-285584 瀏覽

實(shí)現(xiàn)業(yè)務(wù)增長的三大手段

06-234212 瀏覽

評論

琪涵

挺好是挺好，我感覺只能起到一定的輔助作用，對于用戶不想起還是沒辦法。

最近回復(fù)
區(qū)區(qū)boss

挺智能的，但是誤喚醒做的不行，已經(jīng)體驗(yàn)過被好幾次了

最近回復(fù)
1. 大龍作者回復(fù)區(qū)區(qū)boss
  
  誤喚醒取決于訓(xùn)練和算法優(yōu)化
  
  最近來自廣東回復(fù)