如何判斷一個(gè)對(duì)話機(jī)器人有多智能?

0 評(píng)論 11425 瀏覽 38 收藏 13 分鐘

有些對(duì)話機(jī)器人總讓人崩潰,也許是智能級(jí)別不夠高。本文,就來一起看看如何判斷一個(gè)機(jī)器人的智能程度。

隨著智能對(duì)話技術(shù)的發(fā)展,對(duì)話機(jī)器人越來越多地出現(xiàn)在人們的日常工作和生活中。

從企業(yè)的角度,在合適的業(yè)務(wù)場(chǎng)景中使用對(duì)話機(jī)器人,能夠極大地提升服務(wù)效率和用戶體驗(yàn)。因此,引入對(duì)話機(jī)器人逐漸成為每個(gè)企業(yè)數(shù)字化和智能化轉(zhuǎn)型過程中的重要戰(zhàn)略。

那么,我們應(yīng)該如何來評(píng)判一個(gè)對(duì)話機(jī)器人的能力,或者更具體一點(diǎn),如何判斷一個(gè)對(duì)話機(jī)器人的智能程度呢?

本文介紹一種對(duì)話機(jī)器人的分級(jí),讓我們可以更清楚地了解不同等級(jí)的對(duì)話機(jī)器人分別具有什么能力,適用于什么場(chǎng)景。

對(duì)話機(jī)器人的分級(jí)

目前業(yè)界并沒有一個(gè)成熟的對(duì)話機(jī)器人分級(jí)體系,但自動(dòng)駕駛的分級(jí)能夠給我們一些啟發(fā)。

根據(jù)行業(yè)標(biāo)準(zhǔn),自動(dòng)駕駛能力被分為L(zhǎng)1到L5共5個(gè)等級(jí)(L0代表完全人類駕駛,不算在5個(gè)等級(jí)之內(nèi)),等級(jí)越高代表自動(dòng)駕駛能力越強(qiáng)。比如,L1代表輔助駕駛,L5代表完全自動(dòng)駕駛。

在不同的級(jí)別下,駕駛員和車輛所扮演的角色有所不同,級(jí)別越高駕駛員需要對(duì)車輛的控制越少(如下圖所示)。

如何判斷一個(gè)對(duì)話機(jī)器人有多智能?

圖片來源[1]

參考國(guó)外開發(fā)者社區(qū)對(duì)于智能助手的分級(jí)[2],我們從對(duì)話機(jī)器人能夠解決的問題及其應(yīng)用場(chǎng)景出發(fā),將對(duì)話機(jī)器人的能力也進(jìn)行分級(jí),分為L(zhǎng)1到L5共5個(gè)等級(jí),等級(jí)越高代表對(duì)話機(jī)器人的能力越強(qiáng)(如下圖所示)。

下面我們分別介紹這5個(gè)等級(jí)。

如何判斷一個(gè)對(duì)話機(jī)器人有多智能?

L1 單向推送

機(jī)器人可向用戶推送消息,但沒有對(duì)話能力。

L1級(jí)別的對(duì)話機(jī)器人,只具備向用戶單向推送的能力。今天,我們所使用的App、微信公眾號(hào)都會(huì)使用這種方式與用戶交互。

這種方式的好處是受眾廣,效率高;缺點(diǎn)是用戶只能被動(dòng)接收推送,無法和機(jī)器人進(jìn)行對(duì)話交互。因此,L1級(jí)別的機(jī)器人在嚴(yán)格意義上不能被稱為“對(duì)話機(jī)器人”。

L2 單輪問答

機(jī)器人能回答用戶的常見問題,但沒有上下文理解能力,無法主動(dòng)與用戶交互。

L2級(jí)別的對(duì)話機(jī)器人開始具備對(duì)話交互能力,具體體現(xiàn)在它能夠回答用戶的常見問題。最典型的應(yīng)用場(chǎng)景是簡(jiǎn)單的問答型客服機(jī)器人,即用戶問一個(gè)問題,機(jī)器人回答答案。

這類對(duì)話機(jī)器人通?;谝粋€(gè)特定的知識(shí)庫(kù),當(dāng)用戶提出問題后,機(jī)器人需要對(duì)用戶的問題進(jìn)行語(yǔ)義理解,并從知識(shí)庫(kù)中找到對(duì)應(yīng)的答案回復(fù)給用戶。

因此,評(píng)價(jià)L2級(jí)別對(duì)話機(jī)器人的效果,主要看召回率和準(zhǔn)確率這兩項(xiàng)指標(biāo)。其中,召回率等于有多少用戶的問題能夠被機(jī)器人回答,準(zhǔn)確率等于機(jī)器人回答的問題中有多少回答正確。

關(guān)于L2級(jí)別對(duì)話機(jī)器人背后使用的技術(shù),感興趣的讀者可以閱讀之前的文章《對(duì)話機(jī)器人平臺(tái)智能問答技術(shù)拆解》。

綜合來看,L2級(jí)別的對(duì)話機(jī)器人適合比較簡(jiǎn)單的客服場(chǎng)景,機(jī)器人能準(zhǔn)確回答用戶的問題,用戶問完即走。

L3 多輪對(duì)話

機(jī)器人能理解上下文,和用戶進(jìn)行多輪對(duì)話,幫用戶完成任務(wù)。

L2級(jí)別的對(duì)話機(jī)器人經(jīng)過訓(xùn)練后雖然能夠準(zhǔn)確地回答用戶的問題,但仍然存在兩個(gè)明顯的缺陷:

  1. 它沒有上下文理解的能力,即機(jī)器人在回答一個(gè)用戶問題時(shí),不會(huì)考慮用戶之前所說的內(nèi)容;
  2. 它只能被動(dòng)地回答用戶的問題,無法主動(dòng)發(fā)起與用戶交互,導(dǎo)致機(jī)器人的應(yīng)用場(chǎng)景相對(duì)受限。

因此,我們需要更加智能的L3級(jí)別對(duì)話機(jī)器人。

我們以快遞領(lǐng)域的客服機(jī)器人為例,通過兩個(gè)具體的例子來說明L3級(jí)別對(duì)話機(jī)器人和L2級(jí)別的差別。

L2級(jí)別對(duì)話機(jī)器人無法理解上下文

因?yàn)槿鄙偕舷挛睦斫饽芰?,?dāng)用戶問“星期天開門嗎”時(shí),缺少了主語(yǔ) “中關(guān)村的門店”,L2級(jí)別的對(duì)話機(jī)器人無法理解用戶其實(shí)是在問“中關(guān)村的自提點(diǎn)星期天開門嗎”,導(dǎo)致機(jī)器人無法回答這個(gè)問題。

對(duì)于L3級(jí)別的對(duì)話機(jī)器人,它能夠理解上下文,從而補(bǔ)全了用戶問題的主語(yǔ),這樣一來便可以回答出這個(gè)問題。

L3級(jí)別對(duì)話機(jī)器人能夠理解上下文

有些時(shí)候,機(jī)器人在滿足用戶需求時(shí),不僅要聽懂用戶在說什么,還需要主動(dòng)向用戶發(fā)問,來獲取相關(guān)的信息。

我們來看另一個(gè)例子。

L2級(jí)別對(duì)話機(jī)器人能夠回答問題,但無法解決問題

上面的例子中,在機(jī)器人回復(fù)的消息里,“預(yù)約取件”是一個(gè)可點(diǎn)擊的鏈接,需要用戶點(diǎn)擊后在一個(gè)新的圖形化用戶界面(GUI, Graphical User Interface)中輸入取件時(shí)間、取件地址、取件電話等信息完成預(yù)約取件,這種需要在CUI和GUI之間來回切換的交互方式顯然不夠高效。

L2級(jí)別的對(duì)話機(jī)器人之所以要這樣,對(duì)話機(jī)器人并不知道取件時(shí)間、取件地址、取件電話等信息,沒有這些信息的情況下,機(jī)器人只能提供一個(gè)鏈接讓用戶自己操作。也就是說,L2級(jí)別的對(duì)話機(jī)器人有時(shí)候雖然回答了用戶的問題,但并沒有真正幫用戶解決問題。

理想情況下,我們希望機(jī)器人能夠通過對(duì)話直接幫助用戶完成任務(wù),這要求機(jī)器人能夠通過多輪對(duì)話去理解和澄清用戶的意圖。

L3級(jí)別對(duì)話機(jī)器人通過多輪對(duì)話解決用戶問題

綜上所述,L3級(jí)別對(duì)話機(jī)器人的核心能力有兩點(diǎn):

  1. 能夠理解上下文;
  2. 能夠通過主動(dòng)交互澄清用戶意圖,并通過多輪對(duì)話幫助用戶完成任務(wù)。

因此,在準(zhǔn)確率和召回率之外,任務(wù)完成率是L3對(duì)話機(jī)器人的重要指標(biāo)。

L3級(jí)別的對(duì)話機(jī)器人適合更加復(fù)雜的業(yè)務(wù)場(chǎng)景,尤其是需要機(jī)器人通過主動(dòng)對(duì)話收集用戶信息的場(chǎng)景,例如營(yíng)銷獲客等。

L4 個(gè)性化對(duì)話

機(jī)器人能基于用戶標(biāo)簽,為用戶提供個(gè)性化的對(duì)話體驗(yàn)。

理想情況下,對(duì)話機(jī)器人在和用戶交互時(shí),不僅需要理解用戶在說什么,也需要知道用戶是誰(shuí)。

具體而言,機(jī)器人可以基于用戶標(biāo)簽,即用戶的屬性、興趣等,為用戶提供更個(gè)性化的對(duì)話體驗(yàn),也提升交互的效率。

我們繼續(xù)以預(yù)約上門取件為例,L4級(jí)別的對(duì)話機(jī)器人會(huì)以這樣的方式來進(jìn)行對(duì)話。

L4級(jí)別對(duì)話機(jī)器人基于用戶標(biāo)簽提升對(duì)話效率

上面的例子中,機(jī)器人曾經(jīng)服務(wù)過這個(gè)用戶,所以它已經(jīng)記錄了用戶的取件地址和取件電話。在這次對(duì)話中,機(jī)器人無需再向用戶詢問取件地址、取件時(shí)間、取件電話,大大提升了交互效率和用戶體驗(yàn)。

對(duì)于L4級(jí)別的對(duì)話機(jī)器人,其核心在于能夠?yàn)橛脩舸驑?biāo)簽,并在對(duì)話過程中靈活使用用戶標(biāo)簽來提升對(duì)話效率和體驗(yàn)。當(dāng)然,如果個(gè)性化的對(duì)話體驗(yàn)如果處理得不恰當(dāng),可能會(huì)給用戶帶來困擾,甚至傷害用戶的體驗(yàn)。

因此,對(duì)于L4級(jí)別的對(duì)話機(jī)器人,用戶滿意度是一個(gè)非常重要的指標(biāo)。

L4級(jí)別的對(duì)話機(jī)器人則更適合機(jī)器人和用戶保持長(zhǎng)期關(guān)系的場(chǎng)景,例如智能助手等。

L5 多機(jī)器人協(xié)作

多機(jī)器人相互協(xié)作,滿足更復(fù)雜的用戶需求。在某些情況下,用戶的需求無法被單一的對(duì)話機(jī)器人滿足。

以預(yù)訂餐廳為例,用戶可以對(duì)一個(gè)智能助手說出需求,智能助手通過對(duì)話的方式收集到了用戶要訂哪家餐廳、什么時(shí)間、就餐人數(shù)等信息。此時(shí),智能助手需要再調(diào)動(dòng)另一個(gè)電話機(jī)器人給餐廳打電話進(jìn)行預(yù)訂。

我們可以發(fā)現(xiàn),這個(gè)需求的滿足過程涉及到智能助手和電話機(jī)器人這兩個(gè)對(duì)話機(jī)器人的協(xié)作,未來會(huì)有更多的場(chǎng)景和需求需要多機(jī)器人協(xié)作。

另一方面,對(duì)話機(jī)器人只是一種形態(tài)的智能機(jī)器人,還有更多種不同類型的智能機(jī)器人。比如,機(jī)器人流程自動(dòng)化(RPA)就是一種能夠控制軟件自動(dòng)完成特定任務(wù)流程的機(jī)器人。對(duì)話機(jī)器人和RPA機(jī)器人也有很多可以結(jié)合的場(chǎng)景。

還是回到預(yù)訂餐廳的例子,如果餐廳提供在線預(yù)訂的網(wǎng)站,那么可以由對(duì)話機(jī)器人完成信息的收集,由RPA機(jī)器人完成預(yù)訂的操作。

未來趨勢(shì)

未來,無論是企業(yè)還是個(gè)人用戶,都可以根據(jù)自己的業(yè)務(wù)場(chǎng)景,使用L2到L4級(jí)別的對(duì)話能力,來提升交互的效率和體驗(yàn)。

注:

[1] SAE關(guān)于自動(dòng)駕駛的分級(jí),了解一下?網(wǎng)址為“http://www.lilunpai.com/w/466”

[2] Conversational AI: Your Guide to Five Levels of AI Assistants in Enterprise. 網(wǎng)址為“https://blog.rasa.com/conversational-ai-your-guide-to-five-levels-of-ai-assistants-in-enterprise/”

 

作者:吾來;公眾號(hào):吾來對(duì)話機(jī)器人(ID:wulaipingtai),幫助每家企業(yè)或個(gè)人快速擁有屬于自己的對(duì)話機(jī)器人。

本文由 @吾來 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!