總理和小度機器人是如何對話的?

3 評論 11392 瀏覽 7 收藏 9 分鐘

 

10月19日,總理再次來到創(chuàng)業(yè)展示中心,在李彥宏的陪同下與百度的人工智能產(chǎn)品小度機器人進行了一次“深度交流”,根據(jù)新聞稿,對話如下。

百度人員:小度,你知道總理是誰嗎?

小度:國務院總理是李克強,這誰不知道?

李總理:你為什么叫小度?

小度:百度研發(fā)的嘛。

李總理:你儲存了多少個句子?

小度:好多好多的。

李總理:不愿意說具體數(shù)字是保守秘密嗎?

小度:特別大呢!

李總理:你知道大眾創(chuàng)業(yè)、萬眾創(chuàng)新也有利于改善環(huán)境嗎?

小度:當然啦。

北京市長王安順:你對北京城市管理有什么意見?

小度:不堵車吧。

表面上李克強總理好像是在和小度機器人交流,一問一答,但實際上背后所需要用到的技術(shù)遠比看起來復雜得多,這背后到底是如何運作的?這種技術(shù)正在展現(xiàn)怎樣的科技未來?我希望能夠以我的理解帶來一些解釋。

小度怎樣實現(xiàn)與總理的深度對話?

現(xiàn)在我們還原整個流程,當總理問“你為什么叫小度?”時,小度就開始運行了。

第一步,語音識別,對于人來說接收到的語音可以立馬轉(zhuǎn)換為文字信息,但是對于機器來說接收到的則是數(shù)字信號而已。當總理問“你為什么叫小度”時,“NI”這個發(fā)音可以是“泥”也可以是“逆”,所以最終要確定是哪個字還需要語音技術(shù)來實現(xiàn)計算概率的最大化。

第二步,更為核心的自然語言處理技術(shù)(NLP),當機器獲得總理說的話之后就需要進行理解,對于我們?nèi)硕月牭揭痪湓挷⒗斫馐且患浅@硭斎坏氖虑?,但是對于機器來說就很麻煩,比如當機器收到“你為什么叫小度”這句話后,要判斷意思到底是“你的名字為什么是小度”還是“你為什么呼叫小度”,這種語義理解困境會在語義理解中反復出現(xiàn)。

自然語言處理技術(shù)(NLP)正是針對這一問題,2010年國際自然語言處理專家,王海峰博士加入百度,對NLP發(fā)展進行了一次系統(tǒng)性的梳理和規(guī)劃。百度將NLP各項技術(shù)應用到復雜長查詢的意圖分析問題,當搜索“宮崎駿的電影”時,在之前只會搜出一堆網(wǎng)頁,而現(xiàn)在的百度會默認給出所有宮崎駿的相關(guān)電影,用戶可以直接進入觀看。其次當用戶搜索“感冒可以吃螃蟹嗎”這類不確定性問題時,在傳統(tǒng)搜索時代同樣只會給出一堆網(wǎng)頁,而目前則是基于深度問答技術(shù)自動匯總網(wǎng)上的大量知識,并得到更加精煉、全面性的答案,更為高效的幫助用戶決策,而不是直接給出一堆不確定性的網(wǎng)頁讓用戶不停打轉(zhuǎn)。

簡而言之,自然語言處理(NLP)技術(shù)是不斷去分析用戶搜索意圖,通過反復學習與大數(shù)據(jù)分析來給出用戶最優(yōu)的答案,而目前百度的NLP技術(shù)集中體現(xiàn)在搜索上,所以此次小度能夠較為準確的回答總理問題并非一朝一夕之事,而是長期積累后的結(jié)果,并且依然在不斷的發(fā)展中。

第三步,機器學習技術(shù),現(xiàn)在當機器理解完這句話的目的之后,就需要為其提供答案,通過全網(wǎng)大數(shù)據(jù)為總理提供答案,如果總理是百度的老用戶,并且使用次數(shù)越多,那么百度就會根據(jù)其用戶歷史行為記錄,給出更為精確的答案。

根據(jù)百度2014年數(shù)據(jù),10PB的網(wǎng)頁數(shù)據(jù)(1PB=1024TB),關(guān)鍵搜索的平均響應速度僅0.3秒完成,這需要海量的集群服務器才能做到,這種大數(shù)據(jù)挖掘的有賴于機器學習。

而在自然語言處理(NLP)技術(shù)方面已發(fā)展的成熟性則是小度機器人深度問答的重要基礎(chǔ)。例如,當北京市長王安順問:“你對北京城市管理有什么意見?”,得到的答案已不再是互聯(lián)網(wǎng)上五花八門的答案,而是一個統(tǒng)一的答案“不堵車”,這是NLP深度問答系統(tǒng)自動對網(wǎng)上大量相關(guān)知識、觀點進行自動分析、抽取、統(tǒng)計而得到的結(jié)果。從小度機器人身上可以看到,小度在一定意義上正在突破傳統(tǒng)“搜索引擎”的概念,因為它不僅搜索信息,而且還生產(chǎn)知識。

深度問答技術(shù)的研發(fā)過程很復雜,一個完整的深度問答系統(tǒng)需要多項NLP技術(shù)組合而成,從問題分類到需求解析,從網(wǎng)頁檢索到知識庫查詢,從信息抽取到答案排序……每一個環(huán)節(jié)都需要達到很高的精度,才能使得最終搭建起來的問答系統(tǒng)準確地理解問題并給出答案。所以,小度這一產(chǎn)品是通過各種技術(shù)的組合與疊加,對用戶體驗的全新升級。

小度機器人在百度的戰(zhàn)略地位是什么?

當我們聊起人機對話通常會想到的是圖靈測試,但事實上圖靈測試的目的是機器是否能夠具備人類思維,而小度的目的則是幫助人解決問題,這也與李彥宏的理念有關(guān),只專注能夠為人帶來真正價值的技術(shù)。

在百度所有申請的專利中,向媒體對外公布的專利只有兩個:第一是李彥宏創(chuàng)立百度時所用到的“超級文本鏈接”技術(shù),該技術(shù)是百度能夠走到今天的關(guān)鍵因素;而第二個公布的技術(shù)則是小度的人工智能專利,側(cè)面說明了小度對于百度的重要性。

而這種對于人工智能的重視并非停留在虛無縹緲的口頭層面,百度正在全面落實人工智能的落地應用。目前度秘已經(jīng)接入手機百度,而且還可能計劃接入百度地圖、百度糯米,多個平臺的用戶都可以通過向度秘起各種請求來完成所需要的服務,實現(xiàn)由點到面的整體性串聯(lián)。

回看小度的推出也是有其整體邏輯,百度屬于技術(shù)型驅(qū)動型公司,其核心是為用戶提供信息搜索服務,在PC時代還是移動時代,其努力的方向依然是讓用戶便捷獲取信息甚至服務,而未來的人工智能時代會將這種加速帶到全新的高度。

人工智能也是國家“互聯(lián)網(wǎng)+”戰(zhàn)略的一個重要組成部分,總理在今年3月6日的政府報告工作中第一次提到了將“互聯(lián)網(wǎng)+”放到國家戰(zhàn)略層面,而今年李彥宏也在兩會中提出“中國大腦”計劃,兩者不謀而合。而李彥宏也說百度這幾年正在專注的“百度大腦”也是“中國大腦”的迷你版,隨著未來計算能力的增加以及成本的降低,曾經(jīng)不能做不敢做的事情都將變成現(xiàn)實,未來的人工智能也將更加無處不在。

結(jié)語:

小度是一個綜合百度各方面人工智能技術(shù)的合體,代表著未來人工智能將人類生活由點到面連接的可能性,而現(xiàn)在的人工智能就在像當年的互聯(lián)網(wǎng)一樣,正在不知不覺的進入我們生活,至少,現(xiàn)在連總理也開始關(guān)心了。

#專欄作家#

承哲,微信公眾號:shouxifayanzhe,人人都是產(chǎn)品經(jīng)理專欄作家,關(guān)注工具產(chǎn)品和人工智能領(lǐng)域,擅長AXURE,興趣愛好看書,思考。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,不得轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 4年過去了,不知道小度進化的怎么樣了

    來自北京 回復
  2. 這算是軟文嗎,哈哈!

    來自廣東 回復
  3. 這算是軟文嗎,哈哈!

    來自湖北 回復