新“Siri”之戰(zhàn)開打,微軟、亞馬遜、OpenAI已入場(chǎng)

0 評(píng)論 3810 瀏覽 7 收藏 20 分鐘

“個(gè)人助理”因?yàn)橐恢鄙儆泄救刖郑瑢?dǎo)致大眾的使用體驗(yàn)也不是很好。但自從生成式AI大火之后,個(gè)人助理有了更多的可能性,紛紛吸引大公司入局。亞馬遜、微軟也發(fā)布了自己的AI助理。這篇文章,我們就來看下現(xiàn)在個(gè)人AI助理的具體情況。

新一代個(gè)人AI助理之戰(zhàn),終于打響了。

9月,三家公司發(fā)布了重要預(yù)告,標(biāo)志著這個(gè)節(jié)點(diǎn)的到來。這三家公司分別是亞馬遜、微軟和OpenAI。

亞馬遜在21日的秋季硬件發(fā)布會(huì)上宣布,“老牌”語(yǔ)音助理Alexa終于要升級(jí),融入大語(yǔ)言模型。新Alexa延遲更低,能理解上下文、記憶此前的對(duì)話、無(wú)需來回喚醒,而且還會(huì)越用越個(gè)性化。

同樣是在9月21日,微軟在美國(guó)紐約召開秋季發(fā)布會(huì),宣布自26日起將逐步給Windows11用戶推送系列更新,其中一個(gè)重要更新是人工智能助手Copilot。Copilot,正如其名“副駕駛”,要成為用戶的數(shù)字管家,將出現(xiàn)在Windows11的側(cè)邊欄,可以語(yǔ)音對(duì)話,允許用戶通過其控制PC上的設(shè)置、啟動(dòng)應(yīng)用程序,或是回答問題等。驅(qū)動(dòng)Copilot的是OpenAI目前最先進(jìn)的大語(yǔ)言模型GPT-4。

沒過幾天,25日,OpenAI突然放招,發(fā)布公告《ChatGPT現(xiàn)在能看、能聽、能說》,宣布將在未來兩周向付費(fèi)用戶推送多模態(tài)新功能。多模態(tài)ChatGPT將能基于圖片對(duì)話,并進(jìn)行實(shí)時(shí)語(yǔ)音對(duì)話。舉個(gè)例子就是,你打開冰箱拍張照,就可以和ChatGPT語(yǔ)音暢聊晚上吃點(diǎn)什么。結(jié)合ChatGPT已經(jīng)以App形式登陸安卓和iOS,相比于無(wú)所不知的“大明白”AI,此舉讓ChatGPT更具備個(gè)人助理的能力。

除了這三家正式宣布相關(guān)產(chǎn)品升級(jí)之外,谷歌在上個(gè)月被科技媒體Axios爆料,內(nèi)部郵件顯示,谷歌將利用最新的大語(yǔ)言模型技術(shù)對(duì)谷歌助手(Google Assistant)進(jìn)行全新改造。蘋果也被爆料已經(jīng)搭建好大語(yǔ)言模型的框架,在對(duì)地圖、Siri在內(nèi)的功能進(jìn)行改造。

科技巨頭在個(gè)人助理的戰(zhàn)場(chǎng)上廝殺,上一次出現(xiàn)這樣的場(chǎng)景還是在8年前:Alexa首次發(fā)布于2014年,搭載在亞馬遜智能音箱Echo產(chǎn)品中。也是在那一年,微軟也隨Windows系統(tǒng)推出語(yǔ)音助理Cortana,在中國(guó)大陸被稱為“小娜”;谷歌隨安卓4.1推出語(yǔ)音助理Google Now,也就是后來的谷歌助手Google Assistant。那是繼2011年蘋果隨iPhone 4S推出Siri之后,緊跟的三款來自科技巨頭的語(yǔ)音助理競(jìng)品,拉開了上一代語(yǔ)音助理混戰(zhàn)的序幕。

然而,最初引起大眾極大興趣的語(yǔ)音助理,近幾年已經(jīng)變成了智能終端必備、但人見人嫌的“人工智障”。隨著去年11月底OpenAI發(fā)布ChatGPT,流暢的對(duì)話讓上一代個(gè)人助理更加相形見絀。在ChatGPT發(fā)布前不久,Alexa被傳出虧損、裁員的消息,而在ChatGPT發(fā)布之后,微軟“殺死”了Cortana,在今年8月將其下線。

上一代個(gè)人助理之戰(zhàn)告一段落,新一代個(gè)人助理的戰(zhàn)爭(zhēng)已經(jīng)奏響號(hào)角。有了大語(yǔ)言模型技術(shù)的加持,這一次的故事會(huì)有不同嗎?

01

先讓我們官方給出的例子,看看亞馬遜Alexa、微軟Cortana和OpenAI的多模態(tài)ChatGPT是怎樣的存在。

接入大語(yǔ)言模型的Alexa,“機(jī)器人”味少了。用戶可以說得不直白,如“Alexa,我很冷”來讓Alexa開空調(diào),也可以很抽象,比如“讓這個(gè)房間看起來像XX球隊(duì)的顏色”。用戶還可以一次說多個(gè)指令,如“Alexa,打開噴頭,打開車庫(kù)門,關(guān)閉外部燈光”,Alexa就會(huì)識(shí)別并執(zhí)行這些任務(wù)。

此外,現(xiàn)在,用戶可以對(duì)Alexa說“Alexa,讓我們聊天吧”,接下來的對(duì)話中都不需要再叫Alexa的名字。并且Alexa會(huì)記住用戶的一些信息和偏好,不必每次都對(duì)TA做自我介紹。

在一條演示廣告中,用戶和Alexa進(jìn)入聊天模式。用戶想要舉辦一場(chǎng)派對(duì),讓Alexa推薦派對(duì)主題,然后再依據(jù)主題推薦合適的場(chǎng)地。當(dāng)用戶和Alexa商量好一切之后,用戶要求“給我的朋友發(fā)送下周五晚上8點(diǎn)的邀請(qǐng)郵件嗎,神秘一些”,Alexa便欣然答應(yīng),并閱讀以“你準(zhǔn)備好度過一個(gè)難忘的夜晚了嗎”開頭的郵件給用戶確認(rèn)。

比起過去每句話都要叫一聲“Alexa”、前后不能有連續(xù)、指令必須清晰明確的語(yǔ)音助手體驗(yàn),新Alexa的確“更像人”了。相信每一個(gè)使用智能家居的用戶,都受夠了變著法地試探怎么說才能讓“小X”和“精靈”們聽懂指令。

已經(jīng)被殺死的微軟Cortana,也就是我們熟悉的“小娜”,基本上和iPhone的Siri差不多。為你打開某個(gè)應(yīng)用、播放一首歌曲,或者回答你的問題(除了今天的日期和天氣之類的基礎(chǔ)問題外,基本上是給你顯示網(wǎng)頁(yè)搜索結(jié)果)。

而Copilot則更像一個(gè)實(shí)干型的助手。比如你可以要求Copilot幫你“整理桌面”,它就會(huì)把窗口平鋪排列;當(dāng)你瀏覽網(wǎng)頁(yè)的時(shí)候,可以呼出Copilot讓它幫你總結(jié)、解釋、重寫網(wǎng)頁(yè)的內(nèi)容;編寫文案、總結(jié)圖表更是不在話下。更有意思的是,Copilot還具備對(duì)圖片的處理能力,你可以在截圖后直接讓Copilot進(jìn)行去除背景、摳出人像等操作。

和升級(jí)后的Alexa一樣,Copilot的對(duì)話體驗(yàn)也更偏“人類”,你可以直接讓Copilot“播放讓我集中精力的歌”,它就會(huì)找到Spotify上的對(duì)應(yīng)歌單。

至于OpenAI的ChatGPT,也在轉(zhuǎn)向多模態(tài)之后變得更貼近生活。

前文已經(jīng)提到,你可以打開冰箱拍張照,和ChatGPT討論晚上吃什么。

在官方給出的另一個(gè)例子中,用戶給ChatGPT發(fā)送了一張自行車的照片,問它如何調(diào)低座椅。

ChatGPT提醒用戶查看車的型號(hào),確認(rèn)是有快拆桿還是用螺栓固定,并給出詳細(xì)步驟。用戶還是不明白,拍攝了座椅連接處的照片并圈出某部位,問這是不是快拆桿。

ChatGPT識(shí)別出這是螺栓,并建議用內(nèi)六角扳手。

用戶接著發(fā)難,拍攝了一張工具箱的照片,詢問ChatGPT哪一個(gè)是內(nèi)六角扳手,它也成功識(shí)別了出來。

除了日常生活中的問題解決外,由于具備語(yǔ)音功能,可以“說”的ChatGPT還可以給孩子講睡前故事。更有意思的是,當(dāng)你與人吵架,也可以把能聽會(huì)說的ChatGPT擺上來,幫你們梳理思路,解決爭(zhēng)論。

02

不過,不管是新Alexa,還是Copilot和多模態(tài)ChatGPT,都有一定的使用門檻。

Windows11操作系統(tǒng)內(nèi)置的Copilot目前沒有收費(fèi)的消息,應(yīng)該是免費(fèi)向用戶開放的,但是要等更新逐步推送。而在辦公套件Microsoft 365上,Copilot屬于高級(jí)訂閱功能,每月收費(fèi)30美元。

OpenAI的多模態(tài)ChatGPT僅向高級(jí)訂閱用戶開放,也就是ChatGPT Plus,每月20美元。

而新Alexa未來可能會(huì)收費(fèi)。在亞馬遜秋季發(fā)布會(huì)之后,彭博社采訪了即將離任的亞馬遜設(shè)備和服務(wù)部門副總裁大衛(wèi)·林普(David Limp),他表示亞馬遜“絕對(duì)”在考慮Alexa的訂閱模式。

林普拒絕討論Alexa若收費(fèi)的話定價(jià)會(huì)是多少,并表示“你今天所熟悉和喜愛的Alexa將保持免費(fèi)”,但為AI聊天機(jī)器人提供動(dòng)力并不便宜,他承認(rèn)“在云端進(jìn)行模型推理的成本是巨大的。”

剛開始打仗就想著怎么收費(fèi),這看似急功近利,實(shí)際上都是上一代個(gè)人助理之戰(zhàn)的血淚教訓(xùn)。

個(gè)人助理產(chǎn)品早就有,其中的代表是微軟在1995年就推出的微軟鮑勃(Microsoft Bob),彼時(shí)比爾·蓋茨(Bill Gates)還是微軟的CEO,在那一年首次登上《福布斯》全球富翁榜榜首。但現(xiàn)在回頭看,鮑勃顯得很臃腫:軟件顯示一座虛擬的房間,就像一間個(gè)人辦公室,角落里蹲著卡通狗助手,親切地問你需要什么幫助。

這條路沒有走通,僅一年,微軟就用Clippy代替了鮑勃,就是那個(gè)濃眉大眼的曲別針,熱心腸地想幫你做這做那(但什么都做不好),也不成功,是大家批評(píng)嘲笑的對(duì)象。

到了2011年,一切都改變了,蘋果推出iPhone 4S,“附贈(zèng)”的還有Siri——一個(gè)沒有實(shí)體形象,可以長(zhǎng)按Home鍵呼出的語(yǔ)音助理,可以幫你打開應(yīng)用,還能回答問題,甚至可以俏皮地給你講笑話,在當(dāng)時(shí)頗具“未來感”。

科技巨頭們聞風(fēng)而動(dòng)。在2014年,語(yǔ)音助理大爆發(fā),占據(jù)安卓的谷歌推出了Google Now(兩年后升級(jí)為谷歌助手Google Assistant),占據(jù)PC操作系統(tǒng)的微軟推出了Cortana,而亞馬遜干脆研發(fā)智能音箱設(shè)備,將Alexa塞了進(jìn)去。

電影《她》上映了,電影中男主人公和電腦操作系統(tǒng)的語(yǔ)音助手談戀愛,后者的配音是好萊塢著名演員“寡姐”斯嘉麗·約翰遜(Scarlett Johansson),而語(yǔ)音助手的界面像極了Cortana。電影上映后,《連線》雜志甚至報(bào)道有一些iPhone用戶認(rèn)為Siri似乎開始擁有“自我意識(shí)”。

到了2019年之前,各家陸續(xù)在更多端口搭載語(yǔ)音助手,谷歌、蘋果、微軟都推出了智能音箱設(shè)備,Alexa和Cortana還搞起了合作,可以在自家語(yǔ)音助手那里呼出對(duì)方,以實(shí)現(xiàn)更多功能。在國(guó)內(nèi),手機(jī)智能語(yǔ)音助手和智能音箱也開始涌現(xiàn),小度、小愛、天貓精靈等悉數(shù)登場(chǎng)。

然而,也是在這個(gè)階段,語(yǔ)音助手越來越普及,大眾對(duì)其的評(píng)價(jià)卻慢慢從充滿幻想,變?yōu)榱烁械绞?。在?guó)內(nèi),這些語(yǔ)音助手喜提“人工智障”稱號(hào)。人們?cè)诰W(wǎng)上發(fā)帖詢問“Cortana老自己彈出來,怎么關(guān)掉啊”,或是分享智能音箱怎么都聽不懂“關(guān)掉客廳的燈”的簡(jiǎn)單指令的短視頻。

以Siri為例,2018年Vetro Analytics的數(shù)據(jù)顯示,Siri的使用率為19.6%,依賴度僅為11%,每位用戶每月平均使用時(shí)長(zhǎng)只有短短14分鐘。

03

體驗(yàn)差,直接影響著語(yǔ)音助手產(chǎn)品的商業(yè)前景。

就在ChatGPT推出之前,2022年11月,媒體Business Insider報(bào)道,根據(jù)其獲得的內(nèi)部數(shù)據(jù),一季度亞馬遜Worldwide Digital部門運(yùn)營(yíng)虧損超過30億美元。這個(gè)部門包括從Echo智能音箱、Alexa語(yǔ)音技術(shù)到流媒體服務(wù)的所有內(nèi)容。而熟悉該部門的人士表示,這一虧損是亞馬遜所有業(yè)務(wù)部門中最大的,而且其中大部分損失都要?dú)w咎于Alexa。報(bào)道估計(jì),2022年該部門的虧損甚至?xí)_(dá)到100億美元。

Alexa的開局并不差,第一代Echo設(shè)備的銷量超過500萬(wàn)臺(tái)。但是其商業(yè)模式一直是個(gè)問題,所有的語(yǔ)音助手其實(shí)都有這個(gè)問題:提供了服務(wù),然后呢?2018年,亞馬遜預(yù)計(jì)2021你那每臺(tái)設(shè)備都將虧損5美元。

上一代語(yǔ)音助手并沒有很好的貨幣化舉措,再加上交互的體驗(yàn)并不好,Alexa期望可以將亞馬遜的電商服務(wù)融合進(jìn)去,但糟糕的體驗(yàn)無(wú)法支撐這個(gè)愿景,而頻繁地詢問用戶要不要買東西本身又在損害體驗(yàn)。用戶到頭來和語(yǔ)音助手間的大部分對(duì)話瑣碎而日常,如今天的天氣、日期、打開某個(gè)應(yīng)用等,而這并不能讓亞馬遜賺錢。

在裁員、虧損的消息傳出后,亞馬遜表示還是會(huì)大力發(fā)展Alexa,但是外界看不到什么新的可能。

ChatGPT的出現(xiàn),讓一切都不同了。

一方面是危機(jī),ChatGPT基于大語(yǔ)言模型的出色對(duì)話能力,讓大眾幾乎在第一時(shí)間就將之與上一代語(yǔ)音助手進(jìn)行對(duì)比,結(jié)論就是“太差了”。問題改變,上一代語(yǔ)音助手不思進(jìn)取、不上大模型,就有可能落后挨打,即便是蘋果和谷歌也得忌憚這種可能性。

除了谷歌在今年8月被傳出要用大語(yǔ)言模型升級(jí)谷歌助手以外,蘋果也有類似的傳聞。今年7月,名記馬克·古爾曼(Mark Gurman)爆料,蘋果已經(jīng)完成了其大語(yǔ)言模型的基礎(chǔ)框架,被稱為“Ajax”,定位為支持對(duì)話式AI系統(tǒng),并已經(jīng)將其應(yīng)用在地圖、Siri等功能上,做人工智能改進(jìn)。

而在科技巨頭動(dòng)作之前,早就有各種整合了大模型的個(gè)人助理第三方應(yīng)用出現(xiàn)。如今年6月,就有人“復(fù)活”了微軟鮑勃,使用的是GPT-3.5模型,在微軟商店上架。

另一方面是機(jī)遇。以亞馬遜Alexa為代表的智能生態(tài)想象,如今在5G加持、大模型支撐之下,實(shí)現(xiàn)的可能性前所未有得大。

本次秋季發(fā)布會(huì),亞馬遜在宣布Alexa將全面升級(jí)之時(shí),也已經(jīng)勾勒出了廣闊的前景:亞馬遜將大語(yǔ)言模型注入200多個(gè)智能家居API,為Alexa提供更主動(dòng)無(wú)縫管理智能家居所需的背景信息。同時(shí),亞馬遜要推出工具,允許Alexa控制第三方產(chǎn)品的某些功能,后者無(wú)需在智能家居生態(tài)系統(tǒng)的工具包中。亞馬遜表示,已經(jīng)和通用電氣、飛利浦、小米、iRobot等合作開發(fā)這些功能。

但現(xiàn)在要面臨的新挑戰(zhàn)也是10年前所沒有的,AI對(duì)于個(gè)人隱私和數(shù)據(jù)安全的威脅正在被重視。不管是新Alexa、Copilot還是多模態(tài)ChatGPT,在向個(gè)性化助理的方向進(jìn)發(fā)時(shí),將不可避免地觸及這一問題。目前,新Alexa發(fā)布,亞馬遜將利用用戶與Alexa的語(yǔ)音交互來訓(xùn)練模型的消息已經(jīng)在被討論。

“誰(shuí)贏得了個(gè)人代理,那就是一件大事。因?yàn)槟銓⒃僖膊粫?huì)去搜索網(wǎng)站或去生產(chǎn)力網(wǎng)站,你再也不會(huì)去亞馬遜(購(gòu)物)?!痹诮衲?月的一場(chǎng)活動(dòng)上,比爾·蓋茨如是預(yù)測(cè)。

問題是,究竟會(huì)是誰(shuí)贏下這場(chǎng)戰(zhàn)爭(zhēng)呢?亦或是像上一代語(yǔ)音助手之戰(zhàn)一樣,轟轟烈烈之后沒有贏家。

參考資料:

1、IT之家:《“大眼夾”重生,變身 ChatGPT 聊天機(jī)器人》

2、智東西:《昨夜微軟與亞馬遜“聯(lián)姻” 還拋出5道AI殺手锏》

3、金融界:《從“全村的希望”到“大裁員”,亞馬遜是如何摧毀Alexa 的?》

4、鈦媒體:《智能手機(jī)之爭(zhēng)的下半場(chǎng):語(yǔ)音助手之戰(zhàn)》

作者:畢安娣,編輯:王靖

來源公眾號(hào):字母榜(ID:wujicaijing),讓未來不止于大。

本文由人人都是產(chǎn)品經(jīng)理合作媒體@字母榜 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!