透過一段歷史,來回答我們?yōu)槭裁葱枰謾C(jī)AI
![](http://image.woshipm.com/wp-files/img/33.jpg)
現(xiàn)在,越來越多的廠商和開發(fā)者正在加入手機(jī)AI這一領(lǐng)域,越來越多的用戶也在關(guān)注手機(jī)AI。那我們?yōu)槭裁葱枰謾C(jī)AI?到底期待什么樣的AI體驗(yàn)?
我們已經(jīng)討論過很多有關(guān)手機(jī)AI的問題,半年過去,我們很高興看到越來越多的廠商和開發(fā)者加入這個(gè)大命題,越來越多的消費(fèi)者開始關(guān)注AI。同時(shí),移動(dòng)AI的相關(guān)平臺(tái)、解決方案和黑科技也在開枝散葉。
智能手機(jī)的歷史上,曾經(jīng)出現(xiàn)過很多令人激動(dòng)的時(shí)刻。而AI的加入,顯然正在醞釀下一個(gè)。
要知道,手機(jī)AI的出現(xiàn)和發(fā)展,并不僅僅完成了手機(jī)某部分的進(jìn)化。
在芯片、算法、開發(fā)平臺(tái),以及硬件、軟件、傳感設(shè)備等要素的協(xié)同進(jìn)化下,我們接下來很可能見證一場(chǎng),人與移動(dòng)設(shè)備共存方式的長(zhǎng)久改變。從攝影、游戲、翻譯這樣的手機(jī)固有功能,到旅行、商務(wù)、家庭這些與每個(gè)人密不可分的生活方式,都可能被手機(jī)AI帶來的沖擊所改變。
然而,在對(duì)未來滿懷好奇的時(shí)候,手機(jī)AI的相關(guān)賽道也開始出現(xiàn)擁堵,甚至混亂。很多“AI擦邊球”開始出現(xiàn),劣幣效應(yīng)若隱若現(xiàn),也不免讓心底泛起憂慮。
于是我們似乎應(yīng)該來回答一個(gè)問題:到底我們?yōu)槭裁葱枰謾C(jī)AI?手機(jī)AI又有哪些必要條件?
想要回答它,讓我們回到那久遠(yuǎn)的過去——幾個(gè)月之前。
“史”前時(shí)代:手機(jī)開始嘗試人工智能,以及遇到的問題
雖然手機(jī)AI,這件事大舉躍入公共視野,僅僅是幾個(gè)月之前的事。但恐怕我們想要搞明白這次相遇,還要再把時(shí)間倒回去一點(diǎn),也不多,七十年吧。
自1951年,會(huì)議確定了AI概念開始,學(xué)術(shù)界對(duì)人工智能運(yùn)算的期許,始終都可以總結(jié)成三件事:像人類一樣對(duì)話;用如同人類的眼鏡識(shí)別萬物;如人類一樣推理和思考。
為了這三個(gè)目標(biāo),計(jì)算機(jī)科學(xué)和數(shù)學(xué)界努力了幾十年。發(fā)明了從邏輯到專家系統(tǒng),再到機(jī)器學(xué)習(xí)的各種解決方案。
有意思的是,在智能手機(jī)徹底占領(lǐng)人類生活方式之后,這三個(gè)“小目標(biāo)”剛好能滿足手機(jī)下一步進(jìn)化的需求——對(duì)話操作??梢缘窒|屏操作中的不便、機(jī)器視覺技術(shù),可以讓手機(jī)的拍照、視頻和圖像處理更多元。而基于多元數(shù)據(jù)的機(jī)器學(xué)習(xí),可以讓手機(jī)開始理解用戶的習(xí)慣和需求。
從這個(gè)邏輯上看,智能手機(jī)的下一步幾乎肯定是AI。但怎么跨入AI的大門,對(duì)于手機(jī)產(chǎn)業(yè)來說卻并不是那么容易解決的問題。
其實(shí)早在移動(dòng)AI芯片出現(xiàn)之前,各種手機(jī)探索AI的方式已經(jīng)陸續(xù)誕生,或許這個(gè)可以稱為手機(jī)AI的“史前時(shí)代”。
比如說:蘋果手機(jī)一度以語音助手Siri掀起了浪潮,而Siri的不斷進(jìn)化,基本是靠AI的語音交互和語義理解能力來實(shí)現(xiàn)的。最早的Siri是個(gè)問答模板,而AI的加入讓ta不斷變得“聰明”起來。
再比如:蘋果手機(jī),很早開始探索的圖片識(shí)別和標(biāo)簽分類,也是利用了AI的圖像理解技術(shù)來實(shí)現(xiàn)。
在語音和圖像之外,AI理解用戶這件事也被嘗試了出來。
2016年,榮耀發(fā)布了榮耀magic,首次探索了利用AI技術(shù),主動(dòng)理解用戶信息,提供主動(dòng)服務(wù)。
除此之外,AI還隱藏在手機(jī)的更多角落。比如:很多雙攝解決方案中,都需要用AI的空間算法來優(yōu)化拍照效果。
但以上這些探索,卻不約而同遇到了問題:AI的神經(jīng)網(wǎng)絡(luò)和卷積運(yùn)算模式,不同于傳統(tǒng)的運(yùn)算和圖像處理任務(wù)。用CPU+GPU的傳統(tǒng)移動(dòng)運(yùn)算模式來處理比較吃力,還要大量耗能。
就像上文所說蘋果的圖像分類,由于讓手機(jī)識(shí)別圖像的運(yùn)算非常緩慢,必須要依托云計(jì)算來完成,所以蘋果選擇在夜晚進(jìn)行分類處理。對(duì)于用戶來說,這種隔一天才能完成的運(yùn)算當(dāng)然體驗(yàn)很差。
AI很好,但運(yùn)行AI很慢很耗電,在2017年之前差不多是手機(jī)產(chǎn)業(yè)的共識(shí)。
那么,解決方案是什么呢?
萌芽紀(jì)元:從AI芯片開始一切
差不多所有技術(shù)發(fā)展史上,關(guān)鍵節(jié)點(diǎn)的技術(shù)突破,都會(huì)成為撬動(dòng)整個(gè)行業(yè)的“勝負(fù)手”。燃油機(jī)之于輪船、汽車;交流電之于照明和電器設(shè)備,莫不如是。
對(duì)于手機(jī)AI來說,既然CPU、GPU來承擔(dān)復(fù)雜的AI計(jì)算任務(wù)不靠譜。那解決方案,當(dāng)然是單獨(dú)做一個(gè)基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的AI專項(xiàng)處理單元。
其實(shí)類似的云計(jì)算芯片解決方案已經(jīng)很多,但在2017年年中的時(shí)候,外界還是普遍不看好這類技術(shù)可以在移動(dòng)終端實(shí)現(xiàn)。
清楚記得去年7月,一位同行還跟我抬杠。他言之鑿鑿地告訴我,以他報(bào)道芯片十年的經(jīng)驗(yàn),AI移動(dòng)芯片五年內(nèi)都不可能出現(xiàn)。
好吧,最后打臉的不是我。
去年9月2日,華為率先發(fā)布了世界首款搭載AI任務(wù)專項(xiàng)處理能力的移動(dòng)芯片——麒麟970,它的最大特點(diǎn)顯然在于它在CPU、GPU兩個(gè)通用處理單元之外,加入了AI處理單元NPU(Neural?network?Processing Unit,神經(jīng)網(wǎng)絡(luò)單元)。
由于利用了深度學(xué)習(xí)處理技術(shù),NPU可以比其他處理模式,更快地處理卷積、遷移等深度學(xué)習(xí)任務(wù),也就可以達(dá)成更快的AI任務(wù)處理能力。
9月13日,蘋果在發(fā)布iPhone X時(shí)發(fā)布了A11芯片。
A11集成了一個(gè)專用于處理AI任務(wù)的運(yùn)算單元“神經(jīng)網(wǎng)絡(luò)引擎(Neural Engine)”,開啟了iPhone的AI之路。
隨后到了10月,華為發(fā)布了搭載麒麟970的旗艦機(jī)——華為mate10,在攝影、圖片識(shí)別和用戶服務(wù)幾個(gè)層面展開了AI攻勢(shì);而榮耀也緊隨其后,發(fā)布了搭載麒麟970的V10;剛剛發(fā)布的華為P20也以此為基礎(chǔ),創(chuàng)造了DxO攝像頭評(píng)測(cè)的分?jǐn)?shù)新高。
目前來看,華為、榮耀、蘋果的主流旗艦產(chǎn)品,在今年都會(huì)搭載AI專用芯片,并以此作為產(chǎn)品功能創(chuàng)新的基礎(chǔ),應(yīng)該已經(jīng)沒什么疑問。
此外,谷歌在pixel2中,使用了在攝像頭區(qū)域安裝專用圖像處,處理單元ImageProcessing Unit(IPU)的解決方案;三星則希望以新的語音交互功能,帶來AI體驗(yàn)。
整個(gè)移動(dòng)AI賽道開始變得多元,但有一個(gè)共識(shí),似乎已經(jīng)在這場(chǎng)比賽初期就達(dá)成了——專用的處理能力,是AI體驗(yàn)的基礎(chǔ)。
創(chuàng)生期的共識(shí):AI為什么需要終端計(jì)算?
無論是華為、蘋果還是谷歌,似乎都在一開始就認(rèn)定了,先有AI處理單元,而后有AI體驗(yàn)。
這到底是什么道理?直到現(xiàn)在,很多手機(jī)評(píng)測(cè)和分析還是沒有搞清。
讓我們舉個(gè)例子:應(yīng)該很多人都用過拍照識(shí)花功能,春天是個(gè)踏青的季節(jié),這功能在今天可謂正當(dāng)其時(shí)。但不妨回想一下,這個(gè)很有代表性的AI體驗(yàn),其實(shí)反應(yīng)非常慢。各種識(shí)花軟件都要等上一會(huì),假如網(wǎng)絡(luò)不好還要等更久。
這就是因?yàn)閳D像識(shí)別消耗算力較大,還要到云端進(jìn)行數(shù)據(jù)庫(kù)匹配,最終導(dǎo)致體驗(yàn)并不是瞬時(shí)的。
其實(shí),用CPU和GPU也都能處理AI任務(wù),就像單CPU也能處理圖像任務(wù)一樣,問題是缺乏針對(duì)性算力,會(huì)導(dǎo)致能耗過高和大量延遲。
假如是識(shí)花倒也還好,畢竟這么雅致的事值得等上一等,但假如是直播中進(jìn)行AI優(yōu)化與識(shí)別,高延遲加高耗電不就太過分了?
這就是通過AI處理單元,在終端完成AI任務(wù)處理的第一個(gè)原因:提高處理速度,達(dá)成實(shí)時(shí)化,低耗能,并能夠處理復(fù)雜的AI任務(wù)。
另一方面,最近Facebook的數(shù)據(jù)泄露事件,鬧得沸沸揚(yáng)揚(yáng)。而此前谷歌、蘋果也都有關(guān)于數(shù)據(jù)庫(kù)泄露的問題出現(xiàn)。
在AI時(shí)代,用戶把聲音、圖像和視頻上傳給系統(tǒng),完成識(shí)別與優(yōu)化已經(jīng)成為必然。但上傳到云端,把自己的數(shù)據(jù)交給一個(gè)遠(yuǎn)在天邊的服務(wù)器,似乎有些不妥。
拍個(gè)花花草草當(dāng)然還好了,但如果是自己與家人的照片和視頻,冒著隨時(shí)可能泄露的風(fēng)險(xiǎn),上傳到云端進(jìn)行AI處理,估計(jì)很多用戶都會(huì)選擇放棄。
這就是手機(jī)必須搭載AI處理單元的第二個(gè)原因:終端處理,保證安全。
當(dāng)然,云端訓(xùn)練機(jī)器,終端機(jī)器服務(wù)用戶的“云端一體化”思路是更加合理的。但終端AI處理能力,是整個(gè)AI服務(wù)閉環(huán)中不可或缺,但也是最難攻克的一環(huán)。
除了上述兩點(diǎn)之外,近半年的手機(jī)AI創(chuàng)生史中,還有一件事是值得大家思考的。
那就是我們到底期待什么樣的AI體驗(yàn)?
再舉個(gè)例子:在去年華為Mate10發(fā)布了場(chǎng)景化拍照模式之后,今天小米mix2S也發(fā)布了宣傳話術(shù)都近乎一樣的功能。
相信不久的將來,還會(huì)看到更多場(chǎng)景識(shí)別拍照,最終這將成為今年主流機(jī)型的標(biāo)配。
但AI真的只能如此雷同嗎?
回想一下喬布斯帶給智能手機(jī)的創(chuàng)意,最大的突破在于引入了APP模式,讓各種各樣的功能和體驗(yàn)進(jìn)入到同一部手機(jī)里。而AI原本應(yīng)該是更多元化,更多想象力的技術(shù)邏輯,怎么竟然變成了“天下是一家,抄我再抄他”?
開發(fā)一種AI算法很容易(模仿就更容易),讓各種各樣的AI功能百花齊放卻有點(diǎn)難。
而這就是AI需要在終端完成計(jì)算的第三個(gè)原因:通過硬件提供通用AI加速能力,引進(jìn)開發(fā)生態(tài)。
試想一下,假如手機(jī)AI算力支持,也不提供開放接口,只是自己搞了一些簡(jiǎn)單AI功能。那一個(gè)開發(fā)者即使想出來特別牛的AI創(chuàng)意,基本也于事無補(bǔ)。
是拿少數(shù)幾個(gè)AI功能,賭消費(fèi)者能否買賬,還是拿千萬開發(fā)者的創(chuàng)意能力,去賭AI生態(tài)的開花結(jié)果,顯然并不是特別難的選擇題。
所以,整個(gè)手機(jī)AI的從無到有,從蠻荒生長(zhǎng)到萌芽勃發(fā),基本可以看做是一個(gè)問題和一個(gè)回答:我們到底如何AI?
答案是:走最困難的路,搭建從芯片到平臺(tái),再到生態(tài)的邏輯閉環(huán)。
畢竟AI不是魔法,不能從空中結(jié)出果子。
作者:腦極體,微信公眾號(hào):腦極體
本文由 @腦極體 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash ,基于 CC0 協(xié)議
- 目前還沒評(píng)論,等你發(fā)揮!