Face++云服務(wù)平臺產(chǎn)品負責人:AI如何助力行業(yè)智能化

1 評論 4332 瀏覽 32 收藏 19 分鐘

算法,是否可行?行業(yè),是否認可?決定了,是否可以做?用戶場景是什么,決定了是否值得做?能否給現(xiàn)有行業(yè)的核心玩家?guī)硐鄳?yīng)的價值,且價值可否去復(fù)用,這是判斷是否有價值并且可持續(xù)。邊界、場景、價值,這是在AI落地行業(yè)實踐中需要不斷考量的三大核心要點。

本文是AI獨角獸公司Face++云服務(wù)平臺產(chǎn)品負責人劉楊洋在起點學(xué)院的分享實錄,嘉賓分享視頻已經(jīng)在起點社員頻道上架,限時免費觀看,詳情請戳:視頻鏈接

內(nèi)容經(jīng)編輯整理,部分有修改:

 

一、什么是人工智能?

最近,特別是這兩年開始,AI和區(qū)塊鏈可以說是互聯(lián)網(wǎng)最大的風口,連詐騙集團都學(xué)會用這兩個詞忽悠了。如果你這個公司沒有左手“區(qū)塊鏈”,右手“AI”,你都不好意思說自己是高科技的公司。

那么說到底,什么是人工智能?

講這個概念之前,我們先說說什么是智能。

其實,智能是個體的一個行為閉環(huán)——大家都是智能的生物,每天都會經(jīng)歷無數(shù)次這樣的閉環(huán)。

比如:

今天出門,穿著睡衣頂著加了三天班的憔悴面貌去買菜,結(jié)果一出門就看到前任挽著他的現(xiàn)任光鮮亮麗地從遠處走過來了。這個時候我們首先感知到了這件事情,緊接著就會認知到這個非常尷尬的境地,那么接下來我們就要做決策:究竟是趕快找個地縫躲起來,還是干脆打暈前任,并且把這個決策付諸實踐(就是執(zhí)行)?執(zhí)行過后就會學(xué)到:你總是會在最不想見的時候見到你的前任——多么痛的領(lǐng)悟!

這是一個最簡單的智能個體閉環(huán)。

當然,這只是個體;真正的智能生物還要涉及到和其他個體,或者說整個社會的博弈、合作,這種整體的閉環(huán)叫智能。所以,人工智能學(xué)科,據(jù)官方定義應(yīng)該是:

創(chuàng)造可以自主地進行感知、認知、執(zhí)行、決策、學(xué)習的閉環(huán);并且可以和其他(符合社會的核心價值觀)的個體進行交互,這就是人工智能。

我們傳統(tǒng)的系統(tǒng),主要的功效是在影響我們(這個智能體)的閉環(huán)。有的是希望影響感知,比如蛋糕都想做好看一點;有的是希望影響決策,比如降價等等;而人工智能系統(tǒng),最終的目標就是自身可以實現(xiàn)這樣的閉環(huán)。

1. 舉兩個案例

(1)鸚鵡學(xué)舌

這應(yīng)該是現(xiàn)在基本上在應(yīng)用的所謂人工智能階段。

我教一只鸚鵡說“你好!”,它會說“你好!”然后問“你吃了嗎?”它只會回“你吃了嗎?”,而不會回兩條蟲——這只是目前階段鸚鵡學(xué)舌。

當我問:你吃了嗎?鸚鵡會做一些語義分析(它內(nèi)部的AI系統(tǒng)),再返回說我吃了兩條蟲——這才是相對智能。

(2)烏鴉吃果

這個視頻非常的出名。

烏鴉是一種很聰明的生物,一些烏鴉和海鷗在海邊吃貝殼吃不到怎么辦?它會把貝殼叼到很高的地方,貝殼摔下來之后再吃。貝殼是很堅硬的東西,所以它觀察馬路上的汽車會把這些堅硬的東西壓下去去吃。這時候出現(xiàn)問題的是:馬路上太危險,萬一車過來出現(xiàn)車禍怎么辦?它們觀察綠燈的時候車是川流不息,紅燈的時候車會停下來。所以它們后來學(xué)會叼堅硬的東西往路上放,等到紅燈的時候再去吃——所以它是形成了完整的閉環(huán)。

鳥類其實是非常聰明的。

最近看一個報道說,在澳大利亞有一種猛禽。它甚至會去偷人類的火種,偷完火種之后往荒野上一放;發(fā)生火災(zāi),那些小動物就會跑出來,它就會吃那些小動物——我覺得它應(yīng)該也是有這樣的長期觀察,得到了一個方法。

所以,這樣兩個案例,我覺得烏鴉吃果或者是這樣的人工智能,最終是希望能夠做出這樣的機器或者說這樣的一個系統(tǒng)。

二、人工智能包含哪些東西?

包含這幾樣:

  1. 計算機視覺,現(xiàn)在非常火,包括我們公司主要是做這個。人臉識別、圖像識別和模式識別都包括在這里邊。
  2. 自然語言理解與交流,就是科大訊飛一直專精的語義理解這個方面。
  3. 認知和推理,這是另外一個方向,比如知識圖譜、社會倫理學(xué)這樣的一些東西。
  4. 機器人學(xué),怎么去創(chuàng)建一些機器,包括任務(wù)的系統(tǒng),路線的規(guī)劃,機器人的控制等這一系列的東西。
  5. 博弈與理論,個體之間是如何的競爭和合作?包括研究如何符合人類的核心價值觀,人工智能和人類如何一起和平的共存等等。

最后其實是研究上面的工具,比較火的深度學(xué)習、無監(jiān)督學(xué)習都包含在這里邊,統(tǒng)稱叫機器學(xué)習,它是研究數(shù)據(jù)的統(tǒng)計、建模的方法。

三、從產(chǎn)品角度看,哪些屬于人工智能?

  • 認知:是指收集信息和解析信息來感知世界,比如圖片識別、語音識別、自然語言處理等;
  • 預(yù)測:是指通過計算,來預(yù)測行為和結(jié)果。比如廣告推薦,歌曲推薦等;
  • 決策:是指確定實現(xiàn)的方式和路徑,比如移動路線規(guī)劃、自動買賣股票等;
  • 集成解決方案:是指人工智能和其他技術(shù)結(jié)合時,產(chǎn)生的多種集成解決方案,比如和汽車結(jié)合就是無人駕駛,和醫(yī)療器械結(jié)合就是手術(shù)機器人。

四、AI在手機行業(yè)的落地實踐

我們判斷一個技術(shù)能不能在行業(yè)落地,最重要的是能不能達到超越價值線的價值,并且可以有一定的門檻,可以持續(xù)地發(fā)展。

以手機行業(yè)為例,為什么選擇手機?

首先,計算機視覺本質(zhì)是賦能各種各樣的攝像頭,而在現(xiàn)在的社會里邊最重要的攝像頭就是手機,每個人的手機上至少有兩個,未來會有三個、四個,短暫地時間里邊個數(shù)不會減少,只會增多,這是最重要的“戰(zhàn)場”。

其次,手機它是一個比較有價值,是高價值的行業(yè)。我們能夠在很多方面發(fā)力,比如安全領(lǐng)域,常見的刷臉解鎖/刷臉支付。

從手機誕生的那一天或者說電腦誕生那一天開始就會有數(shù)字密碼。上世紀開始基于生物特征的安全越來越受到大家的喜歡,我們在做之前其實內(nèi)部有個分析,為什么刷臉現(xiàn)在可以做?我們的優(yōu)勢在哪里?

最主要的因素是工業(yè)設(shè)計和制造工藝的提升。今年的全面屏成為工業(yè)設(shè)計上的主流趨勢,大指紋設(shè)計挪到了手機背面,指紋的用戶體驗優(yōu)勢降低了。人臉不僅彌補了體驗上的不足,更重要的是:人臉只需要攝像頭就可以完成,不需要像指紋一樣占用更多屏幕面積,所以能夠大大提高屏占比。

第二個是芯片處理能力的提升與人臉識別算法的成熟。一些硬件層的加速方案可以讓人臉識別的算法能在手機上跑得更快,新的活體技術(shù)可以讓刷臉變得更安全。

第三個原因是攝像頭模組制造工藝的突破。其實結(jié)構(gòu)光在幾年前就有了,但是并沒有小型化到手機這么小的體積內(nèi),iPhone 是第一家推出這樣設(shè)備的廠商。除了結(jié)構(gòu)光之外,還包括普通的紅外IO攝像頭、TOF攝像頭、攝像頭模組的小型化。

除此之外就是成本和收益問題:如果廠商想要在手機那么小的空間內(nèi)裝一個指紋模組、虹膜模組,所要犧牲的手機內(nèi)部空間占用;換句話說:所需要的成本是巨大的,而人臉識別不會占用除攝像頭模組外更多的內(nèi)部空間。

用戶體驗更好,大家在刷臉解鎖的過程中不需要做任何的配合式操作,可以拿起手機直接解鎖。而刷臉還可以抵抗一些常見的干擾,例如暗光、側(cè)臉、小范圍遮擋等。這讓刷臉成為一種體驗更優(yōu)的生物識別方案。

五、AI在教育/營銷/制造業(yè)等行業(yè)的落地實踐

說完手機,我們再講一講其他的行業(yè)。

1. 汽車

比如汽車。

汽車主要的切入點是讓汽車更了解它的用戶,包括駕駛員他是誰,根據(jù)他的情況去調(diào)整一些座椅、后視鏡,各種音樂這樣的設(shè)置。還有就是:你有沒有遺留一些物體,或者是遺留一些小孩或者是遺留一些寵物在車上?

主要的切入點是:讓汽車能夠更了解它的用戶。

2. 教育

教育,這方面是兩塊:

一塊是讓老師更了解學(xué)生,可以通過視覺的方式來了解學(xué)生學(xué)得到底認不認真,開不開心,課堂質(zhì)量怎么樣,反饋提升老師的教育質(zhì)量;

第二塊是有一些手勢、貼紙、特效,更豐富教育的方法的嘗試;第三個其實就是校園安全監(jiān)控,保護孩子在學(xué)校的安全等等。

3. 營銷

營銷,營銷這塊的主要切入點是幫助找到更精準的一些客戶,年齡、性別這些,然后找到客戶之后,可以分析看看營銷效果怎么樣?

舉一個廣告牌,發(fā)現(xiàn)是女生,給他推化妝品——她看沒看?看了多久?有沒有拿出手機來掃?表情什么樣?這些其實都可以做。

去年比較火的軍裝照、換臉這些東西,它也是營銷的一種新的方式;也許以后是換個身體,拍下照可能是施瓦辛格的身體,臉變成貝克漢姆,大概是這樣的營銷。

4. 制造業(yè)

制造業(yè),主要是異常的檢測和報警。比如拉鏈到底是不是壞的,還有沒有起火、煙霧這樣的一些預(yù)警。

第二塊是正常的保證:該入庫的是不是入庫,該進行的程序有沒有做?

但是無論如何,在這幾個行業(yè)想要有長足的發(fā)展,還是需要深耕,需要對行業(yè)本來就很了解的人和我們一起發(fā)力;能夠在計算機視覺給這些行業(yè)賦予所謂的超越價值線,也就是高價值,看能不能有一些更深入的合作。

六、AI落地行業(yè)的核心思路:場景、邊界、價值

最后總結(jié)一下行業(yè)的落地思路,或者說怎么確保AI這些東西能不能做。

1. 邊界

第一,人眼的邊界。這其實是一個技術(shù)問題,就是這個東西是否已經(jīng)跨越了人眼的識別邊界,這是否是一個計算機視覺能夠解決的需求。

第二,算法可行性。舉一個很簡單的例子,比如把手張開,也許我的朋友跟我說是你好!也許我家的貓看見說我要打它。但是算法只是說你只是把手舉起來,到底是干嘛算法是不知道的。所以算法到目前為止是沒有推理作用。

還有就是寬域到窄域的預(yù)設(shè),這其實就是一個場景的預(yù)先規(guī)劃,以及對訓(xùn)練數(shù)據(jù)的要求——因為我們現(xiàn)在所說的算法訓(xùn)練,都指的是監(jiān)督式學(xué)習。

什么叫監(jiān)督式學(xué)習呢?

比如說我看的都是中國人,你突然給我一個黑人,也許我就識別不出來了;以前有個人做了識別健身房啞鈴,做得非常好,每一個人拍一張照都能識別出啞鈴,后來有一天沒有人手出現(xiàn)拍了一張啞鈴,它就識別不出來?;厝グl(fā)現(xiàn)所有訓(xùn)練的數(shù)據(jù)都是人舉著一個啞鈴,它把手和啞鈴識別到一起了——所以,要想達到必須沒有推理性的,有推理性的人來告訴它,它才能進行相應(yīng)的訓(xùn)練。

第二是數(shù)據(jù)要有一定的量,并且盡可能的覆蓋使用場景的數(shù)據(jù)。

第三是行業(yè)的邊界,這是到底決定價值線在哪兒。

俞軍老師的著名理論:

產(chǎn)品價值=(新體驗-舊體驗)+替換成本

這里邊有一個可以分享案例:

AI做醫(yī)療現(xiàn)在都很火,比如說通過一張片認定你有沒有得肺結(jié)節(jié)、乳腺癌這種的。之前中國醫(yī)學(xué)界泰斗級別的一位老師,在他眼里,中國可能有資格識別肺結(jié)節(jié)的只有不到四五百人,但是,這部分人的識別準確度也只是在85%左右——實際上,他們識別出來之后,還要去做病理切片,做各種病理測試,才能夠最終確定這個人到底有沒有這樣的病。

一開始,需求只要超過85%,是不是就可以了呢?反問過來想,這個東西到底誰可以買單?是用戶來買單還是醫(yī)院來買單?用戶為什么去醫(yī)院看?我是不是能夠提升醫(yī)生的效率。

2. 場景

你要值得做就考慮場景。

用戶的場景是什么?我們都說一個攝像頭,拍一張圖片去識別,或者是一個視頻去識別;那么識別的角度、識別的距離,包括我要求識別的時間、底庫等等,這些就也關(guān)系到算法適用的范圍。對應(yīng)我的產(chǎn)品形態(tài)是SDK還是API,用在什么架構(gòu)上,這是整個方案的設(shè)計。

算法的場景,算法在哪兒跑?它需要什么樣的性能?它要達到多少的概率?它要覆蓋多少的范圍?這就是算法需要考慮的場景。

最后是涉及到行業(yè)的場景,到底能不能為這個行業(yè)賦能?

我說,我這個可以達到100%肯定是沒有問題的,但是醫(yī)院說也許就是不能用,我們這邊的醫(yī)生都是有什么證之類的,你這個機器有證能證明自己嗎?錯了誰來買單?——其實會面臨很多這樣復(fù)雜的問題。

3. 價值

關(guān)于行業(yè)的賦能,我們要考慮的更多。

現(xiàn)在是否是進入這個行業(yè)的好時機,基礎(chǔ)是否已經(jīng)具備了,能不能給現(xiàn)在行業(yè)的核心玩家?guī)硐鄳?yīng)的價值,并且這個價值可否去復(fù)用,有沒有足夠的門檻。最后才來判斷到有沒有超出這樣的價值線,并且是否可持續(xù)。

 

嘉賓:劉楊洋,F(xiàn)ace++云服務(wù)平臺產(chǎn)品負責人,先后任職于滴滴、京東等互聯(lián)網(wǎng)公司,負責平臺增長與創(chuàng)新等工作?,F(xiàn)負責Face++人工智能開放平臺產(chǎn)品能力建構(gòu),專注于AI能力面向各行業(yè)用戶的場景實踐。

本文為起點學(xué)院嘉賓分享整理總結(jié),未經(jīng)本站許可,禁止轉(zhuǎn)載。謝謝合作

題圖來自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 想跟著BAT大咖老師學(xué)習更多系統(tǒng)高階產(chǎn)品知識嗎?
    在【產(chǎn)品總監(jiān)修煉之道】,四位來自騰訊、百度的資深總監(jiān)級導(dǎo)師,將和你面對面分享高階產(chǎn)品必備的系統(tǒng)知識,幫你掌握更加全面的產(chǎn)品專業(yè)知識和團隊管理思路……

    想了解更多詳情?立即戳>>http://996.pm/z4bLB
    也快可以聯(lián)系KK進行咨詢哦~微信/TEL:13043462422

    PS:除了咨詢問題,還能領(lǐng)取【產(chǎn)品總監(jiān)課程學(xué)習筆記】! ??

    來自廣東 回復(fù)