小白懵懂人工智能 (1):淺談人臉識別這點事

4 評論 26315 瀏覽 86 收藏 13 分鐘

現(xiàn)在混在職場,如果不懂一點人工智能的知識都不敢說你跟上了時代。況且你還是一名產(chǎn)品經(jīng)理,技能之一就是八面玲瓏又要有求知的欲望,不斷地學習和吸收新的知識。誰能通俗的做個專業(yè)知識科普?又站在PM新人的角度思考和聊聊呢???

此文的目的?讀后能得到什么?

  1. 此文獻給不是AI產(chǎn)品經(jīng)理但是想了解一些人工智能知識的同學,想學專業(yè)方法論的請繞行。
  2. 讓你在茶余飯后閑談時,參加大咖的AI交流沙龍時,面試Ai公司準備資料時,更熟悉和從容。
  3. 我希望用小白最能懂的話解釋一些我們不懂的知識,因為我和你都是AI領域的修行者。

文章分為6個部分:

  1. 人工智能淺談
  2. 人臉識別是什么
  3. 人臉識別的產(chǎn)品實現(xiàn)路徑
  4. 國內(nèi)外比較出名的公司
  5. 人臉識別核心技術(shù)
  6. 人臉識別的應用分類和案例

一、人工智能淺談

人工智能今年被提的次數(shù)太多了,互聯(lián)網(wǎng)的幾個大風口有金融,AI,醫(yī)療,教育。

AI進入了很多的領域并讓大家熟識,從自動駕駛汽車,到智能客服機器人,再到智能家居。 你似乎可以讓任何商品(例如醫(yī)療健康藥柜,智能音箱,無人車等),通過人工智能的技術(shù)使其更加智能和有趣。

目前各類文章經(jīng)常提到人工智能的三個分類,有技術(shù)角度的,也有產(chǎn)品角度的。

在我理解,人工智能這類產(chǎn)品是技術(shù)驅(qū)動的產(chǎn)品,在百度,騰訊這樣的公司都有AI部門,很多PM每天都要面對大量的技術(shù)文檔和一些偏技術(shù)術(shù)語的資料,和傳統(tǒng)的pm的知識結(jié)構(gòu)差異很大。所以目前很多AI的產(chǎn)品經(jīng)理的職責和工作內(nèi)容還都很模糊和不確定。每個想干和已經(jīng)在干的AI公司都在各種摸索中。

每1個分類,我都整理了一句話,我覺得是比較易懂和有價值的金句。

技術(shù)角度的三個分類

在很多學術(shù)文章里面和進入到AI工作領域后,總會大量提到這些漢字和單詞。初學期慢慢來懂這些詞和事,我們先混個眼熟。大家記住技術(shù)儲備和技術(shù)人才在AI領域的地位。

  1. 認知AI (cognitive AI):認知計算是最受歡迎的一個人工智能分支,負責所有感覺“像人一樣”的交互。認知AI必須能夠輕松處理復雜性和二義性,同時還持續(xù)不斷地在數(shù)據(jù)挖掘、NLP(自然語言處理)和智能自動化的經(jīng)驗中學習。
  2. 機器學習AI (Machine Learning AI):機器學習是要在大數(shù)據(jù)中尋找一些“模式”,然后在沒有過多的人為解釋的情況下,用這些模式來預測結(jié)果。
  3. 深度學習(Deep Learning):深度學習是許多現(xiàn)代語音和圖像識別方法的基礎,并且與以往提供的非學習方法相比,隨著時間的推移具有更高的準確度。

產(chǎn)品角度的三個分類

人工智能的產(chǎn)品路徑也可分為三步或三類:

  1. 識別
  2. 判斷決策
  3. 創(chuàng)造生成

圖像識別,語音識別,人臉識別都屬于識別部分。人臉比對,活體判斷屬于判斷決策階段,最高階的是生成和創(chuàng)造階段,比如圖像語音合成,古詩詞自動作文。

在目前的發(fā)展階段,降峰pm覺得判斷和決策類的產(chǎn)品更有產(chǎn)品和商業(yè)價值。不但是識別還有結(jié)果判斷輸出,可以提高很多事情的效率。

人工智能的產(chǎn)品分為圖像,語音,自然語言,文字,用戶畫像等等很多方向。

一個AI平臺的架構(gòu)圖

你會發(fā)現(xiàn)里面的模塊很多。子業(yè)務線也很多。

今天我先整理一個子集,圖像領域的人臉識別方向。后續(xù)還有續(xù)集。

二、人臉識別是什么

在《速度與激情7》中就出現(xiàn)一個名為“天眼”的智能系統(tǒng),可隨時調(diào)用遍布城市的攝像機進行追蹤,通過面部特征迅速準確定位,發(fā)動全城圍捕。而《諜影重重》《國家公敵》等眾多電影中,都出現(xiàn)過用人臉識別技術(shù)進行快速身份鑒別等橋段。炫酷高科技經(jīng)常能把觀眾迷得不要不要的。

傳統(tǒng)的人臉識別技術(shù)主要是基于可見光圖像的人臉識別,已有30多年的研發(fā)歷史。但這種方式在環(huán)境光照發(fā)生變化時,識別效果會急劇下降。解決光照問題的方案有三維圖像人臉識別和熱成像人臉識別,但這兩種技術(shù)還遠不成熟,識別效果不盡人意。另外,基于主動近紅外圖像的多光源人臉識別技術(shù)迅速崛起,它可以克服光線變化的影響,在精度、穩(wěn)定性、速度方面的表現(xiàn)不俗。

如今,人臉識別在日常生活中的應用場景已非常寬泛。很多在安防和犯罪追捕方面有很多的案例。

例如:日本政府將人臉識別投入到2020年東京夏季奧運會的安全安保系統(tǒng)。

一句話總結(jié):人臉識別,是基于人的臉部特征信息進行身份識別的一種生物驗證技術(shù)。

三、人臉識別的產(chǎn)品實現(xiàn)路徑

1、人臉檢測 ,找到臉

人臉檢測與分析技術(shù),是人臉識別的第一步。是指對于任意一副給定的圖像,采用一定的策略對其進行搜索以確定其中是否含有人。

2、人臉對齊,找到五官位置

主要的目的就是在人臉區(qū)域進行特征點的定位,在人臉表情有變化,頭部有姿勢變化時仍能夠精確定位人臉的主要位置,例如:嘴巴,鼻子,眼睛等位置。

3、人臉校準和相似度度量,做判斷和決策

主要是1:1和1:N的識別問題,確認兩張人臉是不是一個人和海量圖片庫識別相似臉等問題。

簡單說人臉識別的基礎就是先從一張圖中識別出人臉位置,逐步把人臉上的特征點定位到,然后再做人臉校驗和人臉識別等事。

下圖這個案例就是一個人臉識別的效果:

檢測圖中的人臉,并為人臉標記出邊框。檢測出人臉后,可對人臉進行分析,獲得眼、口、鼻輪廓等72個關(guān)鍵點定位準確識別多種人臉屬性,如性別,年齡,表情等信息。

后面再給大家舉一些案例展開。

四、國內(nèi)外比較出名的公司

1、國內(nèi)知名公司

目前國內(nèi)的公司發(fā)展的很快,大家感興趣可以搜索如下一些網(wǎng)站獲取更多信息和免費體驗的資格。

每個公司的介紹就不一一寫了。人工智能這林子太大了,想把鳥都抓齊不現(xiàn)實。不分排名前后,歡迎補充。

(1)騰訊優(yōu)圖

(2)百度AI 天智平臺

天智是基于世界領先的百度大腦打造的人工智能平臺,提供了語音技術(shù)、文字識別、人臉識別、深度學習和自然語言NLP等一系列人工智能產(chǎn)品及解決方案,幫助各行各業(yè)的客戶打造智能化業(yè)務系統(tǒng)。

(3)曠視科技FACE++

美圖秀秀這款神器,一直搭載了曠視科技的人臉識別技術(shù):人臉關(guān)鍵點監(jiān)測、大規(guī)模人臉監(jiān)測等。

(4)漢王人臉識別

(5)云從科技 cloudwalk

(6)商湯科技SenseTime

(7)DeepGlint-格靈深瞳

(8)Linkface

(9)飛搜(FaceAll)科技

(10)科大訊飛

2、國外知名公司

除了國內(nèi)這幾家人臉識別公司之外,國外也有很多優(yōu)秀的公司,比如:

  • 美國Identix公司
  • 美國Bioscrypt公司
  • 德國Cognitec Systems公司
  • 西班牙Herta Secunty公司
  • 日本NEC公司
  • 日本Softwise公司

五、人臉識別核心技術(shù)

核心技術(shù)有6類,在某個角度看,也是識別的路徑步驟。

大家了解一下這些名詞:

  1. 人臉檢測跟蹤
  2. 五官關(guān)鍵點檢測
  3. 人臉像素解析
  4. 表情,膚色,種族,性別等元素識別
  5. 活體檢測和識別驗證
  6. 負責大量級的人臉檢測及檢索

大家還記得第三章的示意圖片么?里面就包含了前4個部分的結(jié)論。

降峰老師重點談下活體檢測。目前金融行業(yè)都在用活體檢測來進行風控識別能力的建設。我們在借款,付款時,會遇到讓你拍攝正面照圖片,再眨眨眼睛 搖搖頭這些動作,就是在進行活體檢測,證明你就是你,你是活的而不是圖片。防止欺詐。這個有機會單獨給大家將金融風控時單獨談。有很多檢驗的元素點和比對內(nèi)容。

六、人臉識別的應用分類和案例

目前應用的場景比較多。我們簡單列舉幾類:

  1. 人證比對
  2. 人臉驗證
  3. 人臉識別查找
  4. 人臉美化

一些場景

如果再設想一些場景,會有如下一些場景,很多都已經(jīng)實現(xiàn)了:

  1. 上班打卡 刷臉考勤,不用帶工卡,智能門禁
  2. 入駐酒店景區(qū),識別身份,給予VIp待遇。案例:烏鎮(zhèn)閘機
  3. 啟動汽車,無鑰匙進入
  4. 刷臉支付,不用帶卡帶手機,直接扣款支付。案例:百度錢包
  5. 多圖對比尋找唯一個體,比如100張王珞丹和100張白百合放在一起,找不同。

更多補充中。

如今2017年,人臉識別的識別率已經(jīng)很高了。這個技術(shù)怎么商業(yè)化、怎么玩將會被進一步挖掘。暗流涌動的割據(jù)戰(zhàn)現(xiàn)在正在拉開,安防、社交、金融的市場份額將鹿死誰手?我認為場景很豐富,玩法很多。

 

作者:降峰,十年產(chǎn)品人。百度金融資深產(chǎn)品經(jīng)理,原海南航空產(chǎn)品總監(jiān),目前從事互聯(lián)網(wǎng)金融方向產(chǎn)品設計和產(chǎn)品架構(gòu)工作。

本文由 @降峰 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 最近想轉(zhuǎn)AI PM,對人臉識別感興趣,文章寫得很好,解決了我一部分的疑惑,另外我想問一下你的微信是多少啊

    來自廣東 回復
    1. chanpinpeixun 公眾號

      回復
  2. 最近正好在了解這一塊,大贊

    來自上海 回復
    1. 感謝。歡迎轉(zhuǎn)發(fā),關(guān)注我的微信號。

      來自北京 回復