小白懵懂人工智能 (1):淺談人臉識別這點事
現(xiàn)在混在職場,如果不懂一點人工智能的知識都不敢說你跟上了時代。況且你還是一名產(chǎn)品經(jīng)理,技能之一就是八面玲瓏又要有求知的欲望,不斷地學習和吸收新的知識。誰能通俗的做個專業(yè)知識科普?又站在PM新人的角度思考和聊聊呢???
此文的目的?讀后能得到什么?
- 此文獻給不是AI產(chǎn)品經(jīng)理但是想了解一些人工智能知識的同學,想學專業(yè)方法論的請繞行。
- 讓你在茶余飯后閑談時,參加大咖的AI交流沙龍時,面試Ai公司準備資料時,更熟悉和從容。
- 我希望用小白最能懂的話解釋一些我們不懂的知識,因為我和你都是AI領域的修行者。
文章分為6個部分:
- 人工智能淺談
- 人臉識別是什么
- 人臉識別的產(chǎn)品實現(xiàn)路徑
- 國內(nèi)外比較出名的公司
- 人臉識別核心技術(shù)
- 人臉識別的應用分類和案例
一、人工智能淺談
人工智能今年被提的次數(shù)太多了,互聯(lián)網(wǎng)的幾個大風口有金融,AI,醫(yī)療,教育。
AI進入了很多的領域并讓大家熟識,從自動駕駛汽車,到智能客服機器人,再到智能家居。 你似乎可以讓任何商品(例如醫(yī)療健康藥柜,智能音箱,無人車等),通過人工智能的技術(shù)使其更加智能和有趣。
目前各類文章經(jīng)常提到人工智能的三個分類,有技術(shù)角度的,也有產(chǎn)品角度的。
在我理解,人工智能這類產(chǎn)品是技術(shù)驅(qū)動的產(chǎn)品,在百度,騰訊這樣的公司都有AI部門,很多PM每天都要面對大量的技術(shù)文檔和一些偏技術(shù)術(shù)語的資料,和傳統(tǒng)的pm的知識結(jié)構(gòu)差異很大。所以目前很多AI的產(chǎn)品經(jīng)理的職責和工作內(nèi)容還都很模糊和不確定。每個想干和已經(jīng)在干的AI公司都在各種摸索中。
每1個分類,我都整理了一句話,我覺得是比較易懂和有價值的金句。
技術(shù)角度的三個分類
在很多學術(shù)文章里面和進入到AI工作領域后,總會大量提到這些漢字和單詞。初學期慢慢來懂這些詞和事,我們先混個眼熟。大家記住技術(shù)儲備和技術(shù)人才在AI領域的地位。
- 認知AI (cognitive AI):認知計算是最受歡迎的一個人工智能分支,負責所有感覺“像人一樣”的交互。認知AI必須能夠輕松處理復雜性和二義性,同時還持續(xù)不斷地在數(shù)據(jù)挖掘、NLP(自然語言處理)和智能自動化的經(jīng)驗中學習。
- 機器學習AI (Machine Learning AI):機器學習是要在大數(shù)據(jù)中尋找一些“模式”,然后在沒有過多的人為解釋的情況下,用這些模式來預測結(jié)果。
- 深度學習(Deep Learning):深度學習是許多現(xiàn)代語音和圖像識別方法的基礎,并且與以往提供的非學習方法相比,隨著時間的推移具有更高的準確度。
產(chǎn)品角度的三個分類
人工智能的產(chǎn)品路徑也可分為三步或三類:
- 識別
- 判斷決策
- 創(chuàng)造生成
圖像識別,語音識別,人臉識別都屬于識別部分。人臉比對,活體判斷屬于判斷決策階段,最高階的是生成和創(chuàng)造階段,比如圖像語音合成,古詩詞自動作文。
在目前的發(fā)展階段,降峰pm覺得判斷和決策類的產(chǎn)品更有產(chǎn)品和商業(yè)價值。不但是識別還有結(jié)果判斷輸出,可以提高很多事情的效率。
人工智能的產(chǎn)品分為圖像,語音,自然語言,文字,用戶畫像等等很多方向。
一個AI平臺的架構(gòu)圖
你會發(fā)現(xiàn)里面的模塊很多。子業(yè)務線也很多。
今天我先整理一個子集,圖像領域的人臉識別方向。后續(xù)還有續(xù)集。
二、人臉識別是什么
在《速度與激情7》中就出現(xiàn)一個名為“天眼”的智能系統(tǒng),可隨時調(diào)用遍布城市的攝像機進行追蹤,通過面部特征迅速準確定位,發(fā)動全城圍捕。而《諜影重重》《國家公敵》等眾多電影中,都出現(xiàn)過用人臉識別技術(shù)進行快速身份鑒別等橋段。炫酷高科技經(jīng)常能把觀眾迷得不要不要的。
傳統(tǒng)的人臉識別技術(shù)主要是基于可見光圖像的人臉識別,已有30多年的研發(fā)歷史。但這種方式在環(huán)境光照發(fā)生變化時,識別效果會急劇下降。解決光照問題的方案有三維圖像人臉識別和熱成像人臉識別,但這兩種技術(shù)還遠不成熟,識別效果不盡人意。另外,基于主動近紅外圖像的多光源人臉識別技術(shù)迅速崛起,它可以克服光線變化的影響,在精度、穩(wěn)定性、速度方面的表現(xiàn)不俗。
如今,人臉識別在日常生活中的應用場景已非常寬泛。很多在安防和犯罪追捕方面有很多的案例。
例如:日本政府將人臉識別投入到2020年東京夏季奧運會的安全安保系統(tǒng)。
一句話總結(jié):人臉識別,是基于人的臉部特征信息進行身份識別的一種生物驗證技術(shù)。
三、人臉識別的產(chǎn)品實現(xiàn)路徑
1、人臉檢測 ,找到臉
人臉檢測與分析技術(shù),是人臉識別的第一步。是指對于任意一副給定的圖像,采用一定的策略對其進行搜索以確定其中是否含有人。
2、人臉對齊,找到五官位置
主要的目的就是在人臉區(qū)域進行特征點的定位,在人臉表情有變化,頭部有姿勢變化時仍能夠精確定位人臉的主要位置,例如:嘴巴,鼻子,眼睛等位置。
3、人臉校準和相似度度量,做判斷和決策
主要是1:1和1:N的識別問題,確認兩張人臉是不是一個人和海量圖片庫識別相似臉等問題。
簡單說人臉識別的基礎就是先從一張圖中識別出人臉位置,逐步把人臉上的特征點定位到,然后再做人臉校驗和人臉識別等事。
下圖這個案例就是一個人臉識別的效果:
檢測圖中的人臉,并為人臉標記出邊框。檢測出人臉后,可對人臉進行分析,獲得眼、口、鼻輪廓等72個關(guān)鍵點定位準確識別多種人臉屬性,如性別,年齡,表情等信息。
后面再給大家舉一些案例展開。
四、國內(nèi)外比較出名的公司
1、國內(nèi)知名公司
目前國內(nèi)的公司發(fā)展的很快,大家感興趣可以搜索如下一些網(wǎng)站獲取更多信息和免費體驗的資格。
每個公司的介紹就不一一寫了。人工智能這林子太大了,想把鳥都抓齊不現(xiàn)實。不分排名前后,歡迎補充。
(1)騰訊優(yōu)圖
(2)百度AI 天智平臺
天智是基于世界領先的百度大腦打造的人工智能平臺,提供了語音技術(shù)、文字識別、人臉識別、深度學習和自然語言NLP等一系列人工智能產(chǎn)品及解決方案,幫助各行各業(yè)的客戶打造智能化業(yè)務系統(tǒng)。
(3)曠視科技FACE++
美圖秀秀這款神器,一直搭載了曠視科技的人臉識別技術(shù):人臉關(guān)鍵點監(jiān)測、大規(guī)模人臉監(jiān)測等。
(4)漢王人臉識別
(5)云從科技 cloudwalk
(6)商湯科技SenseTime
(7)DeepGlint-格靈深瞳
(8)Linkface
(9)飛搜(FaceAll)科技
(10)科大訊飛
2、國外知名公司
除了國內(nèi)這幾家人臉識別公司之外,國外也有很多優(yōu)秀的公司,比如:
- 美國Identix公司
- 美國Bioscrypt公司
- 德國Cognitec Systems公司
- 西班牙Herta Secunty公司
- 日本NEC公司
- 日本Softwise公司
五、人臉識別核心技術(shù)
核心技術(shù)有6類,在某個角度看,也是識別的路徑步驟。
大家了解一下這些名詞:
- 人臉檢測跟蹤
- 五官關(guān)鍵點檢測
- 人臉像素解析
- 表情,膚色,種族,性別等元素識別
- 活體檢測和識別驗證
- 負責大量級的人臉檢測及檢索
大家還記得第三章的示意圖片么?里面就包含了前4個部分的結(jié)論。
降峰老師重點談下活體檢測。目前金融行業(yè)都在用活體檢測來進行風控識別能力的建設。我們在借款,付款時,會遇到讓你拍攝正面照圖片,再眨眨眼睛 搖搖頭這些動作,就是在進行活體檢測,證明你就是你,你是活的而不是圖片。防止欺詐。這個有機會單獨給大家將金融風控時單獨談。有很多檢驗的元素點和比對內(nèi)容。
六、人臉識別的應用分類和案例
目前應用的場景比較多。我們簡單列舉幾類:
- 人證比對
- 人臉驗證
- 人臉識別查找
- 人臉美化
一些場景
如果再設想一些場景,會有如下一些場景,很多都已經(jīng)實現(xiàn)了:
- 上班打卡 刷臉考勤,不用帶工卡,智能門禁
- 入駐酒店景區(qū),識別身份,給予VIp待遇。案例:烏鎮(zhèn)閘機
- 啟動汽車,無鑰匙進入
- 刷臉支付,不用帶卡帶手機,直接扣款支付。案例:百度錢包
- 多圖對比尋找唯一個體,比如100張王珞丹和100張白百合放在一起,找不同。
更多補充中。
如今2017年,人臉識別的識別率已經(jīng)很高了。這個技術(shù)怎么商業(yè)化、怎么玩將會被進一步挖掘。暗流涌動的割據(jù)戰(zhàn)現(xiàn)在正在拉開,安防、社交、金融的市場份額將鹿死誰手?我認為場景很豐富,玩法很多。
作者:降峰,十年產(chǎn)品人。百度金融資深產(chǎn)品經(jīng)理,原海南航空產(chǎn)品總監(jiān),目前從事互聯(lián)網(wǎng)金融方向產(chǎn)品設計和產(chǎn)品架構(gòu)工作。
本文由 @降峰 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
最近想轉(zhuǎn)AI PM,對人臉識別感興趣,文章寫得很好,解決了我一部分的疑惑,另外我想問一下你的微信是多少啊
chanpinpeixun 公眾號
最近正好在了解這一塊,大贊
感謝。歡迎轉(zhuǎn)發(fā),關(guān)注我的微信號。