AI技術(shù)中最有商業(yè)想象空間的能力——人臉識別

0 評論 4327 瀏覽 14 收藏 12 分鐘

編輯導(dǎo)讀:人臉識別技術(shù)已經(jīng)被運用到生活的各個角落,滿足人們不同的需求。本文作者基于自身經(jīng)驗,對人臉識別技術(shù)的相關(guān)后臺流程和技術(shù)產(chǎn)品應(yīng)用展開了分析討論,與大家分享,希望通過此文能夠加深你對人臉識別技術(shù)的認(rèn)識。

人臉識別技術(shù)一項很有意思的技術(shù),未來理想的狀態(tài)是在你不經(jīng)意的時候就已經(jīng)查明你的身份。對于系統(tǒng),你已不再是隱形之人。

在我之前的文章中也詳細(xì)通俗的介紹了語義理解及語音識別技術(shù)的具體細(xì)節(jié),但是作為AI界三大基礎(chǔ)技術(shù)是必須要講完的,所以今天我們談?wù)勅四樧R別究竟是如何認(rèn)出你的?

按照慣例,我們先大致了解人臉識別技術(shù)的后臺流程:

人臉識別原理過程

第一步:人臉圖像采集及檢測,顧名思義,其實就是給你照個相,然后傳遞給下一個模塊。

第二步:這個時候照完像我們是不是該處理,比如ps啊,美圖啊,瘦臉啊,美白啊。識別技術(shù)也同樣需要對你的臉做一下校正,讓它用自己那一套自己熟悉的處理方式給你打打光(光線補償)避免暗色過多,順便做一下灰度變換,濾波、銳化等等一套組合拳打下來。

第三步:美完圖了,這個時候重頭戲就到了,應(yīng)該開始提取你的特征點了,你張的是不是歪瓜劣棗,怎么歪的?歪的特點在哪里。當(dāng)然我只是比喻,真正提取特征的方式很多種,比如視覺特征、像素統(tǒng)計特征、人臉圖像變換系數(shù)特征等等,方式不同提取的料也不同。當(dāng)然也就容易影響識別的效果,還是需要具體看在哪個場景應(yīng)用哪種識別方法。

第四步:提取特征數(shù)據(jù)后傳輸?shù)綌?shù)據(jù)庫中開始檢索,看看誰更像這人?但是以什么為標(biāo)準(zhǔn)說像這個人呢?我們設(shè)定一個閥值,超過這個數(shù)值我們就認(rèn)為他們很像,搞不好是兄弟姐妹。但是會出現(xiàn)一個問題,一旦出現(xiàn)好幾個閥值以上的人,那到底誰是呢?這個時候我們可能就要重新多采集一些你的照片,多優(yōu)化一下模型以便更好的認(rèn)識你了。

這就是大致的一個原理流程,具體場景還需要增加具體步驟。

01 人臉識別技術(shù)的分類

我們經(jīng)常說的人臉識別只是人臉技術(shù)的一個子技術(shù),人臉識別技術(shù)是分很多類別的,出門別丟人哦。

人臉技術(shù)分類-摘自百度

我們以百度的人臉技術(shù)舉例,先看看人臉檢測及跟蹤

人臉檢測跟蹤

百度一般都會給識別到的人臉規(guī)劃一個方框,用于識別人臉?biāo)?。初步定位,以便后面做更加詳?xì)的分解。

業(yè)內(nèi)熟悉的朋友可能都了解,在人臉上都會布置關(guān)鍵點位,點位越多,越詳細(xì),識別的效果越優(yōu)秀,用關(guān)鍵點位的方式能夠詳細(xì)的分析我們的臉型特征,能夠為特征提取起到很好的助力。

這項技術(shù)應(yīng)該是很多妹子的真愛,左上角是原圖,右上角是算法經(jīng)過關(guān)鍵點位分析出來的像素人臉,算法中會分析出人臉中鼻子在哪里?眼睛在哪里?

大家可能會問,能干嘛呢?看下面兩張圖,是美白之后的效果。可以應(yīng)用于視頻美白處理,天然黑妹子的福音。

02 人臉屬性定義

人臉屬性值表分析

在給該算法模型一張圖片,可以分析出我們想要的任何維度屬性值以及結(jié)果概率,這項技術(shù)在未來應(yīng)用上是非常廣泛的,相當(dāng)于計算機視覺類的大腦,通俗來講就是讓機器能讀懂它看到的一切。大家創(chuàng)業(yè),找工作的都可以往這里來靠哈。

03 人臉識別技術(shù)產(chǎn)品應(yīng)用

活體檢測

金融行業(yè)驗證

貼紙相機

當(dāng)前很流行的貼紙相機產(chǎn)品,依據(jù)人臉檢索跟蹤的技術(shù),不斷的調(diào)整貼紙位置,達(dá)成圖中的效果。

圖像文字識別

這項技術(shù)也是系統(tǒng)錄入員工的最愛,基本一拍照便能依照系統(tǒng)欄目維度規(guī)定自動錄入文本。

從以上的介紹后大家是否能夠理解人臉識別技術(shù)的具體流程?或者該技術(shù)在未來和現(xiàn)在都能應(yīng)用在哪些場景?

你認(rèn)為什么技術(shù)最有可能影響未來的世界,影響你的生活?

從作者從業(yè)者角度來思考的話,語音、語義、圖像識別三大基礎(chǔ)AI技術(shù)都缺一不可,但商業(yè)角度來看,當(dāng)前最有可能衍生出大量新場景的技術(shù)是圖像識別,而圖像識別最大的應(yīng)用空間是人臉識別

在人臉識別技術(shù)應(yīng)用中,通過標(biāo)注出來的有包括人像,物體的信息的圖像數(shù)據(jù),和核心算法、深度學(xué)習(xí)技術(shù)行成自己的產(chǎn)品,比如人臉識別的閘機、人臉識別機器人等,然后再通過產(chǎn)品本身來服務(wù)用戶,在用戶使用的過程當(dāng)中自主去學(xué)習(xí)從而產(chǎn)生用戶行為數(shù)據(jù),接而再反哺并促使產(chǎn)品和技術(shù)不斷優(yōu)化、自我學(xué)習(xí)。

04 基于深度學(xué)習(xí)的人臉識別技術(shù)

人臉識別是一個較為寬泛的概念,涵蓋了構(gòu)建人臉識別系統(tǒng)的一系列技術(shù),包括人臉檢測、防偽檢測、人臉對齊、特征提取、特征對比等,其按照對比的量級可分為1:1、1:N、N:N。目前先進(jìn)的人臉識別算法均采用了深度學(xué)習(xí)技術(shù),在公開的百萬基準(zhǔn)數(shù)據(jù)集MegaFace中已能達(dá)到98%的精度,人臉識別技術(shù)基本趨于成熟。

1:1人臉識別模式主要用于身份驗證

1:1即Face Verification,1:1人臉識別技術(shù)是一種靜態(tài)對比,比較兩個人的相似度。主要是利用圖像處理技術(shù)從圖像中提取人臉特征值,計算機對當(dāng)前人臉與人像數(shù)據(jù)庫進(jìn)行快速人臉比對,并得出是否匹配的過程,可以簡單理解為證明你就是你。

1:1人臉識別的應(yīng)用場景主要為人臉手機解鎖、人證合一,通常應(yīng)用落地場景為手機廠商尋找有算法識別技術(shù)的軟件供應(yīng)商為其內(nèi)置SDK,輔助代碼移植,使其手機擁有人臉識別解鎖的能力,典型代表為OPPO、華為等手機廠商。

1:N人臉識別模式主要是用于行業(yè)場景落地

1:N人臉識別技術(shù)是在海量的人像數(shù)據(jù)庫中找出當(dāng)前用戶的人臉數(shù)據(jù)并進(jìn)行匹配。N的數(shù)目在千萬級。其特點是動態(tài)和非配合,這是對于1:N而言也是非常重要的兩個點,所謂的動態(tài)也就是識別的是一個動態(tài)的視頻流;非配合是指識別對象不用感知到攝像頭的位置并配合完成識別工作,而地點,陰暗,光線,玻璃都會影響識別的準(zhǔn)確性,所以1:N相對更具挑戰(zhàn)性。

1:N人臉識別的應(yīng)用場景包括學(xué)校電子班牌、物業(yè)小區(qū)、新零售的客戶識別等。

學(xué)校電子班牌, 將走班制課程表與多模式多方式班級考勤關(guān)聯(lián),實現(xiàn)校務(wù)與教務(wù)的信息化管理,成為學(xué)校和班級、教師和學(xué)生、家長和學(xué)生之間交流與互動的橋梁。

從物業(yè)小區(qū)到企業(yè)樓宇,結(jié)合企業(yè)的需要可以用于人臉閘機、考勤、OA管理、訪客的管理和注冊,隨之而來的就是更加智能的管理人群和流向。

在新零售行業(yè),幫助線下零售商家更了解他們的客戶,將線下人群信息向線上轉(zhuǎn)化。通過前端的圖像獲取硬件和機器視覺技術(shù)分析客群,提供精準(zhǔn)的客流分析如顧客年齡、性別,甚至停留時長、行為分析等多維數(shù)據(jù)。

N:N人臉識別模式主要用于政府機關(guān)

N:N是1:N的延伸,即同時對多張人臉進(jìn)行人臉檢索,需要占用更多的計算資源。是通過計算機對場景內(nèi)所有人進(jìn)行面部識別并與人像數(shù)據(jù)庫進(jìn)行比對的過程,是動態(tài)人臉比對。

N:N人臉識別的應(yīng)用場景主要為公共安防、天網(wǎng)系統(tǒng)等。比如公共場所動態(tài)監(jiān)控、緝拿逃犯、人員布控等就是典型的運用N:N人臉識別模式。

 

本文由 @南國書生 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!