應(yīng)用層下的人臉識別(二):人臉庫
本文作者根據(jù)多年人臉識別項目經(jīng)驗,總結(jié)了人臉識別技術(shù)在安防、商業(yè)領(lǐng)域應(yīng)用及產(chǎn)品設(shè)計細節(jié),匯總成應(yīng)用層下的人臉識別系列文章。
本文為系列文章的第二篇,介紹人臉庫的相關(guān)內(nèi)容。人臉庫是人臉識別的基礎(chǔ),建立人臉庫往往是人臉項目的首要任務(wù),全文圍繞著什么是人臉庫及如何建立人臉庫展開討論。
1. 什么是人臉庫
簡單來講,人臉庫就是人臉數(shù)據(jù)的儲存管理中心,能夠為人臉識別提供比對模板,為抓拍人臉數(shù)據(jù)提供管理空間,為人臉算法檢測提供測試樣本。人臉識別項目是建立在人臉庫的基礎(chǔ)之上,所以人臉識別的首要任務(wù)便是是建立人臉庫。
人臉庫按照用途可分為人臉比對庫、人臉抓拍庫、人臉數(shù)據(jù)集,不同類型人臉庫的組成、結(jié)構(gòu)、作用也有所不同,下面將會依次介紹,本文重點討論人臉比對庫。
1.1?人臉比對庫
人臉比對庫主要用于人臉1:N識別,如下圖,人臉1:N是將人臉抓拍照片的人臉特征與人臉庫中所有人臉特征進行逐一比對。
人臉比對庫主要由人臉庫管理、人臉數(shù)據(jù)、人臉庫屬性描述三部分組成,如下圖:
人臉比對庫按照應(yīng)用場景又可分為四類,分別是黑名單庫、白名單庫、紅名單庫和灰名單庫。
(1)黑名單庫:黑名單指需要重點管控、關(guān)注的人員,一般由在逃犯、慣犯、水客、異常行為或是想要重點關(guān)注的人員構(gòu)成。比中黑名單中會產(chǎn)生報警提示,常用于公安追逃;
(2)白名單庫:白名單一般指可信人員,常用于商業(yè)領(lǐng)域中的通行管理,白名單中的人員容許進入通過。例如在樓宇內(nèi)設(shè)置人臉識別門禁,只容許公司內(nèi)部人員進入,于是可將公司員工設(shè)置成白名單,白名單一般不會觸發(fā)報警;
(3)紅名單庫:紅名屬于白名單的拓展應(yīng)用,用于白名單中需要重點關(guān)注展現(xiàn)的人群,如VIP客戶、領(lǐng)導(dǎo)人等,可在識別后進一步分析該人群的行為特點和活動范圍;
(4)灰名單:介于白名單和黑名單之間,是一類具有異常行為的可疑人員,還需要通過更多數(shù)據(jù)分析他們是否是黃牛、小偷、罪犯同伙等。
1.2?人臉抓拍庫
人臉抓拍庫是管理人臉抓拍數(shù)據(jù)的地方,在視頻流或圖片流中凡是能被算法檢測到的人臉都會經(jīng)過圖像處理形成一張張人臉的抓拍照片及對應(yīng)的場景照,再將抓拍照片進行數(shù)據(jù)結(jié)構(gòu)化并與其場景照一同保留至人臉抓拍庫中。
抓拍庫的人臉照片會具有性別、年齡、戴眼鏡、胡須、表情、是否戴帽子、是否有遮擋等圖片描述,方便抓拍照片的檢索及深層次人臉數(shù)據(jù)應(yīng)用。
人臉數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),人臉結(jié)構(gòu)化數(shù)據(jù)指將原始采集數(shù)據(jù)按照規(guī)則處理,形成具有統(tǒng)一格式,并用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)。
如下圖:抓拍庫儲存的是結(jié)構(gòu)化數(shù)據(jù),人臉結(jié)構(gòu)化數(shù)據(jù)指原始人臉數(shù)據(jù)經(jīng)過程序分析和過濾,形成具有統(tǒng)一格式和描述的數(shù)據(jù)儲存在數(shù)據(jù)庫中。
1.3?人臉數(shù)據(jù)集
人臉數(shù)據(jù)集就是用于檢測人臉算法效果和訓(xùn)練算法的數(shù)據(jù)庫,網(wǎng)上有很多公開的人臉數(shù)據(jù)集可為模型訓(xùn)練提供數(shù)據(jù)來源。
常見的人臉數(shù)據(jù)集可見下表:
人臉識別
人臉檢測
人臉表情
人臉年齡、性別
2. 如何建立人臉庫
人臉庫中人臉比對庫的建立最為為復(fù)雜,這里只討論人臉比對庫的建立過程。
2.1 梳理入庫流程
人臉入庫流程見下圖,人臉數(shù)據(jù)包含人臉特征向量,人臉信息兩部分,它們儲存在數(shù)據(jù)庫不同的表中,注意在刪除人臉庫照片時一定要刪除它對應(yīng)的特征向量。如果照片質(zhì)量未達到要求,且沒有更好的照片,可以有強制入庫的選項。
2.2 制定入庫規(guī)則
人臉數(shù)據(jù)的質(zhì)量關(guān)系到人臉比對的效果,盡可能將人臉清晰、正臉、本人近期的人臉照片入庫。在人臉入庫時,產(chǎn)品經(jīng)理需要制定入庫規(guī)則來過濾質(zhì)量不佳、格式不規(guī)范的人臉數(shù)據(jù)。
入庫規(guī)則應(yīng)該包含:
- 圖片的顏色:可支持彩色及灰度的圖片,最低要求256灰度圖片;
- 圖片的格式:各類主流圖片格式,例如 bmp/jpg/png等,圖片命名格式統(tǒng)一,如常用的命名“姓名_證件號”;
- 圖片像素:雙眼中心之間的距離大于30像素;
- 圖片尺寸:尺寸大于70X80以上;
- 人臉角度:人臉左右偏轉(zhuǎn)30度以內(nèi),上下偏轉(zhuǎn)20度以內(nèi);
- 入庫圖片大小建議幾十KB~幾百KB之間為宜,但也不能太大,超過1M,會影響入庫和識別的速度。
2.3?設(shè)計人臉庫功能、及界面
人臉庫應(yīng)包含人臉信息的增、刪、改、查等基本功能,人臉庫界面可參見下圖的樣式:
人臉信息可以從客戶端批量導(dǎo)入,客戶端需要提供人臉批量導(dǎo)入模板,批量導(dǎo)入適合小規(guī)模格式統(tǒng)一的數(shù)據(jù)。
當人臉項目中需要入庫數(shù)萬以上的人臉信息,并且人臉數(shù)據(jù)格式并不統(tǒng)一,整理起來很麻煩,這時就需要設(shè)計批量入庫工具。
新建的人臉庫需要設(shè)定人臉規(guī)模,一般分為<1W、1W-100W、100W-1000W、>1000W四個范圍,大庫容進行人臉比對需要更高配置服務(wù)器,服務(wù)器配置與圖像處理能力的關(guān)系將會在后續(xù)文章中詳細討論。
2.4 采集人臉庫數(shù)據(jù)
如果想通過人臉識別技術(shù)識別某人,就需要先獲取到該人的人臉數(shù)據(jù),并錄入人臉庫中作為比對模板,那么如何采集人臉庫數(shù)據(jù)呢?采集方式依據(jù)使用場景而定。
公安類項目,人臉數(shù)據(jù)提供方是公安,公安內(nèi)部有大量的人臉數(shù)據(jù),可通過對接公安信息資源庫來獲取人臉數(shù)據(jù),如下圖為八大公安信息資源庫。
公安的信息資源庫是嚴禁外泄的,對產(chǎn)品的網(wǎng)絡(luò)安全及數(shù)據(jù)保密性要求頗為嚴格,在產(chǎn)品設(shè)計時需要考慮到相關(guān)問題。
刷臉通行或新零售類項目,一般是用戶配合式采集人臉信息,需要設(shè)計人臉信息采集入口,用戶可在微信公眾號、手機app或PC端進行注冊時上傳人臉信息。
大型商業(yè)類或平安城市項目中,需要設(shè)計非配合式采集人臉信息。一般會通過在主要出入口、通道、走廊等地部署的人臉抓拍機,抓拍路人人臉,自動建立該人檔案庫,這里需要用到一人一檔,作者會在后期文章詳細討論。
以上就是系列文章的第二篇-人臉庫的相關(guān)內(nèi)容,后續(xù)將會推出人臉識別系列文章,歡迎大家與我交流圖像識別相關(guān)問題。
相關(guān)閱讀
本文由@陽春柏樰 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
人臉庫的界面看不清?。?/p>
人臉庫除了業(yè)務(wù)黑灰白名單,還有識別效率上的考慮,單庫都盡量小于1萬.那么怎么劃分人臉庫呢?
人臉數(shù)據(jù)集也不需要在產(chǎn)品層面進行后臺設(shè)計了吧
如果是保險行業(yè)的人臉核身,則是直接和身份證的高清證件照進行比對,這種的就不需要進行人臉庫的錄入和采集了吧。就是文中提到的人臉庫的設(shè)計。
您好,我是人民郵電出版社編輯,想與您合作相關(guān)內(nèi)容,可否詳談18811565025
您好,可以加微信“陽春柏樰”聊聊
寫的很詳細,學(xué)習(xí)了