“安防+AI”,規(guī)模性落地中的關(guān)鍵三要素

0 評論 6256 瀏覽 29 收藏 13 分鐘

隨著AI技術(shù)的發(fā)展和成熟,AI+安防,必然會為視頻資源的信息化、情報化、智能化提供強有力的支撐。文章主要來跟大家分享一下,安防+AI規(guī)模性落地中的關(guān)鍵三要素。

隨著當(dāng)前AI技術(shù)的不斷進步,作為天然AI落地場景的安防領(lǐng)域引起了監(jiān)控大佬、IT巨頭、算法新貴們的極大關(guān)注。各類安防+AI,或者AI+安防概念炒的火熱,但是真正經(jīng)得起市場考驗的鳳毛麟角。

細(xì)究起來,不是技術(shù)問題,高精尖技術(shù)國內(nèi)基本上可以與美國保持同步,國內(nèi)團隊奪得國際比賽的成績單光明耀眼;不是人才問題,頂尖的國際人才流動比比皆是。更不是制造能力問題,中國的監(jiān)控設(shè)備制造商制造了世界六成還多的設(shè)備,可能有的小伙伴會說是對行業(yè)的理解度問題。

不可否認(rèn),這是個重要因素,但對大規(guī)模落地“安防+AI”的關(guān)鍵要素認(rèn)知可能是個更關(guān)鍵的問題。

一、當(dāng)前視頻監(jiān)控的應(yīng)用現(xiàn)狀

從2004年以來的平安城市,天網(wǎng)工程,雪亮工程,經(jīng)過十多年的建設(shè),全國各省市乃至鄉(xiāng)村,都建起了大規(guī)模的視頻監(jiān)控系統(tǒng)。

據(jù)不完全統(tǒng)計,目前全國已建各類監(jiān)控近2億路,加上在建的和待建的,至少規(guī)模會翻翻。隨之而來的是天量級視頻文件,即使配備數(shù)百萬視頻巡視員來看視頻,每天能監(jiān)控到的視頻大概也不到總視頻量的百分之一。

但是這些天量的視頻數(shù)據(jù),在社會公共安全管理和案件偵破等工作中,起著越來越重要的作用。在公共安全信息化建設(shè)深入持續(xù)開展的背景下,現(xiàn)有視頻系統(tǒng)缺乏深度應(yīng)用模式,視頻數(shù)據(jù)智能化程度不高的問題不斷凸顯。如何用AI升級現(xiàn)有的視頻系統(tǒng),使之能更好地適應(yīng)物聯(lián)網(wǎng)時代視頻智能化、信息化、情報化的應(yīng)用需求已勢在必行。

當(dāng)前小規(guī)模落地安防+AI,已經(jīng)不是難題,智能攝像頭或者結(jié)構(gòu)化服務(wù)器就能解決這個問題。

以下要說的是大規(guī)模、城市級的安防+AI中的落地要素:

要素一:視頻結(jié)構(gòu)化

要實現(xiàn)視頻信息智能化、信息化的問題,必須要先面對結(jié)構(gòu)化的問題,結(jié)構(gòu)化之后就可以把原來只能看無法調(diào)用的視頻變成可調(diào)用的信息。迎接視頻數(shù)據(jù)深度應(yīng)用的挑戰(zhàn),其核心及瓶頸是通過研究視頻結(jié)構(gòu)化描述技術(shù),解決通用視頻數(shù)據(jù)向視頻信息化、視頻情報化方向的轉(zhuǎn)化,實現(xiàn)社會公共安全視頻應(yīng)用工作模式的創(chuàng)新。

視頻結(jié)構(gòu)化描述是一種基于視頻內(nèi)容信息提取的技術(shù),它對視頻內(nèi)容按照語義關(guān)系,采用時空分割、特征提取、對象識別等處理手段,組織成可供計算機和人類理解的結(jié)構(gòu)化信息的技術(shù)。

從數(shù)據(jù)處理的流程看,視頻結(jié)構(gòu)化描述技術(shù),能夠?qū)⒎墙Y(jié)構(gòu)化的視頻數(shù)據(jù)轉(zhuǎn)化為人和機器可理解的結(jié)構(gòu)化信息,并進一步轉(zhuǎn)化為公安民警實戰(zhàn)所用的情報數(shù)據(jù),實現(xiàn)視頻數(shù)據(jù)向信息化、情報化、智能化的應(yīng)用轉(zhuǎn)化,達(dá)到借用視頻監(jiān)控掌控安全的目的。

視頻結(jié)構(gòu)化描述的內(nèi)容類型方面主要是:人員、車輛、物品、行為。

  1. 在視頻中把人作為一個可描述的個體展現(xiàn)出來,其中包括人員的臉部精準(zhǔn)定位、臉部特征提取、臉部特征比對,還包括人員的性別、年齡范圍、大概身高、衣著特征、發(fā)飾特征、配飾、攜帶物品、步履形態(tài)、交通工具等多種可結(jié)構(gòu)化描述信息;
  2. 對于車輛的描述信息包括:車牌、品牌、車顏色、車型、子品牌、車貼、車飾物信息等多種車輛描述信息;
  3. 對于行為的描述信息包括:區(qū)域、越界、徘徊、遺留、聚集等多種行為描述信息。

經(jīng)過視頻結(jié)構(gòu)化解析處理,可以實現(xiàn)如下目標(biāo):

  • 一是視頻變成了可調(diào)用的信息庫,可以針對目標(biāo)對象進行快速檢索,線索查找速度會得到極大的提升。視頻結(jié)構(gòu)化之后,從百萬量級的目標(biāo)圖庫中(大約一千小時內(nèi)的高清視頻),查找視頻截圖中的一個嫌疑人對象,一秒內(nèi)即可完成;千萬量級目標(biāo)的圖庫中查找,數(shù)秒內(nèi)即可完成。
  • 二是監(jiān)控系統(tǒng)所占用存儲容量極大的降低,結(jié)構(gòu)化后的信息,存儲人的結(jié)構(gòu)化檢索信息和目標(biāo)數(shù)據(jù)信息不到原視頻數(shù)據(jù)容量的2%;對于車輛和行為,均不到1%。存儲容量極大地降低,可以解決視頻長期存儲和存儲成本高昂的問題。
  • 三是視頻結(jié)構(gòu)化可以活化視頻數(shù)據(jù),作為數(shù)據(jù)挖掘、應(yīng)用的基礎(chǔ)。結(jié)構(gòu)化的圖像及描述信息,存入相應(yīng)的數(shù)據(jù)倉庫,對各類數(shù)據(jù)倉庫可以進行深度的數(shù)據(jù)挖掘、關(guān)聯(lián)、融合、應(yīng)用,充分發(fā)揮大數(shù)據(jù)的作用,提升視頻監(jiān)控的應(yīng)用價值,提高對視頻場景的分析和預(yù)測能力。

要素二:視頻智能分析技術(shù)

視頻結(jié)構(gòu)化描述是針對視頻內(nèi)容的智能結(jié)構(gòu)化分析,將非結(jié)構(gòu)化的視頻數(shù)據(jù)經(jīng)過智能分析,形成可供標(biāo)記描述的結(jié)構(gòu)化數(shù)據(jù),因此視頻智能化分析是視頻結(jié)構(gòu)化的核心技術(shù)。

智能視頻分析技術(shù)的高低,對視頻結(jié)構(gòu)化描述的準(zhǔn)確率至關(guān)重要。為了能更高質(zhì)量地進行視頻結(jié)構(gòu)化分析,必須在這三個方向進行創(chuàng)新:

首先、視頻預(yù)處理技術(shù),主要包括視頻解碼、圖片篩選、圖片清洗等,也包括視頻防抖動和圖像增強。

  1. 視頻解碼把視頻還原成一張張的圖片,圖片篩選把圖片中的無用圖片進行廢棄處理,圖片清洗保留最有效圖片;
  2. 視頻抖動主要是道路監(jiān)控中高架安裝方式帶來的較高頻率的小幅抖動,抖動的拍攝往往會拍出一團糊的視頻,視頻防抖動能有效抑制智能分析中的誤報和漏報,提高智能分析的準(zhǔn)確率;
  3. 圖像增強是對視頻源進行質(zhì)量改善處理,有效改善畫質(zhì),提高圖像的清晰度,使原本低質(zhì)量的圖像達(dá)到清晰可辨。

其次,不斷提升分析準(zhǔn)確率。

如人臉識別技術(shù)從最初的特征臉方法過渡到卷積神經(jīng)網(wǎng)絡(luò)方法,由可見光人臉識別到多源光人臉識別。類同,車輛、物品和行為的智能分析也有了更高效的分析技術(shù)。要不斷關(guān)注前沿AI技術(shù)的發(fā)展,重點關(guān)注實戰(zhàn)場景下的訓(xùn)練方法、模型構(gòu)建,加上大數(shù)據(jù)量的實踐,不斷提升分析識別的準(zhǔn)確率,最后達(dá)到可實用的程度。

再次,影像處理技術(shù),主要包括圖像復(fù)原技術(shù)等。圖像復(fù)原就是綜合利用超分辨率、去模糊濾波、變形矯正、色彩調(diào)整等對模糊視頻進行處理,使之清晰可辨。

要素三:結(jié)構(gòu)化圖像信息數(shù)據(jù)庫

通過對視頻內(nèi)容的智能化分析處理,生成一個高密度存儲,又能快速調(diào)用的結(jié)構(gòu)化圖像信息大數(shù)據(jù)庫。只有實現(xiàn)了對圖像庫的快速落盤,才能使結(jié)構(gòu)化信息不堵塞、不丟失;也只有實現(xiàn)了快速調(diào)用,才能做到千萬量級秒級檢索,也才能快速準(zhǔn)確的發(fā)現(xiàn)有效線索,充分發(fā)揮視頻資源的實戰(zhàn)價值。

然而,在公安信息化建設(shè)深入開展的背景下,現(xiàn)有視頻資源缺乏深度應(yīng)用的模式。其應(yīng)用的瓶頸依然是視頻信息如何高效提取?如何保障識別的準(zhǔn)確率?如何進行快速調(diào)用?如何同其他信息系統(tǒng)進行標(biāo)準(zhǔn)數(shù)據(jù)交換、融合、共享等。

視頻結(jié)構(gòu)化技術(shù)難點

首先是視頻結(jié)構(gòu)化核心算法技術(shù)的突破。

視頻結(jié)構(gòu)化描述依托于智能分析技術(shù),但是當(dāng)前視頻智能分析技術(shù)還未突破各種應(yīng)用環(huán)境的制約。

比如:人臉識別的應(yīng)用場景,當(dāng)下的人臉識別多半是配合式、重復(fù)式應(yīng)用場景,如:銀行、機場、海關(guān)卡口。在這種應(yīng)用場景下,人臉的識別率基本能達(dá)到實用要求,而在無配合、多人臉、動態(tài)視頻的場景下就很難達(dá)到實用目標(biāo)。特別是在一般視頻監(jiān)控場景下,由于架設(shè)位置高、拍攝距離遠(yuǎn),基本上識別不到人臉,更別說進行人臉結(jié)構(gòu)化了。

雖然當(dāng)前的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模式,使得人臉檢測和識別的準(zhǔn)確度大幅提長,但是隨之而來的負(fù)面效應(yīng)也相當(dāng)明顯,首當(dāng)其沖的就是運算復(fù)雜度的提升,需要耗費大量的計算資源。

針對這一瓶頸,雖然業(yè)內(nèi)公司試圖通過將計算前端推移(智能攝像頭)和后端集中化處理(GPU結(jié)構(gòu)化服務(wù)器)兩種方案來解決,但是智能攝像頭方案大規(guī)模部署成本高昂,且對已安裝的巨量監(jiān)控?zé)o法結(jié)構(gòu)化。

集中化處理方案也需要大量價格昂貴的結(jié)構(gòu)化服務(wù)器,而且?guī)淼膸拤毫薮?,也不利于?guī)模性實施。這就需要第三種更貼合當(dāng)前實際的解決方案,報道稱由安軟慧視推出的這種方案已在部分省市公安廳公安局開始實施,作者已與市局進行了聯(lián)系,等詳細(xì)了解后再詳細(xì)寫出。

其次是實戰(zhàn)場景大數(shù)據(jù)和深度學(xué)習(xí)場景訓(xùn)練模型的構(gòu)建。

算法、算力和數(shù)據(jù)作為AI的基本三大支撐,少了哪一個都不行。不獲得足夠量的場景數(shù)據(jù)就訓(xùn)練不出好的模型,而沒有好的模型又不被客戶認(rèn)可,沒辦法從客戶那里獲得巨量的場景數(shù)據(jù)。

最后是視頻結(jié)構(gòu)化標(biāo)記描述數(shù)據(jù)存儲,檢索和應(yīng)用技術(shù)創(chuàng)新。

隨著結(jié)構(gòu)化數(shù)據(jù)總量的海量累積,如何實現(xiàn)其圖像大數(shù)據(jù)的超大容量、高效存儲、高效檢索以及快速調(diào)用就需要不斷進行技術(shù)創(chuàng)新。如果不能做到規(guī)模性實時處理實時檢索,它最終只能是一個事后處置系統(tǒng),仍然會讓公安辦案失去時機,對于提高破案率的效果不大。

雖然當(dāng)前還面臨不少困難,但隨著AI技術(shù)的發(fā)展和成熟,AI+安防,必然會為視頻資源的信息化、情報化、智能化提供強有力的支撐,變視頻的被動防御為主動識別,變事后處置為事前事中事后全程掌控,進而最終實現(xiàn)“AI+安防”的規(guī)模性落地。

 

本文由 @李震 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!