AI+時(shí)代,淺談產(chǎn)品經(jīng)理對(duì)圖像識(shí)別技術(shù)的閾值控制

4 評(píng)論 20277 瀏覽 107 收藏 19 分鐘

產(chǎn)品滿足用戶的需求有一個(gè)閾值,產(chǎn)品值低于閾值用戶會(huì)覺得了無生意,即產(chǎn)品一般般也即產(chǎn)品經(jīng)理做了功能經(jīng)理,產(chǎn)品值等于閾值產(chǎn)品功能基本滿足了用戶的需求,而只有產(chǎn)品經(jīng)理駕馭了需求,把產(chǎn)品做成作品產(chǎn)品值才有可能高于閾值,任何時(shí)候產(chǎn)品經(jīng)理應(yīng)該學(xué)習(xí)到高于需求閾值的產(chǎn)品方法論。

首先撰寫本篇的目的:

當(dāng)下每天看的到一個(gè)詞:AI,滿眼皆是AI的階段,我們產(chǎn)品經(jīng)理應(yīng)該如何了解到AI的技術(shù)脈絡(luò)和市場(chǎng)需求大勢(shì)!AI不是新的概念,再次起來是因?yàn)橛行碌耐黄啤?/p>

創(chuàng)新工廠的李開復(fù)博士說現(xiàn)在是技術(shù)從業(yè)者創(chuàng)新的時(shí)代,百度聯(lián)合創(chuàng)始人同時(shí)也是36K的投資人也說當(dāng)今是技術(shù)人員創(chuàng)業(yè)做產(chǎn)品的最好時(shí)代,那么我們產(chǎn)品經(jīng)理究竟知道AI的哪些技術(shù)呢,本篇著重淺析一下AI+時(shí)代的圖像識(shí)別技術(shù)。

在AI領(lǐng)域之中,圖像識(shí)別技術(shù)占據(jù)著極為重要的地位,而隨著計(jì)算機(jī)技術(shù)與信息技術(shù)的不斷發(fā)展,AI中的圖像識(shí)別技術(shù)的應(yīng)用范圍不斷擴(kuò)展,如LineLian所見過的IBM的Watson醫(yī)療診斷、各種指紋識(shí)別、及常用的支付寶的面部識(shí)別以及百度地圖中全景衛(wèi)星云圖識(shí)別等都屬于這一應(yīng)用的典型,AI這一技術(shù)已經(jīng)應(yīng)用于日常生活之中,圖像識(shí)別技術(shù)將來定會(huì)有著較為廣泛的運(yùn)用,而為了保證AI中的圖像識(shí)別技術(shù)能夠較好地服務(wù)于AI+時(shí)代的幾個(gè)重要產(chǎn)品領(lǐng)域,正是本篇就AI中的圖像識(shí)別技術(shù)展開具體研討的目的所在。

其次圖像識(shí)別概況:

為了較好完成產(chǎn)品經(jīng)理理解AI中的圖像識(shí)別技術(shù)的本源,我們首先需要深入了解圖像識(shí)別技術(shù)。作為智能領(lǐng)域的重要組成部分,圖像識(shí)別的發(fā)展先后經(jīng)歷了文字識(shí)別、數(shù)字圖像處理與識(shí)別、物體識(shí)別三個(gè)發(fā)展階段,而在AI+時(shí)代的圖像識(shí)別技術(shù)中,其本身所具備的功能早已超過了人類的極限,這也是AI的圖像識(shí)別技術(shù)能夠在各個(gè)垂直產(chǎn)品領(lǐng)域?qū)崿F(xiàn)較好應(yīng)用并幾乎成為標(biāo)配的原因所在。

最開始產(chǎn)品經(jīng)理要明白圖像識(shí)別技術(shù)本身的原理并不算太過復(fù)雜,信息的處理是這一技術(shù)的關(guān)鍵點(diǎn)所在,由于應(yīng)用計(jì)算機(jī)實(shí)現(xiàn)的圖像識(shí)別技術(shù)本身與人眼識(shí)別并不存在著本質(zhì)的差別,這就使得圖像識(shí)別技術(shù)同樣需要根據(jù)自身對(duì)圖像的記憶完成具體的識(shí)別工作。在人類進(jìn)行圖像識(shí)別的過程中,人類的大腦會(huì)將圖像的特征進(jìn)行提取,并結(jié)合大腦中以往對(duì)各類圖像的認(rèn)知判斷自身是否對(duì)圖像存在過印象,這就是人們能夠在觀看一張圖片后快速對(duì)其識(shí)別的原因所在。結(jié)合人類識(shí)別圖像的原理,在計(jì)算機(jī)進(jìn)行的圖像識(shí)別中,計(jì)算機(jī)首先就能夠完成圖像分類并選出重要信息、排除冗余信息,根據(jù)這一分類計(jì)算機(jī)就能夠結(jié)合自身記憶存儲(chǔ)結(jié)合相關(guān)要求進(jìn)行圖像的識(shí)別,這一過程本身與人腦識(shí)別圖像并不存在著本質(zhì)差別。對(duì)于圖像識(shí)別技術(shù)來說,其本身提取出的圖像特征直接關(guān)系著圖像識(shí)別能否取得較為滿意的結(jié)果。值得注意的是,由于計(jì)算機(jī)歸根結(jié)底不同于人類的大腦,所以計(jì)算機(jī)提取出的圖像特征存在著不穩(wěn)定性,這種不穩(wěn)定性往往會(huì)因?yàn)橛?jì)算機(jī)提取圖像特征的明顯與普通影響圖像識(shí)別的效率與準(zhǔn)確性,由此可見圖像特征對(duì)于AI中圖像識(shí)別技術(shù)的重要意義。

再則圖像識(shí)別分析:

對(duì)于當(dāng)下AI+時(shí)代的圖像識(shí)別技術(shù)來說,神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)與非線性降維的圖像識(shí)別技術(shù)是最為常見的兩種圖像識(shí)別技術(shù),LineLian將對(duì)兩種常見的AI圖像識(shí)別技術(shù)進(jìn)行詳細(xì)分析。

第一:神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)

想要深入了解非線性降維的圖像識(shí)別技術(shù),我們就必須理解何為神經(jīng)網(wǎng)絡(luò),這里的神經(jīng)網(wǎng)絡(luò)全稱人工神經(jīng)網(wǎng)絡(luò),其本身指的是在現(xiàn)代神經(jīng)生物學(xué)研究基礎(chǔ)上提出的模擬生物過程以反映人腦某些特性的計(jì)算結(jié)構(gòu),雖然我們使用了模擬這一名詞,但事實(shí)上神經(jīng)網(wǎng)絡(luò)本身并沒有完全模仿人類的神經(jīng)網(wǎng)絡(luò),其本身只是通過對(duì)人類神經(jīng)網(wǎng)絡(luò)的抽象、簡(jiǎn)化和模擬實(shí)現(xiàn)相關(guān)計(jì)算結(jié)構(gòu)效率的提升。

對(duì)于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)來說,其能夠?qū)崿F(xiàn)圖像的識(shí)別主要得益于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的運(yùn)用,而在應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行的圖像識(shí)別中,我們首先需要對(duì)相關(guān)圖像進(jìn)行預(yù)處理,這一預(yù)處理主要包括真彩色圖像轉(zhuǎn)換為灰度圖、灰度圖像的旋轉(zhuǎn)與放大、灰度圖像的歸一化等內(nèi)容。為了保證神經(jīng)網(wǎng)絡(luò)能夠較好地實(shí)現(xiàn)圖像識(shí)別,我們還需要針對(duì)圖像識(shí)別的領(lǐng)域與對(duì)象完成具體的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),這一設(shè)計(jì)主要包括輸入層設(shè)計(jì)、隱含層設(shè)計(jì)、輸出層設(shè)計(jì)、初始權(quán)值的選取、期望誤差的選取等五個(gè)方面。在輸入層設(shè)計(jì)中,我們需要根據(jù)圖像識(shí)別對(duì)象的需要確定求解的問題與數(shù)據(jù)表示方式,而在本篇進(jìn)行的研究中,為了我們產(chǎn)品經(jīng)理理解,LineLian將輸入層統(tǒng)一設(shè)計(jì)為16×16圖像樣本尺寸縮放大小,256 維網(wǎng)絡(luò)輸入需要;而在隱含層的設(shè)計(jì)中,我們需要確定隱含層的數(shù)目與隱含層單元數(shù)的選擇,當(dāng)下業(yè)界已經(jīng)確定了隱含層神經(jīng)元數(shù)目的增加能夠保證誤差精度的降低,所以適當(dāng)時(shí)候增加隱層數(shù)目就能夠較好地完成神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì),而在隱含層單元數(shù)的選擇中,我們可以參考經(jīng)驗(yàn)公式?L=√M+N +a,L=log2N,這樣就能夠有效避免神經(jīng)網(wǎng)絡(luò)泛化能力較弱,對(duì)于訓(xùn)練外樣本識(shí)別率降低的問題出現(xiàn),公式中的 M 代表的是輸出層神經(jīng)元數(shù)目,而 N 則代表輸入層神經(jīng)元數(shù)目。值得注意的是,通過刪除那些影響較小的隱含層單元能夠較好地提高神經(jīng)網(wǎng)絡(luò)的自身性能,但結(jié)構(gòu)選定花費(fèi)時(shí)間較長(zhǎng)是這一方法的缺陷所在;在輸出層的設(shè)計(jì)中,一般會(huì)選擇多輸出型作為神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì);而在初始權(quán)值的選取中,為了滿足神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)過程中的較好收斂,初始權(quán)值一般選為(-1,1)之間的隨機(jī)數(shù);而在期望誤差的選取中,其本身需要參考訓(xùn)練時(shí)間與預(yù)期誤差值,這里L(fēng)ineLian選擇 0.001 作為期望誤差值。

在完成神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)后,我們還需要進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練才能夠保證其較好的滿足圖像識(shí)別需求,為了保證這一設(shè)計(jì)的較好實(shí)現(xiàn),LineLian選擇在 MATLAB7.0 中使用函數(shù) newff創(chuàng)建一個(gè)兩層網(wǎng)絡(luò),這一網(wǎng)絡(luò)包括 1 個(gè)輸出神經(jīng)元、16×16 個(gè)輸入、26 個(gè)單元的隱含層,學(xué)習(xí)函數(shù)則選擇了 learngdm,初始學(xué)習(xí)速率為 0.01 ~ 0.6、訓(xùn)練性能函數(shù)“mse”、訓(xùn)練指標(biāo) 0.001、訓(xùn)練最大循環(huán) 2500。

在完成上述提到的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)與訓(xùn)練后,我們就可以著手對(duì)其進(jìn)行應(yīng)用實(shí)驗(yàn),在這一實(shí)驗(yàn)中筆者應(yīng)用這一神經(jīng)網(wǎng)絡(luò)對(duì) 26 個(gè)手寫英文字母的圖片進(jìn)行了識(shí)別,下表 為這一識(shí)別的識(shí)別結(jié)果,結(jié)合該表我們能夠發(fā)現(xiàn),不同節(jié)點(diǎn)數(shù)目會(huì)直接影響神經(jīng)網(wǎng)絡(luò)圖像識(shí)別的識(shí)別率,而 26 個(gè)隱含層節(jié)點(diǎn)數(shù)能夠較好滿足圖像識(shí)別的需求,下圖 為隱含層為 26 時(shí)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的誤差性能曲線及訓(xùn)練時(shí)間。結(jié)合這一結(jié)果我們可以斷定,神經(jīng)網(wǎng)絡(luò)識(shí)別技術(shù)能夠較好滿足手寫字母的識(shí)別,其本身在這一識(shí)別的過程中體現(xiàn)了準(zhǔn)確、快速、較強(qiáng)抗干擾能力等特點(diǎn),這些特點(diǎn)使得其本身能夠憑借著學(xué)習(xí)算法較好地應(yīng)用到更多復(fù)雜的圖像識(shí)別中,更好地為我們垂直領(lǐng)域的產(chǎn)品提供服務(wù)。

第二:非線性降維的圖像識(shí)別技術(shù)

除了神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)外,非線性降維的圖像識(shí)別技術(shù)也是當(dāng)下AI時(shí)代較為常用的圖像識(shí)別技術(shù)形式。對(duì)于傳統(tǒng)應(yīng)用計(jì)算機(jī)實(shí)現(xiàn)的圖像識(shí)別技術(shù)來說,其本身屬于較為高維的識(shí)別技術(shù),這種高維特性使得計(jì)算機(jī)往往在圖像識(shí)別的過程中承擔(dān)著很多不必要的負(fù)擔(dān),這種負(fù)擔(dān)自然會(huì)影響圖像識(shí)別的速度與質(zhì)量,非線性降維的圖像識(shí)別技術(shù)就是能夠較好實(shí)現(xiàn)圖像識(shí)別降維的技術(shù)形式。

在非線性降維的圖像識(shí)別技術(shù)出現(xiàn)前,業(yè)界最常采用的是線性降維的圖像識(shí)別技術(shù),這種技術(shù)本身具備著簡(jiǎn)單易于理解的優(yōu)點(diǎn),但在實(shí)際應(yīng)用中人們發(fā)現(xiàn),線性降維的圖像識(shí)別技術(shù)存在著計(jì)算復(fù)雜度高且占用相對(duì)較多的時(shí)間和空間特性,也使得線性降維的圖像識(shí)別技術(shù)不能夠較好地滿足各產(chǎn)品領(lǐng)域圖像識(shí)別的需要。對(duì)于非線性降維的圖像識(shí)別技術(shù)來說,其本身能夠在不破壞圖像結(jié)構(gòu)的前提下實(shí)現(xiàn)其自身的降維這就使得圖像識(shí)別技術(shù)的識(shí)別速度與精度能夠?qū)崿F(xiàn)較好的提升。例如在人臉識(shí)別系統(tǒng)中,以往受圖像維度較高的影響,人類識(shí)別系統(tǒng)往往需要耗費(fèi)大量的時(shí)間,計(jì)算機(jī)系統(tǒng)也往往會(huì)受到較大的“摧殘”,這主要是由于人臉在高緯度空間中存在的分布不均勻特性所致,而在應(yīng)用非線性降維的圖像識(shí)別技術(shù)后,人臉圖形就能夠較好地實(shí)現(xiàn)自身的緊湊,這就使得人臉識(shí)別系統(tǒng)的工作效率大大提升,總的來說非線性降維的圖像識(shí)別技術(shù)能夠較好地為圖像識(shí)

別提供輔助,上文中LineLian提到的神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù),也能夠在非線性降維的圖像識(shí)別技術(shù)的支持下更好地完成自身工作。

最后圖像識(shí)別技術(shù)的對(duì)產(chǎn)品領(lǐng)域的應(yīng)用

隨著智能網(wǎng)絡(luò)中的AI技術(shù)不斷發(fā)展,其本身將在產(chǎn)品數(shù)據(jù)安全、AI+醫(yī)療產(chǎn)品、AI+直播產(chǎn)品、AI+社交產(chǎn)品等垂直領(lǐng)域產(chǎn)生重要的產(chǎn)品應(yīng)用。

之前人機(jī)圍棋大戰(zhàn),最終人類頂尖棋手李世石以 1:4 不敵 Google 出品的人工智能 AlphaGo。其核心原理采用了多層神經(jīng)網(wǎng)絡(luò)對(duì)圖像進(jìn)行分析,同時(shí)運(yùn)用深度學(xué)習(xí)算法總結(jié)規(guī)律,最終得出戰(zhàn)勝人類高手的棋招。

圖像鑒別,10000 個(gè)場(chǎng)控都干不來互聯(lián)網(wǎng)的開放不僅帶來了自由,同樣也成為垃圾信息的溫床。最為人熟知的一個(gè)職位叫做“鑒黃師”,代表人物自然是“唐馬儒”,但實(shí)際上“唐馬儒”再多也滿足不了現(xiàn)在對(duì)于圖像鑒別和挖掘的需求。最好的例子就是前不久爆出的“直播造人”,視頻和直播類內(nèi)容的興起使得對(duì)內(nèi)容的鑒定需求呈幾何倍數(shù)增長(zhǎng)。

直播對(duì)于審核的實(shí)時(shí)性要求太高,同時(shí)在線的直播數(shù)量大,一不小心違規(guī)的東西就上線了。傳統(tǒng)的解決方案是通過人力完成,所需要的人數(shù)會(huì)與主播成一個(gè)比例。通常都是好幾百人坐在屏幕前面持續(xù)對(duì)閃過的畫面進(jìn)行篩選,如果發(fā)現(xiàn)不符合規(guī)定就進(jìn)行人工處理。而AI+時(shí)代的產(chǎn)品趣向是利用AI圖像識(shí)別技術(shù)。

另外在公共安全領(lǐng)域中,人臉識(shí)別產(chǎn)品的應(yīng)用就能夠較好的提高市場(chǎng)社會(huì)的安全性與便利性;而在醫(yī)學(xué)領(lǐng)域中,心電圖與 B 超的識(shí)別將大大促進(jìn)用戶醫(yī)療事業(yè)的便捷;而在農(nóng)業(yè)領(lǐng)域中,種子識(shí)別科技產(chǎn)品與食品品質(zhì)檢測(cè)科技產(chǎn)品的應(yīng)用將大大提高農(nóng)產(chǎn)品的生產(chǎn)質(zhì)量,例如我家種了幾十畝葡萄 葡萄需要剪枝 修果 摘葉 需要很多的勞動(dòng)力, 感覺很多環(huán)節(jié)可以通過圖像識(shí)別的機(jī)器來處理,粒徑不同的果粒,大小不一的葉片,高度不同的枝條,我總覺得可以通過圖像對(duì)比來區(qū)分,篩選,這樣的AI圖像識(shí)別機(jī)器人才是剛性需求。在日常生活中圖像識(shí)別技術(shù)在冰箱中的運(yùn)用將大大提高用戶生活的便利性,這一應(yīng)用能夠?qū)崿F(xiàn)自動(dòng)冰箱食品列表生成、食品保鮮狀態(tài)的顯示、食物最佳儲(chǔ)存溫度的判斷等功能,這些將大大提高用戶的生活品質(zhì)。在未來科學(xué)技術(shù)的不斷發(fā)展中,AI的圖像識(shí)別技術(shù)還將實(shí)現(xiàn)更為長(zhǎng)足的發(fā)展,而這一發(fā)展也將能夠更好地接受圖像識(shí)別技術(shù)產(chǎn)品所帶來的服務(wù),最終大大提高用戶的生活質(zhì)量。

作為一門科技含量較高的新興技術(shù),AI的圖像識(shí)別技術(shù)已經(jīng)與用戶的生活緊密結(jié)合在一起,而為了保證其能夠更好的為用戶提供服務(wù),對(duì)于科技網(wǎng)絡(luò)從業(yè)緊密相關(guān)的產(chǎn)品技術(shù)人員就必須大力推進(jìn)AI圖像識(shí)別技術(shù)產(chǎn)品的不斷學(xué)習(xí)與創(chuàng)新,這對(duì)于我們產(chǎn)品經(jīng)理未來創(chuàng)造的很多產(chǎn)品息息相關(guān)并將提高產(chǎn)品效率和切中用戶對(duì)產(chǎn)品的剛性需求。

產(chǎn)品思維是抓住機(jī)遇,需求一旦過氣了或者被競(jìng)爭(zhēng)對(duì)手超越了產(chǎn)品想勝出是是十分困難的,只能跟隨市場(chǎng)的步伐去追市場(chǎng)的需求而迭代。而AI+時(shí)代的產(chǎn)品經(jīng)理應(yīng)該有的思維模式是作品思維,不僅僅是追隨需求,更多的是錘煉過濾并真金不怕火煉般的引領(lǐng)需求的潮流。

產(chǎn)品滿足用戶的需求有一個(gè)閾值,產(chǎn)品值低于閾值用戶會(huì)覺得了無生意,即產(chǎn)品一般般也即產(chǎn)品經(jīng)理做了功能經(jīng)理,產(chǎn)品值等于閾值產(chǎn)品功能基本滿足了用戶的需求,而只有產(chǎn)品經(jīng)理駕馭了需求,把產(chǎn)品做成作品產(chǎn)品值才有可能高于閾值,任何時(shí)候產(chǎn)品經(jīng)理應(yīng)該學(xué)習(xí)到高于需求閾值的產(chǎn)品方法論。AI+時(shí)代圖片識(shí)別技術(shù)就是起點(diǎn)!

如果你想系統(tǒng)化入門AI產(chǎn)品經(jīng)理,掌握AI產(chǎn)品經(jīng)理的落地工作方法,戳這里>http://996.pm/7bjab

#專欄作家#

連詩路,公眾號(hào):LineLian。微信私號(hào) Line15201991967,人人都是產(chǎn)品經(jīng)理專欄作家,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

專欄作家

連詩路AI產(chǎn)品,公眾號(hào):連詩路AI產(chǎn)品。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進(jìn)化論:AI+時(shí)代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 閾值

    回復(fù)
  2. 很棒的一篇文章,雖然在圖像處理算法講解這一塊,對(duì)于不懂這個(gè)技術(shù)的人稍顯生澀,但總體來說,對(duì)AI技術(shù)的發(fā)展,應(yīng)用等做了很好的闡釋,謝謝分享

    回復(fù)
  3. nice

    來自廣東 回復(fù)
  4. V587

    來自上海 回復(fù)