業(yè)務(wù)進(jìn)階:AI圖像識(shí)別

13 評(píng)論 7068 瀏覽 35 收藏 14 分鐘

編輯導(dǎo)語(yǔ):作為一名AI產(chǎn)品經(jīng)理,你需要對(duì)自身所負(fù)責(zé)的業(yè)務(wù)有所洞察,進(jìn)而根據(jù)具體的業(yè)務(wù)需求、用戶需求來(lái)做好產(chǎn)品架構(gòu)設(shè)計(jì)。那么,你了解AI圖像識(shí)別業(yè)務(wù)嗎?本篇文章里,作者便結(jié)合實(shí)際經(jīng)驗(yàn),總結(jié)了AI圖像識(shí)別的相關(guān)業(yè)務(wù)原理,一起來(lái)看一下。

一、靈魂三問(wèn)

1. AI 業(yè)務(wù)的盈利模式是否完善、合理?

個(gè)人認(rèn)為這是PM/PO/BA最容易發(fā)生的問(wèn)題,把自己放在已有業(yè)務(wù)上而喪失觀察相鄰業(yè)態(tài)的大局觀。因?yàn)椴粔蛄私馐袌?chǎng)的多樣性,限制了擴(kuò)展業(yè)務(wù)的思路和眼界。

之前我負(fù)責(zé)的產(chǎn)品主要服務(wù)對(duì)象是G端客戶,幫助他們識(shí)別圖像中的特征,提高業(yè)務(wù)效率。后來(lái)我在衛(wèi)生間靈光一現(xiàn),想到除了G端還可以服務(wù)B端,因?yàn)楹芏嘀行∥⑿推髽I(yè)沒(méi)有技術(shù)能力來(lái)實(shí)現(xiàn)這些系統(tǒng),那么就可以把這些業(yè)務(wù)給產(chǎn)品化,給這些企業(yè)提供AI-a-a-S產(chǎn)品,一來(lái)是增加公司盈利渠道,二來(lái)是通過(guò)市場(chǎng)來(lái)檢驗(yàn)產(chǎn)品,而且最重要的點(diǎn)是能夠留存大量第三方的數(shù)據(jù),這些數(shù)據(jù)對(duì)于企業(yè)來(lái)說(shuō)是巨大的寶藏。

2. ROI能否達(dá)到公司預(yù)期?

ROI的時(shí)間維度是非常重要的因素,不知道有多少項(xiàng)目由于各種因素導(dǎo)致暫時(shí)不能給公司盈利而被砍掉。大象無(wú)形,大音聲稀,沒(méi)有人能永遠(yuǎn)掌握市場(chǎng)的需求,盡量多跟商務(wù)和市場(chǎng)的同事溝通,做好當(dāng)下,規(guī)劃未來(lái)。

3. 產(chǎn)品是否符合公司政策和發(fā)展基調(diào)

PM直接對(duì)公司和用戶負(fù)責(zé),二者的側(cè)重點(diǎn)如同排序一樣,有時(shí)候好的產(chǎn)品并不符合公司利益,絕對(duì)忠于公司,其次才是用戶。

之前我們公司贏利點(diǎn)在G端,但是B端在國(guó)內(nèi)也有大量客戶,公司規(guī)劃的發(fā)展方向也是逐漸摒棄G端以B端為主,所以毫無(wú)疑問(wèn)往B端發(fā)力,不管是不是屬于我負(fù)責(zé)的業(yè)務(wù),都要想方設(shè)法跟B端產(chǎn)生更多業(yè)務(wù)聯(lián)系。

二、產(chǎn)品架構(gòu)設(shè)計(jì)

公司資源、業(yè)務(wù)需求等各種條件都較為復(fù)雜的情況下,可以通過(guò)劃分維度來(lái)設(shè)計(jì)產(chǎn)品,比如可能涉及到配置層、操作層和應(yīng)用層。

1. 配置層

用來(lái)幫助客戶配置AI產(chǎn)品的規(guī)則邏輯等內(nèi)容。包括但不限于

  • AI識(shí)別模型庫(kù):用來(lái)維護(hù)識(shí)別模型的種類(lèi),也是業(yè)務(wù)中科技含量最高的模塊,便于規(guī)劃下沉市場(chǎng)和管理;
  • AI權(quán)限模塊:用來(lái)管理相關(guān)的業(yè)務(wù)人員進(jìn)行操作,定位權(quán)限問(wèn)題,定義使用AI服務(wù)的客戶;
  • 人工審核管理模塊:用來(lái)管理使用AI識(shí)別還是人工識(shí)別的規(guī)則,便于對(duì)不太成熟的算法進(jìn)行優(yōu)化,減少誤識(shí)率;
  • 事件定義模塊:統(tǒng)一定義事件的判斷結(jié)果和觸發(fā)條件,可通過(guò)對(duì)比模型之間的規(guī)則提高業(yè)務(wù)適用率;
  • AI服務(wù)周期:用來(lái)管理AI服務(wù)的有效期。

根據(jù)各公司實(shí)際情況,判斷以上內(nèi)容是否適用。

2. 操作層

對(duì)AI識(shí)別后的結(jié)果進(jìn)行二次檢查。可以設(shè)計(jì)AI標(biāo)注庫(kù),用來(lái)校驗(yàn)AI的識(shí)別結(jié)果,提高正確率。也可以使用人工標(biāo)注的數(shù)據(jù)優(yōu)化現(xiàn)有算法。

3. 應(yīng)用層

AI產(chǎn)生的結(jié)果直接面向客戶。可以設(shè)計(jì)通知觸發(fā)規(guī)則,用來(lái)管理通知的內(nèi)容、觸發(fā)頻率和受眾類(lèi)型等;客戶類(lèi)型,根據(jù)客戶類(lèi)型給客戶展示識(shí)別結(jié)果和數(shù)據(jù)可視化內(nèi)容。

三、圖像識(shí)別原理

1. 概念

通過(guò)當(dāng)前已有數(shù)據(jù)對(duì)算法模型進(jìn)行訓(xùn)練,總結(jié)數(shù)據(jù)的規(guī)則,預(yù)測(cè)新數(shù)據(jù)的結(jié)果。

2. 學(xué)習(xí)方式

分為《預(yù)測(cè)學(xué)習(xí)》和《描述學(xué)習(xí)》。

1)預(yù)測(cè)學(xué)習(xí)

模型訓(xùn)練之前,使用人工的方式提取特征并給打上標(biāo)簽。其目標(biāo)是在給定一系列輸入輸出實(shí)例所構(gòu)成的數(shù)據(jù)集的條件下,學(xué)習(xí)輸入x到輸出y的映射關(guān)系。

這里的數(shù)據(jù)集稱(chēng)為訓(xùn)練集,實(shí)例的個(gè)數(shù)稱(chēng)為訓(xùn)練樣本數(shù)。對(duì)于給定的x,可以對(duì)所視察到的值與預(yù)測(cè)的值進(jìn)行比較。

例如我們現(xiàn)在有大量的獅子和老虎的照片,首先給每張照片都打上對(duì)應(yīng)動(dòng)物的標(biāo)簽。然后把這些帶標(biāo)簽的圖片喂給模型,讓模型知道獅子長(zhǎng)什么樣,老虎長(zhǎng)什么樣。最后我們找一些新的、沒(méi)打標(biāo)簽的圖片給模型,讓它自己識(shí)別圖片里是什么。這就是一個(gè)完整的有監(jiān)督模式的機(jī)器學(xué)習(xí)過(guò)程。

2)描述學(xué)習(xí)

直接把數(shù)據(jù)丟給算法模型,又稱(chēng)為“聚類(lèi)”。

在給定一系列僅由輸入實(shí)例構(gòu)成的數(shù)據(jù)集的條件下,其目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)中的有趣模式。

描述學(xué)習(xí)有時(shí)候也稱(chēng)為只是發(fā)現(xiàn),這類(lèi)問(wèn)題并沒(méi)有明確定義,因?yàn)槲覀儾恢佬枰獙ふ沂裁礃拥哪J剑矝](méi)有明顯的誤差度量可供使用。為了讓機(jī)器能夠理解物體之間的關(guān)系,我們最終把現(xiàn)實(shí)中的特征轉(zhuǎn)化為“向量”進(jìn)行計(jì)算。

例如擎天柱,張三和我,如果細(xì)分的話,張三和我應(yīng)該是一類(lèi),因?yàn)閷儆谌祟?lèi);擎天柱屬于機(jī)械類(lèi)。最后三者才同歸屬于生命體類(lèi)。

3)算法模型

目前所有算法模型都是各有千秋的狀態(tài),沒(méi)有一種算法能夠被證明全面優(yōu)于其他算法,每種算法都是為了解決某一特定場(chǎng)景的問(wèn)題,只有某一特定場(chǎng)景更優(yōu)的算法,可以通過(guò)對(duì)比找到其中最好的算法。

目前出現(xiàn)的相對(duì)流行的算法主要是以對(duì)象、區(qū)域、上下文等場(chǎng)景的分類(lèi)算法:

① 基于對(duì)象的場(chǎng)景分類(lèi)

這種分類(lèi)方法以對(duì)象為識(shí)別單位,根據(jù)場(chǎng)景中出現(xiàn)的特定對(duì)象來(lái)區(qū)分不同的場(chǎng)景;基于視覺(jué)的場(chǎng)景分類(lèi)方法大部分都是以對(duì)象為單位的,也就是說(shuō),通過(guò)識(shí)別一些有代表性的對(duì)象來(lái)確定自然界的位置。

典型的基于對(duì)象的場(chǎng)景分類(lèi)方法有以下的中間步驟:特征提取、重組和對(duì)象識(shí)別。

缺點(diǎn):底層的錯(cuò)誤會(huì)隨著處理的深入而被放大。例如,上位層中小對(duì)象的識(shí)別往往會(huì)受到下屬層相機(jī)傳感器的原始噪聲或者光照變化條件的影響。尤其是在寬敞的環(huán)境下,目標(biāo)往往會(huì)非常分散,這種方法的應(yīng)用也受到了限制。

需要指出的是,該方法需要選擇特定環(huán)境中的一些固定對(duì)象,一般使用深度網(wǎng)絡(luò)提取對(duì)象特征,并進(jìn)行分類(lèi)。例如PCA算法實(shí)現(xiàn)識(shí)別人臉降維原理,排除冗余和噪音的干擾,試驗(yàn)步驟如下:

② 基于區(qū)域的場(chǎng)景分類(lèi)

首先通過(guò)目標(biāo)候選候選區(qū)域選擇算法,生成一系列候選目標(biāo)區(qū)域,然后通過(guò)深度神經(jīng)網(wǎng)絡(luò)提取候選目標(biāo)區(qū)域特征,并用這些特征進(jìn)行分類(lèi)。

③ 基于上下文的場(chǎng)景分類(lèi)

這類(lèi)方法不同于前面兩種算法,而將場(chǎng)景圖像看作全局對(duì)象而非圖像中的某一對(duì)象或細(xì)節(jié),這樣可以降低局部噪聲對(duì)場(chǎng)景分類(lèi)的影響。將輸入圖片作為一個(gè)特征,并提取可以概括圖像統(tǒng)計(jì)或語(yǔ)義的低維特征。

該類(lèi)方法的目的即為提高場(chǎng)景分類(lèi)的魯棒性。因?yàn)樽匀粓D片中很容易摻雜一些隨機(jī)噪聲,這類(lèi)噪聲會(huì)對(duì)局部處理造成災(zāi)難性的影響,而對(duì)于全局圖像卻可以通過(guò)平均數(shù)來(lái)降低這種影響。

基于上下文的方法,通過(guò)識(shí)別全局對(duì)象,而非場(chǎng)景中的小對(duì)象集合或者準(zhǔn)確的區(qū)域邊界,因此不需要處理小的孤立區(qū)域的噪聲和低級(jí)圖片的變化,其解決了分割和目標(biāo)識(shí)別分類(lèi)方法遇到的問(wèn)題。

四、圖像識(shí)別過(guò)程

圖像識(shí)別技術(shù)歸納起來(lái),主要包括4個(gè)步驟:

  1. 首先是獲取信息,主要是指將各類(lèi)信息通過(guò)傳感器向電信號(hào)轉(zhuǎn)換,也就是對(duì)識(shí)別對(duì)象的基本信息進(jìn)行獲取,并通過(guò)“聚類(lèi)”的方式,將其向計(jì)算機(jī)可識(shí)別的信息轉(zhuǎn)換。
  2. 然后是信息預(yù)處理,主要是指采用去噪、變換及平滑等操作對(duì)圖像進(jìn)行處理,基于此使圖像的重要特點(diǎn)提高。
  3. 其次是抽取及選擇特征,主要是指在模式識(shí)別中,抽取及選擇圖像特征,概括而言就是識(shí)別圖像具有種類(lèi)多樣的特點(diǎn),如采用一定方式分離,就要識(shí)別圖像的特征,獲取特征也被稱(chēng)為特征抽取。
  4. 最后是設(shè)計(jì)分類(lèi)器及分類(lèi)決策,其中設(shè)計(jì)分類(lèi)器就是根據(jù)訓(xùn)練對(duì)識(shí)別規(guī)則進(jìn)行制定,基于此識(shí)別規(guī)則能夠得到特征的主要種類(lèi),進(jìn)而使圖像識(shí)別的不斷提高辨識(shí)率,此后再通過(guò)識(shí)別特殊特征,最終實(shí)現(xiàn)對(duì)圖像的評(píng)價(jià)和確認(rèn)。

五、工作應(yīng)用

作為PM\PO\TPM來(lái)說(shuō),給到技術(shù)大佬們的策略是要清晰完整的,舉例:要識(shí)別圖片中的人是否帶帽子,那么這時(shí)我們就要描述清楚帽子的顏色、種類(lèi)和所在位置等維度信息。

最好用爬蟲(chóng)的方式爬取大量帽子,然后判斷帽子是否在人的腦袋上。在語(yǔ)音識(shí)別中,需要建立字符庫(kù),完善優(yōu)化字符庫(kù)的內(nèi)容。

通過(guò)收集和整理,我們對(duì)要產(chǎn)品需求會(huì)有一個(gè)直觀的認(rèn)知,但隨著調(diào)研的繼續(xù),我們還可能會(huì)發(fā)現(xiàn)其他問(wèn)題。為了避免有價(jià)值的信息遺漏,這個(gè)階段我們收集的案例,應(yīng)該具有更多的發(fā)散性。

六、用戶感知提升

對(duì)于用戶來(lái)說(shuō),能夠讓用戶感知到的是產(chǎn)品的擬人度。但AI的輸出是否合理,這個(gè)取決于人的主觀評(píng)判。這也是數(shù)據(jù)標(biāo)注工作所做的意義所在——盡可能通過(guò)標(biāo)注讓模型更像真實(shí)的人。比如在情景對(duì)話中,雖然有些回答聽(tīng)起來(lái)很搞笑,但只要輸出的結(jié)果讓人覺(jué)得合理,就依然會(huì)被人接受。

  • 老巫婆:你說(shuō)這個(gè)世界上最美麗的人是誰(shuí)?
  • AI:是白雪公主!
  • 老巫婆:再給你一次重新組織語(yǔ)言的機(jī)會(huì)!
  • AI:是白雪公主!
  • 老巫婆:你看清楚了,我手里拿著刀呢!
  • AI:是你,你是世界上最美的人!

PS:與AI算法工程師的溝通小技巧

客觀化、可量化、數(shù)字化、就事論事。如下:

業(yè)務(wù)說(shuō):大佬,能不能優(yōu)化下這個(gè)模型,好多地方都不準(zhǔn),客戶都投訴啦。

建議溝通方式:

業(yè)務(wù)說(shuō):博士,這個(gè)模型的準(zhǔn)確率能不能提高到95%?因?yàn)槟壳皥D像上的3個(gè)點(diǎn)都屬于特征點(diǎn),但是沒(méi)有識(shí)別成功。

本文由 @趙大師 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 你好 可以請(qǐng)教一下 如何設(shè)計(jì)AI識(shí)別因業(yè)務(wù)

    來(lái)自重慶 回復(fù)
    1. 設(shè)計(jì)思路需要根據(jù)業(yè)務(wù)來(lái)的,AI識(shí)別是業(yè)務(wù)的中間節(jié)點(diǎn)

      來(lái)自北京 回復(fù)
  2. 小哥哥能不能私聊下,想請(qǐng)教一些問(wèn)題

    回復(fù)
    1. 可以的,805370546

      回復(fù)
  3. AI圖像識(shí)別業(yè)務(wù)真的是一個(gè)很值得學(xué)習(xí)的知識(shí),里面蘊(yùn)含了很多。

    來(lái)自江西 回復(fù)
  4. 之前對(duì)AI識(shí)別的了解不是很多,看完這篇文章讓我懂得了很多。

    來(lái)自江西 回復(fù)
  5. 看完這篇文章讓我對(duì)AI識(shí)別有了新的了解,學(xué)習(xí)到了很多!

    來(lái)自江西 回復(fù)
  6. ai識(shí)別還是挺好的,但是有時(shí)候也不是那么的靈敏,還是需要繼續(xù)精進(jìn)一下的,希望以后可以更好吧

    來(lái)自河南 回復(fù)
  7. ai識(shí)別真的是ai業(yè)務(wù)的進(jìn)階版,現(xiàn)在很多人工智能真的太蠢了

    來(lái)自江西 回復(fù)
    1. 別著急,給人工智障一些時(shí)間,未來(lái)可期~

      來(lái)自北京 回復(fù)
  8. ai業(yè)務(wù)還有很多需要改進(jìn)的地方

    來(lái)自江西 回復(fù)
    1. 是的,讓我們一起改進(jìn)世界!

      來(lái)自上海 回復(fù)
  9. ai識(shí)別真的非常的好用和實(shí)用,建議多多升級(jí)

    來(lái)自江西 回復(fù)