久久无码国产视频，国产免费AV片在线无码免费看，久久免费毛片视频播放，丝袜人妻无码13p，午夜电影福利无码网，在线观看高清无码大片，一区二区精品性色，日韩欧美国产专区

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

如何用機(jī)器學(xué)習(xí)滿足產(chǎn)品需求

躚塵

2017-12-06

2 評(píng)論 5374 瀏覽 47 收藏

10 分鐘

關(guān)于機(jī)器學(xué)習(xí)有太多的文章介紹了，如果還對(duì)機(jī)器學(xué)習(xí)一知半解的可以參考一下其他文章，我的其他文章中也有簡(jiǎn)單介紹了機(jī)器學(xué)習(xí)。本文主要介紹機(jī)器學(xué)習(xí)的應(yīng)用以及我們?nèi)绾问褂脵C(jī)器學(xué)習(xí)滿足產(chǎn)品需求，盡量不說(shuō)廢話。

作為AI產(chǎn)品經(jīng)理，不僅需要知道技術(shù)的邊界，還要對(duì)應(yīng)用場(chǎng)景的有足夠的理解。

談到談到機(jī)器學(xué)習(xí)，有些人還不清楚機(jī)器學(xué)習(xí)和深度學(xué)習(xí)、人工智能之間的關(guān)系，甚至以為是一回事——其實(shí)不是這樣的。

下面這個(gè)圖可以幫助大家梳理這三者之間的關(guān)系：

人工智能是個(gè)很泛的概念，有很多不同的方向：

50年代-70年代，人們認(rèn)為賦予機(jī)器推理能力就能夠使得機(jī)器具有智能，具有代表性的工作是圖靈獎(jiǎng)得主A.Newell和H.SImon的“邏輯理論家”程序。隨著研究的逐漸深入，人們意識(shí)到僅有邏輯推理還是遠(yuǎn)遠(yuǎn)達(dá)不到智能的，必須要有先驗(yàn)知識(shí)。

這階段人們?cè)噲D將人類的知識(shí)抽象成規(guī)則輸出到機(jī)器，也就是所謂的專家系統(tǒng)。

顯然，知識(shí)是浩瀚的海洋，很快人們就遇到了瓶頸，幾乎不可能準(zhǔn)確的去概括所有知識(shí)。

例如語(yǔ)音識(shí)別，一開始人們把字詞的發(fā)音做成模板，通過(guò)模板匹配的方式做識(shí)別，可想而知由于不同的人的發(fā)音習(xí)慣，加上不同的口音，語(yǔ)速等等，使得識(shí)別率一直都很差。

關(guān)于語(yǔ)音的特征，是很難人工去刻畫的；于是就有學(xué)者提出了讓機(jī)器自己學(xué)習(xí)的思路，并進(jìn)行了相關(guān)的研究——這就是機(jī)器學(xué)習(xí)。

而深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)方向：得益于計(jì)算能力的提升和互聯(lián)網(wǎng)發(fā)展帶來(lái)的大量數(shù)據(jù)累積，往往只要調(diào)節(jié)好參數(shù)，就能得到不錯(cuò)的性能。

深度學(xué)習(xí)并沒有嚴(yán)格的理論基礎(chǔ)，可以說(shuō)是“大力出奇跡”的一種方法，降低了了機(jī)器學(xué)習(xí)應(yīng)用的門檻。

一、什么時(shí)候可以使用機(jī)器學(xué)習(xí)？

首先我們要明白：什么是智能？

廣義上來(lái)說(shuō)，只要是能夠根據(jù)先驗(yàn)知識(shí)，通過(guò)決策對(duì)外部刺激做出合理反饋的行為都可以稱為智能。

互聯(lián)網(wǎng)產(chǎn)品在這幾年的發(fā)展大多數(shù)是基于流程化，是一種對(duì)于信息的重新組織和優(yōu)化。一般來(lái)說(shuō)只要有一個(gè)輸入，我們就能夠得到一個(gè)預(yù)期的輸出——直觀上就是“不智能”。

仔細(xì)想一下：是不是和人工智能最開始的“邏輯推理”階段有點(diǎn)像？

互聯(lián)網(wǎng)剛開始興起的時(shí)候，流程優(yōu)化、打破信息不對(duì)稱，提升了社會(huì)效率，積累了大量的數(shù)據(jù)；同樣的，現(xiàn)在信息的高度流通，也達(dá)到了一個(gè)“瓶頸”。

那么，如何進(jìn)一步提升效率呢？機(jī)器學(xué)習(xí)給出了一個(gè)答案：現(xiàn)在的大數(shù)據(jù)就相當(dāng)于“先驗(yàn)經(jīng)驗(yàn)”，通過(guò)機(jī)器學(xué)習(xí)，讓信息觸達(dá)能夠做到“千人千面”，降低了無(wú)效信息的損耗，讓資源得到更加合理的配置。

所以使用機(jī)器學(xué)習(xí)的第一個(gè)目標(biāo)，就是要幫助產(chǎn)品突破“瓶頸”，提高效率。

現(xiàn)在回答什么時(shí)候使用機(jī)器學(xué)習(xí)？或者說(shuō)是具備了什么樣的條件的業(yè)務(wù)適合使用機(jī)器學(xué)習(xí)？

1.業(yè)務(wù)目標(biāo)清晰（抽象為分類/回歸問題）

在使用機(jī)器學(xué)習(xí)之前，要明確業(yè)務(wù)目標(biāo)。

單獨(dú)的機(jī)器學(xué)習(xí)在目前是很難直接支撐其一個(gè)場(chǎng)景產(chǎn)品的（區(qū)別于工具產(chǎn)品），所以機(jī)器學(xué)習(xí)的業(yè)務(wù)目標(biāo)一般散落在產(chǎn)品業(yè)務(wù)的各個(gè)角落。例如向用戶推送營(yíng)銷信息，如果全量推送，既無(wú)法保證轉(zhuǎn)化率，又會(huì)騷擾用戶，這是一種“低效率”的方式，可以使用機(jī)器學(xué)習(xí)找出可能會(huì)對(duì)營(yíng)銷信息感興趣的用戶推送。

其實(shí)大多數(shù)適用機(jī)器學(xué)習(xí)的業(yè)務(wù)場(chǎng)景都能夠過(guò)抽象為分類（離散化）/回歸（連續(xù)化）的問題。

常見的分類問題：識(shí)別問題（人臉識(shí)別、指紋識(shí)別、花草識(shí)別）
常見的回歸問題：預(yù)測(cè)問題（點(diǎn)擊率預(yù)測(cè)、轉(zhuǎn)化率預(yù)測(cè)）

2.機(jī)器學(xué)習(xí)的成果能夠作用于業(yè)務(wù)

在某項(xiàng)業(yè)務(wù)中使用機(jī)器學(xué)習(xí)，機(jī)器學(xué)習(xí)的成果要能夠反過(guò)來(lái)作用于業(yè)務(wù)（提升轉(zhuǎn)化率、提高用戶體驗(yàn)等等）。

舉個(gè)例子，假設(shè)你拿到大量的個(gè)人數(shù)據(jù)，可以準(zhǔn)確預(yù)測(cè)出某個(gè)人的購(gòu)物喜好，但是這份數(shù)據(jù)并沒有這些人的聯(lián)系方式，則預(yù)測(cè)的結(jié)果實(shí)際上是沒辦法作用到業(yè)務(wù)的。

再舉個(gè)例子，如自動(dòng)摘要，如果自動(dòng)摘要出來(lái)的結(jié)果準(zhǔn)確率不高，則這些結(jié)果是沒有什么價(jià)值的，同樣不能滿足“能夠作用于業(yè)務(wù)”。

3.具備“特征”

具備特征是很重要的一點(diǎn)。

如垃圾郵件識(shí)別，可能具備的特征有：無(wú)規(guī)則的郵箱地址、含有生僻字、發(fā)信時(shí)間等等——那么很顯然可以使用機(jī)器學(xué)習(xí)解決。

反例，通過(guò)長(zhǎng)相預(yù)測(cè)年收入。

仔細(xì)想想：年收入高的人在長(zhǎng)相上具備什么“特征”嗎？這個(gè)是個(gè)謎；或許還真有，但是不好說(shuō)。但是如果使用機(jī)器學(xué)習(xí)去做這樣的預(yù)測(cè)，除非是做學(xué)術(shù)研究，否則在生產(chǎn)環(huán)境中是不太適合的。

4.具備“樣本”

無(wú)論是統(tǒng)計(jì)機(jī)器學(xué)習(xí)還是深度學(xué)習(xí)，都是需要樣本的。

而樣本獲取可以是基于業(yè)務(wù)經(jīng)驗(yàn)收集，如第3點(diǎn)的垃圾郵件識(shí)別，根據(jù)經(jīng)驗(yàn)我們就可以收集郵箱地址、發(fā)信時(shí)間等等維度的特征。

如果沒有業(yè)務(wù)經(jīng)驗(yàn)，也可以進(jìn)行全量的收集，特征不是越多越好，特征太多就會(huì)造成過(guò)擬合。

如果新加入的特征讓準(zhǔn)確率提升不大但是讓模型的復(fù)雜度提升很大，我們就認(rèn)為這個(gè)特征是不必要的。

二、如何提機(jī)器學(xué)習(xí)產(chǎn)品需求？

除了常規(guī)的界面需求、流程需求之外，涉及到機(jī)器學(xué)習(xí)的產(chǎn)品需求還應(yīng)包括：

1.業(yè)務(wù)場(chǎng)景描述

作用是讓算法人員理解業(yè)務(wù)場(chǎng)景，更好的理解輸入與輸出的需求，可以包含對(duì)業(yè)務(wù)經(jīng)驗(yàn)的描述。

以垃圾郵件識(shí)別為例：在用戶接收的郵件后，推送提醒之前，對(duì)郵件進(jìn)行判定，如果為垃圾郵件，則不推送提醒，將郵件轉(zhuǎn)移到放入”垃圾郵件“文件夾。

2.目標(biāo)（輸出）定義

什么樣的郵件才是垃圾郵件？含有廣告信息？含有欺詐信息？不同的人都有不同的定義。但是總是能夠找得到一個(gè)共識(shí)。定義和特征類似，不是越完整越好，越完整的定義，泛化能力就越差。

例如你把廣告信息定義為垃圾郵件，但是有用戶愛好奇特，喜歡看廣告，對(duì)于他們來(lái)說(shuō)就不是垃圾郵件。

明確的定義主要是用來(lái)指導(dǎo)標(biāo)注，關(guān)于標(biāo)注那些事兒在我的上篇文章已經(jīng)詳細(xì)介紹，有興趣可以翻閱。

關(guān)于垃圾郵件，可以列出幾條定義如：無(wú)內(nèi)容、內(nèi)容雜亂、明顯的黃暴信息等等。

如果是回歸問題，如預(yù)測(cè)銷售量，定義銷售量=受眾群體數(shù)×轉(zhuǎn)化率。受眾群體數(shù)一般可知，則預(yù)測(cè)轉(zhuǎn)化率即算出銷售量。

3.指標(biāo)要求

關(guān)于機(jī)器學(xué)習(xí)的四個(gè)指標(biāo)，簡(jiǎn)單提一下，許多文章都有介紹了。查準(zhǔn)率（Precision）、查全率（Recall）、精確度（Accuracy）、F值。這是封閉測(cè)試集中的指標(biāo)，如果是生物識(shí)別問題，還涉及錯(cuò)誤接受率、錯(cuò)誤拒絕率、等錯(cuò)率等指標(biāo)。產(chǎn)品需要根據(jù)業(yè)務(wù)需要，或者是充分的數(shù)據(jù)分析來(lái)確定指標(biāo)要求。