AI產(chǎn)品經(jīng)理 VS 數(shù)據(jù)產(chǎn)品經(jīng)理,看這5點區(qū)別與聯(lián)系

5 評論 20189 瀏覽 89 收藏 19 分鐘

本篇從4點區(qū)別,產(chǎn)品目標的區(qū)別、產(chǎn)品實戰(zhàn)過程的區(qū)別、算法模型實戰(zhàn)區(qū)別、產(chǎn)品經(jīng)理駕馭難易程度區(qū)別,和1點聯(lián)系的實戰(zhàn)多案例鑒別AI產(chǎn)品經(jīng)理與數(shù)據(jù)產(chǎn)品經(jīng)理的區(qū)別與聯(lián)系,并通過多個實戰(zhàn)案例掌握數(shù)據(jù)產(chǎn)品經(jīng)理和AI產(chǎn)品經(jīng)理各自的技能。

人工智能快速滲入到各個行業(yè),AI 產(chǎn)品經(jīng)理缺口高達 6.8 萬,成為稀缺人才?!窤I 產(chǎn)品經(jīng)理」項目面向想要通過AI 技術(shù)推動業(yè)務發(fā)展的產(chǎn)品經(jīng)理以及商業(yè)領(lǐng)導者。

將介紹如何創(chuàng)建能帶來商業(yè)價值的 AI 產(chǎn)品,學習 AI 產(chǎn)品開發(fā)流程。你將跟LineLian學習案例研究、創(chuàng)建數(shù)據(jù)集,并構(gòu)建AI模型,熟練掌握各種 AI 概念和實用技能并能夠構(gòu)思、開發(fā)、評估和實施基于人工智能技術(shù)的新產(chǎn)品。

而數(shù)據(jù)產(chǎn)品經(jīng)理也是時下的熱門崗位。

兩者關(guān)系是,AI產(chǎn)品經(jīng)理以數(shù)據(jù)為基礎,數(shù)據(jù)產(chǎn)品經(jīng)理發(fā)展的晉級階段是AI產(chǎn)品經(jīng)理。

第一點區(qū)別:產(chǎn)品目標不同

有時候產(chǎn)品經(jīng)理不得不拍著胸脯提需求,常常會遭遇多方的質(zhì)疑,這個需求靠譜嗎?有時候產(chǎn)品上線后大家感覺應該一片歡喜,但是公司卻沒有帶來很好的商業(yè)增長;

當增長遇瓶頸;當產(chǎn)品不能精準的推薦給用戶;當生產(chǎn)效率變低;當產(chǎn)品經(jīng)理不能預測新的產(chǎn)品需求和新的服務需求;當人力成本變高,當有些固定流程的工作可以被機器人代替;

前類主要是數(shù)據(jù)產(chǎn)品經(jīng)理要解決的問題,通過數(shù)據(jù)來驗證產(chǎn)品提出的產(chǎn)品需求的正確性,通過上線后的數(shù)據(jù)來發(fā)現(xiàn)產(chǎn)品需要迭代改進甚至創(chuàng)新的點,通過數(shù)據(jù)分析,數(shù)據(jù)挖掘發(fā)現(xiàn)原本發(fā)現(xiàn)不了的產(chǎn)品問題,改進問題。

后類主要是AI產(chǎn)品經(jīng)理的產(chǎn)品目標,AI一方面能幫人節(jié)省時間,另外能預測原本發(fā)現(xiàn)不了的產(chǎn)品和服務需求,還有AI能夠解決不確定性的產(chǎn)品服務需求。

數(shù)據(jù)產(chǎn)品經(jīng)理的產(chǎn)品目標是用數(shù)據(jù)確認確定性的需求;AI產(chǎn)品經(jīng)理的產(chǎn)品目標是創(chuàng)造性的解決不確定性的產(chǎn)品需求。

第二點區(qū)別:產(chǎn)品實戰(zhàn)過程不同

先講數(shù)據(jù)產(chǎn)品經(jīng)理的產(chǎn)品過程,再看AI產(chǎn)品經(jīng)理的產(chǎn)品過程。

數(shù)據(jù)產(chǎn)品經(jīng)理的數(shù)據(jù)分析的步驟一般可以分為如下6個步驟:

  1. 明確分析的目的
  2. 數(shù)據(jù)準備
  3. 數(shù)據(jù)清洗
  4. 數(shù)據(jù)分析
  5. 數(shù)據(jù)可視化
  6. 分析報告

數(shù)據(jù)產(chǎn)品經(jīng)理案例:朝陽醫(yī)院醫(yī)藥銷售情況數(shù)據(jù)分析經(jīng)典案例拆解

1. 分析目的

通過對朝陽區(qū)醫(yī)院的藥品銷售數(shù)據(jù)的分析,了解朝陽醫(yī)院的患者的月均消費次數(shù),月均消費金額、客單價以及消費趨勢、需求量前幾位的藥品等。

2. 數(shù)據(jù)導入

從筆者LineLian本地讀取數(shù)據(jù),如果需要數(shù)據(jù)分析進一步的可以點擊文章最后的鏈接。

3. 數(shù)據(jù)清洗

數(shù)據(jù)清洗包含,行缺失值、列缺失值、異常值如不該出現(xiàn)負值出現(xiàn)了負值,不該過大不該過小等異常值的清洗、數(shù)據(jù)列名的修改變更、數(shù)據(jù)類型的轉(zhuǎn)換、數(shù)據(jù)重新抽取排序等等清洗。

4. 數(shù)據(jù)分析

數(shù)據(jù)產(chǎn)品經(jīng)理的數(shù)據(jù)分析主要是數(shù)據(jù)對應的業(yè)務分析,數(shù)據(jù)場景分析,常由數(shù)據(jù)產(chǎn)經(jīng)理提出產(chǎn)品分析方案,例如本案例中,月均消費次數(shù)的業(yè)務定義計算方式是:月均消費次數(shù) = 總消費次數(shù) / 月份數(shù);

月均消費金額的業(yè)務定義計算方式是:月均消費金額 = 總消費金額 / 月份數(shù);客單價業(yè)務定義計算方式是:客單價 = 總消費金額 / 總消費次數(shù)。等等

5. 數(shù)據(jù)可視化

對于擅長形象思維的同學來說,文不如圖,圖不如視頻,數(shù)據(jù)可視化就是講數(shù)據(jù)分析的文變成形象的圖或者變成可視化直觀化的結(jié)構(gòu)呈現(xiàn)的更直接明了。

例如本案例中藥品銷售前十的情況如下圖:

6. 產(chǎn)品數(shù)據(jù)分析報告

產(chǎn)品數(shù)據(jù)分析報告無固定的形式,根據(jù)筆者的經(jīng)驗有的專家直接帶著一張嘴也行,有的寫成PPT,有的用Word文檔,有的則是PDF,有的是個其他的文檔或者圖片。

AI產(chǎn)品經(jīng)理案例:

AI產(chǎn)品內(nèi)容領(lǐng)域增長方向更加明顯,根據(jù)筆者LineLian實際工作發(fā)現(xiàn)有以下幾個產(chǎn)品實戰(zhàn)過程方案。

  1. 神經(jīng)網(wǎng)絡、機器學習、深度學習以軟件為主的產(chǎn)品;
  2. 機器人、芯片、智能硬件、軟硬件協(xié)同類的產(chǎn)品;
  3. 具有行業(yè)經(jīng)驗以場景驅(qū)動尋找AI賦能;
  4. 以AI算法創(chuàng)新為主。

本篇先講以神經(jīng)網(wǎng)絡、機器學習、深度學習軟件為主的產(chǎn)品方案解決過程。

AI產(chǎn)品經(jīng)理案例:訓練神經(jīng)網(wǎng)絡經(jīng)典案例拆解

  1. 選定一個基礎模型
  2. 設定初始化參數(shù)代入模型
  3. 用訓練集對模型進行訓練
  4. 通過一些數(shù)量指標,評估訓練誤差
  5. 如果訓練誤差不滿足要求,繼續(xù)調(diào)整參數(shù)
  6. 重復7–8次
  7. 采集新的數(shù)據(jù),生成新的數(shù)據(jù)集。

(1)選定一個基礎模型

本篇選擇sklearn.neural作為基礎訓練模型框架。如下圖

(2)設定初始化參數(shù)代入模型

設置神經(jīng)網(wǎng)絡模型參數(shù),隱藏層坐標大小(50,50)。

(3)訓練出模型,用訓練集對模型進行訓練

導入數(shù)據(jù),需要如下圖中數(shù)據(jù)集的同學請觀看筆者的微信公眾號LineLian數(shù)智產(chǎn)品窗口。

一次訓練模型,采用訓練集數(shù)據(jù)訓練MLP分類器模型

一次查看模型訓練結(jié)果

將一次訓練的模型保存

(4)通過一些數(shù)量指標,評估訓練誤差

通過準確率數(shù)據(jù)、通過繪制誤差曲線等等評估模型訓練效率。

(5)如果訓練誤差不滿足要求,繼續(xù)調(diào)整參數(shù)

重新優(yōu)化節(jié)點數(shù)等參數(shù),再次訓練模型

(6)重復7–8

重新調(diào)整,坐標、節(jié)點、訓練次數(shù)等參數(shù)、超參數(shù),重復訓練模型,最終選擇優(yōu)秀的模型備用。

(7)選擇新的數(shù)據(jù),生成新的數(shù)據(jù)集

本篇使用的是著名的MINST數(shù)據(jù)集,如果需要請關(guān)注筆者的微信公眾號LineLian數(shù)智產(chǎn)品窗口。

針對這個圖像數(shù)據(jù)集存在的問題比較明顯,1.訓練的數(shù)據(jù)數(shù)量;2.數(shù)據(jù)標注的質(zhì)量;鑒于此,可以使用自己的自有Label數(shù)據(jù)集重新訓練新的模型。

第三點區(qū)別:算法模型不同

數(shù)據(jù)產(chǎn)品經(jīng)理常用的算法如下:

對于數(shù)據(jù)分析所采用的的算法非常多,主要是解決驗證性和確定性問題的算法,例如:回歸、三次多項式等等算法均可以屬于數(shù)據(jù)產(chǎn)品經(jīng)理采用的數(shù)據(jù)分析算法。

1. RFM算法模型

RFM模型想必很多搞數(shù)據(jù)做產(chǎn)品運營的同學都聽說過,最常用在用戶分層管理中。而且很多提到RFM模型都會動不動就祭出。

RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段。

2. CART: 分類與回歸樹

CART, Classification and Regression Trees。

在分類樹下面有兩個關(guān)鍵的思想:第一個 是關(guān)于遞歸地劃分自變量空間的想法;第二個想法是用驗證數(shù)據(jù)進行剪枝。

3. K-Means算法

k-means algorithm算法是一個聚類算法,把n的對象根據(jù)他們的屬性分為k個分割(k < n)。

它與處理混合正態(tài)分布的最大期望算法(本十大算法第五條)很相似,因為他們都試圖找到數(shù)據(jù)中自然聚類的中心。

它假設對象屬性來自于空間向量,并且目標是使各個群組內(nèi)部的均方誤差總和最小。

4. 關(guān)聯(lián)規(guī)則Apriori算法

Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法。其核心是基于兩階段頻集思想的遞推算法。該關(guān)聯(lián)規(guī)則在分類上屬于單維、單層、布爾關(guān)聯(lián)規(guī)則。在這里,所有支持度大于最小支持度的項集稱為頻繁項集,簡稱頻集。

5. SVM支持向量機

支持向量機,英文為Support Vector Machine,簡稱SV機(論文中一般簡稱SVM)。

它是一種監(jiān)督式學習的方法,它廣泛的應用于統(tǒng)計分類以及回歸分析中。支持向量機將向量映射到一個更高維的空間里,在這個空間里建立有一個最大間隔超平面。在分開數(shù)據(jù)的超平面的兩邊建有兩個互相平行的超平面,分隔超平面使兩個平行超平面的距離最大化。假定平行超平面間的距離或差距越大,分類器的總誤差越小。一個極好的指南是C.J.C Burges的《模式識別支持向量機指南》。van der Walt 和 Barnard 將支持向量機和其他分類器進行了比較。

6. 最大期望(EM)算法

在統(tǒng)計計算中,最大期望 (EM,Expectation–Maximization)算法是在概率(probabilistic)模型中尋找參數(shù)最大似然估計的算法,其中概率模型依賴于無法觀測的隱藏變量(Latent Variabl)。最大期望經(jīng)常用在機器學習和計算機視覺數(shù)據(jù)集聚(Data Clustering)領(lǐng)域。

7. PageRank算法

PageRank是Google算法的重要內(nèi)容。2001年9月被授予美國專利,專利人是Google創(chuàng)始人之一拉里?佩奇(Larry Page)。因此,PageRank里的page不是指網(wǎng)頁,而是指佩奇,即這個等級方法是以佩奇來命名的。PageRank根據(jù)網(wǎng)站的外部鏈接和內(nèi)部鏈接的數(shù)量和質(zhì)量,衡量網(wǎng)站的價值。

PageRank背后的概念是,每個到頁面的鏈接都是對該頁面的一次投票,被鏈接的越多,就意味著被其他網(wǎng)站投票越多。這個就是所謂的“鏈接流行度”——衡量多少人愿意將他們的網(wǎng)站和你的網(wǎng)站掛鉤。PageRank這個概念引自學術(shù)中一篇論文的被引述的頻度——即被別人引述的次數(shù)越多,一般判斷這篇論文的權(quán)威性就越高。

8. AdaBoost 迭代算法

Adaboost是一種迭代算法,其核心思想是針對同一個訓練集訓練不同的分類器(弱分類器),然后把這些弱分類器集合起來,構(gòu)成一個更強的最終分類器(強分類器)。

其算法本身是通過改變數(shù)據(jù)分布來實現(xiàn)的,它根據(jù)每次訓練集之中每個樣本的分類是否正確,以及上次的總體分類的準確率,來確定每個樣本的權(quán)值。

9. 其他數(shù)據(jù)分析算法模型

AI產(chǎn)品經(jīng)理常用的算法如下:

(1)神經(jīng)網(wǎng)絡算法模型

起步神經(jīng)網(wǎng)絡算法( Neural Network )是機器學習中非常非常重要的算法。這是整個深度學習的核心算法,深度學習就是根據(jù)神經(jīng)網(wǎng)絡算法進行的一個應用特例。某種程度上來說AI產(chǎn)品的入門在于對神經(jīng)網(wǎng)絡算法的理解和應用。

(2)機器學習算法模型 Maching learning

機器學習的對象是:具有一定的統(tǒng)計規(guī)律的數(shù)據(jù)。

機器學習根據(jù)任務類型,可以劃分為:

  • 監(jiān)督學習任務:從已標記的訓練數(shù)據(jù)來訓練模型。主要分為:分類任務、回歸任務、序列標注任務。
  • 無監(jiān)督學習任務:從未標記的訓練數(shù)據(jù)來訓練模型。主要分為:聚類任務、降維任務。
  • 半監(jiān)督學習任務:用大量的未標記訓練數(shù)據(jù)和少量的已標記數(shù)據(jù)來訓練模型。
  • 強化學習任務:從系統(tǒng)與環(huán)境的大量交互知識中訓練模型。

機器學習根據(jù)算法類型,可以劃分為:

  • 傳統(tǒng)統(tǒng)計數(shù)據(jù)學習:基于數(shù)學模型的機器學習方法。包括SVM、邏輯回歸、決策樹等。

這一類算法基于嚴格的數(shù)學推理,具有可解釋性強、運行速度快、可應用于小規(guī)模數(shù)據(jù)集的特點。

(3)深度學習DeepLearning

深度學習:基于神經(jīng)網(wǎng)絡的機器學習方法。包括前饋神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、遞歸神經(jīng)網(wǎng)絡等。

這一類算法基于神經(jīng)網(wǎng)絡,可解釋性較差,強烈依賴于數(shù)據(jù)集規(guī)模。但是這類算法在語音、視覺、自然語言等領(lǐng)域非常成功。

沒有免費的午餐定理(No Free Lunch Theorem:NFL):對于一個學習算法A,如果在某些問題上它比算法B好,那么必然存在另一些問題,在那些問題中B比A更好。

(4)CNN

卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)是一種前饋神經(jīng)網(wǎng)絡,它的人工神經(jīng)元可以響應一部分覆蓋范圍內(nèi)的周圍單元,對于大型圖像處理有出色表現(xiàn)。

(5)RNN

循環(huán)神經(jīng)網(wǎng)絡(Recurrent neural network:RNN)是神經(jīng)網(wǎng)絡的一種。單純的RNN因為無法處理隨著遞歸,權(quán)重指數(shù)級爆炸或梯度消失問題,難以捕捉長期時間關(guān)聯(lián);而結(jié)合不同的LSTM可以很好解決這個問題。

時間循環(huán)神經(jīng)網(wǎng)絡可以描述動態(tài)時間行為,因為和前饋神經(jīng)網(wǎng)絡(feedforward neural network)接受較特定結(jié)構(gòu)的輸入不同,RNN將狀態(tài)在自身網(wǎng)絡中循環(huán)傳遞,因此可以接受更廣泛的時間序列結(jié)構(gòu)輸入。手寫識別是最早成功利用RNN的研究結(jié)果。

(6)GNN

圖神經(jīng)網(wǎng)絡,圖神經(jīng)網(wǎng)絡劃分為五大類別,分別是:圖卷積網(wǎng)絡(Graph Convolution Networks,GCN)、 圖注意力網(wǎng)絡(Graph Attention Networks)、圖自編碼器( Graph Autoencoders)、圖生成網(wǎng)絡( Graph Generative Networks) 和圖時空網(wǎng)絡(Graph Spatial-temporal Networks)。

(7)其他神經(jīng)網(wǎng)絡。

第四點區(qū)別:產(chǎn)品經(jīng)理駕馭難度不同

產(chǎn)品經(jīng)理駕馭產(chǎn)品的難易程度參考下圖:

第五點聯(lián)系:最后AI產(chǎn)品經(jīng)理與數(shù)據(jù)產(chǎn)品經(jīng)理既有區(qū)別也有聯(lián)系

聯(lián)系是:數(shù)據(jù)產(chǎn)品經(jīng)理常用的元素數(shù)據(jù)是AI產(chǎn)品經(jīng)理常用的元素數(shù)據(jù)+算法+算力三元素之一。

做好數(shù)據(jù)產(chǎn)品經(jīng)理是為了今天的飯碗,做好AI產(chǎn)品經(jīng)理是為了明天的希望。兩者都很重要。

總之AI產(chǎn)品經(jīng)理和數(shù)據(jù)產(chǎn)品經(jīng)理是唇齒相依的關(guān)系!

#專欄作家#

連詩路,公眾號:LineLian。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進化論:AI+時代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash, 基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 老師,好: 看到您舉的例子,覺得更像數(shù)據(jù)分析師 以及 算法工程師 的工作, 那么請問 您認為 這些開發(fā)工程師 和產(chǎn)品的區(qū)別在哪里呢?

    來自上海 回復
    1. 贊同啊。數(shù)據(jù)產(chǎn)品經(jīng)理就是數(shù)據(jù)分析師么?AI產(chǎn)品經(jīng)理還需要參與算法的訓練么?

      來自浙江 回復
  2. 大家期待已久的《數(shù)據(jù)產(chǎn)品經(jīng)理實戰(zhàn)訓練營》終于在起點學院(人人都是產(chǎn)品經(jīng)理旗下教育機構(gòu))上線啦!經(jīng)過迭代優(yōu)化,現(xiàn)在已經(jīng)第7期開啟報名啦
    本課程非常適合新手數(shù)據(jù)產(chǎn)品經(jīng)理,或者想要轉(zhuǎn)崗的產(chǎn)品經(jīng)理、數(shù)據(jù)分析師、研發(fā)、產(chǎn)品運營等人群。
    課程會從基礎概念,到核心技能,再通過典型數(shù)據(jù)分析平臺的實戰(zhàn),幫助大家構(gòu)建完整的知識體系,掌握數(shù)據(jù)產(chǎn)品經(jīng)理的基本功。
    學完后你會掌握怎么建指標體系、指標字典,如何設計數(shù)據(jù)埋點、保證數(shù)據(jù)質(zhì)量,規(guī)劃大數(shù)據(jù)分析平臺等實際工作技能~
    現(xiàn)在就添加空空老師(微信id:anne012520),咨詢課程詳情并領(lǐng)取福利優(yōu)惠吧!

    來自廣東 回復
  3. 連老師,我很喜歡你的課

    來自浙江 回復
  4. 當前公司業(yè)務系統(tǒng)中沒有ai產(chǎn)品經(jīng)理的業(yè)務場景,想請教一下該如何盡快入門ai或者數(shù)據(jù)產(chǎn)品經(jīng)理呢?

    來自浙江 回復