NLP領域AI產(chǎn)品經(jīng)理必備的常識及術語

3 評論 4345 瀏覽 62 收藏 5 分鐘

AI產(chǎn)品經(jīng)理自然要了解目前AI領域的基本技術,本文介紹了NLP領域AI產(chǎn)品經(jīng)理必備的常識及術語。與大家分享!

產(chǎn)品經(jīng)理要了解基本的技術,那AI產(chǎn)品經(jīng)理自然要了解目前AI領域的基本技術。

當然我們不一定要掌握那些技術但至少要了解基本的常識和專業(yè)術語,便于更好的利用AI技術創(chuàng)造或優(yōu)化產(chǎn)品;同時可以與技術算法人員更輕松的溝通并擁有一定的話語權。

由于目前丸子妹在從事NLP領域相關產(chǎn)品實踐,因此總結(jié)了目前階段接觸到的AI相關的技術以及日常接觸到的專業(yè)術語。希望給正在準備入行或者剛剛?cè)胄胁痪玫耐稽c點幫助,如有疑問和建議歡迎各位及時指正和交流。

NLP領域目前主要有幾個大的任務類別:語音識別和生成、文本分類、信息提取、實體識別、對話系統(tǒng)、機器翻譯、情感分析、知識圖譜等。而每一個大類都有比較經(jīng)典常用的技術和算法模型,了解了這些常識就可以在有新的任務時做好足夠的項目預判及評估。

但由于算法的不斷優(yōu)化創(chuàng)新,新的算法層出不窮。因此需要更加及時的關注領域頂會論文動態(tài)及新模型的優(yōu)劣,不必一味追求最新的算法;而是通過對比分析選擇更合適在自己的產(chǎn)品業(yè)務中落地的算法。

一、常見任務及當下經(jīng)典算法

  • 文本分類/意圖識別CNN / Bert / LSTM+Attention
  • 實體識別:LSTM+CRF
  • 中文分詞:N-Gram / CRF / HMM
  • 文本相似度:TF-IDF / BM25+Bert
  • 文本摘要Bert+Textrank
  • 問答系統(tǒng)/機器翻譯:Transformer+Bert / Seq2seq+Attention
  • 情感分析:Word2vec+LSTM / CNN

二、常見知識點、術語

  • 人工智能領域兩類算法:基于統(tǒng)計的機器學習算法(Machine Learning) / 深度學習算法(Deep Learning)
  • 人工智能三要素:算法、算力、數(shù)據(jù)
  • 常用的框架:pytorch / sklearn / tensorflow /PaddlePaddle
  • 數(shù)據(jù)標注:為模型訓練提供學習語料的數(shù)據(jù)處理,一般為人工+系統(tǒng)相結(jié)合
  • 預訓練模型:用某個較大的數(shù)據(jù)集訓練好的模型(給出了可使用的初始化參數(shù)),你可以利用它使用自有數(shù)據(jù)集進行訓練并得到合適的模型參數(shù)
  • 詞向量:即將文字數(shù)字化,利用數(shù)學領域的向量表示單詞/短語
  • 語料:語言材料,提供給算法模型進行學習的基本知識
  • 批處理大?。杭从柧毜?batch_size
  • 訓練數(shù)據(jù)的訓練次數(shù):訓練 epoch 數(shù)
  • 學習率:即 learning_rate

三、詞向量維度:網(wǎng)絡中詞向量的維度

  • 各層網(wǎng)絡卷積核大?。杭?kernel_size
  • 窗口大?。簊kip-gram 算法中的 window_size 參數(shù)
  • 過擬合:在模型訓練過程中效果較好但在測試樣本中準確率較差,表現(xiàn)為模型過分依賴于訓練語料,反之可以理解“欠擬合”
  • 模型蒸餾:算法能夠用小型的網(wǎng)絡從微調(diào)過的文本分類模型中學習信息
  • 蒸餾訓練次數(shù):蒸餾過程遍歷蒸餾數(shù)據(jù)的次數(shù)
  • 評估標準:準確率、召回率、F1、AUC、ROC、損失函數(shù)
  • 監(jiān)督學習:通過已有的訓練語料完成模型訓練,從而在測試樣本驗證模型已經(jīng)學習到的能力
  • 強化學習:將一個已經(jīng)訓練好的模型作為另一個任務的基礎模型,降低成本

好了,以上就是丸子妹根據(jù)實際工作總結(jié)的AI產(chǎn)品經(jīng)理必備的與技術相關的常識和術語,歡迎評論區(qū)補充~

 

本文由 @丸子筆記 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Pixabay,基于CCO協(xié)議。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. ai產(chǎn)品經(jīng)理會在需求文檔里寫這些東西?

    來自廣東 回復
  2. 寫的很實用,希望能加個微信多交流一下,V:939999047

    來自北京 回復
  3. 只是翻譯

    回復