人工智能從業(yè)者:大牛,工程師和調(diào)參狗

3 評(píng)論 8665 瀏覽 13 收藏 7 分鐘

你眼中的他和他眼中的他是不是同一個(gè)人。

今天準(zhǔn)備來點(diǎn)兒干貨。

你要問這兩天什么火,每個(gè)產(chǎn)品經(jīng)理都會(huì)告訴你人工智能和區(qū)塊鏈。很多人都還沒搞明白這些東西是什么,能解決啥問題,就已經(jīng)懷著一身熱情撲了進(jìn)去,生怕錯(cuò)過下一個(gè)微信。你果哥也是個(gè)沒事兒就喜歡焦慮的人,想了三天三夜,決定去做個(gè)人工智能的落地產(chǎn)品。

不瞞你們,你果哥之前是個(gè)很水的程序員,只會(huì)寫寫UI,調(diào)調(diào)API,連冒泡排序這樣的幼兒園算法,都要咬爛一支筆憋半天。就這水平去搞AI,好比茍到?jīng)Q賽圈還只有一把平底鍋,怎么跟人家98K八倍鏡拼啊。不過你果哥也是見過世面的人,有差距不可怕,為了知彼知己,就把人工智能領(lǐng)域里的專家教授扒了扒,看看他們都是在做什么。

這里面的第一類人,是學(xué)術(shù)界的大牛。人工智能其實(shí)是一門比較老的學(xué)科,上世紀(jì)4、50年代就出現(xiàn)了,但進(jìn)展一直比較緩慢。這幾年有點(diǎn)噴薄的趨勢(shì),一方面算力跟上來了,另一方面學(xué)術(shù)研究起了很大的作用。大家看很多入門書,講回歸分析、聚類,反向傳播,支持向量機(jī),一大堆公式定理,涉及矩陣、概率、求導(dǎo),都是學(xué)術(shù)界的工作。

隨著理論的發(fā)展,很多神經(jīng)網(wǎng)絡(luò)模型被提出來然后完善。最基礎(chǔ)的圖像任務(wù),識(shí)別定位檢測(cè),有幾十個(gè)經(jīng)典的CNN模型可以選。自然語言處理,從RNN到LSTM,記憶力越來越強(qiáng)。往往學(xué)術(shù)界一篇文章,可以帶來一個(gè)領(lǐng)域的繁榮,比如這幾年很火的對(duì)抗網(wǎng)絡(luò),現(xiàn)在已經(jīng)能幫你把片兒里的女演員換成你老婆gaki了。

這里面第二類人,是工業(yè)界的工程師。理論的落地,離不開工程的實(shí)踐。工程上大致有兩部分,一類是各種深度學(xué)習(xí)框架的開發(fā),一類是AI產(chǎn)品的研發(fā)。

其實(shí)一開始的時(shí)候,并沒有什么框架,大家徒手搭神經(jīng)網(wǎng)絡(luò),卷積運(yùn)算,梯度更新全都自己解決。后來有大牛站出來,說干脆我給你們寫一個(gè)框架,把這些基礎(chǔ)的、都用的著的、需要極致的運(yùn)算速度的東西做了,你們資詞不資詞啊?

于是一下子出來很多框架。G家的tensorflow,基于Python和C++,很流行,但是實(shí)際上用起來并不咋地,對(duì)新手不友好,調(diào)bug不容易。tensorflow算是比較低級(jí)的框架,還是要寫很多無用的代碼,keras框架更上一層,基于tensorflow,幾行代碼就能搭起一個(gè)神經(jīng)網(wǎng)絡(luò)。大牛賈清揚(yáng)的caffe,元老級(jí)的框架,封裝的非常好,速度很快,社區(qū)也很活躍,但是,我咧個(gè)神哩,安裝起來那叫一個(gè)費(fèi)勁?,F(xiàn)在在做caffe2,據(jù)說對(duì)移動(dòng)端支持比較好。FB的Torch,學(xué)術(shù)界用的比較多,主要是它基于Lua,把我們這些培訓(xùn)班學(xué)python出來的鄙視慘了。

都說未來是AI的時(shí)代,這里面有個(gè)很重要的前提是要有殺手級(jí)的產(chǎn)品落地?,F(xiàn)在落地比較好的,一個(gè)是一些推薦系統(tǒng),已經(jīng)從傳統(tǒng)的過濾算法,邁向了深度學(xué)習(xí)的路子。除此之外,如果C端不夠成熟,從B端切入也是個(gè)不錯(cuò)的思路。

最后再說說,人工智能領(lǐng)域,還有一群從業(yè)者躲在墻角瑟瑟發(fā)抖,那就是大家說的調(diào)參狗。一個(gè)神經(jīng)網(wǎng)絡(luò)從理論到落地,有這么幾個(gè)階段,一個(gè)是模型構(gòu)建,就是把別人論文里的網(wǎng)絡(luò)搭建起來。然后是模型訓(xùn)練,把自己需要的數(shù)據(jù)準(zhǔn)備好,然后部署到顯卡上去跑,這個(gè)過程有很多參數(shù)要調(diào),很玄,屬于老中醫(yī)看病,全靠經(jīng)驗(yàn),妙,不可言。一名調(diào)參狗的日常是這樣的:

調(diào)參狗接到需求,第一件事就是去github和各種框架的model zoo上當(dāng)搬運(yùn)工。調(diào)參狗沒有設(shè)計(jì)網(wǎng)絡(luò)的能力,如果github上沒有,就只能看論文動(dòng)手?jǐn)]了,不僅費(fèi)時(shí)費(fèi)力,出了bug還得到處求人。

模型搭好了,調(diào)參狗開始徹夜整理數(shù)據(jù)。你果哥有句話常常掛在嘴上,就是有多少人工,就有多少智能。很多時(shí)候大家用的模型是一樣的,你牛逼就牛逼在有高質(zhì)量的標(biāo)注數(shù)據(jù)。實(shí)在沒有?威脅老板買買買啊。

數(shù)據(jù)準(zhǔn)備好了,調(diào)參狗就開始調(diào)參了。嗯,先用默認(rèn)值來一遍,不行,試試小一點(diǎn)的LR呢?不行,換個(gè)initializer試試?艾瑪,一不小心過擬合了,快快快,加大正則,加大正則還有救。

很不幸,你果哥干的就是調(diào)參狗的活。這不,沒日沒夜瞎折騰,時(shí)光小視頻終于上線了。它能幫你的手機(jī)相冊(cè)智能分類、整理、去差,做成小視頻,一鍵即成。無論是分享給親友,還是發(fā)抖音,都是逼格滿滿的。還不快玩起來,玩起來同學(xué)們~!

#專欄作家#

給產(chǎn)品經(jīng)理講技術(shù),微信公眾號(hào)(pm_teacher),人人都是產(chǎn)品經(jīng)理專欄作家。資深程序猿,專注客戶端開發(fā)若干年,對(duì)前端、后臺(tái)技術(shù)略懂,熱衷于對(duì)新的科技領(lǐng)域的探索。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Pixabay,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 為啥我看這文章會(huì)邊看邊笑,文筆好幽默。

    來自北京 回復(fù)
  2. 這一篇有點(diǎn)太科,普得不夠啊 小白看不懂QAQ

    來自四川 回復(fù)
  3. 賈揚(yáng)清不是賈清揚(yáng),去屑洗發(fā)水

    來自廣東 回復(fù)