從產(chǎn)品視角說說DeepSeek
近年來,DeepSeek憑借其卓越的技術(shù)實(shí)力和創(chuàng)新應(yīng)用,迅速走紅于市場。本文從應(yīng)用場景、數(shù)據(jù)服務(wù)和研發(fā)成本三個(gè)角度,深入探討DeepSeek的獨(dú)特之處,供大家參考。
近期,DeepSeek真可謂火出天際,相關(guān)的文章和報(bào)道猶如雨后春筍。集中討論的方向主要包括:中美博弈、開源勝利、技術(shù)解析,投資價(jià)值……
然而,作為一個(gè)產(chǎn)品人,只想從以下三個(gè)方面說說我對DeepSeek的理解。
一、應(yīng)用場景:DeepSeek 解鎖高時(shí)效、高精度的復(fù)雜分析決策場景
DeepSeek 的進(jìn)展有望解鎖更多對“響應(yīng)時(shí)效和精度要求極高”的復(fù)雜分析決策場景,例如投資決策、科研輔助、家庭教育、兵棋推演、具身智能、案件分析等。
小參數(shù)模型的優(yōu)勢不僅在于算力成本低,更在于其能夠顯著提升響應(yīng)速度,并支持邊緣計(jì)算。
通過強(qiáng)化學(xué)習(xí)(RL)和模型蒸餾技術(shù),DeepSeek 使得較小參數(shù)的模型也能夠展現(xiàn)出長思維鏈和自我驗(yàn)證的能力。
DeepSeek 為行業(yè)開啟了一個(gè)巨大的想象空間:
許多原本需要深度分析推理的“慢思考”場景,未來可能以“快思考”的速度完成。這并不是說 DeepSeek 已經(jīng)實(shí)現(xiàn)了這一目標(biāo),而是它正在推動(dòng)這一趨勢的發(fā)展。
回顧 2017 年,AlphaGo 已經(jīng)能夠在圍棋這種有限規(guī)則的封閉場景中快速落子,而大語言模型(LLM)則能夠應(yīng)對更加多變、開放的無限場景。
正如《有限與無限的游戲》一書所描述的,這兩種場景共同構(gòu)成了人類社會的全部行為模式。
以往,只有人類的認(rèn)知能力能夠在無限游戲中實(shí)現(xiàn)瞬時(shí)響應(yīng),而未來 AI 也可能具備這種能力。
以馬斯克為例,他的每一句即興表達(dá)幾乎都遵循第一性原理,深度思考率接近 100%,這是一般普通人難以企及的。
類似地,福爾摩斯在第一次見到華生時(shí),僅憑一眼就推斷出他是剛從阿富汗回來的軍醫(yī)。這種瞬間復(fù)雜推理的能力,即便給華生一年時(shí)間也難以完成。
通過大量強(qiáng)化訓(xùn)練,將原本需要“慢思考”的復(fù)雜邏輯推理問題,轉(zhuǎn)變?yōu)榻咏翱焖伎肌钡乃俣?。這種能力的人在專業(yè)領(lǐng)域內(nèi)幾乎無敵。
如果你讀過《思考,快與慢》,可能會更容易理解這一點(diǎn)。書中提到,人類有兩種思考系統(tǒng):
系統(tǒng) 1 ——快速、直覺的“快思考”;
系統(tǒng) 2—— 是緩慢、邏輯的“慢思考”。
通過長期訓(xùn)練,某些系統(tǒng) 2 的行為可以逐漸自動(dòng)化,接近系統(tǒng) 1 的運(yùn)作方式。DeepSeek 帶來的最本質(zhì)改變,正是讓復(fù)雜決策能夠?qū)崿F(xiàn)瞬時(shí)響應(yīng)。
二、數(shù)據(jù)服務(wù):高質(zhì)量專業(yè)數(shù)據(jù)成為稀缺資源
在復(fù)雜場景和垂直領(lǐng)域中,高質(zhì)量的專業(yè)數(shù)據(jù)比以往更加稀缺。
在 GPT-4 發(fā)布時(shí),我曾提出一個(gè)觀點(diǎn):通用訓(xùn)練數(shù)據(jù)已接近耗盡。
后來,Ilya 等業(yè)界大佬也表達(dá)了類似看法,印證了這一猜測。監(jiān)督微調(diào)(SFT)本身存在局限性,如果要進(jìn)一步突破模型上限,強(qiáng)化學(xué)習(xí)是為數(shù)不多的可行路徑。
DeepSeek 的實(shí)踐表明,僅通過強(qiáng)化學(xué)習(xí)就能很好地完成模型的后訓(xùn)練(post-train),從而減少對標(biāo)注數(shù)據(jù)規(guī)模的依賴。
然而,這并不意味著不再需要標(biāo)注數(shù)據(jù)。如果希望大模型能夠解決更復(fù)雜的推理場景,就必須對數(shù)據(jù)結(jié)構(gòu)和標(biāo)注質(zhì)量提出更高要求——即提升評測標(biāo)準(zhǔn)。
具體來說,標(biāo)注評測標(biāo)準(zhǔn)的提升主要體現(xiàn)在兩個(gè)方面:專業(yè)化和擬人化。
那專業(yè)化需要達(dá)到什么程度?
我認(rèn)為,未來各行業(yè)的業(yè)務(wù)專家和領(lǐng)導(dǎo)者需要親自參與數(shù)據(jù)貢獻(xiàn),將他們的認(rèn)知復(fù)刻到大模型中。通用場景數(shù)據(jù)和中低端數(shù)據(jù)外包服務(wù)將不再重要,因?yàn)殚_發(fā)者可以通過導(dǎo)師模型合成數(shù)據(jù)來訓(xùn)練小參數(shù)模型。真正稀缺的是經(jīng)過精心設(shè)計(jì)、篩選、標(biāo)注、核驗(yàn)和優(yōu)化的高質(zhì)量專家數(shù)據(jù)。
擬人化需要達(dá)到什么程度?
每一輪對話都應(yīng)像真人交流,而非機(jī)械地“念稿”?!跋裾嫒恕边@一標(biāo)準(zhǔn)可以無限高,例如像 AGI(通用人工智能)那樣,或者像馬斯克、王陽明那樣的頂尖人類。
那什么樣的數(shù)據(jù)才能訓(xùn)練出如此擬人的模型?
僅僅依賴微信、抖音等平臺上的內(nèi)容數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的。如果這些數(shù)據(jù)足夠有效,互聯(lián)網(wǎng)大廠的大模型性能早已遙遙領(lǐng)先,但事實(shí)并非如此。目前,DeepSeek 在模型性能上表現(xiàn)出色,而 AI 領(lǐng)域的其他新興力量也并未被大廠拉開質(zhì)的差距。
當(dāng)前主流的訓(xùn)練數(shù)據(jù)混合模式是“人工數(shù)據(jù) + 合成數(shù)據(jù)”,但合成數(shù)據(jù)的質(zhì)量遠(yuǎn)不如人類專家。因此,專家們需要親自下場,參與數(shù)據(jù)構(gòu)建。
我認(rèn)為,2025 年將是 AI 數(shù)據(jù)領(lǐng)域的分水嶺,勞動(dòng)密集型的數(shù)據(jù)服務(wù)將逐漸被淘汰,取而代之的是專家密集型的高質(zhì)量數(shù)據(jù)服務(wù)。
這也是為什么 Scale AI 的創(chuàng)始人會因 DeepSeek 的崛起而感到焦慮,甚至呼吁限制中國 AI 發(fā)展——本質(zhì)上是因?yàn)樗麄兊纳虡I(yè)模式受到了沖擊。
三、研發(fā)成本:頭部 AI 公司將控制算力成本與團(tuán)隊(duì)規(guī)模,并提升人才密度
1)算力成本:DeepSeek 展示了低成本、高 ROI(投資回報(bào)率)的模型研發(fā)路徑,讓更多玩家看到了應(yīng)用場景落地的可能性。
這將吸引更多應(yīng)用端玩家入場,并促使資金投入更加堅(jiān)決。同時(shí),DeepSeek 的崛起也加劇了中美 AI 軍備競賽,使得英偉達(dá)芯片斷供問題更加嚴(yán)峻。國產(chǎn)替代芯片的需求因此變得更加迫切,市場對低成本高端芯片的渴望也將推動(dòng)國內(nèi)芯片產(chǎn)業(yè)的發(fā)展,這對國運(yùn)而言是一大利好。
2)人力成本:DeepSeek 的成功揭示了 AI 大廠組織精簡的拐點(diǎn)已經(jīng)到來。
不僅是硅谷,國內(nèi)大廠同樣難以避免這一趨勢。與此同時(shí),低成本、高效率的大模型研發(fā)機(jī)會將刺激更多新老軟件公司加速布局 AI,從而導(dǎo)致 AI 人才呈現(xiàn)結(jié)構(gòu)化流動(dòng)的趨勢。
優(yōu)秀的 AI 公司永遠(yuǎn)缺乏頂尖人才。無論是在算法、工程還是產(chǎn)品領(lǐng)域,100 個(gè)普通工程師的價(jià)值可能遠(yuǎn)不如 1 個(gè)頂尖人才。
這就像房地產(chǎn)和股市中的現(xiàn)象:自 2021 年以來,房價(jià)暴跌,但一線城市的豪宅明顯比剛需房更具抗跌性,因?yàn)楹勒衅洫?dú)立的價(jià)值邏輯。
同樣,在股市中,投資者偏愛龍頭股,表面上是人性使然,但更深層的邏輯在于:龍頭股漲得最早、漲得最多,也跌得最晚。
本文由人人都是產(chǎn)品經(jīng)理作者【并步跳步交叉步】,微信公眾號:【一起侃產(chǎn)品】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!