關(guān)于DeepSeek的三點(diǎn)差異化思考:應(yīng)用場(chǎng)景、數(shù)據(jù)服務(wù)、研發(fā)成本

0 評(píng)論 4868 瀏覽 6 收藏 9 分鐘

DeepSeek的出現(xiàn)不僅在技術(shù)上取得了突破,更在應(yīng)用場(chǎng)景、數(shù)據(jù)服務(wù)和研發(fā)成本等方面帶來(lái)了新的思考。本文將從這三個(gè)維度深入分析DeepSeek的差異化優(yōu)勢(shì)及其對(duì)AI行業(yè)的影響,供大家參考。

蛇年除夕夜,各路自媒體忙著討論DeepSeek:中美博弈、開(kāi)源勝利、技術(shù)解析…

我今天不聊這些,來(lái)簡(jiǎn)單分析3個(gè)趨勢(shì):應(yīng)用場(chǎng)景、數(shù)據(jù)服務(wù)、研發(fā)成本。

先回顧2個(gè)被驗(yàn)證了的DeepSeek的馬前炮:

被驗(yàn)證的馬前炮1:半年前,我認(rèn)為國(guó)內(nèi)最堅(jiān)定AI技術(shù)理想主義者的公司在量化機(jī)構(gòu),DeepSeek現(xiàn)在證明了這個(gè)判斷。DeepSeek能打開(kāi)如今的局面,絕非偶然,技術(shù)認(rèn)知與戰(zhàn)略定力確實(shí)在線。

被驗(yàn)證的馬前炮2:DeepSeek利空英偉達(dá),利好國(guó)產(chǎn)化算力。發(fā)文時(shí),英偉達(dá)創(chuàng)造歷史最高市值蒸發(fā)紀(jì)錄。大洋彼岸OpenAI、Meta們,管理成本的問(wèn)題也被晾火架上烤。

然后分析3個(gè)趨勢(shì):場(chǎng)景、數(shù)據(jù)、成本。

一、應(yīng)用場(chǎng)景

DeepSeek的進(jìn)展,可能解鎖更多高響應(yīng)時(shí)效、高精度要求的復(fù)雜分析決策場(chǎng)景。譬如:投資決策、輔助科研、家庭教育、兵棋推演、具身智能、案件分析等等。

DeepSeek通過(guò)RL和蒸餾,較小參數(shù)的模型也可以涌現(xiàn)出長(zhǎng)思維鏈、自我驗(yàn)證的能力。小參數(shù)模型的優(yōu)勢(shì)不僅是算力成本低,更重要的是提升響應(yīng)時(shí)效、方便邊緣計(jì)算。

DeepSeek開(kāi)啟了一個(gè)巨大的想象空間:大量原本需要深度分析推理的“慢思考”場(chǎng)景,很可能用“快思考”的速度就能完成。不是說(shuō)DeepSeek已經(jīng)做到,而是它解鎖了這個(gè)趨勢(shì)。

2017年Alpha Go已經(jīng)可以在圍棋上快速落子,圍棋是有限規(guī)則的封閉場(chǎng)景。LLM應(yīng)對(duì)更加多變的無(wú)限場(chǎng)景,有本書(shū)叫《有限與無(wú)限的游戲》,講了這兩種場(chǎng)景決策共同組成了人類社會(huì)的全部行為。

以往只有人類的認(rèn)知天花板,才能夠面對(duì)無(wú)限游戲做到瞬時(shí)響應(yīng),未來(lái)AI也可能做得到。

如果看過(guò)馬斯克的采訪,你會(huì)發(fā)現(xiàn)他幾乎每句即興表達(dá),都遵循第一性原理,深度思考率接近100%,普通人類是做不到的。

福爾摩斯第一次看見(jiàn)華生,只看了華生一眼,就推斷出他是剛從阿富汗回來(lái)的軍醫(yī)。這種瞬間復(fù)雜推理的能力,即便給華生1年時(shí)間也搞不定。福爾摩斯通過(guò)大量強(qiáng)化訓(xùn)練,將原本需要“慢思考”才能解決的復(fù)雜邏輯推理問(wèn)題,轉(zhuǎn)變?yōu)楦翱焖伎肌币粯拥乃俣取?/strong>

這種人,在專業(yè)領(lǐng)域內(nèi)就是無(wú)敵的存在。

如果你看過(guò)《思考快與慢》,可能更容易理解。人類有兩種思考系統(tǒng),系統(tǒng)1是快思考,系統(tǒng)2是慢思考。人類通過(guò)長(zhǎng)期訓(xùn)練,某些系統(tǒng)2的行為可以逐漸變得自動(dòng)化,接近系統(tǒng)1的運(yùn)作方式。復(fù)雜決策的瞬時(shí)響應(yīng),才是DeepSeek為應(yīng)用場(chǎng)景帶來(lái)的最本質(zhì)改變。

二、數(shù)據(jù)服務(wù)

復(fù)雜場(chǎng)景、垂直領(lǐng)域、高質(zhì)量的專業(yè)數(shù)據(jù),比以往更加稀缺。

GPT-4o發(fā)布的時(shí)候,我拋出過(guò)這個(gè)觀點(diǎn):

后來(lái)Ilya等大佬也發(fā)表了類似的觀點(diǎn),證明我的猜測(cè),確實(shí)通用的訓(xùn)練數(shù)據(jù)已接近耗盡。SFT本身有局限,如果要進(jìn)一步突破上限,強(qiáng)化學(xué)習(xí)是為數(shù)不多的選項(xiàng)。

DeepSeek – R1證明僅用強(qiáng)化學(xué)習(xí)就可以很好地完成post – train,這樣所需的標(biāo)注數(shù)據(jù)規(guī)模就會(huì)下降。下降不代表沒(méi)有,如果想要大模型解決更復(fù)雜的推理場(chǎng)景,就必須對(duì)數(shù)據(jù)結(jié)構(gòu)、標(biāo)注質(zhì)量提高要求 —— 也就是提升評(píng)測(cè)標(biāo)準(zhǔn)。

提升哪些標(biāo)準(zhǔn)?一個(gè)是專業(yè)化,一個(gè)是擬人化。

專業(yè)化,要到什么程度?我認(rèn)為不久的將來(lái),各行業(yè)的業(yè)務(wù)專家、Leader們都要到親自到一線實(shí)操貢獻(xiàn)數(shù)據(jù),萃取他們的認(rèn)知復(fù)刻到大模型。通用場(chǎng)景數(shù)據(jù)、中低端數(shù)據(jù)外包服務(wù)將不再重要,開(kāi)發(fā)者并不缺這類數(shù)據(jù),可以通過(guò)導(dǎo)師模型來(lái)合成數(shù)據(jù)訓(xùn)練小參數(shù)模型。

高質(zhì)量的專家數(shù)據(jù)將變得尤為重要,并且是經(jīng)過(guò)設(shè)計(jì)、篩選、標(biāo)注、核驗(yàn)、優(yōu)化過(guò)的專家數(shù)據(jù)。

擬人化,要到什么程度?每一輪對(duì)話都像真人,而不像念稿?!跋裾嫒恕边@三個(gè)字的標(biāo)準(zhǔn)可以無(wú)限高,AGI也是像真人,像馬斯克、王陽(yáng)明一樣也是像真人。到底什么樣的數(shù)據(jù),才能訓(xùn)練出像真人的模型?只靠微信、抖音里的那種內(nèi)容數(shù)據(jù)來(lái)堆量,是沒(méi)用的。如果有用,互聯(lián)網(wǎng)大廠們的大模型性能早就可以一騎絕塵,但實(shí)際上并沒(méi)有?,F(xiàn)在一騎絕塵的是DeepSeek,AI六小虎也沒(méi)有在模型水平上被大廠甩開(kāi)質(zhì)的差距。

現(xiàn)在主流的訓(xùn)練數(shù)據(jù)混合式是:人工數(shù)據(jù) + 合成數(shù)據(jù),合成數(shù)據(jù)的質(zhì)量不如人類專家。所以專家們,該下場(chǎng)造數(shù)據(jù)了。

我認(rèn)為2025年是AI數(shù)據(jù)領(lǐng)域的分水嶺,勞動(dòng)密集型的數(shù)據(jù)生意將逐漸被淘汰,轉(zhuǎn)向?qū)<颐芗偷母哔|(zhì)量數(shù)據(jù)服務(wù)。這也是為什么Scale AI創(chuàng)始人被DeepSeek刺激,呼吁限制中國(guó)AI發(fā)展,實(shí)際上是未來(lái)Scale AI的生意更難做,真的很焦慮。

三、研發(fā)成本

頭部AI公司的算力成本、團(tuán)隊(duì)規(guī)模會(huì)大幅控制,但人才密度會(huì)上升。

算力成本:DeepSeek展現(xiàn)出低成本、高ROI的模型讓更多玩家看到應(yīng)用場(chǎng)景落地的可能性,應(yīng)用端玩家會(huì)更多,資金投入會(huì)更堅(jiān)決。

DeepSeek刺激中美AI軍備競(jìng)賽加劇,英偉達(dá)斷供問(wèn)題更嚴(yán)重。國(guó)產(chǎn)替代芯片需求就更加迫切,準(zhǔn)確的說(shuō)市場(chǎng)更加渴望低成本的高端芯片,這對(duì)國(guó)運(yùn)來(lái)說(shuō)是利好。

人力成本:經(jīng)過(guò)DeepSeek的祛魅,AI大廠組織精簡(jiǎn)拐點(diǎn)已至。我想強(qiáng)調(diào),不僅是硅谷,國(guó)內(nèi)大廠也絕對(duì)跑不掉。

同時(shí),更低成本、更高效率的大模型研發(fā)機(jī)會(huì),將刺激更多新老軟件公司加速布局AI,所以AI人才將呈現(xiàn)結(jié)構(gòu)化的流動(dòng)趨勢(shì)。好的AI公司比以往更缺頂尖人才,100個(gè)臭皮匠不如1個(gè)諸葛亮,包括算法、工程和產(chǎn)品。

就像炒房、炒股,21年以來(lái)房?jī)r(jià)暴跌,一線城市的豪宅明顯比剛需抗跌,豪宅自有其獨(dú)立的價(jià)值邏輯。為什么炒股大家都愛(ài)龍頭?表面看是人性使然,更本質(zhì)的邏輯在于:龍頭漲得最早,漲得最多,死得最晚。

所以,未來(lái)優(yōu)秀AI公司的人才密度一定會(huì)提升,將涌現(xiàn)出更多小而美的組織用實(shí)力證明自己。

作者:于長(zhǎng)弘;公眾號(hào):弘觀AI

本文由 @于長(zhǎng)弘 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!