Deepseek為什么比Openai便宜?

0 評(píng)論 227 瀏覽 0 收藏 9 分鐘

隨著AI技術(shù)的迅猛發(fā)展,DeepSeek作為新興的AI模型引起了廣泛關(guān)注。本文將探討DeepSeek為何在成本上相比OpenAI更具優(yōu)勢(shì),分析其在算法優(yōu)化、算力利用、推理成本和產(chǎn)品思維等方面的創(chuàng)新。

很多人讓我聊一deepseek,通過(guò)一個(gè)把國(guó)外科技股票打下來(lái)多少去聊deepseek,這個(gè)話題沒(méi)有意義。

你當(dāng)個(gè)熱點(diǎn)去講可以,分析什么國(guó)運(yùn)級(jí)別,實(shí)在是一言難盡……很多大V其實(shí)自己都沒(méi)有用過(guò),他就是互聯(lián)網(wǎng)上隨便搜了點(diǎn)素材,人云亦云的胡扯。

于是出現(xiàn)了一邊倒,但是說(shuō)法兩種極端一個(gè)說(shuō)比比任何生成式模型都要好用,企業(yè)省錢的一種方式,另一種則吹成人工智能的高級(jí)形態(tài)。我不認(rèn)同后者,我認(rèn)同前者。

我們用了另外一種方式達(dá)到了目的,這個(gè)就是現(xiàn)階段市場(chǎng)需求的一個(gè)產(chǎn)品,所以它爆了,確實(shí)是有點(diǎn)意思的。

這種爆炸級(jí)現(xiàn)象,我看了很多博主去分析,從直觀上去感受deepseek確實(shí)很好用,但是你說(shuō)它是人工智能的高級(jí)形態(tài),我認(rèn)為不太對(duì)。

為什么?

打個(gè)比方,類似于美國(guó)底特律初代油車的時(shí)代,車企從跑車、高性能怪獸、高端車型開始做起。那時(shí),占領(lǐng)用戶心智的并不是“這車有多高端”,而是“這車能快速將你帶到目的地”。雖然車是個(gè)高昂的奢侈品,大多數(shù)人并非專業(yè)的造車專家,大家只知道這輛車好看、跑得快,但要擁有它,確實(shí)需要花費(fèi)不小的代價(jià)。

直到日本豐田把技術(shù)應(yīng)用到家用車領(lǐng)域,它才迅速占領(lǐng)了市場(chǎng)。市場(chǎng)不再關(guān)心車的底盤多強(qiáng)、速度多快,反而更加看重的是:我需要一部車,它能夠帶我和家人安全、方便地到達(dá)目的地,這才是消費(fèi)者最關(guān)心的。于是,市場(chǎng)的需求發(fā)生了轉(zhuǎn)變,汽車的普及化才得以實(shí)現(xiàn)。

類比一下特斯拉是從ModelX慢慢做到現(xiàn)在的3和Y,而我們的新能源都是盡可能的去壓縮成本,把最好的功能堆上去。這是產(chǎn)品思維上的差異….

我前兩篇有講到類似的觀點(diǎn)。

簡(jiǎn)單點(diǎn)說(shuō)就是,漂亮國(guó)喜歡頂層設(shè)計(jì)產(chǎn)品,然后降維打擊市場(chǎng),是一個(gè)完整的資本套路,而我們喜歡做的就是平權(quán),一切平權(quán)。

這次的市場(chǎng)反應(yīng)激烈,也印證了閃電式擴(kuò)張依然奏效,主打就是快,這個(gè)還是蠻牛逼的。估計(jì)漂亮國(guó)那邊也沒(méi)有想到我們能這么快,時(shí)間短花費(fèi)少,這就是市場(chǎng)爆炸的原因。

當(dāng)然爆炸的不是我們這些B端用戶,也不是用戶端。而是資本和一些投資者,他們才是對(duì)計(jì)算成本最在乎的那類群體。

那Deepseek開發(fā)成本為什么那么便宜?

這里面有幾個(gè)點(diǎn)

能夠降低研發(fā)成本的核心原因在于其在算法優(yōu)化、算力利用、推理成本和產(chǎn)品思維等方面的多重創(chuàng)新。

第一算法的持續(xù)優(yōu)化(如FP8和混合MoE)以及算力的通縮,成功降低了所需算力。

第二在算法利用上面很多人認(rèn)為訓(xùn)練效率的提高意味著減少投入,但實(shí)際上,這種效率的提升更多的是為了進(jìn)一步榨干算力,從而獲得更大的收益。

第三是DeepSeek架構(gòu)與標(biāo)準(zhǔn)的transformer架構(gòu)相比,繞過(guò)了CUDA架構(gòu),這使得它能夠相對(duì)輕松地支持各種類型的硬件,尤其是AMD等非NVIDIA的GPU支持。這一設(shè)計(jì)不僅降低了推理成本,還讓其可以更廣泛地應(yīng)用于不同硬件平臺(tái)上。我在下一篇會(huì)講到,這個(gè)將是deepseek最恐怖的發(fā)展方向。

第四就是產(chǎn)品思維,去掉所謂的現(xiàn)階段沒(méi)有必要性能功能,比如RAG、知識(shí)圖譜、Embedding等,我舉個(gè)例子:DeepSeek-V3 目前沒(méi)有明確提及支持獨(dú)立的 Embedding API。其模型結(jié)構(gòu)采用了共享 Embedding 和 Output Head 的設(shè)計(jì),以減少參數(shù)量和內(nèi)存占用,但這主要是針對(duì)模型訓(xùn)練和推理優(yōu)化,而非提供單獨(dú)的 Embedding 向量生成功能。

如果你真的需要專門的 Embedding 支持,可以考慮其他大模型的,比如OpenAI的 text-embedding-ada-002 或 Cohere 的 embed API。

我用大白話跟大家講。

就像2010年比亞迪F6使用的是三菱6缸發(fā)動(dòng)機(jī),雖然當(dāng)時(shí)他們的大部分零部件都需要外購(gòu),沒(méi)有自己的研發(fā)能力,但通過(guò)新能源的思路,他們最終解決了“發(fā)動(dòng)機(jī)”這個(gè)關(guān)鍵問(wèn)題。這個(gè)過(guò)程中的核心思路就是:如果我們換個(gè)角度思考,可能根本不需要傳統(tǒng)發(fā)動(dòng)機(jī),也能讓車跑得更快。最后,比亞迪通過(guò)電動(dòng)化技術(shù)打破了傳統(tǒng)內(nèi)燃機(jī)的限制,甚至在某些方面超過(guò)了傳統(tǒng)汽車制造商的技術(shù)水平。

對(duì)于AI而言,DeepSeek也在做類似的創(chuàng)新。從外部采購(gòu)到自主研發(fā),再到通過(guò)新的算法和架構(gòu)創(chuàng)新,DeepSeek并不是單純依賴傳統(tǒng)的“發(fā)動(dòng)機(jī)”——比如高算力的硬件和超大規(guī)模的訓(xùn)練數(shù)據(jù)。而是通過(guò)優(yōu)化算法、改進(jìn)推理成本、利用先進(jìn)的推理架構(gòu),把AI從傳統(tǒng)的“發(fā)動(dòng)機(jī)”驅(qū)動(dòng)模式轉(zhuǎn)變?yōu)楦痈咝А⒌统杀镜南到y(tǒng)。就像比亞迪不再局限于傳統(tǒng)內(nèi)燃機(jī),而是通過(guò)新能源技術(shù)提高了效率一樣,DeepSeek通過(guò)算法的創(chuàng)新提升了算力的利用率,達(dá)到了降低研發(fā)成本、提升整體性能的目的。

所以,AI的“發(fā)動(dòng)機(jī)”未必是傳統(tǒng)意義上的算力或者硬件,也可以通過(guò)創(chuàng)新的思維,利用更高效的算法和架構(gòu),幫助AI系統(tǒng)更快、更好地運(yùn)行。正如比亞迪通過(guò)電動(dòng)化重塑了汽車產(chǎn)業(yè),DeepSeek也通過(guò)技術(shù)創(chuàng)新在AI領(lǐng)域取得了突破,走出了一條與傳統(tǒng)做法不同的道路。

就是這個(gè)道理…

最后,說(shuō)一下蒸餾技術(shù),我們沒(méi)有必要去糾結(jié)這些了,技術(shù)上一定是原創(chuàng)了,創(chuàng)新了,是出色產(chǎn)品上是成功的。但不要忘記,后面BYD的研發(fā)成本還在持續(xù)投入…..

本文由人人都是產(chǎn)品經(jīng)理作者【羅福如】,微信公眾號(hào):【羅福如】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!