為什么BAT沒做出DeepSeek
DeepSeek 的橫空出世,讓全球科技圈為之震動(dòng)。本文將深入探討 DeepSeek 成功的背后原因,分析其與 BAT 等大廠在 AI 領(lǐng)域的不同發(fā)展路徑,以及其如何通過獨(dú)特的團(tuán)隊(duì)組成、創(chuàng)新的技術(shù)路線和靈活的組織架構(gòu),實(shí)現(xiàn)了大廠未能達(dá)成的突破。
一夜之間,DeepSeek搶走了幾乎所有國(guó)產(chǎn)大模型的風(fēng)頭。
過去一年,無論是在C端出圈的Kimi,還是后在居上的豆包,無論是用戶日活早早突破2億的文心一言,還是登頂全球開源第一的通義千問,與DeepSeek給全球科技圈帶來的震動(dòng)相比,都遜色不少。
這并非是一眾國(guó)產(chǎn)大模型不給力,而實(shí)在是DeepSeek太優(yōu)秀了。
以前國(guó)內(nèi)大廠一直討論的是,距離OpenAI到底有多少年差距,但在DeepSeeK這里,卻是另一番景象。市場(chǎng)熱議的是DeepSeeK是否已經(jīng)干翻了OpenAI,其所代表的開源路線,已經(jīng)在倒逼OpenAI CEO山姆·奧爾特曼進(jìn)行反思:“我個(gè)人認(rèn)為,在這個(gè)問題上我們站在歷史的錯(cuò)誤一邊?,F(xiàn)在需要想出一個(gè)不同的開源策略?!?/p>
DeepSeek的橫空出世,其帶來的影響不僅是在行業(yè)內(nèi),同樣也更在C端市場(chǎng)。
數(shù)據(jù)顯示,僅僅上線20天,DeepSeek的日活就突破了2000萬大關(guān),成為全球增速最快的AI應(yīng)用。與之相比,ChatGPT突破1500萬大關(guān)花了244天,而DeepSeek僅用了18天。上線20天后的DeepSeek日活已達(dá)2215萬,是ChatGPT日活用戶的41.6%,并遠(yuǎn)超豆包日活用戶的1695萬。
這是一場(chǎng)極其夸張的AI風(fēng)暴,并且跟以往截然不同的是,這是一家真正由中國(guó)創(chuàng)業(yè)公司主導(dǎo)引發(fā)的AI風(fēng)暴。
問題在于,為什么是DeepSeek?
要知道,過去兩年國(guó)內(nèi)主流的互聯(lián)網(wǎng)大廠都在大模型賽道上投入重兵,也都跑出了不少產(chǎn)品,市場(chǎng)也普遍抱有期待,希望其中有誰能早上追上OpenAI,與硅谷AI一較高下。
但最終破局的,卻是DeepSeek,大廠沒做到的,它反而實(shí)現(xiàn)了。
一、深耕已久
本質(zhì)上DeepSeek當(dāng)下的爆火,是一種厚積之下的爆發(fā)。
雖說此次DeepSeek是一鳴驚人,但其團(tuán)隊(duì)早就在AI領(lǐng)域布局多年,時(shí)間線上甚至比大廠還早,布局寬度以及深度,也絲毫不比大廠差多少。
公開數(shù)據(jù)顯示,DeepSeek,由知名私募巨頭幻方量化孕育而生,創(chuàng)始人為梁文鋒。
事實(shí)上,早在大學(xué)期間,即便在當(dāng)時(shí),人工智能還是一個(gè)空有理論并無實(shí)質(zhì)的概念,但梁文鋒無比篤信,“人工智能一定會(huì)改變世界”。
這也成為了其創(chuàng)業(yè)以來的終極愿景。
2015年梁文鋒創(chuàng)辦幻方,這是是國(guó)內(nèi)最早使用人工智能進(jìn)行量化交易的公司,2016年第一份由深度學(xué)習(xí)生成的交易倉(cāng)位上線執(zhí)行,2017 年全面應(yīng)用深度學(xué)習(xí)技術(shù)進(jìn)行交易。
到了2018年,幻方官網(wǎng)將“把AI確定為公司的主要發(fā)展方向”寫入公司大事,再一年,幻方干脆改變了組織架構(gòu),成立了幻方AI,對(duì)外自我介紹時(shí)總說自己是一家以大規(guī)模深度學(xué)習(xí)基礎(chǔ)研究與應(yīng)用為核心的人工智能公司。
自2019年至2021年間,幻方相繼自主研發(fā)了“螢火一號(hào)”與“螢火二號(hào)”AI集群,其中“螢火二號(hào)”投資達(dá)到10億元,極大提升算力支持。同時(shí),幻方也積極招募了一批算法科學(xué)家。而創(chuàng)始人梁文鋒本人,則每天也都在寫代碼、跑代碼。
技術(shù)上,一直在穩(wěn)步儲(chǔ)備,基建上,更是沒有落下。
可能很少有人能預(yù)料到,2023年當(dāng)ChatGPT橫空出世時(shí),市場(chǎng)突然發(fā)現(xiàn)在國(guó)內(nèi),擁有高性能GPU芯片最多的不是人工智能公司,而是梁文鋒旗下的幻方量化。
彼時(shí)根據(jù)國(guó)盛證券研報(bào),在云算力端,當(dāng)時(shí)除了幾家互聯(lián)網(wǎng)公司(商湯、百度、騰訊、字節(jié)、阿里),就只有幻方有超過1萬張A100芯片儲(chǔ)備。
足見,幻方對(duì)AI的投入,對(duì)比大廠,絲毫不落下風(fēng)。
二、反套路
還有就是,以梁文鋒為代表的DeepSeek創(chuàng)業(yè)團(tuán)隊(duì)的銳氣。
互聯(lián)網(wǎng)大廠的AI戰(zhàn)略往往依附于現(xiàn)有業(yè)務(wù)體系。騰訊的AI需服務(wù)于社交與游戲生態(tài),阿里的AI需嵌入電商和云計(jì)算場(chǎng)景。這種業(yè)務(wù)協(xié)同邏輯,固然能快速商業(yè)化,卻也框定了技術(shù)演進(jìn)的路徑——資源投入越多,越傾向于優(yōu)化既有模式,而非另辟蹊徑。
而背靠幻方的DeepSeek,既有強(qiáng)大的財(cái)力支持,又有身為創(chuàng)業(yè)者敢于“從零開始”,不怕試錯(cuò)的勇氣。這讓DeepSeek只需要沿著創(chuàng)新的信念,一路蹚過去。
對(duì)于創(chuàng)新,梁文鋒的態(tài)度是非常堅(jiān)決的——“過去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過來做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展。”
“我們看到的是中國(guó)AI不可能永遠(yuǎn)處在跟隨的位置。我們經(jīng)常說中國(guó)AI和美國(guó)有一兩年差距,但真實(shí)的gap是原創(chuàng)和模仿之差。如果這個(gè)不改變,中國(guó)永遠(yuǎn)只能是追隨者,所以有些探索也是逃不掉的?!?/p>
而如何實(shí)現(xiàn)創(chuàng)新,則是拋棄慣性的反套路。
最直接的體現(xiàn),就是在團(tuán)隊(duì)組成上。
圖片來自于幻方官網(wǎng)
國(guó)內(nèi)大廠在進(jìn)入大模型賽道上,通常傾向于去海外挖人,引入技術(shù)大牛,快速拉起一個(gè)團(tuán)隊(duì),然后大干快上。而DeepSeek團(tuán)隊(duì)組多由本土一些Top高校的應(yīng)屆畢業(yè)生組成,不看經(jīng)驗(yàn)資歷,選人的標(biāo)準(zhǔn)一直都是熱愛和好奇心。
同時(shí)在工作機(jī)制上,“我們一般不前置分工,而是自然分工。每個(gè)人有自己獨(dú)特的成長(zhǎng)經(jīng)歷,都是自帶想法的,不需要push他。探索過程中,他遇到問題,自己就會(huì)拉人討論。不過當(dāng)一個(gè)idea顯示出潛力,我們也會(huì)自上而下地去調(diào)配資源。”
“如果有想法,每個(gè)人隨時(shí)可以調(diào)用訓(xùn)練集群的卡無需審批。同時(shí)因?yàn)椴淮嬖趯蛹?jí)和跨部門,也可以靈活調(diào)用所有人,只要對(duì)方也有興趣。”
換句話說,大廠的組織架構(gòu),本質(zhì)是一臺(tái)精密運(yùn)轉(zhuǎn)的“效率機(jī)器”。但顛覆性創(chuàng)新的誕生,需要的恰恰是反效率的“失控”。
而DeepSeek正做到了這一點(diǎn)。
AI藍(lán)媒匯也就為什么大廠沒有做出DeepSeeK的問題,向DeepSeek提問,后者表示,本質(zhì)上是組織慣性、商業(yè)化壓力與技術(shù)路徑共同作用的結(jié)果,并稱:這場(chǎng)由開源模型引發(fā)的技術(shù)革命,正在倒逼大廠重新思考創(chuàng)新邏輯。若無法跳出既有框架,其技術(shù)話語權(quán)或?qū)⑦M(jìn)一步削弱。
作者 | 葉二 編輯 | 魏曉
本文由人人都是產(chǎn)品經(jīng)理作者【藍(lán)媒匯】,微信公眾號(hào):【AI藍(lán)媒匯】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!