國產(chǎn)大模型發(fā)展史:大模型競爭進(jìn)入“后暴力計算時代”

0 評論 823 瀏覽 11 收藏 14 分鐘

在人工智能領(lǐng)域的前沿戰(zhàn)場上,國產(chǎn)大模型正在悄然崛起,進(jìn)入一個全新的“后暴力計算時代”。在這個時代,效率的提升成為關(guān)鍵,技術(shù)權(quán)力格局也在不斷重構(gòu)。本文將回顧國產(chǎn)AI發(fā)展的歷史,探討DeepSeek引發(fā)的變革如何推動行業(yè)進(jìn)步,并揭示未來大模型競爭中的核心趨勢和挑戰(zhàn)。

AI競技場正靜靜見證著一場深刻的技術(shù)權(quán)力騰挪。

這場由DeepSeek引發(fā)的變革仍未見平息,大模型競爭進(jìn)入“后暴力計算時代”,效率的重要性躍然紙上,而AI權(quán)力也面臨重構(gòu),OpenAI“一家獨大”的局面正不斷受到?jīng)_擊。

后浪兇猛進(jìn)化,前浪披荊斬棘,“城頭變幻大王旗”贏家尚未有定論,如何既通過開源獲取生態(tài)的加持,又利用閉源實現(xiàn)商業(yè)變現(xiàn),才是決勝的關(guān)鍵。

01 中國AI項目乘政策風(fēng)“井噴”

國產(chǎn)AI的發(fā)展在不聲不響間悄然醞釀。2023年被業(yè)內(nèi)人士視為人工智能發(fā)展的分水嶺。

人工智能科學(xué)家李飛飛曾說:“在歷史上,2023 年有望因技術(shù)的深刻變化和公眾覺醒而被人們銘記?!?/p>

而在此之前,關(guān)于人工智能的技術(shù)探索和創(chuàng)新早已不勝枚舉。

1956年約翰·麥卡錫在達(dá)特茅斯會議上首次提出“人工智能”(Artificial Intelligence)概念,AI作為一門學(xué)科正式誕生。

但到了1973年,由于AI研究遭遇瓶頸,對AI的資金投入大幅縮水,發(fā)展進(jìn)入 “寒冬”。

1986年,直到“AI教父”杰弗里·辛頓(Geoffrey Hinton)提出了反向傳播(Backpropagation)算法,神經(jīng)網(wǎng)絡(luò)的復(fù)興讓AI發(fā)展再迎曙光,再到2017年Google提出基于自注意力機制(Self-Attention),取代RNN/LSTM,成為后續(xù)大語言模型(LLM)的核心架構(gòu)……

回望國內(nèi)的AI發(fā)展歷程,2023年同樣是“國產(chǎn)AI時代開啟元年”。

據(jù)天眼查,僅2023年上半年與大模型直接相關(guān)的融資事件超20起,國內(nèi)已發(fā)布的各類大模型數(shù)量超過100個,而到了2024年7月時完成備案并上線的生成式AI大模型數(shù)量接近200個。

直到今天,有機會沖進(jìn)決賽圈的依然只有十幾家。咨詢機構(gòu)弗若斯特沙利文指出,我們目前在通用基礎(chǔ)大模型領(lǐng)域的競爭者已縮減至20余家,主要由互聯(lián)網(wǎng)企業(yè)、云計算巨頭及人工智能創(chuàng)業(yè)公司主導(dǎo)。

大家都是這場沒有硝煙的“戰(zhàn)爭”的親歷者,站在2025年的開年回望,或許是經(jīng)歷了2024年 “百模大戰(zhàn)”的大浪淘沙,DeepSeek才得以在2025年開年在全球科技行業(yè)投擲下“驚雷”,推動國產(chǎn)AI實現(xiàn)了”關(guān)鍵一躍”,站穩(wěn)腳跟。

擁有持續(xù)創(chuàng)新能力的企業(yè)逐漸占據(jù)市場主導(dǎo),從圖文轉(zhuǎn)視頻到多語言廣告生成,人工智能的應(yīng)用范圍正在迅速拓展。

與此同時,大模型和智能體技術(shù)也進(jìn)入了加速發(fā)展階段。無論是C端的用戶體驗優(yōu)化,還是B端的企業(yè)解決方案,智能體和大模型正在重新定義技術(shù)與社會的連接方式。

決賽圈里目前有三股力量:一是阿里巴巴、字節(jié)跳動代表的互聯(lián)網(wǎng)大廠、云服務(wù)商,介入大模型;二是科大訊飛代表的人工智能國家隊,以G/B/C聯(lián)動的方式,既做解決方案又做硬件產(chǎn)品;三是智譜、DeepSeek等AI創(chuàng)業(yè)公司,少數(shù)還在堅持基礎(chǔ)模型創(chuàng)新。

產(chǎn)業(yè)鏈上下游處境分化,模型廠商發(fā)展路徑分野。即便“AI六小虎”,也面臨道路分化。例如,百川智能已轉(zhuǎn)向醫(yī)療等行業(yè)大模型;零一萬物將超級大模型訓(xùn)練交給阿里;月之暗面和MiniMax專注做C端應(yīng)用和產(chǎn)品。

業(yè)內(nèi)人士普遍認(rèn)為,與產(chǎn)業(yè)鏈上下游相比,處于中游的模型廠商普遍面臨盈利困境。2025年,大模型決賽圈的選手,還能在基礎(chǔ)大模型層創(chuàng)新的企業(yè),會進(jìn)一步減少。

02 從“燒錢信仰”到“效率革命”

如果說“成本、AI Agent、多模態(tài)”是當(dāng)下AI產(chǎn)業(yè)的三個關(guān)鍵詞,代表著2024年大模型的進(jìn)化方向,那么它們或許也代表著大模型邁向產(chǎn)業(yè)落地的關(guān)鍵節(jié)點。

首先,成本無疑是決定企業(yè)生死的關(guān)鍵,訓(xùn)練和部署大規(guī)模 AI模型對計算資源的龐大需求不容忽視,這也使得企業(yè)必須背負(fù)高昂的計算成本和運維成本。

DeepSeek-R1也正是抓了企業(yè)在效率和成本控制上的痛點,實現(xiàn)了在相對較低的算力投入下,可媲美甚至超越頭部模型的性能表現(xiàn)。

傳統(tǒng)人工智能發(fā)展模式往往依賴于“規(guī)模至上”的邏輯,追求超大規(guī)模模型和超大規(guī)模算力集群。DeepSeek R1的輕量化模型和開源策略,降低了人工智能應(yīng)用的門檻,促進(jìn)了中端算力設(shè)施和分布式數(shù)據(jù)中心的普及。

產(chǎn)業(yè)鏈上游的英偉達(dá),因DeepSeek的出現(xiàn)開始面臨一定需求結(jié)構(gòu)調(diào)整的壓力。

ASIC芯片廠商則迎來了新的發(fā)展機遇。由于ASIC芯片能夠針對特定人工智能應(yīng)用進(jìn)行硬件加速,在能效比和成本控制上具有明顯優(yōu)勢,更適應(yīng)分布式算力發(fā)展的趨勢。

對于算力服務(wù)端來說,區(qū)域性數(shù)據(jù)中心憑借低時延和貼近應(yīng)用場景的優(yōu)勢,開始承接制造業(yè)智能質(zhì)檢、金融風(fēng)控等對延遲敏感的應(yīng)用需求。

AWS、阿里云等云計算巨頭調(diào)整部分大型數(shù)據(jù)中心的建設(shè)策略,加大在邊緣計算和分布式算力布局方面的投入。

而應(yīng)用端則將受益于算力成本的下降,驅(qū)動人工智能在制造業(yè)、金融、醫(yī)療等領(lǐng)域的滲透加速。

在代碼托管平臺GitHub上,已涌現(xiàn)出大量基于DeepSeek模型的集成應(yīng)用案例(awesome deepseek integration),形成“需求牽引供給”的正向循環(huán),實現(xiàn)“算力+行業(yè)”的雙向賦能。

人工智能技術(shù)將加速滲透到各行各業(yè),成為推動產(chǎn)業(yè)升級和經(jīng)濟(jì)發(fā)展的重要引擎。

但值得關(guān)注的是,DeepSeek R1的技術(shù)突破,在降低人工智能應(yīng)用門檻的同時,也可能引發(fā)“杰文斯悖論”。

杰文斯悖論由19世紀(jì)經(jīng)濟(jì)學(xué)家 William Stanley Jevons提出,他發(fā)現(xiàn),隨著煤炭使用效率的提高,煤炭的消耗總量反而增加。這一悖論揭示了一個深刻的經(jīng)濟(jì)規(guī)律:效率的提升并不必然導(dǎo)致資源消耗的減少,反而可能因為成本降低和應(yīng)用范圍擴大,刺激需求增長,最終導(dǎo)致資源消耗總量增加。

微軟 CEO 薩提亞·納德拉引用杰文斯悖論來解釋DeepSeek R1可能帶來的影響,可謂一針見血。

納德拉認(rèn)為,更實惠、更易于訪問的人工智能技術(shù),將通過更快的普及和更廣泛的應(yīng)用,導(dǎo)致需求的激增。隨著人工智能技術(shù)的門檻降低,過去由于成本限制而無法應(yīng)用人工智能的領(lǐng)域,例如中小企業(yè)、邊緣計算場景等,將涌現(xiàn)出大量新的應(yīng)用需求,從而導(dǎo)致算力調(diào)用密度指數(shù)級上升。

新興應(yīng)用場景的爆發(fā),也將加速算力需求的裂變。智能駕駛、具身機器人等前沿領(lǐng)域?qū)崟r算力的需求極為龐大,遠(yuǎn)超DeepSeek技術(shù)優(yōu)化的速度。即使單任務(wù)效率提升數(shù)倍,百萬級智能終端的并發(fā)需求,仍將形成巨大的算力吞噬黑洞。

03 “開源”與“閉源”的協(xié)同

隨著開源大模型DeepSeek的“爆火”,“開源”和“免費”等關(guān)鍵詞頻現(xiàn)。

如果說,在DeepSeek之前,國內(nèi)大模型企業(yè)關(guān)于“開源”和“閉源”的路徑仍多有分歧,現(xiàn)在“開源”、“開放生態(tài)”、擴大朋友圈的呼聲似乎成了主流。

在DeepSeek這條鯰魚的沖擊之下,國內(nèi)大模型企業(yè)展示出更“開放”的姿態(tài),希望加快建立自己的開發(fā)者生態(tài)和應(yīng)用生態(tài)。

而開源模型和閉源模型的關(guān)鍵差異,則可以從基礎(chǔ)條件、技術(shù)層面和商業(yè)化三個維度來觀察。

從基礎(chǔ)條件看,開源模型以公開數(shù)據(jù)集、社區(qū)貢獻(xiàn)數(shù)據(jù)為數(shù)據(jù)來源,以分布式的、開發(fā)者自有的GPU集群為算力支撐,為開發(fā)者、研究者、企業(yè)等提供了平等的接入機會,促進(jìn)了技術(shù)的創(chuàng)新和共享。

閉源模型則是由公司或團(tuán)隊開發(fā),以專有數(shù)據(jù)如用戶行為日志、私有數(shù)據(jù)庫、清洗后公開數(shù)據(jù)為數(shù)據(jù)來源,用戶只能根據(jù)公司提供的接口或平臺使用這些模型。

從盈利場景看,開源模型本身并不直接帶來收益,但它們通常通過附加服務(wù)(如云計算、技術(shù)支持、培訓(xùn)、定制化開發(fā)等)來實現(xiàn)營利。公司可以通過商業(yè)化的方式提供增值服務(wù),依托開源模型形成可持續(xù)的收入來源。

閉源模型的商業(yè)化路徑相對直接,企業(yè)通過授權(quán)許可、訂閱服務(wù)、平臺收費等方式實現(xiàn)營利。閉源模型能為公司帶來高利潤,因為客戶需要為其使用權(quán)限和服務(wù)支付費用。

開源與閉源并非“水火不融”,未來很可能會形成開源與閉源相互作用的形式,開源加速了AI技術(shù)的普及和創(chuàng)新,而閉源則確保技術(shù)能夠在商業(yè)上獲得長足發(fā)展并維持穩(wěn)定性。

未來的贏家將是能同時掌握開源和閉源能力的多面手,,既通過開源獲取生態(tài)勢能,也利用閉源實現(xiàn)價值捕獲。

正如納德拉所說,“超大規(guī)模AI不會出現(xiàn)贏者通吃的局面,開源模式將制衡閉源。”

尾聲

DeepSeek 在當(dāng)下的AI時代將扮演重要角色,就像 Android 之于移動互聯(lián)網(wǎng)革命。

重構(gòu)產(chǎn)業(yè)生態(tài),引發(fā)鏈?zhǔn)椒磻?yīng),加速上層應(yīng)用發(fā)展與下層系統(tǒng)統(tǒng)一。這將調(diào)動起跨越軟硬件和上下游的生態(tài)力量,促使各方加大 “模型 – 芯片 – 系統(tǒng)” 協(xié)同優(yōu)化與垂直打通的投入,進(jìn)一步削弱 CUDA 生態(tài)優(yōu)勢,為國產(chǎn) AI 產(chǎn)業(yè)發(fā)展創(chuàng)造機遇。

DeepSeek 通過技術(shù)創(chuàng)新,在 AI 模型訓(xùn)練過程中實現(xiàn)了對高端進(jìn)口芯片依賴的降低,這為國內(nèi)企業(yè)展示了一條可行的技術(shù)路徑,極大地增強了國內(nèi)企業(yè)自主研發(fā)算力芯片的信心。

博弈,不僅僅是開源以及閉源的技術(shù)選擇,更是涉及 AI 發(fā)展的話語權(quán)、市場主導(dǎo)權(quán)以及算力的分配的角逐。而這場AI權(quán)利爭奪戰(zhàn)已然開始。

作者丨關(guān)鍵幀 編輯丨劉涵

本文由人人都是產(chǎn)品經(jīng)理作者【慢放】,微信公眾號:【慢放】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!