《超越追趕》視角看DeepSeeK的成就

0 評論 2519 瀏覽 4 收藏 18 分鐘

DeepSeek作為國內(nèi)AI領域的一匹黑馬,憑借其在AI大模型技術(shù)上的創(chuàng)新和成本優(yōu)勢,引發(fā)了全球范圍內(nèi)的廣泛關注。本文將從浙大吳曉波教授的“超越追趕”理論出發(fā),深入分析DeepSeek在機會窗口和技術(shù)二次創(chuàng)新方面的成就,供大家參考。

最近令全球嘩然的DeepSeek幾乎擠占了國內(nèi)外各大社交媒體平臺,引起了AI圈、各行業(yè)企業(yè)圈、資本圈、政治圈以及社會各階層的關注和討論。作為國內(nèi)AI領域的一匹現(xiàn)象級的黑馬,DeepSeeK憑借其在AI大模型技術(shù)路線上的創(chuàng)新和成本優(yōu)勢的建立,其立下的“豐功偉績”顯而易見有歷史性的積極面,但也充斥著不同視角的消極面。

積極的一面是國內(nèi)外專家紛紛公開表達,中美AI差距在縮?。◤闹暗?-3年縮短到了1年之內(nèi)甚至半年內(nèi)),優(yōu)化后的架構(gòu)和訓練方式大大降低了對算力的依賴、中國大概率可以擺脫美國的芯片卡脖子問題,進而促進國內(nèi)芯片的發(fā)展。

消極的一面是有些博主從資本視角看這場舉國同慶的盛宴,只不過是資本圈的營銷劇本,只不過是與普通老百姓關系甚遠甚至危機隱私就業(yè)問題的糟心事兒,只不過是依附于頂尖大模型技術(shù)的更新迭代、絕非獨立創(chuàng)新那般優(yōu)越…

但無論全球AI競爭與合作會走向怎么樣的結(jié)局,當下DeepSeek作為一家國內(nèi)大廠、AI六小龍之外的后起之秀,面對行業(yè)領先者、在位者的時候,可以利用好自身稟賦、把握機會窗口,形成后發(fā)優(yōu)勢,最終實現(xiàn)持續(xù)追趕、甚至有望全面超越的成果,就是一個值得被拆解的典范。我們嘗試用浙大吳曉波教授的超越追趕理論,從機會窗口、二次創(chuàng)新2個層面逐一分析,從而看清楚DeepSeek從追趕到超越的外在機會和內(nèi)在邏輯。

注:關于DeepSeeK最近在技術(shù)上的成果、對比及相關的評論,詳見文末的參考文獻

一、DeepSeek是誰?

DeepSeek是一家專注于人工智能開源大模型研發(fā)與應用的科技公司,以“技術(shù)驅(qū)動 + 場景落地”為核心理念,專注于金融、醫(yī)療、政務等高價值領域,提供行業(yè)專用的大模型解決方案。

DeepSeek是在2023年由母公司幻方量化創(chuàng)立的,在此之前它是幻方量化公司內(nèi)部專注于AI研究和應用的團隊,而其母公司幻方量化是一家成立于2016年的量化投資公司,不僅可以為DeepSeek提供了強大的技術(shù)支持和資源,還通過與多家公司的合作,為DeepSeek的模型訓練和應用提供了豐富的數(shù)據(jù)和算力支持。

二、超越追趕理論是什么?

超越追趕理論是由浙江大學吳曉波教授提出的,宏觀上解決國家級的超越追趕問題,微觀上解決企業(yè)通過技術(shù)創(chuàng)新和商業(yè)模式創(chuàng)新實現(xiàn)追趕超越問題的方法論。具體通過把握范式轉(zhuǎn)變的機會窗口,借助技術(shù)和商業(yè)模式上的二次創(chuàng)新、價值網(wǎng)絡的作用來實現(xiàn)趕超。

本篇文章重點先從機會窗口和技術(shù)創(chuàng)新2個層面拆解DeepSeek這類企業(yè)能夠“橫空出世”的外在機會和內(nèi)在邏輯,隨著AI領域和DeepSeek的持續(xù)發(fā)展,我們后續(xù)補充超越追趕理論的其他模塊,從而更系統(tǒng)地進行分析。

為什么這次先從機會窗口和技術(shù)創(chuàng)新2個層面展開,原因在于VUCA時代之下順勢而為是每一個在位者企業(yè)和后發(fā)者企業(yè)的必然選擇,技術(shù)壁壘是每一個在位者企業(yè)和后發(fā)者企業(yè)的立身之本,而機會窗口體現(xiàn)的就是順勢而為,技術(shù)創(chuàng)新強調(diào)的就是技術(shù)壁壘。

三、DeepSeek的機會窗口長什么樣?

機會窗口是市場上絕大多數(shù)企業(yè)都接受某一產(chǎn)品的概念模式,但具有主導地位的產(chǎn)品架構(gòu)還沒有形成的這一特殊時期(引自《超越追趕》),在機會窗口時期,后發(fā)者企業(yè)追趕以及超越的阻力相對更小,或者說領先者與后發(fā)者之間的優(yōu)劣勢差距相對更小,為后發(fā)者追趕及超越創(chuàng)造了機會。

而面對不同有利條件類型的機會窗口時,企業(yè)得選擇適配的追趕模式,并防范掉入追趕陷阱(即落后-引進-再落后-再引進的惡性循環(huán))。

具體來說,不同的有利條件指的是企業(yè)外部的市場環(huán)境、技術(shù)環(huán)境以及企業(yè)內(nèi)部的資源能力情況等三個影響因素的不同組合情況,市場環(huán)境的有利性可以體現(xiàn)為市場需求大或者潛在需求增長快,生產(chǎn)經(jīng)營容易獲得規(guī)模經(jīng)濟和學習效應(主動獲取多樣化信息和知識,并通過相互交流提高吸收程度和運用深度);技術(shù)條件的有利性可以體現(xiàn)為技術(shù)演進具有可預測性且變動慢,或者技術(shù)演化處于混沌期;而資源能力的有利性可以體現(xiàn)為內(nèi)部資源豐富、調(diào)度外部資源能力強等。

我們從《超越追趕》理論總結(jié)的不同有利性組合情況可以看出,市場、技術(shù)、資源能力三個因素中至少有2個處于有利條件時,整體環(huán)境有利性才是相對可觀的、也是相對靠譜的,在追趕超越模式上,企業(yè)可以根據(jù)實際情況相應采取或自主研發(fā)或合作共贏或引進學習或兼并收購等超越方式。

有了以上關于機會窗口相關知識邏輯的補充,我們把目光轉(zhuǎn)向DeepSeek來看其所處的市場環(huán)境、技術(shù)環(huán)境和自身資源能力方面的處境究竟如何?以及它選擇了哪條超越模式的道路?

  • 市場環(huán)境方面,隨著B端和C端對AI的認知、習慣和需要的進一步加深,同時各行各業(yè)急需通過AI技術(shù)革命實現(xiàn)新的商業(yè)升級來解決增長乏力的問題,低成本、優(yōu)性能的AI大模型和場景應用的市場需求是日益增長、越發(fā)緊迫;而且,美國對中國設置芯片禁令等科技封鎖的手段,導致中國面臨AI、新能源等多行業(yè)卡脖子的問題,這個時候高效率、低成本的大模型技術(shù)突破成了中國擺脫卡脖子問題、推動國內(nèi)AI發(fā)展和國產(chǎn)芯片發(fā)展的關鍵需求所在;此外,中國國內(nèi)信創(chuàng)替代(即國產(chǎn)替代)、數(shù)據(jù)本地化等政策的推動,更有利于國內(nèi)AI大模型公司的發(fā)展;總體上看,視窗環(huán)境是有利的。
  • 技術(shù)環(huán)境方面,目前AI大模型技術(shù)的發(fā)展路徑仍屬于百花齊放階段,在模型架構(gòu)、訓練方式、算法創(chuàng)新上有不同選擇來解決不同的需求,模型架構(gòu)創(chuàng)新方面包括Transformer架構(gòu)及其變體、多模態(tài)融合架構(gòu)等并行路徑,訓練方式創(chuàng)新方面有預訓練+微調(diào)、強化學習等并行路徑,算法創(chuàng)新方面有深度學習算法、擴散模型等并行路徑,主導范式仍未形成,AI大模型處于技術(shù)演進的混沌期(即技術(shù)范式轉(zhuǎn)變、技術(shù)演進非線性、方向尚不明確的階段);總體上看,技術(shù)環(huán)境是相對有利的。
  • 資源能力方面,DeepSeek脫胎于母公司幻方量化,作為量化投資的資深玩家,幻方量化在AI領域及金融領域擁有強大的技術(shù)積累、硬件資源和數(shù)據(jù)資產(chǎn),可以為DeepSeek的大模型研發(fā)給到全面的保障和支持;同時,DeepSeek利于技術(shù)開源策略,憑借其資深的行業(yè)積累和技術(shù)創(chuàng)新,吸引了全球開發(fā)者和企業(yè)的參與到整體的開發(fā)中,生態(tài)資源可以不斷豐富;總體上看,內(nèi)外部的資源能力是有利的。

當三個環(huán)境因素均相對有利的情況下,機會窗口是相對明朗的、相對容易打開的,DeepSeek或者類似DeepSeep處境的后發(fā)者可以通過借機會窗口的力、走自主研發(fā)的路,進而獲得超越領先者的機會。事實上,DeepSeek走的也正是“自主研發(fā)”的路線,只不過是建立在引入Google的Transformer大模型的基礎上,進行二次創(chuàng)新后的自主研發(fā),嚴格來說應該屬于引進后的二次創(chuàng)新。

四、DeepSeek的技術(shù)二次創(chuàng)新是什么?

《超越追趕》總結(jié)了關于后發(fā)者技術(shù)追趕實現(xiàn)后發(fā)優(yōu)勢的兩種策略,一種是以較低代價獲取領先者所費不菲積累起來的先進設備和技術(shù),并結(jié)合自身的條件和環(huán)境,對先進技術(shù)進行消化吸收,且在此基礎上展開技術(shù)創(chuàng)新,最終實現(xiàn)趕超;一種是后發(fā)者跳過舊范式直接緊隨新范式。第一種策略適用于技術(shù)生命周期較長、領先者創(chuàng)新迭代速度緩慢的行業(yè)場景,后發(fā)者具備較長的時間窗口來消化吸收和在創(chuàng)新;而第二種策略適用于技術(shù)進步周期短的高新技術(shù)領域,如電子通信、人工智能等。

DeepSeek采取的正是第二種策略,在成熟的Transformer大模型基礎上,通過自主研發(fā),從模型架構(gòu)、訓練方式兩方面進行創(chuàng)新迭代,形成了“架構(gòu)優(yōu)化+訓練方式優(yōu)化”的創(chuàng)新策略,減少了對高性能硬件(GPU)的依賴。

  • 架構(gòu)優(yōu)化,主要表現(xiàn)為多頭潛在注意力機制(MLA)+混合專家機制(MoE)的配合,降低了對內(nèi)存和計算資源的需求。DeepSeek將傳統(tǒng)的多頭注意力機制升級為多頭潛在注意力機制(MLA),如同將一個廠房濃縮成了一個小車間,從而大幅降低對內(nèi)存和計算資源的需求。同時,DeepSeek在傳統(tǒng)的Transformer架構(gòu)基礎上、通過自主研發(fā)引入了混合專家(MoE)機制,將模型中的“計算任務”分配給多個專家模塊,每次只激活任務相關性較高的少數(shù)專家,進一步減少了計算資源的需求。
  • 訓練方式優(yōu)化,主要表現(xiàn)為規(guī)則化獎勵+GPRO模式配合的強化學習模式。DeepSeek拋棄了傳統(tǒng)大模型通過加強預訓練來實現(xiàn)性能提升的方式,選用通過提升推理時的思考能力來實現(xiàn)性能提升的方式(如同不讓小孩花大量精力去刷題背題,而是讓他去做更多的邏輯思考,該比喻引自視頻號AI享科技)。具體的實現(xiàn)邏輯是在僅依靠準確性獎勵和格式獎勵兩條獎勵規(guī)則的引導下,讓大模型自己找到最優(yōu)答案,并通過GRPO(Group Relative Policy Optimization)的優(yōu)化機制形成“輸入問題 → 模型生成多個答案 → 規(guī)則系統(tǒng)評分 → GRPO計算相對優(yōu)勢 → 更新模型”的模型迭代流程,提升模型的學習效率、甚至形成頓悟的效果(如同老師出題后,讓多個小朋友一起做卷子,大模型選出分數(shù)最高的卷子和小朋友,其他小朋友抄就可以了,該比喻引自視頻號AI享科技)。

架構(gòu)優(yōu)化和訓練方式優(yōu)化結(jié)合的技術(shù)創(chuàng)新策略,不僅帶來了大模型效率效能的提升,還帶來了成本優(yōu)勢的大幅領先。從DeepSeek-R1論文的性能數(shù)據(jù)上可以看出,在數(shù)學、代碼、自然語言推理等任務類型的性能上已堪比頂級大模型水平,同時其成本卻不到頂級大模型的三十分之一,這足以體現(xiàn)DeepSeek大模型在技術(shù)創(chuàng)新實現(xiàn)了跨越范式的創(chuàng)新,即在AI大模型領域的市場競爭上,形成了以算法(高效率、低成本)為主線的新的競爭范式,而不是之前算力為主線的競爭范式。

DeepSeek的R1、V3和OPEN AI的O1性能比對

API費用對比

相關的技術(shù)對比和成本對比不在本文中贅述,詳細內(nèi)容可見文章開頭的內(nèi)容推薦

DeepSeek的機會把握和技術(shù)創(chuàng)新,打破了當前AI大模型的競爭格局,建立了中國AI走向前沿的信心。DeepSeek創(chuàng)始人梁文鋒在接受“暗涌”采訪時說:“我們看到的是,中國AI不可能永遠處在跟隨的位置。中國AI和美國有一兩年的差距,但真實的GAP是原創(chuàng)和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。英偉達的領先,不只是一個公司的努力,而是整個西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果。他們能看到下一代的技術(shù)趨勢,手里有路線圖。中國AI的發(fā)展,同樣需要這樣的生態(tài)。”

超越追趕是每一個后發(fā)企業(yè)可以有也應該有的目標和夢想,不局限于當前備受國家關注的AI、芯片、新能源等行業(yè),也應該是當前備受煎熬的軟件行業(yè)的重要課題。追趕超越可以是一個企業(yè)通過機會窗口的把握、技術(shù)創(chuàng)新和商業(yè)模式創(chuàng)新雙輪驅(qū)動之下實現(xiàn)的,但要實現(xiàn)更大范圍、更高戰(zhàn)略規(guī)劃時的追趕超越,我們更加需要有更加完整的價值網(wǎng)絡和產(chǎn)業(yè)聯(lián)盟,目的只有一個:看清路線圖,順勢而為。

文獻參考

  • 【2025年1月發(fā)布的R1大模型的論文】DeepSeek-R1論文.pdf
  • Nature新聞:China’s cheap, open AI model DeepSeek thrills (scientists(https://www.nature.com/articles/d41586-025-00229-6)
  • 一文讀懂:DeepSeek新模型大揭秘,為何它能震動全球AI圈(https://www.36kr.com/p/3135022841879040
  • 為什么老外在deepseek上面慢半拍?(https://finance.sina.com.cn/roll/2025-01-26/doc-inehhqya0549350.shtml)
  • DeepSeek 發(fā)展歷程(截止到25年1月)(https://zhuanlan.zhihu.com/p/17511493759)

本文由 @運營在洞察 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!