被掃地出門18個(gè)月后,馬斯克終復(fù)仇OpenAI

0 評(píng)論 571 瀏覽 0 收藏 11 分鐘

18個(gè)月前,馬斯克被OpenAI掃地出門;18個(gè)月后,他帶著Grok 3強(qiáng)勢回歸,直接將OpenAI拉下神壇。

昨天,馬斯克發(fā)布的Grok 3大模型不僅在性能上超越了OpenAI的GPT-4o,還在推理、編程和多模態(tài)能力上展現(xiàn)出驚人的實(shí)力。

從被踢出OpenAI到創(chuàng)建xAI實(shí)驗(yàn)室,再到如今的復(fù)仇成功,馬斯克用“暴力開源”策略撕裂了OpenAI的閉源壁壘。而OpenAI的山姆·奧特曼也毫不示弱,聲稱GPT-4.5將帶來AGI的初體驗(yàn)。

這場AI領(lǐng)域的權(quán)力天平正在傾斜,而開源與閉源的路線之爭,或許才是這場戰(zhàn)爭的真正焦點(diǎn)。

2月18日,馬斯克發(fā)布完Grok 3大模型后,轉(zhuǎn)發(fā)了一條推特:

劃重點(diǎn),Grok3目前世界第一強(qiáng)模型(競技場得分1400),比OpenAI的推理模型還厲害,18個(gè)月就超越了山姆·奧特曼領(lǐng)導(dǎo)下的OpenAI。

要知道馬斯克曾是OpenAI的天使投資人,甚至Open這個(gè)關(guān)鍵詞就是馬斯克幫取名的。變化發(fā)生在2018年,奧特曼與馬斯克在“開源還是閉源”的問題上徹底決裂。馬斯克堅(jiān)信,人工智能必須透明開放以規(guī)避風(fēng)險(xiǎn);而奧特曼則在資本壓力下選擇與微軟結(jié)盟,將技術(shù)封閉于商業(yè)護(hù)城河內(nèi)。

此前大家都相安無事,因?yàn)楫?dāng)時(shí)ChatGPT還沒那么厲害。就在2022年末,ChatGPT4橫空出世后,馬斯克對(duì)于被踢出了這么一個(gè)跨時(shí)代項(xiàng)目,就開始碎碎念了。應(yīng)了那句話:『不怕分手,就怕前任過得好。

這段往事在2024年再度被點(diǎn)燃。馬斯克以“違背公益初衷”為由,對(duì)OpenAI發(fā)起訴訟,指控其將技術(shù)壟斷權(quán)拱手讓給微軟。這場官司雖未勝訴,卻為馬斯克埋下了一顆復(fù)仇的種子——2023年7月,馬斯克成立xAI實(shí)驗(yàn)室,開始發(fā)布Grok系列模型,對(duì)標(biāo)OpenAI的GPT系列模型。

01 大力出奇跡,18個(gè)月追上OpenAI

在Grok3發(fā)布會(huì)上,開場xAI介紹了他們的決心:

『122天,建成了10萬顯卡集群,再過了92天后,建成了20萬張 H100 顯卡集群?!贿@是世界上最大的H100算力集群。

很多朋友不懂這個(gè)數(shù)據(jù)的意義,這意味著Grok3訓(xùn)練算力超過了DeepSeek V3的263倍,卻只帶來超過DeepSeek 33%的Benchmark能力。

Scaling Law是否失效暫且不提,就說這大手筆投入算力基礎(chǔ)設(shè)施,也算是體現(xiàn)了馬斯克追趕的決心。

短短2年內(nèi),xAI接連推出Grok系列模型:從參數(shù)量為3140億的Grok-1,到支持多模態(tài)的Grok-1.5 Vision,追趕ChatGPT 4o的Grok 2,以及今天登頂?shù)腉rok 3,Grok每一步都試圖用“暴力開源”策略撕裂OpenAI的閉源壁壘。

重要時(shí)間節(jié)點(diǎn)是在2024年底。xAI在田納西州孟菲斯建成了一座堪比“算力核電站”的數(shù)據(jù)中心,10萬塊英偉達(dá)H100 GPU組成的集群,讓Grok 3的訓(xùn)練速度比前代提升十倍。馬斯克在推特上寫道:“算力即權(quán)力,而我們將擁有最暴力的武器。”

此后馬斯克宣布融資60億美元,繼續(xù)投資Grok大模型的訓(xùn)練。這筆錢比國內(nèi)大模型六小虎的融資總額還多。

在xAI成立的18個(gè)月(不到2年時(shí)間)后,Grok 3正式發(fā)布,成功登頂最強(qiáng)大模型。

02 Grok 3的“量子躍升”,有何殺手锏?

2025年2月18日,全球百萬觀眾涌入直播平臺(tái),見證馬斯克的最新大模型,此前他在中東的AI大會(huì)上,宣布將發(fā)布全球最聰明的大模型Grok 3?,F(xiàn)在看來Grok 3名副其實(shí),具有諸多強(qiáng)悍能力。

技術(shù)核爆點(diǎn)一:最聰明的模型

基準(zhǔn)測試數(shù)據(jù)顯示,Grok 3達(dá)到了1400的Elo得分,這是其他任何模型都未曾達(dá)到的。

Grok 3在AIME 2025科學(xué)推理測試中得分超過Gemini 2 Pro和GPT-4o,其迷你版模型甚至在編程任務(wù)中擊敗了DeepSeek-R1。

可能大家已經(jīng)被大模型刷榜測試的傳聞,搞得不太相信這些數(shù)據(jù)的真實(shí)性。國外有拿到Grok 3測試的大神,測試了超過人類和一些大模型理解的《卡坦島》問題:。

“創(chuàng)建一個(gè)顯示六邊形網(wǎng)格的棋盤游戲網(wǎng)頁,就像游戲中的 Settlers of Catan 一樣。每個(gè)六邊形網(wǎng)格的編號(hào)從 1 到 N,其中 N 是六邊形瓷磚的總數(shù)。使其通用,以便可以使用滑塊更改“環(huán)”的數(shù)量。例如,在 Catan 中半徑為 3 個(gè)六邊形。請(qǐng)使用單個(gè) html 頁面。”

他評(píng)價(jià)很少有模型能夠可靠地做到這一點(diǎn)。頂級(jí)的 OpenAI 思維模型(例如 o1-pro,每月 200 美元)也能做到這一點(diǎn),但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都沒有做到這一點(diǎn)。

甚至數(shù)學(xué)歷史上著名的未接知名『黎曼猜想』,Grok 3也會(huì)嘗試去算,不像O1-Pro、Claude等模型直接回答做不了,放棄了。

技術(shù)核爆點(diǎn)二:動(dòng)態(tài)反思機(jī)制

Grok 3引入“思維鏈”推理技術(shù),能像人類一樣拆解復(fù)雜任務(wù)并實(shí)時(shí)修正邏輯斷層?,F(xiàn)場演示中,Grok 3僅用30秒便生成了一份從地球到火星的航天器軌跡圖,并標(biāo)注出引力彈弓效應(yīng)的最佳利用節(jié)點(diǎn)。

『你能看到Grok真的在做一些模糊思考,這樣模型就不會(huì)被立即完全復(fù)制?!?/p>

圖中可以看到,在數(shù)學(xué)測試中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分,超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。

同樣在科學(xué)和編程兩項(xiàng)中,Grok3兩款模型也存在一定程度上的領(lǐng)先。

技術(shù)核爆點(diǎn)三:更多呈現(xiàn)模式

Grok 3不僅能解鎖測試時(shí)間計(jì)算,還能啟用強(qiáng)大的代理。這些能力促成了一款名為DeepSearch的新產(chǎn)品。“下一代搜索代理,用于理解宇宙”。DeepSearch還會(huì)展示它進(jìn)行搜索時(shí)所采取的步驟。

不僅如此,Elon強(qiáng)調(diào)了Grok 3的創(chuàng)意涌現(xiàn)能力。在這個(gè)和DeepSeek十分相似的頁面上,Grok新增了第三個(gè)標(biāo)簽按鈕『Big Brain』。使用“大腦模式”,通過更多計(jì)算資源和推理來使用Grok 3,也許會(huì)呈現(xiàn)意想不到的效果。

未來Grok 3應(yīng)該不太限制大模型的創(chuàng)作風(fēng)格,以及思考創(chuàng)意的邊界。相比之下,OpenAI則是解除了ChatGPT的成人內(nèi)容限制,這就。。。。。

03 口水戰(zhàn)打不完,奧特曼的反擊

面對(duì)Grok 3的突襲,OpenAI并非毫無動(dòng)作。

發(fā)布會(huì)前天,山姆·奧特曼在X平臺(tái)宣稱:“GPT-4.5將帶來AGI的初體驗(yàn)。”預(yù)計(jì)GPT-4.5也會(huì)在一兩周內(nèi)發(fā)布,屆時(shí)拿出滿血的O3,應(yīng)該能奪回全球最佳模型的寶座。

此前,一個(gè)由馬斯克牽頭的財(cái)團(tuán)擬出價(jià) 974 億美元收購 OpenAI,后者的首席執(zhí)行官薩姆?阿爾特曼對(duì)此回應(yīng)稱,” 不用了,謝謝,但如果你愿意,我們可以以 97.4 億美元的價(jià)格收購?fù)铺兀慈缃竦?X)” 后。

商業(yè)競爭互相都不手軟,口水戰(zhàn)也打個(gè)不停。

未來兩家公司還存在路線競爭。與OpenAI的閉源策略針鋒相對(duì),Grok 3承諾未來“開源”,Grok 2將在一個(gè)月內(nèi)開源,并計(jì)劃接入特斯拉車載系統(tǒng)和Optimus人形機(jī)器人。

同時(shí),xAI同步推出了“Super Grok”訂閱服務(wù),以每月49美元的價(jià)格向開發(fā)者開放深度搜索(DeepSearch)功能——這種能交叉驗(yàn)證信息來源、公開推理路徑的引擎,直指ChatGPT的“黑箱”痛點(diǎn)。

更深層的沖擊來自生態(tài)層面。Grok 3的開源策略吸引了大量開發(fā)者涌入,而特斯拉的硬件布局(如Model Q車載系統(tǒng))則為AI落地提供了現(xiàn)實(shí)場景。

2025年,AI領(lǐng)域的權(quán)力天平正在傾斜。Grok 3的顛覆性不僅在于技術(shù),更在于它重新點(diǎn)燃了“開源理想主義”的火種。正如一位硅谷投資人所言:“馬斯克用Grok 3完成了一場遲到的復(fù)仇,但這場戰(zhàn)爭的真正贏家,或許是那些終于看見技術(shù)透明曙光的人們?!?/p>

山姆·奧特曼會(huì)拿出怎樣的競爭手段回?fù)裟兀?/p>

作者丨鯨哥

本文由人人都是產(chǎn)品經(jīng)理作者【AI鯨選社】,微信公眾號(hào):【鯨選AI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!