百度文心4.5與X1登場(chǎng)后,大模型第一梯隊(duì)的競(jìng)爭(zhēng)再升級(jí)?
前幾天,百度正式發(fā)布文心大模型4.5(文心4.5)和文心大模型X1(文心X1),并宣布文心4.5將于6月30日正式開源,這一系列動(dòng)作引發(fā)了行業(yè)的廣泛關(guān)注。百度的這一戰(zhàn)略布局不僅是對(duì)“掉隊(duì)”質(zhì)疑的有力回應(yīng),也標(biāo)志著大模型競(jìng)爭(zhēng)進(jìn)入了一個(gè)新的階段。
3月16日,百度正式發(fā)布文心大模型4.5(以下簡(jiǎn)稱文心4.5)及文心大模型X1(以下簡(jiǎn)稱文心X1),在文心一言官網(wǎng)即可免費(fèi)使用。
文心4.5不僅在基礎(chǔ)能力上有大幅度提升,且具備原生多模態(tài)等能力,其多項(xiàng)基準(zhǔn)測(cè)試成績(jī)優(yōu)于GPT4.5、DeepSeek-V3等,并且平均分達(dá)到79.6分,高于GPT4.5的79.14。
文心X1不僅在性能上對(duì)標(biāo)DeepSeek-R1,且具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),是首個(gè)自主運(yùn)動(dòng)工具的深度思考模型。和DeepSeek橫空出世一樣,文心4.5和文心X1不僅點(diǎn)燃了國(guó)內(nèi)用戶的熱情,更讓外網(wǎng)沸騰。
在推特上,不少人紛紛在求百度測(cè)試賬號(hào),他們?yōu)閮纱竽P蛢?yōu)異的性能和超低的價(jià)格感到不可思議,不少人覺得百度的股價(jià)被低估了。甚至有人在百度推特賬號(hào)下@薩姆·奧爾特曼,他們表示游戲結(jié)束了。
在看到文心新模型的表現(xiàn)后,在推特上擁有70萬(wàn)粉絲的美國(guó)投資人Bill Gurley感慨道,美國(guó)人工智能公司應(yīng)將100%的時(shí)間用于開發(fā)和創(chuàng)新,而不是在華盛頓特區(qū)游說(shuō)尋求保護(hù)以躲避競(jìng)爭(zhēng)。這種情況很糟糕,明顯暴露出缺乏自信。
兩大模型的優(yōu)異能力,是對(duì)過(guò)去3月外界對(duì)于“百度大模型掉隊(duì)了”最有效的回應(yīng),也再一次證明了百度對(duì)AI戰(zhàn)略貫徹到底的決心。
畢竟,大模型競(jìng)技是一場(chǎng)持久戰(zhàn),拼的是耐力、技術(shù)、資本。從Transformer到OpenAI-o1和DeepSeek-R1,技術(shù)的更新時(shí)刻在發(fā)生,沒(méi)有人可以保證永遠(yuǎn)領(lǐng)先,但關(guān)鍵的是敢拼的勇氣。所有玩家從來(lái)沒(méi)有放棄和停止在大模型領(lǐng)域的努力,百度也是如此。
開年以來(lái),百度在大模型領(lǐng)域動(dòng)作頻頻——文心一言完全免費(fèi)、文心4.5將于6月30日正式開源;百度核心業(yè)務(wù)搜索接入DeepSeek;很快百度還會(huì)發(fā)布4.5系列模型,以及更前沿的下一代模型5.0版本。動(dòng)作頻頻的背后,透露出百度依然想留在牌桌上的決心,它也確實(shí)做到了。
但百度并不能掉以輕心。因?yàn)椋竽P偷慕K局遠(yuǎn)未到來(lái),包括百度在內(nèi),所有的玩家都必須全力以赴。這也是百度堅(jiān)持不懈的根源。
01 百度加速變革:一場(chǎng)必要的戰(zhàn)略糾偏
半個(gè)月之前,OpenAI舉辦了一場(chǎng)線上發(fā)布會(huì),正式發(fā)布了其最新一代基礎(chǔ)模型GPT-4.5。3月16日,百度并沒(méi)有任何發(fā)布動(dòng)作,而是直接上線了文心4.5與文心X1。
這場(chǎng)上線發(fā)生得悄無(wú)聲息。有百度內(nèi)部人士稱,無(wú)論是文心4.5全面免費(fèi),還是PC和移動(dòng)兩端直接上線,百度管理層都是在半天之內(nèi)做出的決策。
這似乎是現(xiàn)在的百度與過(guò)去的百度,以及行業(yè)的一場(chǎng)賽跑。
這一次的百度越來(lái)越快了。據(jù)百度方面透露,此次文心4.5和X1大模型發(fā)布之后,百度后續(xù)還會(huì)推出文心4.5系列模型,以及在下半年推出更先進(jìn)的下一代模型5.0版本。
其實(shí),此次模型迭代進(jìn)程明顯加快,并非偶然。這一現(xiàn)象背后,其實(shí)是百度對(duì)過(guò)往策略選擇的反思與積極糾偏。
過(guò)去半年間,DeepSeek等新興公司憑借開源、低成本的模式,給OpenAI、百度這類傳統(tǒng)大模型巨頭帶來(lái)了不小的壓力。如今,全球AI企業(yè)中,無(wú)論是OpenAI,還是百度,都逐漸意識(shí)到,大模型領(lǐng)域未來(lái)走向依舊充滿變數(shù),尚無(wú)定論。
激烈競(jìng)爭(zhēng)的大模型領(lǐng)域,保持競(jìng)爭(zhēng)力的關(guān)鍵在于果敢地 “求變”。于是,就在今年2月,比OpenAI更快一步,百度決定及時(shí)轉(zhuǎn)變策略。
隨后,百度創(chuàng)始人李彥宏就快速且堅(jiān)決地推動(dòng)了一系列動(dòng)作:文心一言免費(fèi)、核心業(yè)務(wù)搜索接入DeepSeek、文心大模型4.5系列將在6月30日正式開源等。
這次糾偏是文心一言對(duì)當(dāng)下市場(chǎng)競(jìng)爭(zhēng)的直接回應(yīng)。從悄然上線文心4.5與X1,以及后續(xù)透露的一系列迭代計(jì)劃,無(wú)一不彰顯出百度謀求變革的堅(jiān)定決心。
不過(guò),百度突然加快腳步,讓外界有人質(zhì)疑它可能會(huì)迷失方向。但目前來(lái)看,百度的“變快”建立在對(duì)自身技術(shù)實(shí)力與市場(chǎng)趨勢(shì)的研判上,每一次模型的迭代都伴隨著技術(shù)架構(gòu)的深度優(yōu)化,以及性能的飛躍提升。
從百度自有業(yè)務(wù)來(lái)看,百度旗下多款用大模型重構(gòu)后的AI應(yīng)用,包括百度App、百度地圖、百度網(wǎng)盤、百度文庫(kù)等體驗(yàn)感都在持續(xù)提升。在此次文心4.5與文心X1上線后,這些應(yīng)用也在迎來(lái)全方位升級(jí)。
02 讓大模型產(chǎn)品,植入“原生技術(shù)內(nèi)核”
作為百度重回牌桌的階段性產(chǎn)品,原生多模態(tài)大模型文心4.5以及深度思考模型文心X1,究竟在哪些方面實(shí)現(xiàn)了蛻變與升級(jí)?
據(jù)了解,文心4.5是百度自主研發(fā)的新一代原生多模態(tài)大模型,通過(guò)多個(gè)模態(tài)聯(lián)合建模實(shí)現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進(jìn)的語(yǔ)言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。
而文心大模型X1具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),是首個(gè)自主運(yùn)用工具的深度思考模型,兼?zhèn)錅?zhǔn)確、創(chuàng)意和文采。基于文心大模型4.5和文心大模型X1,Tech星球分別實(shí)測(cè)了一些應(yīng)用場(chǎng)景。
我們上傳了一段“體重管理年”的新聞視頻,要求文心4.5概括新聞內(nèi)容,可以看到其給出了準(zhǔn)確的回答,證明了其跨模態(tài)的能力。目前,文心4.5支持上傳的視頻文件,兼容常見的格式,單個(gè)視頻文件大小不超過(guò)20M。
在圖片理解上,通過(guò)這個(gè)問(wèn)題也能夠看出在圖形推理、圖表分析的“高智商”以外,文心4.5還具備了理解梗圖、漫畫、歌曲、電影等多模態(tài)內(nèi)容的“高情商”。
此外,文心4.5的能力也在圖片生成、RAG(Retrieval Augmented Generation檢索生成增強(qiáng))測(cè)試、邏輯測(cè)試、文本創(chuàng)作等方面得到了很好地體現(xiàn)。在文心X1的測(cè)試中能夠看到,作為一個(gè)能力更全面的深度思考模型,其在邏輯問(wèn)題中展現(xiàn)了周密的思考過(guò)程,且在答案的輸出上更為明確、直接。
在文本創(chuàng)作類的問(wèn)題中,也能夠看出文心X1擅長(zhǎng)寫“銳評(píng)”,避免“端水”,回答尖銳有態(tài)度。
Tech星球獲悉,文心X1在技術(shù)層面頗具創(chuàng)新,主要運(yùn)用遞進(jìn)式強(qiáng)化學(xué)習(xí)訓(xùn)練方法,以思維鏈和行動(dòng)鏈為依托開展端到端訓(xùn)練,還構(gòu)建起統(tǒng)一的獎(jiǎng)勵(lì)系統(tǒng),融入多元獎(jiǎng)勵(lì)機(jī)制。
憑借這些技術(shù),文心X1能夠在諸多場(chǎng)景中大顯身手,包括中文知識(shí)問(wèn)答、文學(xué)創(chuàng)作、文稿寫作、日常對(duì)話、邏輯推理、復(fù)雜計(jì)算等。此外,多工具調(diào)用是文心X1的特色之一。
目前,X1已支持高級(jí)搜索、文檔問(wèn)答、圖片理解、AI繪圖、代碼解釋器、網(wǎng)頁(yè)鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢、詞云生成等多款工具。
03 技術(shù)+場(chǎng)景,大模型的生態(tài)戰(zhàn)
今年2月11日,李彥宏參加“世界政府峰會(huì)”WGS 訪談時(shí)曾表示,從技術(shù)的基礎(chǔ)要素來(lái)看,核心主題依然是技術(shù)進(jìn)步得非???。
成本每年降低約90%,并且性能越來(lái)越好。當(dāng)技術(shù)發(fā)展如此之快,你必須持續(xù)投入,以確保處于技術(shù)創(chuàng)新的最前沿。換句話說(shuō),大模型的競(jìng)爭(zhēng)首先是技術(shù)實(shí)力的競(jìng)爭(zhēng),最直觀的體現(xiàn)是價(jià)格。
文心4.5輸入價(jià)格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價(jià)格的1%;文心X1定價(jià)為輸入0.002元/千tokens,輸出0.008元/千tokens,是DeepSeek R1的一半。
效率得以大幅度提升,背后是百度通過(guò)全棧自研能力構(gòu)建了“芯片層、框架層、模型層和應(yīng)用層”的競(jìng)爭(zhēng)壁壘。
從昆侖芯三代萬(wàn)卡集群的算力支撐,到飛槳深度學(xué)習(xí)平臺(tái)的開發(fā)者生態(tài),再到文心大模型體系的多層次迭代以及AI重構(gòu)的百度搜索、近億用戶的百度文庫(kù),每一層都有反饋,通過(guò)不斷獲得反饋,實(shí)現(xiàn)了端到端優(yōu)化,大幅度提升效率。
這也是百度近十年累計(jì)研發(fā)費(fèi)用超過(guò)1800億元的正向反饋。
成本的降低讓百度有了實(shí)現(xiàn)AI普惠的底氣,也為接下來(lái)文心4.5的開源打下了堅(jiān)實(shí)的基礎(chǔ)。
通過(guò)開放模型權(quán)重、訓(xùn)練框架等核心能力,吸引開發(fā)者共建,百度會(huì)擁有更加繁榮的開發(fā)生態(tài),構(gòu)建更深的護(hù)城河。因?yàn)殚_源不僅是技術(shù)輸出,更是生態(tài)卡位。文心一言將于4月1日取消59.9元/月的付費(fèi)墻,免費(fèi)開放表面看是“割肉”,實(shí)則是雙贏。
這種“零門檻”的模式,讓更多人可以享受技術(shù)進(jìn)步帶來(lái)的樂(lè)趣。同時(shí),百度在4.3億用戶基數(shù)的基礎(chǔ)上得以形成更大的數(shù)據(jù)飛輪效應(yīng),驅(qū)動(dòng)模型持續(xù)優(yōu)化。
開源和免費(fèi)的戰(zhàn)略轉(zhuǎn)向是百度應(yīng)對(duì)行業(yè)變局的標(biāo)志性動(dòng)作,它讓每一個(gè)人都可以參與到創(chuàng)新中來(lái)。
就像李彥宏所言,“創(chuàng)新不能被計(jì)劃,你不知道創(chuàng)新何時(shí)到來(lái),你所能做的就是營(yíng)造一個(gè)有利于創(chuàng)新的環(huán)境?!备匾氖牵夹g(shù)的終局從來(lái)不是參數(shù)的比拼,而是在于解決現(xiàn)實(shí)生活中的問(wèn)題。
百度已經(jīng)將這種理念落地實(shí)踐。被AI深度重構(gòu)的百度搜索有超過(guò)20%的頁(yè)面含有AI生成的內(nèi)容,近億用戶使用的百度文庫(kù)可以智能生成PPT、文檔,已經(jīng)成為“一站式AI內(nèi)容創(chuàng)作平臺(tái)”,其AI功能月活達(dá)9000萬(wàn)。
更進(jìn)一步看,大模型比拼的不僅僅是技術(shù)實(shí)力,更是一場(chǎng)以技術(shù)生態(tài)為核心、以場(chǎng)景落地為驅(qū)動(dòng)的生態(tài)戰(zhàn)爭(zhēng)。
這也是百度和其他創(chuàng)業(yè)公司的根本區(qū)別,百度旗下?lián)碛袃|級(jí)用戶的搜索、地圖、文庫(kù)等應(yīng)用都是AI的落地試驗(yàn)場(chǎng)。不僅如此,百度智能云千帆大模型平臺(tái)預(yù)置了包括百度文心大模型在內(nèi)的、國(guó)內(nèi)外上百個(gè)主流基礎(chǔ)大模型和行業(yè)大模型,還為大模型的持續(xù)預(yù)訓(xùn)練、精調(diào)、評(píng)估、壓縮和部署等環(huán)節(jié)提供最完善易用的工具鏈,它已經(jīng)幫助客戶精調(diào)了3.3萬(wàn)個(gè)模型、開發(fā)了77萬(wàn)個(gè)企業(yè)應(yīng)用。
站在大模型爆發(fā)的前夜,百度的轉(zhuǎn)向證明:AI的未來(lái)屬于激活生態(tài)的玩家,而非單一技術(shù)的掌控者。
當(dāng)開源成為行業(yè)標(biāo)配,真正的競(jìng)爭(zhēng)將聚焦于“如何讓每個(gè)人在創(chuàng)新中獲益”——這或許才是李彥宏“創(chuàng)新不能被計(jì)劃”斷言的終極答案。
文 | 任雪蕓
本文由人人都是產(chǎn)品經(jīng)理作者【Tech星球】,微信公眾號(hào):【Tech星球】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Pixabay,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!