接替Manus,字節(jié)的Agent王牌能打多久?
自4月18日上線(xiàn)以來(lái),扣子Agent不僅在短時(shí)間內(nèi)吸引了大量用戶(hù),還因服務(wù)器多次爆滿(mǎn)而顯示出其巨大的吸引力。然而,盡管扣子Agent在用戶(hù)體驗(yàn)和功能設(shè)計(jì)上表現(xiàn)出色,但其底層模型與行業(yè)領(lǐng)先者相比仍存在差距。
在DeepSeek和Manus的沖擊之下,“沉寂”已久的字節(jié),做出了首個(gè)由大廠(chǎng)發(fā)布的Agent爆款。
從4月18號(hào)扣子Agent上線(xiàn)以來(lái),各個(gè)AI交流群都開(kāi)始搶起了扣子的邀請(qǐng)碼。用戶(hù)們蹲在各個(gè)群里等待5個(gè)一組的邀請(qǐng)碼放出,又在幾秒鐘被橫掃一空。
與之對(duì)應(yīng)的是,即便算力充沛如字節(jié),也沒(méi)頂住用戶(hù)對(duì)Agent嘗鮮的熱情。幾天內(nèi),扣子出現(xiàn)過(guò)幾次因人多而服務(wù)器爆滿(mǎn)的情況,可見(jiàn),其算力消耗也遠(yuǎn)遠(yuǎn)超過(guò)了字節(jié)原本的預(yù)期。
在Manus之后,字節(jié)新上線(xiàn)的Agent,靠著優(yōu)化的產(chǎn)品思路和量大便宜的優(yōu)勢(shì),暫時(shí)成功吃下了昂貴的Manus遺留的空白市場(chǎng)。
一時(shí)的熱鬧后,扣子空間會(huì)曇花一現(xiàn),還是成為字節(jié)屹立不倒的招牌?
邀請(qǐng)碼被瘋搶?zhuān)圩友a(bǔ)上了Agent市場(chǎng)的空白
在扣子本次更新的多款產(chǎn)品和功能中,“扣子空間”成為了引爆用戶(hù)熱情的關(guān)鍵產(chǎn)品。
“扣子空間”,是字節(jié)的智能體平臺(tái)扣子推出的Agent,目前已經(jīng)滿(mǎn)足了規(guī)劃、使用工具和記憶等關(guān)鍵的自主能力。
根據(jù)扣子官網(wǎng)給出的各種使用體驗(yàn)案例,扣子既可以用來(lái)寫(xiě)游戲攻略、市場(chǎng)調(diào)研報(bào)告,也能基于字節(jié)提供的數(shù)十種MCP實(shí)現(xiàn)更加復(fù)雜的需求,比如用高德地圖MCP+Agent寫(xiě)一份旅游指南,用飛書(shū)多維表格統(tǒng)計(jì)數(shù)據(jù)等等。
實(shí)際體驗(yàn)下來(lái),扣子的Agent更接近于OpenAI發(fā)布的智能體DeepResearch和Manus的結(jié)合體。
拿到體驗(yàn)碼后,光錐智能以“字節(jié)一年To B的AI戰(zhàn)略”為要求,讓Agent幫忙收集信息并生成一份分析報(bào)告。Agent將任務(wù)拆解成4個(gè)步驟,并在測(cè)試者的意見(jiàn)修改下,給出最終的拆解結(jié)果:
通過(guò)在瀏覽器搜索信息,扣子Agent用了十幾分鐘,把上述三個(gè)步驟收集到的信息各整理成文件留存,供使用者隨時(shí)查看。最后,Agent調(diào)用了網(wǎng)頁(yè)生成工具,輸出了一份長(zhǎng)達(dá)10個(gè)小節(jié)的報(bào)告。雖然概況的內(nèi)容還較為簡(jiǎn)略,但Agent的調(diào)查報(bào)告已經(jīng)能做到基本覆蓋各個(gè)維度的信息。
于產(chǎn)品設(shè)計(jì)思路上,字節(jié)整體的設(shè)計(jì)方式更加接近DeepResearch。比如兩者都將Agent的思考過(guò)程和收集內(nèi)容放到了整體界面的右側(cè),讓使用者能夠更加清晰地看到AI的每一步操作。
在此基礎(chǔ)上,扣子的Agent還延續(xù)了字節(jié)一貫突出的產(chǎn)品設(shè)計(jì)思路,進(jìn)一步提升了用戶(hù)的交互體驗(yàn)。
當(dāng)前,一般的Agent雖然生成速度快,但往往難以滿(mǎn)足用戶(hù)的復(fù)雜需求;深度思考的Agent又往往效率不如前者,需要花幾十分鐘才能給出結(jié)果。
考慮到用戶(hù)對(duì)于生成效率和質(zhì)量?jī)煞N不同的需求,扣子的智能體史無(wú)前例地在Agent使用界面中開(kāi)啟了兩種模式——“探索模式”和“規(guī)劃模式”。
對(duì)比起來(lái),前者的思考速度快,但只能處理需求較為簡(jiǎn)單的任務(wù),而后者則能根據(jù)用戶(hù)需求將任務(wù)拆分成詳細(xì)步驟,還能在生成規(guī)劃后讓用戶(hù)根據(jù)需求修改。加入用戶(hù)的修改意見(jiàn)后,也能提升AI操作的準(zhǔn)確性。
不過(guò),如果以智能體目前的三個(gè)關(guān)鍵能力指標(biāo),即規(guī)劃、工具調(diào)用和記憶來(lái)衡量,字節(jié)的Agent表現(xiàn)還無(wú)法比肩DeepResearch和Manus。
在工具調(diào)用上,目前字節(jié)平臺(tái)給出的可直接調(diào)用的MCP只有十多種,還需要進(jìn)一步擴(kuò)充。
交給扣子Agent生成內(nèi)容的體驗(yàn)中,目前它搜索的文字內(nèi)容也多直接來(lái)自互聯(lián)網(wǎng)引擎搜索,沒(méi)辦法像DeepResearch一樣直接在特定的垂類(lèi)網(wǎng)站搜索信息,也沒(méi)有橫跨各個(gè)平臺(tái)的內(nèi)容搜索。內(nèi)容池窄了,生成的內(nèi)容質(zhì)量自然有限。
而在記憶問(wèn)題上,也有不少體驗(yàn)扣子的用戶(hù)表示,在測(cè)試了十幾輪上下文對(duì)話(huà)后,Agent就會(huì)出現(xiàn)“失憶”的情況,無(wú)法記住之前的交流內(nèi)容。
實(shí)際上,這也是由于扣子Agent的底層模型決定。
當(dāng)下的共識(shí)是,Agent的能力依賴(lài)于底層模型的水平。但和用自研模型的OpenAI,以及調(diào)用Claude 3.7等模型的Manus相比,扣子的底層模型主要使用的是豆包通用模型Doubao-1.5-pro,從效果和部分開(kāi)發(fā)者反饋效果來(lái)看,無(wú)論在文本理解思考能力還是代碼輸出等能力上,扣子Agent表現(xiàn)還稍遜于前者。
不過(guò),為了提升Agent使用體驗(yàn),字節(jié)在多模態(tài)能力上下了功夫。比如字節(jié)在上一周發(fā)布了專(zhuān)門(mén)為Agent設(shè)計(jì)的GUI(圖形交互界面)模型,這也讓扣子Agent在視覺(jué)理解和圖片生成能力上表現(xiàn)更加突出。
在上述光錐智能實(shí)際體驗(yàn)后,扣子Agent按照要求生成的報(bào)告不僅詳細(xì)分好了對(duì)應(yīng)的報(bào)告節(jié)點(diǎn),且在UI設(shè)計(jì)上體驗(yàn)拉滿(mǎn),給到了圖文并茂的調(diào)研報(bào)告。
雖然,扣子的Agent目前表現(xiàn)還沒(méi)辦法追趕上Manus,但在一片基本空白的自主Agent市場(chǎng)中,扣子Agent的表現(xiàn)已經(jīng)足夠驚艷。它做到了火山引擎最?lèi)?ài)強(qiáng)調(diào)的那句“成本低、易落地”,先把具備自主執(zhí)行能力的Agent端上來(lái),讓人們能夠體驗(yàn)并反饋。
如同字節(jié)給扣子空間的定位“一個(gè)通用的實(shí)習(xí)生配合各領(lǐng)域的專(zhuān)家”,現(xiàn)階段的扣子Agent,做到了這個(gè)執(zhí)行標(biāo)準(zhǔn)。
搶占時(shí)間窗口,扣子拿下大廠(chǎng)智能體首勝
“扣子空間”的誕生,是大廠(chǎng)在智能體路線(xiàn)上的一次“糾偏”。
為什么Manus沒(méi)有出生在大廠(chǎng)?這個(gè)在Manus爆火后常常被人提起的問(wèn)題,要從大廠(chǎng)做智能體的思路說(shuō)起。
從OpenAI發(fā)布GPTs商店開(kāi)始,大廠(chǎng)在2024年上半年紛紛跟進(jìn)智能體。字節(jié)跳動(dòng)的扣子、騰訊云的騰訊元器、百度智能云千帆AgentBuilder、阿里云大模型平臺(tái)百煉,都是在這個(gè)時(shí)間段先后發(fā)布。
字節(jié)海外版平臺(tái)Coze
但大廠(chǎng)們對(duì)這些智能體的定位,仍然停留在做開(kāi)發(fā)者生態(tài)的平臺(tái)上——智能體商店。
通過(guò)接入市面上多種大模型能力和各種Agent開(kāi)放工具,智能體平臺(tái)們不斷吸納開(kāi)發(fā)者,寄希望于靠開(kāi)發(fā)者們做出應(yīng)用生態(tài),再借著各種功能的智能體來(lái)吸引用戶(hù),智能體平臺(tái)則順勢(shì)成為流量生態(tài)的入口。
之所以做出這樣的選擇,是大廠(chǎng)一貫的“平臺(tái)思維”的慣性——做好平臺(tái)和基礎(chǔ)工具,并不親自下場(chǎng)。這就像淘寶和京東一開(kāi)始的區(qū)別。
另外一方面也是由于模型能力的制約。彼時(shí),在多模態(tài)能力尚未完善的情況下,大模型還無(wú)法“理解”手機(jī)和電腦的操作界面信息,也就無(wú)法完成各種自主操作。
所以,扣子們重點(diǎn)做的是通用工具的打磨,完善各種工作流,降低開(kāi)發(fā)者們的開(kāi)發(fā)門(mén)檻。再采用流量分成的方式,吸引開(kāi)發(fā)者接入。
但在去年11月,智譜發(fā)布的Agent“AutoGLM”開(kāi)始能夠?qū)崿F(xiàn)點(diǎn)外賣(mài)、發(fā)紅包等自主操作后,大廠(chǎng)們肯定看到了相關(guān)的潛力,但從行動(dòng)上來(lái)看,大廠(chǎng)的速度顯然沒(méi)有Manus更快,產(chǎn)品也沒(méi)有Manus深。
在現(xiàn)象級(jí)爆款產(chǎn)品面前,各家大廠(chǎng)都開(kāi)始坐不住了。向來(lái)求穩(wěn),發(fā)產(chǎn)品從來(lái)不發(fā)“半成品”的字節(jié),這次搶著把還不夠完善的扣子Agent發(fā)了出來(lái)。
如今的扣子Agent,就是一個(gè)滿(mǎn)足“60分及格”的產(chǎn)品,它要做的就是搶占時(shí)間窗口。
此前,譚待曾在采訪(fǎng)中表示,做B端,搶先發(fā)優(yōu)勢(shì)的前提是產(chǎn)品或服務(wù)要達(dá)到及格線(xiàn)。
“做B端更要為結(jié)果負(fù)責(zé)。”譚待說(shuō),“如果你的產(chǎn)品足夠‘可用’,搶占先發(fā)優(yōu)勢(shì)肯定是有價(jià)值的?!?/p>
這次,字節(jié)選對(duì)了。
Manus雖然在短時(shí)間內(nèi)在市場(chǎng)點(diǎn)燃了熱度,成功驗(yàn)證PMF,但它的技術(shù)護(hù)城河并不高,在強(qiáng)手云集的AI行業(yè)中,多家大廠(chǎng)都開(kāi)始著手準(zhǔn)備復(fù)刻Manus類(lèi)產(chǎn)品。
從一開(kāi)始的爆火,Manus要想真的在行業(yè)中“長(zhǎng)青”,關(guān)鍵在于兩點(diǎn),一是保證技術(shù)優(yōu)勢(shì)持續(xù)領(lǐng)先,二則是解決Agent成本高企的問(wèn)題,快速鋪開(kāi)市場(chǎng)規(guī)模。
但現(xiàn)在,Manus仍然深受成本問(wèn)題制約。在Manus的閉門(mén)會(huì)上,其工作人員分享Manus單次運(yùn)行成本在2美元左右。高昂的成本,注定了Manus只能在起步階段向少量用戶(hù)開(kāi)放。即使開(kāi)放商業(yè)計(jì)劃,它的定價(jià)也不會(huì)是一筆普通用戶(hù)能承擔(dān)的費(fèi)用。
開(kāi)出最低一個(gè)月39美金的會(huì)員定價(jià)的情況下,Manus還無(wú)法進(jìn)一步提升市場(chǎng)占有率。
Manus的兩個(gè)會(huì)員訂閱方案
而成本,就是大廠(chǎng)的優(yōu)勢(shì),更何況是背靠火山引擎的云底座,可以把現(xiàn)有產(chǎn)品做得更便宜、好上手。
有意思的是,這次扣子Agent在營(yíng)銷(xiāo)上也似乎有意在參考Manus的“饑餓營(yíng)銷(xiāo)”。從最開(kāi)始上線(xiàn)就發(fā)出了大量邀請(qǐng)碼,且一個(gè)用戶(hù)使用后就能再拿到5個(gè)邀請(qǐng)碼繼續(xù)分享裂變??梢哉f(shuō),字節(jié)為這次扣子的上線(xiàn)煞費(fèi)苦心,也準(zhǔn)備了不少?gòu)椝帯?/p>
字節(jié)的后發(fā)優(yōu)勢(shì),讓Manus類(lèi)的自主智能體不再停留在Demo中,從而在市場(chǎng)中率先分得一杯羹。
不過(guò),“扣子空間”Agent能火多久,還是一個(gè)問(wèn)題。
在一次采訪(fǎng)中,火山引擎總裁討論過(guò)“先發(fā)優(yōu)勢(shì)和后發(fā)優(yōu)勢(shì)”。面對(duì)“第二名是否永遠(yuǎn)是投入產(chǎn)出比最高”的問(wèn)題,譚待給出了如下回答。
“第一名有很大優(yōu)勢(shì),但第二名應(yīng)該把跟隨優(yōu)勢(shì)發(fā)揮好,前提是第二名足夠優(yōu)秀,普通賽車(chē)手也很難反超。”
足夠優(yōu)秀的“第二名”字節(jié),能在接下來(lái)的迭代中保住市場(chǎng)優(yōu)勢(shì)嗎?
企業(yè)級(jí)智能體 火山引擎的野心
從去年的試水觀(guān)望,到今年紛紛接入Agent,DeepSeek和Manus讓企業(yè)們看到了Agent落地的可能性,模型能力的提升也降低了實(shí)現(xiàn)的門(mén)檻。
2025年,Agent迎來(lái)爆發(fā)之年。
但企業(yè)做Agent,最大的問(wèn)題就是卡在如何接入內(nèi)部系統(tǒng)上。
和開(kāi)發(fā)者做Agent不一樣的是,企業(yè)對(duì)數(shù)據(jù)安全的要求高,這就意味著可能需要私有化部署大模型;再?gòu)穆涞匦Ч蟻?lái)說(shuō),企業(yè)需要Agent做到準(zhǔn)確度接近100%的級(jí)別,因?yàn)樯逃妙I(lǐng)域承擔(dān)不起錯(cuò)誤結(jié)果;最后,面對(duì)很多復(fù)雜的需求,Agent想要一一實(shí)現(xiàn),需要技術(shù)團(tuán)隊(duì)針對(duì)具體場(chǎng)景琢磨用哪些實(shí)現(xiàn)方式完成。
但在去年整體大模型能力有限的情況下,Agent要想真正接入企業(yè),靠的還不是當(dāng)下流行的自主Agent,而是根據(jù)業(yè)務(wù)需求編寫(xiě)工作流完成。
對(duì)于沒(méi)有AI大模型基礎(chǔ)的企業(yè)來(lái)說(shuō),沒(méi)有專(zhuān)門(mén)的技術(shù)人才,想做明白Agent就是難上加難。
專(zhuān)注智能體B端生意的廠(chǎng)商們,都很清楚上述的問(wèn)題。
所以,在字節(jié)從扣子上看到了Agent潛力之后,推出的扣子專(zhuān)業(yè)版一是只能在公有云上調(diào)用,二是這個(gè)智能體平臺(tái)只是工具的集合體,對(duì)于想真正落地的企業(yè)來(lái)說(shuō),空有工具又不會(huì)用,也是問(wèn)題。
一位字節(jié)跳動(dòng)旗下的智能體平臺(tái)扣子的研發(fā)人員曾對(duì)光錐智能表示,“我們?cè)谑袌?chǎng)開(kāi)拓期,會(huì)免費(fèi)給客戶(hù)接入豆包大模型,還會(huì)做一對(duì)一的調(diào)試和服務(wù)?!?/p>
但只是這樣還不夠,字節(jié)要想進(jìn)一步收獲更多客戶(hù),就得推出一個(gè)更聚焦企業(yè)的版本,于是就有了去年5月上線(xiàn)的HiAgent。
HiAgent上線(xiàn),先解決了一個(gè)關(guān)鍵的問(wèn)題,就是能夠把豆包私有化部署到企業(yè)中,這才能夠上企業(yè)安全的門(mén)檻。
比起之前扣子企業(yè)版明碼標(biāo)價(jià)的包月制服務(wù),HiAgent再準(zhǔn)備著手解決的是落地方面的問(wèn)題。比如給缺少相關(guān)技術(shù)指導(dǎo)的企業(yè)直接派人才幫忙,再比如直接針對(duì)各行業(yè)做了適配行業(yè)特點(diǎn)的上百個(gè)模版。
坦白來(lái)說(shuō),字節(jié)搭建Agent企服的思路不稀奇,這也是多家B端行業(yè)一直沿用的方式,即全方位包攬落地,再加以人力精準(zhǔn)輔助。
不過(guò)對(duì)比同期的云廠(chǎng)商來(lái)說(shuō),字節(jié)無(wú)論是在扣子平臺(tái)還是在HiAgent的服務(wù)搭建上,都做得夠快、夠全,這也是字節(jié)能搶下大量智能體市場(chǎng)訂單的原因。
字節(jié)逐漸提升Agent地位的半年時(shí)間內(nèi),也迎合上了行業(yè)內(nèi)智能體的增長(zhǎng)。據(jù)大單網(wǎng)統(tǒng)計(jì),下半年,下半年 AI 智能體應(yīng)用落地大幅提速,增幅達(dá) 330+%。
而在競(jìng)爭(zhēng)者云集的市場(chǎng)中,火山引擎在2024年一共吃下了32個(gè)項(xiàng)目,各廠(chǎng)商智能體項(xiàng)目數(shù)量上位列第一。但和位列第二的科大訊飛相比,兩者的訂單數(shù)量差距只有2個(gè)。換言之,字節(jié)在Agent企服領(lǐng)域的優(yōu)勢(shì)存在,但并不算穩(wěn)固。
不過(guò),在一眾云廠(chǎng)商里,字節(jié)已經(jīng)算得上是行動(dòng)上夠快、業(yè)務(wù)布局也更廣的一個(gè)。比起第四名百度,字節(jié)比后者吃下的智能體訂單數(shù)量多了1/3。
而在當(dāng)下Agent爆發(fā)的節(jié)點(diǎn),字節(jié)更不會(huì)懈怠。它需要一個(gè)扣子在前臺(tái)吸引開(kāi)發(fā)者,再通過(guò)推出企業(yè)端服務(wù)拉攏客戶(hù),最終,火山引擎則奔著Agent爆發(fā)背后的可觀(guān)算力消耗而去。這次,扣子平臺(tái)引發(fā)的多次服務(wù)器崩潰,側(cè)面也印證了這次算力消耗情況,已經(jīng)超出了字節(jié)的預(yù)期。
這一次的時(shí)間窗口,字節(jié)能享有多久,就要看其他廠(chǎng)商接下來(lái)的行動(dòng)了。
作者|魏琳華 編輯|王一粟
本文由人人都是產(chǎn)品經(jīng)理作者【光錐智能】,微信公眾號(hào):【光錐智能】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!