Manus的三個(gè)啟示
Manus的出現(xiàn)引發(fā)了AI領(lǐng)域的廣泛關(guān)注,這款產(chǎn)品不僅在短時(shí)間內(nèi)吸引了大量關(guān)注,還引發(fā)了關(guān)于其技術(shù)實(shí)力、市場(chǎng)潛力以及未來(lái)發(fā)展方向的激烈討論。本文從Manus的功能亮點(diǎn)、背后的團(tuán)隊(duì)背景、當(dāng)前面臨的問(wèn)題以及對(duì)行業(yè)的啟示四個(gè)角度,深入剖析了Manus現(xiàn)象背后更深層次的意義。
Manus成為AI頂流,似乎只用了一個(gè)晚上,另加一場(chǎng)不那么正式的發(fā)布會(huì)。一個(gè)邀請(qǐng)碼在某魚已經(jīng)炒到了5萬(wàn)。不用想,現(xiàn)在最慌的有兩批人——投資人,以及大廠。
Manus神奇在何處,是虛火炒作,還是貨真價(jià)實(shí)?
01 它可以做什么?
它可以全自主完成一個(gè)針對(duì)特斯拉的財(cái)報(bào)分析報(bào)告,也可以幫你生成一個(gè)完全可以正常交互的網(wǎng)站,甚至可以做一款可以直接上手玩的RPG游戲——它可以搭建開(kāi)發(fā)環(huán)境,自行寫代碼,自己debug,自行編譯。
如果你想做一個(gè)地區(qū)人口調(diào)研報(bào)告,Manus還可以自己訪問(wèn)數(shù)據(jù)庫(kù)和自己搜索決定該用什么數(shù)據(jù)來(lái)完成。
Manus幾乎可以通過(guò)一個(gè)prompt來(lái)完成一個(gè)復(fù)雜的分析項(xiàng)目。官網(wǎng)顯示,在AI agent的評(píng)測(cè)標(biāo)準(zhǔn)GAIA benchmark基準(zhǔn)下,其表現(xiàn)更是高于OpenAI的 DeepSearch。
筆者分析了用戶在推特和國(guó)內(nèi)社媒上發(fā)布的使用案例,從執(zhí)行過(guò)程來(lái)看,完全比肩DeepSearch,每個(gè)流程的執(zhí)行代碼、產(chǎn)出文件都完全可見(jiàn),分門別類整理好等待用戶檢閱。就特斯拉和英偉達(dá)的財(cái)報(bào)分析和估值結(jié)果來(lái)看,不遜色于雪球各種大V。
筆者覺(jué)得其中最為驚艷之處是,Manus通過(guò)自己搭建的虛擬電腦來(lái)執(zhí)行數(shù)據(jù)獲取、計(jì)算、開(kāi)發(fā)環(huán)境搭建和測(cè)試等一系列硬核環(huán)節(jié),這幾乎將用戶從復(fù)雜的基礎(chǔ)工作中解放出來(lái),一個(gè)新人完全可以零幀起手進(jìn)入工作。
02 背后的團(tuán)隊(duì)
Manus引發(fā)如此大的聲量,除了其超高質(zhì)量的產(chǎn)出,作為土生土長(zhǎng)的國(guó)內(nèi)團(tuán)隊(duì)作品也是引燃社媒聲量的一個(gè)引線。AI領(lǐng)域,國(guó)內(nèi)團(tuán)隊(duì)的步伐和美國(guó)集結(jié)了全球人才的夢(mèng)之隊(duì)相比,似乎并沒(méi)有落后。
我們了解到,Manus是國(guó)內(nèi)AI創(chuàng)業(yè)團(tuán)隊(duì)Monica AI的另一產(chǎn)品。Monica AI是一款A(yù)I chatbot產(chǎn)品,不同于國(guó)外處于原生狀態(tài)的chatbot,Monica AI 并非僅僅提供一個(gè)模型使用入口,而是通過(guò)提供大量垂直向可以直接使用的API接口,用戶不需要擔(dān)心prompt調(diào)優(yōu),上手即可使用。
創(chuàng)始人肖宏在這樣一款模式簡(jiǎn)單的chatbot產(chǎn)品上,已經(jīng)意識(shí)到了大模型和用戶之間交互方式的局限性。即,模型是優(yōu)秀的和具備一定“超能力”,可以在一系列調(diào)教下,完成一個(gè)復(fù)雜的項(xiàng)目。
但由于chatbot直接將用戶和大模型對(duì)接上,使得要完成某個(gè)任務(wù)的用戶,只能分批次將任務(wù)通過(guò)1v1對(duì)話讓模型分步驟產(chǎn)出。甚至,用戶可能都無(wú)法確認(rèn)輸入給模型的token是否是這個(gè)任務(wù)最優(yōu)的方案。
Manus讓人們繼續(xù)在對(duì)話框中,一步到位解決更復(fù)雜需要更高智能的任務(wù)了。站在這個(gè)角度考慮,Manus似乎更像是一個(gè)多個(gè)經(jīng)過(guò)規(guī)劃后的AI 任務(wù)集合。
團(tuán)隊(duì)刻意忽略顯示大模型神奇之處,轉(zhuǎn)而站在用戶角度,思考如何通過(guò)發(fā)揮模型的優(yōu)勢(shì)來(lái)完成日常任務(wù)。這是務(wù)實(shí)又珍貴的探索。
Manus的故事。讓人們看到了連續(xù)創(chuàng)業(yè)者對(duì)用戶需求的精準(zhǔn)把握能力和團(tuán)隊(duì)的超強(qiáng)執(zhí)行力。至于AI所需要的團(tuán)隊(duì)技術(shù)實(shí)力如何,我們稍后再講。
03 產(chǎn)品的亮點(diǎn)
通過(guò)接近Manus團(tuán)隊(duì)的自媒體《賽博禪心》的文章透露,單條任務(wù)的成本在2美金左右是Deep Search的1/10?;贑laude 3.7 Sonet和國(guó)內(nèi)的Qwen模型基礎(chǔ)上,增加了自己的訓(xùn)練過(guò)程,這點(diǎn)是毋庸置疑的,創(chuàng)始人在播客訪談中透露,即使在做Monica的時(shí)候,他們也并不是僅僅作為prompt中轉(zhuǎn)站,直接將用戶的需求扔給模型,而是增加了產(chǎn)品調(diào)優(yōu)過(guò)程的。
就像一個(gè)天賦異稟骨骼清奇的練武奇才,需要經(jīng)過(guò)后天的努力才能成為笑傲江湖。Manus任務(wù)自主規(guī)劃、思考和完成能力來(lái)自其混合模型的架構(gòu)?;赾laude 和Qwen,并非任務(wù)的某一個(gè)環(huán)節(jié)基于claude,另一個(gè)環(huán)節(jié)基于Qwen,manus打破了模型的“結(jié)界”,讓每個(gè)模型完成自己擅長(zhǎng)的任務(wù)環(huán)節(jié)。
多個(gè)大模型混合+manus虛擬云端執(zhí)行環(huán)境,實(shí)現(xiàn)了讓用戶只需要一次性敲鍵盤就可以完成往常chatbot多輪對(duì)話都未必能完成的復(fù)雜需求。
關(guān)于Mmanus執(zhí)行過(guò)程的猜測(cè):
《賽博禪心》在其文章中提到的“工程驅(qū)動(dòng)創(chuàng)新”一詞,猜測(cè)Manus的任務(wù)執(zhí)行過(guò)程中,運(yùn)用了大量工程手段加模型能力來(lái)完成任務(wù)。結(jié)合多個(gè)社媒的案例分享,我們對(duì)manus的運(yùn)行機(jī)制做了簡(jiǎn)單猜測(cè)。
通過(guò)大模型(這一步猜測(cè)是Qwen)對(duì)于輸入進(jìn)行分析后,首先確定任務(wù)類型,manus內(nèi)部對(duì)于輸入應(yīng)該有一個(gè)類目劃分,如編程任務(wù)、多模態(tài)內(nèi)容生成、任務(wù)規(guī)劃類、建議咨詢類等等。其次,如輸入語(yǔ)言是英文,猜測(cè)可能任務(wù)執(zhí)行也以Claude為主。
具體到任務(wù)執(zhí)行層面,猜測(cè)過(guò)程如下:
1.接收到一個(gè)輸入后,大模型會(huì)首先進(jìn)行任務(wù)分類,決定后續(xù)任務(wù)執(zhí)行的模型選擇;
2.之后大模型將輸入拆解成多個(gè)帶有層級(jí)關(guān)系、優(yōu)先級(jí)和執(zhí)行順序的子任務(wù);
3.按序執(zhí)行以后,上級(jí)任務(wù)的輸出,成為下個(gè)任務(wù)的輸入;
4.多個(gè)任務(wù)產(chǎn)出合并成一個(gè)最終分析結(jié)果。
對(duì)于每個(gè)子節(jié)點(diǎn)選擇什么模型來(lái)執(zhí)行,我們猜測(cè),如果是編程任務(wù)后面執(zhí)行以Claude為主,如果是中文決策建議類就以Qwen為主;根據(jù)子節(jié)點(diǎn)的任務(wù)復(fù)雜度,執(zhí)行過(guò)程中單一任務(wù)甚至可能是Qwen和Claude混合,然后再用模型進(jìn)行效果對(duì)比,最終選擇保留效果最佳的一個(gè)。
從上述的分析可見(jiàn),初始需求的輸入質(zhì)量決定了后續(xù)的任務(wù)類型判斷,以及子節(jié)點(diǎn)規(guī)劃和執(zhí)行效率,所以manus對(duì)于輸入的質(zhì)量要求很高,通常需要用戶詳細(xì)和完整的描述需求內(nèi)容(越詳細(xì)越好)。
這可能會(huì)成為Manus被詬病的一點(diǎn),畢竟一個(gè)輸入的執(zhí)行是漫長(zhǎng)的,如果僅僅因?yàn)槊枋霾粔蚯逦敿?xì)而導(dǎo)致時(shí)間和算力的浪費(fèi),會(huì)嚴(yán)重影響產(chǎn)品體驗(yàn),屬于產(chǎn)品的不成熟,相信未來(lái)團(tuán)隊(duì)會(huì)改善這一點(diǎn),畢竟一次任務(wù)執(zhí)行就要花費(fèi)一杯奶茶錢呢。
04 當(dāng)前的問(wèn)題
從2022年到2025年,經(jīng)歷了三年多的大模型風(fēng)口一輪輪的認(rèn)知沖擊。人們對(duì)于大模型產(chǎn)品的使用體驗(yàn),已經(jīng)基本走過(guò)了“AHA Moment”決定產(chǎn)品去留的階段。一個(gè)大模型產(chǎn)品,在效果驚人的基礎(chǔ)上,還必須要穩(wěn)定、要快,才能長(zhǎng)久抓住用戶。
效果穩(wěn)定性
回頭看manus,鑒于我們的Manus賬號(hào)尚在wishlist,從推特和國(guó)內(nèi)社媒的使用者反饋來(lái)看,略不同于DeepSeek的眾人交口稱贊,用戶對(duì)Mansu的產(chǎn)出穩(wěn)定性很不樂(lè)觀,甚至有不少弄錯(cuò)事實(shí),讓人啼笑皆非的環(huán)節(jié)。
如果執(zhí)行中一個(gè)任務(wù)的數(shù)據(jù)或者事實(shí)用錯(cuò)了,就會(huì)導(dǎo)致最終產(chǎn)出變得不可信,從而浪費(fèi)這2美元的成本。
算力
除了效果不穩(wěn)定,單任務(wù)執(zhí)行時(shí)間過(guò)長(zhǎng)也是被詬病了另一個(gè)點(diǎn),盡管Manus已經(jīng)展示出了其任務(wù)執(zhí)行邏輯和過(guò)程,但留給用戶的仍然有漫長(zhǎng)的等待,一個(gè)用戶發(fā)推說(shuō),自己的任務(wù)執(zhí)行了4-5個(gè)小時(shí)。
這背后是團(tuán)隊(duì)對(duì)使用量的低谷,以及Manus本身架構(gòu)無(wú)法產(chǎn)生的大量算力需求。除以意外,用戶已經(jīng)被各大模型養(yǎng)刁了口味,習(xí)慣了分分鐘出結(jié)果的體驗(yàn),對(duì)于長(zhǎng)達(dá)數(shù)小時(shí)的等待自然無(wú)法容忍。
其實(shí),Manus如果能給用戶一個(gè)可預(yù)見(jiàn)的完成時(shí)間,也許可以減少等待的焦慮。畢竟對(duì)于一個(gè)復(fù)雜的分析任務(wù),即使執(zhí)行時(shí)間長(zhǎng)達(dá)2-3個(gè)小時(shí)甚至半天的時(shí)間,恐怕也比現(xiàn)實(shí)中初級(jí)員工要快的多。
技術(shù)能力
如果說(shuō),算力可以通過(guò)加卡來(lái)完成,那么團(tuán)隊(duì)技術(shù)能力可能短時(shí)間很難補(bǔ)齊。且不去對(duì)比DeepSeek那樣的夢(mèng)之隊(duì),Manus的技術(shù)儲(chǔ)備可能更適合做一款日活百萬(wàn)級(jí)左右的用戶端產(chǎn)品。連續(xù)創(chuàng)業(yè)者出身的團(tuán)隊(duì)可能優(yōu)勢(shì)更在于需求發(fā)現(xiàn),并在短時(shí)間內(nèi)手搓出一個(gè)可以上線使用的產(chǎn)品,但用戶量大了怎么辦?需要技術(shù)升級(jí)是怎么辦,這些都是需要長(zhǎng)時(shí)間解決的問(wèn)題。當(dāng)前Mansu的用戶吐槽套殼和運(yùn)行速度太慢,任務(wù)卡頓就是這個(gè)問(wèn)題的外在體現(xiàn)(團(tuán)隊(duì)的道歉信中我們也看到他們沒(méi)想到這款產(chǎn)品這么出圈)。
Manus有了一個(gè)優(yōu)秀的起步基礎(chǔ),有善于發(fā)現(xiàn)和抓住用戶需求的創(chuàng)始團(tuán)隊(duì)來(lái)把我研發(fā)方向,但還需要更多AI人才來(lái)讓manus成長(zhǎng)的更快更穩(wěn)定。畢竟目前的產(chǎn)品現(xiàn)狀,內(nèi)行人使用幾次之后就能大概了解產(chǎn)品架構(gòu),被大廠拷貝一個(gè)出來(lái)是沒(méi)什么難度的。05Manus初步證明AI Agent的另一條路
市面上的Agent產(chǎn)品有2個(gè)方向,通用型和垂直應(yīng)用型。前者中知名度最高的2個(gè)產(chǎn)品,是來(lái)自2個(gè)大模型廠商OpenAI的”Operator”和Anthropic 推出的 “Computer Use”。這個(gè)方向可以說(shuō)是通用型Agent的代表。
Anthropic的Agent軟件是通過(guò)一個(gè)特殊的API,開(kāi)發(fā)者可以知道Claude 模型來(lái)完成各種計(jì)算機(jī)基本的輸入、打開(kāi)文件等基本操作任務(wù);OpenAI則是在此技術(shù)上擴(kuò)大硬件調(diào)用范圍允許通過(guò)API接口,在個(gè)人電腦上完成編程、預(yù)定旅行和購(gòu)物等操作。國(guó)內(nèi)智譜的AutoGLM在運(yùn)行模式上類似OpenAI的”Operator”。
垂直Agent,典型代表為cursor和devin。這兩款agent產(chǎn)品在程序員中口碑很好,但遺憾的是應(yīng)用領(lǐng)域窄很難推開(kāi)來(lái)。Manus創(chuàng)始人肖宏在一則訪談中也表達(dá)了垂直和通用相比,顯然后者更具有普世價(jià)值,但前者更快走入了應(yīng)用。從實(shí)際情況看,我們周圍不少程序員朋友在用cursor編寫基礎(chǔ)代碼了。
Manus定位為一款通用型AI agent。通過(guò)工程手段實(shí)現(xiàn)Agent架構(gòu)創(chuàng)新,將復(fù)雜的工作流程封裝在一個(gè)云環(huán)境上,融合多個(gè)大模型,通過(guò)任務(wù)規(guī)劃來(lái)自動(dòng)完成子節(jié)點(diǎn)需求處理,產(chǎn)出的是一個(gè)往常需要經(jīng)過(guò)多輪人機(jī)對(duì)話才能完成的復(fù)雜任務(wù)。
Manus達(dá)到了在部分任務(wù)上超越OpenAI DeepSearch的效果,代表了Agent的另一條可以選擇的路。
通用型agent產(chǎn)品,不可能依靠單一大模型實(shí)現(xiàn),并且天然就是第三方開(kāi)發(fā)者的使命。
畢竟OpenAI和Anthropic的agent,幾乎不太可能通過(guò)競(jìng)對(duì)的模型來(lái)實(shí)現(xiàn),這就決定了他們的產(chǎn)品研發(fā)進(jìn)度和工程手段無(wú)法和第三方相比。
同時(shí)Manus的應(yīng)用范圍相比通用型產(chǎn)品更加落地,相比垂直型有更廣闊的應(yīng)用領(lǐng)域。通用型agent所宣傳的幫助用戶購(gòu)票、規(guī)劃形成以及電商購(gòu)物的一系列操作,用戶自己操作也毫無(wú)門檻。但完成一個(gè)特斯拉財(cái)報(bào)分析報(bào)告,就需要很高的門檻了。通常有門檻的產(chǎn)品,其商業(yè)價(jià)值就更高。
互聯(lián)網(wǎng)界一直將AI Agent和通用型AGI鎖定起來(lái),但Manus的出現(xiàn)告訴人們,即使尚未達(dá)到AGI,但 who cares,對(duì)普通用戶來(lái)說(shuō)能完成任務(wù)的同志才是好同志。
05 三重啟示
1. 有了AI助力,更需要獨(dú)立決策能力
即使今天和不遠(yuǎn)的明天Manus仍不能變成廣泛使用的agent產(chǎn)品,我們也能從不斷涌現(xiàn)的類似產(chǎn)品中明白看到一個(gè)核心問(wèn)題,即獨(dú)立思考和創(chuàng)新能力未來(lái)會(huì)是一個(gè)人的核心能力。
AI的確能幫人們做很多事,幫你分析實(shí)驗(yàn)結(jié)果、做實(shí)驗(yàn)報(bào)告,幫你完成案頭材料撰寫等等,但AI不會(huì)幫你做實(shí)驗(yàn),AI不會(huì)幫你想一個(gè)分析該從哪個(gè)點(diǎn)切入才能讓結(jié)果看起來(lái)更有亮點(diǎn)。我們毫不懷疑在AI的介入下,人和人的差距會(huì)越來(lái)越大。
2. 第一手消息更換了來(lái)源
上個(gè)互聯(lián)網(wǎng)風(fēng)口2010年前后,扮演攪動(dòng)風(fēng)云角色的是各大科技媒體,除了四大傳統(tǒng)互聯(lián)網(wǎng)門戶網(wǎng)站外,垂直領(lǐng)域科技媒體也起了舉足輕重的作用。AI風(fēng)口前,創(chuàng)業(yè)企業(yè)新的動(dòng)向往往來(lái)自自媒體、而后經(jīng)過(guò)社媒發(fā)酵,再被全民皆知。
“古典”時(shí)代,只要和記者保持溝通就不會(huì)錯(cuò)過(guò)重要行業(yè)動(dòng)態(tài),但來(lái)到AI時(shí)代,投資人經(jīng)常陷于被動(dòng),對(duì)突然冒出來(lái)的科技新秀一無(wú)所知。不少風(fēng)投機(jī)構(gòu)通過(guò)設(shè)立孵化器來(lái)自己培養(yǎng)創(chuàng)業(yè)企業(yè),但概率不理想,也很少有爆品產(chǎn)生。如何在一個(gè)社媒發(fā)酵模式下,抓住潛在甚至冒尖的機(jī)會(huì),是機(jī)構(gòu)面臨的新課題。
3. 大廠怎么辦
DeepSeek一枝獨(dú)秀的模型效果加開(kāi)源殺手锏,將字節(jié)、騰訊、百度等大廠從技術(shù)潮頭絀落。Manus又邁出了通用型agent走進(jìn)現(xiàn)實(shí)的第一步,又領(lǐng)先了大廠。這里我們都不敢將Manus的研發(fā)成本和大廠成本作對(duì)比,恐怕屆時(shí)將是對(duì)大廠的羞辱。Agent,跟還是不跟?
參考資料
張小珺Jùn|商業(yè)訪談錄:https://www.xiaoyuzhoufm.com/episode/67c3d80fb0167b8db9e3ec0fhttps://pan.baidu.com/s/1KkGRdYdkf84vJygkFk2J5Q?pwd=n15q#list/path=%2F
賽博禪心:實(shí)測(cè) Manus:首個(gè)真干活 AI,中國(guó)造(附50個(gè)用例 + 拆解)https://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==&mid=2247498251&idx=1&sn=f3a81f0f2a0f54c89ed51b2951b07da2&scene=142
賽博禪心:關(guān)于 Manus 的一些獨(dú)家信息https://mp.weixin.qq.com/s/oecpFKV0iog4mK5MNBvTfwmanus使用分享https://manus.im/share/hRGARE7EBqtDhLHBGISLP7?replay=1
本文由人人都是產(chǎn)品經(jīng)理作者【錦緞】,微信公眾號(hào):【錦緞】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!