又黑又紅的Manus,還要闖三道關(guān)
本文將深入剖析Manus的“黑紅”體質(zhì),探討其背后的技術(shù)邏輯、用戶體驗以及面臨的成本、技術(shù)和市場競爭三大挑戰(zhàn),試圖還原一個真實的Manus,并思考其對國內(nèi)AI Agent發(fā)展的啟示。
“AI一天,人間一年”。
3月6日凌晨,Manus亮相,瞬間點燃了整個科技圈。它被稱為全球首款通用型AI Agent(人工智能代理)產(chǎn)品,由國內(nèi)一家創(chuàng)業(yè)團隊——Monica.im打造。但這場技術(shù)狂歡,迅速陷入爭議旋渦。發(fā)布僅兩天,Manus的口碑經(jīng)歷了數(shù)次劇烈反轉(zhuǎn)。
Manus官方將自己定義為一款連接思維與行動的通用人工智能代理,特點是擅長處理各種任務(wù),不僅能思考(聽懂復(fù)雜指令進行推理),還能交付成果(順滑對接完成該任務(wù)的各個環(huán)節(jié),將最終結(jié)果給到用戶)。
舉個簡單的例子。
如果讓Manus篩選簡歷,用戶只需將存有多份簡歷的壓縮包直接發(fā)給Manus,剩下的任務(wù)就全部交由它完成。Manus會自動解壓縮文件,瀏覽找出重要信息,給出候選人評估結(jié)果,還可以將候選人姓名和重要信息做成表格,方便用戶查閱。
在此過程中,用戶不僅可以關(guān)閉電腦,還能隨時添加其他任務(wù)。
有了Manus,普通HR的日常工作似乎變得“多余”。這也讓許多人驚呼,取代打工人的“AI牛馬”真的來了。
不過,Manus屬于“黑紅”體質(zhì)。
發(fā)布之初,它被冠以“炸裂”、“拳打ChatGPT”、“比肩DeepSeek”、“震撼硅谷”等名頭,風(fēng)光無限。不久后質(zhì)疑聲接踵而至,有人認為它過度營銷,技術(shù)沒有太大突破實為“套殼”,噱頭遠大于實際能力。
緊接著,其內(nèi)測邀請碼被炒到10萬元天價的消息傳出;它在X平臺上的官方賬號被凍結(jié),顯示原因為“違反平臺規(guī)則”。隨后,Manus聯(lián)合創(chuàng)始人兼首席科學(xué)家季逸超公開回應(yīng)稱,賬號被凍結(jié)可能與第三方提及加密貨幣詐騙有關(guān),該領(lǐng)域與Manus的運營完全無關(guān)。
這一系列事件,更加深了外界對Manus的疑慮。這款備受矚目的產(chǎn)品,究竟是真正的技術(shù)革新,還是營銷噱頭?未來又能火多久?
01 爭議中的Manus,真有實力還是套殼工具?
Manus爆火兩天,外界對它的評價極為兩極分化。
一部分人覺得Manus讓AI Agent又上了一個臺階,馬上就要搶走打工人的飯碗,也有一部分人認為它只是個套殼工具。
來看它“封神”的點。
相比市面上已經(jīng)出現(xiàn)AI Agent(比如豆包、文小言都內(nèi)置了很多智能體),Manus的優(yōu)點之一在于,處理復(fù)雜任務(wù)時具備自主性、連續(xù)性。
比如用戶只需給出一段比較詳細的提示詞,Manus便能自主解讀、拆解并給出結(jié)果,還能進行自我檢查,省去了一步步的對話引導(dǎo)步驟。
由于Manus是基于云端異步運行,用戶下達完指令后關(guān)閉頁面都不會影響Manus處理指令,任務(wù)完成后還會自動通知用戶結(jié)果。
Manus的另一大亮點,是號稱全球首款通用型AI Agent產(chǎn)品。
需要注意的是“通用”二字,指它能夠處理各種各樣的任務(wù),不限任何領(lǐng)域,比如支持篩選簡歷、房產(chǎn)調(diào)研、股票分析等多場景。
然而,對于這兩大亮點,也存在著不少質(zhì)疑的聲音。
首先,由于Manus處于內(nèi)測階段,采用邀請碼制度,大多數(shù)用戶尚未真正使用過該產(chǎn)品,目前對其“驚艷”的評價大多源自官方發(fā)布的演示視頻。鑒于過往許多AI產(chǎn)品都存在“樣片水平大于實際實力”的情況,部分從業(yè)者認為Manus的真實能力有待進一步考量。
其次,對于Manus的“通用性”,部分從業(yè)者認為,存在套殼嫌疑。
有從業(yè)者評價,Manus沒有自研底層大模型的能力,其模型能力主要來源于國外Anthropic的Claude。而且,很多場景和功能早已在其他Agent中實現(xiàn)。比如,Devin作為全球首個AI程序員,也是一個能獨立完成寫代碼任務(wù)(學(xué)習(xí)新技術(shù)、調(diào)試代碼到部署應(yīng)用程序)的AI Agent,在去年年底便面向公眾開放。
從這個角度來看,Manus更像是給現(xiàn)有的各類AI應(yīng)用加了個殼子,把DeepResearch(OpenAI推出)、Computer Use(Anthropic推出)等應(yīng)用匯總了起來。
AI軟件工程師覃相告訴「定焦One」,Manus是基于現(xiàn)有大語言模型的調(diào)用,并未涉及底層技術(shù)突破。比如在進行股票分析時,Manus通過調(diào)用雅虎金融API獲取數(shù)據(jù),再借助編程語言生成可視化圖表,依賴的都是現(xiàn)有的技術(shù)和工具。
參加了Manus閉門分享會的AI博主自動華也對「定焦One」表示,制作團隊分享了Manus作為AI員工主要做的三件事:配電腦(賦予AI訪問瀏覽器和工具的能力)、配權(quán)限(接入私有API和權(quán)威數(shù)據(jù)源)、給培訓(xùn)(用戶可以通過反饋實時調(diào)整AI行為)。
可見,Manus本質(zhì)上是將各種工具進行拼接,其能完成跨應(yīng)用這類復(fù)雜任務(wù),依賴的是Claude模型,以及接入的各類智能體工具。
至于“套殼”“拼接”是否算作創(chuàng)新,業(yè)界觀點不一。支持者認為,這種整合方式能夠快速實現(xiàn)多種功能,為用戶提供一站式解決方案,具有一定的實用價值;反對者則認為,這種模式只是基于現(xiàn)有技術(shù)進行簡單組合。
但從業(yè)者基本都認同,從技術(shù)維度上看,Manus還遠稱不上是下一個DeepSeek。
02 如何正確看待Manus?
比起技術(shù),Manus走紅的關(guān)鍵在于用戶體驗。
減少了操作步驟,執(zhí)行過程中不用反復(fù)和AI對話,還可以關(guān)閉界面,這都是過往AI Agent產(chǎn)品所不具備的。
自動華認為,AI Agent的意義在于幫助普通人提效,Manus重新定義了AI應(yīng)用的價值指標(biāo),由重視DAU(用戶留存)變到AHPU(Agentic Hours Per User,用戶使用AI完成任務(wù)所耗費的時間)。
“正是這樣的benchmark(可簡單理解為評估指標(biāo)),決定了產(chǎn)品優(yōu)化路線,讓Manus和市面上其他AI Agent產(chǎn)品有了區(qū)別?!弊詣尤A表示。
他解釋,傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品都是“注意力經(jīng)濟”,希望占據(jù)用戶更多的使用時間,最終通過廣告變現(xiàn),所以將五花八門的垂類Agent放到了產(chǎn)品中。
Manus的定位是通用型AI Agent,在執(zhí)行同量任務(wù)情況時,試圖讓用戶花的時間越短越好,所以它做了一個大整合,希望用越快的操作方式、越少的操作步驟為用戶提效。
這與團隊的過往背景有關(guān)。Manus背后的團隊在2023年開發(fā)了AI瀏覽器插件助手Monica,他們發(fā)現(xiàn)瀏覽器作為單用戶場景存在人機控制權(quán)沖突,AI頻繁打斷用戶體驗的痛點,由此得出“AI應(yīng)擁有獨立云端瀏覽器”。
自動華覺得,正是由此他們提出了“Less structure, more intelligence”,主張減少對AI的結(jié)構(gòu)化限制,依賴模型自主進化能力,而非人工預(yù)設(shè)流程,才讓Manus區(qū)別于傳統(tǒng) AI Agent。
這也是大部分用戶對Manus感到興奮的點。覃相將Manus比作“數(shù)字代理人”,能自動拆解復(fù)雜指令、替用戶完成多個任務(wù),而且執(zhí)行速度快,在任務(wù)執(zhí)行和用戶體驗上超越了豆包和百度的AI Agent。
覃相還進一步分析Manus核心優(yōu)勢背后的技術(shù)原理:多代理架構(gòu)、強自主學(xué)習(xí)能力。
首先,Manus具備多代理架構(gòu)與任務(wù)分解能力,它采用了多智能體系統(tǒng)架構(gòu),能夠?qū)?fù)雜任務(wù)分解為多個子任務(wù),并通過不同的智能體協(xié)同完成。這種架構(gòu)使其能夠高效處理長尾任務(wù)。
其次,它具備自主學(xué)習(xí)與記憶功能,能夠記住用戶的偏好,并在后續(xù)任務(wù)中主動調(diào)整策略。這種自主學(xué)習(xí)能力使其能夠不斷優(yōu)化任務(wù)執(zhí)行邏輯,逐漸從被動響應(yīng)轉(zhuǎn)向主動服務(wù)。
不過,在速度提升時,準(zhǔn)確率也是需要重點考慮的要素。
Manus官方指出其具有低錯誤率,在GAIA(一個專為通用人工智能助手設(shè)計的基準(zhǔn)數(shù)據(jù)集,主要用來評估 AI的基本能力)中,面對基礎(chǔ)(整理文件、數(shù)據(jù)分析)、中等(調(diào)用API、寫代碼)、復(fù)雜(邏輯推理、多模態(tài)處理)三個級別的任務(wù)測試,其分數(shù)都超過了OpenAI的DeepResearch,但低于人類平均正確率92%,仍不如人腦聰明。
正如前文所說,由于產(chǎn)品還未大范圍鋪開,從業(yè)者對其實際效果持懷疑態(tài)度。很多博主在測評中發(fā)現(xiàn),Manus在處理中等復(fù)雜的任務(wù)時,出現(xiàn)了長耗時問題;在訪問需要登錄的網(wǎng)站或處理付費墻內(nèi)容時,也會出現(xiàn)卡頓,還是需要用戶手動接管。
03 Manus的下一步,成本、技術(shù)、市場競爭
Manus的爭議不小,但被捧得很高。很多人擔(dān)心,Manus正式上線后,如果實力與預(yù)期不符,很有可能消耗掉DeepSeek為國內(nèi)AI積攢下來的正向價值。
自動華告訴「定焦One」,在Manus的閉門分享會上,官方也提到了將面臨的一些問題。比如未來的產(chǎn)品戰(zhàn)略會朝著優(yōu)化成本和提升運行速度努力,同時他們也在尋找一個與成本相平衡的商業(yè)化定價模式,所以距離公開上線還會有一段時間。
這些挑戰(zhàn)中,成本問題尤為突出。
“Manus單任務(wù)運行成本約2美元,雖然僅為競品DeepResearch的1/10,但相比于豆包的單次任務(wù)調(diào)用回答,卻昂貴了非常多倍?!弊詣尤A表示,在他看來,Manus調(diào)用的算力和生成結(jié)果的質(zhì)量與競品存在差異,但在目前國內(nèi)大模型產(chǎn)品普遍免費的背景下,這種AI一次性完成高質(zhì)量結(jié)果對應(yīng)的付費模式,還有待探索。
目前,大多數(shù)普通用戶為AI產(chǎn)品付費的意愿較低,盡管是功能強大的AI軟件工程師Devin,高昂的月費(500美元)導(dǎo)致使用它的人很少。
這也是Manus需要邀請碼才能使用的重要原因。從業(yè)者認為,官方之所以不全面放開使用權(quán)限,一方面可能是“饑餓營銷”,但更重要的是,要考慮商業(yè)價值和成本的平衡。
用戶多了很有可能導(dǎo)致算力跟不上?!癕anus的底層是依靠大模型能力,算力緊張可通過加顯卡解決,但很多公司支付不起背后高額的成本,特別是Monica還是一家創(chuàng)業(yè)公司?!弊詣尤A表示,Kimi在剛推出市場時也遭遇過類似問題,也沒有輕易選擇加顯卡。
其次,當(dāng)前AI Agent還做不到像人類一樣聰明,解決問題的能力相對有限,Manus也同樣面臨著這一問題。
比如,最容易出現(xiàn)的情況是對用戶問題理解不清晰,同一個問題反復(fù)問AI Agent好幾遍,生成的答案還是無法達到與人類認知相匹配的標(biāo)準(zhǔn)。
因為AI Agent在執(zhí)行任務(wù)時的思考方式是,復(fù)現(xiàn)成熟的任務(wù)流程或通過訓(xùn)練數(shù)據(jù)對問題進行簡單拆分,歸根究底,還是依賴于大模型的基礎(chǔ)能力。Manus并沒有在這方面做出強技術(shù)突破。有使用者指出,Manus對復(fù)雜問題的拆解能力仍處于較低水平。
以及Manus即將面臨的市場競爭壓力也不小。
覃相認為,豆包和百度的AI Agent也有各自的市場定位和技術(shù)優(yōu)勢,未來它們可能會通過技術(shù)升級或差異化競爭,縮小與Manus的差距,而且這兩家公司的資金實力更強。
對于Manus的火爆,很多人持觀望態(tài)度。不止一位投資人對「定焦One」表示,雖然他們很看好今年AI Agent的發(fā)展,但由于之前有類似AI程序員Devin的出現(xiàn),Manus并沒有太驚艷到他們,核心技術(shù)問題也沒有得到根本性提升。
此刻,相比DeepSeek護城河較低的Manus,已經(jīng)有不少開源復(fù)刻版項目出現(xiàn),留給Manus的時間不多了。
作者 | 王璐 編輯 | 魏佳
本文由人人都是產(chǎn)品經(jīng)理作者【定焦One】,微信公眾號:【定焦One】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!