Manus不是打工人的完美替代品
Manus作為全球首款通用AI Agent產(chǎn)品,自發(fā)布以來迅速成為AI領(lǐng)域的焦點。它憑借強(qiáng)大的任務(wù)執(zhí)行能力和自動化流程,被寄予了“解放打工人生產(chǎn)力”的厚望。然而,隨著測試樣本的增多,Manus的實際表現(xiàn)引發(fā)了市場的分歧。本文深入剖析了Manus的能力邊界、技術(shù)局限以及其在AI Agent賽道中的破圈意義,探討了它是否真的能夠成為“全能替代者”,以及未來AI Agent的發(fā)展方向。
DeepSeek的風(fēng)還沒過,AI賽道又來了一個國產(chǎn)新爆款Manus。
自3月5日晚正式發(fā)布以來,與這個全球首款通用AI Agent相關(guān)的消息,不斷在各大互聯(lián)網(wǎng)上刷屏:“發(fā)布4小時后官網(wǎng)訪問量突破千萬”“在微博、B站等社交媒體一夜爆紅”“A股AI智能體指數(shù)單日暴漲超6%”“相關(guān)概念股批量漲?!薄把埓a被炒到數(shù)千至上萬元”……
同時,各方也在關(guān)注,目前還未全面推出市場,只有測試版的Manus,到底能否復(fù)制DeepSeek的走紅之路,成為國產(chǎn)AI智能體的一塊新豐碑。
但隨著網(wǎng)絡(luò)上曝光的Manus測試樣本不斷增多,該產(chǎn)品也快速陷入到口碑崩盤、虛假突破、饑餓營銷的重重迷局之中。
破圈意義遠(yuǎn)大于實際能力
這段時間,通過官方演示和多方實測,業(yè)界對這款全球首款通用AI Agent,到底具備怎樣的能力有了新的認(rèn)知。
從官方演示中,Manus已經(jīng)開始自主完成簡歷篩選、分析股票等復(fù)雜的任務(wù)。全程無須人工后期優(yōu)化,可直接交付完整成果,遠(yuǎn)超OpenAI同類產(chǎn)品,還創(chuàng)下了GAIA基準(zhǔn)測試新紀(jì)錄。
而在全網(wǎng)泛濫的測評內(nèi)容中,從篩選簡歷、寫報告,到做PPT、股票分析,Manus的使用者似乎只需發(fā)送一個任務(wù)或文件,就能迅速調(diào)用各類工具,實現(xiàn)編寫和執(zhí)行代碼、瀏覽網(wǎng)頁、操作應(yīng)用等,還能根據(jù)用戶需求來拆解任務(wù),進(jìn)行極度復(fù)雜的任務(wù)規(guī)劃和執(zhí)行。
這也是Manus和DeepSeek最大的不同。
如果說DeepSeek是“知識型最強(qiáng)大腦”,專注于語言模型的極致優(yōu)化,擅長知識推理、文本生成、數(shù)學(xué)計算和代碼優(yōu)化,如法律合同潤色、學(xué)術(shù)論文撰寫、復(fù)雜語義解析等。
上一個AI爆款DeepSeek
那Manus就是“執(zhí)行型打工人”,核心能力是調(diào)用工具鏈自動執(zhí)行復(fù)雜任務(wù)并交付成果,如“爬取財報→編寫代碼→部署網(wǎng)站”的端到端自動化流程。
在C端的應(yīng)用表現(xiàn)上,能實現(xiàn)跨領(lǐng)域協(xié)同的Manus,看起來才是那個可以解放普通人雙手,像人一樣進(jìn)行思考和行動?的完美替代品。
業(yè)內(nèi)人士分析稱:“Manus本質(zhì)上相當(dāng)于把deepseek R1、cline、cloud studio等功能糅合在一起,是一個比較成熟且可操作性比較強(qiáng)的AI Agent,但是它的核心能力依然建立在底層大模型與工具鏈的協(xié)同調(diào)用上?!?/p>
這也導(dǎo)致Manus的口碑褒貶不一:追捧者看好其生產(chǎn)力,通過自動化處理財報分析、電商運營等任務(wù),能達(dá)到降本增效的目的;批評者則痛斥其突發(fā)性錯誤、隱性成本飆升,以及在復(fù)雜流程中可能出現(xiàn)的失控風(fēng)險。
Manus口碑褒貶不一
基于Manus現(xiàn)階段的實際表現(xiàn),將之視為“數(shù)字化輔助工具人”比“全能替代者”更加恰當(dāng)。
對此,華源證券認(rèn)為,Manus的破圈意義遠(yuǎn)大于它目前的實際能力。因為它讓市場見識到了AI應(yīng)用2.0時代下,任務(wù)式AI/Agent應(yīng)該實現(xiàn)的目標(biāo)是:能夠執(zhí)行長任務(wù)步驟、具備異步自主執(zhí)行能力(部署在云端虛擬機(jī),與用戶的工作流程互不干預(yù))。
這都是完全不同于1.0時代的聊天機(jī)器人的用戶體驗和能力邊界,所以有理由相信這是一個不可小視的產(chǎn)業(yè)趨勢節(jié)點。
Manus變體才是大殺器
市場對Manus的實際能力有分歧,但其存在之于產(chǎn)業(yè)的意義更大。
正如前文所說,Manus并非依賴底層模型的顛覆性突破,而是通過工程化手段整合現(xiàn)有技術(shù)(如大模型、Agent框架、工具鏈等),像“搭積木”般構(gòu)建出完整的任務(wù)執(zhí)行閉環(huán)。
Hugging Face的產(chǎn)品負(fù)責(zé)人Victor Mustar
使用Manus編寫了一個飛機(jī)小游戲
國內(nèi)初創(chuàng)公司DeepWisdom的MetaGPT團(tuán)隊,僅用3小時就利用開源框架復(fù)刻出了OpenManus;開源社區(qū)CAMEL-AI團(tuán)隊“0天”就復(fù)刻出了Manus的通用智能體OWL……Manus范式對各家的最主要啟示,或許就是Agent(智能體)的門檻并不高。
這種模式下,Agent開發(fā)的關(guān)鍵在于高效整合現(xiàn)有資源,而不是從零開始技術(shù)攻關(guān)。
換句話說,是“如何用好現(xiàn)有技術(shù)”,而非“發(fā)明新技術(shù)”。通過工程整合、開源協(xié)作與用戶體驗優(yōu)化,中小團(tuán)隊完全可能打造出實用的Agent產(chǎn)品。
問題是,隨著市面上有關(guān)Manus的測試樣本逐漸增多,其在使用過程中暴露的局限性,也揭示了該賽道的深層技術(shù)壁壘。
相關(guān)報道顯示,科技媒體TechCrunch利用Manus測試了包括訂外賣,預(yù)訂餐廳位置,買機(jī)票等一系列任務(wù),但是無一例外都發(fā)生了錯誤,導(dǎo)致任務(wù)中止或任務(wù)完成質(zhì)量不高。平安基金經(jīng)理翟森也在接受財聯(lián)社采訪時表示,已經(jīng)第一時間看過賣方、自媒體等渠道的演示,效果確實很驚艷。但由于尚在測試期,可能存在資源不足的問題,目前一個任務(wù)代理的生成任務(wù)需要花費以小時計的時間。
測試樣本不斷增多
這意味著想要實現(xiàn)真正的跨領(lǐng)域協(xié)同,仍需突破核心技術(shù)瓶頸——多領(lǐng)域知識的動態(tài)融合與語義對齊。
其中,既要突破領(lǐng)域壁壘帶來的認(rèn)知鴻溝,又要在實時交互中保持上下文一致性,同時還要兼顧任務(wù)目標(biāo)的優(yōu)先級動態(tài)調(diào)度,以及資源的優(yōu)化分配,最終在復(fù)雜場景下確保決策的準(zhǔn)確性、時效性和可解釋性。
這對像Manus這樣的實用型Agent產(chǎn)品,在知識圖譜構(gòu)建、上下文感知算法、多模態(tài)交互協(xié)議及動態(tài)推理框架等方面,提出了更加系統(tǒng)性的要求。
而Manus的測試實踐結(jié)果,也為該賽道揭示了一個未來的關(guān)鍵趨勢:AI Agent的競爭正從單一產(chǎn)品功能轉(zhuǎn)向生態(tài)構(gòu)建能力。
短期來看,垂直領(lǐng)域必然將出現(xiàn)更多”Manus變體”,即利用開源框架快速封裝場景化Agent;長期而言,真正實現(xiàn)跨領(lǐng)域協(xié)同,需突破智能體操作系統(tǒng)的誕生和人機(jī)協(xié)作范式的重構(gòu)這兩大拐點。
當(dāng)Agent不再是執(zhí)行預(yù)設(shè)流程的工具,而是能自主理解跨領(lǐng)域任務(wù)語義的”數(shù)字同事”,解放打工人生產(chǎn)力的那一天也就真的來了。
撰文/ 孟會緣 編輯/ 陳鄧新
本文由人人都是產(chǎn)品經(jīng)理作者【鋅刻度】,微信公眾號:【鋅刻度】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!