海外科技博主點評Manus:炒作跑在了技術(shù)創(chuàng)新前面

0 評論 763 瀏覽 0 收藏 8 分鐘

Manus作為一款備受矚目的“代理型”人工智能平臺,在推出后迅速引發(fā)了廣泛的關(guān)注和討論。然而,海外科技博主對其實際表現(xiàn)提出了質(zhì)疑,認(rèn)為Manus的炒作可能跑在了技術(shù)創(chuàng)新前面。

Manus是一款上周推出預(yù)覽版的“代理型”人工智能平臺,其引發(fā)的關(guān)注度甚至超過了泰勒·斯威夫特(Taylor Swift)的演唱會。

Hugging Face的產(chǎn)品負(fù)責(zé)人稱Manus是“我嘗試過的最令人印象深刻的人工智能工具”。人工智能政策研究員迪安·鮑爾(Dean Ball)將Manus描述為“使用人工智能的最復(fù)雜的計算機”。Manus的官方Discord服務(wù)器在短短幾天內(nèi)就吸引了超過13.8萬名成員,其邀請碼在中國的二手平臺閑魚上甚至被炒至數(shù)千美元。

然而,這種熱度似乎并不完全合理。

據(jù)社交媒體上的報道,Manus并非完全從零開始開發(fā)。該平臺結(jié)合了現(xiàn)有的和經(jīng)過微調(diào)的人工智能模型,包括Anthropic的Claude和阿里巴巴的Qwen,以執(zhí)行諸如撰寫研究報告和分析財務(wù)文件等任務(wù)。

然而,在其網(wǎng)站上,Manus背后的中國公司“蝴蝶效應(yīng)”(The Butterfly Effect)卻給出了該平臺能夠?qū)崿F(xiàn)的一些夸張例子,從購買房產(chǎn)到開發(fā)電子游戲無所不包。

在一段在X平臺上瘋傳的視頻中,Manus的研究負(fù)責(zé)人紀(jì)益超(Yichao “Peak” Ji)暗示,該平臺優(yōu)于OpenAI的深度研究和操作員等代理型工具。紀(jì)益超聲稱,Manus在一項名為GAIA的通用人工智能助手基準(zhǔn)測試中表現(xiàn)優(yōu)于深度研究,該測試考察人工智能通過瀏覽網(wǎng)頁、使用軟件等方式完成工作的能力。

“Manus不僅僅是一個聊天機器人或工作流,”紀(jì)益超在視頻中說,“它是一個完全自主的代理,彌合了構(gòu)想與執(zhí)行之間的差距……我們認(rèn)為這是人機協(xié)作的下一個范式?!?/p>

然而,一些早期用戶表示,Manus并非萬能的解決方案。

人工智能初創(chuàng)公司Pleias的聯(lián)合創(chuàng)始人亞歷山大·多利亞(Alexander Doria)在X平臺上發(fā)帖稱,他在測試Manus時遇到了錯誤信息和無限循環(huán)。其他用戶也指出,Manus在回答事實性問題時會出錯,且并不總是引用其來源——而且經(jīng)常遺漏一些很容易在網(wǎng)上找到的信息。

“深度研究在不到15分鐘內(nèi)就完成了。不幸的是,Manus AI在第18/20步失敗了,耗時50分鐘!它表現(xiàn)得相當(dāng)不錯——我在查看Manus的輸出結(jié)果時,感覺很不錯。然而,第二次運行相同的指令時,它花了太長時間,這有點令人沮喪!”

我自己使用Manus的經(jīng)歷也并不十分積極。

我讓這個平臺幫我處理一個在我看來非常簡單的要求:從我配送范圍內(nèi)的一個高評分快餐店訂購一份炸雞漢堡。大約10分鐘后,Manus崩潰了。第二次嘗試時,它找到了符合我標(biāo)準(zhǔn)的菜單項,但Manus無法完成訂購過程,甚至無法提供一個結(jié)賬鏈接。

嘗試用Manus點炸雞三明治是一種令人沮喪的經(jīng)歷。

當(dāng)我要求Manus預(yù)訂從紐約到日本的航班時,它的表現(xiàn)同樣不盡如人意。

我給出的指令在我看來并沒有太多模糊空間(例如“尋找商務(wù)艙航班,優(yōu)先考慮價格和靈活的日期”),但Manus能做到的最好結(jié)果只是提供了一些航空公司網(wǎng)站和航班搜索平臺(如Kayak)的機票鏈接,其中一些鏈接甚至無法打開。

Manus目前還不能為您預(yù)訂去東京的航班。

懷著對接下來的任務(wù)可能會有更好表現(xiàn)的希望,我讓Manus為我預(yù)訂一張步行距離內(nèi)的餐廳的單人桌,但幾分鐘后它失敗了。隨后,我要求該平臺開發(fā)一款受《火影忍者》啟發(fā)的格斗游戲,但在半小時后出現(xiàn)了錯誤,這讓我決定放棄。

阿什托什·夏里瓦斯塔瓦(Ashutosh Shrivastava)在3月9日的推文中表示:

“在嘗試Manus AI三天后,我的真實看法如下,有好有壞。
好的方面:
它在互聯(lián)網(wǎng)上進(jìn)行的研究以及生成的報告令人難以置信。
它在后臺運行腳本來執(zhí)行任務(wù)的能力令人印象深刻。
它的計劃……”

Manus的一位發(fā)言人通過直接消息向TechCrunch發(fā)送了以下聲明:

“作為一個小團隊,我們的重點是不斷改進(jìn)Manus,打造真正能幫助用戶解決問題的人工智能代理……當(dāng)前封閉測試的主要目標(biāo)是對系統(tǒng)的各個部分進(jìn)行壓力測試并識別問題。我們非常感謝每個人分享的寶貴見解。”

因此,如果Manus未能實現(xiàn)其技術(shù)承諾,為什么它會引發(fā)如此大的關(guān)注呢?有幾個因素促成了這一點,比如由于邀請碼稀缺而產(chǎn)生的排他性。

中國媒體迅速將Manus宣傳為一項人工智能突破,《QQ新聞》甚至稱其為“國內(nèi)產(chǎn)品的驕傲”。與此同時,社交媒體上的人工智能網(wǎng)紅傳播了關(guān)于Manus能力的不實信息。一個被廣泛分享的視頻展示了一個桌面程序(據(jù)稱是Manus)在多個智能手機應(yīng)用程序中采取行動。但紀(jì)益超確認(rèn),這段視頻實際上并不是Manus的演示。

X平臺上的其他有影響力的人工智能賬號試圖將Manus與中國的DeepSeek公司進(jìn)行比較——但這些比較并不一定基于事實。與DeepSeek不同,蝴蝶效應(yīng)并沒有開發(fā)任何內(nèi)部模型。此外,盡管DeepSeek公開了許多技術(shù),但Manus尚未做到——至少目前還沒有。

公平地說,Manus目前仍處于非常早期的訪問階段。該公司聲稱正在努力擴展計算能力,并在問題被報告后進(jìn)行修復(fù)。但就目前該平臺的現(xiàn)狀而言,Manus似乎是一個技術(shù)炒作跑在技術(shù)創(chuàng)新前面的例子。(TechCrunch)

本文由人人都是產(chǎn)品經(jīng)理作者【AI新智能】,微信公眾號:【AI新智能】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!