從沉思到執(zhí)行,AutoGLM 到底能否成為產(chǎn)品調(diào)研的好助手?
在人工智能浪潮中,AutoGLM 作為一款備受矚目的產(chǎn)品,聲稱能實現(xiàn)“一邊想一邊干”的強(qiáng)大功能。然而,它是否真的能成為產(chǎn)品調(diào)研的好助手?本文作者通過親身實踐,從多個維度對 AutoGLM 進(jìn)行了深度測試與分析,供大家參考。
媒體宣傳說智譜清言可以“一邊想一邊干”,于是我立刻申請內(nèi)測,開始使用 AutoGLM,期盼它能自主運行,幫我訂一杯奶茶。結(jié)果是它只是幫我打開了美團(tuán)網(wǎng)站,輸出了一堆沒用的信息,奶茶依然留在了奶茶店,沒有出現(xiàn)在我的桌面上。
我隨后又嘗試了官網(wǎng)宣傳的“訂酒店”功能,結(jié)果還是一長串搜索與分析,最終也沒有真正幫我完成酒店預(yù)訂。
最終,我放棄了它“干”的功能,轉(zhuǎn)而測試它“想”的能力,嘗試用它來做一些深度分析。
從官網(wǎng)的用例來看,目前 AutoGLM 的核心功能,個人認(rèn)為還是集中在 Deep Research 層面。我下載了 mac 版本的桌面應(yīng)用,同時也下載了 Chrome 的 AutoGLM 插件。從插件的信息來看,支持自動運行的網(wǎng)站包括知乎、微博、百度等十幾個網(wǎng)站。正如官網(wǎng)所說,目前該產(chǎn)品功能仍處于實驗階段,期待后續(xù)能夠真正實現(xiàn)“一句話訂酒店”的愿景。
我測試了一個“節(jié)假日西安周邊游”的出行規(guī)劃。從它的思維鏈可以看出,它的 workflow 包括:常規(guī)搜索、AutoGLM 搜索、工具調(diào)用、內(nèi)容思考、總結(jié)輸出。首次在小紅書上的搜索失敗,隨后改用搜索引擎進(jìn)行全局搜索。通過 tool observation 獲取信息,從知乎、小紅書、抖音等社交媒體進(jìn)行詳細(xì)搜索。
在搜索過程中,它會自動啟動 Chrome 瀏覽器,可以看到 AutoGLM 的操作過程,比如調(diào)整小紅書搜索帖子的過濾器,從“綜合”調(diào)整為“最熱”。操作過程中,瀏覽器會出現(xiàn)藍(lán)色光暈閃現(xiàn),表示正在工作中。
大約 10 分鐘后輸出了一份行程規(guī)劃。但結(jié)果價值不大。因為是節(jié)假日,必然會遇到交通擁堵等問題,本應(yīng)提前規(guī)劃自駕路線,而報告中并未提供相應(yīng)的出行路線規(guī)劃。
官網(wǎng)介紹視頻講解了 AutoGLM 的技術(shù)路徑:從通用基座模型 GLM-4,到推理能力大幅提升的 GLM-Z1-Air,再到強(qiáng)化學(xué)習(xí)訓(xùn)練出“沉思”能力的 GLM-Z1-Rumination,最終融合為 AutoGLM 的執(zhí)行力。于是我開始橫向?qū)Ρ人摹俺了寄芰Α薄?/p>
這幾天我在研究 AI 在電子閱讀器中的應(yīng)用情況,于是隨手用 AI 來做一份產(chǎn)品市場分析,用類似 AutoGLM 的“沉思”功能來測試它的思考整合能力到底如何。
在 Mac 客戶端中輸入 Prompt:“分析目前電子閱讀器 AI 應(yīng)用的情況,從產(chǎn)品功能、定價策略、用戶評價、更新日志、社交媒體監(jiān)聽(受歡迎程度、用戶反饋以及互動情況)、App Store / Google Play Store 數(shù)據(jù)分析(下載量、評分、評論內(nèi)容、更新頻率)等方面進(jìn)行調(diào)查,必須依據(jù)最新的數(shù)據(jù)進(jìn)行分析;另外分析未來 AI 在電子閱讀器領(lǐng)域的應(yīng)用趨勢?!?/p>
盡可能讓 Prompt 思考得更全面,并橫向?qū)Ρ绕渌?AI 模型的推理能力。
輸入 Prompt 后,客戶端開始工作,首先進(jìn)行免責(zé)申明,提示目前仍處于實驗階段。隨后進(jìn)行常規(guī)搜索,第一步完成推理后,生成搜索關(guān)鍵詞。接著提示我確認(rèn)品牌,我補(bǔ)充輸入:“以亞馬遜等主流品牌為基礎(chǔ)研究,地區(qū)以歐美為主,中國為輔進(jìn)行分析?!盇utoGLM 再次搜索關(guān)鍵詞,并在推理與搜索過程中自動啟動了 Chrome,讓用戶實時看到其搜索流程。說實話,第一次看到它自動彈出網(wǎng)頁并演示自動搜索過程還挺新鮮,但如果一直這樣操作,就會影響用戶體驗。在用戶進(jìn)行多任務(wù)工作時,突然開啟大量網(wǎng)頁,不僅無實際幫助,反而還需要用戶手動關(guān)閉,增加負(fù)擔(dān)。
報告輸出后,內(nèi)容依然逃不過“大而全、泛泛而談”的通病,對我需要的信息闡述不夠細(xì)致,倒是展示了一堆額外信息。尤其是在數(shù)據(jù)范圍方面并未詳盡說明,比如價格和 Google Play Store 的數(shù)據(jù)分析基本缺失,提示無法獲取相關(guān)數(shù)據(jù)。我理解這可能是因為智譜的網(wǎng)絡(luò)環(huán)境限制了訪問 Google 網(wǎng)頁。
對比 ChatGPT-4o 的 Deep Research,它給的數(shù)據(jù)相對更“詳盡”,對數(shù)據(jù)的解讀也較為到位。用戶評論總結(jié)有據(jù)可依,關(guān)鍵結(jié)論都附有網(wǎng)頁鏈接,節(jié)省了二次搜索驗證的精力。
而 Gemini 的 Deep Research 表現(xiàn)介于兩者之間,雖然提供了數(shù)據(jù)描述,但沒有像 ChatGPT 那樣結(jié)構(gòu)化地以表格形式清晰呈現(xiàn)。不過也提供了基本的數(shù)據(jù)與分析。從這個角度來看,ChatGPT 在這一項指標(biāo)上勝出。
再來看 Manus 的表現(xiàn),它同樣提供了數(shù)據(jù),并以結(jié)構(gòu)化的方式進(jìn)行了總結(jié)分析。對于常規(guī)研究,這些信息基本夠用。目前給出的分析細(xì)節(jié)與數(shù)據(jù)可信度略低于 ChatGPT。
AI 對現(xiàn)有數(shù)據(jù)的整合能力很強(qiáng),但對未來的預(yù)測仍然是基于現(xiàn)有數(shù)據(jù)的衍生與推演,我們也做了一些測試。
關(guān)于未來電子閱讀器 AI 的應(yīng)用分析,ChatGPT 給出了幾個方向:
1.閱讀器從“被動呈現(xiàn)”轉(zhuǎn)向“主動交互”。AI 可以成為閱讀伙伴,與讀者共同探討閱讀內(nèi)容。這是一個有趣的方向,但我個人認(rèn)為閱讀更偏向沉浸式體驗,頻繁交互可能反而影響體驗。
2.AI 覆蓋整個閱讀流程,從“讀前-讀中-讀后”全流程滿足用戶細(xì)分需求。這對于產(chǎn)品設(shè)計初期是很好的創(chuàng)意來源。
3.更自然的語音交互。這項發(fā)展已經(jīng)非常接近現(xiàn)實,可能會對有聲讀物市場產(chǎn)生一定沖擊。
4.推動端側(cè)模型和云端模型的結(jié)合。類似手機(jī)產(chǎn)品,會有越來越多的 AI 功能通過端側(cè)模型處理,進(jìn)而推動硬件處理器發(fā)展。
此外,還有一些總結(jié)性的風(fēng)險提示。
AutoGLM 的“沉思”功能提供的方向相對概括:
1.個性化體驗
2.深度理解
3.多模態(tài)交互
4.跨設(shè)備同步
5.社交閱讀
但整體分析偏簡單,缺乏足夠細(xì)節(jié)來“令人信服”。感覺像是“為了 AI 而 AI”。這些總結(jié)點目前主流閱讀器已有實現(xiàn),沒有提出令人眼前一亮的新點子,顯得平庸。對產(chǎn)品設(shè)計前期的頭腦風(fēng)暴也沒能提供有力支持。
再來看 Gemini 提出的方向:
1.更智能的內(nèi)容推薦
2.更自然的交互方式
3.增強(qiáng)的語言學(xué)習(xí)功能
4.AI 驅(qū)動的文本分析與理解
5.更強(qiáng)大的輔助功能
6.更互動的動態(tài)電子書
看完 Gemini 的分析,以及雖然沒有展示但已測試的 Manus,可以看出各家對未來的預(yù)測已趨同,本質(zhì)上并無太大差異。這說明,AI 能提供全面概括,但真正挖掘新的 AI 需求,仍需“以人為本”的體感洞察。
我們再來看下 Manus 的表現(xiàn),它同樣給出了數(shù)據(jù),并且以結(jié)構(gòu)化的進(jìn)行了總結(jié)分析,對于常規(guī)性的研究,這些信息基本夠用,目前給出的分析細(xì)節(jié)及數(shù)據(jù)可信度略低于 ChatGPT 。
綜合來看,AutoGLM、ChatGPT、Manus、Gemini 對產(chǎn)品調(diào)研確實有積極作用。在傳統(tǒng)桌面調(diào)研路徑中,AI 節(jié)省了大量時間和精力,能夠輕松獲取基礎(chǔ)產(chǎn)品信息。同時,AI 的智能性也可扮演產(chǎn)品助理角色,補(bǔ)充我們的思路。但在涉及定性層面研究時,仍需要“人肉”調(diào)研,真實使用產(chǎn)品、觀察用戶、聆聽用戶聲音,才能深入挖掘產(chǎn)品需求。
我認(rèn)為 AutoGLM 的優(yōu)勢,最終還是應(yīng)聚焦在能夠 執(zhí)行用戶操作 的任務(wù)上,比如電子購物、智能填表等。如果它能在執(zhí)行力方面做出差異化,才能在眾多思維鏈 AI 產(chǎn)品中脫穎而出。
本文由 @Antonio 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)
- 目前還沒評論,等你發(fā)揮!