AI Agent 是人類生產(chǎn)關(guān)系的一次巨變

0 評論 3074 瀏覽 6 收藏 13 分鐘

AI Agent不僅僅是對現(xiàn)有技術(shù)的升級;它們代表了一種組織運作、競爭和創(chuàng)新方式的轉(zhuǎn)變。

谷歌發(fā)布的一份名為《Agent》的白皮書,展望了人工智能在商業(yè)中扮演更加積極和獨立的角色的未來。這份42頁的文件在9月發(fā)布時并未引起太大轟動,但如今在X.com(前身為推特)和LinkedIn上引起了廣泛關(guān)注。

這份報告提出了“AI Agent”的概念,一種超越現(xiàn)有AI模型的軟件系統(tǒng),能夠進(jìn)行推理、規(guī)劃并采取行動,以實現(xiàn)特定目標(biāo)。與傳統(tǒng)的AI系統(tǒng)不同,后者僅根據(jù)預(yù)先存在的訓(xùn)練數(shù)據(jù)生成響應(yīng),AI Agent可以與外部系統(tǒng)互動,做出決策,并獨立完成復(fù)雜任務(wù)。

白皮書解釋道:“Agent是自主的,可以在沒有人類干預(yù)的情況下獨立行動?!彼鼈儽幻枋鰹榻Y(jié)合了推理、邏輯和實時數(shù)據(jù)訪問的系統(tǒng)。AI Agent的背后理念十分雄心勃勃:它們可以幫助企業(yè)自動化任務(wù)、解決問題,并做出曾經(jīng)完全由人類處理的決策。

白皮書的作者——朱莉亞·維辛格(Julia Wiesinger)、帕特里克·馬洛(Patrick Marlow)和弗拉基米爾·武斯科維奇(Vladimir Vuskovic),詳細(xì)闡述了AI Agent如何運作以及它們所需的功能。

然而,更廣泛的影響同樣重要。AI Agent不僅僅是對現(xiàn)有技術(shù)的升級;它們代表了一種組織運作、競爭和創(chuàng)新方式的轉(zhuǎn)變。那些采納這些系統(tǒng)的企業(yè)可能會在效率和生產(chǎn)力上獲得巨大的提升,而那些猶豫不決的企業(yè)則可能發(fā)現(xiàn)自己在競爭中逐漸落后。

以下是谷歌白皮書中的五大關(guān)鍵見解,以及它們對未來商業(yè)中AI應(yīng)用的潛在影響。

一、AI Agent不僅僅是更聰明的模型

谷歌認(rèn)為,AI Agent代表了對傳統(tǒng)語言模型的根本性突破。像GPT-4和谷歌的Gemini這樣的模型,在生成單輪響應(yīng)方面表現(xiàn)優(yōu)異,但它們僅限于從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的內(nèi)容。相比之下,AI Agent設(shè)計的初衷是與外部系統(tǒng)互動,基于實時數(shù)據(jù)進(jìn)行學(xué)習(xí),并執(zhí)行多步驟任務(wù)。

白皮書指出:“傳統(tǒng)模型中的知識僅限于它們訓(xùn)練數(shù)據(jù)中已有的內(nèi)容。AI Agent通過與外部系統(tǒng)的連接擴(kuò)展了這些知識。”

這種差異不僅僅是理論上的。設(shè)想一個傳統(tǒng)的語言模型被要求推薦旅游行程。它可能會基于一般知識提出一些建議,但缺乏預(yù)訂機票、檢查酒店可用性或根據(jù)用戶反饋調(diào)整建議的能力。然而,AI Agent則能做到這一切,它可以結(jié)合實時信息并做出自主決策。

這一轉(zhuǎn)變使AI Agent成為一種新的數(shù)字工作者,能夠處理復(fù)雜的工作流。對于企業(yè)來說,這意味著能夠自動化那些曾經(jīng)需要多個人力角色來完成的任務(wù)。通過整合推理與執(zhí)行,AI Agent可能成為從物流到客戶服務(wù)等多個行業(yè)中不可或缺的工具。

人工智能Agent如何使用擴(kuò)展訪問外部API以執(zhí)行任務(wù)的細(xì)分。(圖片來源:谷歌)

二、認(rèn)知架構(gòu)驅(qū)動它們的決策過程

AI Agent能力的核心是其認(rèn)知架構(gòu),谷歌將其描述為一個用于推理、規(guī)劃和決策的框架。這一架構(gòu)被稱為協(xié)調(diào)層,使Agent能夠以循環(huán)的方式處理信息,結(jié)合新數(shù)據(jù)來優(yōu)化其行動和決策。

谷歌將這一過程比作一位大廚在繁忙廚房中的工作。大廚會收集食材,考慮顧客的口味需求,并根據(jù)反饋或食材的可用性調(diào)整食譜。類似地,AI Agent會收集數(shù)據(jù),推理下一步行動,并根據(jù)目標(biāo)調(diào)整自己的行為。

協(xié)調(diào)層依賴于先進(jìn)的推理技術(shù)來引導(dǎo)決策過程。諸如推理與行動(ReAct)、思維鏈(CoT)和思維樹(ToT)等框架,為拆解復(fù)雜任務(wù)提供了結(jié)構(gòu)化的方法。例如,ReAct允許Agent在實時中結(jié)合推理和行動,而ToT則使Agent能夠同時探索多個可能的解決方案。

這些技術(shù)賦予Agent不僅僅是反應(yīng)性的決策能力,還能做出積極主動的決策。白皮書指出,這使得AI Agent具有高度的適應(yīng)性,能夠以傳統(tǒng)模型無法做到的方式應(yīng)對不確定性和復(fù)雜性。對于企業(yè)來說,這意味著AI Agent可以承擔(dān)一些任務(wù),例如故障排除供應(yīng)鏈問題或分析財務(wù)數(shù)據(jù),且在較少人工監(jiān)督的情況下實現(xiàn)高度的自主性。

AI Agent決策過程的流程,從用戶輸入到工具執(zhí)行和最終響應(yīng)。(圖片來源:谷歌)

三、工具拓展了Agent的能力,超越了訓(xùn)練數(shù)據(jù)的限制

傳統(tǒng)的AI模型常被描述為“靜態(tài)知識庫”,僅限于其訓(xùn)練數(shù)據(jù)所涵蓋的內(nèi)容。而AI Agent則不同,它們能夠通過工具訪問實時信息,并與外部系統(tǒng)進(jìn)行互動。這一能力使得它們在現(xiàn)實應(yīng)用中具有實際價值。

白皮書解釋道:“工具彌合了Agent內(nèi)部能力與外部世界之間的差距?!边@些工具包括API、擴(kuò)展程序和數(shù)據(jù)存儲,它們使Agent能夠獲取信息、執(zhí)行操作,并檢索隨著時間變化的知識。

例如,一位負(fù)責(zé)規(guī)劃商務(wù)旅行的Agent可以通過API擴(kuò)展程序檢查航班時刻表,通過數(shù)據(jù)存儲檢索旅行政策,或者使用地圖工具查找附近的酒店。AI Agent能夠動態(tài)與外部系統(tǒng)互動,這使得它們不再是靜態(tài)的響應(yīng)者,而是商業(yè)流程中的活躍參與者。

谷歌還強調(diào)了這些工具的靈活性。例如,函數(shù)允許開發(fā)者將某些任務(wù)卸載到客戶端系統(tǒng),企業(yè)因此能更好地控制Agent如何訪問敏感數(shù)據(jù)或執(zhí)行特定操作。這種靈活性對于金融、醫(yī)療等行業(yè)至關(guān)重要,因為這些行業(yè)對合規(guī)性和安全性有嚴(yán)格的要求。

代理端和客戶端控制的比較,說明人工智能Agent如何與Google Flights API等外部工具交互。(圖片來源:谷歌)

四、檢索增強生成(RAG),讓Agent變得更智能

AI Agent設(shè)計中的一項最具前景的進(jìn)展是檢索增強生成(RAG)的整合。這項技術(shù)使Agent能夠在其訓(xùn)練數(shù)據(jù)不足時,查詢外部數(shù)據(jù)源——如向量數(shù)據(jù)庫或結(jié)構(gòu)化文檔。

白皮書解釋道:“數(shù)據(jù)存儲通過提供訪問更動態(tài)和最新信息的途徑,解決了[靜態(tài)模型]的限制?!盇gent可以實時檢索相關(guān)數(shù)據(jù),從而將其響應(yīng)基于事實信息。

基于RAG的Agent在信息變化迅速的領(lǐng)域尤其有價值。例如,在金融行業(yè),Agent可以在做出投資建議之前拉取實時市場數(shù)據(jù)。在醫(yī)療領(lǐng)域,Agent則可以檢索最新的研究成果,來為診斷建議提供支持。

這一方法還解決了AI中一個長期存在的問題:幻覺(hallucinations),即生成不正確或虛假的信息。通過將響應(yīng)建立在現(xiàn)實世界數(shù)據(jù)的基礎(chǔ)上,Agent能夠提高準(zhǔn)確性和可靠性,從而更適用于那些高風(fēng)險的應(yīng)用場景。

檢索增強生成(RAG)如何使Agent能夠查詢向量數(shù)據(jù)庫并提供精確的上下文感知響應(yīng)。(圖片來源:谷歌)

五、谷歌提供工具加速Agent部署

盡管這份白皮書充滿了技術(shù)細(xì)節(jié),但它同樣為希望實施AI Agent的企業(yè)提供了實用的指導(dǎo)。谷歌重點介紹了兩個關(guān)鍵平臺:LangChain,一個開源的Agent開發(fā)框架,以及Vertex AI,一個用于大規(guī)模部署Agent的托管平臺。

LangChain通過允許開發(fā)者將推理步驟和工具調(diào)用串聯(lián)在一起,簡化了構(gòu)建Agent的過程。而Vertex AI則提供了測試、調(diào)試和性能評估等功能,使得部署生產(chǎn)級Agent變得更加容易。

白皮書指出:“Vertex AI使得開發(fā)者能夠?qū)W⒂跇?gòu)建和完善他們的Agent,而平臺本身則管理了基礎(chǔ)設(shè)施、部署和維護(hù)的復(fù)雜性?!?/p>

這些工具降低了那些想嘗試AI Agent但缺乏深入技術(shù)專長的企業(yè)的門檻。然而,它們也引發(fā)了關(guān)于廣泛采用Agent的長期后果的思考。隨著這些系統(tǒng)變得越來越強大,企業(yè)將需要考慮如何平衡效率提升與潛在風(fēng)險,如對自動化的過度依賴或決策透明度方面的倫理問題。

推理循環(huán)、工具和API的集成,使AI Agent能夠處理旅行計劃或天氣檢查等復(fù)雜任務(wù)。(圖片來源:谷歌)

六、這意味著什么

谷歌關(guān)于AI Agent的白皮書呈現(xiàn)了一個詳細(xì)且雄心勃勃的AI發(fā)展藍(lán)圖。對于企業(yè)而言,信息非常明確:AI Agent不僅僅是一個理論概念,它們是能夠重塑企業(yè)運營方式的實際工具。

然而,這一轉(zhuǎn)型不會一蹴而就。部署AI Agent需要精心的規(guī)劃、實驗和重新思考傳統(tǒng)工作流程的勇氣。正如白皮書所指出的:“由于基礎(chǔ)模型的生成特性,沒有兩個Agent是完全相同的。”

目前,AI Agent既是一個機遇,也是一項挑戰(zhàn)。那些投資于理解和實施這一技術(shù)的企業(yè)將能夠獲得顯著的競爭優(yōu)勢。而那些選擇觀望的企業(yè),可能會在智能化、自動化系統(tǒng)日益主導(dǎo)一切的世界中,陷入追趕的困境。(Venture Beat)

本文由人人都是產(chǎn)品經(jīng)理作者【AI新智能】,微信公眾號:【AI新智能】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!