AI創(chuàng)新加速:揭秘Coze、元器、Dify、千帆、百煉如何推動Agent開發(fā)新紀(jì)元
今年開始,Agent成為大模型落地的最佳選擇,各大廠商都在大力推廣。面對這種技術(shù)簇,我們應(yīng)采取一種積極探索與謹(jǐn)慎評估并重的策略——既要保持理性,也要保持樂觀。
隨著大模型迭代的浪潮一波接一波地推高技術(shù)前沿,Agent技術(shù)已經(jīng)成為大模型落地的主流選擇,并被視為賦予大模型更廣闊能力的最佳路徑。從理解復(fù)雜的指令,到處理多模態(tài)信息,從簡單的問答系統(tǒng)到復(fù)雜的決策支持系統(tǒng),從個(gè)性化推薦到自動化的業(yè)務(wù)流程管理,陸續(xù)在更多領(lǐng)域展現(xiàn)出其巨大的潛力和價(jià)值,它正在為社會帶來深刻的變革。
在這場趨之若鶩的群體行動中,面對這項(xiàng)持續(xù)發(fā)展變化的技術(shù)簇,我們應(yīng)采取一種積極探索與謹(jǐn)慎評估并重的策略——既要保持理性,也要保持樂觀,以此來應(yīng)對不確定性。技術(shù)的更新迭代需要時(shí)間與耐心,而技術(shù)的應(yīng)用則需了解其限制和準(zhǔn)確判斷業(yè)務(wù)場景。
要有效利用大模型,首先,必須明確他們的優(yōu)勢和不足(圖1)。接下來,整理業(yè)務(wù)操作流程即業(yè)務(wù)SOP,確保對業(yè)務(wù)場景有深刻理解和準(zhǔn)確的認(rèn)知。其次,對領(lǐng)域知識進(jìn)行必要的梳理。第四,在搭建Agent的過程中,盡可能的規(guī)避LLM的局限(例如,通過多輪對話精準(zhǔn)捕捉識別用戶意圖)。第五,要做好企業(yè)內(nèi)專業(yè)資料的處理和必要工具的建設(shè)。最后,準(zhǔn)備好對Agent進(jìn)行持續(xù)的優(yōu)化(效果優(yōu)化),從而在應(yīng)用大型模型時(shí)發(fā)揮其優(yōu)勢,規(guī)避弱點(diǎn)。
一、大模型原生能力&局限
大模型擅長語義理解、邏輯推理以及生成和創(chuàng)作內(nèi)容。然而,它們目前存在一些限制,包括對特定領(lǐng)域的深入理解和時(shí)效性不足、有限的記憶能力、在實(shí)際情況中的魯棒性不夠,導(dǎo)致錯誤、潛在的安全風(fēng)險(xiǎn)、推理和規(guī)劃能力尚待提升、缺少合作意識而無法協(xié)同解決復(fù)雜問題、以及缺乏視覺和聽覺等感官能力,有時(shí)生成的信息可能不精確或是虛構(gòu)的。在構(gòu)建Agent時(shí),可以通過集成其他技術(shù)和能力來補(bǔ)充和改進(jìn)大模型的這些不足。
另外,一些限制更多地取決于大型模型自身能力的提升。例如,泛化能力和過度擬合現(xiàn)象,這可能導(dǎo)致對含糊不清的信息的理解出現(xiàn)歧義,或者混淆了特定領(lǐng)域的知識。模型處理上下文的能力也受到長度的限制。模型的可解釋性和可調(diào)試性不足,使其在某些情況下表現(xiàn)得像一個(gè)局部的黑箱。由于模型參數(shù)眾多,推理過程耗時(shí)較長。此外,微調(diào)模型對高性能的GPU和TPU計(jì)算資源的需求也相對較大。
二、Agent
為讓大模型更充分的發(fā)揮價(jià)值,突破當(dāng)前的局限,主流趨勢是通過Agent增強(qiáng)能力(大腦),為大模型增加眼耳鼻口手腳的能力。
2.1 Agent框架
Agent為大模型提供了執(zhí)行復(fù)雜任務(wù)、與環(huán)境交互、自主決策和長期記憶等關(guān)鍵能力,使得大模型的應(yīng)用從單純的語言處理擴(kuò)展到更廣泛的領(lǐng)域,包括自動化任務(wù)執(zhí)行、客戶服務(wù)、內(nèi)容創(chuàng)作等,極大地?cái)U(kuò)展了AI的實(shí)用性和影響力。為了實(shí)現(xiàn)這樣一套解決方案(圖2),背后需要用工程化的手段落地——工具鏈。
2.2 一站式AI Agent開發(fā)工具鏈
Agent開發(fā)平臺是面向智能體生產(chǎn)場景的一站式開發(fā)工具,具備智能體編排、流程搭建、知識庫管理、大小模型交互、計(jì)量、開放、私有化部署等功能,能夠有效提升智能體研發(fā)效率,降低研發(fā)成本。目前國內(nèi)知名的Agent開發(fā)平臺包括百度的千帆、阿里的百煉、字節(jié)的Coze、Dify以及騰訊的元器等。
2.3 工具鏈競品分析
1)字節(jié)Coze
Coze平臺專為零代碼或低代碼(可視化編排)開發(fā)者設(shè)計(jì),極大地降低了開發(fā)門檻,使得非技術(shù)人員也能快速上手。
優(yōu)勢:
- 功能強(qiáng)大(圖像流、通過觸發(fā)器實(shí)現(xiàn)自動化的任務(wù)調(diào)度和執(zhí)行、多渠道發(fā)布)
- 高度可定制
- 支持豐富的主流第三方插件
- 數(shù)據(jù)源多樣
但整體的動線繁瑣,用好的門檻比較高。
2)騰訊元器
網(wǎng)站風(fēng)格一如既往的“節(jié)制”,功能布局清晰易懂,用戶無需花費(fèi)腦力去理解網(wǎng)站的結(jié)構(gòu)、布局和導(dǎo)航。該有的元素都有,后續(xù)在生態(tài)建設(shè)上,期待看到更多的可能,包括且不限于更豐富的大模型可選、插件……
3)Dify
是做LLM應(yīng)用開發(fā)平臺中最早的一批之一,且功能性甚至比國內(nèi)頭部大廠更突出,相比之下,目前它是是Github上Star數(shù)最多的大模型應(yīng)用開發(fā)工具(54000星),是全球LLM Tools增速Top1的開源項(xiàng)目(300萬的安裝量)。
優(yōu)勢:
- AI生態(tài)相對最好:支持40多家廠商的大模型,對接大模型平臺、對接開源大模型,全鏈路免費(fèi)。上百種插件
- 成功打開海外市場
- 提供云服務(wù)和本地部署兩種方式,滿足了不同用戶的需求,同時(shí)支持多平臺發(fā)布應(yīng)用
- 自動化流程搭建和數(shù)據(jù)處理方面具有明顯的優(yōu)勢,適合需要構(gòu)建復(fù)雜自動化流程或處理大量數(shù)據(jù)的用戶
4)百度千帆AppBuilder
千帆AppBuilder提供全面便捷的應(yīng)用開發(fā)套件與資源環(huán)境,包括大模型驅(qū)動的開發(fā)組件(文字識別、文生圖等多模態(tài)能力),內(nèi)置RAG(檢索增強(qiáng)生成)、Agent(智能體)、GBI(智能數(shù)據(jù)分析)等常用的AI原生應(yīng)用框架,語音識別、TTS、文生圖等AI能力組件,以及各類IAAS云資源。使得開發(fā)者能夠在一個(gè)平臺上完成從應(yīng)用開發(fā)到部署的全過程,大大提高了開發(fā)效率。
優(yōu)勢:
- 千帆大模型平臺提供了從模型設(shè)計(jì)、訓(xùn)練到部署、優(yōu)化的全流程支持
- 平臺42個(gè)大模型,預(yù)置41個(gè)數(shù)據(jù)集。內(nèi)置103套Prompt模版及自動化Prompt工程能力
- 預(yù)置的安全模塊可以有效控制輸入和輸出的安全風(fēng)險(xiǎn),為用戶提供全面的模型安全、內(nèi)容安全和數(shù)據(jù)安全保障
- 自研集群,為企業(yè)節(jié)約了算力成本和時(shí)間成本
- 生態(tài)能力強(qiáng)大,預(yù)置100+優(yōu)質(zhì)官方組件
- 自主規(guī)劃準(zhǔn)確,支持人工編排以高效還原業(yè)務(wù)SOP
5)阿里百煉
優(yōu)勢:
- 開放的模型非常多,除了阿里系之外,支持主流的三方大模型,百川、智譜、零一萬物、Meta……
- 支持進(jìn)行多輪對話配置,模型支持將選定的歷史對話信息作為輸入
- 允許企業(yè)開發(fā)應(yīng)用時(shí)引入自研插件,與業(yè)務(wù)場景充分融合
6)競品分析:核心功能
從Agent構(gòu)建(編排)、節(jié)點(diǎn)(及節(jié)點(diǎn)管理)、生態(tài)、發(fā)布渠道、OPS,5個(gè)一級維度,70個(gè)三級維度,來評估5個(gè)頭部供應(yīng)商的功能,可以看出,在過去一年多的時(shí)間里,各家的開發(fā)工具鏈都在快速演進(jìn)和迭代。
2.4 參與方
以企業(yè)內(nèi)部自建or私有化部署Agent開發(fā)平臺角度看,利益相關(guān)者有Agent開發(fā)平臺的建造者(自建)or維護(hù)人(外采)。有小白用戶,有研發(fā)能力的Agent開發(fā)者(包括插件的開發(fā)、知識庫的建設(shè)等圍繞大模型應(yīng)用的一系列的元素建設(shè)),還有外部的三方服務(wù)商(提供底層基座大模型、Agent開發(fā)套件、解決方案、甚至是上手幫企業(yè)調(diào)Agent)。
2.5 沉淀的AI資產(chǎn)——生態(tài)市場
在大模型的范疇內(nèi),新型的AI資產(chǎn)是企業(yè)核心價(jià)值力的一種體現(xiàn)。包括各種Agent(Mult-Agent)、Flow工作流、業(yè)務(wù)的SOP、大&小模型、Prompt、插件、知識庫、知識圖譜、語料、評測集、評測排行榜(含報(bào)告)……。這些資產(chǎn)在具體的業(yè)務(wù)領(lǐng)域應(yīng)用中,像變形金剛一樣,可以單打獨(dú)斗,也可以組合變形,以解決文本編輯、圖像處理、語音識別、智能助手等形態(tài)推進(jìn)企業(yè)的產(chǎn)品創(chuàng)新、服務(wù)質(zhì)量的提升、運(yùn)營效率的改進(jìn)、營銷效果的高轉(zhuǎn)化。
三、Agent開發(fā)生命周期
上文介紹了Agent開發(fā)工具,有了這些利器,接下來的關(guān)鍵點(diǎn)在于如何巧妙的運(yùn)用它們?構(gòu)建并完善Agent,以確保業(yè)務(wù)效率的顯著提升,是展現(xiàn)大模型價(jià)值的最佳途徑。企業(yè)內(nèi)部做Agent一般經(jīng)過3個(gè)步驟:
其一,業(yè)務(wù)提需求,搭建Agent,確保POC符合業(yè)務(wù)預(yù)期
其二,正式開發(fā)Agent,以及對接業(yè)務(wù)系統(tǒng),上線交付
其三,持續(xù)運(yùn)營優(yōu)化Agent,不斷提升效果
四、行業(yè)發(fā)展趨勢VS企業(yè)落地關(guān)鍵點(diǎn)
在企業(yè)實(shí)際搭建Agent的過程中,有三個(gè)關(guān)鍵步驟極其重要,必須由企業(yè)內(nèi)部人員主動參與并領(lǐng)導(dǎo),這是無法通過購買第三方服務(wù)來取代的。
其一,是讓大型模型理解企業(yè)內(nèi)部的數(shù)據(jù)、信息和知識,為Agent提供高質(zhì)量、精確的數(shù)據(jù)資源,以便讓大型模型輸出符合業(yè)務(wù)預(yù)期的答案是至關(guān)重要的。數(shù)據(jù)到信息,信息到知識,知識到智慧的轉(zhuǎn)化過程,需要從最終使用者的角度反向思考。如何采集、處理和加工數(shù)據(jù)、信息、知識才能達(dá)到預(yù)期效果。這需要在六個(gè)方面進(jìn)行思考:準(zhǔn)確性、完整性、全面性、粒度(粗糙或詳細(xì))、關(guān)聯(lián)性以及訪問或使用權(quán)限。信息處理的效果對于企業(yè)有效利用大型模型至關(guān)重要,這需要具備專業(yè)知識的人員掌握與大型模型互動的專門技巧,如提示(Prompt)和知識庫或記憶技巧。
其二,通過使用插件,可以實(shí)現(xiàn)Agent與企業(yè)現(xiàn)有系統(tǒng)的無縫集成,從而提升系統(tǒng)的智能化程度。這一過程通常由開發(fā)團(tuán)隊(duì)負(fù)責(zé)編碼(或使用如Cursor等代碼生成工具)。在此過程中,需要重視元數(shù)據(jù)的完整性(AI資產(chǎn)管理),以便實(shí)現(xiàn)最大程度的復(fù)用性,從而提高企業(yè)內(nèi)部系統(tǒng)對接的效率。
其三,在構(gòu)建Agent之前,我們需要理清業(yè)務(wù)的標(biāo)準(zhǔn)操作流程(SOP)。在編輯工作流時(shí),開發(fā)者需要參照SOP,將大模型、知識庫、插件等原始元素進(jìn)行編排,并通過邏輯節(jié)點(diǎn)將流程連貫起來,從而“虛擬重現(xiàn)”業(yè)務(wù)場景。這三個(gè)方面的推進(jìn)效率和質(zhì)量,決定了一個(gè)企業(yè)應(yīng)用大型模型的效率和效果,也決定了在這場生產(chǎn)力革命中的排位。
可以預(yù)見,在2025年,大模型應(yīng)用將給我們帶來更多令人驚嘆的“哇哦”時(shí)刻,讓我們拭目以待~
受作者領(lǐng)域認(rèn)知深度所限及技術(shù)無時(shí)無刻不在更新迭代,業(yè)界對LLM、AGI、Agent、GPT……的衍生應(yīng)用必定是珠零錦粲。無法在一篇中盡現(xiàn)全貌,未來可能會徹底推翻當(dāng)下的種種嘗試而不得知。能為大家?guī)ヒ稽c(diǎn)點(diǎn)新的啟發(fā),以深感欣慰。文中難免有紕漏或不準(zhǔn)確的地方,歡迎大家批評指正。
撰寫中參考網(wǎng)絡(luò)上各位同仁的最新觀點(diǎn),拿來主義未打招呼,還望見諒。若有任何建議或意見,歡迎聯(lián)系作者探討。
作者:shucay、佳琪
本文由@shucay 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!