AI 產品的五種交互模式
本文深入分析了五種主要的AI交互模式,探討了它們如何塑造未來的應用開發(fā)和用戶體驗。通過具體實例,我們將了解AI如何在不同場景下發(fā)揮作用,并預見其對未來軟件生態(tài)的影響。
一、歷史
回顧計算機交互的演變歷程,經歷了批處理—命令行式交互—圖形界面交互,AI 的出現(xiàn)帶來了自然語言交互,基于人類的意圖完成輸出。
早期的批處理系統(tǒng)古樸且笨拙,交互依靠的是穿孔卡片——一種編碼數(shù)據(jù)和指令的媒介。用戶將一系列任務預先編碼到這些卡片上,然后將它們交給數(shù)據(jù)中心。這里的計算機巨大如房間,它們不斷地讀取這些卡片,執(zhí)行上面的命令。
需要排隊等待一夜才能知道程序是否完成運行。即便如此,也能幫助科學家和工程師們執(zhí)行復雜的計算任務,如天氣預報的模擬、工程問題的數(shù)值分析,甚至是太空探索任務的軌道計算。
現(xiàn)在,在需要處理大規(guī)模數(shù)據(jù)集,如日志分析、金融交易記錄或大量的用戶行為數(shù)據(jù)時,批處理仍然是一個有效的方法。
后來,分時系統(tǒng)的出現(xiàn),讓 CPU 可分配使用,提高了利用率,計算機可以根據(jù)命令對用戶的每一個輸入給出反饋。這種基于命令的交互,讓用戶可以控制計算機來執(zhí)行任務,逐步解決問題。
但仍需要學習大量的指令,體驗并不友好,不過至少讓人感覺在和機器建立連接。
至今, Linux、Mac、windows 系統(tǒng)中的命令行仍然存在,是程序員們與計算機底層交互的常見方式。
GUI 的出現(xiàn)徹底改變了規(guī)則,計算機不再只是枯燥的命令行,而是充滿了窗口、圖標和鼠標點擊的界面。這種所見即所得的革新,讓 word 、Excel 這樣的效率工具出現(xiàn),完全革命了人們的辦公方式,瀏覽器出現(xiàn),則成為了互聯(lián)網(wǎng)的開端。
等智能手機普及后,GUI不再局限于笨重的桌面電腦?,F(xiàn)在,一個小小的觸屏設備就能完成從購物到預定機票,從社交到遠程工作的各種任務。
當AI驅動的界面開始融入我們的生活,我們又站在了另一個交互革命的前沿,AI該如何改變軟件,又怎樣影響人們的生活。
二、基于意圖的交互
現(xiàn)在只要你有問題,AI就能給你答案。
想要一幅太空宇航員的畫作?不必親自動手,AI可以根據(jù)你的描述生成幾個選項供你選擇。讓我們的交流更直接,更本質,不再是命令和代碼,而是愿望和創(chuàng)意的直接表達。
當移動互聯(lián)網(wǎng)出現(xiàn)時,有人說所有的應用都值得用 APP 再做一遍,事實也確實如此。
那么所有的產品都值得用 AI 做一遍嗎?如果是的話,該怎么做呢?
先來看看大模型廠商的答案:
OpenAI 作為生成式 AI 的破局者,提供面向C端的 ChatGPT 對話助手,和面向開發(fā)者的模型 API 調用,前者通過每月20美元的訂閱模式,占到了總營收34 億美元的 80%。
移動互聯(lián)網(wǎng)時代有 APP,瀏覽器有插件,微信有小程序,它們都是依托于一個平臺生態(tài)衍生出全新的軟件交互和商業(yè)模式。
一個平臺級的產品,必然擁有有良好的生態(tài),用戶因為找到合適的應用而付費、開發(fā)者因為有用戶使用而入局、平臺因為有持續(xù)增長而不斷改善,機構、企業(yè)、組織陸續(xù)加入,廣告、娛樂、購物統(tǒng)統(tǒng)改變。
OpenAI 也看到了這條路,并且也在這么做。
OpenAI 在去年先后推出了 GPT 插件,和GPTs,通過封裝知識庫和 Prompt 可以定制對話機器人,這樣就能把 AI 的能力應用在垂直領域的。
解決更多用戶問題,奧特曼也說通過傭金分成方式吸引開發(fā)者,從而建立起平臺的生態(tài)。
在推出之際,就被行業(yè)內認為可以顛覆 PC、移動端操作系統(tǒng)。
現(xiàn)在一年過去,國內的大模型廠商也在推出類似GPTs 的功能——被大家稱作 Agent 智能體。豆包、文心一言和 GPT 一樣,允許用戶創(chuàng)作Agent 并發(fā)布到廣場。Kimi 就比較保守了,只是官方推出不允許用戶創(chuàng)作。
不管怎么做,Agent 是有它的應用場景在的,不用每次都去輸 Prompt 了,用戶進入平臺也能快速找到適用于自己的 Agent,但是它難以撼動操作系統(tǒng),也難以成為平臺級產品。
不論是用戶創(chuàng)建的 Agent 還是官方推出 Agent,活躍度和創(chuàng)建數(shù)都在下降,用戶用不起來,開發(fā)者也不愿意進來,平臺在嚴格選擇 Agent 的展示。
我們大可以想象未來 OpenAI 能夠打造一個平臺級產品,完全顛覆軟件的交互和商業(yè)模式。
但目前來看,有苗頭卻看不到前景,因為傳統(tǒng)應用的生命力太旺盛,而且他們也在融入 AI 的能力。
這些應用運行在windows、MacOS 、安卓和IOS,網(wǎng)頁以及瀏覽器插件等。要么是傳統(tǒng)應用+AI,要么是依托于AI而生的應用。
下面我就通過例子,來說明下 AI 在應用中的五種交互:
- 輔助回答型:集成在應用中的AI,能夠根據(jù)用戶的直接輸入提供即時幫助和信息,如回答問題或提供具體操作的指導。
- 主任務驅動型:AI直接融入應用的核心功能,通過用戶的常規(guī)操作觸發(fā),幫助優(yōu)化和執(zhí)行主要的業(yè)務或工作任務。
- 自動生成型:AI根據(jù)由其他任務觸發(fā)而接收給定的輸入自動生成內容,如給文章自動總結、打標簽。
- 隱藏型:AI隱秘地工作,用戶通常意識不到其存在,自動執(zhí)行背后的優(yōu)化和功能增強,如推薦系統(tǒng)或內容過濾。
- 工作流自動化:AI被集成到低代碼工作流中,自動化處理輸入和輸出
1. 輔助回答型
在主應用界面,通過右側面板或者彈窗內置一個對話框 ,在想用的時候就喚起,這種簡單有效的方式是大部分應用采用的做法。
比如,現(xiàn)在使用微軟Office或Google Docs處理文檔時,遇到了表達或語法的困難。這時候,AI輔助回答框就是一個隨時待命的助手,你可以隨時向它提問或請求幫助。它能即時為你提供寫作建議,還能幫你糾正錯誤。
好處在于你幾乎感覺不到它的存在。缺點就是每次都要復制內容,思考問題才能完成輸入,這和在網(wǎng)頁端使用GPT有什么區(qū)別的,看似融入AI,如果模型能力不夠垂直或強大,這樣的融合意義不大。
2. 主任務驅動型
我一直認為Notion的做法非常的巧妙,23年初就已經融入AI, 成為了文檔類產品的交互設計的典范,當你在創(chuàng)作的過程中,在Notion的page里編輯你的bolok ,給AI 輸入的內容可以是你現(xiàn)在所寫的東西,AI輸出的答案也會呈現(xiàn)也在當前的page中。
它很好的處理了AI打斷任務的影響,我會為這樣的便利而付費,即使模型的輸出能力比不上GPT4。
它的優(yōu)勢就是體驗更加流暢,但它也會增加系統(tǒng)的復雜性,如果集成一個生成質量或性能的模型,這樣做無疑帶來很大風險。
3. 自動生成型
通過我們在使用軟件過程中的任務,自動觸發(fā)AI的能力,不同于主任務驅動型,自動生成不需要用戶輸入問題或指令,它能夠根據(jù)用戶當前的任務觸發(fā)AI的使用,自動生成內容。
比如:Arc瀏覽器中,當用戶創(chuàng)建新的瀏覽器標簽時,AI自動分析頁面內容并生成相關描述性強的標簽名稱,幫助用戶更容易識別和管理開啟的多個標簽頁。
再比如:Notion的database中,用戶可以定義一個表頭字段為AI生成類型,如標簽(AI ),那么在創(chuàng)建一條記錄時,這個標簽會根據(jù)主內容自動生成。
這種結合方式,我想象不到什么缺點,很多場景都有待使用這種方式改善,比如文件夾、筆記的命名管理。
4. 隱藏式
AI 的能力早已隱藏在我們使用的數(shù)碼產品中,以至于我們感受不到它的存在,在使用手機拍照的時候,手機識別不同的景色、光線來優(yōu)化照片的拍攝效果,在相冊搜索關鍵詞,比如貓,就能搜到所有和貓相關的照片;Siri 會根據(jù)你的日常查詢和命令優(yōu)化其響應。這些背后都是算法的能力。
當然,今天提到的GenAI也有很多隱藏式的,iOS最新的Apple Inteligence,CEO 蒂姆庫克強調蘋果的AI助手在設計上對于用戶來說更加“自然”,不張揚但又無處不在。例如在文本輔助生成環(huán)節(jié),Apple Intelligence建議回復的內容文本直接呈現(xiàn)在輸入法內部;在歸納總結文檔時,交互按鍵也很好的被設計并且集成在界面的側邊位置。
5. 工作流自動化
如果你手頭上有成堆的進度報告和計劃調整需求。通常這種情況下,你可能需要花費大量時間在手動分析和整理數(shù)據(jù)上,但有了AI,你就可以把數(shù)據(jù)發(fā)給它做總結分析。
不過這樣,還不夠理想,假如你想指定某一行去分析,并且將分析結果寫入表格,GPT就不可能實現(xiàn)了,必須要借助工具去搭建一個工作流,這樣你不僅可以在任務中自動使用AI的能力,還能批量去處理相同的任務。
這本質上是低代碼工具+AI,大模型廠商都在售賣自家的模型API,通過API接入到低代碼工作流中。
低代碼比如蘋果的快捷指令,Dify、n8n、zaiper、集簡云等等,通過拖放界面設計工作流,集成大模型的API后,AI在背后幫助自動化數(shù)據(jù)處理和決策邏輯。
這種交互方式不同于Agent,它具備更高的靈活性,和更強的能力,感興趣的可以動手實踐。
今天了解這些多少能幫你在使用 AI 產品時有個方法論,目前的交互再怎么花哨也逃不出這幾種。最后再來給這五種交互方式做一個簡單的總結:
移動互聯(lián)網(wǎng)發(fā)展依托于手機這一硬件,經歷了工具產品,娛樂社交產品,購物生活產品,最后到 ToB 產品的演變,AI 和那個時代已經不同,沒有成熟的硬件,技術棧也不同。
但相同的的是,都是在早期出現(xiàn)大量的工具產品,因為工具產品場景足夠明確。
未來,娛樂類,社交類,購物類如何發(fā)展,我們拭目以待。
本文由 @Zephyr 原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
總結的很到位
womomoojkkkllghaowuq