“賈維斯”這類智能助手,已經看到落地的可能性了

0 評論 3305 瀏覽 12 收藏 20 分鐘

近段時間以來,隨著ChatGPT這類大模型的火熱,引發(fā)了各行各業(yè)的變革,也讓我們不禁設想是否能夠創(chuàng)造一個“賈維斯”這類智能助手。本文總結分析了類似產品,探討“賈維斯”這類智能助手的落地可能性。

作為一個普通人,我曾經設想過,如果能有一個類似與鋼鐵俠的智能助力“賈維斯”來幫助自己成為一個全能小助手,那是多么科幻的一個事。

最近半年,隨著ChatGPT這類大模型的火熱,引發(fā)了各行各業(yè)的變革,其中有智能問答類的,文章等宣傳文案生成類的、還有結合midjourney這類能力的衍生最近半個月則是顯得更加智能化的autoGPT的誕生。讓我覺得想要去打造一個“賈維斯”也是有可能的。

首先我們就想要實現(xiàn)這個目標,進行一下需求與功能模塊的拆分,以我目前的理解,可以拆分為【ChatGPT】+【數(shù)字人】+【PRA】來實現(xiàn)。

接下來細說一下這3塊分別具備什么能力以及主要實現(xiàn)的功能作用:首先就【ChatGPT】、【數(shù)字人】、【PRA】進行一下基礎的科普:

1. ChatGPT (Generative Pre-trained Transformer)

能用像模像樣的“人話”來回答幾乎任何領域的用戶問題,并對上下文有一定程度的理解。ChatGPT不僅會聊天,還可以幫助人類寫代碼、修復bug、寫工作周報、寫小說、進行考試答題、繪畫、看病以及大幅度提高搜索效率和體驗等。

強大的優(yōu)勢:

  • 它已經經過數(shù)百萬句子的預訓練,并且在多項自然語言處理任務中取得了最先進的結果。它能夠流暢地產生自然語言響應,有效地響應用戶的疑問和請求。
  • 多個處理單元同時工作來處理多個用戶請求,可以在短時間內處理大量的請求,為用戶提供快速而高效的響應。
  • 是基于預訓練的模型,并使用大量的數(shù)據(jù)進行訓練,因此其學習到的知識是通用的,可以適用于不同的業(yè)務場景。此外,還進行了嚴格的指標監(jiān)測和數(shù)據(jù)收集,以確保ChatGPT提供一致且可重復的響應質量。

2. 數(shù)字人

是一種使用計算機生成的圖像、聲音和方法來模擬人類交互的系統(tǒng)。

其特點和優(yōu)勢如下:

  • 逼真的表現(xiàn)力:虛擬數(shù)字人采用高級計算機圖形學技術,其外觀和聲音都可以被設計得與真實人類非常相似。虛擬數(shù)字人能夠模擬真實人類情感,語言和動作,無論是在視聽上還是在交互上,都能產生高度逼真的效果。
  • 可定制性強:由于使用計算機生成的系統(tǒng),虛擬數(shù)字人可以在控制臺上輕松進行定制和編輯,包括其外觀、聲音、交互方式和應用場景等。因此,用戶可以為其特定的應用領域和客戶而定制虛擬數(shù)字人方案,從而提高交互的效率和滿足需求的多樣性。
  • 成本低廉:與雇用真實人類的費用相比,虛擬數(shù)字人的成本更低廉,而且它們可以在全天候和全年范圍內運行,不受固定的時間和地點限制,從而為企業(yè)節(jié)省了大量的成本,并且能夠提供更高效的客戶服務。
  • 擴展性:通過設計和定制虛擬數(shù)字人的語義和交互方式,可以擴展虛擬數(shù)字人的功能和應用領域。例如,虛擬數(shù)字人可以作為客戶服務,智能家居,娛樂等領域的智能助手,實現(xiàn)與人類的高效互動和交流。
  • 支持多語言和跨文化交互:虛擬數(shù)字人的聲音可以通過技術手段實現(xiàn)多語種,并且設計技術也能考慮到文化差異。這使得虛擬數(shù)字人能夠成為全球商業(yè)和社交交互中的全球級參與者。

3. PRA-機器人流程自動化(Robotic process automation)

以軟件機器人及人工智能(AI)為基礎的業(yè)務過程自動化應用程序,通過模仿最終用戶在電腦的手動操作方式,提供了另一種方式來使最終用戶手動操作流程自動化。

使符合某些適用性標準的基于桌面的業(yè)務流程和工作流程實現(xiàn)自動化,自動化工具(如屏幕抓取工具、Excel宏、業(yè)務流程自動化管理等),一般來說這些操作在很大程度上是重復的,數(shù)量比較多的,并且可以通過嚴格的規(guī)則和結果來定義。

一、類似【智能助手】產品設計舉例

初步設想的業(yè)務邏輯如下:

以【給XX郵箱或者手機號碼發(fā)送內容】為例(如下為業(yè)務流程說明):

  1. 用戶可以通過語音或者文本輸入一些問題或指令;
  2. 這些內容會被發(fā)送到chatgpt服務API中獲取答案;
  3. 在獲取答案之后,答案文本會被調用TTS服務的能力進行語音合成;
  4. 數(shù)字人會獲取到TTS合成的文本內容,并在客戶端進行語音播報;
  5. 然后TTS會將相關指令通過RPA同步給郵件服務/短信服務;
  6. RPA收到指令后會按照指令去做相應的操作,并將結果返回給客戶端;
  7. 客戶端獲取操作結果后,將結果轉化為文本輸出給TTS;
  8. TTS同步給數(shù)字人;
  9. 在客戶端進行語音播報告知用戶結果;

目前網(wǎng)上已經有相關同學做了一個視頻,初步可以看出其效果,如下:

1)對接語音輸入模塊,支持語音輸入與文本輸入:

2)基于chatgpt進行回復

3)發(fā)起業(yè)務同步,相關發(fā)送到手機端:

4)完成業(yè)務需求的交互

看到這,是不是發(fā)現(xiàn)其實想要實現(xiàn)搭建一個“賈維斯”好像已經是可以觸摸到的了。

二、基于以上的運用思路,再發(fā)散一下

以PRA多對接一些應用的情況下,或者對接一些專有的NLP等其他應用,在很多實現(xiàn)落地方面是不是可以有更多的想象空間:

1. 針對個人用戶的助理類產品

可以根據(jù)用戶需求和習慣,提供更為智能、個性化與專業(yè)的服務。 借助一系列的高效工具,能夠幫助人們更好地管理自己的生活并且讓生活變得更加美好和方便。

私人超級管家:

目前很多家庭的家電等設備都是智能化的,那么就可以通過語音交互幫助用戶完成很多基礎的事務,例如調節(jié)房間溫度、打開窗戶、查找信息,或者發(fā)起一次語音通話等。

舉個具象一點的例子:比如在夏天時,室外氣溫很高,當你工作了一天準備下班回家,這個時候,他就出現(xiàn)在手機上來咨詢你,是否需要幫你提前開啟汽車的空調,并調整到多少的車內溫度,在開車回家前,基于是否在外面進行吃飯以及是否有其他行程安排,規(guī)劃好最合適的路線,并在車內設定好導航。另外,在解答一些疑問和提供如搜索特定內容、聽取音樂、收聽新聞等,也能是一個合格的智能管家。

通過最初的系統(tǒng)設定,以及對用戶的日常行為進行分析和學習,能自動幫服務對象規(guī)劃日程,包括會議安排、旅行計劃等等,并提醒用戶收看日程變更等此類服務。

文案專員到視頻剪輯再到生成視頻:

基于ChatGPT本身文案生成的能力,在確定完內容的核心主題后,先生成文案的核心框架,再通過框架的提綱,生成框架下的集體內容,不僅可以直接從無到有,也可以是在一定內容的基礎上在進行潤色有優(yōu)化。在通過指令的形式,將生成好的文案直接導入到類似剪映此類可以通過文案直接生成視頻的軟件中,從而實現(xiàn)從大綱-文章輸出-視頻制作-發(fā)布自動化流水線的快速生成。

當然,按照目前當前的生成文案也好,需要基于很好的角色設定、基礎內容輸入,ChatGPT類才會有高質量的產出。另外自動生成的視頻也需要二次加工才能真正做到一個看起來比較連貫并且能表達清楚基本思路的一個視頻。

數(shù)據(jù)分析專家:

全天候的待機與支持情況下,幫助用戶更方便地分析相關的數(shù)據(jù)和統(tǒng)計,比如家庭財務預算、運動指標計算、睡眠監(jiān)測等。以幫助用戶制定家庭財務預算舉例:

首先,可以為用戶提供一個移動應用程序,讓他們輸入他們的日常開銷和收入,例如購物、房租、電話賬單和工資。在這種情況下,再根據(jù)這些數(shù)據(jù)執(zhí)行以下操作:

  1. 通過自學習的算法對數(shù)據(jù)進行分類和處理,例如自動識別不同種類的支出和收入,同時去除重復或無效的數(shù)據(jù)。
  2. 針對用戶家庭預算的需要,自動分析該用戶的數(shù)據(jù),例如分析每個月的開銷、品類占比,以及列出預算中的可支配收入。
  3. 幫助用戶識別一些有利的模式,例如指出某些支出的比例過高,或者某些開銷具有明顯的周期性變化,并作為指標項進行標記。
  4. 如果需要更好的視覺顯示效果,也可以通過數(shù)據(jù)可視化工具,將數(shù)據(jù)呈現(xiàn)出來,例如把收入和支出用圖表或餅狀圖呈現(xiàn),讓用戶容易看懂。
  5. 最后在基于以上的收支情況,進而制定出更合理和靈活的財務預算計劃以及建議。

將人工智能系統(tǒng)應用于金融行業(yè),可以幫助企業(yè)和個體投資者更精準的進行投資與風險控制、監(jiān)測市場走勢,提高相關業(yè)務線的效率以及為客戶提供更便捷的服務。

風控方面:

假設有一個銀行正在使用類似chatgpt這類大模型來提高其風險管理能力。可以從多個數(shù)據(jù)源中收集信息,例如客戶開戶信息、信用評估數(shù)據(jù)、交易歷史記錄、市場數(shù)據(jù)等。再可以對這些數(shù)據(jù)進行分析,并根據(jù)自身的算法自主處理和提取重要信息。

在風險管理方面,就可以幫助銀行完成以下任務:

  • 評估潛在風險:可以快速分析和處理大量數(shù)據(jù),以識別和評估潛在的風險,例如個人或企業(yè)的財務困境,交易異?;蛐庞每ㄆ墼p等。這將使銀行更快地發(fā)現(xiàn),并通過適當?shù)拇胧┓乐够蚪鉀Q潛在的風險問題。
  • 自動化決策:可以根據(jù)預設規(guī)則和算法自動化地做出決策,例如自動拒絕不良信用記錄的客戶,或者自動限制某些類型的交易。這樣銀行客服即使在非工作時間也可以自動地解決問題,提高了客戶服務效率。
  • 非線性建模:在風險管理中非常有用,因為它們可以利用非線性建模方法,更好地應對復雜和不確定的領域。例如,新興的業(yè)務或市場領域,因為信息不足或變化快速,可以使用大模型來進行非線性建模以預測未來趨勢。

財富助手方面:

市場上原本存在的許多金融產品,包含股票債券的定價和交易受制于信息不對稱的情況,基于此,【ChatGPT】+【數(shù)字人】+【PRA】等APGC能力,可以幫助財富顧問實現(xiàn)更高效、更準確地提供專業(yè)服務,提出更好的投資計劃或優(yōu)化方案,以及更好地監(jiān)測市場趨勢和潛在風險。

舉個例子:

  • 量身定制方案:可以針對每位客戶的獨特需求、背景和風險承受能力,創(chuàng)建個性化的投資組合方案。在考慮客戶收入、年齡、婚姻狀況、風險投資偏好等因素后,大模型可以自動創(chuàng)建出投資方案,以確??蛻羰找孀畲蠡?。
  • 動態(tài)優(yōu)化:可以通過數(shù)據(jù)分析來識別市場機會和潛在風險,對客戶的投資組合進行動態(tài)優(yōu)化調整,分析大量的市場數(shù)據(jù)并預測未來市場動向, 讓投資者能更好地制定投資策略和風險控制策略。實時監(jiān)控國際貨幣、利率等經濟數(shù)據(jù),對企業(yè)財務、投資組合等進行跟蹤和監(jiān)測并給出實時提示和預警,從而幫助企業(yè)決策者及時調整策略。例如,如果市場出現(xiàn)某些風險,可以及時調整該客戶的股票組合并增加投資基金和貨幣市場基金的分配。
  • 高效交易:可以利用機器學習和自然語言處理技術來預測市場趨勢和交易機會,根據(jù)收集到的數(shù)據(jù)預測行情,以便幫助財富顧問更快速地做出決策。例如,大型模型可以分析歷史數(shù)據(jù)、市場新聞或公司報告,并預測某些股票的未來表現(xiàn),財富顧問可以據(jù)此來做出決策。
  • 風險控制:可以通過持續(xù)的風險管理來控制客戶的風險水平。通過跟蹤客戶投資組合中的資產分配、固定收益證券、股票與股票總市值之比、持倉期限以及其他指標等,模型可以確定潛在風險并提出建議,以便財富顧問與客戶共同控制風險。

智能客服:

如同上文中,類似【智能助手】產品,銀行行業(yè)可以提供24小時全天候智能服務,基于已有的NLP或者知識庫效用,對金融知識的專業(yè)講解、基礎客戶服務、理財產品的智能推薦回復等,可以實現(xiàn)步驟流程的規(guī)范化以及標準哈。

  1. 自動化問題解答:可以利用自然語言處理和機器學習技術來學習客戶請求的語言以及常見的問題,它們通過分析大量的數(shù)據(jù)來識別常見問題的關鍵字、句式等,訓練出智能客服機器人來自動解答客戶的問題,減少需要人工干預的量,提高客戶服務的效率。
  2. 提供超預期體驗:智能客服機器人可以利用大型模型技術,自學習人類學習到的經驗,并將在相近情境下所學到的知識應用于更復雜的情況。例如,客戶詢問交易信息,大型模型可以幫助智能客服機器人了解該客戶的交易和需求信息,提高客戶體驗。
  3. 利用數(shù)據(jù)優(yōu)化服務:可以利用自己分析大量數(shù)據(jù)的能力,從客戶歷史數(shù)據(jù)中發(fā)現(xiàn)不同級別的服務需求。例如,如果客戶詢問較基礎的問題,那么智能客服機器人可以通過自學習來為客戶提供更細致的答案,而非僅僅給出基礎的答案。
  4. 數(shù)字人的形象可以以更加生動的形象吸引客戶的注意,同時也可以利用顏色和音樂等元素,呈現(xiàn)出更加詳細、更有說服力的解釋,幫助客戶更好地理解一些復雜的金融概念和標準。

結語

以上是本人對于數(shù)字人+大模型+RPA集合后運用的一些想法與思路分享。

如有不合理或不正確的,歡迎指正~

本文由 @毅鳴 原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協(xié)議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!