AI Agent崛起:手機(jī)操作系統(tǒng)的智能未來
隨著AI技術(shù)的飛速發(fā)展,AI Agent(智能代理)正在成為手機(jī)操作系統(tǒng)的全新核心,推動(dòng)手機(jī)從傳統(tǒng)的功能集合向智能化服務(wù)生態(tài)轉(zhuǎn)變。本文深入探討了AI Agent如何通過自動(dòng)化功能、多模態(tài)交互和服務(wù)生態(tài)融合,徹底改變手機(jī)操作系統(tǒng)的交互方式和用戶體驗(yàn)。
一、AI 手機(jī)發(fā)展背景
非 AI 與智能機(jī)時(shí)代痛點(diǎn):非 AI 時(shí)代,用戶被淹沒到系統(tǒng)生態(tài)之中,用戶需要承擔(dān)大量的記憶負(fù)擔(dān)。從功能機(jī)簡單(對(duì)比如今其實(shí)是簡陋)到復(fù)雜的智能機(jī)時(shí)代,龐雜的功能及服務(wù)如海嘯般涌向消費(fèi)者,手機(jī)廠商絞盡腦汁為消費(fèi)者開發(fā)出很多實(shí)用但不常用甚至不曾開啟的功能,一個(gè)重要的原因就是缺乏服務(wù)設(shè)計(jì)與用戶場景自動(dòng)連接的橋梁。在智能機(jī)時(shí)代,大部分的功能還是依賴簡單的機(jī)器學(xué)習(xí)算法規(guī)則來實(shí)現(xiàn)信息檢索和判斷,處于一個(gè)低維度的功能實(shí)現(xiàn)。
二、AI 手機(jī)核心概念
AI 對(duì)手機(jī)交互的變革:隨著 AI 這幾年的爆發(fā)發(fā)展,這一痛點(diǎn)需求會(huì)得到史無前例的滿足。AI 將成為手機(jī)與用戶之間交互的交通樞紐。AI 手機(jī)發(fā)展路徑,從本地化 AI 功能面向服務(wù)生態(tài)化邁進(jìn),利用 Agent 能力像八爪魚一樣伸向四面八方。
AI 手機(jī)核心:Agent 與服務(wù)生態(tài)融合,手機(jī)操作系統(tǒng)從去中心化回到了以 AI 為核心的中心化系統(tǒng),例如以蘋果的語音助手 Siri、三星的語音助手 Bixby 為中心,用戶通過多模態(tài)輸入,進(jìn)行基本的本地功能調(diào)用,生成式回答。
AI Agent 核心能力 – 自動(dòng)化功能:AI Agent 的核心能力就是自動(dòng)化功能,可以縮短用戶的交互路徑。在傳統(tǒng)操作系統(tǒng)下,新建一個(gè)約會(huì)吃飯的日程,需要打開日歷 APP,填寫信息,分享日程,打開微信,選擇聯(lián)系人,發(fā)送。在實(shí)際的操作中,很有可能會(huì)被其他的操作障礙給中斷,交互效率比較低下。在 AI 賦能的情況下,只需要語音輸入信息,AI 根據(jù)歷史信息進(jìn)行信息補(bǔ)全,所有動(dòng)作都會(huì)在后臺(tái)靜默完成,在重要的核心交互接觸點(diǎn)進(jìn)行用戶告知。這樣的 Use case 會(huì)遍布整個(gè)用戶使用系統(tǒng)之中。在有關(guān)人們的衣食住行和個(gè)人事務(wù)安排方面,已經(jīng)有人在踐行,比如 Brain AI 和羅友浩老師的 J1Assistant。
AI 對(duì)手機(jī)操作系統(tǒng)技術(shù)生態(tài)的改變:AI agent 的引入,將會(huì)徹底改變手機(jī)操作系統(tǒng)的運(yùn)作技術(shù)生態(tài)。在信息整合,搜索,篩選等方面,將會(huì)更加智能精準(zhǔn),比如通知,郵件,短信等垃圾信息等過濾將會(huì)變得異常精準(zhǔn),利于監(jiān)督學(xué)習(xí),將信息作分類,優(yōu)先級(jí)排序等處理,語義和意圖識(shí)別加上用戶的動(dòng)態(tài)信息(位置,時(shí)間,交互反饋)實(shí)現(xiàn)更加準(zhǔn)確的個(gè)性化處理信息。
三、具體 AI 手機(jī)產(chǎn)品實(shí)例 – J1Assistant
J1Assistant 整體情況:J1Assistant 是以羅永浩為核心,以它為基準(zhǔn)點(diǎn)連接多設(shè)備,構(gòu)成一個(gè)完整的 AI OS 生態(tài)群。初版的體驗(yàn)不盡人意,集成了 Google ,ChatGPT,Perplexity 的信息工具,在功能上實(shí)現(xiàn)代辦,備忘,日程。
J1Assistant 框架設(shè)計(jì)與功能覆蓋:J1Assistant 在基礎(chǔ)框架設(shè)計(jì)上就是直接沖著要打造一個(gè)自我閉環(huán)的 AI 助理的 OS 系統(tǒng),具備代辦,備忘,應(yīng)用內(nèi)短信社交,信息搜索,Chatbot 等功能?;靖采w了用戶在搜索數(shù)據(jù)和生成數(shù)據(jù)的大部分場景,因?yàn)榫哂信枷癜ぃ麄€(gè)助手繼承了錘子系統(tǒng)的 GUI 和交互邏輯,尤其是備忘子系統(tǒng),錘子便簽至今用戶活躍度不錯(cuò)。
J1Assistant 當(dāng)前整合度與問題:目前的整合度還處于一個(gè)初步驗(yàn)證階段,用戶輸入特定的指令能夠較為準(zhǔn)確的分清任務(wù),比如明確指令生成代辦或者便簽,系統(tǒng)能準(zhǔn)確生成對(duì)應(yīng)的結(jié)果。我用的是第一個(gè)版本,隨著用戶量的沉淀和反饋,系統(tǒng)會(huì)進(jìn)行一定程度的調(diào)優(yōu),目前交互入口過于龐雜,對(duì)用戶的交互鏈路會(huì)產(chǎn)生回挫。
J1Assistant 搜索模塊拓展:在搜索模塊,我們可以看到助手伸向了各個(gè)領(lǐng)域的信息檢索,Google,X,Reddit 等不同的領(lǐng)域分支,還延伸到電子購物。我認(rèn)為這都是從信息層作為切入口,將來肯定會(huì)深入到具體的 AI agent 任務(wù),不單單只做一個(gè)信息檢索工具。
目前羅老師的助手受限于研發(fā)成本和歷史原因,多項(xiàng)功能處于半自動(dòng)化狀態(tài),隨著大模型能力提升,有望讓模型自行識(shí)別用戶意圖并進(jìn)行推理,自動(dòng)化給出用戶想要的結(jié)果。
四、手機(jī)廠商與大模型的合作
手機(jī)廠商與大模型合作趨勢:最近蘋果與阿里達(dá)成非排他性協(xié)議合作,三星與智普達(dá)成深度合作協(xié)議給大模型廠商帶來極大的虹吸效應(yīng)。過去一年,阿里、百度、訊飛、騰訊、智普與國內(nèi)手機(jī)大廠都沒有達(dá)成非常深度的合作。相反,世界最大的兩家手機(jī)品牌選擇了國內(nèi)模型大廠的深度合作,因海外品牌自研適應(yīng)國內(nèi)本土的大模型難度大,相信蘋果與三星在國內(nèi)大模型成功落地得到市場正向反饋后,國內(nèi)手機(jī)品牌會(huì)持續(xù)跟進(jìn),甚至走出海外。
蘋果與阿里合作詳情:根據(jù)最新消息,蘋果與阿里巴巴的合作聚焦電商與生活服務(wù):購物體驗(yàn)優(yōu)化:結(jié)合阿里電商生態(tài),為用戶提供更智能的購物推薦和搜索功能。生活服務(wù)接入:可能會(huì)通過 AI 助手接入更多本地生活服務(wù),如外賣、打車、支付等。這個(gè)合作將助力蘋果完善國內(nèi)手機(jī)系統(tǒng)工具和服務(wù)體系的整合。強(qiáng)強(qiáng)聯(lián)合將拉開與其他廠商的距離,為其他廠牌提供樣板。AI 驅(qū)動(dòng)是連接樞紐,沒有 AI 驅(qū)動(dòng),很多服務(wù)無法打通。
三星與智譜合作及相關(guān)產(chǎn)品功能:同樣,三星 Galaxy S25 借助智譜 Agentic GLM 的能力,「語聊視界」支持以 FunctionCall 方式,通過語音對(duì)系統(tǒng)級(jí)功能進(jìn)行調(diào)用,可進(jìn)行日程、出行路線規(guī)劃等一系列個(gè)人助理的個(gè)性化使用場景拓展。
五、Deepseek 模型分析及應(yīng)用
Deepseek 的影響力與跟進(jìn)情況:Deepseek 現(xiàn)象級(jí)走紅,從海外紅到國內(nèi),給手機(jī)廠商集成 Deepseek 模型做了極大的背書,華為、榮耀、OPPO、魅族、VIVO 都快速跟進(jìn)。未來帶著 Deepseek 走向海外頗具可能性,老羅的 AI assistant 研發(fā)團(tuán)隊(duì)也可能在積極跟進(jìn)集成 Deepseek。
DeepSeek V3 性能分析:DeepSeek V3 在較難的學(xué)術(shù)和閱讀理解類測試(如 MMLU, DROP, MMLU-Redux)表現(xiàn)突出,甚至超越 GPT-4o 和 Claude-3.5。在代碼相關(guān)任務(wù)(如 Codeforces, LiveCodeBench)和部分如 SimpleQA 的表現(xiàn)相對(duì)較弱。整體而言,它在語言理解、推理、數(shù)學(xué)等高難度任務(wù)上處于領(lǐng)先水平,但在部分開放域問答任務(wù)中仍有改進(jìn)空間。比如對(duì)比 Deepseek v3 與 GPT-4o:
SimpleQA (Correct):GPT-4o 領(lǐng)先 13.3,表明在基礎(chǔ)開放問答場景(例如用戶提問 – 直接回答),GPT-4o 更精準(zhǔn)。FRAMES (Acc.):GPT-4o 領(lǐng)先 7.2,表示在多輪對(duì)話場景中,GPT-4o 更穩(wěn)定。
對(duì)于手機(jī) AI OS 系統(tǒng)來講,開放領(lǐng)域問答使用場景較多,例如信息查詢(搜索引擎、新聞、百科)、社交交流(短信、社交媒體、即時(shí)通訊)、娛樂(音樂、視頻、游戲)、生活服務(wù)(導(dǎo)航、外賣、購物、支付)、AI 助手(Siri、Google Assistant、小愛同學(xué)等)。但在目前的開源模型領(lǐng)域中,DeepSeek 在真實(shí)的手機(jī) AI OS 用戶使用場景下能夠滿足需求,與小愛同學(xué)所使用的模型進(jìn)行橫向?qū)Ρ葧r(shí),DeepSeek 具有碾壓式的優(yōu)勢。
DeepSeek 模型尺寸與應(yīng)用情況:只講模型尺寸不講實(shí)際場景應(yīng)用是不行的,DeepSeek-R1 系列模型的參數(shù)規(guī)模從 1.5 億(1.5B)到 6710 億(671B)不等,其中最大模型為 6710 億參數(shù)。相比之下,小米自研的大模型 MiLM 主要有 13 億(1.3B)和 64 億(6B)參數(shù)兩個(gè)版本,小米在場景優(yōu)化、本地部署方面做了很多優(yōu)化工作。短期內(nèi) DeepSeek 作為本地模型部署到手機(jī)端有距離,目前有些大廠牌將 Deepseek 作為智能體入口放置到手機(jī)助手,也有類似 Oppo 某些旗艦產(chǎn)品將滿血版 deepseek 深入集成到助手,可直接語音喚起使用。
手機(jī)廠商應(yīng)用 DeepSeek 的策略困境:一個(gè)手機(jī)廠牌的產(chǎn)品線覆蓋從低端到旗艦高端多種機(jī)型,希望 AIOS 系統(tǒng)覆蓋所有機(jī)型,但存在矛盾短期內(nèi)無法調(diào)和。雖有 DeepSeek 這樣開源性能強(qiáng)勁的模型問世,低端機(jī)型想要 AI 賦能,只能在低硬件配置基礎(chǔ)上采用現(xiàn)成的云 API + 規(guī)則匹配方式完成,隨時(shí)間推移,成本累加,收益遞減。所以目前廠商大多采用旗艦機(jī) + 數(shù)據(jù)集 + 模型優(yōu)化的策略打造 AIOS。雖前期投入大,但后期成本降低,旗艦機(jī)高溢價(jià)可覆蓋部分本地模型訓(xùn)練成本投入。
總結(jié),隨著模型能力的不斷提升以及應(yīng)用場景的持續(xù)拓展,AI 操作系統(tǒng)(AIOS)的發(fā)展演變進(jìn)程將進(jìn)一步加快。AI 帶來的價(jià)值遠(yuǎn)不止是賦予用戶自動(dòng)化操作的能力,更為關(guān)鍵的是,它極大地增強(qiáng)了用戶解決問題的實(shí)際能力,使用戶能夠在省時(shí)省力的前提下,以高效的方式完成那些以往需要耗費(fèi)大量精力才能達(dá)成的任務(wù),顯著提升了用戶體驗(yàn)與生活、工作效率。模型價(jià)格和體積的縮小,相信會(huì)普惠到更多的用戶群里。
本文由 @Antonio 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
- 目前還沒評(píng)論,等你發(fā)揮!