一文看懂 Google Cloud Next 25 AI 大更新:Google 一夜十二次,能否逆襲當(dāng)回 AI 界老大

0 評論 2041 瀏覽 4 收藏 21 分鐘

今日凌晨,谷歌在Google Cloud Next 25大會上宣布了一系列重大的AI更新,包括近20個AI相關(guān)模型、應(yīng)用、開發(fā)工具和硬件。這些更新不僅展示了谷歌在AI領(lǐng)域的強大實力,也引發(fā)了業(yè)界對其能否重新奪回AI界領(lǐng)導(dǎo)地位的討論。本文將為你詳細解讀這些更新的亮點,供大家參考。

今天早上看到 Google 開完了他們的 Google Cloud Next 25,發(fā)了近 20 個 AI 相關(guān)的模型、應(yīng)用、開發(fā)工具、硬件。

這次發(fā)的內(nèi)容特別多,很多信息散落在大量公告中。

我選了AI 相關(guān)重點和效果演示,整理了這份全網(wǎng)最清晰 Google Cloud Next 25 AI 更新解讀,方便大家跟上最新進展。

先給個總結(jié):

  1. Google公布了很多重磅、酷炫的 AI 模型與工具,但不少好東西都是期貨,求谷歌快點放出來
  2. Gemini 2.5 Flash 即將發(fā)布,高性價比推理。 結(jié)合此前登頂?shù)?2.5 Pro,能否逆襲當(dāng)回 AI 界老大?
  3. 特別的,發(fā)了讓 Agent 無縫協(xié)作的 A2A 協(xié)議,主導(dǎo)全球 Agent未來協(xié)同規(guī)范
  4. 全面公開了 Google AI 的601 項 AI 落地案例,對應(yīng)用層創(chuàng)業(yè)者指出明路。

本文共耗時 8 小時,整理了5 個 AI 新模型、1 個面向未來的 AI 協(xié)議,以及 6 項其他重點更新。

下文提到的所有公告原文、產(chǎn)品體驗與 Waitlist 地址,都統(tǒng)一整理在文末。(感謝關(guān)注、點贊、轉(zhuǎn)發(fā)、在看)

?? 5 個 AI 模型更新

首先是 5 個 AI 模型更新,我繪制了這份看板,方便大家速覽:

 

Gemini 2.5 Flash:快來了,是推理模型,主打快速、便宜

此前 Google 已經(jīng)推出了 Gemini 2.5 Pro 推理模型,擁有 100W tokens 上下文(實測在超出上下文對話中,依舊能遵循指令,精準回憶早期對話記憶),而且支持多模態(tài)提示。在眾多 Benchmark 測試中,取得了最高排名。

確實非常厲害,目前一澤的日常主力模型就是 2.5 Pro,前幾天備受好評的「萬能文生圖提示框架」中,就使用它獲得了最佳的體驗效果。

現(xiàn)在 Gemini 2.5 Flash 也快來了,與前代 2.0 Flash 不同的是:

  • 這次是個推理模型,但依然延續(xù)了快速、便宜好用的優(yōu)點
  • 推理程度會根據(jù)對話任務(wù)復(fù)雜度,動態(tài)適應(yīng)(不傻傻地對簡單常識問題進行長推理實在是太有必要了??)
  • 開發(fā)者可以自定義模型的推理程度,便于控制成本
  • 正式發(fā)布還需要時間,再等等,很快在 Vertex AI 中可用

Veo 2:超一流視頻生成模型,現(xiàn)已開放 waitlist 申請

Veo 2 絕對是值得關(guān)注的視頻生成模型,現(xiàn)在還支持P 視頻、關(guān)鍵幀生成視頻、擴展畫面、鏡頭控制等特性:

  • P 視頻:無需手動修圖,移除視頻中不需要的元素。注意看,左圖是有吊威亞的,右圖的繩子就被自然 P 掉了
  • 關(guān)鍵幀生成視頻:用首尾畫面(最左為首圖、最右為尾圖),生成視頻,畫面效果非常穩(wěn)定
  • 擴展畫面:可以對已有視頻畫面進行自然擴展,雖然效果不算特別高級,但很適合把一些橫版視頻變成豎版,方便投稿到 TikTok 等豎屏內(nèi)容平臺
  • 鏡頭控制:可以在視頻生成時,調(diào)整鏡頭構(gòu)圖、攝像機角度和控制節(jié)奏,將攝像機向不同方向移動,創(chuàng)建延時攝影效果,或生成無人機跟隨風(fēng)格的鏡頭。

PS:Google VideoFX 用的就是 Veo 2 模型(不得不說 Google 家的產(chǎn)品入口、關(guān)系是真的復(fù)雜)

注:Veo2 現(xiàn)已開放 waitlist 申請,申請地址請在文末獲取。

吐槽:Google Cloud 和 Vertex AI 的界面是真難用。如無必要,還是等 VideoFX 這類 to C 入口開放了再用吧

Chirp 3:只需 10 秒語音樣本,即可創(chuàng)建逼真的自定義語言

和 Veo 2 一起被更新到 Vertex AI 的還有 Chirp 3,是 Google 的音頻理解與生成模型。

Chirp 3 提供了超過 35 種語言(含中文)的自然逼真的語音,并支持八種音色選項。

亮點一:支持通過 10 秒的短錄音,就能生成非常逼真的自定義語音

  • 因為 Chirp 3 現(xiàn)在只能通過 API 調(diào)用,所以沒能直接上手。暫時不確定用于學(xué)習(xí)的 10 秒短錄音是必須跟讀固定文本,還是隨意任何一條清晰的錄音也可以。
  • 如果是后者,那就非常有意思,你可以拿游戲、動漫里的角色的任何一段音頻,合成對應(yīng)的虛擬人語音(捏虛擬老婆,啊不,正經(jīng) AI 伴侶),對于開發(fā)者還是阿宅都非常有價值。
  • 當(dāng)然,也希望 Google 抓緊做好安全策略,以防自己的語音被別人拿去隨意合成。
  • 下面是個 Chirp 3 的實際音頻效果,展示了無停頓和有停頓的語音區(qū)別,挺自然的。

亮點二:區(qū)分音頻中的說話人身份,提升音頻轉(zhuǎn)文本的易用性

  • 天下苦音頻轉(zhuǎn)寫不能區(qū)分人聲久矣。這下好了,現(xiàn)在能夠區(qū)分多個說話人錄音中“哪句話是誰說的”。這也是這項技術(shù)必然的需求趨勢。
  • 會議摘要、播客分析、訪談錄音轉(zhuǎn)寫會方便很多。

Lyria:文本到音樂生成模型,也開放 waitlist 申請

Lyria 也被更新到了 Vertex AI ,可從簡單文本提示創(chuàng)建完整音樂作品。

不過沒看出來特別的亮點,像海螺音樂的效果也不錯。

以下是官方放出的演示音頻:

?? 看過就好。

注:Lyria 現(xiàn)已開放 waitlist 申請,申請地址見文末。

Imagen 3:圖像生成和編輯能力改進,更擅長對象移除和圖像修復(fù)了

Imagen 3 已經(jīng)放出來很久了,《萬能文生圖提示詞框架》就通過 ImageFX(Imagen 3)生成了很多產(chǎn)品、游戲、家居設(shè)計的圖像樣例。絕對是被低估的、頭一檔的文生圖模型。

一澤萬能文生圖框架,測試 Imagefx 效果

Imagen 提升了編輯/修復(fù)功能效果,能夠快速移除、重繪圖像中不需要的對象、瑕疵。

下圖是官方演示:

左圖為原圖,中間是舊版本,右圖是 Imagen3 版本

Imagen 3一如既往的穩(wěn)定,實力真的被大大低估了。

你可以在 Gemini 應(yīng)用、ImageFX 開始使用它。

?? 1 個面向未來的 AI 協(xié)議

Agent 2 Agent:讓 Agent 們無縫協(xié)作的新協(xié)議

?? AI 開發(fā)者好不容易在 WaytoAGI 社區(qū)、AI 博主們的共學(xué)努力下,逐漸搞懂 MCP 是什么。

現(xiàn)在 Google 又搓出了特殊的協(xié)議——Agent 2 Agent。

如果要看小科普,隔壁那個很快的數(shù)字肝帝已經(jīng)發(fā)了,可以去看看:《5000字長文帶你看懂,Agent世界里的A2A、MCP協(xié)議到底是個啥》

大意是:

  • A2A 是一種用于 Agent 與 Agent 聯(lián)動協(xié)作的開放協(xié)議,是對 Anthropic 模型上下文協(xié)議 (MCP) 的補充
  • MCP 側(cè)重于為 Agent 接入各類工具與信息
  • A2A 更側(cè)重讓“你要用的 Agent”(客戶端 Agent)能夠與“提供第三方支持的 Agent”(遠程 Agent)進行聯(lián)動,前者負責(zé)制定、傳達任務(wù),后者負責(zé)執(zhí)行
  • 在 A2A 連接的過程中,Agent 之間可以互相發(fā)送消息,傳達上下文信息、回復(fù)等
  • A2A 協(xié)議的連接,可以持續(xù)保持很久,直到完成任務(wù)

官方也給了一個演示視頻,用來看效果:

類 A2A 協(xié)議在未來 AI Agent 全面落地的時代,當(dāng)然非常重要。

但不管怎么樣,在類 MCP 生態(tài)還未健全、Workflow 到底能不能算 Agent 都沒分清楚的現(xiàn)在,普通人甚至大部分開發(fā)者,也都沒必要過多關(guān)注 A2A 協(xié)議。

Don’t be so serious.

如果你喜歡研究技術(shù),可移步官方 Github 倉庫:https://github.com/google/A2A

??? 其他 AI 應(yīng)用、開發(fā)者工具和 601 個案例

除了前面的模型更新、 A2A 協(xié)議外,谷歌還面向一般用戶、開發(fā)者更新了一堆應(yīng)用和開發(fā)工具,以及 601 個真實 AI 應(yīng)用案例。

就挑一些重點說,按主觀優(yōu)先級排列:

Firebase Studio:搭載最強 AI 的云端 AI 編程工具,支持一鍵部署應(yīng)用

Google 也發(fā)布了他們自己的 AI 編程工具,得益于 Google Cloud 的云資源,開發(fā)者可以用 Firebase 一站式完成應(yīng)用開發(fā)的全流程。

包括 AI coding、編譯構(gòu)建、云服務(wù)部署、運行 的一切。

確實很方便,而且不需要下載 IDE,在云端就可以完成 AI 編程。

他們的首頁是這樣的。

具體的 Coding 界面長這樣,操作體驗和其他 AI 編程應(yīng)用一致。

得益于最強 Gemini 2.5 Pro 的加持,你能體驗到這個星球上現(xiàn)在一流的 Coding 體驗。

可以前往https://idx.google.com/體驗。

ADK:Google 的新 Agent 開發(fā)框架

ADK,全稱 Agent Development Kit。也是 Google 新發(fā)布的開發(fā)框架,適用于構(gòu)建 Multi-Agent 系統(tǒng)的開發(fā)。

以下是官方介紹的優(yōu)勢:

開發(fā)者可以自行前往https://google.github.io/adk-docs查看具體項目

 

Google Workspace :集成大量 AI 服務(wù)

Google 給 Workspace 套件追加了大量的 AI 能力。

為 Docs、Sheets、Meet、Chat 等日常工具帶來更多 AI 功能:

  • 可以把 Google 文檔變成音頻版本,或者用播客風(fēng)格概括文檔亮點
  • Google 文檔新增“幫我改進”功能
  • Vids 可用 Veo2 視頻生成模型
  • Sheets 支持用 AI 自動分析數(shù)據(jù),并生成洞察

對了,普通用戶在 Google Doc 中無法體驗

Google AI Studio 整體 UI 優(yōu)化

Google 這次還是沒選擇優(yōu)化他們的 Google Cloud 控制臺設(shè)計,而是選擇了繼續(xù)優(yōu)化 AI Studio。

整體設(shè)計風(fēng)格向 Gemini Web 應(yīng)用靠攏,變清晰了不少。

這算個小添頭,還不錯,用起來會更順手。

Google 的 601 個真實客戶帶來的 AI 案例

Google 更新了過去一年他們推動的 AI 客戶案例。

在去年 Google Cloud Next 24 時,這個案例列表還只有 101 個,現(xiàn)在已經(jīng)多了 500 個。狠狠秀了一把肌肉。

用 Gemini 總結(jié)這 601 個應(yīng)用場景,涉及的應(yīng)用場景如下:

  • 客戶代理:提升客戶服務(wù)(如聊天機器人、個性化推薦、訂單處理)
  • 員工代理:提高員工效率(如自動化任務(wù)、信息檢索、內(nèi)容生成、協(xié)作)
  • 創(chuàng)意代理:加速創(chuàng)意內(nèi)容生成(如廣告、圖像、視頻、文案)
  • 代碼代理:輔助軟件開發(fā)(如代碼生成、調(diào)試、代碼庫理解)
  • 數(shù)據(jù)代理:強化數(shù)據(jù)分析和洞察(如模式識別、預(yù)測、供應(yīng)鏈優(yōu)化、數(shù)字孿生)
  • 安全代理:增強安全防護(如威脅檢測、欺詐預(yù)防、合規(guī)性)

相信對很多 AI 公司(尤其 To B)會有不少解決方案上的啟發(fā)。

詳細案例集在此:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

Ironwood TPU:Google 第 7 代 AI 芯片,專為推理而生

Google 即將推出他們的第 7 代 AI 芯片「Ironwood」,是他們迄今為止性能最高、可擴展性最強的定制 AI 加速器,也是首款專為推理而設(shè)計的加速器。

官方公布 Ironwood 的峰值計算性能是上代 Trillium 的 5 倍,將大幅加速 AI 推理效率。

 

除了以上這些外,Google 還更新了不少其他的 AI 開發(fā)小套件、解決方案。

在這里看到 Google Cloud Next 2025 的完整官方公告:https://blog.google/products/google-cloud/next-2025/

差不多就是這些內(nèi)容,我最期待 Gemini 2.5 Flash ,你最期待哪個更新?

你覺得 Google 又是否能借這次 Next 25,重新當(dāng)回 AI 界老大哥呢?

?? Ref

公告原文

  • 【Google Cloud Next 25 官方原文大合集】:https://blog.google/products/google-cloud/next-2025
  • Gemini 2.5 Flash:https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-pro-flash-on-vertex-ai
  • Vertex AI – Veo 2 / Chirp 3 / Lyria / Imagen 3:https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai
  • A2A:https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/
  • Agent Development Kit:https://developers.googleblog.com/en/agent-development-kit-easy-to-build-multi-agent-applications/
  • Google Workspace:https://blog.google/products/workspace/cloud-next-2025-workspace-gemini/
  • Google AI 的 601 個落地案例:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
  • Ironwood TPU:https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/

文內(nèi)提到的可體驗內(nèi)容

  • Firebase Studio:https://idx.google.com/
  • Google AI Studio:https://aistudio.google.com/
  • Chirp 3:https://cloud.google.com/text-to-speech/docs/chirp3-hd
  • Imagen 3:https://labs.google/fx/zh/tools/image-fx

Waitlist 申請地址

  • Veo 2:https://docs.google.com/forms/d/e/1FAIpQLSfdksQf4brbFzAx5l1geMx7DlBTjoZKjA4DuI3uTiETCB-0hg/viewform
  • Lyria:https://docs.google.com/forms/d/1YktCIiIzyZe6TxfKnQ9PzybXGLzOeH0LJMUnhJubi1M/viewform

本文由人人都是產(chǎn)品經(jīng)理作者【一澤Eze】,微信公眾號:【一澤Eze】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!