久久久自慰免费看，制服丝袜在线观看亚洲不卡，激情久久久久久久久久久，欧美视频人妻少妇，亚洲无码久久精品视频，无码专区3D动漫精品一区二区，无码在线不卡视频，国产精品久久精品性色

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線(xiàn)下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專(zhuān)項(xiàng)技能課

1300+專(zhuān)題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專(zhuān)業(yè)技能直播

會(huì)員專(zhuān)屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

谷歌2小時(shí)瘋狂復(fù)仇，終極殺器硬剛GPT-4o！Gemini顛覆搜索，視頻AI震破Sora

新智元

2024-05-15

2 評(píng)論 1347 瀏覽 3 收藏

33 分鐘

被OpenAI提前截胡的谷歌，現(xiàn)在不甘示弱地開(kāi)啟反擊！大殺器Project Astra效果不輸GPT-4o，文生視頻模型Veo硬剛Sora，用AI徹底顛覆谷歌搜索，Gemini 1.5 Pro達(dá)到200萬(wàn)token上下文……谷歌轟出一連串武器，對(duì)OpenAI貼臉開(kāi)大。

谷歌I/O 2024如期來(lái)了，眼花繚亂地發(fā)布了一堆更新。

跟OpenAI半小時(shí)的「小而美」發(fā)布會(huì)相比，谷歌顯然準(zhǔn)備得更加充分，當(dāng)然，時(shí)間也相當(dāng)之長(zhǎng)……

2個(gè)多小時(shí)的發(fā)布會(huì)也是挑戰(zhàn)著觀(guān)眾們的極限，在場(chǎng)人群早已困倒一大片。

準(zhǔn)備好，谷歌要開(kāi)始轟炸了。

首先，Gemini 1.5 Pro，上下文長(zhǎng)度將達(dá)到驚人的200萬(wàn)token。

然后，面對(duì)昨天OpenAI GPT-4o的挑釁，谷歌直接甩出大殺器Project Astra，視覺(jué)識(shí)別和語(yǔ)音交互效果，跟GPT-4o不相上下。

接著，谷歌祭出文生視頻模型Veo硬剛Sora，效果酷炫，時(shí)長(zhǎng)超過(guò)1分鐘，打破Sora紀(jì)錄。

最后來(lái)了一個(gè)重磅消息：谷歌搜索將被Gemini重塑，形態(tài)從此徹底改變！我們不再需要自己點(diǎn)進(jìn)搜索結(jié)果，而是由多步驟推理的AI Overview來(lái)代辦一切。

發(fā)布會(huì)結(jié)束后，劈柴甚至還用Gemini算了一下，整個(gè)發(fā)布會(huì)共提了121次AI。

一、Gemini時(shí)代，來(lái)了

CEO劈柴上來(lái)就無(wú)視了GPT和Llama的存在，這樣總結(jié)道：「我們完全處于Gemini時(shí)代」。

并且給出數(shù)據(jù)：如今全世界使用Gemini的開(kāi)發(fā)者，一共有150萬(wàn)人。

萬(wàn)眾矚目的Gemini更新如期而至。

Gemini 1.5 Pro最強(qiáng)特性之一，就是超長(zhǎng)的上下文窗口，達(dá)到了100萬(wàn)tokens的級(jí)別，超過(guò)了目前所有的大語(yǔ)言模型，而且開(kāi)放給個(gè)人用戶(hù)使用。

今天，劈柴宣布：它的上下文token數(shù)將會(huì)達(dá)到2000K（200萬(wàn)）！相比之下，GPT-4 Turbo只有128K，Claude 3也只有200K。

而這也意味著——你可以給模型輸入2小時(shí)視頻、22小時(shí)音頻、超過(guò)6萬(wàn)行代碼或者140多萬(wàn)單詞。

2M長(zhǎng)上下文窗口，可以去排隊(duì)申請(qǐng)了

這個(gè)上下文長(zhǎng)度，已經(jīng)超過(guò)了目前所有大模型。

但是，這并不是終點(diǎn)，谷歌的目標(biāo)是——無(wú)限長(zhǎng)上下文，不過(guò)，這就是后話(huà)了。

1. 用籃球講解牛頓運(yùn)動(dòng)定律

在這樣的Gemini加持下，我們可以實(shí)現(xiàn)許多迅捷的功能。

比如，作為父母需要了解孩子在學(xué)校的情況，就可以在Gmail中要求Gemini識(shí)別所有關(guān)于學(xué)校的電子郵件，然后幫你總結(jié)出要點(diǎn)。

如果你錯(cuò)過(guò)了公司會(huì)議，但可以拿到一小時(shí)時(shí)長(zhǎng)的會(huì)議錄音，Gemini就能立刻幫你總結(jié)出會(huì)議要點(diǎn)。

為了幫助學(xué)生和教師，在NotebookLM中，谷歌設(shè)計(jì)了一個(gè)「音頻概述」的功能。

把左邊的所有材料作為輸入，Notebook就可以把它們整合成一個(gè)個(gè)性化的科學(xué)討論了。

對(duì)于聽(tīng)覺(jué)學(xué)習(xí)型學(xué)生，這種形式就非常生動(dòng)。

演示這個(gè)demo的Josh表示，自己的兒子第一次看到這個(gè)功能時(shí)，直接驚掉下巴。

他第一次感覺(jué)到，學(xué)習(xí)不再是死板的，牛頓力學(xué)定律居然以通過(guò)籃球來(lái)學(xué)習(xí)！

支持多模態(tài)的Gemini可以處理你上傳的任何格式的信息，理解內(nèi)容后將其改造成適合你的形式，與你對(duì)話(huà)互動(dòng)了！

2. Agent：幫你申請(qǐng)退貨

接下來(lái)，劈柴展示了Agent的一些例子。

買(mǎi)了一雙鞋子，不合適想退回怎么辦？

拍一張照片給Agent，它就可以從你的郵箱中搜出訂單后，幫你填寫(xiě)退貨單了。

再比如，你剛搬到某個(gè)城市，Agent就能幫你探索你在這個(gè)城市所需的服務(wù)了，比如干洗店、幫忙遛狗的人等等。

如果靠我們自己搜索，可是要搜十幾個(gè)網(wǎng)站，但Gemini可以發(fā)揮自己的「多步推理」能力包攬這些任務(wù)，把你需要的信息一次性提供給你！

搜索和整合信息的功能非常強(qiáng)大，輸入新家的地址后，它甚至可以代替軟件問(wèn)你外賣(mài)應(yīng)該放哪個(gè)位置。

總的來(lái)說(shuō)，谷歌的理念就是：利用Gemini的多模態(tài)、超長(zhǎng)上下文和智能體能力，把世界上的所有信息組織起來(lái)，讓它們對(duì)每個(gè)人都可觸達(dá)、可利用。

而最終目標(biāo)，就是讓AI對(duì)每一個(gè)人都有用。

二、谷歌搜索，被Gemini徹底重塑

之前OpenAI一直有意無(wú)意放出煙霧彈，聲稱(chēng)要發(fā)布全新的搜索產(chǎn)品，等于是把刀架在谷歌脖子上了。

果然，谷歌這次不甘示弱，放出了個(gè)大的。

從今天開(kāi)始，在Gemini的加持下，谷歌搜索會(huì)徹底變樣。

在搜索框下，會(huì)出現(xiàn)一個(gè)為你量身定做的AI總結(jié)。

注意，它并不簡(jiǎn)單地將所有內(nèi)容拼湊在一起，而是幫你把活都干了！

你的問(wèn)題是什么樣，它就會(huì)幫你做規(guī)劃，展示出若干個(gè)卡片，讓搜索信息以鮮明的方式被呈現(xiàn)出來(lái)。

這次AI Overview即將發(fā)布的另一個(gè)重磅功能，就是多步驟推理。

它能將用戶(hù)輸入的一個(gè)復(fù)雜問(wèn)題分解成多部分，確定需要解決哪些問(wèn)題，以及用什么順序解決。

因此，以前可能要花幾分鐘甚至幾個(gè)小時(shí)的研究，現(xiàn)在幾秒鐘內(nèi)就可以完成！因?yàn)樗鼘⑹畟€(gè)問(wèn)題合而為一。

比如，如果想找到波士頓最好的瑜伽或普拉提工作室，它會(huì)直接搜出來(lái)結(jié)果，然后幫你整理好情況介紹和工作時(shí)間。

只要一次搜索，所有需要的信息就自動(dòng)呈現(xiàn)出來(lái)。

在下面這個(gè)例子中，你可以要求谷歌提供一個(gè)三天的膳食計(jì)劃。

這些食譜被從整個(gè)網(wǎng)絡(luò)整合出來(lái)，清晰又全面。

而且，我們還可以用視頻去搜索了！

比如，該怎么修這個(gè)唱片機(jī)？

以前，我們需要進(jìn)行一堆搜索，確定它的牌子、型號(hào)。

現(xiàn)在，直接拍一個(gè)視頻丟給谷歌，然后直接開(kāi)口問(wèn)：它的這個(gè)毛病是什么原因？

谷歌用AI Overview，給出了最全面的信息。

從此，在谷歌搜索中，你需要做的，就是簡(jiǎn)單的「張嘴問(wèn)」。

三、對(duì)標(biāo)GPT-4o，Project Astra打造通用AI智能體

我們已經(jīng)看到，新模型GPT-4o賦予了ChatGPT強(qiáng)大的實(shí)時(shí)對(duì)話(huà)能力，讓Her走進(jìn)現(xiàn)實(shí)。

全新AI語(yǔ)音助手，是通往AGI的下一個(gè)未來(lái)。

對(duì)標(biāo)OpenAI，谷歌DeepMind今天首次對(duì)外公布了「通用AI智能體」新項(xiàng)目——Astra。

其實(shí)，昨天谷歌放出了一個(gè)demo，已經(jīng)讓所有人對(duì)Astra項(xiàng)目有了初步的了解。

而今天，現(xiàn)場(chǎng)的演示更加炸裂。

網(wǎng)友稱(chēng)，這是谷歌I/O大會(huì)中，自己最喜歡的part。

不僅有Astra強(qiáng)大的對(duì)答如流的能力，還首次展示了「谷歌AR原型眼鏡」配上AI的震撼演示。

Astra兩部分演示，每段視頻均為單次拍攝、實(shí)時(shí)錄制完成

召喚Gemini之后，測(cè)試者提出問(wèn)題，「當(dāng)你看到會(huì)發(fā)出聲音的東西時(shí)，告訴我」。

它回答道，「我看到一個(gè)揚(yáng)聲器，它可能會(huì)發(fā)聲」。

接下來(lái)，測(cè)試者用紅色剪頭指向揚(yáng)聲器的頂部，再次問(wèn)道，「這個(gè)揚(yáng)聲器的部件叫什么」？

Gemini準(zhǔn)確理解指令，并答出「這是高音揚(yáng)聲器，能產(chǎn)生高頻的聲音」。

然后，對(duì)著桌上一桶彩色蠟筆，讓Gemini就展示的物體，給出了「押頭韻」的創(chuàng)意——

「Creative crayons color cheerfully. They certainly craft colorful creations.」

Gemini以「c」音重復(fù)開(kāi)頭，生動(dòng)形象地描繪了用蠟筆歡快涂色，可以創(chuàng)作出許多絢麗多彩作品的場(chǎng)景。

而更讓你意想不到的是，它還可以讀懂代碼。

甚至都不是截屏，而是用攝像頭懟著電腦屏幕拍，然后問(wèn)Gemini「這部分代碼是做什么的」？

Gemini看了一眼，就立即給出回答：「此段代碼定義了加密和解密函數(shù)。它似乎使用AES CBC加密，根據(jù)密鑰和初始化向量對(duì)數(shù)據(jù)進(jìn)行編碼和解碼」。

再將鏡頭移向窗外，「我在哪個(gè)街區(qū)」？

Gemini便回答道，「這似乎是倫敦國(guó)王十字區(qū)，這里以火車(chē)站和交通樞紐而聞名」。

眼鏡找不到了？

直接可以問(wèn)Gemini，「你記得在哪里見(jiàn)過(guò)我的眼鏡」？

它立刻回想剛剛見(jiàn)到的場(chǎng)景，「是的，我記得。你的眼鏡就在桌子上，旁邊有一個(gè)紅蘋(píng)果」。

要知道，剛剛這個(gè)問(wèn)題并沒(méi)有向它提過(guò)，Astra完全是憑自己的視覺(jué)記憶回答出來(lái)的，簡(jiǎn)直成精了。

而Astra的這番表現(xiàn)，直接讓全場(chǎng)倒吸一口涼氣，發(fā)出驚呼。

谷歌原型AR眼鏡首現(xiàn)身

接下來(lái)的演示，更炫酷了。

剛剛找到的眼鏡，竟是谷歌的原型AR眼鏡！配合上強(qiáng)大的Gemini模型，即將開(kāi)辟全新的應(yīng)用。

測(cè)試者走到白板前，看向一個(gè)「服務(wù)器」的構(gòu)建示意圖，然后問(wèn)道，「我應(yīng)該怎樣做能使這個(gè)系統(tǒng)更快」？

Gemini表示，「在服務(wù)器和數(shù)據(jù)庫(kù)之間，添加緩存可以提高速度」。

再比如，「看到如下圖，會(huì)讓你想起什么」？

——薛定諤的貓！

「在幫我給這對(duì)家伙，起一個(gè)二重唱樂(lè)隊(duì)名字」。

——Golden Stripes

大會(huì)上，Hassabis稱(chēng)，「一直以來(lái)，谷歌希望構(gòu)建一個(gè)能在日常生活中真正有所幫助的通用AI智能體。如今，這一愿景成為現(xiàn)實(shí)，可以追溯到很多年前。這也是谷歌從頭開(kāi)始打造多模態(tài)Gemini的主要原因」。

真正的通用AI智能體，必須像人類(lèi)一樣，對(duì)復(fù)雜、動(dòng)態(tài)的世界做出理解和響應(yīng)。

它需要接受和記住所看到的內(nèi)容，以便理解上下文采取行動(dòng)，并且具備主動(dòng)性和個(gè)性化。

甚至，你可以與其如真人般絲滑交流，沒(méi)有任何滯后或延遲。

為了打造這款全能AI智能體，谷歌DeepMind克服了很困難的工程挑戰(zhàn)——將AI響應(yīng)時(shí)間降低至對(duì)話(huà)水平。

具體來(lái)說(shuō)，谷歌團(tuán)隊(duì)在Gemini的基礎(chǔ)上，開(kāi)發(fā)了能夠持續(xù)編碼視頻幀的智能體。

然后，將視頻和語(yǔ)音多模態(tài)輸入，整合到事件時(shí)間軸中并緩存，以便實(shí)現(xiàn)AI智能體高效召回，更快處理信息。

此外，谷歌還使用廣泛的語(yǔ)調(diào)變化，增強(qiáng)了語(yǔ)音輸出效果。

基于這些努力，Astra能夠更好理解上下文，在交談中可以快速做出反應(yīng)，讓互動(dòng)的節(jié)奏和質(zhì)量感覺(jué)更加自然。

有網(wǎng)友稱(chēng)，「谷歌的這個(gè)Astra項(xiàng)目絕對(duì)是游戲規(guī)則的改變者，我們現(xiàn)在生活在一個(gè)由個(gè)人AI助手組成的世界，聊天機(jī)器人現(xiàn)在已經(jīng)過(guò)時(shí)了。它可以實(shí)時(shí)地看、說(shuō)、聽(tīng)，幾乎沒(méi)有延遲」

當(dāng)然，這次演示中，谷歌偷偷推出的AR硬件，也成為網(wǎng)友們的關(guān)注點(diǎn)。

谷歌科學(xué)家剛剛放出了，用Astra看谷歌I/O大會(huì)的演示，可以自己感受下。

四、圖像、音樂(lè)、視頻，面面俱到

與此同時(shí)，谷歌大會(huì)上再次推出了一系列關(guān)于「生成式媒體工具」的最新進(jìn)展。

其中，包括圖像、音樂(lè)，以及視頻模型。

1. 最強(qiáng)AI文生圖Imagen 3

首先，AI文本到圖像生成模型Imagen 3迎來(lái)重磅升級(jí)。

比起上一代，Imagen 3能生成更多細(xì)節(jié)、光影豐富，且干擾偽影更少的圖像。

新模型對(duì)提示的理解能力，得到顯著提升，可以從較長(zhǎng)的提示中，捕獲細(xì)節(jié)。

如下圖中，對(duì)狼的特征，背景顏色，畫(huà)質(zhì)質(zhì)量等要求，Imagen 3一致地呈現(xiàn)了出來(lái)。

另外，Imagen 3可以生成視覺(jué)豐富、高質(zhì)量的圖像，有良好光照和構(gòu)圖。

它可以準(zhǔn)確地渲染小細(xì)節(jié)，比如人手上的細(xì)微皺紋，以及復(fù)雜的紋理。

下圖中，毛絨大象清晰的編織紋理，還有光照，效果鮮明。

Imagen 3還可以在更長(zhǎng)的提示中，加入一些微小的細(xì)節(jié)，比如「野花」、「藍(lán)色的小鳥(niǎo)」…

谷歌還極大地改進(jìn)了Imagen 3的文本渲染能力。

如下圖片提示，「由各種顏色的羽毛組成的「光」字，黑色背景」，然后Imagen 3生成了漂亮的字體。

以下是官方給出的更多演示demo：

2. 視頻生成模型Veo，1080p超過(guò)60秒

這次谷歌發(fā)布的視頻模型Veo，可以看作是對(duì)OpenAI Sora的正面迎戰(zhàn)了。

可以看出，Veo生成的視頻不僅真實(shí)，而且在光線(xiàn)、構(gòu)圖等方面具有驚人的電影感。

Veo的推出建立在DeepMind過(guò)去一年各種開(kāi)創(chuàng)性成果的基礎(chǔ)上，包括GQN、Phenaki、Walt、VideoPoet、Lumiere等等。

谷歌結(jié)合了這些成果中最好的架構(gòu)和技術(shù)，提高了一致性、質(zhì)量和分辨率。

Veo具備1080p的高質(zhì)量，用戶(hù)提示可以是文本、圖像、視頻等各種格式，還能捕捉到其中關(guān)于視覺(jué)效果和影像風(fēng)格的各種細(xì)節(jié)描述。

通過(guò)點(diǎn)擊「擴(kuò)展」按鈕，用戶(hù)就可以持續(xù)增加視頻的時(shí)長(zhǎng)，最終，它的時(shí)長(zhǎng)已經(jīng)超過(guò)Sora達(dá)到了1分10秒。

可以看到，在下面這個(gè)視頻中，汽車(chē)的形狀與周?chē)h(huán)境始終保持一致。

有這種專(zhuān)業(yè)級(jí)的生成效果，電影制作人可以直接用Veo來(lái)協(xié)助創(chuàng)作了。

從此，每個(gè)人都可以成為導(dǎo)演，也應(yīng)該成為導(dǎo)演。

好消息是，Veo已經(jīng)開(kāi)始在官網(wǎng)開(kāi)放試用了。此外，團(tuán)隊(duì)還開(kāi)發(fā)了實(shí)驗(yàn)性工具VideoFX搭載Veo模型。

申請(qǐng)入口：https://aitestkitchen.withgoogle.com/tools/video-fx

在谷歌官博中，給出了Veo更多演示，還特別強(qiáng)調(diào)了均是AI生成，未經(jīng)過(guò)修改：

3. Music AI Sandbox

在音樂(lè)方面，谷歌和Youtube一起構(gòu)建了Music AI Sandbox。

輸入一段旋律，它就可以進(jìn)行風(fēng)格遷移，幫助藝術(shù)家們快速實(shí)現(xiàn)自己的想法和創(chuàng)意。

為此，谷歌還特意邀請(qǐng)了許多音樂(lè)家、詞曲作者和制作人來(lái)測(cè)試。

他們驚喜地發(fā)現(xiàn)，使用這個(gè)新的AI音樂(lè)工具，他們居然做出了自己從未想到的音樂(lè)！

比如這位音樂(lè)制作人，希望把樂(lè)曲中的這段旋律變一個(gè)風(fēng)格。

Music AI Sandbox的產(chǎn)出，讓他激動(dòng)地當(dāng)場(chǎng)跳起來(lái)。

他表示，作為一個(gè)嘻哈音樂(lè)制作人，AI帶給他的嘗試空間，是無(wú)止境的。

4. Demis Hassabis：我在思考智能的本質(zhì)

谷歌DeepMind負(fù)責(zé)人Hassabis表示，自己從小玩國(guó)際象棋時(shí)，就一直在思考智能的本質(zhì)是什么。

他深信，如果我們能以負(fù)責(zé)任的方式建造AGI，影響將是深刻的。

谷歌DeepMind自去年成立以來(lái)成績(jī)斐然。而最近的大成就，就是幾乎可以預(yù)測(cè)所有生命分子結(jié)構(gòu)和相互作用的AlphaFold 3了。

五、原生多模態(tài)Gemini App

谷歌還打造出了一款Gemini原生多模態(tài)應(yīng)用，可以同時(shí)文本、音頻、視頻內(nèi)容。

一直以來(lái)，谷歌希望能夠打造一個(gè)有用的個(gè)人AI助理。

Gemini App，正重新定義我們的交互方式。

為了讓我們與Gemini交互更自然，谷歌發(fā)布了Gemini Live。

有了它，你可以在給朋友發(fā)消息的同一個(gè)程序中，還能與Gemini聊天。

你甚至可以控制自己的說(shuō)話(huà)節(jié)奏，或者隨時(shí)打斷Gemini回答，如同與真人交流一樣。

比如，你正在為一場(chǎng)面試做準(zhǔn)備，只需要進(jìn)入Live，讓Gemini陪你一起做準(zhǔn)備。

Gemini可以與你進(jìn)行模擬面試排練，甚至在與潛在雇主交談時(shí)應(yīng)該突出哪些技能，還能提供建議。

谷歌表示，今年晚些時(shí)候，會(huì)推出攝像頭模式，可以以周?chē)h(huán)境與Gemini實(shí)現(xiàn)對(duì)話(huà)。

與此同時(shí)，谷歌還推出了根據(jù)個(gè)人需求自定義的Gemini專(zhuān)家——Gems。

它可以是你的健身教練、瑜伽伙伴，也可以是你的寫(xiě)作創(chuàng)意導(dǎo)師、編程伙伴等等。

接下來(lái)，谷歌還展示了通過(guò)規(guī)劃，讓我們?nèi)绾坞xAI助手更近一步。

比如，一次旅行的規(guī)劃，需要涉及地理、時(shí)間、天氣等諸多因素，需要AI能夠做出優(yōu)先順序和決策的能力。

Gemini Advanced的全新旅行規(guī)劃，可以將模型推理和智慧融為一體，為人類(lèi)更好服務(wù)。

六、Ask Photos新功能

在Gemini的加持下，谷歌還會(huì)推出Ask Photos的新功能。

比如，如果付停車(chē)費(fèi)時(shí)忘了自己的車(chē)牌號(hào)，就可以直接詢(xún)問(wèn)自己的車(chē)牌照片是哪個(gè)，不需要翻閱手機(jī)里的大量照片了。

在比如，你可以問(wèn)它女兒是什么時(shí)候?qū)W會(huì)游泳的？她的游泳是怎么進(jìn)步的？

Gemini會(huì)識(shí)別眾多照片中的不同場(chǎng)景，將所有相關(guān)內(nèi)容匯總。

七、Gemini 1.5 Flash：更小，更快，200萬(wàn)token

根據(jù)某些Gemini 1.5 Pro用戶(hù)的反饋，一些程序需要更低的延遲和服務(wù)成本。

針對(duì)這一點(diǎn)，谷歌發(fā)布了Gemini 1.5 Flash。

跟Pro比，F(xiàn)lash是一個(gè)更輕量級(jí)的模型，專(zhuān)為那些對(duì)響應(yīng)速度要求極高的特定或頻繁任務(wù)優(yōu)化。

并且，它同樣具有多模態(tài)、1M tokens長(zhǎng)上下文的特點(diǎn)，只不過(guò)實(shí)現(xiàn)了輕量化、低延遲、高效推理，每百萬(wàn)個(gè)token的價(jià)格僅是Pro版的二十分之一。

今天起，Gemini 1.5 Flash在Google AI Studio和Vertex AI中就可用了，開(kāi)發(fā)者可以注冊(cè)申請(qǐng)兩百萬(wàn)token的內(nèi)測(cè)版。

此外，為了方便開(kāi)發(fā)者，谷歌還對(duì)Gemini的API功能進(jìn)行了三項(xiàng)優(yōu)化——視頻幀提取、并行函數(shù)調(diào)用和上下文緩存。

八、第六代TPU Trillium，4.7倍性能提升

在背后給這些技術(shù)進(jìn)步提供基礎(chǔ)設(shè)施的，就是谷歌的TPU。

簡(jiǎn)單來(lái)說(shuō)，相較于TPU v5e，第六代Trillium TPU在性能上實(shí)現(xiàn)了高達(dá)4.7倍的提升，并在能效上提升了超過(guò)67%。

為了實(shí)現(xiàn)這一飛躍，谷歌增大了矩陣乘法單元（MXUs）的規(guī)模并提升了時(shí)鐘速度。

并為T(mén)rillium配備了第三代SparseCore——專(zhuān)門(mén)用于處理高級(jí)排序和推薦工作負(fù)載中常見(jiàn)的超大嵌入的加速器。

在這里，SparseCores可以通過(guò)從TensorCores策略性地卸載隨機(jī)和細(xì)粒度訪(fǎng)問(wèn)，有效加速了重嵌入型工作負(fù)載。

與此同時(shí)，谷歌還將高帶寬存儲(chǔ)器（HBM）的容量和帶寬翻倍，并將芯片間互連（ICI）的帶寬提升了一倍。

由此，Trillium可以支持更加復(fù)雜的模型，擁有更多的權(quán)重和更大的鍵值緩存，并大幅縮短了大模型的訓(xùn)練時(shí)間和響應(yīng)延遲。

在一個(gè)高帶寬、低延遲的Pod中，Trillium可以擴(kuò)展至256個(gè)TPU。

而通過(guò)多切片技術(shù)和Titanium智能處理單元（IPU），Trillium還可以進(jìn)一步擴(kuò)展——通過(guò)數(shù)百個(gè)Pod，連接數(shù)以萬(wàn)計(jì)的芯片，并在一個(gè)多千兆位每秒的數(shù)據(jù)中心網(wǎng)絡(luò)支持下，組成一個(gè)超大規(guī)模的超級(jí)計(jì)算機(jī)。