下载客户端

谷歌最強AI芯片狙擊英偉達B200，性能狂飆3600倍！谷歌版MCP一統(tǒng)AI智能體宇宙

新智元

关注

2025-04-11 12:20

北京

来源：澎湃新聞·澎湃號·湃客

新智元報道

編輯：編輯部 ZNHY

【新智元導讀】谷歌重磅發(fā)布第七代TPU Ironwood，專為推理設計，性能較從初代飆升3600倍，可與英偉達B200一較高下。不僅如此，谷歌還帶來了Veo 2等多款模型全新升級，就連「谷歌版」MCP協(xié)議也公布了。

推理時代的首款TPU誕生了！

昨晚，一年一度的谷歌云大會上，首次亮相了谷歌第七代TPU——Ironwood，直接叫板英偉達Blackwell B200。

它是谷歌迄今為止性能最強、可擴展性最高的定制AI加速器，也是首款專為推理設計的加速器。

相較于2018年的第一代TPU，Ironwood推理性能飆漲3600倍，效率提升了29倍。

甚至，第七代全新TPU的性能是世界第一大超算的24倍。谷歌將于今年晚些時候正式推出TPU v7。

繼MPC之后，谷歌大會上首次亮相Agent2Agent（A2A）開放協(xié)議，為智能體提供一個通用語言，可以在不同生態(tài)系統(tǒng)溝通協(xié)作。

還有ADK、Agentspace，為開發(fā)者提供了全面構(gòu)建、操作、管理AI智能體的能力。

此外，谷歌云大會精彩紛呈，Veo 2、Imagen 3、Chirp 3紛紛迭代升級，文本轉(zhuǎn)音樂模型Lyria，Vertex AI成為唯一覆蓋視頻、圖像、語音和音樂的全新生成式AI平臺。

下一步，極具性價比Gemini 2.5 Flash也將登錄Vertex AI。

推理時代首款TPU出世，媲美B200

Ironwood的誕生，不僅標志著谷歌在AI硬件又一大突破，還代表著AI基礎設施的重大轉(zhuǎn)變。

在谷歌看來，當下被動「響應式」模型，正轉(zhuǎn)變?yōu)橹鲃印干墒健怪悄荏w。

這種轉(zhuǎn)變的核心在于，AI不再僅僅停留在提供原始數(shù)據(jù)層面，而是能夠主動檢索信息、生成見解。

這正是在這個「推理時代」，谷歌對未來AI基礎設施的定義：更智能、更主動、更具協(xié)作性。

主要特性

· 性能顯著提升，同時注重功耗效率，使AI工作負載能夠更具成本效益地運行。

相比起第六代TPU Trillium，Ironwood在功耗效率（perf/watt）上實現(xiàn)了2倍的提升；比2018年推出的首款Cloud TPU，更是高出了近30倍。

同時，谷歌先進的液冷解決方案和優(yōu)化的芯片設計，即使在持續(xù)、繁重的AI工作負載下，也能可靠地維持高達標準風冷兩倍的性能。

圖 3. 功耗效率相較于TPU v2提升了29.3倍

· 高帶寬內(nèi)存（HBM）容量大幅增加

Ironwood芯片搭載了高達192GB的顯存，是Trillium的6倍。

如此一來，便可以處理更大的模型和數(shù)據(jù)集，同時還減少了頻繁數(shù)據(jù)傳輸?shù)男枨螅M而提高了性能。

· HBM帶寬顯著提高

Ironwood芯片在帶寬方面提升到了驚人的7.2 Tbps，是Trillium的4.5倍。

極高的帶寬確保了快速的數(shù)據(jù)訪問，這對于現(xiàn)代AI中常見的內(nèi)存密集型工作負載至關(guān)重要。

· 芯片間互連（ICI）帶寬增強

Ironwood的雙向帶寬已增加到1.2 Tbps，是Trillium的1.5倍。這種芯片之間更快的通信，有助于大規(guī)模高效的分布式訓練和推理。

用Ironwood驅(qū)動推理時代

Ironwood為要求最嚴苛的AI工作負載提供了所需的大規(guī)模并行處理能力，例如用于訓練和推理的、具有思考能力的超大規(guī)模稠密LLM或MoE模型。

對于谷歌Cloud客戶，Ironwood可根據(jù)AI工作負載需求提供兩種規(guī)格——256芯片或9,216芯片。

圖 1. FP8浮點運算峰值性能相較于TPU v2提升了3600倍

其中，每個單獨的芯片峰值算力達4,614 TFLOPs。

當擴展到每個pod 9,216個芯片，總計達到42.5 Exaflop時，Ironwood的算力是世界上最大的超級計算機El Capitan的24倍以上——后者每個pod僅能提供1.7 Exaflops。

不僅如此，Ironwood還配備了增強版的專門用于處理高級排序和推薦任務的加速器——SparseCore。從而為更廣泛的工作負載提供加速，包括超越傳統(tǒng)AI領(lǐng)域，進入金融和科學領(lǐng)域。

Pathways是由谷歌DeepMind開發(fā)的ML運行時，可在多個TPU芯片上實現(xiàn)高效的分布式計算。

谷歌Cloud上的Pathways使得超越單個Ironwood Pod變得簡單直接，能夠?qū)?shù)十萬個Ironwood芯片組合在一起，從而快速推進生成式AI計算的前沿。

圖 2. Ironwood原生支持FP8，而v4和v5p的峰值TFlops為模擬值

OpenAI研究員針對Ironwood與英偉達GB 200做了性能對比，并表示TPU v7與GB200性能相當，甚至略勝一籌。

全模態(tài)AI平臺來了，Veo 2再升級

隨著音樂功能的加入，Vertex AI 現(xiàn)在是唯一一個擁有涵蓋所有模態(tài)——視頻、圖像、語音和音樂——的生成式媒體模型的平臺。

這次放出的重大更新共有四項：

· 文本轉(zhuǎn)音樂模型Lyria，讓客戶可以從文本提示詞開始，生成完整的、生產(chǎn)就緒的素材。

· Veo 2的新編輯和攝像機控制功能，可幫助企業(yè)客戶精確地優(yōu)化和再利用視頻內(nèi)容。

· Chirp 3現(xiàn)在包含了Instant Custom Voice，這是一種僅需10秒音頻輸入即可創(chuàng)建定制語音的新方法。

· Imagen 3改進了圖像生成和圖像修復能力，用于重建圖像中缺失或損壞的部分，并使物體移除編輯的質(zhì)量更高。

Lyria：文生音樂模型

Lyria能生成高保真音頻，細致捕捉精妙之處，并能在多種音樂流派中提供豐富、細節(jié)詳盡的樂曲。

· 企業(yè)可以提升品牌體驗

根據(jù)品牌獨特的調(diào)性，為營銷活動、產(chǎn)品發(fā)布或沉浸式店內(nèi)體驗快速定制配樂。

通過Lyria，企業(yè)可以創(chuàng)建與目標受眾產(chǎn)生深度共鳴的聲音，培養(yǎng)情感聯(lián)系并增強品牌記憶度。

· 創(chuàng)作者可以簡化內(nèi)容創(chuàng)作流程

對于視頻制作、播客和數(shù)字內(nèi)容創(chuàng)作而言，尋找完美的免版稅音樂可能是一個耗時且昂貴的過程。

而Lyria可以在幾分鐘內(nèi)生成定制音樂曲目，直接契合您內(nèi)容的情緒、節(jié)奏和敘事，從而幫助加速制作工作流程并降低授權(quán)成本。例如：

創(chuàng)作一首高能的比波普 (Bebop) 曲調(diào)。優(yōu)先突出令人眩暈的薩克斯管和小號獨奏，以閃電般的速度交換復雜的樂句。鋼琴應提供打擊樂式的和弦伴奏，行進貝斯 (walking bass) 和快節(jié)奏的鼓點驅(qū)動著狂熱的能量。基調(diào)應是令人振奮且激烈的。捕捉深夜、煙霧繚繞的爵士俱樂部的感覺，展示精湛技藝和即興創(chuàng)作。要讓聽眾無法安坐。

Veo 2：擴展編輯功能

Veo 2則為視頻的創(chuàng)建、編輯和視覺效果添加了一套強大的功能集，使其從一個生成工具轉(zhuǎn)變?yōu)橐粋€全面的視頻創(chuàng)作和編輯平臺：

· 視頻修復 (Inpainting)：無需手動修飾即可獲得干凈、專業(yè)的編輯效果。

你可以移除視頻中不需要的背景圖像、徽標或干擾物，使它們在每一幀中都平滑完美地消失，看起來就像從未存在過一樣。

· 畫面擴展 (Outpainting)：擴展現(xiàn)有視頻素材的畫面，將傳統(tǒng)視頻轉(zhuǎn)換為針對網(wǎng)頁和移動平臺優(yōu)化的格式。

你可以輕松調(diào)整內(nèi)容來適應不同的屏幕尺寸和寬高比——例如，將橫向視頻轉(zhuǎn)換為用于社交媒體短視頻的縱向視頻。

· 應用復雜的電影拍攝技術(shù)：新功能包括指導鏡頭構(gòu)圖、攝像機角度和節(jié)奏等。

團隊可以輕松運用復雜的電影拍攝技術(shù)，無需復雜的提示詞或?qū)I(yè)知識。

例如，使用攝像機預設向不同方向移動攝像機、創(chuàng)建延時攝影效果或生成無人機風格鏡頭。

· 通過連接兩個現(xiàn)有素材創(chuàng)建連貫的視頻。

借助插值（Interpolation）功能，你可以定義視頻序列的開始和結(jié)束，讓Veo無縫生成連接幀。

這確保了平滑過渡并保持視覺連續(xù)性，從而創(chuàng)造出精美且專業(yè)的最終成品。

Chirp 3：即時定制語音和轉(zhuǎn)錄功能更新

Chirp 3的高清語音（HD voices）功能提供了超過35種語言的自然逼真語音，并有8種說話人選項。

除此之外，谷歌還新增了兩個功能：

· 即時定制語音（Instant Custom Voice）

只需要10秒的音頻輸入，即可生成逼真的定制語音。這使得企業(yè)能夠個性化呼叫中心、開發(fā)無障礙內(nèi)容，并建立獨特的品牌聲音——同時保持一致的品牌形象。

· 帶說話人日志功能的轉(zhuǎn)錄（Transcription with Diarization）

這項強大的功能可以精確地分離和識別多人錄音中的單個說話人，顯著提高轉(zhuǎn)錄內(nèi)容的清晰度和可用性，適用于會議紀要、播客分析和多方通話錄音等應用場景。

Imagen 3：改進質(zhì)量和編輯功能

作為谷歌最高質(zhì)量的文本轉(zhuǎn)圖像模型，Imagen 3能夠生成具有比之前更好細節(jié)、更豐富光照和更少干擾性偽影的圖像。

這次，谷歌顯著改進了Imagen 3的圖像修復（inpainting）能力，用于重建圖像中缺失或損壞的部分。

尤其是在物體移除（object removal）方面，不僅質(zhì)量更高，而且效果也更加自然。

MCP之后，谷歌再造A2A協(xié)議

智能體可以幫助人們做很多工作，從訂購新電腦，到協(xié)助客服人員，再到支持供應鏈規(guī)劃。

智能體越來越實用的關(guān)鍵在于讓它們能夠在一個動態(tài)的多智能體生態(tài)系統(tǒng)中相互協(xié)作，跨越孤立的數(shù)據(jù)系統(tǒng)和應用程序。

為此，谷歌推出了全新的開放協(xié)議——Agent2Agent（A2A），獲得了超過50家合作伙伴的支持和貢獻。

A2A協(xié)議將使AI智能體能夠相互通信，安全地交換信息，并在各種企業(yè)平臺或應用程序上協(xié)調(diào)行動。

它是一個開放協(xié)議，與Anthropic的模型上下文協(xié)議（MCP）相輔相成。

A2A設計原則

A2A遵循了五大核心原則：

· 擁抱智能體的能力：A2A致力于讓智能體以它們自然、非結(jié)構(gòu)化的方式協(xié)作。

· 基于現(xiàn)有標準：A2A構(gòu)建在已有的、廣泛使用的標準之上，比如HTTP、SSE、JSON-RPC。

· 默認安全：A2A從設計之初就支持企業(yè)級別的認證和授權(quán)，與OpenAPI的認證機制保持一致，確保安全性。

· 支持長時間運行的任務：設計A2A時考慮了靈活性，它能勝任從快速任務到需要數(shù)小時甚至數(shù)天的深入研究等多種場景，尤其是在有人的參與下。

· 不限模態(tài)：智能體的世界不只有文本，因此我們設計A2A時支持多種模態(tài)，包括音頻和視頻流，讓它更加多樣化。

A2A如何工作

A2A讓「客戶端」智能體和「遠程」智能體之間的溝通變得更順暢。

客戶端智能體負責制定和傳達任務，而遠程智能體則負責執(zhí)行這些任務，盡量提供正確的信息或采取正確的行動。這個互動涉及幾個關(guān)鍵功能：

· 能力發(fā)現(xiàn)：智能體可以通過JSON格式的「Agent Card」來展示自己的能力。客戶端智能體可以根據(jù)這個「名片」找到最適合執(zhí)行某項任務的智能體，并通過A2A與遠程智能體溝通。

· 任務管理：客戶端智能體和遠程智能體之間的交流以完成任務為核心，目的是滿足用戶的需求。

· 協(xié)作：智能體之間可以互相發(fā)送消息，分享上下文、回復、產(chǎn)物或用戶指令。

· 用戶體驗協(xié)商：每條消息中包含「parts,」，這是一個完整的內(nèi)容單元，比如一張生成的圖片。

實例：尋找候選人

用戶（比如招聘經(jīng)理）可以讓自己的智能體去尋找符合職位描述的候選人。

這個智能體會與其他專業(yè)智能體互動，幫你挖掘潛在候選人。用戶收到推薦名單后，可以再指示智能體安排后續(xù)面試，讓找人的過程更順暢。面試結(jié)束后，還可以讓另一個智能體幫忙做背景調(diào)查。

A2A有望開啟一個智能體相互操作的新時代，推動創(chuàng)新，打造更強大、更靈活的AI智能體系統(tǒng)。我們相信，這個協(xié)議將為未來鋪平道路，讓智能體能夠無縫協(xié)作，解決復雜問題，提升我們的生活。

我們致力于與合作伙伴和社區(qū)一起，公開構(gòu)建這個協(xié)議。我們會把協(xié)議開源，并為貢獻者設立清晰的參與路徑。

谷歌AI代碼助手，變身超強智能體

此次大會的另一個更新，就是谷歌的AI編碼助手——Gemini Code Assist，已經(jīng)在預覽中獲得了「智能體」能力！

在Cloud Next大會上，谷歌宣布：Code Assist現(xiàn)在可以部署新的AI智能體，這些智能體可以執(zhí)行多個步驟，來完成復雜的編程任務。

例如，這些智能體可以從Google Docs中的產(chǎn)品規(guī)格創(chuàng)建應用程序，或者將代碼從一種語言轉(zhuǎn)換為另一種語言。

另外，Code Assist現(xiàn)在除了其他編碼環(huán)境外，還可在Android Studio中使用。

這次升級，也是谷歌被GitHub Copilot、Cursor和Devin這些競爭者給逼瘋了。

肉眼可見，現(xiàn)在AI編程隱含著巨大的掘金市場，各家的競爭也日趨白熱化。

不過，Code Assist能做到什么程度，目前還不清楚。研究表明，即使是今天最好的代碼生成AI，也往往會引入安全漏洞和錯誤，這是由于編程邏輯理解能力的弱點。

比如對Devin的一項評估就發(fā)現(xiàn)，它只完成了20項任務中的3項。

接下來，就讓我們期待Gemini Code Assist在實際編程環(huán)境中的表現(xiàn)了。

參考資料：

https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/

https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai

原標題：《谷歌最強AI芯片狙擊英偉達B200，性能狂飆3600倍！谷歌版MCP一統(tǒng)AI智能體宇宙》

閱讀原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报

扫码下载澎湃新闻客户端

澎湃矩阵

新闻报料

报料热线: 021-962866
报料邮箱: news@thepaper.cn

沪ICP备14003370号

沪公网安备31010602000299号

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

反馈

长兴郴障科技有限公司

谷歌最強AI芯片狙擊英偉達B200，性能狂飆3600倍！谷歌版MCP一統(tǒng)AI智能體宇宙

马斯克和财长贝森特对骂狂飙脏话，白宫发言人：很正常

终于有个不瞎编的旅游AI了

AI会改变影视生态吗？中国首部AIGC改编科幻短剧来了

怒赚3900万，大学生因开发“AI作弊神器”被开除｜AI日报

研究｜和去年相比，人们使用AI的需求发生了哪些变化？

马斯克和财长贝森特对骂狂飙脏话，白宫发言人：很正常

终于有个不瞎编的旅游AI了

AI会改变影视生态吗？中国首部AIGC改编科幻短剧来了

怒赚3900万，大学生因开发“AI作弊神器”被开除｜AI日报

研究｜和去年相比，人们使用AI的需求发生了哪些变化？

马斯克和财长贝森特对骂狂飙脏话，白宫发言人：很正常

终于有个不瞎编的旅游AI了

AI会改变影视生态吗？中国首部AIGC改编科幻短剧来了

怒赚3900万，大学生因开发“AI作弊神器”被开除｜AI日报

研究｜和去年相比，人们使用AI的需求发生了哪些变化？

扫码下载澎湃新闻客户端