长兴郴障科技有限公司

澎湃Logo
下载客户端

登录

  • +1

谷歌最強AI芯片狙擊英偉達B200,性能狂飆3600倍!谷歌版MCP一統(tǒng)AI智能體宇宙

关注
2025-04-11 12:20
北京
来源:澎湃新聞·澎湃號·湃客
字号

新智元報道

編輯:編輯部 ZNHY

【新智元導讀】谷歌重磅發(fā)布第七代TPU Ironwood,專為推理設計,性能較從初代飆升3600倍,可與英偉達B200一較高下。不僅如此,谷歌還帶來了Veo 2等多款模型全新升級,就連「谷歌版」MCP協(xié)議也公布了。

推理時代的首款TPU誕生了!

昨晚,一年一度的谷歌云大會上,首次亮相了谷歌第七代TPU——Ironwood,直接叫板英偉達Blackwell B200。

它是谷歌迄今為止性能最強、可擴展性最高的定制AI加速器,也是首款專為推理設計的加速器。

相較于2018年的第一代TPU,Ironwood推理性能飆漲3600倍,效率提升了29倍。

甚至,第七代全新TPU的性能是世界第一大超算的24倍。谷歌將于今年晚些時候正式推出TPU v7。

繼MPC之后,谷歌大會上首次亮相Agent2Agent(A2A)開放協(xié)議,為智能體提供一個通用語言,可以在不同生態(tài)系統(tǒng)溝通協(xié)作。

還有ADK、Agentspace,為開發(fā)者提供了全面構(gòu)建、操作、管理AI智能體的能力。

此外,谷歌云大會精彩紛呈,Veo 2、Imagen 3、Chirp 3紛紛迭代升級,文本轉(zhuǎn)音樂模型Lyria,Vertex AI成為唯一覆蓋視頻、圖像、語音和音樂的全新生成式AI平臺。

下一步,極具性價比Gemini 2.5 Flash也將登錄Vertex AI。

推理時代首款TPU出世,媲美B200

Ironwood的誕生,不僅標志著谷歌在AI硬件又一大突破,還代表著AI基礎設施的重大轉(zhuǎn)變。

在谷歌看來,當下被動「響應式」模型,正轉(zhuǎn)變?yōu)橹鲃印干墒健怪悄荏w。

這種轉(zhuǎn)變的核心在于,AI不再僅僅停留在提供原始數(shù)據(jù)層面,而是能夠主動檢索信息、生成見解。

這正是在這個「推理時代」,谷歌對未來AI基礎設施的定義:更智能、更主動、更具協(xié)作性。

主要特性

· 性能顯著提升,同時注重功耗效率,使AI工作負載能夠更具成本效益地運行。

相比起第六代TPU Trillium,Ironwood在功耗效率(perf/watt)上實現(xiàn)了2倍的提升;比2018年推出的首款Cloud TPU,更是高出了近30倍。

同時,谷歌先進的液冷解決方案和優(yōu)化的芯片設計,即使在持續(xù)、繁重的AI工作負載下,也能可靠地維持高達標準風冷兩倍的性能。

圖 3. 功耗效率相較于TPU v2提升了29.3倍

· 高帶寬內(nèi)存(HBM)容量大幅增加

Ironwood芯片搭載了高達192GB的顯存,是Trillium的6倍。

如此一來,便可以處理更大的模型和數(shù)據(jù)集,同時還減少了頻繁數(shù)據(jù)傳輸?shù)男枨螅M而提高了性能。

· HBM帶寬顯著提高

Ironwood芯片在帶寬方面提升到了驚人的7.2 Tbps,是Trillium的4.5倍。

極高的帶寬確保了快速的數(shù)據(jù)訪問,這對于現(xiàn)代AI中常見的內(nèi)存密集型工作負載至關(guān)重要。

· 芯片間互連(ICI)帶寬增強

Ironwood的雙向帶寬已增加到1.2 Tbps,是Trillium的1.5倍。這種芯片之間更快的通信,有助于大規(guī)模高效的分布式訓練和推理。

用Ironwood驅(qū)動推理時代

Ironwood為要求最嚴苛的AI工作負載提供了所需的大規(guī)模并行處理能力,例如用于訓練和推理的、具有思考能力的超大規(guī)模稠密LLM或MoE模型。

對于谷歌Cloud客戶,Ironwood可根據(jù)AI工作負載需求提供兩種規(guī)格——256芯片或9,216芯片。

圖 1. FP8浮點運算峰值性能相較于TPU v2提升了3600倍

其中,每個單獨的芯片峰值算力達4,614 TFLOPs。

當擴展到每個pod 9,216個芯片,總計達到42.5 Exaflop時,Ironwood的算力是世界上最大的超級計算機El Capitan的24倍以上——后者每個pod僅能提供1.7 Exaflops。

不僅如此,Ironwood還配備了增強版的專門用于處理高級排序和推薦任務的加速器——SparseCore。從而為更廣泛的工作負載提供加速,包括超越傳統(tǒng)AI領(lǐng)域,進入金融和科學領(lǐng)域。

Pathways是由谷歌DeepMind開發(fā)的ML運行時,可在多個TPU芯片上實現(xiàn)高效的分布式計算。

谷歌Cloud上的Pathways使得超越單個Ironwood Pod變得簡單直接,能夠?qū)?shù)十萬個Ironwood芯片組合在一起,從而快速推進生成式AI計算的前沿。

圖 2. Ironwood原生支持FP8,而v4和v5p的峰值TFlops為模擬值

OpenAI研究員針對Ironwood與英偉達GB 200做了性能對比,并表示TPU v7與GB200性能相當,甚至略勝一籌。

全模態(tài)AI平臺來了,Veo 2再升級

隨著音樂功能的加入,Vertex AI 現(xiàn)在是唯一一個擁有涵蓋所有模態(tài)——視頻、圖像、語音和音樂——的生成式媒體模型的平臺。

這次放出的重大更新共有四項:

· 文本轉(zhuǎn)音樂模型Lyria,讓客戶可以從文本提示詞開始,生成完整的、生產(chǎn)就緒的素材。

· Veo 2的新編輯和攝像機控制功能,可幫助企業(yè)客戶精確地優(yōu)化和再利用視頻內(nèi)容。

· Chirp 3現(xiàn)在包含了Instant Custom Voice,這是一種僅需10秒音頻輸入即可創(chuàng)建定制語音的新方法。

· Imagen 3改進了圖像生成和圖像修復能力,用于重建圖像中缺失或損壞的部分,并使物體移除編輯的質(zhì)量更高。

Lyria:文生音樂模型

Lyria能生成高保真音頻,細致捕捉精妙之處,并能在多種音樂流派中提供豐富、細節(jié)詳盡的樂曲。

· 企業(yè)可以提升品牌體驗

根據(jù)品牌獨特的調(diào)性,為營銷活動、產(chǎn)品發(fā)布或沉浸式店內(nèi)體驗快速定制配樂。

通過Lyria,企業(yè)可以創(chuàng)建與目標受眾產(chǎn)生深度共鳴的聲音,培養(yǎng)情感聯(lián)系并增強品牌記憶度。

· 創(chuàng)作者可以簡化內(nèi)容創(chuàng)作流程

對于視頻制作、播客和數(shù)字內(nèi)容創(chuàng)作而言,尋找完美的免版稅音樂可能是一個耗時且昂貴的過程。

而Lyria可以在幾分鐘內(nèi)生成定制音樂曲目,直接契合您內(nèi)容的情緒、節(jié)奏和敘事,從而幫助加速制作工作流程并降低授權(quán)成本。例如:

創(chuàng)作一首高能的比波普 (Bebop) 曲調(diào)。優(yōu)先突出令人眩暈的薩克斯管和小號獨奏,以閃電般的速度交換復雜的樂句。鋼琴應提供打擊樂式的和弦伴奏,行進貝斯 (walking bass) 和快節(jié)奏的鼓點驅(qū)動著狂熱的能量。基調(diào)應是令人振奮且激烈的。捕捉深夜、煙霧繚繞的爵士俱樂部的感覺,展示精湛技藝和即興創(chuàng)作。要讓聽眾無法安坐。

Veo 2:擴展編輯功能

Veo 2則為視頻的創(chuàng)建、編輯和視覺效果添加了一套強大的功能集,使其從一個生成工具轉(zhuǎn)變?yōu)橐粋€全面的視頻創(chuàng)作和編輯平臺:

· 視頻修復 (Inpainting):無需手動修飾即可獲得干凈、專業(yè)的編輯效果。

你可以移除視頻中不需要的背景圖像、徽標或干擾物,使它們在每一幀中都平滑完美地消失,看起來就像從未存在過一樣。

· 畫面擴展 (Outpainting):擴展現(xiàn)有視頻素材的畫面,將傳統(tǒng)視頻轉(zhuǎn)換為針對網(wǎng)頁和移動平臺優(yōu)化的格式。

你可以輕松調(diào)整內(nèi)容來適應不同的屏幕尺寸和寬高比——例如,將橫向視頻轉(zhuǎn)換為用于社交媒體短視頻的縱向視頻。

· 應用復雜的電影拍攝技術(shù):新功能包括指導鏡頭構(gòu)圖、攝像機角度和節(jié)奏等。

團隊可以輕松運用復雜的電影拍攝技術(shù),無需復雜的提示詞或?qū)I(yè)知識。

例如,使用攝像機預設向不同方向移動攝像機、創(chuàng)建延時攝影效果或生成無人機風格鏡頭。

· 通過連接兩個現(xiàn)有素材創(chuàng)建連貫的視頻。

借助插值(Interpolation)功能,你可以定義視頻序列的開始和結(jié)束,讓Veo無縫生成連接幀。

這確保了平滑過渡并保持視覺連續(xù)性,從而創(chuàng)造出精美且專業(yè)的最終成品。

Chirp 3:即時定制語音和轉(zhuǎn)錄功能更新

Chirp 3的高清語音(HD voices)功能提供了超過35種語言的自然逼真語音,并有8種說話人選項。

除此之外,谷歌還新增了兩個功能:

· 即時定制語音(Instant Custom Voice)

只需要10秒的音頻輸入,即可生成逼真的定制語音。這使得企業(yè)能夠個性化呼叫中心、開發(fā)無障礙內(nèi)容,并建立獨特的品牌聲音——同時保持一致的品牌形象。

· 帶說話人日志功能的轉(zhuǎn)錄(Transcription with Diarization)

這項強大的功能可以精確地分離和識別多人錄音中的單個說話人,顯著提高轉(zhuǎn)錄內(nèi)容的清晰度和可用性,適用于會議紀要、播客分析和多方通話錄音等應用場景。

Imagen 3:改進質(zhì)量和編輯功能

作為谷歌最高質(zhì)量的文本轉(zhuǎn)圖像模型,Imagen 3能夠生成具有比之前更好細節(jié)、更豐富光照和更少干擾性偽影的圖像。

這次,谷歌顯著改進了Imagen 3的圖像修復(inpainting)能力,用于重建圖像中缺失或損壞的部分。

尤其是在物體移除(object removal)方面,不僅質(zhì)量更高,而且效果也更加自然。

MCP之后,谷歌再造A2A協(xié)議

智能體可以幫助人們做很多工作,從訂購新電腦,到協(xié)助客服人員,再到支持供應鏈規(guī)劃。

智能體越來越實用的關(guān)鍵在于讓它們能夠在一個動態(tài)的多智能體生態(tài)系統(tǒng)中相互協(xié)作,跨越孤立的數(shù)據(jù)系統(tǒng)和應用程序。

為此,谷歌推出了全新的開放協(xié)議——Agent2Agent(A2A),獲得了超過50家合作伙伴的支持和貢獻。

A2A協(xié)議將使AI智能體能夠相互通信,安全地交換信息,并在各種企業(yè)平臺或應用程序上協(xié)調(diào)行動。

它是一個開放協(xié)議,與Anthropic的模型上下文協(xié)議(MCP)相輔相成。

A2A設計原則

A2A遵循了五大核心原則:

· 擁抱智能體的能力:A2A致力于讓智能體以它們自然、非結(jié)構(gòu)化的方式協(xié)作。

· 基于現(xiàn)有標準:A2A構(gòu)建在已有的、廣泛使用的標準之上,比如HTTP、SSE、JSON-RPC。

· 默認安全:A2A從設計之初就支持企業(yè)級別的認證和授權(quán),與OpenAPI的認證機制保持一致,確保安全性。

· 支持長時間運行的任務:設計A2A時考慮了靈活性,它能勝任從快速任務到需要數(shù)小時甚至數(shù)天的深入研究等多種場景,尤其是在有人的參與下。

· 不限模態(tài):智能體的世界不只有文本,因此我們設計A2A時支持多種模態(tài),包括音頻和視頻流,讓它更加多樣化。

A2A如何工作

A2A讓「客戶端」智能體和「遠程」智能體之間的溝通變得更順暢。

客戶端智能體負責制定和傳達任務,而遠程智能體則負責執(zhí)行這些任務,盡量提供正確的信息或采取正確的行動。這個互動涉及幾個關(guān)鍵功能:

· 能力發(fā)現(xiàn):智能體可以通過JSON格式的「Agent Card」來展示自己的能力。客戶端智能體可以根據(jù)這個「名片」找到最適合執(zhí)行某項任務的智能體,并通過A2A與遠程智能體溝通。

· 任務管理:客戶端智能體和遠程智能體之間的交流以完成任務為核心,目的是滿足用戶的需求。

· 協(xié)作:智能體之間可以互相發(fā)送消息,分享上下文、回復、產(chǎn)物或用戶指令。

· 用戶體驗協(xié)商:每條消息中包含「parts,」,這是一個完整的內(nèi)容單元,比如一張生成的圖片。

實例:尋找候選人

用戶(比如招聘經(jīng)理)可以讓自己的智能體去尋找符合職位描述的候選人。

這個智能體會與其他專業(yè)智能體互動,幫你挖掘潛在候選人。用戶收到推薦名單后,可以再指示智能體安排后續(xù)面試,讓找人的過程更順暢。面試結(jié)束后,還可以讓另一個智能體幫忙做背景調(diào)查。

A2A有望開啟一個智能體相互操作的新時代,推動創(chuàng)新,打造更強大、更靈活的AI智能體系統(tǒng)。我們相信,這個協(xié)議將為未來鋪平道路,讓智能體能夠無縫協(xié)作,解決復雜問題,提升我們的生活。

我們致力于與合作伙伴和社區(qū)一起,公開構(gòu)建這個協(xié)議。我們會把協(xié)議開源,并為貢獻者設立清晰的參與路徑。

谷歌AI代碼助手,變身超強智能體

此次大會的另一個更新,就是谷歌的AI編碼助手——Gemini Code Assist,已經(jīng)在預覽中獲得了「智能體」能力!

在Cloud Next大會上,谷歌宣布:Code Assist現(xiàn)在可以部署新的AI智能體,這些智能體可以執(zhí)行多個步驟,來完成復雜的編程任務。

例如,這些智能體可以從Google Docs中的產(chǎn)品規(guī)格創(chuàng)建應用程序,或者將代碼從一種語言轉(zhuǎn)換為另一種語言。

另外,Code Assist現(xiàn)在除了其他編碼環(huán)境外,還可在Android Studio中使用。

這次升級,也是谷歌被GitHub Copilot、Cursor和Devin這些競爭者給逼瘋了。

肉眼可見,現(xiàn)在AI編程隱含著巨大的掘金市場,各家的競爭也日趨白熱化。

不過,Code Assist能做到什么程度,目前還不清楚。研究表明,即使是今天最好的代碼生成AI,也往往會引入安全漏洞和錯誤,這是由于編程邏輯理解能力的弱點。

比如對Devin的一項評估就發(fā)現(xiàn),它只完成了20項任務中的3項。

接下來,就讓我們期待Gemini Code Assist在實際編程環(huán)境中的表現(xiàn)了。

參考資料:

https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/

https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai

原標題:《谷歌最強AI芯片狙擊英偉達B200,性能狂飆3600倍!谷歌版MCP一統(tǒng)AI智能體宇宙》

閱讀原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    0
    收藏
    我要举报
    评论(0)
    发表
    已经到底了
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2025 上海东方报业有限公司

            反馈
            百家乐的桌子| 圣保罗百家乐的玩法技巧和规则 | 大发888老虎机下载| 百家乐官网庄闲出现几率| 大发888在线充值| 24山坐向| 太阳城百家乐官网怎么出千| 大发888娱乐城888| 金沙城百家乐大赛规则| 网络百家乐官网现金游戏哪里的信誉好啊| 足球赌球网| 大发888国际娱乐net| 金域百家乐的玩法技巧和规则| 百家乐上分器定位器| 百家乐官网连锁| 八大胜国际娱乐| 威尼斯人娱乐网代理注| 赌场百家乐规则| 百家乐官网必胜方法如果你还想继续不看可能后悔一生 | 大发娱乐场官网| 巴比伦百家乐的玩法技巧和规则| 澳门百家乐官网有限公司| 宝都棋牌游戏| 百家乐赚钱方| 澳门百家乐职业赌客| 百家乐官网天下| 百家乐官网博彩金| 修水县| 百家乐筹码片| 百家乐斗视频游戏| 百家乐公式分析| 女神百家乐官网的玩法技巧和规则 | 全讯网高手论坛| 威尼斯人娱乐城导航网| 百家乐桌小| 赌百家乐波音备用网| 百家乐单机游戏免费| 做生意门口禁忌| 百家乐必胜绝技| 百家乐有没有绝| 华盛顿百家乐官网的玩法技巧和规则 |