下載客戶端

登錄

黃仁勛Keynote：我們需要更大的GPU……一個非常非常大的GPU！

2024-03-19 17:37

來源：澎湃新聞·澎湃號·湃客

原創蘇霍伊趙健甲子光年

老黃喊出了那句話——“God I love Nvidia.”

作者｜蘇霍伊趙健

編輯｜甲小姐

發自美國圣何塞（San Jose）GTC現場

在暖場環節，一段命名為“活的藝術（Living Art）”的視頻讓全場鴉雀無聲，在AI生成的實時數據雕塑面前，整個硅谷都在屏息以待，直到穿著皮夾克的英偉達創始人&CEO黃仁勛走上Keynote的舞臺。

時隔5年，在硅谷的心臟地帶圣何塞（San Jose），英偉達的盛會GTC（GPU Technology Conference）終于回歸了線下。2020—2023年的GTC都是線上形式，此次回歸線下，東道主英偉達的地位和2019年時已不可同日而語。

原本是最擅長digital（數字）的盛會，卻吸引了大量真實參會者遠道而來。大約有22000人線下參會，他們是AI創業者、開發者、大廠從業者、科學家、投資人，也是英偉達的客戶、合作伙伴或股票持有者。據說，僅中國客戶就有超過800名飛來參會，圣何塞的酒店價格一時飚至平時的4—5倍。

GTC2024將在3月18—21日期間提供超過900場會議，其重要性似乎已超過蘋果、微軟、谷歌的開發者大會和產品發布活動，成為公認的“AI風向標”。這場“AI的伍德斯托克”，正在構建著最絢爛的集體想象：

越來越多人相信，這個世界已經跨過了由AI定義的臨界點(tipping point)——所有人湊在這里尋找任何可能的未來脈絡，借此判斷通用人工智能的走向。

每次GTC，黃仁勛的Keynote都是點睛之筆。這一次，人們在圣何塞的大太陽下站了兩個半小時，隊伍排出了 1 公里。

2023年的GTC，黃仁勛說出了那句“The iPhone moment of AI has started（AI的iPhone 時刻已經到來）”。

2024年的GTC，黃仁勛繼續說出一系列讓世界振聾發聵的句子，比如“The future is generative（未來是生成的）”。

這一次GTC黃仁勛主要發布了5個點：

第一，再一次強調，生成式AI是一次新的產業革命；

第二，發布地表最強GPU Blackwell B200，以及GB200組合芯片；

第三，發布新的軟件產品NIM；

第四，發布定制模型開發軟件Nemo，以及AI工廠；

第五，發布數字孿生產品Omniverse Cloud以及機器人平臺Isaac。

英偉達被推到今天的歷史地位，是因為英偉達的迭代速度，某種程度上決定了整個AI技術的發展和AI應用的爆發速度。

自2012年前后研究者發現GPU更適合AI研究后，英偉達逐漸成為最大的贏家。如今，英偉達幾乎支撐了整個AI領域的研發。根據富國銀行統計，英偉達目前在數據中心AI市場擁有98%的市場份額，而AMD僅有1.2%的市場份額，英特爾則只有不到1%。英偉達的業績就如同一面鏡子，實時映照外界對AI行業發展的信心。而2024年初至今，一季度還沒過完，英偉達股價就漲了80%。

整整兩小時的演講，黃仁勛用簡潔明了的語言描繪出了一個每個人都能參與的科技“伊甸園”，風采似乎超過了當年聚光燈下的喬布斯。作為英偉達的絕對“靈魂”，公司員工們喜歡親切地稱他為Jensen或老黃。

“這個公司沒有老黃就完蛋了，”英偉達的一位中國高管對「甲子光年」說，“老黃很真誠、很直接、很善良，也很嚴格?！?/p>

所有目光都集中在舞臺上，人們需要一個人物、一場事件、一個符號，來完成這場對當下和未來的想象力宣泄——而老黃無疑就是那個符號。

正如會場入口大標語寫著的老黃語錄：GTC的存在，是為了激發這個世界的藝術——一種名為可能性的藝術（GTC exists to inspire the world on the art-of-the-possible）。

以下是老黃keynote的重點內容，由「甲子光年」在GTC現場整理。

1.老黃的“加速計算”新產業

黃仁勛一開場先做了英偉達的歷史回顧與產業科普，試圖論證生成式AI是一次新的生產力革命。

他提到了英偉達發展史上的幾個里程碑事件，比如1993年英偉達成立，2006年研發CUDA，以及2012年的AlexNet構成的人與AI的“第一次接觸（first contact）”。

黃仁勛又提起了去年在GTC上提到的往事。2016年，黃仁勛將首臺超級計算機DGX-1（8個GPU首次連接在一起）交付給了位于舊金山的一家初創公司——OpenAI。此后，命運的齒輪開始轉動。2017年，Transformer發布。2022年，ChatGPT捕捉了世界的想象，讓人們意識到人工智能的重要性和能力。

“A new industry has emerged（一個新的產業出現了）.”黃仁勛說。

黃仁勛表示英偉達的部分合作伙伴加入了英偉達“將世界帶入加速計算”的“旅程”，如Synopsis、Cadence和ANSYS等。同時英偉達宣布了晶圓廠TSMC和EDA解決方案供應商Synopsys將在生產中使用英偉達的計算光刻平臺。

黃仁勛舉了一個例子來解釋人工智能如何幫助EDA廠商設計芯片。

“我們正加速發展CAE、EDA和SDA領域，通過數字孿生構建未來?！彼谘葜v中提到，“這些技術將整合進Omniverse，成為數字孿生的核心平臺?！?/p>

2.地表最強GPU Blackwell B200發布

“We need Bigger GPUs…A very very big GPU!（我們需要更大的GPU……一個非常非常大的GPU?。秉S仁勛說。

然后他推出了最新的Blackwell B200 GPU，并稱其為“世界上最強大的人工智能芯片”。

“Blackwell”是以美國統計學家和數學家David Blackwell命名的。他從事博弈論、概率論和信息論等研究，撰寫了第一本有關貝葉斯統計的教科書。

新的B200 GPU有2080億個晶體管，提供高達20 petaflops的FP4算力。將其中兩個GPU與單個Grace CPU相結合的GB200，可以為LLM推理工作負載提供30倍的性能，同時還可以大幅提升效率。黃仁勛表示，與H100相比，它“可將成本和能耗降低多達25倍”。

黃仁勛表示，訓練一個1.8萬億參數的大模型，之前需要8000個Hopper GPU和15兆瓦的功率。如今，2000個Blackwell GPU就可以做到這一點，而功耗僅為4兆瓦。

在具有1750億個參數的GPT-3 LLM基準測試中，GB200的性能是H100的7倍，訓練速度是H100的4倍。

GB200由兩個 GPU、一個 CPU、一塊主板構成

B200的其中一個關鍵改進是第二代Transformer引擎。它通過為每個神經元使用4位而不是8位，使計算、帶寬和模型大小加倍。當連接大量此類GPU時，會出現第二個關鍵區別：下一代NVLink交換機可讓576個GPU相互通信，具有每秒1.8TB的雙向帶寬。

黃仁勛表示，這需要英偉達打造一款全新的網絡交換芯片，該芯片擁有500億個晶體管和一些自己的板載計算能力：3.6teraflops的FP8。

GH200服務器以及數據中心是一個龐然大物。GB200 NVL72將36個CPU和72個GPU插入一個液冷機架中，AI訓練性能達到720 petaflops，AI推理性能達到1440petaflops（又名1.4exaflops）。它內部有近兩英里長的電纜，共有5000根單獨的電纜。

GB200 NVL72

機架中的每個托盤包含兩個GB200芯片或兩個NVLink交換機，每個機架有18個GB200 芯片和9個NVLink交換機。其中一個機架總共可以支持27萬億個參數模型。據傳GPT-4大約有1.7萬億參數模型。

GB200不缺客戶。黃仁勛表示，亞馬遜、谷歌、微軟和甲骨文都已經計劃在其云服務產品中提供NVL72機架。

英偉達也可以提供更多的解決方案。這是適用于DGX GB200的 DGX Superpod，它將八個系統合二為一，總共288個CPU、576 個GPU、240TB內存和11.5 exaflops的FP4計算。

黃仁勛表示，其系統可以擴展到數萬個GB200超級芯片，并通過新的Quantum-X800 InfiniBand（最多144個連接）或Spectrum-X800以太網（最多64個連接）與800Gbps網絡連接在一起。

3.AI行業的“臺積電”

如果將英偉達定義成硬件公司或GPU公司，是對英偉達最大的誤解。實際上，英偉達很早就開始轉型為一家軟硬件一體的公司，而且其軟件產品在不斷增強。

在去年GTC上，英偉達推出了DGX-Cloud、NVIDIA AI Enterprise 5.0等一系列軟件產品。就像臺積電為芯片行業制造芯片，英偉達最新的定位，是成為AI行業的臺積電。

今天，英偉達又推出了一系列軟件產品——數十種企業級生成式AI微服務，企業可以使用這些服務在自己的平臺上創建和部署自定義應用程序，同時保留對其知識產權的完全所有權和控制權。

這些云原生的微服務構建于NVIDIA CUDA平臺之上，其中NVIDIA NIM是今天最新發布的產品，可對來自英偉達及其合作伙伴生態系統的20多個主流的AI模型進行優化推理。

NIM微服務提供由英偉達推理軟件（包括Triton Inference Server和TensorRT-LLM）驅動的預構建容器，使開發者能夠將部署時間從周縮短至分鐘。

它們為語言、語音和藥物發現等領域提供行業標準API，使開發者能夠使用其托管在自身安全基礎設施中的專有數據快速構建AI應用程序。這些應用程序可以根據需求進行擴展，為在英偉達加速計算平臺上生產運行生成性AI提供靈活性和性能。

此外，英偉達加速的軟件開發工具包、庫和工具現在可以作為NVIDIA CUDA-X微服務訪問，用于檢索增強生成（RAG）、防護欄、數據處理、高性能計算（HPC）等。

英偉達還單獨宣布了二十多個醫療保健NIM和CUDA-X微服務。

這些精心挑選的微服務為英偉達的全棧計算平臺增加了一個新層次。這個層次將模型開發者、平臺提供商和企業的AI生態系統連接起來，提供了一個標準化的路徑來運行為NVIDIA CUDA安裝基礎的數億GPU優化的定制AI模型，這些GPU分布在云、數據中心、工作站和PC上。

在NVIDIA AI Enterprise 5.0中首批使用新的生成性AI微服務的包括領先的應用、數據和網絡安全平臺提供商，如Adobe、Cadence、CrowdStrike、Getty Images、SAP、ServiceNow和Shutterstock。

“成熟的企業平臺坐擁一座數據金礦，這些數據可以轉化為生成性AI副駕駛，”黃仁勛表示，“這些容器化的AI微服務是我們與合作伙伴生態系統共同創造的，它們是各行各業企業成為AI公司的構建模塊?！?/p>

英偉達即將推出的其他NVIDIA NeMo微服務用于定制模型開發。

這些包括用于構建干凈數據集進行訓練和檢索的NVIDIA NeMo Curator，用于使用特定領域數據微調LLM的NVIDIA NeMo Customizer，用于分析AI模型性能的NVIDIA NeMo Evaluator，以及用于LLM的NVIDIA NeMo Guardrails。

Box、Cloudera、Cohesity、Datastax、Dropbox和NetApp在內的頂級數據平臺提供商正在與NVIDIA微服務合作，幫助客戶優化他們的RAG管道，并將他們的專有數據集成到生成性AI應用程序中。Snowflake利用NeMo Retriever利用企業數據構建AI應用程序。

英偉達微服務還支持超過400個英偉達認證系統，包括來自Cisco、Dell Technologies、Hewlett Packard Enterprise（HPE）、HP、Lenovo和Supermicro的服務器和工作站。此外，HPE今日宣布了HPE的企業計算解決方案用于生成性AI，計劃將NIM和英偉達AI基礎模型集成到HPE的AI軟件中。

英偉達的數百個AI和MLOps合作伙伴生態系統，包括Abridge、Anyscale、Dataiku、DataRobot、Glean、H2O.ai、Securiti AI、Scale.ai、OctoAI和Weights & Biases，正在通過NVIDIA AI Enterprise為英偉達微服務添加支持。

Apache Lucene、Datastax、Faiss、Kinetica、Milvus、Redis和Weaviate是與NVIDIA NeMo Retriever微服務合作的向量搜索提供商，為企業提供響應靈敏的RAG能力。

4.AI進入物理世界

英偉達的壓軸產品發布，是AI在物理世界的落地，英偉達將數字孿生與實時AI相結合，以實現工業自動化。

黃仁勛展示了開發人員如何使用數字孿生完全在模擬中開發、測試和完善其大規模實時人工智能，然后再將其推廣到工業基礎設施中，從而節省大量時間和成本。

NVIDIA Omniverse、Metropolis、Isaac和cuOpt在AI產線中相互作用，開發者可以在這里訓練AI代理，幫助機器人和人類導航不可預測或復雜的事件。

英偉達帶來了兩項重要產品：數字孿生云Omniverse Cloud以及機器人平臺Isaac。

英偉達Omniverse是一個由API、服務和軟件開發工具包（SDK）組成的平臺，支持開發人員為工業數字化構建生成式AI支持的工具、應用和服務。

英偉達Omniverse Cloud API是一組簡單的API，允許開發人員將Omniverse技術直接集成到其現有的數字孿生軟件應用程序中，或集成到其用于測試和驗證機器人或自動駕駛車輛等自動機器的模擬工作流中。這并不與去年Omniverse宣布的云平臺即服務（PaaS）相混淆，PaaS是一種用于開發和部署基于Omniverse Kit的應用程序的完全托管服務。

黃仁勛表示：“制造的所有產品都將擁有數字孿生。Omniverse是用于構建和操作物理上真實的數字孿生的操作系統。Omniverse和生成式AI是實現50萬億美元重工業市場數字化的基礎技術?！?/p>

目前，Ansys、Cadence、Hexagon、微軟、羅克韋爾自動化、西門子、Trimble都在采用Omniverse技術來幫助客戶設計、模擬、構建和操作基于物理的數字孿生。

而且，黃仁勛還宣布，Omniverse Cloud今天可以連接到蘋果公司的Vision Pro。

英偉達帶來了第二款AI進入物理世界的產品是機器人平臺Isaac。

NVIDIA Isaac機器人平臺正在利用最新的生成式AI和先進的模擬技術來加速AI機器人技術。

在今天的GTC上，英偉達發布了Isaac Manipulator和Isaac Perceptor——一系列基礎模型、機器人工具和GPU加速庫。

在臺上，黃仁勛在超過10000名觀眾面前演示了GR00T項目，該項目代表Generalist Robot 00 Technology，這是一種用于人形機器人學習的通用基礎模型。GR00T項目利用NVIDIA Isaac機器人平臺的各種工具為人形機器人創建AI。