下載客戶端

登錄

被掃地出門18個月后，馬斯克終復仇OpenAI

2025-02-19 13:45

來源：澎湃新聞·澎湃號·湃客

Grok3登頂地球最聰明大模型

作者丨鯨哥

2月18日，馬斯克發布完Grok 3大模型后，轉發了一條推特：

劃重點，Grok3目前世界第一強模型（競技場得分1400），比OpenAI的推理模型還厲害，18個月就超越了山姆·奧特曼領導下的OpenAI。

要知道馬斯克曾是OpenAI的天使投資人，甚至Open這個關鍵詞就是馬斯克幫取名的。變化發生在2018年，奧特曼與馬斯克在“開源還是閉源”的問題上徹底決裂。馬斯克堅信，人工智能必須透明開放以規避風險；而奧特曼則在資本壓力下選擇與微軟結盟，將技術封閉于商業護城河內。

此前大家都相安無事，因為當時ChatGPT還沒那么厲害。就在2022年末，ChatGPT4橫空出世后，馬斯克對于被踢出了這么一個跨時代項目，就開始碎碎念了。應了那句話：『不怕分手，就怕前任過得好?！?/p>

這段往事在2024年再度被點燃。馬斯克以“違背公益初衷”為由，對OpenAI發起訴訟，指控其將技術壟斷權拱手讓給微軟。這場官司雖未勝訴，卻為馬斯克埋下了一顆復仇的種子——2023年7月，馬斯克成立xAI實驗室，開始發布Grok系列模型，對標OpenAI的GPT系列模型。

大力出奇跡，18個月追上OpenAI

在Grok3發布會上，開場xAI介紹了他們的決心：

『122天，建成了10萬顯卡集群，再過了92天后，建成了20萬張 H100 顯卡集群?！贿@是世界上最大的H100算力集群。

很多朋友不懂這個數據的意義，這意味著Grok3訓練算力超過了DeepSeek V3的263倍，卻只帶來超過DeepSeek 33%的Benchmark能力。

Scaling Law是否失效暫且不提，就說這大手筆投入算力基礎設施，也算是體現了馬斯克追趕的決心。

短短2年內，xAI接連推出Grok系列模型：從參數量為3140億的Grok-1，到支持多模態的Grok-1.5 Vision，追趕ChatGPT 4o的Grok 2，以及今天登頂的Grok 3，Grok每一步都試圖用“暴力開源”策略撕裂OpenAI的閉源壁壘。

重要時間節點是在2024年底。xAI在田納西州孟菲斯建成了一座堪比“算力核電站”的數據中心，10萬塊英偉達H100 GPU組成的集群，讓Grok 3的訓練速度比前代提升十倍。馬斯克在推特上寫道：“算力即權力，而我們將擁有最暴力的武器。”

此后馬斯克宣布融資60億美元，繼續投資Grok大模型的訓練。這筆錢比國內大模型六小虎的融資總額還多。

在xAI成立的18個月（不到2年時間）后，Grok 3正式發布，成功登頂最強大模型。

Grok 3的“量子躍升”，有何殺手锏？

2025年2月18日，全球百萬觀眾涌入直播平臺，見證馬斯克的最新大模型，此前他在中東的AI大會上，宣布將發布全球最聰明的大模型Grok 3。現在看來Grok 3名副其實，具有諸多強悍能力。

技術核爆點一：最聰明的模型

基準測試數據顯示，Grok 3達到了1400的Elo得分，這是其他任何模型都未曾達到的。

Grok 3在AIME 2025科學推理測試中得分超過Gemini 2 Pro和GPT-4o，其迷你版模型甚至在編程任務中擊敗了DeepSeek-R1。

可能大家已經被大模型刷榜測試的傳聞，搞得不太相信這些數據的真實性。國外有拿到Grok 3測試的大神，測試了超過人類和一些大模型理解的《卡坦島》問題：。

“創建一個顯示六邊形網格的棋盤游戲網頁，就像游戲中的 Settlers of Catan 一樣。每個六邊形網格的編號從 1 到 N，其中 N 是六邊形瓷磚的總數。使其通用，以便可以使用滑塊更改“環”的數量。例如，在 Catan 中半徑為 3 個六邊形。請使用單個 html 頁面?！?/p>

他評價很少有模型能夠可靠地做到這一點。頂級的 OpenAI 思維模型（例如 o1-pro，每月 200 美元）也能做到這一點，但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都沒有做到這一點。

甚至數學歷史上著名的未接知名『黎曼猜想』，Grok 3也會嘗試去算，不像O1-Pro、Claude等模型直接回答做不了，放棄了。

技術核爆點二：動態反思機制

Grok 3引入“思維鏈”推理技術，能像人類一樣拆解復雜任務并實時修正邏輯斷層?，F場演示中，Grok 3僅用30秒便生成了一份從地球到火星的航天器軌跡圖，并標注出引力彈弓效應的最佳利用節點。

『你能看到Grok真的在做一些模糊思考，這樣模型就不會被立即完全復制。』

圖中可以看到，在數學測試中，Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分，超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。

同樣在科學和編程兩項中，Grok3兩款模型也存在一定程度上的領先。

技術核爆點三：更多呈現模式

Grok 3不僅能解鎖測試時間計算，還能啟用強大的代理。這些能力促成了一款名為DeepSearch的新產品。“下一代搜索代理，用于理解宇宙”。DeepSearch還會展示它進行搜索時所采取的步驟。

不僅如此，Elon強調了Grok 3的創意涌現能力。在這個和DeepSeek十分相似的頁面上，Grok新增了第三個標簽按鈕『Big Brain』。使用“大腦模式”，通過更多計算資源和推理來使用Grok 3，也許會呈現意想不到的效果。

未來Grok 3應該不太限制大模型的創作風格，以及思考創意的邊界。相比之下，OpenAI則是解除了ChatGPT的成人內容限制，這就。。。。。

口水戰打不完，奧特曼的反擊

面對Grok 3的突襲，OpenAI并非毫無動作。

發布會前天，山姆·奧特曼在X平臺宣稱：“GPT-4.5將帶來AGI的初體驗?！鳖A計GPT-4.5也會在一兩周內發布，屆時拿出滿血的O3，應該能奪回全球最佳模型的寶座。

此前，一個由馬斯克牽頭的財團擬出價 974 億美元收購 OpenAI，后者的首席執行官薩姆?阿爾特曼對此回應稱，" 不用了，謝謝，但如果你愿意，我們可以以 97.4 億美元的價格收購推特（即如今的 X）" 后。

商業競爭互相都不手軟，口水戰也打個不停。

未來兩家公司還存在路線競爭。與OpenAI的閉源策略針鋒相對，Grok 3承諾未來“開源”，Grok 2將在一個月內開源，并計劃接入特斯拉車載系統和Optimus人形機器人。

同時，xAI同步推出了“Super Grok”訂閱服務，以每月49美元的價格向開發者開放深度搜索（DeepSearch）功能——這種能交叉驗證信息來源、公開推理路徑的引擎，直指ChatGPT的“黑箱”痛點。

更深層的沖擊來自生態層面。Grok 3的開源策略吸引了大量開發者涌入，而特斯拉的硬件布局（如Model Q車載系統）則為AI落地提供了現實場景。

2025年，AI領域的權力天平正在傾斜。Grok 3的顛覆性不僅在于技術，更在于它重新點燃了“開源理想主義”的火種。正如一位硅谷投資人所言：“馬斯克用Grok 3完成了一場遲到的復仇，但這場戰爭的真正贏家，或許是那些終于看見技術透明曙光的人們?！?/p>

山姆·奧特曼會拿出怎樣的競爭手段回擊呢？

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#馬斯克 #Grok #OpenAI大模型

掃碼下載澎湃新聞客戶端

澎湃矩陣

澎湃新聞微博
澎湃新聞公眾號
澎湃新聞抖音號
IP SHANGHAI
SIXTH TONE

新聞報料

報料熱線: 021-962866
報料郵箱: news@thepaper.cn

滬ICP備14003370號

滬公網安備31010602000299號

互聯網新聞信息服務許可證：31120170006

增值電信業務經營許可證：滬B2-2017116

? 2014-2025 上海東方報業有限公司

反饋

长兴郴障科技有限公司

被掃地出門18個月后，馬斯克終復仇OpenAI

掃碼下載澎湃新聞客戶端

被掃地出門18個月后，馬斯克終復仇OpenAI