长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

被掃地出門18個月后,馬斯克終復仇OpenAI

2025-02-19 13:45
來源:澎湃新聞·澎湃號·湃客
字號

Grok3登頂地球最聰明大模型

作者丨鯨哥

2月18日,馬斯克發布完Grok 3大模型后,轉發了一條推特:

劃重點,Grok3目前世界第一強模型(競技場得分1400),比OpenAI的推理模型還厲害,18個月就超越了山姆·奧特曼領導下的OpenAI。

要知道馬斯克曾是OpenAI的天使投資人,甚至Open這個關鍵詞就是馬斯克幫取名的。變化發生在2018年,奧特曼與馬斯克在“開源還是閉源”的問題上徹底決裂。馬斯克堅信,人工智能必須透明開放以規避風險;而奧特曼則在資本壓力下選擇與微軟結盟,將技術封閉于商業護城河內。

此前大家都相安無事,因為當時ChatGPT還沒那么厲害。就在2022年末,ChatGPT4橫空出世后,馬斯克對于被踢出了這么一個跨時代項目,就開始碎碎念了。應了那句話:『不怕分手,就怕前任過得好?!?/p>

這段往事在2024年再度被點燃。馬斯克以“違背公益初衷”為由,對OpenAI發起訴訟,指控其將技術壟斷權拱手讓給微軟。這場官司雖未勝訴,卻為馬斯克埋下了一顆復仇的種子——2023年7月,馬斯克成立xAI實驗室,開始發布Grok系列模型,對標OpenAI的GPT系列模型。

大力出奇跡,18個月追上OpenAI

在Grok3發布會上,開場xAI介紹了他們的決心:

『122天,建成了10萬顯卡集群,再過了92天后,建成了20萬張 H100 顯卡集群?!贿@是世界上最大的H100算力集群。

很多朋友不懂這個數據的意義,這意味著Grok3訓練算力超過了DeepSeek V3的263倍,卻只帶來超過DeepSeek 33%的Benchmark能力。

Scaling Law是否失效暫且不提,就說這大手筆投入算力基礎設施,也算是體現了馬斯克追趕的決心。

短短2年內,xAI接連推出Grok系列模型:從參數量為3140億的Grok-1,到支持多模態的Grok-1.5 Vision,追趕ChatGPT 4o的Grok 2,以及今天登頂的Grok 3,Grok每一步都試圖用“暴力開源”策略撕裂OpenAI的閉源壁壘。

重要時間節點是在2024年底。xAI在田納西州孟菲斯建成了一座堪比“算力核電站”的數據中心,10萬塊英偉達H100 GPU組成的集群,讓Grok 3的訓練速度比前代提升十倍。馬斯克在推特上寫道:“算力即權力,而我們將擁有最暴力的武器。”

此后馬斯克宣布融資60億美元,繼續投資Grok大模型的訓練。這筆錢比國內大模型六小虎的融資總額還多。

在xAI成立的18個月(不到2年時間)后,Grok 3正式發布,成功登頂最強大模型。

Grok 3的“量子躍升”,有何殺手锏?

2025年2月18日,全球百萬觀眾涌入直播平臺,見證馬斯克的最新大模型,此前他在中東的AI大會上,宣布將發布全球最聰明的大模型Grok 3。現在看來Grok 3名副其實,具有諸多強悍能力。

技術核爆點一:最聰明的模型

基準測試數據顯示,Grok 3達到了1400的Elo得分,這是其他任何模型都未曾達到的。

Grok 3在AIME 2025科學推理測試中得分超過Gemini 2 Pro和GPT-4o,其迷你版模型甚至在編程任務中擊敗了DeepSeek-R1。

可能大家已經被大模型刷榜測試的傳聞,搞得不太相信這些數據的真實性。國外有拿到Grok 3測試的大神,測試了超過人類和一些大模型理解的《卡坦島》問題:。

“創建一個顯示六邊形網格的棋盤游戲網頁,就像游戲中的 Settlers of Catan 一樣。每個六邊形網格的編號從 1 到 N,其中 N 是六邊形瓷磚的總數。使其通用,以便可以使用滑塊更改“環”的數量。例如,在 Catan 中半徑為 3 個六邊形。請使用單個 html 頁面?!?/p>

他評價很少有模型能夠可靠地做到這一點。頂級的 OpenAI 思維模型(例如 o1-pro,每月 200 美元)也能做到這一點,但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都沒有做到這一點。

甚至數學歷史上著名的未接知名『黎曼猜想』,Grok 3也會嘗試去算,不像O1-Pro、Claude等模型直接回答做不了,放棄了。

技術核爆點二:動態反思機制

Grok 3引入“思維鏈”推理技術,能像人類一樣拆解復雜任務并實時修正邏輯斷層?,F場演示中,Grok 3僅用30秒便生成了一份從地球到火星的航天器軌跡圖,并標注出引力彈弓效應的最佳利用節點。

『你能看到Grok真的在做一些模糊思考,這樣模型就不會被立即完全復制。』

圖中可以看到,在數學測試中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分,超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。

同樣在科學和編程兩項中,Grok3兩款模型也存在一定程度上的領先。

技術核爆點三:更多呈現模式

Grok 3不僅能解鎖測試時間計算,還能啟用強大的代理。這些能力促成了一款名為DeepSearch的新產品。“下一代搜索代理,用于理解宇宙”。DeepSearch還會展示它進行搜索時所采取的步驟。

不僅如此,Elon強調了Grok 3的創意涌現能力。在這個和DeepSeek十分相似的頁面上,Grok新增了第三個標簽按鈕『Big Brain』。使用“大腦模式”,通過更多計算資源和推理來使用Grok 3,也許會呈現意想不到的效果。

未來Grok 3應該不太限制大模型的創作風格,以及思考創意的邊界。相比之下,OpenAI則是解除了ChatGPT的成人內容限制,這就。。。。。

口水戰打不完,奧特曼的反擊

面對Grok 3的突襲,OpenAI并非毫無動作。

發布會前天,山姆·奧特曼在X平臺宣稱:“GPT-4.5將帶來AGI的初體驗?!鳖A計GPT-4.5也會在一兩周內發布,屆時拿出滿血的O3,應該能奪回全球最佳模型的寶座。

此前,一個由馬斯克牽頭的財團擬出價 974 億美元收購 OpenAI,后者的首席執行官薩姆?阿爾特曼對此回應稱," 不用了,謝謝,但如果你愿意,我們可以以 97.4 億美元的價格收購推特(即如今的 X)" 后。

商業競爭互相都不手軟,口水戰也打個不停。

未來兩家公司還存在路線競爭。與OpenAI的閉源策略針鋒相對,Grok 3承諾未來“開源”,Grok 2將在一個月內開源,并計劃接入特斯拉車載系統和Optimus人形機器人。

同時,xAI同步推出了“Super Grok”訂閱服務,以每月49美元的價格向開發者開放深度搜索(DeepSearch)功能——這種能交叉驗證信息來源、公開推理路徑的引擎,直指ChatGPT的“黑箱”痛點。

更深層的沖擊來自生態層面。Grok 3的開源策略吸引了大量開發者涌入,而特斯拉的硬件布局(如Model Q車載系統)則為AI落地提供了現實場景。

2025年,AI領域的權力天平正在傾斜。Grok 3的顛覆性不僅在于技術,更在于它重新點燃了“開源理想主義”的火種。正如一位硅谷投資人所言:“馬斯克用Grok 3完成了一場遲到的復仇,但這場戰爭的真正贏家,或許是那些終于看見技術透明曙光的人們?!?/p>

山姆·奧特曼會拿出怎樣的競爭手段回擊呢?

    本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            在线百家乐官网博彩网| 百家乐官网真人娱乐场开户注册| 威尼斯人娱乐城网络百家乐| 泰来百家乐官网导航| 百家乐澳门路规则| 百家乐官网平台导航| 皇冠娱乐场| 百家乐官网园太阳| 大发888 无法进入网页| 百家乐官网玩法规| 皇冠投注平台| 澳门百家乐赌钱| 在线百家乐官网电脑| 浏阳市| MG百家乐大转轮| 新东方百家乐官网娱乐城| 百家乐官网最佳下注方法| 斗地主百家乐的玩法技巧和规则 | 十六浦娱乐城官网| 网络百家乐游戏机怎么破解| 岗巴县| 神州百家乐的玩法技巧和规则| 百家乐博彩策略论坛| 免费百家乐官网统计软件| 垦利县| 太阳城真人娱乐城| 博E百百家乐娱乐城| 百家乐官网是真的吗| 百家乐推荐| 百家乐龙虎台布作弊技巧| 百家乐官网任你博娱乐场| 英吉沙县| 大发888论坛| 百家乐视频游戏注册| 百家乐官网平注法到| 百家乐官网发脾机| 静宁县| 乐天堂| 百家乐官网概率怎么算| 百家乐官网视频游戏界面| 上海玩百家乐官网算不算违法|