- +1
又慢又貴?OpenAI推理模型“草莓”來了,GPT-5還有多遠
OpenAI的“草莓”終于來了。
當地時間9月12日,人工智能(AI)巨頭OpenAI發布代號“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。
據OpenAI介紹, o1會花更多時間思考問題,然后再做出反應,就像人一樣。通過訓練學會了完善自己的思考過程,嘗試不同的策略,并認識到自己的錯誤。與以前的科學、編碼和數學模型相比,可以推理復雜的任務,解決更難的問題。

OpenAI表示,該系列模型對于復雜的推理任務來說是一個重大進步,因此也將產品計數器重置為1,并命名為OpenAI o1。該名稱中的“o”或指代Orion(獵戶座)。
推理能力更強,思維鏈提供模型安全新機會
“草莓”項目此前名為“Q*”,也正是引發OpenAI“宮斗”并導致公司CEO山姆·奧特曼(Sam Altman)曾被突然解職的原因。彼時,據消息人士稱,OpenAI首席技術官米拉·穆拉蒂(Mira Murati)曾告訴員工,一封關于Q*(發音為 Q-Star)AI取得突破的信件促使董事會采取了解雇行動。
OpenAI在Q*上取得的進展,讓部分公司內部人士相信,這可能是他們找到“超級智能(即AGI,通用人工智能)”的突破。
根據官方給出的信息,o1多項能力遠超GPT-4o。在編程競賽題(Codeforces)中排名第89位,在美國數學奧林匹克預選賽(AIME)中躋身全美前500 名學生行列,在物理、生物和化學問題(GPQA)基準測試中的準確率也超過了人類博士生水平。
據介紹,類似于人類在回答一個難題前可能會思考很長時間,o1在嘗試解決問題時也會使用一連串的思考。通過強化學習,o1可以學會磨練自己的思維鏈,完善自己使用的策略。它學會識別和糾正錯誤、把棘手的步驟分解成更簡單的步驟、在當前方法無效時嘗試不同的方法。
OpenAI表示,使用思維鏈能顯著提高安全性和一致性,因為能夠以清晰的方式觀察模型的思維,且模型對安全規則的推理對分布外場景也更加穩健。
商湯科技董事會執行主席兼CEO徐立此前曾表示,未來決定一個模型聰不聰明,完全在于構造模型思維鏈數據的方法論是否足夠強,并且這一足夠強的方法論能夠可持續并且迭代。

OpenAI o1的原始完整思維鏈部分截圖
不過,OpenAI最終選擇不向用戶展示原始思維鏈,而是展示思維鏈摘要。OpenAI進一步解釋稱:“隱藏的思維鏈為監測模型提供了一個獨特的機會。假設模型是忠實可讀的,那么隱藏的思維鏈就能讓我們‘讀懂’模型的思想,了解它的思維過程。例如,將來可能希望監控思維鏈,以發現操縱用戶的跡象。但是,要做到這一點,模型必須能夠以不改變的形式自由表達自己的想法,因此我們不能在思維鏈上訓練任何政策遵從或用戶偏好。我們也不想讓用戶直接看到不一致的思維鏈。”
目前,ChatGPT的Plus和團隊用戶可以使用o1兩款模型,企業和教育用戶將從下周開始可以使用。
更慢卻更貴,并非GPT-4o“繼任者”
目前,o1-preview的每周消息限制為30條,o1-mini為50條。OpenAI稱正在努力提高消息上限,并讓ChatGPT能夠根據給定的提示自動選擇合適的模式,也將訪問權限擴展到更多層次的用戶,計劃為所有免費用戶提供o1-mini的訪問權限。
而在API( 應用程序編程接口)端,o1-preview每100萬輸入tokens(大模型將文本分解成單詞、字符集或單詞和標點符號的組合)收費15美元,每100萬輸出tokens收費60美元。與GPT-4o 相比,輸入成本是其3倍,輸出成本是其4倍。
o1-mini則定位速度更快、成本效益更高,據稱在數學和編程方面的表現也較為出色,在AIME和Codeforces等評估基準上幾乎與o1性能相當,可作為o1-preview的替代方案,具有更高的速率限制和更低的延遲,API用戶使用o1-mini的價格比o1-preview便宜80%。
其他弊端也顯而易見,OpenAI o1的速度比其他模型更慢。據外媒報道,o1回答某些問題可能需要10多秒鐘,該模型會選擇通過顯示當前正在執行的子任務的標簽來顯示進度。
同時,鑒于生成式人工智能模型的不可預測性,o1可能還有其他缺陷和局限。例如有時會在井字游戲中出錯。在一篇技術論文中,OpenAI表示一些測試人員傳言稱o1比GPT-4o 更容易產生幻覺,當它不知道問題的答案時,也不太愿意承認。
此外,o1目前也無法瀏覽網頁或分析文件。
奧特曼坦言,o1是OpenAI目前能力最強、最對齊的一系列模型,不過仍有缺陷。
OpenAI總裁格雷戈里·布羅克曼(Greg Brockman)也表示,目前o1技術仍處于早期階段,OpenAI正積極探索,包括可靠性、幻覺和對抗攻擊者的魯棒性(穩定性)。
OpenAI表示,作為一個早期模型,OpenAI o1還不具備使ChatGPT變得有用的許多功能,如瀏覽網絡信息、上傳文件和圖片等。對于許多常見情況,GPT-4o 在短期內會有更強的能力。后續會進行定期更新和改進,“讓這個新模型與當前模型一樣易于使用的工作仍在進行中”。
OpenAI強調,OpenAI o1并不是GPT-4o的“繼任者”,可以將4o與o1的推理功能結合使用,在o1系列之后還計劃繼續開發和發布GPT系列模型。

OpenAI o1與GPT-4o多項基準測試對比
值得一提的是,此前據外媒報道,OpenAI或正考慮給“草莓”大模型或下一代旗艦模型制定更高的收費標準,最高或將達到每月2000美元。作為對比的是,目前ChatGPT Plus的收費標準是每月20美元。
動蕩不安的OpenAI,GPT-5何時到來?
據外媒報道,穆拉蒂表示,目前正在構建下一代主模型GPT-5,該模型將比其前身大得多。盡管該公司仍然相信規模將有助于從人工智能中挖掘出新的能力,但GPT-5很可能還會包括本次推出的推理技術。
“有兩種范式。”穆拉蒂表示,“縮放范式和這種新范式。我們希望將它們結合在一起。”
GPT-5的開發之路并不好走。
就在當地時間9月11日,GPT-4o/GPT-5的研究領導人、OpenAI版“Her”技術負責人亞歷克西斯?康諾(Alexis Conneau)突然宣布離職。而此前,OpenAI聯合創始人、首席科學家伊爾亞·蘇茨克韋(Ilya Sutskever),“超級對齊”團隊負責人楊·萊克(Jan Leike),聯合創始人約翰·舒爾曼(John Schulman),ChatGPT負責人Peter Deng等人都已先后離職……目前,11位創始人中,僅剩兩人仍留在OpenAI。
不僅人事動蕩,OpenAI還被曝出今年或將面臨50億美元的收支缺口。
但可以看到的是,OpenAI已經在行動。
OpenAI最新計劃再融資約65億美元,該輪融資估值達到1500億美元。而就在上個月底,OpenAI被曝正在準備新一輪由風投公司Thrive Capital領投,微軟、蘋果、英偉達或跟投的10億美元融資時,估值才剛超過1000億美元。
當地時間8月29日,OpenAI表示ChatGPT目前每周活躍用戶超過2億,是去年秋季的兩倍。
OpenAI表示,92%的財富500強公司都在使用該公司的產品,自7月推出ChatGPT-4o mini以來,其API的使用量翻了一倍。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司