长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

智譜發布推理模型初代版本

澎湃新聞記者 張靜
2024-12-31 18:55
來源:澎湃新聞
? 未來2% >
字號

12月31日,國內明星大模型創業公司北京智譜華章科技有限公司推出基于擴展強化學習技術訓練的推理模型GLM-Zero-Preview,擅長處理數理邏輯、代碼和需要深度推理的復雜問題。

GLM-Zero-Preview是GLM-Zero的初代版本。智譜表示,目前的GLM-Zero-Preview與OpenAI的o3模型仍有不少差距,因此未來將持續優化迭代強化學習技術,推出正式版GLM-Zero,將深度思考能力從數理邏輯擴展到更多更通用的技術。

與現有模型不同,GLM-Zero-Preview能夠初步實現推理過程中自主決策、問題拆解和嘗試多種方式解決問題。團隊發現,隨著強化學習訓練量的增加,模型在深度推理等方面的效果穩步提升。團隊也深入探究了模型在推理階段的scaling law(尺度定律),隨著模型可以思考的token數變多以及更多的計算量,模型給出的結果質量穩步提升,體現了“自我反思和優化、復雜問題分解、嘗試用不同方法解決問題”等能力,這與人類的思考決策過程類似。

在7、9、11、13中如何用3個數字相加得到30,GLM-Zero-Preview識別邏輯漏洞。

在邏輯推理方面,GLM-Zero-Preview善于識別邏輯漏洞,能夠模擬多種假設和可能性。例如在7、9、11、13中如何用3個數字相加得到30,GLM-Zero-Preview能夠識別圖中數字,通過反思發現答案的關鍵在于9可以倒置為6(6+11+13=30)。

在數學方面,GLM-Zero-Preview具有更強的歸納與演繹能力,能夠快速處理復雜的數學運算,解答包括代數、微積分、概率統計等領域的問題。以2025年考研數學一為例,GLM-Zero-Preview得分為126(總分150),達到優秀研究生水平。GLM-Zero-Preview能夠提供詳細的解題過程,幫助用戶理解問題的核心思路。

GLM-Zero-Preview能夠熟練使用多種編程語言,幫助開發者快速編寫代碼。在代碼調試方面能夠快速識別錯誤,給出詳細修復建議。例如只需要輸入指令“幫我用html寫一個有趣的第一人稱射擊游戲”,GLM-Zero-Preview便能迅速獨立完成游戲。

    責任編輯:宦艷紅
    校對:丁曉
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            大发888娱乐场c17| 临江市| 百家乐八卦投注法| 怎么玩百家乐的玩法技巧和规则| 海立方娱乐城线路| 澳门百家乐官网海星王| 赌博游戏机| 速博网上娱乐| 百家乐官网小音箱| 网络百家乐官网金海岸破解软件| 澳门百家乐走势图怎么看| 大发888怎么样| 百家乐官网专家赢钱打法| 百家乐官网是娱乐场| 百家乐技巧技巧| 天天百家乐官网游戏| 澳门百家乐赢钱窍门| 玉门市| 百家乐官网网投打法| 百家乐最佳注码法| 信博娱乐| 百家乐官网永利娱乐场| 百家乐高手的心得| 玩百家乐官网优博娱乐城| 铜梁县| 百家乐官网赌博论坛博客| 新奥博百家乐娱乐城| 娱乐城百家乐官网可以代理吗 | 百家乐凯时娱乐网| 龙泉市| 真人百家乐官网开户优惠| 大发888 打法888游戏| 单张百家乐论坛| 淘金盈娱乐城| 姚记百家乐的玩法技巧和规则| 百家乐官网赌博机有鬼吗| 赌博药| 太阳城百家乐币| 破解百家乐| 大发888洗码| 博彩乐百家乐平台|