下載客戶端

登錄

以后人手一個ChatGPT？微軟宣布開源大模型訓練神器

2023-04-15 15:53

來源：澎湃新聞·澎湃號·湃客

來源丨元宇宙簡史

編寫丨元宇宙簡史編輯部

【元宇宙導讀】Deep Speed Chat的最大優勢，是它可以大幅提升訓練速度和降低訓練成本。據微軟稱，Deep Speed Chat可以在一塊GPU上訓練高達130億參數的對話模型，或者在Azure云上以300美元的費用訓練同樣規模的模型。

近日，微軟宣布開源Deep Speed Chat，一款基于Deep Speed深度學習優化庫開發的工具，旨在幫助用戶輕松訓練類ChatGPT等大語言模型。

Deep Speed Chat的開源，將顯著降低用戶獲得大模型的成本，加速大模型在千行百業的應用落地。

01、什么是Deep Speed Chat？

Deep Speed Chat是微軟在2023年4月發布的一個開源項目，它利用了Deep Speed的優化技術，如ZeRO和LoRA，以及一種新的訓練技術，叫做Reinforcement Learning with Human Feedback (RLHF)，來訓練大規模的對話模型。

RLHF是一種利用人類反饋來指導模型學習和改進對話技能的強化學習方法，它可以讓模型生成更自然、更有趣、更有用的回復。

Deep Speed Chat還支持數據混合，即讓模型從多個數據源中學習，并生成多樣化的回復。此外，Deep Speed Chat還提供了一個簡單易用的訓練界面，讓用戶可以使用預訓練的Huggingface模型，并通過Deep Speed-RLHF將其轉化為一個定制化的對話模型。

02、Deep Speed Chat有什么過人之處？

Deep Speed Chat的最大優勢，是它可以大幅提升訓練速度和降低訓練成本。

據微軟稱，Deep Speed Chat可以在一塊GPU上訓練高達130億參數的對話模型，或者在Azure云上以300美元的費用訓練同樣規模的模型。

相比之下，目前最先進的對話模型，如OpenAI的GPT-4，擁有數千億參數，訓練一次的成本接近500萬美元。

除了規模和成本之外，Deep Speed Chat還具有其他方面的優勢。

例如，它可以支持更大的批量大小和更長的序列長度，從而提高數據利用率和模型性能。它還可以利用Deep Speed的內存優化策略，如ZeRO和LoRA，來支持高達數千億參數的超大規模模型。

此外，它還可以通過RLHF和數據混合來提高模型的對話質量和多樣性。

03、Deep Speed Chat的應用前景如何？

Deep Speed Chat的開源，無疑為用戶提供了一個更便捷、更經濟、更高效的訓練大語言模型的途徑。

這意味著用戶可以根據自己的需求和場景，定制出適合自己的對話模型，并將其應用于各種領域和行業。

例如，用戶可以利用Deep Speed Chat來創建智能客服、智能助理、智能教育、智能娛樂等各種類型的對話系統，并提升用戶體驗和滿意度。

嚴正聲明：本文為元宇宙簡史原創，未經授權禁止轉載！內容僅供參考交流，不構成任何投資建議。任何讀者若據此進行投資決策，風險自擔。

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#Deep #Speed #Chat #微軟宣布開源Deep #ChatGPT #大型語言模型 #大模型 #LLM #人工智能 #AI #大模型訓練

掃碼下載澎湃新聞客戶端

澎湃矩陣

澎湃新聞微博
澎湃新聞公眾號
澎湃新聞抖音號
IP SHANGHAI
SIXTH TONE

新聞報料

報料熱線: 021-962866
報料郵箱: news@thepaper.cn

滬ICP備14003370號

滬公網安備31010602000299號

互聯網新聞信息服務許可證：31120170006

增值電信業務經營許可證：滬B2-2017116

? 2014-2025 上海東方報業有限公司

反饋

长兴郴障科技有限公司

以后人手一個ChatGPT？微軟宣布開源大模型訓練神器

掃碼下載澎湃新聞客戶端