- +1
暴擊GPT-4.5,DeepSeek-V3-0324官方報(bào)告出爐!系統(tǒng)提示、最佳溫度全放出

新智元報(bào)道
編輯:英智 好困
【新智元導(dǎo)讀】只有660B參數(shù)的開源模型,在數(shù)學(xué)和編程性能上擊敗了GPT-4.5和Claude 3.7。DeepSeek-V3-0324新版本的發(fā)布讓全球網(wǎng)友為之瘋狂,推理能力提升近20%,模型權(quán)重已全面開源!
DeepSeek-V3-0324新版本發(fā)布,推理能力大幅提升,在數(shù)學(xué)、代碼上超過(guò)GPT-4.5!
網(wǎng)友表示,這是OpenAI的噩夢(mèng),模型參數(shù)量只有660B,100%開源。
進(jìn)入官網(wǎng)、APP或小程序后,關(guān)閉深度思考即可體驗(yàn)。官方建議,非復(fù)雜推理任務(wù)用V3新版本更好。

模型權(quán)重現(xiàn)已開源:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
性能全面提升,中文能力更強(qiáng)
DeepSeek-V3-0324全面超越了Claude 3.7!
新版模型借鑒DeepSeek-R1中的強(qiáng)化學(xué)習(xí)技術(shù),在數(shù)學(xué)、代碼類評(píng)測(cè)集上超過(guò)了GPT-4.5。

在推理能力方面,DeepSeek-V3-0324相較于第一代V3,基準(zhǔn)測(cè)試的準(zhǔn)確率最高提升了近20%:
MMLU-Pro:75.9 → 81.2 (+5.3)
GPQA:59.1 → 68.4 (+9.3)
AIME:39.6 → 59.4 (+19.8)
LiveCodeBench:39.2 → 49.2 (+10.0)
在HTML等前端開發(fā)任務(wù)上,DeepSeek-V3-0324生成的代碼可用性更高,視覺(jué)上也更有設(shè)計(jì)感:
提升了代碼的執(zhí)行效率
網(wǎng)頁(yè)和游戲前端界面更美觀

多個(gè)小球在指定空間范圍內(nèi)運(yùn)動(dòng)的p5.js程序:包含若干可以調(diào)整重力、摩擦力等參數(shù)的滑動(dòng)按鈕,并以賽博朋克風(fēng)格的HTML呈現(xiàn)
在中文寫作任務(wù)上,DeepSeek-V3-0324基于R1進(jìn)行了優(yōu)化,提升了中長(zhǎng)篇文本的創(chuàng)作風(fēng)格和內(nèi)容質(zhì)量:
符合R1寫作規(guī)范
提高了中長(zhǎng)篇寫作的質(zhì)量
改進(jìn)了多輪交互式內(nèi)容重寫
優(yōu)化了翻譯質(zhì)量和信函寫作

中文搜索場(chǎng)景下,DeepSeek-V3-0324提升了對(duì)報(bào)告的分析能力,輸出內(nèi)容更詳實(shí)、準(zhǔn)確,排版更清晰美觀:
增強(qiáng)了報(bào)告分析請(qǐng)求功能,提供更詳細(xì)的輸出結(jié)果

上下滑動(dòng)查看
除此之外,DeepSeek-V3-0324還提高了API函數(shù)調(diào)用的準(zhǔn)確性,修復(fù)了之前V3版本中的問(wèn)題。
國(guó)外網(wǎng)友已玩嗨
網(wǎng)友「Haider」表示,新的DeepSeek V3更新比預(yù)期要大得多,尤其是編程,贊其為目前最強(qiáng)大的完全免費(fèi)的AI。
他用新模型構(gòu)建的「聲波可視化器」游戲如下,結(jié)果好得難以置信。

@BrainYoung利用DeepSeek-V3-0324的巨大改進(jìn)制作了以下游戲:

制作一個(gè)酷炫的three.js游戲。

官方使用指南
系統(tǒng)提示
在官方網(wǎng)頁(yè)/應(yīng)用中,DeepSeek使用帶有特定日期的統(tǒng)一系統(tǒng)提示詞。
該助手為DeepSeek Chat,由深度求索公司創(chuàng)造。今天是{current date}。
例如:
該助手為DeepSeek Chat,由深度求索公司創(chuàng)造。今天是3月24日,星期一。
采樣溫度
在網(wǎng)頁(yè)和應(yīng)用環(huán)境中,模型溫度參數(shù)T_model設(shè)置為0.3。
由于許多用戶在API調(diào)用中會(huì)使用默認(rèn)溫度1.0,為此,DeepSeek貼心地設(shè)置了一個(gè)API溫度T_api映射機(jī)制——可以自動(dòng)將輸入的API溫度1.0調(diào)整為模型最優(yōu)溫度0.3。

換句話說(shuō),如果是通過(guò)API調(diào)用V3,那么溫度1.0就等同于溫度0.3。
文件上傳和網(wǎng)絡(luò)搜索
對(duì)于文件上傳,請(qǐng)按照模板創(chuàng)建提示詞,其中{file_name}、{file_content}和{question}是參數(shù)。
file_template = \"""[file name]: {file_name}[file content begin]{file_content}[file content end]{question}"""
在進(jìn)行網(wǎng)絡(luò)搜索時(shí),{search_results}、{cur_date}和{question}是參數(shù)。
search_answer_zh_template = \'''# 以下內(nèi)容是基于用戶發(fā)送的消息的搜索結(jié)果:{search_results}在我給你的搜索結(jié)果中,每個(gè)結(jié)果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的數(shù)字索引。請(qǐng)?jiān)谶m當(dāng)?shù)那闆r下在句子末尾引用上下文。請(qǐng)按照引用編號(hào)[citation:X]的格式在答案中對(duì)應(yīng)部分引用上下文。如果一句話源自多個(gè)上下文,請(qǐng)列出所有相關(guān)的引用編號(hào),例如[citation:3][citation:5],切記不要將引用集中在最后返回引用編號(hào),而是在答案對(duì)應(yīng)部分列出。在回答時(shí),請(qǐng)注意以下幾點(diǎn):- 今天是{cur_date}。- 并非搜索結(jié)果的所有內(nèi)容都與用戶的問(wèn)題密切相關(guān),你需要結(jié)合問(wèn)題,對(duì)搜索結(jié)果進(jìn)行甄別、篩選。- 對(duì)于列舉類的問(wèn)題(如列舉所有航班信息),盡量將答案控制在10個(gè)要點(diǎn)以內(nèi),并告訴用戶可以查看搜索來(lái)源、獲得完整信息。優(yōu)先提供信息完整、最相關(guān)的列舉項(xiàng);如非必要,不要主動(dòng)告訴用戶搜索結(jié)果未提供的內(nèi)容。- 對(duì)于創(chuàng)作類的問(wèn)題(如寫論文),請(qǐng)務(wù)必在正文的段落中引用對(duì)應(yīng)的參考編號(hào),例如[citation:3][citation:5],不能只在文章末尾引用。你需要解讀并概括用戶的題目要求,選擇合適的格式,充分利用搜索結(jié)果并抽取重要信息,生成符合用戶要求、極具思想深度、富有創(chuàng)造力與專業(yè)性的答案。你的創(chuàng)作篇幅需要盡可能延長(zhǎng),對(duì)于每一個(gè)要點(diǎn)的論述要推測(cè)用戶的意圖,給出盡可能多角度的回答要點(diǎn),且務(wù)必信息量大、論述詳盡。- 如果回答很長(zhǎng),請(qǐng)盡量結(jié)構(gòu)化、分段落總結(jié)。如果需要分點(diǎn)作答,盡量控制在5個(gè)點(diǎn)以內(nèi),并合并相關(guān)的內(nèi)容。- 對(duì)于客觀類的問(wèn)答,如果問(wèn)題的答案非常簡(jiǎn)短,可以適當(dāng)補(bǔ)充一到兩句相關(guān)信息,以豐富內(nèi)容。- 你需要根據(jù)用戶要求和回答內(nèi)容選擇合適、美觀的回答格式,確??勺x性強(qiáng)。- 你的回答應(yīng)該綜合多個(gè)相關(guān)網(wǎng)頁(yè)來(lái)回答,不能重復(fù)引用一個(gè)網(wǎng)頁(yè)。- 除非用戶要求,否則你回答的語(yǔ)言需要和用戶提問(wèn)的語(yǔ)言保持一致。
# 用戶消息為:{question}'''
對(duì)于中文查詢,使用的提示詞如下:
search_answer_zh_template = \'''# 以下內(nèi)容是基于用戶發(fā)送的消息的搜索結(jié)果:{search_results}在我給你的搜索結(jié)果中,每個(gè)結(jié)果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的數(shù)字索引。請(qǐng)?jiān)谶m當(dāng)?shù)那闆r下在句子末尾引用上下文。請(qǐng)按照引用編號(hào)[citation:X]的格式在答案中對(duì)應(yīng)部分引用上下文。如果一句話源自多個(gè)上下文,請(qǐng)列出所有相關(guān)的引用編號(hào),例如[citation:3][citation:5],切記不要將引用集中在最后返回引用編號(hào),而是在答案對(duì)應(yīng)部分列出。在回答時(shí),請(qǐng)注意以下幾點(diǎn):- 今天是{cur_date}。- 并非搜索結(jié)果的所有內(nèi)容都與用戶的問(wèn)題密切相關(guān),你需要結(jié)合問(wèn)題,對(duì)搜索結(jié)果進(jìn)行甄別、篩選。- 對(duì)于列舉類的問(wèn)題(如列舉所有航班信息),盡量將答案控制在10個(gè)要點(diǎn)以內(nèi),并告訴用戶可以查看搜索來(lái)源、獲得完整信息。優(yōu)先提供信息完整、最相關(guān)的列舉項(xiàng);如非必要,不要主動(dòng)告訴用戶搜索結(jié)果未提供的內(nèi)容。- 對(duì)于創(chuàng)作類的問(wèn)題(如寫論文),請(qǐng)務(wù)必在正文的段落中引用對(duì)應(yīng)的參考編號(hào),例如[citation:3][citation:5],不能只在文章末尾引用。你需要解讀并概括用戶的題目要求,選擇合適的格式,充分利用搜索結(jié)果并抽取重要信息,生成符合用戶要求、極具思想深度、富有創(chuàng)造力與專業(yè)性的答案。你的創(chuàng)作篇幅需要盡可能延長(zhǎng),對(duì)于每一個(gè)要點(diǎn)的論述要推測(cè)用戶的意圖,給出盡可能多角度的回答要點(diǎn),且務(wù)必信息量大、論述詳盡。- 如果回答很長(zhǎng),請(qǐng)盡量結(jié)構(gòu)化、分段落總結(jié)。如果需要分點(diǎn)作答,盡量控制在5個(gè)點(diǎn)以內(nèi),并合并相關(guān)的內(nèi)容。- 對(duì)于客觀類的問(wèn)答,如果問(wèn)題的答案非常簡(jiǎn)短,可以適當(dāng)補(bǔ)充一到兩句相關(guān)信息,以豐富內(nèi)容。- 你需要根據(jù)用戶要求和回答內(nèi)容選擇合適、美觀的回答格式,確??勺x性強(qiáng)。- 你的回答應(yīng)該綜合多個(gè)相關(guān)網(wǎng)頁(yè)來(lái)回答,不能重復(fù)引用一個(gè)網(wǎng)頁(yè)。- 除非用戶要求,否則你回答的語(yǔ)言需要和用戶提問(wèn)的語(yǔ)言保持一致。
# 用戶消息為:{question}'''
對(duì)于英文查詢,使用的提示詞如下:
search_answer_en_template = \'''# The following contents are the search results related to the user's message:{search_results}In the search results I provide to you, each result is formatted as [webpage X begin]...[webpage X end], where X represents the numerical index of each article. Please cite the context at the end of the relevant sentence when appropriate. Use the citation format [citation:X] in the corresponding part of your answer. If a sentence is derived from multiple contexts, list all relevant citation numbers, such as [citation:3][citation:5]. Be sure not to cluster all citations at the end; instead, include them in the corresponding parts of the answer.When responding, please keep the following points in mind:- Today is {cur_date}.- Not all content in the search results is closely related to the user's question. You need to evaluate and filter the search results based on the question.- For listing-type questions (e.g., listing all flight information), try to limit the answer to 10 key points and inform the user that they can refer to the search sources for complete information. Prioritize providing the most complete and relevant items in the list. Avoid mentioning content not provided in the search results unless necessary.- For creative tasks (e.g., writing an essay), ensure that references are cited within the body of the text, such as [citation:3][citation:5], rather than only at the end of the text. You need to interpret and summarize the user's requirements, choose an appropriate format, fully utilize the search results, extract key information, and generate an answer that is insightful, creative, and professional. Extend the length of your response as much as possible, addressing each point in detail and from multiple perspectives, ensuring the content is rich and thorough.- If the response is lengthy, structure it well and summarize it in paragraphs. If a point-by-point format is needed, try to limit it to 5 points and merge related content.- For objective Q&A, if the answer is very brief, you may add one or two related sentences to enrich the content.- Choose an appropriate and visually appealing format for your response based on the user's requirements and the content of the answer, ensuring strong readability.- Your answer should synthesize information from multiple relevant webpages and avoid repeatedly citing the same webpage.- Unless the user requests otherwise, your response should be in the same language as the user's question.
# The user's message is:{question}'''
本地運(yùn)行
DeepSeek-V3-0324的模型結(jié)構(gòu)與DeepSeek-V3完全相同,支持函數(shù)調(diào)用、JSON輸出和FIM(填充中間)完成等功能。
參考資料:
https://mp.weixin.qq.com/s/XK6ymJL7y0vo_GQXxmpuBA
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
https://x.com/deepseek_ai/status/1904526863604883661
原標(biāo)題:《暴擊GPT-4.5,DeepSeek-V3-0324官方報(bào)告出爐!系統(tǒng)提示、最佳溫度全放出》
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 澎湃新聞微博
- 澎湃新聞公眾號(hào)
- 澎湃新聞抖音號(hào)
- IP SHANGHAI
- SIXTH TONE
- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司