- +1
DeepSeek深度解析政府工作報告:今年有兩大關鍵詞
2025年3月5日上午,十四屆全國人大三次會議在人民大會堂舉行開幕會,國務院總理李強作政府工作報告。
基于2025年《政府工作報告》,澎湃新聞透過DeepSeek AI大模型,使用文本向量化的數據分析方法,深度解析報告中的政策密碼。
澎湃新聞分析發現,根據2025年《政府工作報告》,今年的經濟社會發展任務里,“發展”和“建設”是兩大關鍵詞。

以“發展”為關鍵詞,通過文本向量化分析,澎湃新聞找到了上百個關聯度較高的詞匯,如“經濟”“創新”“產業”“民生”等。
不僅如此,2025年《政府工作報告》中,“建設”也在圍繞著“現代化”“教育”“科技”等維度展開。
結合中國政府網上的1978年-2024年的《政府工作報告》,澎湃新聞進一步回顧了這48年的《政府工作報告》。

分析發現,48年間,“發展”“建設”以及“經濟”等詞匯,一直高頻出現,是《政府工作報告》中的“常青詞匯”。

還有部分詞語愈發頻繁地出現在《政府工作報告》中,比如“創新”“民生”“就業”。因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”。
另外,在2025年《政府工作報告》中,還出現了過去47年未曾提及的詞語,例如“具身智能”“智能機器人”“投資于人”等。

分析方法:
1. 本文所有原始文本材料來自中國政府網1978年至2025年政府工作報告。
2. 基于DeepSeek等AI大模型的文本向量化技術,對2025年工作展望的高頻詞進行關聯分析,通過提取共現向量和語義相似度向量,量化計算高頻詞間的關聯關系。
3. 本文使用jieba分詞(https://github.com/fxsjy/jieba/)。采用精確分詞模式,避免重復分詞和歧義。分詞結果均去掉數字、單字、標點符號。
4. 為增加分詞正確率,在jieba分詞的基礎上加入自定義詞典,自定義詞典主要包含了往年人民網和新華網統計的兩會熱詞。
5. 在分詞基礎上,采用TF-IDF加權技術。詞語的重要性隨著它在文本中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。本文使用的語料庫為1978年至2025年政府工作報告文本。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司