今年的政府工作報告,大模型讀到了這些新詞和熱詞

2026年3月5日,十四屆全國人大四次會議開幕會在北京人民大會堂舉行。國務院總理李強作政府工作報告。

在2026年《政府工作報告》基礎上,澎湃新聞美數課工作室借助國產大模型的分析能力,使用文本向量化的數據分析方法,深度解析報告中的政策密碼。

根據2026年《政府工作報告》,今年的經濟社會發展目標中,「發展」「建設」和「推進」是出現頻率最高的三大關鍵詞。

以「發展」為中心,澎湃新聞通過文本向量化分析,找到了幾十個關聯度較高的詞語,如「高質量」「新質生產力」「經濟」等。「建設」和「推進」則分別圍繞「治理」「市場」「城鎮化」等關鍵詞展開。

2026年是「十五五」開局之年,如何推動「十五五」開好局、起好步,成為各界關注的焦點。今年《政府工作報告》就實化量化「十五五」時期經濟社會發展主要目標和重大任務,提出了幾個方面。澎湃新聞在下圖呈現了2016年至2026年,三個「五年規劃」的政策要點和主要變化。

《政府工作報告》提出了貫徹落實《中共中央關於製定國民經濟和社會發展第十五個五年規劃的建議》明確的主要目標,《綱要(草案)》細化提出20項主要指標。

經濟發展方面,圍繞增長、結構、效率提出3項指標。其中,提出國內生產總值增長保持在合理區間、各年度視情提出。創新驅動方面,圍繞創新投入及其成效提出3項指標。其中,提出全社會研發經費投入年均增長7%以上。民生福祉方面,針對性提出就業、收入、教育、醫療、健康、「一老一小」等7項指標。綠色低碳方面,圍繞降碳減汙、生態環保等提出5項指標。其中,提出單位國內生產總值二氧化碳排放累計降低17%,繼續推動重點領域綠色低碳轉型。安全保障方面,圍繞糧食、能源生產能力提出2項指標,著力夯實國家安全重要基礎保障。

清華大學中國發展規劃研究院院長楊永恒在人民日報刊登的署名文章指出,「十三五」規劃、「十四五」規劃都把創新驅動發展作為首位的重點任務進行部署,都體現了在科技革命與大國博弈相互交織的形勢下,我們對現代化建設中具有牽引性的重大問題的聚焦。新中國規劃史上的每個五年規劃,都是在努力解決我國各個發展時期面臨的主要矛盾,力圖以重點突破帶動整體躍升,實現「舉一綱而萬目張,解一卷而眾篇明」。

2026年《政府工作報告》提出的這些新詞,體現了新的發展理念與發展格局:經濟建設領域的新詞有「智能經濟新形態」,科技領域的新詞有「智算集群」,惠及民生的新詞包括「初婚初育家庭住房保障」「帶薪錯峰休假」「獨居老人」等。這些詞語在過去49年的《政府工作報告》中未曾提及。

結合中國政府網上的1978年-2026年的《政府工作報告》,澎湃新聞進一步回顧了過去49年《政府工作報告》中的關鍵詞。「發展」「建設」以及「經濟」等詞彙是一直高頻出現的「常青詞」。

隨著時間推移,還有一些詞語更頻繁地出現在了《政府工作報告》中,澎湃新聞將這一類詞語稱為「喇叭形詞語」,如「高質量發展」「消費」「穩就業」等。

分析方法:分析方法:

1、本文使用所有分析語料來自中國政府網1978年至2025年政府工作報告,新華網2026年全國兩會直播-文字摘登的《政府工作報告》。

2、基於大模型的文本向量化技術,本文對2026年《政府工作報告》的高頻詞進行關聯分析,通過提取共現向量和語義相似度向量,量化計算高頻詞間的關聯關係。

3、本文使用jieba分詞(https://github.com/fxsjy/jieba/)。採用精確分詞模式,避免重覆分詞和歧義。分詞結果均去掉數字、單字、標點符號。

4、為增加分詞正確率,在jieba分詞的基礎上加入自定義詞典,自定義詞典主要包含了往年人民網和新華網統計的兩會熱詞。

5、在分詞基礎上,採用TF-IDF加權技術。詞語的重要性隨著它在文本中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。