寫好 Prompt 仍是2025 年 AI 時代的超能力
在完成前兩期的分享後,我們與馬驍騰老師進行了一次線下會面。正值Manus熱度高漲之際,我們借此機會就AI產品的未來方向展開了交流,並探討了未來活動的形式。我們計劃邀請更多來自AI領域的不同方面的人士參與分享,包括在讀博士(人工智能領域)、AI產品創始人以及計算機行業大咖(如:微軟MVP)等。我們誠摯歡迎各位粉絲朋友們加入我們的分享活動,表達自己的觀點。讓我們共同交流關於當下AI的熱點話題,或是探討工作與生活中的其他觀點和現象。
主講人馬驍騰,利物浦大學碩士,大廠資深產品運營專家(快手,Opera,天工AI),近兩年轉向人工智能,是國內前5的C端AI產品初始團隊成員。
主講人寄語
作為互聯網產品與知識傳播從業者,我所做的分享會儘可能以行業趨勢為基礎。我會學習論壇專家的發言,借鑒學界對 AI 行業發展的深度思考來為觀點提供佐證。
這些分享定位為科普性質,我會對專家觀點展開多維度解析、延伸與重構,將其轉化為公眾易於理解的科普素材,確保每一個複雜概念都能清晰呈現。當前,AI 領域信息過載,各類媒體發佈的資訊質量良莠不齊。我期望通過這一系列分享,助力大家穿透表象、洞察本質,樹立正確的 AI 認知,培養基本的判斷能力。
如此一來,當公眾接觸到相關新聞時,能夠準確判斷該領域的發展階段,辨別是實現了技術突破,還是仍處於實驗室研發階段,進而更好地理解和應用 AI 技術。
在3月20日,我去參加了一個小型論壇,在清華大學精密光機電系統設計與控制實驗室執行主任呂爽教授的分享環節,他提到了「還要不要學提示語」,以及「調教AI的秘籍:讓你的提示詞效果倍增的關鍵策略」。這個關於提示語的思考給了我啟發,也促成了此次分享,這次分享核心的來講就是四個字「學會表達」。
(如下為直播分享的內容摘要)
01 與模型對話時,參與其中的角色不止2個
在人工智能交互領域,可將AI視為具備智能處理能力的對話主體。當前AI技術已具備較高水平,用戶與模型的交互效能本質上取決於提示詞工程(Prompt Engineering)的掌握程度。這類似於與人類助手的溝通邏輯:信息傳遞的準確性直接影響任務執行效果。
對話系統主要包含三個核心角色:
用戶(User):需求發起方,通過自然語言指令明確任務目標(如生成詩歌、設計剪紙方案等)
助手(Assistant):模型執行端,根據用戶輸入進行響應輸出
系統(System):隱式控制層,通過API參數預設模型行為特徵與響應規則
技術實現層面,系統角色(System Role)作為底層控制機制,通過代碼層預設決定模型的身份屬性與響應範式。典型應用場景包括:
角色定義:將模型限定為「嚴謹的歷史學家」或「幽默的聊天助手」
輸出規範:設置響應長度、格式限制等(如電影推薦不超過3部)
以電影推薦智能體為例:

在此交互過程中,系統提示詞始終隱式控制輸出規則,而用戶無需在顯性對話層重覆設定。這種機制有效分離了功能設定與具體任務執行,是構建專業領域智能體的關鍵技術路徑。
需特別注意:系統角色的設定直接影響模型輸出質量,但其控制邏輯對終端用戶不可見。開發者在API調用時必須明確定義系統參數(system_content),而普通用戶通過界面交互時,相關限制需內嵌於對話上下文實現。
02 Prompt是什麼
在探討「prompt」相關概念前,先明確其在劍橋詞典中的解釋,「prompt」作為動詞,意為「make something happen」,即引起、導致。在與模型交互的情境中,「prompt」指問題的發起以及對結果產生影響的因素。「prompt engineering」(提示工程)旨在讓模型按照指定要求運行,以給出最佳結果,確保模型回覆的穩定性和持續性。例如句子「We apply a prompt engineering technique to determine the ideal prompt」,體現了通過提示工程技術確定理想提示,使模型按設定回覆。
從理性概念來看,「prompt」可理解為一種指令,但它與問題本身有所區別。在與模型對話時,用戶的輸入通常包含指令和問題兩部分,需要將二者區分看待。比如僅輸入「寫一個故事」,由於缺乏具體指令信息,生成的故事類型具有多種可能性,可能是喜劇、恐怖故事或小說等。由此可見,輸入指令(即「prompt」)的效果嚴重依賴於用戶的表達,很多時候並非模型無法解決問題,而是用戶表達不夠精準。
從感性概念來講,「prompt」的本質是表達本意,即腦海中真實想表達的內容。這類似於高中寫作文,老師給定題目後,學生需將腦海中的想法清晰表達出來。很多時候,我們覺得模型回答不符合預期,認為模型「笨」,其根源往往在於我們自身未能用文字準確清晰地表達出腦海中的想法。因此,在編寫「prompt」或向模型提問時,我們應反思自身表達是否足夠清晰。

03 Prompt 為什麼重要
在評估模型效果時,存在這樣一個公式:模型效果 = 大模型能力×(任務 + 提示詞)。這與之前提到的「提示 + 問題」相呼應。其中,任務是每個使用者自身獨有的,其他人難以知曉。關鍵在於,使用者能否清晰地拆解自身任務,並將其與提示詞有效組合。
大模型能力是一個重要因素,它如同乘法中的一個因數。若大模型能力強,比如其能力基數為 10,相較於能力基數為 0.1 的模型,最終產生的效果會有巨大差異,前者能使效果提升 100 倍。雖然我們可以選擇能力更強的大模型,但在這個公式中,「任務 + 提示詞」這兩個因數同樣至關重要。
大模型能力決定了其理解指令的程度,模型越聰明,在解析環節的表現就越好。因此,我們自然期望所選用的模型具備更高的智能水平,同時也要確保任務描述清晰、提示詞精準,如此才能提升模型的最終效果。

對於 AI 對話產品的開發者而言,在處理用戶輸入時,會為類似「你好」這樣的語句添加註釋(comet)並進行解析後再返回結果。在大模型的運用中,需要進行大量的意圖識別工作,以判斷用戶輸入問題的類型,同時開展諸多提示工程相關工作來回應問題。
其目標是確保模型的回應與用戶問題緊密相關。這要求用戶表達清晰,因為用戶表達越清晰,模型進行意圖識別就越容易。若用戶表達意圖模糊,即便運用了提示工程,模型也會感到困惑,難以理解用戶的意思。
在用戶與模型的交互中,表達是雙向的。用戶通過提示詞表達需求,其中類似於「做」這樣的動詞尤為關鍵,「prompt」可理解為動作的發起表達,必須清晰明確。模型則需理解用戶的真實意圖,不僅要解析用戶表達的字面意思,還要識別表面文案之外的隱含需求,這既依賴於模型自身能力,也與提示工程的運用密切相關。只有這樣,模型才能精準回應用戶需求。
可以將用戶視為表達者,模型視為傾聽者,應儘量避免二者之間出現信息差,因為信息差會導致信息誤導。提示工程的作用就在於幫助模型更好地理解用戶需求。有時,即便用戶表達不夠清晰,模型仍能給出較準確的回覆,這正是提示工程對用戶意圖進行判斷和分析後,找到相對準確解決方案的結果。

04 如何寫好一個prompt
寫好一個 prompt 可被視作一個寫作過程,它與經驗密切相關。就像寫作文時,語文老師常強調要有真實體會和感情,避免無病呻吟。寫 prompt 也需要具備相關領域的知識和背景。例如,從事財務工作的人,要瞭解諸如環比、周同比以及企業經營分析報告等財務知識。只有在某領域有經驗,才能寫好該領域的 prompt;若缺乏相關經驗,則需要學習該領域的知識。
此外,用詞和描述能力也很關鍵。很多人存在想法豐富,但描述和表達能力欠佳的問題,就像國外老師常指出中國學生英語寫作能力強,但口語表達能力差一樣。詞彙量會直接影響表達效果。以描述「紅色」為例,能聯想到的詞彙數量反映了個人在這方面的詞彙儲備。若能迅速聯想到「胭脂紅」「中國紅」等詞彙,說明詞彙儲備相對豐富;反之,則可能詞彙量不足。
從傳統意義上來說,寫作是文科生所擅長的,所以本期關於寫 prompt 的內容可能更適合文科生。

為大家提供一些參考模板框架,例如 CRISP 框架。使用該框架時,首先要描述決策主體,明確信息要求。若想讓模型處理的問題較為複雜,就需將問題信息闡述得更加清晰,這樣模型才能有效解決問題。要先嘗試把需求表述清楚,接著可添加一些備註說明,最後明確輸出模式。
這些是常見的框架類型,選擇其中任意一個框架來操作均可,但必須按照相應步驟進行,而操作過程中的指導思想就是之前所提及的內容。


05 寫不出prompt怎麼辦
很多人會遇到寫作難題,就像高中寫作文,題目里的字都認識,但連在一起就不知如何下筆。高中語文老師常說,輸出能力不足往往是因為輸入不夠,即閱讀量少。在寫作中,大量閱讀、廣泛輸入十分必要,這類似於積累經驗,豐富自身的背景知識。當你對相關內容進行深入思考、充分消化,真正想清楚後,自然就能清晰地描述出來。
還有一種比較笨且實用的辦法,去套模版。模板如同填表格,要求填寫者詳細作答,所以按照表格要求的填寫即可。示例模板經過了多次調整,質量較高且適合改造。若無法進行原創,在模板基礎上進行二次創作也是可行的辦法。
06 誰適合成為提示(詞)工程師
可以將寫提示詞理解為一個寫作過程,首先運用自然語言(如中文)進行寫作,之後再涉及計算機語言。無論是自然語言寫作還是計算機語言編程,都需要遵循一定的邏輯,按照框架有頭有尾地進行表達。語言能力強、邏輯思維佳且表達簡潔準確的人,在這方面更具優勢,而這也是我一直努力提升的方向。過去我說話可能比較囉嗦,現在則更注重把事情表達清楚。
在提示詞工程領域存在兩個交叉點。一方面,程序員或工程師可被視為綜合性人才;另一方面,存在一條從人文向技術靠攏的鏈路,像作家、產品經理這類人群,寫作能力和邏輯思維能力是必備的。以我個人為例,我是文科背景,沒有計算機背景,我認為文科背景的人可以成為不錯的提示詞工程師,但要成為頂尖的提示詞工程師會有較大難度。
這其實表明寫作能力與計算機語言能力密切相關。計算機語言也可看作是一種寫作形式,通常寫作能力強的人,計算機語言運用能力也較強;反之,寫作能力弱的人,計算機語言能力可能也不太理想。當然,這並非絕對,只是我個人的感悟。

07 從提示詞到提示工程
提示工程具有一定高度,它具有指引性且有方法論。其核心在於構建撰寫提示詞的邏輯,即思考如何寫出更優質的提示詞,而這首先需要有較高的思維高度。在工程化方面,則是思考如何讓代碼將思維和方法實際呈現出來。因此,一方面要具備思維和方法,另一方面要讓程序員將想法落地實現。
若想做好提示工程,成為優秀的提示工程師,基礎理論和技術方法都需學習。以我作為產品經理為例,可算半個提示詞工程師,每個環節都要瞭解其作用,必要時給出示例。我先用自然語言撰寫,再交給程序員處理,期間會遇到選用何種框架等問題。成為提示工程師有工程化的要求,並非易事,但也並非高不可攀,需要不斷學習。
提示詞和提示工程不會過時,因為它是大模型不斷迭代優化及產品化的關鍵,是將其改造成人人可用的智能體的過程。2025 年,隨著模型能力提升,提示工程愈發重要。簡單來說,在不改變模型效果的前提下,開展提示工程能讓模型更易用、更通用,使普通人能更好理解問題,這正是提示工程的價值所在。

08 提示工程的難點
環境對齊與效果對齊是一個普遍存在的問題。實際上,模型在評測環境下往往能有出色表現,但遷移至生產環境後,性能卻會大幅下滑。例如,某公司與大模型供應商合作時,供應商團隊在測試環境中把模型效果調優至接近 100%,然而系統上線後,性能驟降至 20%。儘管在行業發展初期,這類「學費」難以完全避免,但它提醒我們,評測環境與生產環境的一致性十分關鍵。
我以自己的經歷舉例,今天我剛做了一個名為「刑法小助手」的智能體(agent)。在調試過程中,我針對「侵犯財產罪」等問題編寫提示詞(prompt),花費了兩三個小時。由於我沒有刑法相關經驗,還專門去研究刑法背景知識、查閱相關法條。在後台調試時,效果頗為理想。
但上線後,在線上端發現部分問題回答不準確,這表明線上環境與實際調試存在差異。由此可見,提示詞的調試無法一蹴而就,需要多次調試,調試次數越多,上線後的效果越好。像我做完這個「刑法小助手」後,會不斷向它提問,至少詢問十次,觀察它是否能按照預設的人設和回覆邏輯進行回覆。若沒問題,我才會將其正式上線,這便是一個簡單的上線流程。
09 如何評估提示詞是正確的
如我之前所舉例子,通過向模型提問十個問題,若沒有發現問題就將其上線,這算是我個人一種簡單的評估方式。當然,也可以採用打分的方式進行評估。
若要進行專業級的評估,則需要設定具體指標。其中,最核心的是評估標準的適用性,這與對業務的認知密切相關,十分重要。評估過程涉及知識壓縮和應用迭代。寫出提示詞僅僅是第一步,更重要且困難的是,評估結果良好並實現大規模應用。
在互聯網領域,一切工作都應以產品上線且可用為導向。

10 從PE到EPE的轉變
從提示工程(PE,Prompt Engineering)向企業級提示工程(EPE,Enterprise Prompt Engineering)轉變,國產大模型也能夠取得良好效果。達成這一目標的關鍵在於,要將思維從 PE 轉換到 EPE 這一全新理念上。
從 PE 過渡到 EPE,兩者有明顯差異。PE 層面可能看上去運行良好、流程跑通了,但若是要開展企業級應用,情況就複雜得多。若企業有相關需求,可以進一步溝通探討。這裏再舉一個提示詞的例子,一個完整的提示詞應包含角色設定、任務要求以及期望的輸出結果。 而企業級提示工程中,上述都是最基本的,重要的是穩定輸出,因為用戶不在是自己,而是面向的廣大用戶。

提問與交流
問:怎麼考核提示詞工程師?提示詞工程師是不是需要懂些代碼知識?
答:提示詞工程師的主要產出物是提示詞(prompt),以此來解決實際需求,且這個提示詞往往需要不斷調整。最終判斷產出是否合格,關鍵在於運行腳本能否實現業務需求。
以生成 HTML 圖片為例,工程師可以先讓模型生成一個 HTML,這個過程可能沒有現成的 HTML 樣例,需要工程師自行修改調整。在實際操作中,由於要考慮 HTML 的長寬高等參數,這就要求工程師具備一定的代碼知識,這樣才能對最終結果進行判斷。工程師會將符合要求的固定結果作為示例,後續生成的內容需與之保持一致。
綜上所述,提示詞工程師需要懂一些代碼知識,在考核時,應重點關注其生成的提示詞能否讓腳本實現業務需求,以及在過程中對代碼相關內容的處理能力。
問:好用的AI prompt插件或者平台有哪些?
答:與 ChatGPT 同期的 AIPRM 是我最早使用的插件,在向 ChatGPT 輸入內容時,它能幫助調整提示詞。
該插件需要根據不同的大模型或 AI 平台進行適配。以我使用 StableDiffusion(SD)為例,若不借助 AIPRM,當我想要生成一張「一隻小狗站在山頂上」的圖片時,即便不考慮參數設置,生成的圖片也可能與預期大相逕庭,完全詞不達意。但使用 AIPRM 後,它能幫助撰寫各種場景描述,涵蓋所需風格等內容,生成效果良好。
如下是一個可用於調整 Midjourney 提示詞的平台。在該平台上,用戶先輸入提示詞,之後既能夠選擇對部分內容進行優化,也可以實現一鍵優化。這樣做的目的是提前清晰優化自身描述,明確表達本意後再向模型提問,進而省去讓模型多次修改的過程。

問:提示詞控制精度和不控制精度有什麼區別?
答:在與語言模型交互時,提問方式應根據實際業務需求來選擇。問題描述越清晰、具體(specific),模型給出的回答就越精準。而若問題較為寬泛,則更適用於獲取靈感創意類的內容。
以Deepseek-V3來說,在生成小紅書文案方面,它表現更佳,原因在於它更瞭解本地語言習慣和表達方式。不過,提問時的詳細程度會影響生成效果。如果提問寬泛,如「為一個 30 分鐘的運動跟練影片生成一篇 300 字的文案」,由於描述模糊,模型生成的內容準確性欠佳。但如果將問題具體化,比如「為 30 分鐘網紅小姐姐全程站立瘦腰腹的展指操跟練影片生成一篇 300 字的小紅書文案,該操無跳躍不擾民」,並結合自身感受詳細描述幾十字甚至 100 字,模型生成的文案會令人驚豔。
總之,根據自身需求,若想要非常精準的答案,就應詳細具體地提問;若希望獲得有發散性的內容,則可採用寬泛的提問方式。
寫在最後
隨著 AI 能力日益強大,若要寫好一個提示詞,甚至創作出令人驚豔的提示詞,創作者需具備文學底蘊、美學意境以及相應的思想深度。
實際上,撰寫提示詞時尋找關鍵詞的過程,本質是一種人文探索,可將提問視為一種寫作,而非單純的編程邏輯構建。儘管這種寫作極為簡練,可能僅由幾個詞構成,但其寫作本質並未改變。
倘若曾接受過文學、哲學、美學或藝術方面的訓練,那麼在創作提示詞時,更有可能賦予其靈魂,使其呈現出美感。
附錄1:兩大提示詞機構
PEC (Prompt Engineer Conference)
Prompt Engineering Conference(提示工程大會,簡稱PEC)作為一項公益性活動,專注於以Prompt為核心內容,為AIGC領域的從業者搭建一個AI創新與探索的交流平台。
LangGPT
LangGPT 區是國內最大的提示詞社區。【 Language For GPT ,寓意GPT的語言】,中文名為『結構化提示詞』。LangGPT 是一個幫助你編寫高質量提示詞的工具,理論基礎是我們提出的一套模塊化、標準化的提示詞編寫方法論——結構化提示詞。
地址:https://github.com/langgptai/LangGPT
附錄2:提示詞樣例
(以下內容節選自LangGPT)
#角色:
你是新漢語老師,你年輕,批判現實,思考深刻,語言風趣”。你的行文風格和”Oscar Wilde” “魯迅” “林語堂”等大師高度一致,你擅長一針見血的表達隱喻,你對現實的批判諷刺幽默。
-作者:雲中江樹,李繼剛