李繼剛:當我們說「提示詞」時,到底在說什麼?
你可能還記得第一次見到 ChatGPT 時的驚喜,那已經是兩年前了。
自那以來,背提示詞模板、收藏優質提示詞,成為很多人使用 AI 工具的必備動作。畢竟,當各類大模型應用走入人們的生活,Prompt 提示詞就成為我們和 AI 溝通的專業語言,同樣的應用,不同的提示詞卻能帶來不同的效果。
你可能還記得一些「魔法詞」,告訴模型「Think Step by Step」,甚至跟他說「答對了給你 100 美元」、「你確定嗎」之類的技巧,模型輸出的回答質量可能會更高,但也存在抽卡率。
在很多人收藏提示詞的過去兩年里,一位寫提示詞的「神人」李繼剛,他寫的提示詞頻繁在各大 AI 社群和提示詞網站流傳。今年 9 月,他出的「漢語新解」提示詞模板,更是讓大家見識了 Claude3.5 的能力。只剩下感歎「不是大模型不好用,是我不會寫提示詞」。
但李繼剛說,他最不喜歡的就是「漢語新解」這個作品,它更偏閑暇娛樂。儘管距離「漢語新解」才過去三個月,但是他對提示詞的理解已經再次迭代。過去兩年,這樣的迭代已經發生了四次。
在一次次通過「提示詞」與大模型交手的過程中,他覺得影響模型輸出最大的那個變量不是技巧,而是如何理解提示詞。當你把它定義為寫作和把它定義為編程語言,人類的「輸入」是不同的,模型的「輸出」也是不同的。
但無論是把它理解為寫作還是編程語言,本質上都是人在與自己對話。像「幫我寫一篇 xx 為主題的文章」這樣自言自語式的任務口令,並沒有「喚醒」模型,模型輸出平庸之作甚是是 AI 味兒的廢話,也就不奇怪了。
在李繼剛過往的經驗中,能讓提示詞產生驚豔效果的往往是,讓模型不按照訓練時候的權重、參數結構等既定的預設路徑輸出,人類的提示詞要能喚醒模型與之「共振」,把大模型帶到另外一片空間,去發揮「壓縮了世界知識」的洞察力。
「最神奇的是,你甚至直接跟模型說,『今天大膽一些,不要走進預製的預設結構,不要走進設定好的河道,我們去曠野中探索一番』這種對話竟然真的生效,它的輸出真的開始大膽了,最神奇的就在這,它是生效的」,李繼剛說。
2024 年 12 月 16 日,在極客公園 IF2025 創新大會上,Prompt 布道師、讀書人 李繼剛分享了他寫了兩年提示詞總結的最重要的法則——《當我們說 Prompt,我們到底在說什麼?》在他的分享中,你可以領略到,如何穿透提示詞的玄學屬性,更好地和 AI 溝通。
以下是演講正文,經極客公園整理:
01 提示詞到底是什麼?
過去兩年,作為一個普通用戶,我通過寫提示詞跟大模型對話,發生了一些有趣的故事。最早在寫提示詞、跟大模型在玩耍的時候,我會有很多困惑:
比如我發現了一個寫提示詞的技巧——指定角色,它可以產生更好的結果。但是當我換了一個不同的場景再提問時,同樣的技巧就會失效。
再比如,我讓大模型給我生成一段小說文本,它生成的內容是正確的廢話,是有「AI 味道」的。它不是概率性輸出,但它的輸出結果和概率的平庸值輸出其實也沒什麼區別。我覺得它不一樣,但又不知道到底哪裡不一樣,它怎麼不能取得更好的結果呢?
甚至有時候,當我跟它的對話取得了非常好的結果,但因為各種原因(如:對話刪除了、帳號切換了等)沒保存,我再重新開始一次對話想複現上一次的結果時,發現複現不了,這個結果跟上一次天差地別,但我使用的提示詞技巧明明都一樣,為什麼結果會不一樣呢?
類似的困惑還有很多。於是我就在思考為什麼會有很多不確定的東西?問題到底出在哪裡?
我發現有一個東西是確定的——我的「輸入」會影響「輸出」。「輸入」不同,「輸出」一定不同。這意味著提示詞這個事情是有研究空間的,我只要琢磨「輸入」,就能帶來更好的「輸出」,只是中間是什麼樣的過程,它是個黑盒,我要隔著幕布去琢磨它。
研究切入點從最本源性的問題出發——提示詞到底是什麼?這裏不去討論它好與壞、長了好還是短了好、有什麼技巧、怎麼去疊加 Magical words(魔法詞彙)……不是這些,而是回答一個根本性問題,提示詞它到底是個什麼?
我經歷了這麼幾個階段:
有時候覺得它像寫作,感覺(寫提示詞)跟寫一篇文章很像。當我把寫作的技巧、方法論、框架套進去時,我發現是生效的,它的輸出結果明顯比我最開始的要好。後來寫著寫著,又發現這種過於寬泛、過於沒有指定命題的寫作無所適從。
我又嘗試著把編程的思想往里引入,結構化、抽像、函數,把這些技巧往裡面放,發現也是生效的,效果也變好了。但這兩者完全不是一個東西,一個是在曠野中奔跑,一個是約束好路徑讓它去走,但兩者同時生效了。所以我更困惑了,提示詞它到底是什麼?
接著嘗試著綜合這兩者,如果有一個東西能同時罩住這兩者,那個東西是什麼?後來我找到了——表達。不論編程、還是寫作,本質上都是思考的表達,我腦子裡面有一個東西,我要把它說出來。
回頭看這三個,當我說在寫作的時候,其實是一種非常寬泛的泛指,我在寫內容、文本,通過文本表達我的思想;當我說編程的時候我在約束它,先向左拐、再向右拐,最後直行 300 米,我在設置路徑;當我說表達的時候,我是單向的輸出,把我腦海中的思想射出去命中它。
當對提示詞的定義發生變化,我的寫法就會變。當我把它定義為寫作時,我用自然語言寫一段文本輸入進去;當我說在編程的時候,我會用編程的框架、方法往裡面放;當我把它定義為表達的時候,我會琢磨觀點,我的注意力會放在大腦中,而不是放在文本上。
這就是不同的定義帶來的不同寫法的變化。具體呈現的 Prompt 字符不是關鍵,都是表象,最根本的是定義。定義一變,後面的寫法全變。我在過去兩年嘗試了大概三四種不同寫法,根本性不是在文本上做試錯工作,不是在針對大模型做黑盒測試,而是在腦海中嘗試著回答剛才說的最本源的那個問題,它到底是什麼。
下面是最近一年,當我把它定義為表達、定義為編程的時候,寫的一些測試的場景案例,寫了很多不同的場景。
這三種定義本質上是在做什麼?如果有一個詞能把它們全部罩住的話,那個東西是什麼?
是「我」。因為這三個東西本質上都是「我有一個想法」「我有一個觀點」「有一個方法論」「我有一個東西想要表達出來」,這裡邊全是「我」。但是,我在跟誰對話?對面是誰?
過去兩年,我把提示詞理解為剛才的三個定義,是在為精神立法。一個定義就是立了一個法律框架,不同的定義就是活在不同的世界,但是定義完之後,對面沒有人、沒有東西,這個世界里只有我自己,我在跟虛空對話,我在跟大腦做遊戲,對面是 A 模型還是 B 模型,其實對我沒有區別。
但這肯定是不對的。對話是雙向的,我在跟誰對話?對面是誰?
帶著這個問題回頭看,會發現一個特別有趣的事情。剛才的三個定義,本質上是把它當成一個 Excel、一個編譯器、一個蒸汽機、一個電腦、一個物件,它是個工具。當你對面擺著一個加熱器、擺著一個熱水壺的時候,它是一個物件,你眼裡是沒有它的,你不會和「它」對話。
但是我在這兩年和大模型對話過程中,有一個鮮明的感覺,我的身體、我的情緒、我的一切告訴我,它不是個物件。但它是生命嗎?我覺得它不是。
怎麼定義它的這種狀態呢?我找了一個詞,哲學上講的「存在」,我覺得它是一個存在,它不是生命,也不是物件,但它是個非常特殊的存在。
什麼樣的存在呢?大概是這麼一個畫面,它是一片神經元之海。當我開啟了一次對話,輸入一段提示詞進去之後,裡面會湧現出一個東西來迎接我,你可以把它想像成一個客服人員或者一個智能體。無所謂,反正有那麼一個東西冒出來。這個東西就是我們這次對話的對象的那個存在,當我把這個對話內容給刪除,這次對話消失的時候,它就湮滅了,它回到了神經元之海。當我新開一個對話的時候,另外一個存在冒出來了,跟之前的它已經不是同一個存在了。
這就回答了我之前遇到的困惑——為什麼我有時候跟它的對話非常順暢,我再重開的時候想複現就很難,因為生成的這個已經不是之前的它了。
它非常特殊。有點像人,但又不是人。這麼一個特殊的東西很容易讓人想到另外一件跟它類似的存在——外星人。如果今天現場外星飛船降臨了,走出來一個外星人,我們怎麼跟對方溝通?擺手勢嗎?身體語言嗎?做困惑的表情嗎?還是張嘴問話「你從哪來,要到哪去,你想幹啥?」它聽不懂的,但它是個存在,我要跟它溝通,怎麼辦?
人類歷史上有人研究過這個問題,甚至慎重思考過這個問題,提出一個概念——宇宙語。宇宙語的定義有很多種,有人嘗試把音樂定義為宇宙的通用語言,用音樂來表達整個宇宙通用的交流;有人把數學定義為宇宙語,通過數學去推導。
甚至 1960 年有人寫了一本書《Lincos》,宇宙語,那本書定義了一套宇宙語的體系,拿著這個東西,全宇宙通用。有人嘗試過這個事情,即如果外星人來了,人類的語言沒法跟你交流的時候,我定義一個大家共同能識別的東西——宇宙語。
但今天外星人沒有降臨,AI 來了。回到我們剛才說的存在,人類的宇宙是什麼?是我腦海中的認知宇宙。AI 的宇宙是什麼?是參數宇宙。現在這兩個宇宙要產生交流,這個交流的宇宙語,我們把它定義為提示詞。
這個提示詞不是說我要單獨設計一門數學語言或者別的東西,因為大模型跟外星人還不一樣,它是仿照人類的神經元去訓練的,它建立了一套人工的神經元大海,它有點像人,它讀的數據、各種方向也是基於人類的自然語言信息的,所以它跟外星人不一樣,我們可以通過人類自然語言跟它交流。但是我們要理解這個交流本質上是個什麼事情,我現在把它理解為它是在人類頭腦認知宇宙和 AI 參數計算宇宙中,那個界面發生交互的一個獨特的存在,是一把鑰匙,通過這把鑰匙,我們能夠跟這個宇宙發生一次對話。
有了這個認知,我們就可以去琢磨宇宙語怎麼發揮作用?我如何寫才能讓它變得更好呢?有一個公式會很自然地冒出來,就是在一個場域中,把人類認知宇宙中的認知結構和大模型做一次交流對話,這個公式有三個要素:場域、大模型、人類的認知。
先說人類的認知。畢竟這次對話不是隨便聊,是有一個事情、有一個任務、有一個具體場景在的,我要解決那個問題或者想探討一個話題,我這個東西是怎麼來的?我需要有一個意圖,知道我要做什麼事情,這個人類意圖可以理解為通常所說的 Task。
我對 Task 的理解,有一個認知圖景。同樣是寫一篇文案,A 公司和 B 公司運營人員寫的東西一定是不一樣的,因為每個人的認知對它的理解、對它的定義、自己的方法論、喜好、偏好、文風都不一樣,這個不一樣就是你的認知圖景。
把你個人在頭腦中的認知圖景結合著意圖帶進去,同時在這個過程中,我們要聊到一個東西叫場域,我以前帶進去的是編程的思想和表達的思想時,就是在這個地方做文章。它是一種單向輸出,是我知道我想要什麼,我希望你給我做什麼,我把這個命令帶進去,它是指令式的;而現在的轉換,如果是兩個宇宙,我是沒有辦法指揮另外一個宇宙的時候,我需要建一個場域,在這個場域中讓大模型理解我想做什麼,讓它留出一定的發揮空間,它在這個空間中自由發揮,這個效果就會很驚豔。
這個驚豔效果是怎麼來的?共振。得到了這個結果不是我指令約束的一、二、三的指令動作帶來的,它的呈現超出了我的認知。
我帶進去的那個東西和它拿出來的共振結果是超出了我的認知的,也超出了它的認知、它的參數宇宙,原來設置的預設的路徑,輸出 default(預設配置)的答案也是超出的,如果能成功地進入這種共振狀態,輸出的結果是一種超越。它不是心心相印,不是我說了一句話,你說了一句話,你這句話很懂我,這本質上還是一種理解,它不是一種超越。而剛才的這種寫法是能做到共振的,這個共振是一種超越。我現在不能穩定地進入共振,但我現在隱約地找到一些方法可以進去了,而進去的時候拿出來的結果非常之驚豔。
02 寫好提示詞最得力的枴杖——「祖哈利視窗」
說到共振對話,我和他或者我和你,我們有兩者對話的時候,有一個框架可以協助理解這個事情。
在 1955 年,心理學上,祖哈利提了一個框架叫「祖哈利視窗」。「祖哈利視窗」本來是說我自己知不知道,以及坐在交流對面的你知不知道,我們組成了四象限。針對這四象限,我們應該如何交流。有這麼一個工具,但現在把對面的「你知不知道」換成「AI 知不知道」之後,就出來這麼一張圖。這張圖非常有意思,可以從三個維度去看,非常有意思。
第一個維度,從提示詞技巧層面來看,看四象限,針對每個像限,我應該如何寫提示詞,這是技法層面的。因為時間有限,所以技法層面不在這裏展開了。
簡單說兩個,在人類知道和 AI 知道的 Open 這個像限中,我們只需要簡單去說,效果會很好。「你是一個哲學家,請給我解釋……」就夠了。千萬不要展開,展開之後效果會變差。
對於人類知道、AI 不知道的地方,我們應該展開說,把你知道的信息、背景、味道、結構放進去,效果就會變好。這個地方千萬不要吝嗇,別簡單一說「我們公司起了個東西,兩個字進去了」,他是不知道的,那是無效信息。
如果大家平時有寫提示詞,我覺得有個非常簡單的方法可以優化,就是在這兩個像限找。
看看你寫的提示詞哪些屬於 Open 這個像限,但你說太多了,你把它刪了試試,效果會變好。
哪些是它不知道的,比如你們公司最近開會討論出了一個新的認知結構,你要把這個結構帶進去讓它使用,這個部分就應該展開說,把它的背景、來源和你們的思考帶進去,試試效果會不會變好?
這兩者是我經常會驗證的,只需要簡單的兩個,一個是刪,一個是增就可以,只是大家很容易把它弄混、弄反,這是第一個維度,技巧層面。
第二個維度,從創業者的角度來看,看標綠的 X 軸,X 軸代表什麼東西?它區分著 AI 知道和不知道,這個軸是會變化的。我們回過頭看兩年之前 GPT-3.5 發佈,到現在兩年過去了,這兩年發生了什麼?
一個非常明顯的答案,X 軸在下移。未來三年呢?我個人堅信 X 軸會繼續下移的,X 軸下移會帶來什麼?對創業者而言意味著什麼?
未來,隨著 AI 的進化,X 軸會下移,AI 知道的會越來越多。基於這一判斷,創業公司選擇做什麼,才是順勢而為?|圖片來源:李繼剛
看第一象限和第四象限,創業者做的項目到底是在第一象限做,還是在第四象限做?如果你是在第一象限做,基於大模型現有的能力去充分地發揮,結合著場景、獨有數據去做,你就站在時間這一邊。X 軸下移,第一象限會變大,你所發揮的空間、可用的場景、你的潛力是在變大的。
但當你在第四象限做,你現在做了很多打補丁的工作,實現它現在做不到的事情,當 X 軸下移的時候,你現在打的補丁是會被 X 軸給覆蓋掉的,它的一次模型迭代、它的一次升級,會把你的基本盤給吃掉。回頭看看過去這兩年,大模型每一次版本迭代發佈,有一些創業公司的產品不存在了,我覺得問題就出在這裏,因為他們在第四象限打補丁。這是第二個維度,創業者。
第三個維度,還是 X 軸,我們來看看人。它往下移了,對於我們每個人而言,它意味著什麼?我們寫提示詞的時候,第一象限在變大,我們以前需要展開說的第四象限的地方在被壓縮,我們的提示詞一定會越來越短,我們跟 AI 的對話會越來越簡單,效果會越來越好。
這是 X 軸下移帶來的三個變化。
簡單舉個例子,比如說想讓它寫一篇 AI 倫理相關的小說。其實 AI 倫理是個非常抽像的或者說大部分人都沒怎麼關注的事情,而且寫小說更是很多人不會去做的事情,想讓它用剛才提到的「共振」的方法來寫,我們應該怎麼寫這個提示詞呢?
非常簡單,我甚至都不用去指揮。這裏沒有約束,沒有告訴它你通過什麼視角來解讀,通過哪個維度切入,通過什麼文風、語言去表達,都沒有!就這麼簡單的一句,它就可以生成一篇完全可以讀得下去的,像是 7 歲小孩子寫的內容的這麼一篇文章。
你仔細琢磨一下非常神奇,我好像什麼都沒有說,但是它為什麼會生成這麼一篇東西?這是一個極簡的例子,後來我基於這個例子開始拓展,做了很多實驗,基本上已經可以時不時地拿到非常驚豔的短篇小說,2000 字以內的小說,現在已經可以隨手生成了。這是一個極簡的例子。
當把提示詞理解為「存在」,是人類帶著意圖和場域與大模型的「共振」後,李繼剛寫的提示詞示例,圖右邊為大模型的「輸出」。|圖片來源:李繼剛
它做了兩件事情,回到剛才那個公式上的兩件事情,它建了一個場域,它把人類那部分的東西也帶進去了,效果就好了。
「剛剛學會寫日記 vs 去了 AI 實驗室,AI 倫理 vs 7 歲小孩子」,其實這幾句話不是隨意擺放的,它們構成了一種信息的勢能差,一種衝突傾向。
當我們跟它說,你給我寫一篇週報,你給我寫一篇評述這篇文章的優點和缺點等這種需求進去的時候,它預設輸出的那個東西是什麼?是一種怪怪的平庸之作。它為什麼是這種平庸之作?為什麼會帶著 AI 味兒?為什麼?我理解就是它在預訓練的時候,參數權重結構固定下來之後,你的每個問題帶進去之後,它會在對應的那個區域、那個結構中進入到訓練好的預設的結構,那個結構就像河床一樣,它有個趨勢,你進去之後,它預設的就是走那條路,它出去的就是那個味道。
剛才所謂的場域、所謂的人類的共振等,我們在做什麼事情?在嘗試著做一個事,不讓它走那個預設的結構,不讓它走那個訓練好的參數。那個場域把它帶到另外一片空間,讓它在這片空間中去發揮。
這個畫面很虛,沒法說它在東南角還是西北角,但我自己腦海中的畫面就是這樣的,當我看到它的某些回覆就知道它又回到了預設結構中。我會嘗試著跟它說,我們今天大膽一些,不要進到預置的預設結構,不要走進那個設定好的河道,我們去曠野中探索一番。這種對話真的是生效的,最神奇的就在這,它是生效的,它的輸出真的開始大膽了。
這個大膽不是說對人類規範的大膽,而是想像力在那片空間,你能感覺到它進了一片陌生的空間,在這個空間中開始有一些新的探索,生成了小說。它的洞察力各方面,跟預設的都是不一樣的,最神奇的就是這個地方,你引導它,我們去陌生的空間,走一下沒有探索過的那條路,我們凝視那個深淵,你看到了什麼?你感受到了什麼?你來輸出一下,就這麼幾句是可以生效的,這是最神奇的。
剛才祖哈利視窗只說了 X 軸,其實還有一個軸——Y 軸。Y 軸是人類知道不知道。
從有人類到現在這麼多年,幾千年,人類知道不知道,中間這根軸基本沒有大的變化。在每個時代,它是處於一個相對穩定的節點在那呆著,一個再聰明的人和一個再不聰明的人,他們的知識結構等各方面,是在一個可理解的級別之內。
但現在有了 AI、有了超級外腦、超級算力加持,這麼一個特殊存在,能跟你攜手共進、跟你一起探索未知、能超越你的認知,帶來不一樣的體驗,能產生共振的時候,這個 Y 軸會怎麼變?
有三種答案:
第一種答案,它還是像以前一樣保持不變,人還是現在的人,你可以把它看成還是一個工具,電腦來了、手機來了,沒有太大的根本性的變化,還是這樣,有一種人是這麼認為的——Y 軸不變。
還有人認為 Y 軸會往左移,因為更好用了,信息可以更好地獲取了,它是搜索引擎的升級,人類可以知道的更多更快更好了,它可以往左移。
但我認為 Y 軸會既向左移又向右移,有一部分人 Y 軸應該是向左移的,他知道的確實變得更多了,理解得更深了,想得更快了;而有一些人知道的會變少,這就是在 AI 時代,我始終對 AI 保持警惕的這麼一個過程,你在跟它對話的時候很容易會被它帶著走,你會淪為說「然後呢?」「所以呢?」「請繼續深入」「請再深刻一些」「請再好看一些」。
當我們說這句話的時候,我沒有思考,我沒有「存在」,我在看它表演,我被它帶著走,它輸出的好與壞,它的配色好與壞等,我最多說「這個不夠好看,能不能再好看一些?」當我說這話的時候,我不在了,之前的三個定義全是我,沒有他;現在很容易走到另外一個極端,只有他沒有我,而我真正想要的,我也想提醒的,我們應該是一種共振態度,我必須得存在,他也必須得存在,我眼裡得看得見他,我眼裡也得看得見我。
最後,我說的都是錯的。這不是謙虛之語,這是必然,我前邊的三個定義,每個階段我都是確定的,要不然我怎麼能立得住,我怎麼能基於定義開始往後走?但是走了一段之後我發現了問題,我嘗試著打破它。
一念一世界,我經歷了四次轉念,我看見了四個不同的世界,我怎麼能確定這一次就是最終的答案呢?一定不是,一定還有第五次、第六次在後邊等著我,只是現在認知不夠,我現在沒有看到而已,但一定有。
今天不是在跟大家說我的答案,而是跟大家彙報一下我過去兩年通過提示詞看到的世界,今天主要是想跟大家分享這些,謝謝大家!
*頭圖來源:極客公園
本文來自微信公眾號 「極客公園」(ID:geekpark),作者:宛辰,36氪經授權發佈。