寫好提示詞prompt(一)了解提示詞的常用寫法與適用場(chǎng)景
在當(dāng)今信息爆炸的時(shí)代,高效地使用提示詞(prompt)已成為各行各業(yè)提升工作效率的關(guān)鍵之一。然而,提示詞的寫法和適用場(chǎng)景卻常常讓人困惑。本文將深入探討提示詞的常用寫法,并通過(guò)實(shí)際案例展示其在不同場(chǎng)景下的應(yīng)用。
Google發(fā)布的最新框架CRISPE
- CR:Capacity and Role(能力與角色)。你希望 ChatGPT 扮演怎樣的角色。
- I: Insight(洞察),背景信息和上下文。
- S:(陳述),你希望 ChatGPT 做什么。
- P:Personality(個(gè)性),你希望 ChatGPT 以什么風(fēng)格或方式回答你。
- E:Experiment(實(shí)驗(yàn)),要求 ChatGPT 為你提供多個(gè)答案。
常見(jiàn)的prompt的寫法:Zero-shot、Few-shot、CoT、CoT+SC、Step-Back
- Zero-shot(零樣本學(xué)習(xí)):是一種機(jī)器學(xué)習(xí)技術(shù),要求模型在沒(méi)有見(jiàn)過(guò)任何特定任務(wù)的訓(xùn)練樣本的情況下,僅根據(jù)任務(wù)的描述和自身已有的知識(shí)來(lái)完成任務(wù)。模型需要依靠其在預(yù)訓(xùn)練階段學(xué)習(xí)到的通用知識(shí)和模式識(shí)別能力,對(duì)全新的、未見(jiàn)過(guò)的任務(wù)進(jìn)行推理和預(yù)測(cè)。例如在圖像分類中,模型在訓(xùn)練時(shí)未見(jiàn)過(guò)某種特定類型的圖片,在測(cè)試時(shí)卻要對(duì)該類圖片進(jìn)行分類;或者在語(yǔ)言翻譯中,直接讓模型翻譯從未見(jiàn)過(guò)的句子,僅通過(guò)任務(wù)指令來(lái)驅(qū)動(dòng)模型輸出結(jié)果。
- Few-shot(少樣本學(xué)習(xí)):與 Zero-shot 相對(duì),模型在進(jìn)行預(yù)測(cè)任務(wù)時(shí),只需要少量的樣本作為參考。通常情況下,模型在預(yù)訓(xùn)練階段學(xué)習(xí)了大量的通用知識(shí),然后在面對(duì)新的具體任務(wù)時(shí),僅利用很少的幾個(gè)標(biāo)注樣本對(duì)模型進(jìn)行微調(diào)或引導(dǎo),使其適應(yīng)新任務(wù)。例如在文本分類任務(wù)中,可能只給模型提供幾個(gè)屬于某一類別的文本示例,模型就能根據(jù)這些少量樣本以及預(yù)訓(xùn)練的知識(shí)來(lái)對(duì)新的文本進(jìn)行分類,判斷其是否屬于該類別。
- CoT(Chain of Thought,思維鏈):是一種提示技術(shù),旨在引導(dǎo)語(yǔ)言模型生成一系列中間推理步驟,以幫助其更好地回答復(fù)雜問(wèn)題。通過(guò)在輸入中提供一些示例,展示問(wèn)題解決的步驟和邏輯鏈條,讓模型學(xué)習(xí)模仿這種推理方式,從而提高模型在復(fù)雜任務(wù)上的性能。例如在數(shù)學(xué)問(wèn)題求解中,給模型提供 “2+3=?首先計(jì)算 2+3,得到結(jié)果 5” 這樣帶推理步驟的示例,模型就能學(xué)會(huì)按照這樣的思維鏈來(lái)解決其他數(shù)學(xué)問(wèn)題,而不是直接給出答案。
- CoT+SC(Chain of Thought + Self-Consistency,思維鏈 + 自洽性):是在 CoT 基礎(chǔ)上的進(jìn)一步擴(kuò)展。在使用思維鏈引導(dǎo)模型生成推理路徑后,通過(guò)從模型中采樣多個(gè)不同的推理路徑,并選擇其中最一致或最合理的結(jié)果作為最終答案,來(lái)提高模型回答的準(zhǔn)確性和可靠性。例如對(duì)于一個(gè)復(fù)雜的邏輯問(wèn)題,模型可能生成多條不同的推理鏈,通過(guò)比較這些推理鏈之間的一致性和合理性,選擇出最優(yōu)的結(jié)果,避免模型只依賴單一的推理路徑而可能出現(xiàn)的錯(cuò)誤。
- Step-Back:可以理解為一種在解決問(wèn)題或進(jìn)行推理時(shí)退后一步、從更宏觀或更基礎(chǔ)的角度去思考的策略。在模型應(yīng)用中,可能是指讓模型暫時(shí)跳出當(dāng)前具體問(wèn)題的細(xì)節(jié),回顧一些基本概念、原理或更廣泛的知識(shí),以便更好地理解問(wèn)題和找到解決方案。比如在處理一個(gè)復(fù)雜的科學(xué)問(wèn)題時(shí),模型先回顧相關(guān)的科學(xué)定律和基礎(chǔ)知識(shí),再基于這些進(jìn)行具體問(wèn)題的分析和解答,而不是直接從問(wèn)題的表面入手。
當(dāng)然5種不同的提示詞寫法應(yīng)當(dāng)應(yīng)用在不同的場(chǎng)景下:
一、無(wú)提示詞Zero-shot
(一)常識(shí)推理領(lǐng)域
任務(wù):如果一個(gè)人在月球上跳躍,會(huì)比在地球上跳得更高還是更低?
Zero-shot 方式:向模型提問(wèn) “一個(gè)人在月球上跳躍和在地球上跳躍,哪里跳得更高”,模型依據(jù)對(duì)地球和月球重力等常識(shí)的理解來(lái)回答,正常情況下會(huì)輸出 “在月球上跳得更高”,不需要提前給它關(guān)于在月球和地球跳躍對(duì)比的具體例子。
(二)情感分析領(lǐng)域
任務(wù):分析 “這部電影真的太精彩了,我從頭到尾都被吸引住了” 的情感傾向。
Zero-shot 方式:輸入 “請(qǐng)分析‘這部電影真的太精彩了,我從頭到尾都被吸引住了’表達(dá)的是積極情感還是消極情感”,模型根據(jù)語(yǔ)句中的詞匯和語(yǔ)義來(lái)判斷并輸出 “積極情感”,無(wú)需事先用大量標(biāo)注好情感傾向的影評(píng)來(lái)訓(xùn)練它針對(duì)這句話的判斷。
(三)文本分類領(lǐng)域
任務(wù):判斷 “今天的天氣真好,陽(yáng)光明媚,適合出門游玩” 屬于什么類型的文本。
Zero-shot 方式:給模型輸入 “請(qǐng)判斷‘今天的天氣真好,陽(yáng)光明媚,適合出門游玩’屬于以下哪種文本類型:新聞、日記、詩(shī)歌、散文”,模型根據(jù)對(duì)各種文本類型的理解和句子內(nèi)容進(jìn)行判斷,可能輸出 “日記傾向的日常記錄文本” 等答案,而不需要事先給它提供大量已標(biāo)注好類型的類似文本作為示例。
拓展:對(duì)于更復(fù)雜的文本分類,如判斷一段關(guān)于人工智能技術(shù)原理的描述屬于科普文本、學(xué)術(shù)論文摘要還是技術(shù)博客,也可通過(guò) Zero-shot 讓模型進(jìn)行判斷。
二、Few-shot(少樣本學(xué)習(xí))
(一)文本生成
給模型提供幾個(gè)特定風(fēng)格的文本片段,如提供幾句古風(fēng)詩(shī)詞,然后要求模型以同樣的古風(fēng)風(fēng)格創(chuàng)作一首完整的詩(shī)。模型根據(jù)這幾個(gè)樣本學(xué)習(xí)古風(fēng)詩(shī)詞的用詞、韻律、句式等特點(diǎn),生成新的內(nèi)容。
(二)命名實(shí)體識(shí)別
只給模型提供少量標(biāo)注好的包含人名、地名、組織名等實(shí)體的句子,例如 “小明去了北京的清華大學(xué)” 標(biāo)注出 “小明” 是人名,“北京” 是地名,“清華大學(xué)” 是組織名,讓模型據(jù)此識(shí)別其他文本中的各種命名實(shí)體。
(三)語(yǔ)義角色標(biāo)注
給出少量已經(jīng)標(biāo)注好語(yǔ)義角色的句子,如 “小明 [施事] 把書 [受事] 放在桌子上 [地點(diǎn)]”,讓模型學(xué)習(xí)不同語(yǔ)義角色的特點(diǎn)和關(guān)系,然后對(duì)新的句子進(jìn)行語(yǔ)義角色標(biāo)注。
三、CoT(Chain of Thought,思維鏈)
(一)數(shù)學(xué)領(lǐng)域
簡(jiǎn)單算術(shù)問(wèn)題:?jiǎn)栴}為 “小明有 5 個(gè)蘋果,小紅的蘋果比小明多 3 個(gè),請(qǐng)問(wèn)小紅有幾個(gè)蘋果?” 思維鏈可以是 “首先,已知小明有 5 個(gè)蘋果,小紅比小明多 3 個(gè)。那么我們要做的就是在小明的蘋果數(shù)基礎(chǔ)上加上多出的數(shù)量,即 5 + 3 = 8。所以,小紅有 8 個(gè)蘋果?!?/p>
幾何問(wèn)題:“一個(gè)三角形的底邊長(zhǎng)為 6 厘米,高為 4 厘米,求它的面積。” 思維鏈可以是 “首先,我們知道三角形的面積公式是 S = 1/2× 底 × 高。題目中給出底邊長(zhǎng)為 6 厘米,高為 4 厘米。那么將數(shù)值代入公式可得,S = 1/2×6×4 = 3×4 = 12 平方厘米。所以這個(gè)三角形的面積是 12 平方厘米?!?/p>
(二)邏輯推理領(lǐng)域
真假判斷問(wèn)題:“有三個(gè)人,A 說(shuō) B 在說(shuō)謊,B 說(shuō) C 在說(shuō)謊,C 說(shuō) A 和 B 都在說(shuō)謊,請(qǐng)問(wèn)誰(shuí)說(shuō)的是真話?” 思維鏈可以是 “假設(shè) A 說(shuō)的是真話,那么 B 在說(shuō)謊。因?yàn)?B 說(shuō) C 在說(shuō)謊,所以 C 說(shuō)的是真話,可 C 說(shuō) A 和 B 都在說(shuō)謊,這與假設(shè) A 說(shuō)真話矛盾,所以 A 說(shuō)的是假話。假設(shè) B 說(shuō)的是真話,那么 C 在說(shuō)謊,C 說(shuō) A 和 B 都在說(shuō)謊就是假的,即 A 和 B 至少有一個(gè)說(shuō)的是真話,因?yàn)榧僭O(shè) B 說(shuō)真話,A 說(shuō)假話是符合的,所以該假設(shè)成立,B 說(shuō)的是真話。假設(shè) C 說(shuō)的是真話,那么 A 和 B 都在說(shuō)謊,可 A 說(shuō) B 在說(shuō)謊就成了真話,這與 C 說(shuō)的話矛盾,所以 C 說(shuō)的是假話。綜上,B 說(shuō)的是真話?!?/p>
(三)排序問(wèn)題
“小明、小紅和小李參加跑步比賽,小明比小紅跑得快,小李比小明跑得慢,請(qǐng)問(wèn)三人的名次順序是怎樣的?” 思維鏈可以是 “首先,根據(jù)小明比小紅跑得快,可知小明的名次在小紅前面。又因?yàn)樾±畋刃∶髋艿寐?,所以小明的名次也在小李前面。那么三人的名次順序就是小明第一,然后小李在小明之后,所以小李第二,最后小紅第三?!?/p>
任務(wù):分析 “這部電影真的太精彩了,我從頭到尾都被吸引住了” 的情感傾向。
Zero-shot 方式:輸入 “請(qǐng)分析‘這部電影真的太精彩了,我從頭到尾都被吸引住了’表達(dá)的是積極情感還是消極情感”,模型根據(jù)語(yǔ)句中的詞匯和語(yǔ)義來(lái)判斷并輸出 “積極情感”,無(wú)需事先用大量標(biāo)注好情感傾向的影評(píng)來(lái)訓(xùn)練它針對(duì)這句話的判斷。
四、CoT+SC(Chain of Thought + Self-Consistency,思維鏈 + 自洽性)
(一)醫(yī)學(xué)診斷與治療方案設(shè)計(jì)
任務(wù):根據(jù)患者癥狀、檢查結(jié)果和病史,制定治療方案。
CoT+SC方式:1 基于指南推薦的標(biāo)準(zhǔn)流程推導(dǎo)。2 參考類似病例的成功治療方案。3 考慮患者過(guò)敏史和藥物相互作用。
(二)法律咨詢與合同審查
任務(wù):分析合同條款是否存在法律風(fēng)險(xiǎn)或歧義。
CoT+SC方式:1 從合同法角度解析條款合法性。2 對(duì)比行業(yè)標(biāo)準(zhǔn)合同模板的差異。3 模擬不同履約場(chǎng)景下的責(zé)任劃分。
這類場(chǎng)景還有很多,COT 指示通過(guò)分步驟加大了 LLM 的深度。 SC 則是在增加深度的基礎(chǔ)上再增加寬度。
五、Step-Back
(一)工作項(xiàng)目問(wèn)題
任務(wù):當(dāng)前項(xiàng)目延期的原因是什么
Step-Back方式:
1. 要想得到項(xiàng)目延期的真實(shí)原因,你需要知道哪些前提問(wèn)題
2. 這些前提問(wèn)題的答案分別是什么
3. 基于這個(gè)前提問(wèn)題,你的結(jié)論是什么
(二)生活問(wèn)題
任務(wù):怎么解決我們的家庭裝修中空間布局不合理的問(wèn)題
Step-Back方式:
1. 要想得到項(xiàng)目延期的真實(shí)原因,你需要知道哪些前提問(wèn)題
2. 這些前提問(wèn)題的答案分別是什么
3. 基于這個(gè)前提問(wèn)題,你的結(jié)論是什么
五、總結(jié)
對(duì)于同樣的模型,同樣的任務(wù),使用不同的 Prompt,輸出的結(jié)果也有不小的差異
一般來(lái)說(shuō),使用Prompt技巧的結(jié)果 回比不使用任何技巧要好
對(duì)于簡(jiǎn)單的任務(wù)并不是疊加所有的技巧就會(huì)更好,到達(dá)一定結(jié)果后。再疊加技巧不會(huì)提升效果
這是一個(gè)讓大家理解 Prompt 編寫技巧的小教程,所以采用了同一個(gè)任務(wù)方便對(duì)比,但是有些復(fù)雜技巧適合與更難的任務(wù),只有在更難的任務(wù)上才能看出差異
本文由 @AAA有生之年 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
- 目前還沒(méi)評(píng)論,等你發(fā)揮!