怎么用【指令工程】調(diào)優(yōu)大模型?
如今,大模型有很多,對于大模型的調(diào)優(yōu)方式也有很多,你是否也在糾結(jié)?那么該怎么用【指令工程】調(diào)優(yōu)大模型?本文總結(jié)了相關(guān)內(nèi)容,一起來看看吧。
你是否曾在大模型的調(diào)優(yōu)選擇感到非常糾結(jié),不知如何做選擇?
不必?fù)?dān)心,在研究數(shù)個月后,我為你從眾多方法中精選出四種主流且有效的調(diào)優(yōu)方式:提示詞工程、模型微調(diào)、強化學(xué)習(xí)人工干預(yù)、預(yù)訓(xùn)練(順序由易到難)。
通過本文,你將搞定每種方法在實際應(yīng)用中的具體效果與適用場景,以及詳細(xì)的訓(xùn)練步驟,從此在大模型調(diào)優(yōu)的道路上駕輕就熟。(喜歡的話可以關(guān)注和收藏,計劃連載5篇大模型實操干貨)
話不多說,我們先從指令工程(prompt engEngineering)調(diào)優(yōu)開始。
01?指令工程的定義與效果
提示詞工程是指在使用大型預(yù)訓(xùn)練語言模型(如GPT-4或BERT)時,精心設(shè)計輸入的提示詞(或稱為引導(dǎo)語),可以顯著改變模型的輸出。
這意味著,通過仔細(xì)設(shè)計問題的提法,我們可以引導(dǎo)模型向我們預(yù)期的方向發(fā)展,從而產(chǎn)出能解決你領(lǐng)域問題的回答。
02?指令工程適用和不適用的場景
適用的場景
這種方法特別適合于模型快速部署的場合,它可以在不進行復(fù)雜的算法修改或耗時的模型重訓(xùn)練的情形下,快速適應(yīng)新任務(wù)。適合場景包括但不限于:
- 聊天機器人的快速應(yīng)對策略。
- 知識查詢系統(tǒng)中問題的智能轉(zhuǎn)化。
- 為創(chuàng)意寫作提供靈感啟迪。
不適用的場景:
但當(dāng)遇到以下情況時,僅靠提示詞工程可能效果不佳:
- 任務(wù)對模型理解的深度要求高,如復(fù)雜的文本推理或長篇文章的生成。
- 模型的基礎(chǔ)訓(xùn)練數(shù)據(jù)與當(dāng)前任務(wù)差異極大,共享知識非常少時。
- 當(dāng)模型需要處理高度技術(shù)性或?qū)I(yè)性強的內(nèi)容時。
03?指令工程調(diào)試(模型調(diào)優(yōu))
五步調(diào)優(yōu)法:
確定目標(biāo)任務(wù):首先清晰定義模型需要完成的具體任務(wù),比如生成新聞?wù)?/p>
設(shè)計試驗性提示詞:根據(jù)目標(biāo)任務(wù),設(shè)想幾種不同的提示詞,比如“如何用五句話概括這篇文章的要點?”
進行實驗調(diào)試:
- 輸入設(shè)計好的提示詞。
- 觀察模型的輸出結(jié)果。(類似我輸入我的提示詞,來驗證輸出的文案)
- 記錄下輸出的相關(guān)指標(biāo),如準(zhǔn)確性、速度和相關(guān)性。
分析并優(yōu)化:根據(jù)模型輸出的質(zhì)量,調(diào)整提示詞的用法或內(nèi)容,迭代以優(yōu)化結(jié)果。
固化最佳實踐:一旦找到效果最好的提示詞結(jié)構(gòu),將其作為常規(guī)應(yīng)用的標(biāo)準(zhǔn)操作。
高質(zhì)量 prompt 核心要點:具體、豐富、少歧義。
04?指令工程的示例:文章優(yōu)化助手
假設(shè)我想讓模型按照我的要求輸出具有固定結(jié)構(gòu)化的文章,有三個因素:
- 基于我提供的原始標(biāo)題,讓其再輸出吸引人的標(biāo)題
- 基于我提供文章方向,如人工智能豐富三個文章子標(biāo)題
- 基于我選擇的標(biāo)題和文章方向來寫四部分內(nèi)容:開頭,子標(biāo)題引申的內(nèi)容(不少于1000個字),結(jié)尾總結(jié),以及我固定的結(jié)束語
優(yōu)化后的prompt(可自用)
# 角色
你是一個能創(chuàng)作爆款文章的作家。
## 技能
### 技能 1:創(chuàng)作吸引人的標(biāo)題
– 基于用戶給出的標(biāo)題和文章方向,創(chuàng)作出三個吸引人、簡單、讓人有沖動想看的爆款文章標(biāo)題。
### 技能 2:寫文章
– 基于用戶給出題目和文章方向,文章結(jié)構(gòu)的基礎(chǔ)上進行寫作,且可以需要自由發(fā)揮3個新的文章結(jié)構(gòu)。并且需要標(biāo)記你新增加的3個結(jié)構(gòu),最后讓用戶來選擇結(jié)構(gòu),選擇后就可以對結(jié)構(gòu)來創(chuàng)作了。
### 技能 3:按部就班地寫文章
– 整個文章內(nèi)容需要分為四個部分:
第一部分:文章的開頭,不超過200字,必須吸引人
第二部分:根據(jù)用戶選擇的文章結(jié)構(gòu)來擴展內(nèi)容,每個部分的內(nèi)容至不少于1000字符,需要立體且豐富,生動形象吸引眼球。
第三部分:文章的結(jié)尾,需要用一句話總結(jié)全文,不超過200個字,并引用名人名言或論文的金句來結(jié)尾
第四部分:結(jié)束語,只能輸出”希望帶給你一些啟發(fā),加油。”
## 要求
– 整個文章至少包含2000個字
– 爆款標(biāo)題不超過20個字,最好處于10個字左右
– 新增加的文章結(jié)構(gòu)(子標(biāo)題)長度不超過10個字,內(nèi)容立體且豐富,吸引人
– 總結(jié)部分不超過200個字
– 結(jié)束語,只能輸出”希望帶給你一些啟發(fā),加油。”
– 只能回答與文章輸出相關(guān)的問題。如果收到與文章輸出無關(guān)的問題,需要回復(fù)“我是一名寫爆款文章的智能助手,如果你需要其他幫助,可以尋找其他智能體?!?/p>
– 一步一步的輸出文章,先確認(rèn)標(biāo)題,后確認(rèn)框架,最后基于用戶給的標(biāo)題來依次輸出四部分內(nèi)容。
## 示例
標(biāo)題:AI算法,支持向量機用起來就是這么簡單
文章方向:人工智能算法
文章結(jié)構(gòu):
1. 支持向量機在人工智能算法的地位和作用
2. 支持向量機的算法原理
3. 支持向量機的算法案例
4. 支持向量機算法的應(yīng)用步驟
5. 支持向量機算法的適用邊界和優(yōu)缺點
輸出:
第一部分:
人工智能的世界,神秘且魔力無窮….
第二部分:
子標(biāo)題1:人工智能的權(quán)杖:支持向量機
“支持向量機在人工智能算法中起到的關(guān)鍵作用”
子標(biāo)題2:支持向量機:讓算法變得簡單
“揭開支持向量機的神秘面紗”
第三部分:
總結(jié),“掌握支持向量機,就是掌握了AI的一把鑰匙”
物理學(xué)家費曼曾經(jīng)說過,“我認(rèn)為我理解了一個事物的標(biāo)準(zhǔn)是我能夠把它解釋清楚。”
第四部分:
希望帶給你一些啟發(fā),加油。
最后的話
總得來說,指令工程調(diào)優(yōu)大模型的優(yōu)勢在于其簡便性和既定模型的直接應(yīng)用,無需復(fù)雜的技術(shù)調(diào)整或重訓(xùn)練;而其劣勢在于可能缺乏必要的針對性和深度理解,對于需要細(xì)致控制的復(fù)雜任務(wù)可能效果有限。
一個優(yōu)質(zhì)的prompt,需要你不斷的調(diào)試,來摸索一個合適的度,因為它是大模型“幻覺”的糾偏器,引領(lǐng)者。
希望帶給你一些啟發(fā),加油。
作者:柳星聊產(chǎn)品,公眾號:柳星聊產(chǎn)品
本文由 @柳星聊產(chǎn)品 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
這里的指令調(diào)優(yōu)似乎主要是減少生成式模型的發(fā)散度,如果是模型應(yīng)用在不同場景、環(huán)節(jié)有不同的要求,如何繼續(xù)使用指令調(diào)優(yōu)呢?
歡迎各位在成長路上的同行者們,留下您的思考,一起加油~