GPT、大語言模型入門版:面向互聯(lián)網(wǎng)從業(yè)人員的AI通識與個(gè)人思考
現(xiàn)在,AI技術(shù)、GPT等大模型應(yīng)用正在加快對互聯(lián)網(wǎng)行業(yè)的“入侵”,這也倒逼著相關(guān)的互聯(lián)網(wǎng)從業(yè)人員開展內(nèi)容學(xué)習(xí)。那么對非技術(shù)人員來說,如果想擁抱AI時(shí)代,可以基于哪些內(nèi)容進(jìn)行搜索學(xué)習(xí)?本文作者便發(fā)表了他作為非技術(shù)人員的思考和啟發(fā),一起來看一下吧。
從2023年農(nóng)歷春節(jié)開工到現(xiàn)在,身邊每天都充斥著對GPT、LLM領(lǐng)域大量的媒體分析、行研報(bào)告、產(chǎn)品demo、社群活動(dòng)。熱度要比過去元宇宙、區(qū)塊鏈這些技術(shù)概念更加空前,可見他對底層技術(shù)的變革是如此的歇斯底里。
作為一枚數(shù)據(jù)產(chǎn)品經(jīng)理,苦研數(shù)周,輸出倒逼,簡單總結(jié)了一些自己的學(xué)習(xí)心得。
前言
- 用大白話讓非技術(shù)人員了解這一技術(shù)的關(guān)鍵點(diǎn),如想深度探索,可基于此搜索學(xué)習(xí)。
- 讓互聯(lián)網(wǎng)行業(yè)產(chǎn)品、運(yùn)營等人員在工作中想要應(yīng)用這一技術(shù)時(shí)有基本的框架思維。
- 作者非AI技術(shù)出身,有表述不準(zhǔn)的地方,歡迎指正。
一、ChatGPT與GPT通識
ChatGPT是一個(gè)聊天應(yīng)用。一個(gè)輸入框,輸入你想問他的任何問題,他會(huì)給你一個(gè)答案,并且這個(gè)答案看起來是經(jīng)過思考、講究語法并且正確的。他理解你的語言,并能用你的語言給你答案。
而這背后,就是GPT這個(gè)大模型在發(fā)揮作用(Generative Pre-trained Transformer),翻譯為“基于Transformer的生成式預(yù)訓(xùn)練模型”(引號里的中文值得逐字理解),通俗點(diǎn)講,這個(gè)模型的目的就是理解你輸入的文字,然后計(jì)算答案,然后用你能懂的語言進(jìn)行呈現(xiàn)。
至于什么是Transformer、它為什么可以做到,這背后的技術(shù)點(diǎn),我們下文展開。
對于行業(yè)小白,我們先科普幾個(gè)這個(gè)行業(yè)關(guān)鍵詞:
- NLP:Natural Language Processing,自然語言處理。
- AGI:General Artificial Intelligence,通用人工智能。
- LLM:Large Language Modle,大語言模型。
- AIGC:AI-generated content,互聯(lián)網(wǎng)人應(yīng)該都聽過UGC、PGC,沒錯(cuò)這個(gè)就是AIGC,AI生成內(nèi)容。
連起來造句就是:要想讓AI達(dá)到通用人工智能(AGI)的程度,自然語言(NLP)領(lǐng)域的大語言模型(LLM)能力是非常重要的,大語言模型(LLM)領(lǐng)域有一個(gè)重要的應(yīng)用就是AIGC。
二、GPT大模型背后的關(guān)鍵技術(shù)點(diǎn)
如果你想要研究清楚GPT背后的技術(shù)點(diǎn)以及發(fā)展脈絡(luò),可以先從以下幾個(gè)概念入手。
1. Transformer
你可以理解為他是一個(gè)特征提取器,中文語義:轉(zhuǎn)換器,他的目的就是把你給他的文本數(shù)據(jù)進(jìn)行理解學(xué)習(xí),形成他認(rèn)為的人類語法。有資料說明,光GPT3就用了45TB的文本數(shù)據(jù),涵蓋中文、英文等多國語言,模型生成了超1.7萬億的參數(shù)。就像一個(gè)一兩歲的孩子,沒背單詞、沒背語法、沒學(xué)拼音也會(huì)說話一樣。這中間的實(shí)現(xiàn)就是這個(gè)模型在起作用。所以也堪稱暴力美學(xué)。
用技術(shù)術(shù)語說,Transformer的核心是自注意力機(jī)制(self-attention),它可以讓模型在處理序列數(shù)據(jù)時(shí),將不同位置的信息加權(quán)組合起來,從而更好地理解輸入序列的結(jié)構(gòu)和含義。這其中的核心手段是編碼和解碼,即Encoder和Decoder。
Encoder把輸入文本編碼成一系列向量,Decoder則將這些向量逐一解碼成輸出文本。在每一個(gè)Encoder和Decoder中,都有多個(gè)自注意力層和前饋神經(jīng)網(wǎng)絡(luò)層組成。這些層通過不斷傳遞信息和調(diào)整參數(shù),最終將輸入轉(zhuǎn)化為一個(gè)意義準(zhǔn)確的輸出。
2. MLM(Masked Language Modeling)
MLM(掩碼語言模型)是 GPT 預(yù)訓(xùn)練中的一個(gè)關(guān)鍵技術(shù)點(diǎn),其目的是通過對輸入序列中的部分單詞進(jìn)行遮蓋,使模型在預(yù)測下一個(gè)單詞時(shí)能夠?qū)W習(xí)到上下文的信息。簡單但很巧妙。
在MLM中,模型會(huì)在輸入的文本序列中隨機(jī)選擇一些單詞,并將其替換為特殊的MASK標(biāo)記。模型的任務(wù)是預(yù)測這些MASK標(biāo)記所代表的單詞是什么。因?yàn)槟P椭荒苡^察到MASK標(biāo)記周圍的文本,因此它需要對上下文進(jìn)行建模,以便正確地預(yù)測MASK標(biāo)記所代表的單詞。Transformer、MLM等等這些架構(gòu)、算法和模型設(shè)計(jì)讓GPT問世,而Prompt和Fine-tune可以讓我們能更好的使用他。
3. Prompt
中文語義:提問、提示語。在與ChatGPT對話的時(shí)候,我們的輸入即為prompt,想要讓GPT更好的理解我們的意圖,那prompt的精度就決定了這個(gè)大模型能否高效理解我們的意圖。
特別是在AIGC領(lǐng)域,只要你能想到,他就可以給你反饋。如果把GPT看做一個(gè)知識的海洋、一個(gè)可以持續(xù)再生的金庫,人類想要攫取,那Prompt會(huì)變得非常非常非常重要,它就是那個(gè)金鑰匙。
4. Fine-tune
中文語義:微調(diào)。企業(yè)在應(yīng)用AI能力時(shí),GPT可以定義為一個(gè)理解自然語言的初始模型,為了更好地應(yīng)用在業(yè)務(wù)場景中,可以在GPT的基礎(chǔ)上進(jìn)行微調(diào),理解為一個(gè)有監(jiān)督學(xué)習(xí)的過程,喂給他我們的業(yè)務(wù)數(shù)據(jù)或領(lǐng)域數(shù)據(jù)集,讓他能讀懂我們的業(yè)務(wù)數(shù)據(jù)并按需輸出。
三、大語言模型對軟件產(chǎn)品的改變
1. 用戶需求被直觀暴露
目前的軟件產(chǎn)品,用戶的真實(shí)需求主要是通過在軟件產(chǎn)品內(nèi)的行為數(shù)據(jù)進(jìn)行發(fā)現(xiàn)和理解,如監(jiān)控用戶反復(fù)查看某個(gè)商品、用戶搜索了某個(gè)商品、用戶將什么商品添加到了購物車,基于此進(jìn)行分析、預(yù)測,根據(jù)用戶行為反饋再進(jìn)行調(diào)優(yōu)。
當(dāng)有了自然語言處理的能力,用戶會(huì)直接暴露自己的需求,如“我需要購買從北京到三亞的往返機(jī)票,旅途5天,希望有一半時(shí)間住民宿,機(jī)票和住宿一共7000元預(yù)算,請給我提供一個(gè)規(guī)劃”。
這種簡單粗暴的交互,會(huì)迭代目前“業(yè)務(wù)與行為數(shù)據(jù)采集、數(shù)據(jù)聚合與處理、用戶畫像建模、人/物標(biāo)簽計(jì)算、推薦算法、反饋調(diào)優(yōu)”的整套數(shù)據(jù)工程。當(dāng)下自然語言所暴露出來的需求會(huì)在數(shù)據(jù)集中占更大的權(quán)重。
2. 新的人機(jī)交互
ChatGPT、Midjourney+Discord、文心一言等現(xiàn)在都是通過聊天框模式提供服務(wù)。這確實(shí)也是人與機(jī)器通過自然語言溝通最理想的方式。但chat模式不是當(dāng)前人機(jī)交互的終極形態(tài)。
人與機(jī)器交互,想要達(dá)成期望結(jié)果,對話框、對話框+命令行、對話框+插件并不是當(dāng)前人機(jī)交互的終極形態(tài)。
所以chat不是結(jié)果,但,已成必須。
比如我們的日常學(xué)習(xí)某一軟件,特別PS、數(shù)據(jù)分析工具等,學(xué)習(xí)門檻很高,這是因?yàn)檐浖O(shè)計(jì)是自下而上的設(shè)計(jì),人機(jī)交互的連接點(diǎn)是鼠標(biāo)(或約等于鼠標(biāo)的手指)。
想要讓軟件以及他的宿主——計(jì)算機(jī),識別你的意圖,開發(fā)者需要完全依賴于鼠標(biāo)在計(jì)算機(jī)上的點(diǎn)擊、拖拽、滾動(dòng)等交互方式來設(shè)計(jì)軟件反饋。而現(xiàn)在,有了一種新的范式,就是自然語言。基于LLM這樣的大模型,機(jī)器已經(jīng)或逐步可以足夠理解人類的語言并做出正確的反映。如果再有鼠標(biāo)的交互加持,人類使用機(jī)器的效率會(huì)有更大程度的提升。
所以自然語言交互可能會(huì)成為所有軟件產(chǎn)品的必須。
3. 插件化一些軟件,再淘汰一些軟件
軟件的工具如 word、PPT、EXCEL、印象筆記、Xmind、github正在“+AI”以降低使用成本了。你可以自研AI能力,也可以讓自己被插件。當(dāng)新的用戶習(xí)慣被養(yǎng)成,那些不能AI化的軟件會(huì)顯得異常難用。
比如一個(gè)數(shù)據(jù)分析平臺,
如果數(shù)據(jù)查詢只能通過自助式點(diǎn)選,而不是問答式就會(huì)面臨用戶體驗(yàn)差評,如果數(shù)據(jù)查詢報(bào)表還需要人來去總結(jié)數(shù)據(jù)基礎(chǔ)表征,而不是自動(dòng)進(jìn)行總結(jié)也會(huì)面臨用戶體驗(yàn)差評。
于是,產(chǎn)品就會(huì)有逐步被棄用的風(fēng)險(xiǎn)。
4. 想象力變得更為重要
工具本身的術(shù)變得不是那么重要,AIGC類型的工具使用門檻相對變低,但對人的大腦反而提出了更高的要求。
人的想象力是無限的,但實(shí)現(xiàn)能力是有限的,而AIGC工具,他可以讓想象具象化,甚至在你創(chuàng)作過程中給你驚喜。
過去做一張如下的圖需要在設(shè)計(jì)軟件上進(jìn)行至少數(shù)小時(shí)的操作,初級選手光設(shè)計(jì)工具就得學(xué)習(xí)很久。如果這個(gè)需求是來自于客戶,那這其中的溝通和理解成本會(huì)變?yōu)楹艽蟮脑O(shè)計(jì)成本。
圖:在Midjourney平臺的創(chuàng)作而現(xiàn)在,你只需要描述你想要的,即使你要一個(gè)五彩斑斕的黑,AI也會(huì)實(shí)時(shí)給你一個(gè)他認(rèn)為正確的反饋,你可以基于此不斷用語言進(jìn)行調(diào)整或輔之以設(shè)計(jì)師的PS之術(shù)。
想象力變得越來越重要,甚至可以說得到了釋放。
四、值得思考的地方
1. 依然存在的學(xué)習(xí)成本
機(jī)器可以理解人類的語言,但并不代表可以精準(zhǔn)理解人的意圖。這之間的gap需要人去不斷對機(jī)器調(diào)優(yōu),如模型迭代,同時(shí)也需要人去了解機(jī)器的語法,比如現(xiàn)在的Midjourney、playground,你的提問或prompt的使用也是有語法的,并配合圖形界面上的一些控制功能。
圖:Midjourney的prompt“語法“,來自于網(wǎng)絡(luò)視頻
2. 置信度
說GPT一本正經(jīng)胡說八道,不是沒有證據(jù),這是我最近的實(shí)際測試。
我:140和290之間有多少個(gè)質(zhì)數(shù)?
ChatGPT:
140到290之間的質(zhì)數(shù)包括:149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293。因此,140到290之間有28個(gè)質(zhì)數(shù)。
我:直接告訴我有多少個(gè),而不是列出來。
ChatGPT:在140和290之間,共有28個(gè)質(zhì)數(shù)。
我:確定?
ChatGPT:是的,確定。
我:重新計(jì)算一下,再給我一個(gè)答案。
ChatGPT:非常抱歉,在上一個(gè)回答中我犯了一個(gè)錯(cuò)誤,實(shí)際上在140到290之間有23個(gè)質(zhì)數(shù)。感謝您的提醒,希望這次的回答能夠滿足您的要求。
你以為這就是正確答案?這還不算完,于是我讓他寫了一個(gè)python腳本:
代碼沒問題,我執(zhí)行了,于是:
沒錯(cuò),按ChatGPT給我的python執(zhí)行,答案是27。誒?換個(gè)角度想,他也會(huì)犯錯(cuò),是不是更像人類?
3. 可解釋性
可解釋是可信的前提。我們塑造了他,卻不了解他,如果他輸出了一個(gè)錯(cuò)誤的答案,但看起來是那么正確,這時(shí)候我們就得警惕了(就像文中那個(gè)求解質(zhì)數(shù)問題,看起來是那么正確),應(yīng)用在教育、醫(yī)療、建筑設(shè)計(jì)等領(lǐng)域,他輸出了一個(gè)錯(cuò)誤的藥方、他設(shè)計(jì)了一個(gè)尺寸差了幾公分的圖紙,如果他犯的錯(cuò)誤無法及時(shí)發(fā)現(xiàn),那他產(chǎn)生危害需要人類來買單。
我們需要了解他的決策動(dòng)機(jī)是如何生成的,沒錯(cuò),就是動(dòng)機(jī)。因?yàn)槿嗽跊Q策哪怕是犯罪,都會(huì)尋求背后的動(dòng)機(jī),是利他、利己還是此人有精神疾病,最終都會(huì)試圖用動(dòng)機(jī)來解釋。
不能只推導(dǎo)到用了什么計(jì)算框架和算法,然后就給他不停地喂數(shù)據(jù),要想讓他更好的為我們服務(wù),找到合適的時(shí)機(jī)影響他,而不是任由他,最后可能站在我們的對立面。
換句話說,“知其所以然”也是我們求知的源動(dòng)力。
4. 數(shù)據(jù)安全、用戶隱私與版權(quán)
數(shù)據(jù)是GPT的養(yǎng)料,用戶的數(shù)據(jù)從此變得越來越重要,想要微調(diào),普通用戶想要使用,需要貢獻(xiàn)一方數(shù)據(jù)。GPT無國界,但數(shù)據(jù)有國界。目前國內(nèi)中大型企業(yè)對GPT的API能力也仍處于封閉狀態(tài)(所以我們國家也一定會(huì)有自己的大模型,比如百度文心一言)。
關(guān)于版權(quán),我們看ChatGPT自己如何說:
“根據(jù)國際版權(quán)法,創(chuàng)作作品的版權(quán)通常歸原作者所有。但是,當(dāng)作品是由人工智能生成時(shí),問題就變得復(fù)雜了。因?yàn)槿斯ぶ悄鼙旧頉]有創(chuàng)作權(quán),它只是根據(jù)預(yù)設(shè)的算法和數(shù)據(jù)生成內(nèi)容。所以,根據(jù)現(xiàn)有的版權(quán)法律,AIGC的版權(quán)歸誰是一個(gè)尚未確定的問題。
另外,AIGC的版權(quán)問題還涉及到人工智能的產(chǎn)權(quán)和知識產(chǎn)權(quán)。在AIGC的生成過程中,通常會(huì)涉及到許多算法、數(shù)據(jù)、模型和程序等,這些都是有產(chǎn)權(quán)和知識產(chǎn)權(quán)的。因此,除了作品版權(quán)的問題之外,還需要考慮這些產(chǎn)權(quán)和知識產(chǎn)權(quán)的歸屬問題。
綜上所述,AIGC的版權(quán)問題是一個(gè)復(fù)雜的問題,需要在法律、技術(shù)和倫理等多個(gè)方面進(jìn)行探討和解決。我們需要尋求各方面的意見和建議,來制定適當(dāng)?shù)姆珊驼?,以促進(jìn)人工智能技術(shù)的發(fā)展和利用。”
5. 責(zé)任與義務(wù)
自動(dòng)駕駛時(shí)發(fā)生了事故,駕駛員需要承擔(dān)100%的責(zé)任。同樣的,使用AI工具工作,如果犯錯(cuò)了,無論是工具還是人為的錯(cuò)誤,那責(zé)任依然歸咎于人。
所以人類責(zé)任與義務(wù)的存在,決定了即使在AI時(shí)代,某些工作至少需要一個(gè)人來擔(dān)(bei)責(zé)(guo)。
6. 可持續(xù)性
這個(gè)大模型確實(shí)可以成為一個(gè)可持續(xù)再生的金庫,為人類服務(wù)。不過此時(shí),他已經(jīng)站在我們身旁,一同跟我們進(jìn)化,人類長高1厘米,他可能會(huì)長高3厘米。
但如果人類停止對他的數(shù)據(jù)輸入,無論是新的知識、新的研究、還是今天的新聞,甚至對他的答案不做任何反饋。那么他也會(huì)過時(shí)或不那么好用。為了有更多的金礦可以攫取,我們會(huì)進(jìn)入一個(gè)循環(huán),不停的喂養(yǎng)他,迭代他,對他的輸出再反饋,他也不停地進(jìn)化為我們服務(wù)。
五、職業(yè)發(fā)展
什么樣的職業(yè)會(huì)被取代,不如想想什么樣的職業(yè)會(huì)變得越來越重要。我覺得可以從兩個(gè)角度思考:
1. AI建造師
AI本身也是人創(chuàng)造出來的,如果他會(huì)取代一部分人的工作,那就走到上游去成為創(chuàng)造他的人。AI算法工程師、數(shù)據(jù)采集與治理專家、AI軟硬件產(chǎn)品設(shè)計(jì)與開發(fā)、芯片、AI領(lǐng)域新聞媒體,這些都是以AI為中心的上下游領(lǐng)域。
2. 會(huì)用AI的人
一部分會(huì)用AI工具的人已經(jīng)嘗到了甜頭,比如已經(jīng)在Youtube、B站分享AI工具使用以及做教程的up主,他們都是第一波會(huì)用AI的人,已經(jīng)賺到了AI啟蒙的紅利。
在企業(yè)內(nèi),AI可能不會(huì)完全替代某一崗位,但會(huì)替換掉一部分。如設(shè)計(jì)師、工程師,基礎(chǔ)工作可以交給AI來做,但AI輸出的結(jié)果需要有人審驗(yàn),更重要的是需要有人擔(dān)責(zé),所以也會(huì)需要部分專職。
專欄作家
一個(gè)數(shù)據(jù)人的自留地,公眾號:一個(gè)數(shù)據(jù)人的自留地。人人都是產(chǎn)品經(jīng)理專欄作家,《數(shù)據(jù)產(chǎn)品經(jīng)理修煉手冊》作者。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!