LLM/AIGC帶來(lái)的創(chuàng)新機(jī)會(huì)
2023年6月10日~11日,人人都是產(chǎn)品經(jīng)理舉辦的【2023數(shù)字化產(chǎn)品經(jīng)理大會(huì)·深圳站】完美落幕。遠(yuǎn)望資本創(chuàng)始合伙人@程浩老師,為我們帶來(lái)《LLM/AIGC帶來(lái)的創(chuàng)新機(jī)會(huì)》為題的分享。
ChatGPT的出現(xiàn)仿佛平地一聲驚雷,無(wú)異于第四次工業(yè)革命。大模型對(duì)于人類(lèi)的價(jià)值遠(yuǎn)超互聯(lián)網(wǎng)的價(jià)值,互聯(lián)網(wǎng)是搜索信息,大模型是理解信息。舉個(gè)例子,圖書(shū)館有成千上萬(wàn)的書(shū),互聯(lián)網(wǎng)能幫我們做的是找到這本書(shū),而大模型可以幫你理解、看懂、消化這本書(shū)。
而未來(lái)大模型對(duì)人類(lèi)工作的替代會(huì)從初級(jí)白領(lǐng)開(kāi)始,比如幫忙訂酒店機(jī)票的助理,發(fā)展到后面可能也會(huì)取代高級(jí)白領(lǐng),比如律師、醫(yī)生等。
這就帶來(lái)一個(gè)問(wèn)題:未來(lái),知識(shí)不是必選項(xiàng)。純知識(shí)性的、重復(fù)性的工作將會(huì)被取代,留下來(lái)的崗位,都是在做創(chuàng)新的崗位。這也將會(huì)對(duì)國(guó)內(nèi)的教育體系造成沖擊。
接下來(lái)講什么是LLM。這是一種壓縮技術(shù),提示語(yǔ)(Prompt)是解壓縮。涌現(xiàn)是解壓縮中,隨機(jī)組合出現(xiàn)新的內(nèi)容。它就相當(dāng)于基因突變,但大部分基因突變都是錯(cuò)誤的,涌現(xiàn)是好的基因突變。
泛化是LLM核心能力。什么是泛化?以前我在百度時(shí),做問(wèn)答的、客服的、新聞的都有自己的大模型和算法,但他們都只在垂直領(lǐng)域達(dá)到了59分,還不能商業(yè)化。而ChatGPT這個(gè)通用的模型,在每一個(gè)垂直領(lǐng)域都達(dá)到了80分,具有很好的泛化能力。
訓(xùn)練大語(yǔ)言模型模型,需要三個(gè)步驟。第一步是預(yù)訓(xùn)練,去互聯(lián)網(wǎng)找很多語(yǔ)料,無(wú)監(jiān)督學(xué)習(xí)。接下來(lái)第二步就是指令微調(diào),給Q&A,預(yù)訓(xùn)練做得好,指令微調(diào)的成本越低。第三步是reinforcement learning。根據(jù)用戶(hù)反饋不斷調(diào)整,你問(wèn)AI一個(gè)問(wèn)題,AI給你回答,你可以告訴他是對(duì)的,給他正向回饋;也可以告訴他是錯(cuò)的,要他進(jìn)行修正,讓AI不斷優(yōu)化。還包括對(duì)齊,比如對(duì)其價(jià)值觀,不能有地域歧視、殘疾人歧視等等。
這三個(gè)步驟中,預(yù)訓(xùn)練的成本是最高的,沒(méi)有上億都不要搞預(yù)訓(xùn)練。很多創(chuàng)業(yè)公司都是先找好一個(gè)預(yù)訓(xùn)練模型,再進(jìn)行后面兩個(gè)步驟。
從大模型角度來(lái)說(shuō),數(shù)據(jù)質(zhì)量是最重要的,其次是數(shù)據(jù)多樣性,然后是數(shù)據(jù)規(guī)模,再是模型,最后才是模型參數(shù)。這也解釋了為什么英文狀態(tài)下的大模型效果會(huì)更好,因?yàn)椴还苁菑臄?shù)據(jù)質(zhì)量還是數(shù)量或者多樣性上,英文都是遠(yuǎn)超其他語(yǔ)言的。
如今,千億參數(shù)可能是極限,未來(lái)的趨勢(shì)是小型化,比如把大語(yǔ)言模型集成到手機(jī)里。
未來(lái),還有一個(gè)趨勢(shì)是從GUI(圖形界面)到NLUI(自然語(yǔ)言交互)?,F(xiàn)在打車(chē)還需要用滴滴,訂外賣(mài)還要用美團(tuán),未來(lái)可以直接拿手機(jī)說(shuō)打車(chē)去機(jī)場(chǎng),訂票去上海。
現(xiàn)在幾乎每個(gè)企業(yè)都有自己的數(shù)據(jù)庫(kù),未來(lái)大語(yǔ)言模型也會(huì)像數(shù)據(jù)庫(kù)一樣,成為企業(yè)的重要基礎(chǔ)措施。
未來(lái)大語(yǔ)言模型會(huì)讓那些行業(yè)受益呢?主要是以文字語(yǔ)言交互為主導(dǎo)的行業(yè),對(duì)純數(shù)字化行業(yè)影響不大。
在C端領(lǐng)域,受益的可能是寫(xiě)作、問(wèn)答、總結(jié)、法律、招聘、售前、客服、營(yíng)銷(xiāo)等這些以文字交互為主的行業(yè)。
那么,想要做大語(yǔ)言模型,是用開(kāi)源模型還是閉源模型呢?像ChatGPT、文心一言這些都是閉源模型,但開(kāi)源模型的趨勢(shì)正愈演愈烈。
創(chuàng)業(yè)公司選擇開(kāi)源還是閉源呢?各有優(yōu)勢(shì)。開(kāi)源你只需要買(mǎi)TOKEN就好了,再加上 Prompt engineering和向量數(shù)據(jù)庫(kù)等。閉源的優(yōu)勢(shì)在于,保護(hù)數(shù)據(jù)隱私,并且可以不斷用數(shù)據(jù)填充完善自己的模型。
C端有做開(kāi)源的也有閉源的,但是B端幾乎都是開(kāi)源的。在做demo的時(shí)候,通常會(huì)用閉源的,效果最好,還不用買(mǎi)云計(jì)算資源,等到要形成行業(yè)壁壘了,再改回到開(kāi)源模型。
那么,大語(yǔ)言模型,也就是通用模型,它的泛化能力足夠好之后,是不是不需要垂直模型了?
不是的。通用模型很難替代垂直模型。
因?yàn)?0%的有價(jià)值的行業(yè)知識(shí)和數(shù)據(jù)都在企業(yè)防火墻內(nèi),通用模型沒(méi)辦法接觸到這些數(shù)據(jù),自然也就沒(méi)辦法推導(dǎo)出答案。并且,通用模型具有一定的模糊性,所以它更適合一些容錯(cuò)率高的、低價(jià)值的行業(yè)。垂直模型更適合容錯(cuò)率低的、高價(jià)值的行業(yè)。
比如炒股票、自動(dòng)駕駛這類(lèi)需要精確、可控的事情顯然不能用通用模型,但是聊天、寫(xiě)作就可以。
大語(yǔ)言模型有四個(gè)架構(gòu),最底層的是Infrastructure,例如算法、算力,這些和創(chuàng)業(yè)公司都沒(méi)關(guān)系,都是巨頭在參與。
第二層是large language models,比如ChatGPT、文心一言、通義千問(wèn)都是屬于第二層的。
第三層是LLMOPs,這層實(shí)際上是工具層,像向量數(shù)據(jù)庫(kù)就是典型的LLMOPs。
第四層是應(yīng)用APP。
最下面兩層沒(méi)有上億的資金很難做出來(lái),適合大公司去做,上面兩層比較適合創(chuàng)業(yè)公司,尤其是應(yīng)用層,可應(yīng)用的行業(yè)太多了。
那么,創(chuàng)業(yè)公司能不能做通用大語(yǔ)言模型呢?很難。
首先,缺乏先發(fā)優(yōu)勢(shì)。創(chuàng)業(yè)公司能突破大公司的包圍,核心原因就是你跑得快,有先發(fā)優(yōu)勢(shì)。要么是大公司沒(méi)看上、沒(méi)看懂或者走錯(cuò)方向了,所以創(chuàng)業(yè)公司能沖出來(lái)。但在大語(yǔ)言模型這塊,這些情況都不成立,每個(gè)大公司都無(wú)比重視。
第二,沒(méi)有Dummy Period?,F(xiàn)在做大模型已經(jīng)成為了共識(shí),但是創(chuàng)業(yè)公司要想跑出來(lái),那就得留有一定的非共識(shí)期來(lái)發(fā)育。
第三,缺乏場(chǎng)景。大公司都有很好的落地場(chǎng)景,比如百度可以把問(wèn)答和搜索引擎結(jié)合,騰訊的語(yǔ)言模型可以和微信結(jié)合。但是創(chuàng)業(yè)公司有什么可落地的場(chǎng)景呢?
在垂直領(lǐng)域,創(chuàng)業(yè)的機(jī)會(huì)還是挺多的。我分成B端、C端、國(guó)內(nèi)、國(guó)外四個(gè)方面來(lái)講。
在國(guó)內(nèi)做TO C的好處是什么呢?高爆發(fā)。在國(guó)內(nèi)幾個(gè)月做成幾百萬(wàn)DAU是非常有可能的。但問(wèn)題是什么呢?第一,壁壘低。你能做的,競(jìng)爭(zhēng)對(duì)手也能做。第二,C端的流量紅利沒(méi)了。想想大家手機(jī)的首頁(yè)APP已經(jīng)有多久沒(méi)更新過(guò)就知道了,幾年都不會(huì)下載一個(gè)新應(yīng)用。第三,巨頭抄襲。你做了一個(gè)APP,那字節(jié)跳動(dòng)、騰訊跟你做一個(gè)類(lèi)似的,你怎么辦?第四,合規(guī)成本高。做C端的大語(yǔ)言模型,用戶(hù)問(wèn)的問(wèn)題是千奇百怪的,指不定哪個(gè)問(wèn)題就違規(guī)了。第五,只能用國(guó)內(nèi)的大模型。
在國(guó)內(nèi)做TO B的好處是離錢(qián)近,壁壘相對(duì)高一些。但問(wèn)題是,天花板低。在中國(guó)做TO B最大的痛苦就是企業(yè)的付費(fèi)能力不好,這是受限于國(guó)內(nèi)B端市場(chǎng)的規(guī)模。中國(guó)的IT Spending只有美國(guó)的六分之一,國(guó)內(nèi)上市SaaS公司的人均產(chǎn)值只有30—60萬(wàn)人民幣。所以在中國(guó)做企業(yè)服務(wù)就比較辛苦,核心原因就是民企沒(méi)錢(qián)。
在國(guó)際做C端的好處是增長(zhǎng)快,問(wèn)題同樣是壁壘低,而且市場(chǎng)已經(jīng)是紅海了。并且,即使是海外AIGC獨(dú)角獸也面臨巨頭競(jìng)爭(zhēng)。
在國(guó)際做B端的好處是海外企業(yè)付費(fèi)好,天花板高。有垂直壁壘,巨頭不會(huì)進(jìn)入,而且國(guó)外的大模型相對(duì)更成熟。但問(wèn)題是團(tuán)隊(duì)得懂海外的企業(yè)服務(wù)市場(chǎng)。
最后,我們?cè)趧?chuàng)業(yè)的時(shí)候,是AIGC+還是+AIGC呢?這兩者的區(qū)別是你是用AIGC原生還是用AIGC賦能。比如要做一個(gè)客服系統(tǒng),一個(gè)團(tuán)隊(duì)是之前就做AI的,先做好了問(wèn)答機(jī)器人,再去添加客服系統(tǒng)的其他功能;另一個(gè)團(tuán)隊(duì)是本來(lái)就是做客服SaaS的,只不過(guò)之前的SaaS不是智能的而是人在后面回答,現(xiàn)在要把AI的自動(dòng)回答功能加到已有的客服系統(tǒng)里去。
如何判斷你更適合哪一種?第一個(gè)判斷依據(jù),如果公司70%的價(jià)值鏈都是AI,那么很顯然就適合AIGC+的賽道。如果本身是SaaS,而AI只占到10%,那顯然更適合+AIGC。第二個(gè)判斷依據(jù),看AI本身的技術(shù)壁壘怎么樣。如果你選擇AIGC+的賽道,那就必須補(bǔ)充業(yè)務(wù)工作流,完善價(jià)值鏈。未來(lái),AIGC+和+AIGC一定會(huì)相互滲透的。
大會(huì)直播回放
產(chǎn)品經(jīng)理大會(huì)舉辦至今,已經(jīng)成為了產(chǎn)品經(jīng)理職業(yè)發(fā)展的風(fēng)向標(biāo)。每一年的大會(huì),我們都聚焦行業(yè)發(fā)展的前沿動(dòng)態(tài)、熱點(diǎn)趨勢(shì),重點(diǎn)圍繞產(chǎn)品經(jīng)理人群的職業(yè)發(fā)展,為大家?guī)?lái)新方向、新思考。
今年的產(chǎn)品經(jīng)理大會(huì),在各自領(lǐng)域已經(jīng)取得結(jié)果的嘉賓們將現(xiàn)身說(shuō)法,從不同的視角告訴你如何應(yīng)對(duì)當(dāng)下的需求變化,探尋產(chǎn)品經(jīng)理的進(jìn)化方向!
目前,北京站https://996.pm/7gX2B,深圳站https://996.pm/zaGbp,大會(huì)視頻回放已上架,戳鏈接購(gòu)買(mǎi),即可收看!
本文為直播專(zhuān)場(chǎng)分享整理內(nèi)容,由人人都是產(chǎn)品經(jīng)理運(yùn)營(yíng) @Darcy 整理發(fā)布。未經(jīng)許可,禁止轉(zhuǎn)載,謝謝合作。
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。息存儲(chǔ)空間服務(wù)。儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!