“每天只睡5小時(shí)”,大模型在火熱落地中
大模型落地的第一批“明白人”出現(xiàn)了。他們?cè)隈R不停蹄的實(shí)踐中尋找著訣竅;同時(shí),大模型落地的成本已經(jīng)開(kāi)始下降。
中工互聯(lián)董事長(zhǎng)智振,最近經(jīng)常奔波于前往各地的高鐵上,見(jiàn)客戶、簽訂戰(zhàn)略合作、推進(jìn)大模型落地,“比起一個(gè)月前更忙了”。
3月中旬,智振曾向數(shù)智前線分享自己的工作狀態(tài)——“一天就睡5小時(shí),光戰(zhàn)略合作都忙不過(guò)來(lái)。今年的目標(biāo)是面向能源等工業(yè)領(lǐng)域,落地至少幾百、上千個(gè)大模型項(xiàng)目。”
而這種忙碌狀態(tài)同樣存在于數(shù)智前線接觸的多位行業(yè)大模型落地服務(wù)商中。業(yè)界觀察,行業(yè)大模型,正在以一種意想不到的速度,加緊落地。
水面之上,或許仍舊平靜無(wú)波,但水面之下,早已激流暗涌?!艾F(xiàn)在大家還在水面下,下半年應(yīng)該都會(huì)浮上來(lái)一些?!痹诮鹑谛袠I(yè)做大模型落地的寬客進(jìn)化CTO王舸說(shuō)。
一、“每周以10個(gè)項(xiàng)目的數(shù)量增長(zhǎng)”
被業(yè)界視作“大模型落地元年”的2024年,剛過(guò)去4個(gè)月,已經(jīng)涌現(xiàn)出火熱氛圍。
“去年,主要是試的人和看的人比較多,愿意付費(fèi)的人很少?!痹茊?wèn)科技聯(lián)合創(chuàng)始人茆傳羽告訴數(shù)智前線,但今年,付費(fèi)人群明顯多了起來(lái)。
一位行業(yè)人士觀察,以2024年春節(jié)開(kāi)工后第一天,國(guó)資委召開(kāi)“中央企業(yè)人工智能專題推進(jìn)會(huì)”為風(fēng)向標(biāo),大量央國(guó)企開(kāi)始大面積尋找合適的業(yè)務(wù)場(chǎng)景,市場(chǎng)氛圍被迅速帶動(dòng),大模型服務(wù)商們接洽的項(xiàng)目也在快速增長(zhǎng)。
“客戶現(xiàn)在熱情似火。”AI智能化服務(wù)企業(yè)眾數(shù)信科創(chuàng)始人兼CEO吳炳坤說(shuō),去年,都是他們主動(dòng)去找客戶,但今年元旦過(guò)后,已基本變成“被動(dòng)接洽需求”。2024年一季度尚未結(jié)束,這家公司處在PoC、走合同、實(shí)施交付等不同環(huán)節(jié)的需求數(shù)已有上百個(gè),遠(yuǎn)高于去年10余家的量級(jí),且每周在以10個(gè)的數(shù)量新增,“我們不得不開(kāi)始篩選”。
寬客進(jìn)化CTO王舸則透露,去年他們?cè)诖竽P蜕蠋缀鯖](méi)有落地項(xiàng)目,但今年,他們已經(jīng)簽約好幾個(gè)百萬(wàn)級(jí)的合同,涉及金融、電力、運(yùn)營(yíng)商等多個(gè)行業(yè)。其中,一些相對(duì)淺層次的需求,如大模型與傳統(tǒng)標(biāo)準(zhǔn)作業(yè)流程的結(jié)合,目前落地相對(duì)良好,但一些更深層次的需求,如專家經(jīng)驗(yàn)與大模型結(jié)合,還處于初級(jí)階段,“這塊的項(xiàng)目現(xiàn)在正在研發(fā)階段,下半年可能會(huì)有一些落地案例出來(lái)。”
“圍繞市場(chǎng)熱點(diǎn),主動(dòng)找來(lái)的客戶也有不少。”王舸進(jìn)一步說(shuō),比如個(gè)性化寫作場(chǎng)景,又如一些企業(yè)提出,是否能將數(shù)據(jù)要素和大模型這兩個(gè)今年最為火熱的概念結(jié)合起來(lái)。“比如數(shù)據(jù)入表,數(shù)據(jù)分級(jí)、分類,數(shù)據(jù)怎么溯源,以及數(shù)據(jù)需求方在交易所進(jìn)行數(shù)據(jù)交易時(shí),怎么在成千上萬(wàn)的數(shù)據(jù)產(chǎn)品中自動(dòng)匹配需要的數(shù)據(jù),這些都是大家在構(gòu)想和探索是否能用上大模型的方向?!?/p>
“大模型的加持,對(duì)現(xiàn)在大熱的‘?dāng)?shù)據(jù)要素×’三年規(guī)劃來(lái)說(shuō),是一個(gè)巨大的催化劑,能讓很多客戶很快地感受到數(shù)據(jù)帶來(lái)的價(jià)值?!崩顺痹瓶偨?jīng)理顏亮說(shuō)。
一些聚焦在更為垂直領(lǐng)域的大模型落地服務(wù)商,也明確感知到了變化。
云蝠智能創(chuàng)始人魏佳星告訴數(shù)智前線,他們主攻的基于大模型的智能客服業(yè)務(wù)線,今年比去年同期增長(zhǎng)了30%的訂單。而且今年的增長(zhǎng)要比去年更加穩(wěn)定。“去年3月,受大模型熱度刺激,我們?nèi)〉昧瞬诲e(cuò)的增速,但很快又在4月回落,但今年4月,不僅維持住了3月的增勢(shì),還繼續(xù)保持了增長(zhǎng)?!?/p>
高新興機(jī)器人首席技術(shù)官劉彪則透露,機(jī)器人已成為大模型最快落地的領(lǐng)域之一。今年底左右,他們結(jié)合大模型的機(jī)器人產(chǎn)品將可能全面商業(yè)化。目前,在工業(yè)領(lǐng)域,高新興巡檢機(jī)器人在解決“跑冒滴漏”的難題,處于試用階段;在物業(yè)等場(chǎng)景的煙火檢測(cè)已商用落地。
而一些服務(wù)商,已經(jīng)考慮規(guī)范化復(fù)制的問(wèn)題。中工互聯(lián)董事長(zhǎng)智振透露,今年開(kāi)始,他們將過(guò)去一年探索出的能做的方向全都產(chǎn)品化了,“一旦產(chǎn)品化,推廣復(fù)制就會(huì)很快”。
吳炳坤也告訴數(shù)智前線,由于產(chǎn)品化,他們一些客戶的交付落地時(shí)間,已經(jīng)從過(guò)去的三個(gè)月,縮短到半個(gè)月。而今年,這家公司的目標(biāo),也不再是要拿下多少個(gè)客戶,而是鎖定兩大行業(yè)、6個(gè)細(xì)分子行業(yè),做15個(gè)標(biāo)品化的產(chǎn)品出來(lái)。
“今年的大模型應(yīng)用肯定會(huì)爆發(fā),這個(gè)速度會(huì)比想象的要快得多?!?/strong>智振說(shuō)。
不過(guò)也有資深人士用“方興未艾”來(lái)形容大模型目前的落地勢(shì)頭?!敖衲晡覀兛吹胶芏囝^部企業(yè)都動(dòng)了起來(lái),但大多都還是一些單點(diǎn)的應(yīng)用或幾個(gè)場(chǎng)景的組合。”一些人士表示,大家都在等待C端和B端的殺手級(jí)應(yīng)用出現(xiàn)。
浪潮云CEO顏亮認(rèn)為,從單點(diǎn)到全流程植入才能帶來(lái)質(zhì)的變化,可能需要1~2年,其中關(guān)鍵是大模型要經(jīng)過(guò)周期性迭代,才能達(dá)到可用?!白疃鄡赡陼r(shí)間。競(jìng)爭(zhēng)會(huì)促成大家的互相學(xué)習(xí)和投入,我們感知到,2024年用戶在大模型上的投入,是2023在3~4倍以上。”
二、“在定價(jià)上遇到了‘挫折’”
春節(jié)過(guò)后,百度智能云渠道生態(tài)部總經(jīng)理陳之若他們發(fā)現(xiàn)一個(gè)現(xiàn)象,一些大模型服務(wù)商,在幫客戶做完P(guān)oC后,在定價(jià)上遇到了挫折。
“服務(wù)商起初自己也沒(méi)有概念,打個(gè)比方假設(shè)以前產(chǎn)品賣兩萬(wàn)塊錢,加了大模型后定價(jià)三萬(wàn)五,服務(wù)商覺(jué)得是比較合理的,因?yàn)槲医o你降本增效了,但客戶反饋‘效果不錯(cuò)但貴’。”于是,大家開(kāi)始掰扯定價(jià)、交付和服務(wù)的事情。
這對(duì)于服務(wù)商來(lái)說(shuō),既是挑戰(zhàn),也是一個(gè)積極信號(hào),因?yàn)榇竽P烷_(kāi)始邁出商業(yè)化的第一步了。
定價(jià)背后,也有關(guān)于ROI(投資回報(bào)率)的考量。
“客戶對(duì)于最終的產(chǎn)出物其核心關(guān)注的點(diǎn)就是ROI?!辈墉t說(shuō)。但大模型銷售的更多的是服務(wù),看不見(jiàn)摸不著,客戶不容易算出ROI。
“這就需要服務(wù)商去幫客戶把ROI明確出來(lái)?!?/strong>軟通動(dòng)力羅晟告訴數(shù)智前線。比如,給企業(yè)售后場(chǎng)景賦能。原來(lái)一個(gè)售后人員即使經(jīng)過(guò)好幾天的培訓(xùn),想要精準(zhǔn)找到每個(gè)產(chǎn)品的售后問(wèn)題,也要花十幾分鐘。但現(xiàn)在有了大模型助手,可以秒級(jí)輔助他們找到問(wèn)題。這對(duì)于客戶來(lái)說(shuō),就是一個(gè)ROI比較高突出的場(chǎng)景。
而曹璽介紹,當(dāng)下ROI的測(cè)算需要拿效果說(shuō)話,有時(shí)甚至是較為直觀的計(jì)算。比如,工作效率的具體提升,獲新客戶與客戶轉(zhuǎn)化的量化、購(gòu)買數(shù)字人的成本比對(duì)。
幾位行業(yè)人士談到了大模型替代員工的敏感問(wèn)題?!拔覀儾⒉皇钦f(shuō),大模型能減掉他們多少人,而是減少員工一些程序性的事物,提高效率,去做更有價(jià)值的事?;蛘呖梢杂懈噘Y源做新業(yè)務(wù)?!币晃淮竽P头?wù)商觀察,他們遇到一家醫(yī)院科室主任抱怨,自己手下那么多博士,整天在辦公室寫病歷,根本接觸不到患者。他們就想解決這個(gè)問(wèn)題。
三、大模型場(chǎng)景落地要“短平快”
場(chǎng)景的選擇,同樣考驗(yàn)服務(wù)商的能力。吳炳坤告訴數(shù)智前線,過(guò)去一年間,行業(yè)內(nèi)不乏“叫好不叫座”的情況?!按蠹业膱?chǎng)景需求很多,但都是在做PoC,真正要讓客戶愿意付錢,還有蠻大的門檻要邁過(guò)去?!?/p>
智振則總結(jié),“一年能回本,客戶很容易接受;三五年回本,客戶就要考慮考慮;7年回本,肯定得政策強(qiáng)制要求了。”這要求他們必須首先找到投資回報(bào)高的點(diǎn)來(lái)做。
為此,不少服務(wù)商都會(huì)選擇小點(diǎn)切入的策略,快速形成閉環(huán)來(lái)看效果。
比如新致軟件,最開(kāi)始實(shí)際是以咨詢師的身份,切入到膳魔師項(xiàng)目中,并在多輪溝通和探討中,發(fā)現(xiàn)了老板在了解公司運(yùn)營(yíng)情況時(shí)耗時(shí)過(guò)長(zhǎng)的痛點(diǎn)。通過(guò)在工作群中引入數(shù)字人,收集對(duì)話素材,并進(jìn)行模型微調(diào)后,實(shí)現(xiàn)對(duì)管理層需求的快速響應(yīng)。
“原來(lái)一個(gè)數(shù)據(jù)報(bào)表的訴求,大概需要2~3周,現(xiàn)在可以縮短到一天?!辈墉t告訴數(shù)智前線,這大大提升了管理層的決策效率。而在內(nèi)部跑通幾個(gè)場(chǎng)景后,新致軟件又幫膳魔師進(jìn)一步打通了外部場(chǎng)景,落地了to c的7×24小時(shí)的AI助理。
“我們現(xiàn)在所有項(xiàng)目都是按‘短平快’的方式去做實(shí)施。我們會(huì)幫客戶把一個(gè)大的需求,切到一個(gè)個(gè)比較小的點(diǎn),逐點(diǎn)試錯(cuò),逐點(diǎn)突破,而不是像以前做軟件一樣,一個(gè)項(xiàng)目做上半年一年,客戶才能看到效果?!辈墉t告訴數(shù)智前線,這樣既保證客戶能快速看到效果,也能根據(jù)客戶反饋,更快發(fā)現(xiàn)問(wèn)題,“少走彎路”。
“你要知道客戶到底在做一門怎么樣的生意,他最想達(dá)到的是流量盤活、轉(zhuǎn)化率還是更精準(zhǔn)的獲客?你要不斷的去了解客戶業(yè)務(wù)訴求,同時(shí)要不斷去做復(fù)盤和打磨?!辈墉t說(shuō)。
眾數(shù)信科也在場(chǎng)景選擇上提出了“小切口、大縱深”的策略。而為了避免大模型前期落地效果與客戶預(yù)期之間因偏差而導(dǎo)致客戶中途放棄的情況,有經(jīng)驗(yàn)的大模型服務(wù)商,在鎖定某個(gè)場(chǎng)景后,還會(huì)主動(dòng)降低客戶的心理預(yù)期。
中工互聯(lián)智振也告訴數(shù)智前線,大家現(xiàn)在的想法都是優(yōu)先把一個(gè)點(diǎn)打透,然后再基于這些成功的經(jīng)驗(yàn),做全鏈條的整合?!艾F(xiàn)在已經(jīng)有客戶與我們做了兩年的規(guī)劃,一點(diǎn)一點(diǎn)來(lái)做?!敝钦裾f(shuō)。
技術(shù)和服務(wù)的延續(xù)性也被重點(diǎn)強(qiáng)調(diào)?!拔医?jīng)常被問(wèn)到,大模型技術(shù)發(fā)展那么快,我們之前的選擇的大模型會(huì)不會(huì)過(guò)時(shí)?為它做的定制、數(shù)據(jù)標(biāo)注會(huì)不會(huì)失效?”百度智能云AI與大數(shù)據(jù)總經(jīng)理忻舟說(shuō)。
吳炳坤也告訴數(shù)智前線,大模型迭代太快了,但企業(yè)內(nèi)部又基本沒(méi)有專門的AI人才。這就要求服務(wù)商要形成一種新的思維——大模型時(shí)代的項(xiàng)目不再是交鑰匙工程,而是需要提供教練式的陪跑服務(wù),“陪著客戶不斷優(yōu)化它自有的模型”。
四、大模型落地成本在下降
企業(yè)一旦在某個(gè)場(chǎng)景驗(yàn)證模型的價(jià)值后,第二步關(guān)心的就是如何降低成本。
“現(xiàn)在最常見(jiàn)的成本區(qū)間,主要有兩級(jí)?!睂捒瓦M(jìn)化CTO王舸告訴數(shù)智前線,一些簡(jiǎn)單應(yīng)用,比如個(gè)性化寫作、在傳統(tǒng)BPM流程中串接大模型能力等,一般可以直接調(diào)用API,成本較低,二三十萬(wàn)元即可實(shí)現(xiàn)落地。另一極則是一些需要與專家經(jīng)驗(yàn)深度綁定的項(xiàng)目,會(huì)有私有化部署要求,成本普遍在百萬(wàn)元起,甚至四五百萬(wàn)。
“二三十萬(wàn)元的市場(chǎng),今年會(huì)非常卷,而跟業(yè)務(wù)深度綁定的市場(chǎng),是大家想做,但目前做起來(lái)還比較困難的市場(chǎng)?!蓖豸凑f(shuō),尤其是需要私有化的項(xiàng)目,算力會(huì)是一個(gè)比較大的困難。
實(shí)際上,為了解決算力難和成本過(guò)高的問(wèn)題,業(yè)界目前已經(jīng)探索了一些方法。比如,企業(yè)除了使用純私有化的模式,也可以選擇“公有云的私有化”模式,即在公有云上開(kāi)一個(gè)私有化的環(huán)境,達(dá)到節(jié)省成本的目的。
“目前,像銀行等有著嚴(yán)格數(shù)據(jù)不出域要求的金融企業(yè),基本都還是采用前一種私有化,而在零售、酒店和文旅等數(shù)據(jù)管控沒(méi)那么嚴(yán)格的行業(yè),則有不少企業(yè)傾向于選用后一種模式?!毙轮萝浖墉t告訴數(shù)智前線。
算力不足的情況下,通過(guò)CPU進(jìn)行推理,也被不少人視為一個(gè)可選方案。“7B以下的模型,一般的推理場(chǎng)景,CPU目前是能夠滿足的。模型再大一點(diǎn),30B~70B,速度會(huì)明顯變慢,但一些不需要實(shí)時(shí)交互的場(chǎng)景,CPU也是一個(gè)比較好的解決方案?!蓖豸凑f(shuō)。
更重要的是,模型輕量化的趨勢(shì),以及MoE概念的火熱,也降低了企業(yè)客戶對(duì)算力資源的訴求。
可以看到,通用大模型參數(shù)雖然已從上千億走到萬(wàn)億級(jí),但具體到行業(yè)落地上,卻不是參數(shù)規(guī)模越大越好。在海外,Meta發(fā)布的Llama系列模型,從70億、130億、330億到700億不等。在國(guó)內(nèi),百度、阿里、百川等都發(fā)布輕量級(jí)大模型。
“很多場(chǎng)景其實(shí)并不需要全知全能的能力,而是需要一個(gè)行業(yè)專家來(lái)解決一些專業(yè)的問(wèn)題?!眳潜ふf(shuō)。根據(jù)他的經(jīng)驗(yàn),在很多垂類場(chǎng)景中,通過(guò)剪枝蒸餾等手段,壓縮出一個(gè)百億級(jí)的基礎(chǔ)模型,最大程度保留行業(yè)通識(shí)和能力,再結(jié)合企業(yè)的私有數(shù)據(jù),也能實(shí)現(xiàn)千億級(jí)的效果,推理成本更低,使用也更簡(jiǎn)單,是目前企業(yè)歡迎的做法。
“在行業(yè)中,我們認(rèn)為7B-70B性價(jià)比最佳。”浪潮云CEO顏亮透露。
吳炳坤告訴數(shù)智前線,通過(guò)模型輕量化,他們已將包含算力、模型、應(yīng)用等在內(nèi)的落地成本做到幾十萬(wàn)到小一兩百萬(wàn)元的成本。這也是不少中腰部企業(yè)普遍能接受的價(jià)格區(qū)間。智振則透露,現(xiàn)在做大模型私有化部署,成本已降到百萬(wàn)元起,一些小的嵌入式產(chǎn)品,比如1.6B參數(shù)、能放到一臺(tái)單機(jī)上的模型,甚至可以做到5萬(wàn)元起。
一些企業(yè)探索MoE(混合專家系統(tǒng)),以實(shí)現(xiàn)用更合適的性價(jià)比。MoE的全稱是Mixture of Experts,被認(rèn)為十分符合人類社會(huì)的分工概念,它通過(guò)“專家+路由”的機(jī)制,將不同問(wèn)題交給對(duì)應(yīng)領(lǐng)域的專家來(lái)解決,理論上能在算力成本不增加的前提下,顯著提升Transformer模型的性能。
去年年中,GPT-4曾一度被傳由8或16個(gè)MoE構(gòu)成,這一概念隨之在業(yè)內(nèi)引起關(guān)注。幾天前,騰訊混元宣布完成架構(gòu)升級(jí)到MoE。
智振告訴數(shù)智前線,大模型會(huì)和第二次工業(yè)革命中興起的電器一樣,“最終并非一個(gè)電器通用,而是會(huì)涌現(xiàn)出各種各樣的電器,從燈泡到電飯煲,它只會(huì)取決于不同場(chǎng)景下怎么樣的性價(jià)比最高,怎么樣的功能最強(qiáng),客戶接受度最高?!?/p>
李彥宏則在此前的一場(chǎng)演講中指出,未來(lái)大型的AI原生應(yīng)用基本都是 MoE 架構(gòu)。
值得關(guān)注的是,多位業(yè)內(nèi)人士告訴數(shù)智前線,MoE目前仍處于發(fā)展早期,還存在不少挑戰(zhàn)。一些人士認(rèn)為,它的技術(shù)復(fù)雜性太高,投入產(chǎn)出比不太匹配。也有人士表示,MoE需要資源較多,在響應(yīng)速度和算力占用方面還有較大提升空間。
過(guò)去半年,大模型的技術(shù)進(jìn)步速度極快,也推動(dòng)行業(yè)落地的大潮在快速演進(jìn)。
作者:周享玥,趙艷秋????????????;編輯:?;????
來(lái)源公眾號(hào):數(shù)智前線(ID:szqx1991),關(guān)注數(shù)字化和智能化。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @數(shù)智前線 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!