OpenAI在國內(nèi)的兩條應(yīng)用之路走不通了?

0 評論 1800 瀏覽 1 收藏 12 分鐘

OpenAI即將停止為中國大陸提供API服務(wù),可能導(dǎo)致中國企業(yè)和服務(wù)提供商轉(zhuǎn)向國產(chǎn)大模型。

接到奧特曼警告信的第一時間,專注出海電商服務(wù)的大模型領(lǐng)域創(chuàng)業(yè)者高瑞麟,緊急召開了一場辦公會,商討是否需要將公司業(yè)務(wù)遷移到國產(chǎn)大模型上去的棘手問題。

“遷移,(擔(dān)心)用戶會不會繼續(xù)買賬;不遷移,繼續(xù)(調(diào)用OpenAI API)的話,成本、合規(guī)風(fēng)險等都在提高?!?/p>

令高瑞麟陷入兩難的,是在奧特曼領(lǐng)導(dǎo)下的OpenAI的一封推送郵件。在6月25日發(fā)出的郵件中,OpenAI表示,從今年7月9日開始,將阻止來自非支持國家和地區(qū)的API(應(yīng)用程序接口)服務(wù)。受影響組織若希望繼續(xù)使用OpenAI的服務(wù),必須在其支持的國家或地區(qū)內(nèi)訪問。

這也意味著,不在支持地區(qū)范圍內(nèi)的中國大陸,將迎接OpenAI的“斷供”風(fēng)險。需要注意的是,ChatGPT爆紅以來,OpenAI其實一直未曾開放過中國市場的服務(wù)。

國內(nèi)大模型創(chuàng)業(yè)者李振告訴字母榜,當(dāng)前國內(nèi)想要訪問OpenAI的API,一般有兩個途徑:一是直接向OpenAI官方申請,這種方式更多適合個人開發(fā)者;二是通過采購微軟云服務(wù),間接接入OpenAI服務(wù),這也是當(dāng)前國內(nèi)唯一的合規(guī)渠道。據(jù)李振觀察,目前微軟云提供的OpenAI接入服務(wù)仍可以正常訪問。

通過上述兩種途徑,圍繞OpenAI的API,國內(nèi)大模型玩家也由此發(fā)展出了兩大應(yīng)用場景:科技大廠用以幫助訓(xùn)練自己的大模型,在模仿的基礎(chǔ)上追求趕超效果;中小企業(yè)則用來開發(fā)落地應(yīng)用,在實際使用中向客戶提供多樣性選擇。

對于更有實力和資源的大模型玩家而言,即便“斷供”政策正式生效,也可能擋不住它們繼續(xù)調(diào)用OpenAI的API的行為,“在一個全球化的市場中,很難存在徹底隔斷某一地區(qū)訪問權(quán)限的可能性,就是需要穿越多少圍欄的問題?!标P(guān)注大模型投資的恒業(yè)資本創(chuàng)始合伙人江一說道。

01

進入2024年,即便已經(jīng)出現(xiàn)了一眾號稱性能媲美GPT-4級別的國產(chǎn)基礎(chǔ)大模型,但調(diào)用OpenAI技術(shù)的需求仍然存在。

在江一接觸到的合作客戶中,有人明確提出希望提供OpenAI技術(shù)選項,“面對更開放、更發(fā)散性的問答時,OpenAI展現(xiàn)出來的答案還是更強一些?!?/p>

這也促使一些應(yīng)用開發(fā)商對不同的模型做起人為分割,簡單的問題推理,以及涉及垂類行業(yè)問答的場景,優(yōu)先調(diào)用國內(nèi)大模型,偏復(fù)雜推理和分析的內(nèi)容,就交給OpenAI。

具體運行環(huán)節(jié),有點類似當(dāng)前業(yè)內(nèi)推崇的MoE混合專家模型邏輯,當(dāng)客戶提出一個問題后,借助機器學(xué)習(xí)的匹配算法,先將問題分類,從而基于分類結(jié)果匹配對應(yīng)的模型服務(wù)商。但是否使用OpenAI服務(wù),還取決于客戶是否愿意為此多花錢,“充什么樣的會員套餐,給你供應(yīng)什么樣的大模型選擇范圍。”李振解釋道。

不同于應(yīng)用開發(fā)者的具體使用需求,那些同樣有著自研大模型野心的國內(nèi)廠商,通過接入OpenAI技術(shù),還能起到輔助刷榜的作用。

知名大模型測試集C-Eval就曾在官網(wǎng)置頂聲明,稱評估永遠不可能是全面的,任何排行榜都可能以不健康的方式被黑客入侵,并給出了幾種常見的刷榜手法,如對強大的模型(例如GPT-4)的預(yù)測結(jié)果蒸餾、找人工標(biāo)注然后蒸餾、在網(wǎng)上找到原題加入訓(xùn)練集中微調(diào)模型等等。

站在OpenAI的肩膀上,從模仿借鑒中快速趕超,則是國內(nèi)大模型玩家接入OpenAI技術(shù)的更重要目的。

去年12月份,字節(jié)跳動被爆出正在研發(fā)一個名為“種子計劃”(Project Seed)的AI大模型項目,但該項目在訓(xùn)練和評估模型等多個研發(fā)階段調(diào)用了OpenAI的API,并使用ChatGPT輸出的數(shù)據(jù)進行模型訓(xùn)練。

此舉違反了OpenAI的使用協(xié)議,根據(jù)規(guī)則,OpenAI禁止使用輸出開發(fā)競爭模型。因此,字節(jié)旗下部分GPT使用權(quán)限被OpenAI封禁。

字節(jié)官方坦陳,內(nèi)部技術(shù)團隊剛開始進行大模型的初期探索時,確實有部分工程師將ChatGPT的API服務(wù)應(yīng)用于較小模型的實驗性項目研究中,但“該模型僅為測試,沒有計劃上線,也從未對外使用?!?/p>

部分國產(chǎn)大模型在訓(xùn)練模型速度上快速起步的一大原因,同樣離不開對國外大模型的借鑒。去年11月被傳出套殼消息時,零一萬物在回應(yīng)字母榜中承認,在訓(xùn)練模型過程中,沿用了 GPT/LLaMA的基本架構(gòu),但需要說明的是,借鑒架構(gòu)并不能跟“套殼”或者“抄襲”直接劃等號。

不過,這確實幫助零一萬物縮短了模型研發(fā)時間。去年3月,李開復(fù)正式宣布將親自帶隊,成立一家AI 2.0公司,研發(fā)通用大模型。經(jīng)過三個月籌辦期,同年7月份,該公司正式定名“零一萬物”,并組建起數(shù)十人的大模型研發(fā)團隊。團隊成型四個月后,零一萬物便在11月份推出了“Yi”系列大模型產(chǎn)品,并借助Yi-34B霸榜多個大模型測試集。

02

在OpenAI“斷供”危機之下,國產(chǎn)大模型的戰(zhàn)略替代價值越發(fā)凸顯。在李振看來,從經(jīng)濟賬上考量,國內(nèi)公司直接調(diào)用國產(chǎn)大模型會是更為劃算的選擇。

搶在企業(yè)遷移之前,一些追求更高收益的個人開發(fā)者,已經(jīng)率先用國產(chǎn)模型替換掉了OpenAI。

2022年11月ChatGPT亮相后,受限于政策,一些人開始盯上國內(nèi)想要嘗鮮的用戶,做起了賣號生意。當(dāng)時,ChatGPT Plus官方訂閱價格為一個月20美元,國內(nèi)用戶想要使用,收費一般為共享號(供4-6個人使用)一個月50元左右,獨享號一個月170元左右。

但從2023年下半年開始,隨著越來越多國產(chǎn)大模型的發(fā)布,加上用戶對ChatGPT新鮮感的減弱,越來越多個人開發(fā)者已經(jīng)將技術(shù)底座從OpenAI換成了國產(chǎn)平替,訂閱價格也隨之下降,有的連續(xù)包年僅需198元。

現(xiàn)在,在App Store應(yīng)用商店中搜索“ChatGPT”,各類相似應(yīng)用程序充斥其中,ChatGtp4o、ChatGp4、ChatGp4o、ChatBPT 4.0、ChatGTB4……

如今,OpenAI的“斷供”之舉,給國產(chǎn)大模型廠商提供了一次搶奪中小企業(yè)用戶的遷移機會。

繼5月份字節(jié)、阿里、百度、騰訊等掀起大模型價格戰(zhàn)之外,從6月25日開始,一眾國產(chǎn)大模型玩家又紛紛祭出了零成本遷移計劃,再次加碼性價比之戰(zhàn)。

截至目前,包括智譜AI、百度、阿里、騰訊、百川智能、零一萬物、商湯科技、月之暗面等均已推出了OpenAI零成本遷移計劃。為加速用戶“搬家”,部分國產(chǎn)大模型還額外附送1千萬乃至1億Tokens,并配套調(diào)用、遷徙、訓(xùn)練等多項免費服務(wù)大禮包。

03

便宜,只是鼓動用戶遷移的必要條件。想要真正贏得用戶的青睞,國產(chǎn)大模型還需要做到更好用。

去年曾喊出史上最大降價的阿里云,并未能借助價格戰(zhàn)換來新的增長。聚焦到國內(nèi)公有云市場,阿里云市場份額不增反減。IDC發(fā)布的《中國公有云服務(wù)市場(2023下半年)跟蹤》報告顯示,2023下半年IaaS市場中,阿里云市場占比27.1%,位居第一。但在2023上半年中國IaaS市場中,阿里云市場份額則為29.9%。

更可況,在國產(chǎn)大模型降價的同時,OpenAI們也在降價。按奧特曼的話說,“OpenAI也可以將非常高質(zhì)量的AI技術(shù)成本降至接近零……”

想要增強大模型底座的產(chǎn)品吸引力,除了價格之外,更重要的比拼則在數(shù)據(jù)端。

2020年發(fā)布GPT-3時,OpenAI曾詳細公開了模型訓(xùn)練的所有技術(shù)細節(jié)。中國人民大學(xué)高瓴人工智能學(xué)院執(zhí)行院長文繼榮表示,國內(nèi)很多大模型其實都有GPT-3的影子。但隨著OpenAI在GPT-4上一改開源策略,逐漸走向封閉,一些國產(chǎn)大模型就此失去了可供復(fù)制的追趕路徑。

此后,各家大模型拉開技術(shù)差距的重點,越來越多體現(xiàn)在訓(xùn)練方法、數(shù)據(jù)配比、數(shù)據(jù)工程、細節(jié)參數(shù)、訓(xùn)練過程監(jiān)測技巧等細節(jié)之中。

即便在模型框架相同之下,不同的數(shù)據(jù)來源和數(shù)據(jù)訓(xùn)練方法加持下,最終訓(xùn)練出來的大模型性能依然會表現(xiàn)各異?!扒按竽P蜁r代,AI的主流是以模型為中心的單任務(wù)系統(tǒng),數(shù)據(jù)基本保持不變。進入大模型時代,算法基本保持恒定,而數(shù)據(jù)在不斷增強增大?!痹诋a(chǎn)業(yè)專家劉飛看來,相比算法和算力,數(shù)據(jù)可能是眼下阻礙國產(chǎn)大模型追趕OpenAI步伐的更大鴻溝,“魔鬼都藏在這些數(shù)據(jù)訓(xùn)練的細節(jié)里?!?/p>

在國內(nèi)大模型紛紛跨入萬億參數(shù)時代之后,對數(shù)據(jù)采集和訓(xùn)練的能力考驗再次提升。參數(shù)量的大小與最終模型呈現(xiàn)的效果之間,兩者“投入產(chǎn)出并不成正比,而是非線性的。”劉飛表示,“數(shù)據(jù)多只是一個定性,更重要的是考驗團隊數(shù)據(jù)清洗的能力,否則隨著數(shù)據(jù)增多,數(shù)據(jù)干擾也將隨之變大?!?/p>

本文由人人都是產(chǎn)品經(jīng)理作者【字母榜】,微信公眾號:【字母榜】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!