開源大模型和閉源大模型,打法有何區(qū)別?
現(xiàn)階段,各個公司都有自己的大模型產(chǎn)品,有的甚至不止一個。除了小部分開源外,大部分都選擇了閉源。那么,頭部開源模型廠商選擇開源是出于怎樣的初衷和考慮?未來大模型將如何發(fā)展?我們來看看本文的分享。
在對人工智能發(fā)展史的觀察中,我們發(fā)現(xiàn)了AIGC以及它背后的大語言模型在近年高速發(fā)展的諸多偶然與必然(可回顧歷史文章《關(guān)于AIGC崛起與行業(yè)發(fā)展,我有幾點(diǎn)小觀察…》
但近兩年,大批大語言模型應(yīng)用的涌現(xiàn)以及“百模大戰(zhàn)”的興起,卻與“模型開源”這個動作密不可分。
除了開放性,現(xiàn)階段的開源和閉源大模型在盈利模式、商業(yè)打法、發(fā)展策略等方面有何區(qū)別?頭部開源模型廠商選擇開源又是出于怎樣的初衷和考慮?未來開源和閉源大模型將如何發(fā)展?下文揭曉。
一、開源和閉源大模型的差異化打法
在大眾的認(rèn)知中,開源軟件往往指向完整共享源代碼,任何人都能使用、檢查、修改和分發(fā)其源代碼的產(chǎn)品。
在計算機(jī)科學(xué)與技術(shù)發(fā)展進(jìn)程中,Linux(操作系統(tǒng))、Python、JavaScript(編程語言和框架)、MySQL(數(shù)據(jù)庫)、Transformer(深度學(xué)習(xí)框架)等產(chǎn)品的開源都顯得意義非凡。
開源大模型雖屬開源陣營中的一員,但現(xiàn)階段大多數(shù)開源的大模型并不像開源軟件那樣共享完整的源代碼、數(shù)據(jù)集、訓(xùn)練過程等細(xì)節(jié),更多屬于權(quán)重方面的有限開源。
這里面有大模型開發(fā)的數(shù)據(jù)量級、訓(xùn)練復(fù)雜度等方面的原因。因?yàn)檫@層緣故,大多數(shù)開源模型更多依靠開源方來推動產(chǎn)品研發(fā)和迭代,社區(qū)貢獻(xiàn)度有限。
但即便如此,它讓大批開發(fā)者能在較低使用成本的基礎(chǔ)上,根據(jù)自身實(shí)際需求進(jìn)行靈活調(diào)整,并解鎖更多商業(yè)場景和收益,也足以極大刺激整個產(chǎn)業(yè)的發(fā)展與繁榮。
閉源大模型和大多數(shù)閉源軟件差異不大,通常指不對外分享源代碼,僅所有者能合法訪問、修改和分發(fā),經(jīng)封裝后對外進(jìn)行商業(yè)化變現(xiàn)的大模型產(chǎn)品。用戶一般只能在付費(fèi)后按既定方式使用。
區(qū)別于開源產(chǎn)品經(jīng)常采用的“開源方主導(dǎo)+社區(qū)共建”的開發(fā)模式,閉源大模型高度依賴開發(fā)方的自主研發(fā)和長線運(yùn)營,主要通過知識產(chǎn)權(quán)的價值貨幣化快速獲取收益。
因?yàn)殚]源大模型較之開源大模型存在更高的使用門檻,開發(fā)方會傾向于將大模型封裝成各種標(biāo)準(zhǔn)化的產(chǎn)品,方便各類開發(fā)商在此基礎(chǔ)上創(chuàng)建應(yīng)用,并按實(shí)際消耗的tokens量、專有許可費(fèi)等收費(fèi)。
為了豐富業(yè)務(wù)線,目前主流的閉源大模型廠商也有基于底層模型推出AI應(yīng)用,收取相應(yīng)的產(chǎn)品訂閱、調(diào)用、定制化等費(fèi)用,以擴(kuò)大整體營收。
兩者迥異的開發(fā)形態(tài)和商業(yè)模式,決定了開源大模型前期更多通過免費(fèi)/低價獲客和生態(tài)合作,壯大基本盤,實(shí)現(xiàn)對關(guān)聯(lián)業(yè)務(wù)的加持或業(yè)務(wù)場景及客源的拓展,服務(wù)于未來的財務(wù)增長。
而閉源大模型則更多采用“模型即服務(wù)”和應(yīng)用拓展,直接進(jìn)行商業(yè)變現(xiàn),服務(wù)于當(dāng)下的業(yè)績增長。
當(dāng)兩者結(jié)合,共同推動了大語言模型的發(fā)展,加速著通用人工智能時代的來臨。
二、主流玩家開源大模型的幾點(diǎn)思考
就在最近,業(yè)內(nèi)對開源和閉源大模型的討論聲不絕于耳。
孰是孰非這里不論,不過個人比較認(rèn)同“我們都是受益于開源成長起來的個人和公司”這句話(摘自360創(chuàng)始人周鴻祎的公開發(fā)言)。
而且,在整理媒體對當(dāng)下主流開源大模型掌舵人的采訪時,我們發(fā)現(xiàn):各家選擇開源自家大模型產(chǎn)品,背后的商業(yè)考慮與決策依據(jù)其實(shí)挺耐人尋味??偨Y(jié)起來,主要包含以下幾點(diǎn):
1)保障技術(shù)安全與良性發(fā)展。
比如包括Meta CEO扎克伯格、Mistral創(chuàng)始人Arthur Mensch等在內(nèi)的頭部開源大模型廠商leader都有提到:模型的開源會是保障大模型技術(shù)安全,解決安全漏洞的有效措施。
而且伴隨用戶使用的增加,能更好地集思廣益,改善模型適用性與標(biāo)準(zhǔn)性,實(shí)現(xiàn)良性發(fā)展。這點(diǎn)與以往的開源軟件宗旨算是一脈相承。
2)實(shí)現(xiàn)產(chǎn)業(yè)賦能。
鑒于當(dāng)前基于全棧國產(chǎn)化基礎(chǔ)軟硬件的平臺不多,已開源的多模態(tài)本土大模型產(chǎn)品也少,以中國科學(xué)院自動化研究所為代表的“國家隊”選擇開源自研的紫東太初大模型,則更多是想通過“大模型+小數(shù)據(jù)”的形式,推動大模型對產(chǎn)業(yè)帶來的賦能。
3)促成生態(tài)合作共贏。
作為開源大模型賽道的代表性廠商,Meta堅持開源Llama系列大模型,則很大程度上源于對未來發(fā)展的考慮。
在公開采訪中,Meta CEO扎克伯格曾表示:開源對Meta AI的未來發(fā)展有利。對于整個科技領(lǐng)域來說,大模型的開源也顯得意義深刻,能創(chuàng)造更多贏家。
國內(nèi)方面,以智譜為代表的本土大模型廠商,通過開源ChatGLM-6B,在加速全球下載量的同時,催生了600+優(yōu)秀大模型應(yīng)用開源項目,此舉進(jìn)一步推動了產(chǎn)業(yè)融合和AI生態(tài)建設(shè)。
4)為商業(yè)化做準(zhǔn)備。
雖然開源意味著很難直接大規(guī)模商業(yè)變現(xiàn),但作為獲客或打開知名度的手段,卻效果斐然。
比如2023年成立的Mistral AI ,因發(fā)布Mistral 7B、Mistral 8X7B兩大開源模型一舉成名,之后再推商業(yè)化模型,已能在業(yè)內(nèi)快速打開局面,近期官宣獲得6.4億美元B輪融資。
而Llama系列的開源讓Meta保持在AI領(lǐng)域的獨(dú)特優(yōu)勢,反哺社交、廣告等業(yè)務(wù)的同時,也打開了和云服務(wù)商、AI硬件平臺等合作的另一種可能。
除此之外,出于提升行業(yè)地位、擴(kuò)大商業(yè)機(jī)會等考慮,也推動著不少大模型開發(fā)商選擇了開源,以爭取在商業(yè)生態(tài)中的競爭優(yōu)勢或長遠(yuǎn)發(fā)展。
三、未來開源和閉源大模型將如何共處?
目前,有人認(rèn)為開源大模型和閉源大模型處在對立面,未來必將像零和博弈一般,你輸我贏,此消彼長。
不過在個人看來,兩者的關(guān)系未來很可能像開源軟件與閉源軟件一樣,長期共存,各自發(fā)展。
在這其中,開源產(chǎn)品能達(dá)到閉源產(chǎn)品很難企及的用戶覆蓋面與創(chuàng)新自由度,而閉源產(chǎn)品能更快、直接轉(zhuǎn)化為商業(yè)利益,進(jìn)一步提升產(chǎn)品迭代速度和服務(wù)質(zhì)量。
兩者就像Linux與Windows,Android與iOS,雖然有競爭,但互為補(bǔ)充,各自在擅長的領(lǐng)域開疆拓土。
只是在入局者越來越多、產(chǎn)品越來越卷的當(dāng)下,未來市場難免會經(jīng)歷洗牌,只保留少數(shù)頭部、更具有競爭優(yōu)勢的選手。
這也是眼下國內(nèi)外大模型廠商熱心于競爭生態(tài)位或出于商業(yè)化考慮,反復(fù)切換開源和閉源賽道,或豐富業(yè)務(wù)線以保持自身優(yōu)勢的一大原因。
比如谷歌在推出閉源大模型Gemini Ultra的同時,發(fā)布了Gemma 2B 和7B兩款開源模型產(chǎn)品。Mistral在推出Mistral 7B、Mistral 8X7B兩大開源模型后一炮而紅,新推出的旗艦版大模型Large 則為閉源產(chǎn)品。
出于成本壓力和商業(yè)化考慮,目前開源大模型廠商和閉源大模型廠商的界限正逐漸模糊。
不過拋開這些,就整個行業(yè)來說,開源和閉源大模型的百花齊放,推動了AI上層應(yīng)用生態(tài)乃至整個行業(yè)的繁榮,也為人們以較低門檻使用人工智能產(chǎn)品帶來了便利。
備注:本文原創(chuàng),首發(fā)司普科技,第三方首發(fā)人人都是產(chǎn)品經(jīng)理。有參考segmentfault、鈦媒體、智東西等,僅做分享。
本文由 @iseeworld 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Pixabay,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!