亚洲熟女AV天堂五月天，国产精品V欧美精品∨日韩蜜臀，国产无码精品一二三四区，深田咏美av一区二区，欧美丝袜中文更新，狠狠做五月深爱婷婷做完，欧美成人动漫综合一区二区三区，99久久精品少妇高潮喷水

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

拆解騰訊的“大模型觀”

數(shù)字力場(chǎng)

2023-09-15

0 評(píng)論 1070 瀏覽 2 收藏

15 分鐘

就在國(guó)內(nèi)大量大模型產(chǎn)品爭(zhēng)相亮相時(shí)，可以注意到，騰訊卻一直保持著自己的節(jié)奏。而就在最近，騰訊混元大模型也終于亮相了，那么如何解讀這“遲來”的到場(chǎng)？這篇文章里，作者嘗試拆解了騰訊的“大模型觀”，一起來看一下。

在《5000天后的世界》中，著名未來學(xué)家凱文·凱利預(yù)言：“在未來的50年里，AI將成為可以與自動(dòng)化和產(chǎn)業(yè)革命相提并論的，不，應(yīng)該是影響更為深遠(yuǎn)的趨勢(shì)?！?/p>

而今，大模型似乎就是那根杠桿。自ChatGPT問世以來，“工業(yè)革命級(jí)的生產(chǎn)力工具”“有史以來最大的平臺(tái)革命”“新范式的新拐點(diǎn)”之類的說法，已將大模型“封神”。

公開數(shù)據(jù)顯示，截至今年7月底，國(guó)內(nèi)已經(jīng)有130個(gè)大模型產(chǎn)品亮相或宣布?！鞍倌４髴?zhàn)”中的“百”，已非虛指。

有意思的是，在大廠們爭(zhēng)前恐后入局之時(shí)，騰訊卻一直保持自己的節(jié)奏。

9月7日，在2023騰訊全球數(shù)字生態(tài)大會(huì)上，騰訊混元大模型正式亮相，騰訊宣告全面擁抱大模型。

在廠商們爭(zhēng)搶頭啖湯時(shí)不出來，在大模型密集發(fā)布期不出來，等大模型的喧鬧消退后終于現(xiàn)身。

有人說這是“遲”，雖遲但到的遲，但騰訊方面更想說它是“實(shí)”，腳踏實(shí)地的實(shí)。這跟騰訊的“大模型觀”有些內(nèi)在相通——它追求的就是實(shí)用至上。

01

說到“混元”，許多人可能會(huì)想到道家的“混元即無極，無極生太極”?；煸?，是鴻蒙狀態(tài)，是萬物根源。

道可道，非常道。道家始祖老子曾說過“我有三寶，持而保之”，其中之一就是信奉敢為天下后。

而在“中國(guó)巴菲特”段永平的闡釋中，“敢為天下后”還有后半句：后中爭(zhēng)先。

騰訊早在2021年就推出了千億和萬億參數(shù)的NLP（自然語言處理）稀疏大模型，打破了CLUE三大榜單記錄，但混元大模型的推出也是千呼萬喚始出來。

“做三四月的事情，在八九月自有答案。”有些玩家在打通概念炒作跟對(duì)韭當(dāng)割鏈路后一哄而上，“三四月”的事情剛開始做就掏出了PPT，騰訊卻在“六七月”里不事張揚(yáng)，直到“八九月”有了答案才讓其面世。

騰訊董事會(huì)主席兼CEO馬化騰的那番話，為此提供了解釋：“我們最開始以為這（指AI大模型）是互聯(lián)網(wǎng)十年不遇的機(jī)會(huì)，但是越想越覺得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇?！?/p>

他認(rèn)為，“對(duì)于工業(yè)革命來講，早一個(gè)月把電燈泡拿出來，在長(zhǎng)的時(shí)間跨度上來看是不那么重要的。關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實(shí)實(shí)做好?！?/p>

馬拉松長(zhǎng)跑中，方向?qū)?、策略?zhǔn)往往比起步快更重要。

騰訊的通用大模型發(fā)布節(jié)奏，也被解讀為以慢為快，后中爭(zhēng)先。

混元大模型參數(shù)展示的樸實(shí)，似乎可堪佐證——沒有狂堆參數(shù)，也沒展示打了多少榜，騰訊方面主要披露了兩個(gè)數(shù)字：超千億參數(shù)規(guī)模，幾乎是當(dāng)前通用大模型的標(biāo)配；預(yù)訓(xùn)練語料超2萬億tokens，和目前最強(qiáng)開源模型Llama 2持平。

與樸實(shí)對(duì)應(yīng)的是實(shí)用取向：混元大模型不追求Chat（聊天）上的花哨，而追求應(yīng)用場(chǎng)景上的實(shí)效；不是基于國(guó)外開源模型訓(xùn)練求快，而是從零開始、全鏈路自研。

02

實(shí)用取向，指向的是讓大模型從“可用”變?yōu)椤昂糜谩薄?/p>

不得不說，當(dāng)下的大模型正陷入“又強(qiáng)大，又弱雞”的悖論：一方面，很多大模型在問答時(shí)能秀得一手好打油詩、抖出一番機(jī)靈，另一方面，在行業(yè)應(yīng)用中又沒太多實(shí)質(zhì)性用處。

大模型研究者李莉就認(rèn)為，現(xiàn)在很多模型的研究者和應(yīng)用的制作者，考慮的是如何讓別人記住自己，所以效果特別視覺化，“每個(gè)視頻讓人看得血脈賁張，我們紛紛表示太酷炫了，但是靜下心來，我們對(duì)于技術(shù)該怎么用一般都沒有答案……如果真正放到經(jīng)濟(jì)中，你會(huì)發(fā)現(xiàn)根本用不上?！?/p>

這正是ChatGPT熱度滑坡的主要原因：前不久，Newsweek調(diào)查顯示，ChatGPT的用戶數(shù)量已經(jīng)比今年年初高峰時(shí)期下降了近95%。用戶選的最多的理由就是，感覺“ChatGPT對(duì)工作的促進(jìn)能力沒有想象那么強(qiáng)”。

這難言奇怪：在行業(yè)應(yīng)用場(chǎng)景中，用戶在意的，可不是大模型能玩什么梗、扯什么淡，而是能否提供專業(yè)知識(shí)和行業(yè)數(shù)據(jù)。“大”不是最重要的，“?！辈攀恰hatGPT上生成的很多回答，就被指看上去專業(yè)，專業(yè)人士一看卻似是而非。

而今，隨著大模型進(jìn)入Gartner曲線的相對(duì)冷靜階段，越來越多的人已意識(shí)到，應(yīng)用場(chǎng)景是決定大模型能否走遠(yuǎn)的關(guān)鍵因素。沒有落地場(chǎng)景，就沒商業(yè)前景，也就難以走遠(yuǎn)。

正因如此，大模型行業(yè)正在從拼參數(shù)變?yōu)槠绰涞?，B端行業(yè)應(yīng)用已成主戰(zhàn)場(chǎng)。這勾勒出的，是大模型正從“技術(shù)力”轉(zhuǎn)向“生產(chǎn)力”的商業(yè)化圖譜。

▲中國(guó)大模型，很多都很注重跟應(yīng)用場(chǎng)景結(jié)合。

很早之前，騰訊對(duì)大模型的認(rèn)知就是：大模型的長(zhǎng)期價(jià)值將通過行業(yè)應(yīng)用來體現(xiàn)，絕不僅限于聊天機(jī)器人這樣簡(jiǎn)單的問答場(chǎng)景。

這次發(fā)布會(huì)上，騰訊就強(qiáng)調(diào)面向產(chǎn)業(yè)，明確要以提效為第一要義。騰訊高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生就表示，“大模型需要基于產(chǎn)業(yè)場(chǎng)景，與企業(yè)數(shù)據(jù)融合，才能釋放出最大的價(jià)值。”

以垂（垂直大模型）應(yīng)垂（垂直細(xì)分行業(yè)的需求），方為實(shí)用。今年6月，騰訊云從產(chǎn)業(yè)客戶需求場(chǎng)景出發(fā)，依托騰訊云TI平臺(tái)打造模型精選商店。這次發(fā)布的混元大模型，則將作為騰訊云MaaS服務(wù)的底座，為各業(yè)務(wù)領(lǐng)域提供支持。

推出的是為應(yīng)用而生的“從實(shí)踐中來，到實(shí)踐中去”的實(shí)用級(jí)大模型，而非花里胡哨的AI“大玩具”，就是“實(shí)”的體現(xiàn)。

03

實(shí)用取向，內(nèi)在要求是讓大模型更成熟更靠譜。

大模型要走入行業(yè)產(chǎn)業(yè)場(chǎng)景，就得減少“幻覺（即胡言亂語）”、避免“誘導(dǎo)（即誘導(dǎo)偏見或欺騙等）”。

克勞德·香農(nóng)認(rèn)為，信息的本質(zhì)是消除不確定性。但體驗(yàn)過的用戶都知道，當(dāng)下的大模型都有著很強(qiáng)的“不確定性”——它經(jīng)常會(huì)變成CheatGPT，給你胡編亂造一通。

若這只是大模型跟用戶相互“調(diào)戲”，那無非是提供了些笑料，可行業(yè)場(chǎng)景專業(yè)度要求高、邊際容錯(cuò)率低，若是提供了錯(cuò)誤信息，很可能引發(fā)嚴(yán)重后果。

正因如此，面向產(chǎn)業(yè)的大模型必須變得更專業(yè)更成熟更靠譜，不能是初看什么都懂、細(xì)看什么都不“?！薄?/p>

騰訊為此采取的策略可以歸結(jié)為兩點(diǎn)：1，全鏈路自研；2，將內(nèi)部業(yè)務(wù)場(chǎng)景當(dāng)“磨刀石”。

騰訊的混元大模型，從高速網(wǎng)絡(luò)、底層服務(wù)器到網(wǎng)卡、高速組網(wǎng)和平臺(tái)、模型、算法都是自研，AI基礎(chǔ)設(shè)施、機(jī)器學(xué)習(xí)框架、語料庫與模型算法等也是從零訓(xùn)練。

騰訊解鎖全鏈路自研，瞄準(zhǔn)的既是運(yùn)用自身的技術(shù)棧體系，實(shí)現(xiàn)根本的業(yè)務(wù)技術(shù)能力突破，也是利用自主體系的研發(fā)道路，更好地應(yīng)對(duì)旗下海量高并發(fā)業(yè)務(wù)的沖擊。

客觀上講，基于國(guó)外開源模型進(jìn)行“本土化改良”固然是一條更容易的路子，可大模型既然是工業(yè)革命級(jí)的機(jī)會(huì)，只依靠國(guó)外的“開源模型”遠(yuǎn)不夠。

▲BAT大模型的對(duì)照。

騰訊集團(tuán)副總裁蔣杰說：“外界其實(shí)一般多會(huì)用到知識(shí)圖譜，甚至搜索外掛來讓模型的檢索支持能力變得更強(qiáng)，騰訊也會(huì)用，但不能用的比例很高。我們一定要在整個(gè)的大模型的預(yù)訓(xùn)練階段把這個(gè)問題解決掉，控制掉。”依托自研的“探真”算法，混元大模型幻覺比例比其他開源大模型下降了30%到50%。

騰訊還在向外部推出大模型前，將其在騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等50多個(gè)內(nèi)部業(yè)務(wù)中先行驗(yàn)證。

先打磨好大模型產(chǎn)品，再拿出來服務(wù)行業(yè)產(chǎn)業(yè)，看上去，也是主打一個(gè)“實(shí)”。

04

實(shí)用取向，還得讓大模型回歸服務(wù)屬性。

湯道生說：“從一個(gè)大模型，到提供一個(gè)用戶可以感受到的服務(wù)，中間有很多的環(huán)節(jié)和工序。騰訊其實(shí)是提供整個(gè)端到端的AI服務(wù)流程中所需要的‘全鏈條工具’。我們的TI平臺(tái)就是一個(gè)能滿足整個(gè)工序、環(huán)節(jié)的需求，給客戶提供高效模型搭建服務(wù)的重要工具。這可能是大家比較少從友商那里聽到的?！?/p>

將基于自研的大模型技術(shù)能力開放，將其用于從田間到產(chǎn)線的很多角落，這注重的還是落地效果。

大模型很熱，但本質(zhì)上，大模型是信息化的下一幕。過去十多年的信息化對(duì)應(yīng)的時(shí)代大幕上，寫著的主題是“數(shù)字化”。大模型同樣是數(shù)智化變革的助推器。

只不過，以往互聯(lián)網(wǎng)發(fā)展撬動(dòng)的是流通環(huán)節(jié)減少、流通效率提升，以AI為代表的數(shù)字化工具要介入的層次更深——其核心是要增加基礎(chǔ)價(jià)值。

這就需要，將數(shù)字化觸角伸向生產(chǎn)端與供應(yīng)側(cè)，覆蓋包括從工業(yè)制造到冶金采礦、從港口運(yùn)輸?shù)睫r(nóng)林牧副漁的各行各業(yè)。

這對(duì)國(guó)內(nèi)大模型的發(fā)展不無啟示：自從ChatGPT面世后，中國(guó)大模型廠商跟OpenAI差距有多遠(yuǎn)，就成了行業(yè)關(guān)心的話題。

應(yīng)用場(chǎng)景，或許正是中國(guó)大模型彎道超車的突破口。

國(guó)家信息中心專家張振翼就指出，當(dāng)前美國(guó)在大模型發(fā)展中具備一定的領(lǐng)先優(yōu)勢(shì)，我國(guó)需要加強(qiáng)自身獨(dú)特優(yōu)勢(shì)的探索。在他看來，當(dāng)前我國(guó)發(fā)展大模型人工智能主要有三個(gè)方面的優(yōu)勢(shì)：應(yīng)用場(chǎng)景資源極為豐富、數(shù)據(jù)要素政策設(shè)計(jì)較為領(lǐng)先、在相關(guān)領(lǐng)域的技術(shù)創(chuàng)新上已經(jīng)具有一定積累等。

可以看到，在移動(dòng)互聯(lián)網(wǎng)時(shí)代，中國(guó)互聯(lián)網(wǎng)企業(yè)就憑著衣食住行康樂教和產(chǎn)業(yè)領(lǐng)域的豐富場(chǎng)景，跑通了模式，做大了規(guī)模。

在今天，中國(guó)龐大市場(chǎng)上積累了海量數(shù)據(jù)，包括物流、電商、醫(yī)療等各個(gè)領(lǐng)域的，各個(gè)行業(yè)數(shù)字化轉(zhuǎn)型的強(qiáng)烈需要，又為大模型落地提供了需求端支撐。

順勢(shì)而為，以實(shí)用實(shí)干之“實(shí)”，加速大模型的產(chǎn)業(yè)應(yīng)用，中國(guó)大模型從跟跑到并跑再到領(lǐng)跑的圖景，才會(huì)愈發(fā)可期。

作者：佘宗明

來源公眾號(hào)：數(shù)字力場(chǎng)（ID：shuzilichang），抵抗熵增，打撈有趣。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @數(shù)字力場(chǎng) 授權(quán)發(fā)布，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自?Unsplash，基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App