抖音追不上Sora
背靠抖音這顆大樹,剪映原本有很大機會在AI文生視頻領(lǐng)域的占得先機。但OpenAI發(fā)布Sora之后,被打了個措手不及;即便是奮起追趕,OpenAI還是搶先,剪映乃至整個字節(jié)又雙叒慢了。
在AI文生視頻這條熱門賽道,抖音旗下的剪映,正在被OpenAI的Sora越甩越遠。
近日,美國軟件巨頭Adobe宣布,將在知名視頻編輯軟件Premiere Pro的新版本添加多款文生視頻AI工具。近兩個月震動全球科技圈的Sora,以及兩款同類產(chǎn)品Gen-2和Pika,都會在不久的將來加入“Adobe全家桶”。
有了Sora等第三方AI工具的助力,新版Premiere Pro除了編輯處理預先拍攝的常規(guī)視頻外,還能根據(jù)用戶輸入的文本即時生成AI視頻,并將兩者融為一體。
Adobe放出了一條官方演示視頻:一個男人走向窗前,觀看整個城市的夜景。用戶無需拍攝實景,只需輸入一段文字,即可利用Sora生成一段城市雨夜的視頻,并與前面的視頻無縫銜接,效果幾可亂真。
Sora今年2月初次亮相,OpenAI放出幾段演示視頻,但并未公布產(chǎn)品進展和上線時間。如今,Sora被Adobe接納,表明過去幾個月又有不小進步,距離開放使用更近。
另一邊,背靠抖音的視頻剪輯軟件剪映,同樣朝著AIGC(人工智能生成內(nèi)容)方向前行。但截至目前,剪映尚未拿出令人驚艷的成績。
目前,剪映的AI玩法不少,包括一鍵成片、剪同款、AI克隆音色、數(shù)字人口播等,但并不具備根據(jù)文本直接生成視頻的能力。它的海外版本Capcut在2月底推出文生視頻功能,但效果距離Sora相去甚遠。
如今,Sora除了在技術(shù)和產(chǎn)品上領(lǐng)先剪映,還得到了Adobe的青睞。Adobe在全球擁有超3300萬付費用戶;Sora接入“Adobe全家桶”,有望獲取訂閱收入分成,從而初步構(gòu)建商業(yè)模式。
這也意味著,仍在打磨AIGC能力的剪映,追趕Sora的難度將越來越大。
剪映被外界視為抖音搭上AIGC時代快車的關(guān)鍵籌碼。得益于抖音的加持,剪映已成為用戶量最大的手機視頻剪輯軟件之一,每天產(chǎn)出大量短視頻;在此基礎(chǔ)上更進一步,從UGC(用戶生產(chǎn)內(nèi)容)邁向AIGC,似乎水到渠成。
今年2月7日,抖音功勛老將張楠辭去集團CEO職務,親自帶隊剪映。她在官宣職務變動的內(nèi)部信中稱,AI圖像生成對她產(chǎn)生很大的觸動,潛力巨大,并決定“放下一切”,義無反顧地出發(fā)。
剪映的發(fā)展根基不可謂不好,抖音的重視程度也很高。但兩個多月過去,剪映依然沒有太大動靜,Sora反而繼續(xù)高歌猛進。
在AIGC時代,抖音及其背后的字節(jié),似乎總是棋慢一著。
字節(jié)八年前布局AI,成立了專門的實驗室,招募大批業(yè)內(nèi)精英,但成果卻停留在內(nèi)容審核、自動翻譯、搜索服務等。2022年下半年,ChatGPT引爆行業(yè);字節(jié)隨即增加大模型投入,一口氣推出AI聊天機器人等十幾款應用,卻遲遲沒有拿出震動行業(yè)的技術(shù)和產(chǎn)品。
今年1月底的年度全員會上,字節(jié)CEO梁汝波感嘆,字節(jié)“該有的大公司病全有了”。他特別點名AI業(yè)務,稱:“公司層面的半年度技術(shù)回顧,直到2023年才開始討論GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司,都是在2018年至2021年創(chuàng)立的?!?/p>
如今,在立身之本的視頻內(nèi)容領(lǐng)域,OpenAI著著搶先,剪映乃至整個字節(jié)又雙叒慢了。
01
背靠抖音這顆大樹,剪映原本有很大機會在AI文生視頻領(lǐng)域的占得先機。
剪映2019年上線,2021年推出PC端的專業(yè)版。它顯著拉低了UGC視頻的創(chuàng)作門檻,普通人只需準備好素材、點擊幾下,就能生成一段質(zhì)量尚可的視頻,并一鍵發(fā)布至抖音。
此外,作為一款工具軟件,剪映還帶有一定的社區(qū)屬性。除了官方提供的視頻創(chuàng)作課堂外,用戶還可以參考達人制作的視頻模板進行創(chuàng)作,也就是“剪同款”。這有助于提高用戶留存率和活躍度。
依靠豐富的功能,以及與抖音深度綁定,剪映僅用了三年就獲得超1億月活躍用戶,躍升至同類軟件的第一名。
剪映海外版CapCut的增長同樣驚人。
Capcut上線于2020年,與TikTok關(guān)聯(lián)密切。移動應用分析平臺點點數(shù)據(jù)顯示,目前Capcut的月活躍用戶超2億。另據(jù)市場調(diào)研機構(gòu)data.ai的數(shù)據(jù),截至2023年8月,Capcut在iPhone和安卓端的用戶超4.9億,相當于TikTok全球用戶量的1/4。
除了用戶規(guī)模龐大,剪映在AI領(lǐng)域的另一個優(yōu)勢是“近水樓臺先得月”,坐擁大量可用于AI大模型訓練的視頻數(shù)據(jù)。
數(shù)據(jù)、算法和算力是AI大模型的三大基礎(chǔ)要素,其中數(shù)據(jù)是根基。要想提升大模型的綜合能力,就需要不斷“投喂”多模態(tài)數(shù)據(jù),主要是互聯(lián)網(wǎng)文本、圖像和視頻。
OpenAI、Adobe等公司都不直接掌握數(shù)據(jù),必須從第三方付費獲取,成本不菲。據(jù)媒體報道,OpenAI每年僅采購版權(quán)新聞文章授權(quán)的費用,就高達100萬~500萬美元;Adobe為了訓練自家的文生視頻大模型,以每分鐘3美元的價格,向另一個大模型服務Midjourney購買視頻片段。
相比之下,剪映在國內(nèi)綁定抖音、在海外背靠TikTok,每天有大量用戶使用它剪輯和上傳視頻。這讓剪映能夠以相對低廉的成本,接觸到大量視頻內(nèi)容,為訓練大模型、探索AI文生視頻功能打下基礎(chǔ)。
但從2019年至今,剪映并未研發(fā)出強大的AIGC能力,反而早早啟動了商業(yè)化。
剪映很早就上線了VIP會員,用戶每月支付二三十塊錢,可以使用專屬素材、精選模板等,AI玩法也被列為會員權(quán)益之一。根據(jù)官方介紹,AI玩法主要包括“無限創(chuàng)作”“無限運鏡”和“瞬息宇宙”,基于現(xiàn)有視頻素材進行AI美化編輯。
不難看出,剪映的AI玩法距離Sora這樣的文生視頻相去甚遠。此外,它的收費也并不低廉:會員每月可獲得1200積分,而使用一次“無限運鏡”就需要480積分。積分耗盡后,用戶可以選擇繼續(xù)充值,兌換比例為1元:100積分。
剪映誕生之初的定位是,盡可能拉低短視頻創(chuàng)作門檻,促進抖音UGC生態(tài)的繁榮。過去五年,它的確完成了這一任務,大量抖音爆款視頻背后,都有剪映提供技術(shù)和模板。特別是那些趣味特效視頻、踩點視頻,抖音紅人發(fā)布之后,大量用戶迅速群起效仿、共同推高熱度;沒有剪映的幫忙,恐怕不易做到這一點。
但如今看來,抖音還是把剪映的天花板設(shè)定地太低了。它原本有機會成為Sora這樣的劃時代產(chǎn)品,卻始終停留在視頻剪輯軟件的范疇。
今年以來,剪映開始奮起直追,但先機已失、對手已至,追趕難度也迅速增大。剪映被Sora甩開,字節(jié)在AI領(lǐng)域仍然沒能跳出“起大早、趕晚集”的怪圈。這也從側(cè)面印證了梁汝波此前批評的“平庸的重力”。
02
過度重視對業(yè)務的幫助,過早追求商業(yè)化,是剪映乃至整個字節(jié)AI板塊的難題。
剪映除了開設(shè)付費會員、將AI玩法納入權(quán)益包,還在APP內(nèi)增加了不少廣告位。例如,用戶點擊“剪同款”,映入眼簾的除了手機照片和視頻素材,還有懸浮在素材上方、幾乎毫無關(guān)聯(lián)的橫幅廣告。
作為一款用戶破億的工具軟件,剪映的常規(guī)投入和資金壓力并不會特別大。它之所以早早發(fā)展會員和廣告,或許與字節(jié)的做事風格和評判標準有關(guān)。
眾所周知,字節(jié)是一家超快節(jié)奏、高度內(nèi)卷的互聯(lián)網(wǎng)巨頭。如果個人、團隊或業(yè)務無法迅速帶來肉眼可見的產(chǎn)出,就有可能被調(diào)整,甚至徹底出局。即使是需要長期投入的AI,也無法跳出這一隱形的評判標桿。
早在2016年,字節(jié)就設(shè)立了AI Lab人工智能實驗室,并引入多位學界和行業(yè)精英。彼時,OpenAI同樣初出茅廬,正朝著通用人工智能的愿景前行,將自己視為非營利組織。
相比之下,AI Lab雖然名為“實驗室”,實際上仍然需要密切配合和服務業(yè)務。它的官網(wǎng)宣稱,其研究重點是開發(fā)為字節(jié)內(nèi)容平臺服務的新技術(shù);具體領(lǐng)域則包括自然語言處理、數(shù)據(jù)挖掘、計算機視覺、機器學習等,且和抖音各業(yè)務板塊貼合緊密。
隨后幾年,字節(jié)拿出了一系列AI工具,比如提供翻譯服務的Byte Translator,AI寫稿機器人Xiaomingbot,以及頭條和抖音的搜索服務等。它們固然頗有價值,但算不上突破AI領(lǐng)域認知邊界、定義AI發(fā)展范式的創(chuàng)新產(chǎn)品。
直到2022年下半年,OpenAI多年磨一劍,ChatGPT席卷全球,生成式AI成為全球科技公司競逐焦點,字節(jié)才把更多精力投入到這一新浪潮中。
已經(jīng)淡出字節(jié)一線管理的張一鳴,對AI產(chǎn)生強烈興趣,并鼓勵團隊大舉投入。字節(jié)跳動無法錯過AGI(通用人工智能),它是抖音和TikTok在全球發(fā)現(xiàn)新的增長機遇不可或缺的伙伴。
創(chuàng)始人發(fā)話后,字節(jié)各業(yè)務部門聞風而動。從那時起,字節(jié)陸續(xù)上線十多款AI產(chǎn)品,如豆包、話爐、扣子、Gauth等,剪映、飛書等也增添了AI功能。
但在這一輪大舉投入中,字節(jié)以業(yè)務需求為原點、對標競爭對手的做事邏輯被延續(xù)下來。豆包等產(chǎn)品均為現(xiàn)有AI技術(shù)的場景化應用,而非對于AGI的原生探索。
例如,去年3月,微軟上線整合了GPT功能的365 Copilot,全球辦公軟件市場為之震動。一個月后,飛書宣布即將上線AI助手“My AI”,以對話形式提供多種功能,包括優(yōu)化和續(xù)寫文字內(nèi)容、創(chuàng)建日程、自動匯總會議紀要、搜索公司內(nèi)部知識庫等。
一年后,GPT已經(jīng)在微軟“全家桶”遍地開花,帶動后者股價從250美元一路上漲至400美元以上。飛書卻沒能依靠My AI完成逆襲,反而在3月底宣布裁員。
又比如,Sora今年2月16日發(fā)布演示視頻,CapCut一周后就宣布推出這一功能,每人每天可免費生成5段視頻。CapCut的技術(shù)力顯然無法與OpenAI比肩,其文生視頻功能也較為簡陋;倉促上線、對標Sora,不免帶有蹭熱點、強行完成KPI的味道。
從張一鳴點名AGI至今,字節(jié)AI又走過了一年,并未顯著拉近與OpenAI的差距,甚至有擴大的趨勢。字節(jié)AI向?qū)嵱弥髁x的過度傾斜,不僅讓它錯失了以往的機遇,也有可能拖累追趕的步伐。
03
對于AI板塊各自為戰(zhàn)、圍繞業(yè)務打轉(zhuǎn)的局面及其危害,字節(jié)已經(jīng)有所察覺。
2023年11月,字節(jié)抽調(diào)多個部門的精兵強將,組建AI部門Flow。TikTok技術(shù)負責人朱文佳、字節(jié)產(chǎn)品與戰(zhàn)略副總裁朱駿、字節(jié)技術(shù)副總裁洪定坤、飛書產(chǎn)品副總裁齊俊元均加入其中。人員的“高配”,顯露了字節(jié)通過Flow統(tǒng)籌AI發(fā)展、消除重復建設(shè)的意圖。
目前,字節(jié)曝光度最高的AI產(chǎn)品——豆包、扣子、話爐等,均由Flow部門負責。剪映、飛書、大力教育等雖然也有AI業(yè)務,但聲量已經(jīng)逐漸被Flow蓋過。
另一方面,字節(jié)云雀大模型已經(jīng)打磨近一年時間,多模態(tài)大模型BuboGPT也取得進展,為Flow批量產(chǎn)出AI應用奠定根基。假以時日,F(xiàn)low有望扭轉(zhuǎn)字節(jié)AI總是慢人一步的局面。
不過,字節(jié)畢竟不是OpenAI,沒有微軟這樣的超級金主。AGI固然重要,但對于現(xiàn)有業(yè)務的拉動尚不明顯,需要更長時間的沉淀和打磨,才能釋放商業(yè)價值;字節(jié)對AGI的投入不可能無止境,必須考慮中短期的投入產(chǎn)出比。
短期來看,字節(jié)需要用錢、用人、用資源的地方很多,比如抖音貨架電商、生活服務等,都需要大量真金白銀。隨之而來的現(xiàn)象是,盡管Flow挑起了大梁,但字節(jié)AI依然呈現(xiàn)兼顧業(yè)務需求的傾向。
據(jù)Tech星球近日報道,抖音生活服務剛剛成立一支AI團隊,希望利用AI技術(shù)創(chuàng)造增量業(yè)務價值,且已開啟對相關(guān)AI產(chǎn)品的研發(fā),包括搭建生活服務相關(guān)的內(nèi)容創(chuàng)作平臺等。
抖音生活服務之所以拉起這樣一支隊伍,或許與競爭對手美團和餓了么的動作有關(guān)。
美團近日開始小規(guī)模測試AI助手服務“問小袋”,可為用戶推薦符合其需求的外賣商品,以及用餐建議。餓了么則在4月初面向零售行業(yè)商家發(fā)布“AI經(jīng)營助手”,可為商家智能生成各類經(jīng)營關(guān)鍵報表和關(guān)鍵數(shù)據(jù)。
在此情況下,不讓美團餓了么專美于前,或許是抖音生活服務入局AI的基本目標之一。
內(nèi)外因素影響下,字節(jié)沒有條件像OpenAI那樣厚積薄發(fā)。既要追趕AGI潮流,又要具備快速落地、服務業(yè)務的能力,是字節(jié)AI的雙重目標。
在張一鳴和梁汝波的督促下,外界無需質(zhì)疑字節(jié)做AI的決心。但倘若再過去一年、兩年,字節(jié)仍然跟不上OpenAI的節(jié)奏和水準,那么它或許應該考慮另一種選擇:退回“賣水者”的角色,做AGI訓練素材提供商。
如前所述,數(shù)據(jù)是大模型的三大基礎(chǔ)要素之一,而字節(jié)麾下的今日頭條、抖音、TikTok等,已經(jīng)積累了數(shù)以億計的文本、圖片和視頻。字節(jié)可以用這些數(shù)據(jù)訓練自家大模型,也可以考慮更進一步,在妥善解決安全和隱私問題的前提下,將其出售給OpenAI等第三方公司。
充當AGI時代的“賣水者”,其實是字節(jié)擅長的流量生意的變體。字節(jié)如今的現(xiàn)金?!獜V告和電商業(yè)務,都建立在流量變現(xiàn)的基礎(chǔ)上;如果把AI公司轉(zhuǎn)變?yōu)樾驴蛻?,那么字?jié)心心念念的第二增長曲線問題將迎刃而解。
另一方面,OpenAI既然能夠與微軟、Adobe合作,與字節(jié)合作也并非不可想象。畢竟,抖音和TikTok是Sora等AIGC服務最龐大的落地場景。倘若字節(jié)與OpenAI達成“競合”關(guān)系,那么字節(jié)將跳出一步慢、步步慢的循環(huán),在OpenAI的助力下搭上AI快車。
參考資料:
字母榜,《字節(jié)AI:失之PICO,收之飛書?》
字母榜,《Sora會“殺死”剪映嗎?》
光錐智能,《不甘只做AI 應用工廠,字節(jié)跳動補課大模型》
Tech星球,《美團抖音下注新戰(zhàn)場:內(nèi)測外賣助手“問小袋”,成立生活服務AI》
新智元,《3300萬剪輯師被革命, Sora、Pika、Gen-2將全面登陸Adobe》
撰文:彥飛,編輯:王靖
來源公眾號:字母榜(ID:wujicaijing),讓未來不止于大。
本文由人人都是產(chǎn)品經(jīng)理合作媒體@字母榜 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!