這一輪AI會帶來什么樣的范式轉(zhuǎn)移?
近期,人工智能的話題受到人們的關(guān)注與熱烈討論,那么,這一輪AI會帶來什么樣的范式轉(zhuǎn)移?本文從AI將改變軟件價值鏈、每個軟件應用都將包含AI、基礎模型最終將成為所有AI軟件的根基、機器學習的采用將類似于數(shù)據(jù)庫的采用四個方面做了分析,希望對你有所幫助。
Index Ventures是一家歐洲老牌的風險投資公司,成立于1996年,在AI領域投資了Scale、Aurora、Covariant、Cohere、Arthur.ai、Lightning、DeepScribe和Gong等公司,可以說是AI的忠實信仰者和倡導者。
此外Index還聚焦在游戲、平臺、SaaS和開源等領域的早期投資,就在上個月他們還成立了一只3億美金的種子基金,用于押注在這一輪衰退期出現(xiàn)的創(chuàng)業(yè)公司。
一、AI將改變軟件價值鏈
正如我們看到SaaS隨著云計算的興起而出現(xiàn)一樣,基于AI原生的產(chǎn)品也將帶來新的商業(yè)模式。
15年前,云計算的興起帶動了軟件平臺的轉(zhuǎn)變,迎來了軟件即服務(SaaS)的時代?,F(xiàn)在,企業(yè)不再需要配置服務器和數(shù)據(jù)庫,而是將這些工作外包給同時為數(shù)千個客戶服務的專業(yè)團隊。如今,開發(fā)新產(chǎn)品的公司可以專注在為特定的用戶工作流構(gòu)建令人難以置信的交互體驗,而不必擔心底層各類數(shù)據(jù)庫和服務的技術(shù)細節(jié)。
軟件即服務(SaaS)使得公司可以直接通過購買來使用任何不是其核心業(yè)務的軟件,而不再需要自己去花費大量金錢開發(fā)。這通常使得軟件產(chǎn)品更便宜,更安全,更彈性,同時迭代和改進速度更快。我們已經(jīng)看到軟件價值鏈在過去十年中發(fā)生了巨大的變化,這也帶來了技術(shù)生態(tài)系統(tǒng)的巨大變革。
Index Venture認為我們正處于新平臺轉(zhuǎn)變的早期階段,這一次是由AI驅(qū)動的。這種平臺轉(zhuǎn)移基于兩件事:
- 我們相信在十年內(nèi),AI將成為每一個應用軟件的核心組件。
- 這一波浪潮將由廣泛采用的基礎模型(foundation models)來推動。
正如云計算的興起打破了軟件價值鏈,并帶來了新商業(yè)模式的出現(xiàn),我們相信,隨著更多AI技術(shù)的落地,我們將看到類似的現(xiàn)象。我們并不確切地知道這些新的商業(yè)模式將會是什么,但是我們對軟件價值鏈如何變化有一些想法,并且開始看到了新模式出現(xiàn)的早期跡象。
例如,與十年前云服務商的崛起類似,我們看到了一類新公司的出現(xiàn),他們將專注于根據(jù)最前沿的研究來推出最新的基礎模型。我們認為這類公司將屈指可數(shù),因為它成本高昂,需要深度的知識來訓練和管理大型模型,而且像云服務商一樣,隨著時間的推移,產(chǎn)品在某種程度上應該是商品化的,它們的價值來自于巨大的規(guī)模效應。這些公司中的大多數(shù)會像云服務商一樣,采用某種按量付費的商業(yè)模式。
在應用層,我們相信,隨著時間的推移,商業(yè)模式將轉(zhuǎn)變?yōu)?strong>通過AI來解鎖更多針對客戶的價值。我們設想的世界不是簡單地為使用SaaS付費,而是客戶能夠根據(jù)產(chǎn)品內(nèi)的定制或個性化程度付費,例如針對行業(yè)、組織甚至個人進行微調(diào)的模型??紤]到這一點,我們(Index Venture)投資了像Gong和DeepScribe這樣的公司,隨著時間的推移,它們的商業(yè)模式受益于越來越多為用戶或客戶定制化的產(chǎn)品。
我們最初在2020年投資了Gong,他們的產(chǎn)品可以記錄銷售電話,并允許公司管理者來以此分析業(yè)績,發(fā)現(xiàn)客戶反饋的趨勢,并幫助培訓和指導銷售代表。當一個組織廣泛采用該產(chǎn)品時,Gong沉淀了他們與客戶對話產(chǎn)生的大量數(shù)據(jù)集。這反過來又幫助Gong更好地定制他們的產(chǎn)品,以高度個性化的方式服務于特定企業(yè)從而改善用戶體驗。
DeepScribe的產(chǎn)品可以記錄醫(yī)患對話,并使用AI為電子健康記錄生成結(jié)構(gòu)化的醫(yī)生報告。這是另一個例子,通過持續(xù)使用來增加產(chǎn)品對特定用戶(例如,具有特定風格的醫(yī)生)或一組用戶(例如,特定專業(yè)的醫(yī)生或遵循一致標準的特定醫(yī)院集團內(nèi)的醫(yī)生)的價值。
在這兩種情況下,隨著產(chǎn)品地持續(xù)使用,客戶將更多自己的數(shù)據(jù)放入產(chǎn)品中,AI能夠以高度定制化的方式進行改進。我們認為這是AI原生(AI-native)的公司建立護城河并隨著時間推移而持續(xù)獲得增長價值的一條途徑。
這也為新型的托管基礎設施(managed infrastructure)公司創(chuàng)造了機會,幫助軟件公司在基礎模型提供商之上提供Hyper-personalization。大規(guī)模的微調(diào)(fine-tuning)非常復雜,圍繞生成和管理大量數(shù)據(jù)和模型會面臨許多亟待解決的問題。
我們看到新一代基礎設施提供商正在崛起,并在努力抓住價值鏈中的這一環(huán)節(jié),類似于近幾十年來數(shù)據(jù)庫提供商的崛起。我們投資組合中的公司,如Scale AI (Index于2018年投資)和Humanloop (Index于2020年投資),都是致力于讓開發(fā)團隊不需要大量特定的機器學習專業(yè)知識,就可以更容易地在產(chǎn)品中部署模型。他們的產(chǎn)品允許用戶使用人工標簽和實時用戶反饋來比較和微調(diào)模型的性能。
二、每個軟件應用都將包含AI
AI-native的應用通常會戰(zhàn)勝AI-retrofit的應用。
在過去的20年里,我們看到了SaaS產(chǎn)品的激增,我們在日常工作的每個部分都可能使用到這些產(chǎn)品。當前這一代應用程序的構(gòu)建是為了支持端到端工作流和不同人員的協(xié)作。它們經(jīng)過精心構(gòu)造來處理用戶將遇到的許多邊緣情況,并且通常包含了眾多的集成服務和插件,來鞏固自身作為生態(tài)系統(tǒng)中心的地位。
許多SaaS軟件從根本上說就是一個基于數(shù)據(jù)庫的UI,用于跟蹤項目、文檔和操作的狀態(tài)。對于這些產(chǎn)品,我們逐漸看到AI將被用于特定的任務——無論是文檔處理、音頻轉(zhuǎn)錄還是編程。
在Index,我們與專注于正面應對AI挑戰(zhàn)的團隊合作,通過建立一流的團隊來解決高度重復的任務,比如在駕駛和倉儲領域。2018年,我們投資了Aurora,這是一家由Chris Urmson(Waymo的CTO)、Drew Bagnell(Uber的自動駕駛架構(gòu)師)和Sterling Anderson(特斯拉的自動駕駛總監(jiān))創(chuàng)辦的自動駕駛卡車公司。
我們相信,他們深厚的專業(yè)領域知識和對軟件的專注,將為他們提供最快的迭代速度和最通用的解決方案,使他們的自動駕駛技術(shù)能夠應用在卡車和乘用車上。
2020年,我們投資了Covariant,該公司為機器人構(gòu)建了一個AI大腦。他們商業(yè)化的重點是工業(yè)倉儲方向,該公司由機器人AI領域的兩位行業(yè)領袖彼得·阿貝爾(Pieter Abbeel)和彼得·陳(Peter Chen)創(chuàng)立。Covariant專注于構(gòu)建通用的AI機器人大腦,現(xiàn)在他們能夠以最少的AI訓練來滿足特定的客戶硬件要求。我們一直支持AI優(yōu)先的軟件,這些軟件可以定制化到不同的環(huán)境。
生成模型的最新發(fā)展(例如ChatGPT和Stable Diffusion)已經(jīng)將我們推向了一個捕捉世界想象力的AI超級引擎。當我們展望下一代SaaS應用程序時,我們看到AI發(fā)揮著越來越大的作用。讓我們特別興奮的是:
- 利用AI實現(xiàn)頭腦風暴、講故事和開放式創(chuàng)意工作流程的產(chǎn)品。我們已經(jīng)在藝術(shù)和文案領域看到了這一點,這些都是很好的用例,因為風險很低,同時當下工作流程高度手動化。
- AI應用于專業(yè)知識工作,如工程、法律和醫(yī)學。在這些情況下,人們?nèi)耘f需要關(guān)注輸出是否正確。這是當今流程高度手動化的另一個例子,因此ROI很容易測量。
- 將更多的AI工具嵌入到企業(yè)和生產(chǎn)消費者的工作流程中,例如我們在2020年投資了Hebbia,這是一個面向知識工作者的AI企業(yè)級搜索平臺。這些產(chǎn)品將幫助用戶更有效地溝通,吸收更多信息,更快速地搜索和處理數(shù)據(jù),它們將提高整個社會的總體生產(chǎn)力。當然做這種類型的產(chǎn)品會比前面兩種更加困難一些,因為企業(yè)需要來確保他們可以提供一致的用戶體驗。隨著模型變得更容易控制和理解,我們將看到更多創(chuàng)業(yè)者可以構(gòu)建出更可控制的產(chǎn)品,并能被大型企業(yè)采用。
對于以上這些類型的創(chuàng)業(yè)公司,我們認為其中的贏家將是那些可以開發(fā)出易于理解的產(chǎn)品,使模型界面易于學習,而不需要了解它們是如何工作的,能夠清晰地集成到目前存在的流程和工作關(guān)系的結(jié)構(gòu)中,并產(chǎn)生更精確和可控的輸出。這些產(chǎn)品將以符合人體工程學的方式給用戶顆粒度的控制和控制模型的選擇,這個感覺像是一個專門為用戶打造的模型,而不是用戶去適應現(xiàn)有的模型。
讓我們對AI原生應用世界感到興奮的是,隨著技術(shù)的發(fā)展,這提供了一個從零開始設計交互界面的機會。展望下一代產(chǎn)品,它們將從與用戶的交互中學習,用戶將擁有復雜的工具來指導模型輸出,使AI成為我們需要分析數(shù)據(jù)、生成內(nèi)容或解決重復任務時候的多模態(tài)助手。
三、基礎模型最終將成為所有AI軟件的根基
ML領域最新被人熟知的一個名詞是基礎模型(foundation model),這是指在大量數(shù)據(jù)集上“預訓練”后,但沒有特定最終用途的大型人工神經(jīng)網(wǎng)絡。OpenAI的GPT-3是一個很受歡迎的基礎模型,該模型經(jīng)過訓練,用于在給定之前的文本的情況下預測文件中的下一段文本。但是基礎模型可以通過在較小的手工標記數(shù)據(jù)集上進行“微調(diào)”,來執(zhí)行特定的任務,比如回答客戶的問題。
基礎模型可以帶來接近人類表現(xiàn)的能力水平,大多數(shù)AI模型都是根據(jù)特定任務的數(shù)據(jù)進行訓練的。比如機器人手臂被訓練來撿東西,自動駕駛汽車經(jīng)過訓練來實現(xiàn)自動駕駛。但是基礎模型消耗了來自整個互聯(lián)網(wǎng)的大量數(shù)據(jù),它的某些部分是過分的和令人討厭的,但它編碼了人類幾千年來學到的很多東西。我們的一個理論是,幾乎任何AI應用都可以從基礎模型的基本使用中受益。
一些人工任務看起來很有限,比如開車、在倉庫裝箱子或回答客戶的問題,但是我們經(jīng)常會在其中運用到從生活其他方面獲得的理解。然而接受單一任務訓練的機器沒有這種廣度,這就是為什么機器人看到傳送帶上的貓會不知道該怎么辦,這也是為什么自動駕駛汽車遇到不合邏輯的交通標志時就會停下來。人類可以根據(jù)我們對動物和建筑的了解,把這些東西放在特定環(huán)境中思考并繼續(xù)下去,這是人類的超能力。
我們相信,隨著時間的推移,工程師們將越來越多地從預先訓練好的基礎模型開始,然后在垂直的任務上對它們進行微調(diào)?;A模型不會讓孤立的AI模型變得“人性化”,但它們的使用將有助于模型理解最不尋常的環(huán)境,并幫助它們在這些環(huán)境中找到方向。
可以基于司機的行為來理解他們的情緒,這將有助于自動駕駛汽車行駛,可以理解一只偷偷跑進倉庫的貓不應該在傳送帶上,這將有助于機器人處理混亂情形。對于幾乎所有的AI模型來說,最困難的情況就是這種以前從未見過的“長尾”事件。
Cohere的聯(lián)合創(chuàng)始人Aidan Gomez作為聯(lián)合作者撰寫了一篇開創(chuàng)性的論文,這里面的核心內(nèi)容就是如今許多基礎模型的底層“transformer”架構(gòu)。我們在2021年領投了該公司的A輪融資,這里的投資邏輯是,就像十年前的云巨頭一樣,在這一領域也會出現(xiàn)少數(shù)服務商,他們抽象了開發(fā)、管理和托管這些模型背后令人望而卻步的復雜性。
在基礎模型像我們?nèi)祟愐粯诱嬲斫馐挛锏囊饬x之前,我們還有很長的路要走。但它們正在以驚人的速度進步,在不久的將來,它們將開始接近我們用來完成任務的知識能力。
四、機器學習的采用將類似于數(shù)據(jù)庫的采用
就像數(shù)據(jù)庫一樣,每個工程師都需要知道如何使用模型,但很少有人需要從頭開始構(gòu)建模型。
過去50年應用軟件的基礎是數(shù)據(jù)庫,但未來50年的基礎將是機器學習模型。因此,對機器學習和模型如何工作的基本理解將成為每個工程師技能的重要組成部分,而不再是少數(shù)專家的領域。當然機器學習工程師總是會有一席之地的,但是,就像那些構(gòu)建數(shù)據(jù)庫引擎的人一樣,他們的數(shù)量將會很少,而且他們將在少數(shù)大型供應商工作。
事實上,過去十年AI/ML的進展與20世紀末數(shù)據(jù)庫世界發(fā)生的事情驚人地相似。早期數(shù)據(jù)庫的進步有幾個特定的階段,每個階段大約持續(xù)了十年:
(1)起步階段(20世紀60年代)
第一個數(shù)據(jù)庫出現(xiàn)。在當時是一個強大的新概念,但很難使用。即使是訪問簡單的數(shù)據(jù)也相當復雜,高效檢索的所有責任都落在了開發(fā)人員身上。
(2)算力不夠便宜的階段(20世紀70年代)
1970年,Edgar Codd發(fā)布了一系列論文,概述了數(shù)據(jù)庫的關(guān)系模型,提供了行和列的思維模型。這種模型的美妙之處在于它的靈活性,它提供了強大、簡單的抽象邏輯,可以對其進行擴展(通過自定義模式)來適應各種用例。盡管這是數(shù)據(jù)庫歷史上一個神奇的時刻,但它最初遭到了很多質(zhì)疑,這些系統(tǒng)更容易使用和推理,但它們需要更多的計算能力。
(3)易用性和商業(yè)化爆炸階段(20世紀80年代)
關(guān)系型數(shù)據(jù)庫蓬勃發(fā)展的十年。隨著計算資源變得越來越便宜,關(guān)系數(shù)據(jù)庫的成本效益大大提高,它們的易用性成為了強大的動力引擎。尤其重要的是關(guān)系數(shù)據(jù)庫使用查詢優(yōu)化將性能管理的大部分工作從開發(fā)人員轉(zhuǎn)移到數(shù)據(jù)庫中,這使得使用這些系統(tǒng)所需的專業(yè)知識遠遠少于之前的網(wǎng)絡和分層數(shù)據(jù)庫。SQL(1976年發(fā)明,但在80年代中期成為標準)成為數(shù)據(jù)庫的通用語言,像甲骨文這樣的大公司成為了商業(yè)巨頭。
(4)無處不在(1990年到今天)
快進40年,世界上幾乎每個軟件應用程序都使用數(shù)據(jù)庫(無論是關(guān)系數(shù)據(jù)庫還是其他數(shù)據(jù)庫)。作為一名程序員,了解它們的工作原理是首先要學習的內(nèi)容之一,而相關(guān)的開發(fā)人員必須至少對它們的工作原理有一個基本的了解,才能有效地工作。
此外,沒有公司會考慮建立自己的數(shù)據(jù)庫——這樣做根本不劃算。相反,他們使用現(xiàn)成的產(chǎn)品,然后在上面構(gòu)建特定用例的數(shù)據(jù)模型(模式)。其中一些產(chǎn)品是免費和開源的(Postgres),還有一些則來自價值數(shù)十億美元的商業(yè)組織。這種情況一直存在(早期的數(shù)據(jù)庫是由IBM這樣的人創(chuàng)建的),但我們認為仍然值得重申。
有趣的是,這種演進過程與我們所看到的機器學習和AI的商業(yè)化密切相關(guān):
(1)只有大公司的階段(2017年之前)
首先,訓練一個機器學習模型來做任何有用的事情是一項高度專業(yè)化和非常復雜的工作。你必須找到相關(guān)的數(shù)據(jù),同時找到足夠的計算量來對這些數(shù)據(jù)進行訓練。你必須選擇一個架構(gòu)并深刻理解如何進行超參數(shù)調(diào)優(yōu)來優(yōu)化訓練的輸出。所有這些都非常昂貴,而且坦白說非常困難。即使你沒有使用任何深度學習技術(shù),這也是正確的。
(2)早期Transformer階段(2017-2020年)
與數(shù)據(jù)庫一樣,一切也從一篇論文開始。這是一篇名為《Attention Is All You Need》的論文,介紹了一種名為transformer的算法架構(gòu)。緊接著是一系列預先訓練好的基礎模型(BERT、XLNET、GPT-2),它們利用這種架構(gòu)來實現(xiàn)SOTA結(jié)果,特別是在語言方面。這些模型隨后是開源的,類似于如何向關(guān)系數(shù)據(jù)庫添加模式以使其適合用例,用戶可以根據(jù)自己的數(shù)據(jù)對這些基本模型進行微調(diào)。
(3)億級參數(shù)和創(chuàng)業(yè)公司階段(2020 -今天)
當前階段始于OpenAI推出GPT-3。它證明了transformer模型可以擴展到數(shù)十億個參數(shù),而不存在性能漸近線,并且一個非常大的預訓練基礎模型可以在許多不同的任務中表現(xiàn)良好。通用性與OpenAI通過API提供GPT-3這一事實相結(jié)合,帶來了Jasper和Copy等公司的絕對爆炸式增長。
AI是在這些模型上建造的,正如查詢優(yōu)化器(query optimizers)將性能復雜性從軟件開發(fā)人員轉(zhuǎn)移到數(shù)據(jù)庫服務商,AI的這個階段正在做的是將訓練的復雜性從最終用戶轉(zhuǎn)移到模型服務商。
(4)無處不在階段(未來)
在我們知道之前,說一個產(chǎn)品“使用AI”似乎就像說一個產(chǎn)品“使用數(shù)據(jù)庫”一樣愚蠢和明顯?,F(xiàn)在,一般的開發(fā)人員可能不知道查詢計劃器(query planner)是如何工作的,但是他們肯定會使用數(shù)據(jù)庫。類似地,我們不期望一般的開發(fā)人員在五年內(nèi)了解transformer是如何工作的,但我們保證他們會知道如何使用模型。像Cohere和Twelve Labs這樣的公司已經(jīng)分別為文本和視頻創(chuàng)建了這些基本的開發(fā)模塊,允許用戶像使用數(shù)據(jù)庫一樣簡單地使用這些模型。
作為這些模型越來越普遍的證明,無數(shù)公司將AI作為核心組件,但并沒有將其作為關(guān)鍵的差異化因素進行宣傳。例如,我們之前投資的Gong在他們的產(chǎn)品中廣泛使用語音到文本這一技術(shù),但網(wǎng)站的首頁沒有提到ML或AI。
模型本身是一個實現(xiàn)細節(jié)——它很重要,但沒有區(qū)別。區(qū)別在于Gong圍繞語音到文本模型構(gòu)建了出色的產(chǎn)品體驗,就像Salesforce和其他競品的區(qū)別在于圍繞數(shù)據(jù)庫構(gòu)建了出色的產(chǎn)品體驗,而不是數(shù)據(jù)庫本身,正是這種體驗讓他們成為了數(shù)十億美元的企業(yè)。
參考材料:
[1] https://www.indexventures.com/perspectives/the-ai-platform-shift/
[2] https://techcrunch.com/2022/11/17/index-ventures-thinks-new-startups-will-emerge-in-the-downturn-and-is-putting-300m-behind-that-bet/
為我投票
我在參加人人都是產(chǎn)品經(jīng)理2022年度作者評選,希望喜歡我的文章的朋友都能來支持我一下~
點擊下方鏈接進入我的個人參選頁面,點擊紅心即可為我投票。
每人每天最多可投35票,投票即可獲得抽獎機會,抽取書籍、人人都是產(chǎn)品經(jīng)理紀念周邊和起點課堂會員等好禮哦!
投票傳送門:https://996.pm/7lK84
專欄作家
深思圈,公眾號:深思圈,人人都是產(chǎn)品經(jīng)理專欄作家?!妒鍌€酷應用玩轉(zhuǎn)樹莓派》作者,連續(xù)創(chuàng)業(yè)者。做過教育、工具和SaaS等行業(yè),關(guān)注出海、SaaS和AIGC領域,擅長產(chǎn)品、營銷和增長。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Pexels,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!