Claude 4六個月內(nèi)發(fā)布!Anthropic聯(lián)創(chuàng)Kaplan:AGI兩三年內(nèi)到來
Anthropic聯(lián)合創(chuàng)始人兼首席科學(xué)家Jared Kaplan拋出重磅預(yù)測:人類水平的AI(AGI)可能在2-3年內(nèi)實現(xiàn),而非此前預(yù)計的2030年。從AI能力的飛速擴展到Claude 4的即將發(fā)布,再到DeepSeek等全球競爭者的崛起,Kaplan為我們揭示了AI領(lǐng)域的最新突破與挑戰(zhàn)。
提到Anthropic,大家首先想到的可能是它的聯(lián)合創(chuàng)始人、CEO Dario Amodei。
這位明星CEO經(jīng)常出現(xiàn)在各種場合,不時拋出一個「爆炸」言論。
不過,Anthropic的另一位聯(lián)合創(chuàng)始人,也是他們的首席科學(xué)家Jared Kaplan則鮮少露面。
近日,他參加了Azeem Azhar的一檔訪談節(jié)目,并拋出了一個與Dario類似的觀點。
「人類水平的人工智能兩三年內(nèi)就會到來,不用等到2030年。」
這位略顯神秘的大佬表示,AI現(xiàn)在能夠處理的任務(wù)愈加復(fù)雜,甚至有些任務(wù)連人類專家也需要花費幾個小時,甚至幾天才能完成。
一、AGI時間表
Kaplan曾在去年預(yù)測實現(xiàn)人類水平的AI(AGI)需要到2030年,但現(xiàn)在他更傾向于2到3年內(nèi)到來。
不過,「人類水平」的AI并不是一個可以清晰界定的標準。
Kaplan提出了衡量AI能力的兩個重要維度。
一個是AI能夠操作的環(huán)境范圍。
從最初只能在圍棋棋盤上操作的AlphaGo,到如今可以理解文本、圖像,甚至最終可能化身為機器人進入物理世界,AI的操作范圍不斷延伸。
其二是AI能夠處理任務(wù)的復(fù)雜程度。
他回顧早期的語言模型(如BERT)處理的都是1秒級的任務(wù),比如看一個句子找出里面的名詞。到了GPT-3,能處理的是10秒級的任務(wù)。
現(xiàn)在,像Claude 3.7 Sonet這樣的最新模型,已經(jīng)能夠完成人類研究生需花費半天的復(fù)雜任務(wù),例如分析和提煉長達20,000字的文本。
AI在這兩個維度上都快速地擴展。
Kaplan表示,AI能力的快速提升有多種因素:
- 模型智能的整體提升使其能夠關(guān)注和處理更多不同的問題。
- 上下文窗口長度的持續(xù)擴展使AI能夠理解和處理更長的文本,從段落到書籍,從而增強其理解能力。
- 通過強化學(xué)習(xí)訓(xùn)練AI執(zhí)行更復(fù)雜的任務(wù)。
二、Claude 4六個月內(nèi)發(fā)布
Claude 3已經(jīng)發(fā)布了一年多的時間,Kaplan預(yù)計新一代的Claude 4將會在接下來的六個月內(nèi)發(fā)布。
「一方面,我們在后訓(xùn)練跟強化學(xué)習(xí)上有了改進,讓Claude能通過更多測試;另一方面,我們從預(yù)訓(xùn)練中提升了效率?!筀aplan說,短期內(nèi)這種勢頭不會減慢。
對于測試時擴展(test-time scaling),Kaplan覺得這是個大突破。
簡單來說,就是讓AI多想一會兒,性能就能可預(yù)測地變好,尤其是在那種光靠思考就能提高表現(xiàn)的困難問題上。
比如讓Claude 3.7想2000個token、4000個token、8000個token,每次思考量翻倍,性能就能穩(wěn)定提升。
這種方式還能擴展到同時生成好幾個答案,然后讓AI挑個最好的。
Kaplan解釋說:「對于特別難的任務(wù),你可以選一個更聰明的模型快速搞定,或者讓一個普通點的模型多花點時間,效果可能差不多?!?/p>
不過這也帶來了新挑戰(zhàn):模型得學(xué)會判斷什么時候多想一會兒。
Kaplan打了個比方:「就像你剛換了個新工作,老板給你個難題,你肯定得花大把時間琢磨,因為你想答對,不想被炒魷魚。但一旦你適應(yīng)這個工作,可能隨手就給出一個答案?!?/p>
三、DeepSeek沒理由落后
DeepSeek發(fā)布的R1模型引發(fā)全球熱議,展現(xiàn)出了令人驚艷的推理能力。
Kaplan對此并不意外,「我關(guān)注DeepSeek的進展至少有一年半了。他們一直在發(fā)表論文、優(yōu)化模型,所以這對我們或Anthropic來說并不算太大的驚喜。」
這話透露出頂尖AI實驗室之間對彼此的研究非常的熟悉。
他倒覺得全球的反應(yīng)挺有趣:「很多人驚呼,『哇,中國竟然有這么厲害的模型!』我跟一些美國人聊過,他們過去總覺得中國可能落后好幾年。但看看DeepSeek的論文,他們的進展其實很明顯,可能只差六個月,不會太遠。」
這也反映出中美兩國在AI發(fā)展方面的差距正在縮小。
Kaplan表示,AI研究的突破來得特別快。這種飛速進步不是因為科學(xué)家突然變聰明了,而是因為AI這個領(lǐng)域就像個秋天的果園,掛滿了低垂的果子,迭代改進的空間很大。
他進一步說,算力硬件限制可能會讓西方公司在硬件資源上占優(yōu),這對DeepSeek和其他公司來說可能是個挑戰(zhàn)。
但在算法本身上,所有頂尖AI公司都在找簡單、有效、可擴展的方法。
DeepSeek的論文里也提到了這些思路和技術(shù),他們在算法上完全有競爭力,沒理由落后。
四、AI的影響
訪談的最后聚焦在了AI對經(jīng)濟和社會的潛在影響上。
AI對生產(chǎn)力和勞動力市場的影響,可能會比歷史上的任何重大技術(shù)變革來得更快。
Kaplan對此深以為然,他坦言:「我覺得我們對AI會如何改變社會和生產(chǎn)力的思考,可能遠遠不夠。隨著AI能夠完成的事情越來越多,人類可能會通過其他活動,或者用AI來放大自己的能力來實現(xiàn)不同?!?/p>
他同時強調(diào)了實證研究的關(guān)鍵作用。
比如AI是起到互補作用?還是提升了生產(chǎn)力?它會在多大程度上替代原本由人完成的任務(wù)?Kaplan說他們正把這些數(shù)據(jù)開放給經(jīng)濟學(xué)家去分析。
他還特別提到AI在軟件工程領(lǐng)域的應(yīng)用,拋出了一個更深層次的問題:「像我們在軟件工程中看到的這么多人用AI,這種趨勢會擴散到所有知識工作嗎?還是會慢得多?它又會怎樣滲透進我們的日常生活?」
從Claude 4的突破到DeepSeek的異軍突起,全球AI競賽正以前所未有的速度推進。
它將如何改變我們的工作、生活乃至整個世界?
正如Kaplan所言,答案或許藏在數(shù)據(jù)與實證研究中,而我們每個人都將是這場變革的見證者和參與者。
參考資料:
https://www.youtube.com/watch?v=tC_3KAyli4U
新智元報道 編輯:犀牛
本文由人人都是產(chǎn)品經(jīng)理作者【新智元】,微信公眾號:【新智元】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
現(xiàn)在的AI人工智能都是處于高速發(fā)展階段,所以他的發(fā)展周期不會太長
其實從生活中我已經(jīng)感覺到AI對生產(chǎn)力和勞動力市場的影響,這可能會比歷史上的任何重大技術(shù)變革來得更快?,F(xiàn)在生活我們已經(jīng)很多人都離不開AI了