OpenAI宮斗劇引出神秘項(xiàng)目Q*
繼OpenAI的人事斗爭(zhēng)后,神秘項(xiàng)目Q*進(jìn)一步引發(fā)了外界的關(guān)注,那么,神秘的項(xiàng)目Q*究竟是什么?人類離AGI的目標(biāo)實(shí)現(xiàn)還有多遠(yuǎn)?一起來(lái)看看本文的解讀和分析。
“出局-跳槽-返崗”,5天之后,Sam Altman最終重新拿回CEO一職,與力挺他的原董事會(huì)主席Greg Brockman一同回到了OpenAI。
當(dāng)人們以為這家AI巨頭上演的宮斗劇徹底落下帷幕時(shí),路透社甩出一個(gè)大瓜:在Altman被罷免之前,OpenAI幾位研究人員向董事會(huì)發(fā)出警告信,內(nèi)容是一項(xiàng)強(qiáng)大的人工智能發(fā)現(xiàn)可能威脅人類,而這封信可能是Altman下臺(tái)的關(guān)鍵。
知情人士還告訴路透社,OpenAI內(nèi)部有一個(gè)名為Q*(發(fā)音為Q-Star)的項(xiàng)目,這可能是該公司探索通用人工智能(AGI)的突破。
至此,外界的目光從OpenAI的人事斗爭(zhēng)轉(zhuǎn)向神秘的Q*。
一、Q*或與AI的數(shù)學(xué)能力有關(guān)
路透社披露的有關(guān)內(nèi)部警告信和Q*的信息,均來(lái)自不愿具名的消息人士。盡管這家權(quán)威媒體表示沒(méi)有看到內(nèi)部信的原文,也無(wú)法證實(shí)Q*的功能,但這個(gè)增量信息還是引來(lái)了外界的好奇。
11月22日,OpenAI宣布原則上達(dá)成協(xié)議讓Sam Altman重新?lián)蜟EO,并組建由Bret Taylor(主席)、Larry Summers和Adam D’Angelo組成的新董事會(huì)。按照這個(gè)消息,該公司的首席科學(xué)家llya Sutskever從董事會(huì)出局,他曾被視作罷免Altman的核心推動(dòng)者。
在X上,Altman和OpenAI彼此點(diǎn)贊,Brockman發(fā)了一張和成員的“大團(tuán)圓”合影,老板與員工慶祝著再次成為一家人。
這場(chǎng)被稱為“企業(yè)家與科學(xué)家之爭(zhēng)”的大戲以企業(yè)家之勝落下帷幕,但外界至今都不清楚Altman到底因?yàn)槭裁磳?dǎo)致了OpenAI原董事會(huì)的不信任。
11月23日,路透社援引消息人士曝出大瓜稱,Altman下臺(tái)前四天,幾位研究人員寫(xiě)了一封信給董事會(huì),警告一項(xiàng)強(qiáng)大的人工智能發(fā)現(xiàn),他們稱這一發(fā)現(xiàn)可能威脅人類。
兩位消息人士稱,此前未報(bào)道的信件和人工智能算法是董事會(huì)罷免Altman之前的關(guān)鍵。其中一名知情人士稱,OpenAI在給員工的內(nèi)部信中承認(rèn)有一個(gè)名為Q*的項(xiàng)目,一些人認(rèn)為Q*可能是公司探索通用人工智能(AGI)的突破。
OpenAI一直認(rèn)為,AGI能在最具經(jīng)濟(jì)價(jià)值的任務(wù)中超越人類的自主系統(tǒng)。
這位不愿具名的人士表示,鑒于龐大的計(jì)算資源,新模型能夠解決某些數(shù)學(xué)問(wèn)題,雖然數(shù)學(xué)成績(jī)僅達(dá)到小學(xué)生的水平,但在此類測(cè)試中取得的好成績(jī)讓研究人員對(duì)Q*未來(lái)的成功非常樂(lè)觀。
路透社的消息讓外界對(duì)OpenAI的目光從人事紛爭(zhēng)轉(zhuǎn)移到它的主業(yè)上,連OpenAI的開(kāi)發(fā)者社區(qū)都在追問(wèn)Q*到底是什么,但未獲得官方人員的回應(yīng)。
OpenAI開(kāi)發(fā)者社區(qū)討論Q*
由于Q*似乎與數(shù)學(xué)有關(guān),一些開(kāi)發(fā)者推測(cè),OpenAI的研發(fā)可能使用了Q-Learning算法,這可能是這個(gè)神秘項(xiàng)目以Q命名的原因。
Q-Learning算法是一個(gè)數(shù)學(xué)概念,也是機(jī)器學(xué)習(xí)算法中的一種,能夠進(jìn)行“小學(xué)”水平的數(shù)學(xué)計(jì)算,并有望在該領(lǐng)域超越OpenAI的GPT-4模型。
Q-Learning使用被稱為“強(qiáng)化學(xué)習(xí)”的機(jī)器學(xué)習(xí)技術(shù)來(lái)解決數(shù)學(xué)問(wèn)題,對(duì)正確或最佳的行為給予獎(jiǎng)勵(lì),對(duì)不正確或次優(yōu)的行為給予懲罰。機(jī)器可以通過(guò)探索所有可能的路徑來(lái)學(xué)習(xí)獲得預(yù)期獎(jiǎng)勵(lì)的最短路徑(shortestroute),通過(guò)反復(fù)試驗(yàn)找到更優(yōu)化的路線,并隨著時(shí)間的推移達(dá)到優(yōu)化狀態(tài),每次都做出更好的決策。
二、AGI離人類不遠(yuǎn)了?
根據(jù)目前了解GPT-4最直接的產(chǎn)品ChatGPT的表現(xiàn)看,這個(gè)對(duì)話機(jī)器人能夠在人文、編程等領(lǐng)域理解自然語(yǔ)言,并給出符合上下文邏輯的回答,還能在人類的不斷提示中修正自己的回答。
但ChatGPT對(duì)解決數(shù)學(xué)問(wèn)題不是很給力,比如不能一次性答對(duì)“雞兔同籠”的問(wèn)題,還有人給它出過(guò)混合運(yùn)算的數(shù)學(xué)題,這家伙的答案也是不盡人意。
現(xiàn)在,Q*被視作OpenAI在解決GPT數(shù)學(xué)能力的路徑。
新的問(wèn)題來(lái)了:為什么獲得了數(shù)學(xué)能力,就能被OpenAI上升到通向AGI?
研究人員認(rèn)為,數(shù)學(xué)是生成式人工智能發(fā)展的前沿。目前,生成式人工智能擅長(zhǎng)通過(guò)統(tǒng)計(jì)預(yù)測(cè)下一個(gè)單詞進(jìn)行寫(xiě)作和語(yǔ)言翻譯,而同一問(wèn)題的答案可能會(huì)有很大差異。但如果能征服“只有一個(gè)正確答案”的數(shù)學(xué)能力,這意味著人工智能將擁有類似于人類智能的更強(qiáng)推理能力。
與只能解決有限數(shù)量運(yùn)算的計(jì)算器不同,AGI可以概括、學(xué)習(xí)和理解,更強(qiáng)的推理能力無(wú)疑是這些AGI特征的重要一步。
給路透社爆料的消息人士稱,OpenAI內(nèi)部有標(biāo)記為“人工智能科學(xué)家”團(tuán)隊(duì)的工作,多個(gè)消息來(lái)源證實(shí)了該團(tuán)隊(duì)的存在。一位知情人士表示,該小組由早期的“Code Gen”和“Math Gen”團(tuán)隊(duì)合并而成,正在探索如何優(yōu)化現(xiàn)有的人工智能模型,以提高其推理能力并最終開(kāi)展科學(xué)工作。
這些未得到OpenAI回應(yīng)、也沒(méi)有實(shí)證證明的信息,讓Q*變得更加神秘。而從Altman和OpenAI過(guò)去的表態(tài)看,AGI一直是這家公司追求的最高峰。
除了在11月宣布的一系列新工具外,Altman上周還在舊金山舉行的APEC峰會(huì)上稱,他相信重大進(jìn)展即將到來(lái)。“在OpenAI的歷史上已經(jīng)有四次了,最近一次是在過(guò)去幾周,當(dāng)我們推開(kāi)無(wú)知的面紗并推進(jìn)發(fā)現(xiàn)的前沿時(shí),我已經(jīng)在房間里了,能夠做到這一點(diǎn)是我一生的職業(yè)榮譽(yù)。”
如今,Altman殺回來(lái)了,相信這個(gè)善于制造熱點(diǎn)、運(yùn)作資本的商業(yè)領(lǐng)袖,必然不會(huì)讓人錯(cuò)過(guò)有關(guān)Q*的消息。
作者:木沐,編輯:文刀
來(lái)源公眾號(hào):元宇宙日爆(ID:yuanyuzhouribao),在這里,看見(jiàn)未來(lái)。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @元宇宙日爆 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!