ChatGPT哲學(xué)之謎
ChatGPT的出現(xiàn),讓人們從科技和人文的角度都開始重新思考人類與機(jī)械、人類與科技、人類與人工智能之間的關(guān)系。作為一個(gè)大型人工智能語言模型,ChatGPT是怎樣理解人類的邏輯的?我們要怎么看它,它又如何觀照這個(gè)世界?一起來看看這篇文章,希望能為你帶來啟發(fā)。
“一些未知的東西正在做我們不知道的事情。”
——阿瑟·愛丁頓??
“為何不嘗試制作一個(gè)模擬兒童思維的程序呢?”?
——艾倫·圖靈
“只要是人腦能提出的問題,它就能夠得到解決?!?
——庫爾特·哥德爾
一
有人說,ChatGPT是個(gè)文科生。
這么說,只因?yàn)镃hatGPT是一種大型語言模型,基于自然語言處理技術(shù),通過深度學(xué)習(xí)模型對大量文本數(shù)據(jù)進(jìn)行訓(xùn)練,從而學(xué)習(xí)到語言的規(guī)律和語義表達(dá)。
有人說,ChatGPT是個(gè)理科生。
自然語言處理本質(zhì)上仍然是計(jì)算機(jī)語言。其發(fā)展的第二階段是基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí),第三階段是基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),和人類的語言學(xué)規(guī)則關(guān)系不大。
還有人說,ChatGPT是個(gè)體育生。
創(chuàng)造了阿爾法狗的哈薩比斯認(rèn)為,ChatGPT僅僅是更多的計(jì)算能力和數(shù)據(jù)的蠻力,并對這種“不優(yōu)雅”的方式感到失望。
本文將從一道經(jīng)典的“兩孩難題”開始,引出ChatGPT背后的概率思維,以及19世紀(jì)以來人類面臨的不確定性困境。
自亞里士多德與柏拉圖之間的辯論開始,到休謨和貝葉斯二人隔著歷史的相殺相愛,再到不愿意相信上帝是在扔骰子的因果哲學(xué)堅(jiān)守者愛因斯坦,人類在哲學(xué)和科學(xué)范疇里糾結(jié)于確定性與不確定性,并且越陷越深。
我偏向于用一種介于“樂觀”和“懷疑”之間的態(tài)度來評判ChatGPT引發(fā)的又一輪AI熱潮。
本文將用一種個(gè)人化的方式,從零基礎(chǔ)數(shù)學(xué)計(jì)算的源頭,再推演一遍貝葉斯公式,和概率推理的機(jī)制,以及神經(jīng)網(wǎng)絡(luò)的基本原理。
進(jìn)而,經(jīng)過了簡單但卻可感知的數(shù)學(xué)計(jì)算,我們就可以順著休謨的經(jīng)驗(yàn)主義和懷疑論,一路奔襲到羅素的邏輯原子主義,直至維特根斯坦的立場:
語言的界限,就是世界的界限。
人工智能的變遷,幾乎對應(yīng)著人類認(rèn)知世界的變遷結(jié)構(gòu)。
從確定性到不確定性,從物理定律到統(tǒng)計(jì)概率,物理和信息交匯于“熵”,并以類似的達(dá)爾文觀念,進(jìn)化出有生命的熵減系統(tǒng)。???
在這個(gè)愈發(fā)茫然的世界里,AI在疫情后時(shí)代獲得了世人額外的關(guān)切;
諸神已被人類背棄,算法用強(qiáng)大而未知的相關(guān)性替代了神秘主義和因果霸權(quán),仿佛成為新神。
真實(shí)與信念,確定與隨機(jī),意識與虛無,再次于大眾的狂歡之中,對峙在時(shí)代的斷崖邊緣。
二
問題:一個(gè)家庭里有兩個(gè)孩子,其中一個(gè)是男孩,假設(shè)每個(gè)孩子是男孩女孩的概率一樣,那么另一個(gè)孩子也是男孩的概率是多少?
直覺上,生男生女絕大多數(shù)時(shí)候是獨(dú)立事件,其中一個(gè)是男孩,并不會影響另外一個(gè)孩子性別的概率,所以答案難道不是50%嗎?
有些聰明人說:不對。正確的答案應(yīng)該是1/3。
用古典概率的計(jì)算方法如下:
兩個(gè)孩子的性別共有4種情況:
(男,男)、(女,女)、(男,女)、(女,男)
請注意,上述第三種和第四種情況,特別強(qiáng)調(diào)了老大和老二的區(qū)別。
如上四種情況中,其中一個(gè)是男孩共有3種情況:
(男,男)、(男,女)、(女,男)
另一個(gè)也是男孩只有1種情況:(男,男),所以概率是1/3。
麻煩來了:這是不是說,一個(gè)家庭假如有了一個(gè)男孩,再生一個(gè)男孩的概率就變成1/3了???
這不科學(xué)啊。????
聰明如你,應(yīng)當(dāng)能從這看似嚴(yán)謹(jǐn)?shù)鋵?shí)含混的表述中發(fā)現(xiàn)秘密:
上面的計(jì)算,考慮了“有一個(gè)男孩家庭”里男孩是老大或老二的兩種可能,但是卻忽略了問題里“一個(gè)男孩”在“兩個(gè)孩子都是男孩的家庭”里也有老大和老二兩種可能。??????
僅就本文開頭題目的表述而言,樣本空間的概率仍然應(yīng)該是1/3。?
讓我們在這個(gè)經(jīng)典的“兩孩難題”上再前進(jìn)一步。????
堅(jiān)持認(rèn)為正確答案是1/3的聰明人,會拿出貝葉斯公式。???
他們認(rèn)為,本文開頭的題目,不是古典概率問題,而是條件概率問題。
所謂“條件概率”,是指:事件A在另外一個(gè)事件B已經(jīng)發(fā)生條件下的發(fā)生概率。
條件概率表示為:P(A|B),讀作“在B條件下A的概率”。
根據(jù)該公式,計(jì)算如下:
條件B:兩個(gè)孩子其中一個(gè)是男孩。
考慮其對立事件:兩個(gè)孩子都不是男孩,或者說兩個(gè)孩子都是女孩。
P(B)=1-(1/2)×(1/2)=1-1/4=3/4
事件A:另一個(gè)也是男孩。
事件A、B同時(shí)發(fā)生:兩個(gè)孩子都是男孩
P(AB)=(1/2)×(1/2)=1/4
P(A|B)=P(AB)/P(B)=(1/4)/(3/4)=1/3
所以,P(A|B)=1/3。
慢著,這是語言游戲嗎?
答案到底是1/2,還是1/3??????
難道貝葉斯公式也錯(cuò)了嗎??
這一節(jié)的計(jì)算是“對”的,但另一種計(jì)算得出的結(jié)論可以是:????
你觀察到的這個(gè)男孩,來自兩男孩家庭的概率是1/2。???
我不止一次地看到,即使是很聰明的人,以及專業(yè)人士,都在如上這一問題上繞不出來。
為什么呢?
因?yàn)檎Z言的世界,不同語言的世界,個(gè)體觀察的世界,不同個(gè)體觀察的世界,以及上帝視野的世界,和所謂“真實(shí)“的世界,似乎都不是同一個(gè)世界。???
三
在微軟的報(bào)告里,研究者用GPT-4模擬了一段對話:
蘇格拉底:我的朋友,我對最近這些所謂自回歸語言模型的興起感到不安。
亞里士多德:你是什么意思,蘇格拉底?
蘇格拉底:我的意思是,這些模型被用來生成看起來是人類寫的文本,但實(shí)際上是由機(jī)器產(chǎn)生的。
亞里士多德:那有什么問題呢?
蘇格拉底:問題是,這些模型被用來欺騙人們,操縱他們,控制他們。
亞里士多德:但這些模式肯定也有一些積極的應(yīng)用?
蘇格拉底:可能是這樣,但我仍然對濫用的可能性感到不安。畢竟,一個(gè)能夠生成與人類所寫的文字無法區(qū)分的模型可以被用來傳播假新聞,冒充他人,并制造宣傳。
亞里士多德:但這不只是一個(gè)如何使用這些模型的問題,而不是模型本身的問題嗎?
蘇格拉底:我不同意。我認(rèn)為這些模型本身就有問題。它們是一種偽裝的形式,一種創(chuàng)造幻覺的方式,是人類思想和互動的一部分。因此,它們可以被用來以難以察覺的方式進(jìn)行欺騙和操縱。
亞里士多德:但這不正是你反對修辭和演說的理由嗎?
蘇格拉底:是的,我也堅(jiān)持這個(gè)觀點(diǎn)。我相信,任何旨在欺騙或操縱的藝術(shù)或交流形式都是內(nèi)在的危險(xiǎn)。
亞里士多德:我明白了。謝謝你分享你的想法,蘇格拉底。
喬布斯曾經(jīng)設(shè)想過如上的對話,他預(yù)測有一天可以用計(jì)算機(jī)捕捉亞里士多德的底層世界觀,如此一來人們就可以和他親自對話了。
反對修辭和演說的蘇格拉底認(rèn)為:感覺是不可靠的,感性認(rèn)識是不確定的,只有理性才能夠認(rèn)識事物本身。??
而在亞里士多德的方法里,他將修辭確定為哲學(xué)的三個(gè)關(guān)鍵要素之一。另外兩個(gè)則是邏輯和辯證法。
亞里士多德認(rèn)為,邏輯關(guān)注的是用推理達(dá)到科學(xué)確定性,而辯證法和修辭則關(guān)注概率。后者適用于人類事務(wù)。
上面兩段文字我摘自網(wǎng)絡(luò)百科,雖無法確認(rèn)其原文與出處(尤其是概率那部分),卻令人叫好。
然而,在隨后的年代里,亞里士多德的邏輯和確定性知識體系更大程度地影響了人類。
人們信奉因果論和決定論,在牛頓的推動下,世界仿佛是一個(gè)由無數(shù)個(gè)精密齒輪構(gòu)成的機(jī)器,在上帝的首次推動下,持續(xù)有條不紊地運(yùn)轉(zhuǎn)著。
而另外一條線索亦在孕育之中。休謨的懷疑論和經(jīng)驗(yàn)主義徹底改變了人們的思想世界,他認(rèn)為感性知覺是認(rèn)識的唯一對象,人不可能超出知覺去解決知覺的來源問題。
在休謨看來,客觀因果并不存在。????????
隨后康德試圖對理性主義和經(jīng)驗(yàn)主義進(jìn)行調(diào)和,他否認(rèn)客觀因果聯(lián)系,但主張用先天的理智范疇對雜亂的經(jīng)驗(yàn)進(jìn)行整理。??
馬赫則開創(chuàng)了經(jīng)驗(yàn)批判主義,他強(qiáng)調(diào)直接討論觀測數(shù)據(jù),科學(xué)定律只是被視為以最經(jīng)濟(jì)的方式對數(shù)據(jù)進(jìn)行描述的手段而已。
《科學(xué)推斷》一書認(rèn)為,他開啟了現(xiàn)代方法論的主要進(jìn)展。
曾經(jīng)深受馬赫影響的愛因斯坦,無法接受這種對科學(xué)信仰的破壞性,以及對法則、公式、定律的輕視,后來與其分道揚(yáng)鑣。
愛因斯坦用探索性的演繹法建構(gòu)了邏輯嚴(yán)謹(jǐn)?shù)脑?,他相信宇宙有解,不相信鬼魅之力?/p>
某種意義上,愛因斯坦是最后的牛頓(除了用斯賓諾莎的“神”替代了上帝),是科學(xué)因果決定論的捍衛(wèi)者。??
1967年,波普爾對如上交織而漫長的哲學(xué)歷程做了一個(gè)了結(jié),他提出了三元世界的觀點(diǎn),布爾金將其繪制如下:
這似乎是柏拉圖洞穴理論的現(xiàn)代版。
看看,人是多么無知,又是多么分裂??!
基于這樣的結(jié)構(gòu),波普爾提出:我們無法證實(shí)這個(gè)世界,無法證實(shí)規(guī)律和定理,只能去證偽。
四
也許你還記得上一代的老實(shí)人工智能–深藍(lán)。龐大的機(jī)器,手工制作無盡的代碼,多名參與其中的職業(yè)棋手,以及暴力算法,雖然打敗了卡斯帕羅夫,卻如流星般閃過。
《麻省理工科技評論》將深藍(lán)形容為恐龍,而這一代的神經(jīng)網(wǎng)絡(luò)(尤其是深度學(xué)習(xí))則是生存且改變地球的小哺乳動物。
上世紀(jì)50年代,香農(nóng)曾經(jīng)樂觀地預(yù)測AI將很快出現(xiàn),事實(shí)并非如此。失敗的主要原因是:
人工智能的創(chuàng)造者們試圖用純粹的邏輯來處理日常生活中的混亂,他們會耐心地為人工智能需要做的每一個(gè)決定都制定一條規(guī)則。但是,由于現(xiàn)實(shí)世界過于模糊和微妙,無法以刻板的方式進(jìn)行管理。
我們無法像是依照牛頓的原理造車般,用發(fā)條思維和專家系統(tǒng)來打造智能系統(tǒng)。那一類AI不僅狹窄,而且脆弱。
ChatGPT是經(jīng)驗(yàn)主義的進(jìn)化論的“勝利產(chǎn)物”。
經(jīng)驗(yàn)主義亦稱“經(jīng)驗(yàn)論”。作為一種認(rèn)識論學(xué)說,與“理性主義”相對。經(jīng)驗(yàn)主義認(rèn)為感性經(jīng)驗(yàn)是知識的來源,一切知識都通過經(jīng)驗(yàn)而獲得,并在經(jīng)驗(yàn)中得到驗(yàn)證。
這正是ChatGPT的思考和學(xué)習(xí)路徑。
而虛擬進(jìn)化又指數(shù)級放大了基于經(jīng)驗(yàn)的學(xué)習(xí)速度。在波普爾看來,科學(xué)發(fā)展本身就是一種進(jìn)化。
ChatGPT不僅從時(shí)間的角度加速模擬了進(jìn)化,還通過大模型從空間的角度拓展了可能性之廣度,以至于令人們禁不住又驚又喜地探討起涌現(xiàn)。
那么,人工智能是如何思考的?又是如何決策的???
有別于齒輪般的演繹推理,我們需要借助概率在證據(jù)和結(jié)論之間建立起聯(lián)系。????
AI的任務(wù)是做決策,在不確定性下結(jié)合信念與愿望,選擇動作。
《人工智能:現(xiàn)代方法》如此描述:
由于部分可觀測性、非確定性和對抗者的存在,真實(shí)世界中的智能體需要處理不確定性(uncertainty)。智能體可能永遠(yuǎn)都無法確切地知道它現(xiàn)在所處的狀態(tài),也無法知道一系列動作之后結(jié)束的位置。
此外,智能體的正確的動作——理性決策,既依賴各種目標(biāo)的相對重要性,也依賴它們實(shí)現(xiàn)的可能性和程度。
為了進(jìn)行不確定推理,我們需要引入信念度,例如牙痛患者有80%的概率存在蛀牙。
???概率論提供了一種概括因我們的惰性與無知而產(chǎn)生的不確定性的方式。
除了概率,智能體在做決策時(shí)還需要一個(gè)概念:效用理論。?
例如,你要去機(jī)場,假如提前90分鐘出發(fā),趕上飛機(jī)的概率是95%;提早120分鐘出發(fā),概率提升至97%。??????
那么,是不是應(yīng)該越早越高,追求趕上飛機(jī)的最大概率呢?如此一來,你可能要提前一天或者更早住在機(jī)場了。??????
大多數(shù)時(shí)候不必如此,但假如你有一個(gè)無法錯(cuò)過的會議,或者要趕國際航班,提早一天住到機(jī)場,可能是最佳決策。萬豪酒店最早就是靠洞察到商務(wù)人士的這一需求而崛起的。????
由此,我們得出決策論的通用理論:??
決策論=概率論+效用理論
以上的現(xiàn)代方法,離不開兩個(gè)未曾謀面的古代敵手。
五
在諸多反對休謨的人當(dāng)中,貝葉斯也許是最重要的一位。
當(dāng)休謨斬?cái)嗔艘蚬g的必然聯(lián)系時(shí),最惱火的莫過于教會,因?yàn)樯系垡恢北灰暈橐蚬牡谝煌苿恿Α??????
一個(gè)人往往要到了一定歲數(shù),才能夠理解休謨的哲學(xué)。尤其是我們這些從小接受確定性訓(xùn)練的人。
邏輯推理的基本形式是:如果A,則B。
休謨則說,如上這類推理要么是幻覺,要么是胡說八道,要么是自圓其說。
據(jù)說虔誠且又擅長數(shù)學(xué)的牧師貝葉斯是為了反駁休謨,而研究出了貝葉斯公式。???
一個(gè)神奇的結(jié)局出現(xiàn)了,貝葉斯公式反而成為了休謨哲學(xué)的現(xiàn)實(shí)解藥,將其大刀斬?cái)嗟囊蚬?,用逆概率的懸橋連接了起來。?????????
概率,將邏輯推理的形式修正為:如果A,則有x%的可能性導(dǎo)致B。??
而貝葉斯公式,則完成了一個(gè)小小的(卻產(chǎn)生了無法估量的巨大影響)由果推因的顛倒:
如果觀察到B,則有x%的可能性是因?yàn)锳導(dǎo)致。
如此一來,被休謨懷疑的世界,繼續(xù)晃晃悠悠地構(gòu)建出更為龐大繁復(fù)的、以概率關(guān)聯(lián)的因果網(wǎng)絡(luò)。??????????????
假如貝葉斯試圖反擊休謨的動機(jī)是真的,就為“要愛惜你的對手”添加了有力論據(jù)。???
讓我們用一個(gè)簡單的貝葉斯計(jì)算,來看看智能體如何學(xué)習(xí)經(jīng)驗(yàn)。????
題目:黑盒子里有兩個(gè)骰子,一個(gè)是正常骰子,扔出數(shù)字6的概率是1/6;一個(gè)是作弊骰子,扔出數(shù)字6的概率是1/2。????????
這時(shí),你從中摸出一個(gè)骰子,扔了一次,得到一個(gè)6。??
請問:你再扔一次得到6的概率是多大?
計(jì)算的第一步,是計(jì)算這個(gè)骰子是正常骰子和作弊骰子的概率分別是多大。
請?jiān)试S我跳過貝葉斯公式快速計(jì)算如下。????????
是正常骰子的概率為:1/6÷(1/6+1/2)=1/4??????
是作弊骰子的概率為:1/2÷(1/6+1/2)=3/4
計(jì)算的第二步,更新這個(gè)骰子的信息。原來的概率是各1/4,但現(xiàn)在分別是1/4和3/4。??
那么,再扔一次,得到6的概率就是:1/4×1/6+3/4×1/2=5/12。?
從本質(zhì)層面理解如上這個(gè)簡單的計(jì)算并不是容易的事情:
兩次扔骰子都是獨(dú)立事件,為什么第一次扔骰子得到6的概率和第二次的概率不一樣?
貝葉斯概率的解釋是,第一次扔骰子得到6的這一結(jié)果,作為信息,更新了我們對第二次扔骰子得到6的概率的判斷。
疑惑的人會繼續(xù)問:骰子沒有記憶,為什么第一次的結(jié)果會“改變”第二次結(jié)果呢??
答案是:沒有改變結(jié)果,只是改變了“信念”。
即使扔了兩次骰子,我們依然不知道這個(gè)骰子是正常的還是作弊的,但我們可以帶著這種不確定性向前走,為此需要“猜”這個(gè)骰子是正常還是作弊的概率。這個(gè)概率,就是信念。???????
根據(jù)信息的變化,快速更新,體現(xiàn)了某種達(dá)爾文式的進(jìn)化。????
從這個(gè)角度看,AI推理起初或許弱小含混,卻有主動適應(yīng)性,從經(jīng)驗(yàn)中不斷學(xué)習(xí),并快速演化。
以本題為例:第二次扔骰子,從第一次骰子的結(jié)果中學(xué)習(xí)了經(jīng)驗(yàn),從而令預(yù)測更加精確。
這個(gè)過程還可以不斷重復(fù),如同發(fā)動機(jī)般,從而產(chǎn)生了決策和智能的杠桿效應(yīng)。
如前所述,亞里士多德曾經(jīng)認(rèn)為,修辭和概率等不確定性元素,應(yīng)該應(yīng)用于人類社會。而在自然科學(xué)和數(shù)學(xué)領(lǐng)域,則是邏輯推理(尤其是數(shù)學(xué)邏輯)的陣地。??
而如今,確定世界已經(jīng)成為不確定世界,絕對真理也被或然真理替代。??
于是,概率不僅成為“真理”的懸梯,甚至成為真理本身。???
《人工智能:現(xiàn)代方法》寫道,世界就是這樣,實(shí)際示范有時(shí)比證明更有說服力?;诟怕收摰耐茢嘞到y(tǒng)的成功要比哲學(xué)論證更容易改變?nèi)说挠^點(diǎn)。
就像兩個(gè)人就不同的觀點(diǎn)爭論,一種辦法是講道理,講邏輯;還有一種辦法是:?????
我們先下個(gè)注,然后試著跑跑看唄。??
六
在《人工通用智能的火花:GPT-4的早期實(shí)驗(yàn)》的報(bào)告里,微軟實(shí)驗(yàn)室如此表述:??
“我們過去幾年,人工智能研究中最顯著的突破是大型語言模型(LLMs)在自然語言處理方面取得的進(jìn)展。
這些神經(jīng)網(wǎng)絡(luò)模型基于Transformer架構(gòu),并在大規(guī)模的網(wǎng)絡(luò)文本數(shù)據(jù)體上進(jìn)行訓(xùn)練,其核心是使用一個(gè)自我監(jiān)督的目標(biāo)來預(yù)測部分句子中的下一個(gè)單詞。”
ChatGPT,是位“語言游戲”的高手,用的是神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。
這與傳統(tǒng)的語言,以及邏輯語言,都不一樣。
羅素曾經(jīng)試圖構(gòu)建一套邏輯語言,想從少數(shù)的邏輯公理中,推演出數(shù)學(xué)。他提出了自己邏輯原子主義,試圖消除那些形而上語言的混亂,以邏輯語言和我們的現(xiàn)實(shí)世界一一對應(yīng)。
在與羅素的相互影響下,維特根斯坦認(rèn)為哲學(xué)的所有問題其實(shí)就是語言問題,從而推動了哲學(xué)的語言轉(zhuǎn)向。
一種西方哲學(xué)史觀點(diǎn)認(rèn)為:古代哲學(xué)關(guān)注本體論,近代哲學(xué)關(guān)注認(rèn)識論,20世紀(jì)哲學(xué)關(guān)注語言學(xué)問題。
那么,作為“系統(tǒng)地從語言來思考世界的第一人”,維特根斯坦與羅素有何不同?
陳嘉映的論斷是:羅素從本體論來思考語言的本質(zhì),維特根斯坦則一直從語言的本質(zhì)來構(gòu)想本體論。
也許我們能從羅素給情人奧托林·莫雷爾夫人一封信里,發(fā)現(xiàn)維特根斯坦哲學(xué)上的某些經(jīng)驗(yàn)主義線索:
“我們這位德國工程師啊,我認(rèn)為他是個(gè)傻瓜。他認(rèn)為沒有什么經(jīng)驗(yàn)性的東西是可知的——我讓他承認(rèn)房間里沒有一頭犀牛,但他不肯?!?/p>
和每個(gè)天才一樣,維特根斯坦卓絕,但也疑惑。
再說回ChatGPT,它懂語言嗎?如同《天才與算法》一書的設(shè)問:
機(jī)器可以在不理解語言或不接觸周圍物理世界的情況下,生成有意義的句子,甚至是美的句子嗎?
老派的AI,試圖采用羅素的方法。這類模型認(rèn)為:
“理性和智能是深度的、多步驟的推理,由一個(gè)串行過程指揮,并由一個(gè)或幾個(gè)線程組成,使用少量的信息,由少量的強(qiáng)相關(guān)變量來表達(dá)信息?!?/p>
對比而言,“現(xiàn)代的機(jī)器學(xué)習(xí)模式由淺(少步)推理組成,使用大量信息的大規(guī)模并行處理,并涉及大量弱相關(guān)變量?!?/p>
一個(gè)有趣的來描述二者對比的例子是,電影《模仿游戲》里的圖靈,炒掉了自己的密碼破解小組里的語言學(xué)專家?!度斯ぶ悄埽含F(xiàn)代方法》認(rèn)為,純粹的數(shù)據(jù)驅(qū)動的模型,對比基于“文法、句法分析和語義解釋”的手工構(gòu)建方法,更容易開發(fā)和維護(hù),并且在標(biāo)準(zhǔn)的基準(zhǔn)測試中得分更高。
該書作者還提及:
可能是Transformer及其相關(guān)模型學(xué)習(xí)到了潛在的表征,這些表征捕捉到與語法和語義信息相同的基本思想,也可能是在這些大規(guī)模模型中發(fā)生了完全不同的事情,但我們根本不知道。
未必那么精確的類比是:AI如孩子般學(xué)習(xí)語言。這正是當(dāng)年圖靈所所設(shè)想的:有一個(gè)孩子般的大腦,然后去學(xué)習(xí)。而非一開始就設(shè)計(jì)一個(gè)成年人的大腦。????
孩子不懂語法構(gòu)建,也沒有成熟的邏輯,也遠(yuǎn)沒有成年人那樣有主動的刻意練習(xí)??墒窍胂肟?,成年人學(xué)習(xí)語言的效率,與孩子對比,是不是爛到渣?
我不禁聯(lián)想起一個(gè)對教育的嘲諷:天生就是語言學(xué)習(xí)天才的孩子,卻要在一輩子都學(xué)不好一門語言的成年人的指導(dǎo)下學(xué)習(xí)語言。
讓我們來看看,AI如何像一個(gè)孩子般,天才般地學(xué)習(xí)。
七
AI的神經(jīng)網(wǎng)絡(luò),是對人類大腦和基于社會化網(wǎng)絡(luò)的人類群體智慧的模仿游戲。
人類大腦神經(jīng)元結(jié)構(gòu)和工作原理如下:
圖片來自《深度學(xué)習(xí)的數(shù)學(xué)》一書。
以上原理,用計(jì)算模擬和解釋,就是:神經(jīng)元在信號之和超過閾值時(shí)點(diǎn)火,不超過閾值時(shí)不點(diǎn)火。
20世紀(jì)五六十年代,????奧利弗·塞弗里奇創(chuàng)造了名為“鬼域”的概念。這是一個(gè)圖案識別設(shè)備,其中進(jìn)行特征檢測的“惡魔”通過互相競爭,來爭取代表圖像中對象的權(quán)利。
“鬼域”是生動的關(guān)于深度學(xué)習(xí)的隱喻,如下圖:??
圖片來自《深度學(xué)習(xí)》一書。
上圖是對當(dāng)前多層次深度學(xué)習(xí)網(wǎng)絡(luò)的隱喻:
從左到右,是從低到高的惡魔級別。
如果每個(gè)級別的惡魔與前一個(gè)級別的輸入相匹配,就會興奮(點(diǎn)火)。?
高級別的惡魔負(fù)責(zé)從下一級的輸入中提取更復(fù)雜的特征和抽象概念,從而做出決定。然后傳遞給自己的上級。
最終,由大惡魔做出最終決定。
《深度學(xué)習(xí)的數(shù)學(xué)》一書中,依照如上隱喻,用一個(gè)生動的例子,講解了神經(jīng)網(wǎng)絡(luò)的工作原理。
問題:建立一個(gè)神經(jīng)網(wǎng)絡(luò),用來識別通過 4×3 像素的圖像讀取的手寫數(shù)字 0 和 1。
第一步:輸入層
12個(gè)格子,相當(dāng)于每個(gè)格子住一個(gè)人,分別編號為1-12。如下圖。
第二步:隱藏層
這一層,負(fù)責(zé)特征提取。假設(shè)有如下三種主要特征,分為為模式A、B、C。如下圖。??
不同的模式對應(yīng)著相應(yīng)的數(shù)字格子的組合。如下圖。模式A對應(yīng)的是數(shù)字4和7,B對應(yīng)5和8,C對應(yīng)6和9。
第三步:輸出層
這一層,從隱藏層那里獲得信息。
如上圖,最下面是AI要識別的圖像。
首先,輸入層的2、5、8、11點(diǎn)火;
然后,隱藏層5和8所對應(yīng)的特征被提取,“模式B”點(diǎn)火;??
最后,輸出層的1被對應(yīng)的“模式B”點(diǎn)火。?
所以,“大惡魔”識別出圖像為數(shù)字1。?
在上面的例子里,AI可以精確地識別出0和1,但它并不懂0和1,它的眼里只有像素。
可這么說,似乎過于擬人化了。人類又如何懂0和1呢?
人類不也是通過雙眼輸入,通過迄今仍是宇宙間最大謎團(tuán)的大腦神經(jīng)元網(wǎng)絡(luò)(更加復(fù)雜、強(qiáng)大且節(jié)能的隱藏層)提取特征,然后通過大腦的某個(gè)部位再進(jìn)行自我解釋的嗎????????????????
辛頓曾在采訪中提及,認(rèn)知科學(xué)領(lǐng)域兩個(gè)學(xué)派關(guān)于“大腦處理視覺圖像”的不同理念:?????
一派認(rèn)為,當(dāng)大腦處理視覺圖像時(shí),你擁有的是一組正在移動的像素。如同上面的演示;
另一學(xué)派偏向于老派的人工智能,認(rèn)為是分層、結(jié)構(gòu)性的描述,腦內(nèi)處理的是符號結(jié)構(gòu)。
辛頓自己則認(rèn)為以上兩派都不對,“實(shí)際上大腦內(nèi)部是多個(gè)神經(jīng)活動的大向量?!?/strong>而符號只是存在于外部世界。
不管怎樣,神經(jīng)網(wǎng)絡(luò)的模型有用,并且非常有用。?????
不愿意和外行分享專業(yè)話題的辛頓,用如下這段話生動介紹了“神經(jīng)網(wǎng)絡(luò)”:
首先是相對簡單的處理元素,也就是松散的神經(jīng)元模型。然后神經(jīng)元會連接起來,每一個(gè)連接都有其權(quán)值,這種權(quán)值通過學(xué)習(xí)可以改變。神經(jīng)元要做的事就是將連接的活動量與權(quán)值相乘,然后累加,再決定是否發(fā)送結(jié)果。如果得到的數(shù)字足夠大,就會發(fā)送一個(gè)結(jié)果。如果數(shù)字是負(fù)的,就不會發(fā)送任何信息。
你要做的事就是將無數(shù)的活動與無數(shù)的權(quán)重聯(lián)系起來,然后搞清如何改變權(quán)重,那樣就行了。問題的關(guān)鍵就是如何改變權(quán)重。
八
神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)經(jīng)歷了并不算短暫的黑暗期。
從上世紀(jì)80年代開始的整整30年間,只有很少一部分相關(guān)研究者義無反顧地投身其間,他們飽受懷疑,也幾乎拿不到科研經(jīng)費(fèi)。????????????????
也許是由于這個(gè)原因,深度學(xué)習(xí)三巨頭辛頓(Hinton)、本吉奧(Bengio)、楊立昆(LeCun)似乎都和加拿大有些關(guān)系,他們退守在那里研究、教學(xué)、讀書。這倒是很符合那個(gè)“傻國家”的氣質(zhì)。
一個(gè)讓人“心酸”的細(xì)節(jié)是,2012年辛頓帶著學(xué)生在ImageNet 圖像識別比賽上拿了冠軍,商業(yè)公司蜂擁而至。辛頓教授開出的商業(yè)報(bào)價(jià),只是區(qū)區(qū)一百萬美元。(后來谷歌以4400萬美元“中標(biāo)”。)
“老派”AI,使用明確的一步步指令指引計(jì)算機(jī),而深度學(xué)習(xí)則使用學(xué)習(xí)算法從數(shù)據(jù)中提取輸入數(shù)據(jù)與期望輸出的關(guān)聯(lián)模式,正如上一節(jié)的演示。
眾所周知,漫漫長夜之后,隨著人類計(jì)算機(jī)算力和數(shù)據(jù)的指數(shù)級增長,深度學(xué)習(xí)一飛沖天,從阿爾法狗一戰(zhàn)封神,再到ChatGPT征服全球。????
為什么是Open AI,而不是DeepMInd?我對此略有好奇。
OpenAI的聯(lián)合創(chuàng)始人兼首席科學(xué)家伊利亞·薩特斯基弗,是辛頓在多倫多大學(xué)帶的學(xué)生。
他似乎延續(xù)了辛頓對深度學(xué)習(xí)的信仰,并且勇于全力下注。????
辛頓認(rèn)為“深度學(xué)習(xí)足以復(fù)制人類所有的智力”,將無所不能,只要有更多概念上的突破。例如“transformers”利用向量來表示詞義的概念性突破。
此外,還要大幅度增加規(guī)模,包括神經(jīng)網(wǎng)絡(luò)規(guī)模和數(shù)據(jù)規(guī)模。例如,人腦大約有100萬億個(gè)參數(shù),是真正的巨大模型。而GPT-3有1750億個(gè)參數(shù),約比大腦小一千倍。
神經(jīng)網(wǎng)絡(luò)模仿了人類的優(yōu)勢:處理有大量參數(shù)的少量數(shù)據(jù)。但人類在這方面做得更好,而且節(jié)能許多倍。
先行一步的DeepMInd,其發(fā)展方向和速度,除了陷入與谷歌的“商業(yè)VS科研”的兩難糾纏,還不可避免地受到哈薩比斯的AI哲學(xué)觀的影響。
哈薩比斯認(rèn)為不管是ChatGPT,還是自家的Gopher,盡管可以幫你寫作,為你繪畫,“有一些令人印象深刻的模仿”,但AI“仍然不能真正理解它在說什么”。
所以,他說:“(這些)不是真正的意義上的(智能)。”
哈薩比斯的老師,MIT的Poggio教授更尖銳地指出:深度學(xué)習(xí)有點(diǎn)像這個(gè)時(shí)代的“煉金術(shù)”,但是需要從“煉金術(shù)”轉(zhuǎn)化為真正的化學(xué)。
楊立昆反對煉金術(shù)的提法,但他也認(rèn)為要探究智能與學(xué)習(xí)的本質(zhì)。人工神經(jīng)元受到腦神經(jīng)元的直接啟發(fā),不能僅僅復(fù)制大自然。
他的觀點(diǎn)大概是,工程學(xué)實(shí)現(xiàn)了的東西,也只有通過科學(xué)打開黑盒子,才能走得更遠(yuǎn)。??????????????
“我認(rèn)為,我們必須探究智能和學(xué)習(xí)的基礎(chǔ)原理,不管這些原理是以生物學(xué)的形式還是以電子的形式存在。正如空氣動力學(xué)解釋了飛機(jī)、鳥類、蝙蝠和昆蟲的飛行原理,熱力學(xué)解釋了熱機(jī)和生化過程中的能量轉(zhuǎn)換一樣,智能理論也必須考慮到各種形式的智能?!?/p>
幾年前,巔峰時(shí)刻的哈薩比斯就表達(dá)過,僅靠神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí),無法令人工智能走得更遠(yuǎn)。
類似的反思,也發(fā)生于貝葉斯網(wǎng)絡(luò)之父 Judea Pearl。
他說,機(jī)器學(xué)習(xí)不過是在擬合數(shù)據(jù)和概率分布曲線。變量的內(nèi)在因果關(guān)系不僅沒有被重視,反而被刻意忽略和簡化。
簡單來說,就是:重視相關(guān),忽視因果。?????
在Pearl看來,如果要真正解決科學(xué)問題,甚至開發(fā)具有真正意義智能的機(jī)器,因果關(guān)系是必然要邁過的一道坎。????????
不少科學(xué)家有類似的觀點(diǎn),認(rèn)為應(yīng)該給人工智能加上常識,加上因果推理的能力,加上了解世界事實(shí)的能力。所以,解決方案也許是“混合模式”–用神經(jīng)網(wǎng)絡(luò)結(jié)合老式的手工編碼邏輯。?????????
辛頓對此頗為不屑,一方面他堅(jiān)信神經(jīng)網(wǎng)絡(luò)完全可以有推理能力,畢竟大腦就是類似的神經(jīng)網(wǎng)絡(luò)。另一方面,他認(rèn)為加入手工編碼的邏輯很蠢:
它會遇到所有專家系統(tǒng)的問題,那就是你永遠(yuǎn)無法預(yù)測你想要給機(jī)器的所有常識。
AI真的需要那些人類概念嗎?阿爾法狗早已證明,所謂棋理和定式只是多余的夾層解釋而已。????????
關(guān)于AI是否真正“理解”,真正“懂得”,真正有“判斷力”,辛頓以“昆蟲識別花朵”為例:
“昆蟲可以看到紫外線,而人類不能,所以在人類看來一模一樣的兩朵花,在昆蟲眼中卻可能截然不同。那么能不能說昆蟲判斷錯(cuò)誤了呢?昆蟲通過不同的紫外線信號識別出這是兩朵不同的花,顯然昆蟲沒有錯(cuò),只是人類看不到紫外線,所以不知道有區(qū)別而已?!?/p>
我們說AI“不懂”什么,會不會是過于以人類為中心了?
假如我們認(rèn)為AI沒有可解釋性,算不上智能,可會不會是即使AI解釋了,我們也不懂?就像“人類只有借助機(jī)器檢測,看到兩朵花的顏色信號在電磁波譜上分屬不同區(qū)域,才能確信兩朵花確有不同?!?/p>
從十幾歲開始,就相信“模仿大腦神經(jīng)網(wǎng)絡(luò)”的辛頓,仿佛有某種宗教式的堅(jiān)定。
于是,在某個(gè)路口,哈薩比斯略有遲疑,而伊利亞·薩特斯基弗則和辛頓一路向前,豪賭到底。
辛頓的人生哲學(xué)是“基于信仰的差異化”,他的確也是如此實(shí)踐的。
如今,盡管哈薩比斯認(rèn)為ChatGPT僅僅是更多的計(jì)算能力和數(shù)據(jù)的蠻力,但他也不得不承認(rèn),這是目前獲得最佳結(jié)果的有效方式。
九
對AI路線的分歧,不過是一百多年來某類科學(xué)暗涌的延續(xù)。???????????
相當(dāng)長的歲月里,在大雪紛飛的多倫多,辛頓幾乎是深度學(xué)習(xí)唯一的守夜人。
他本科在劍橋大學(xué)讀生理學(xué)和物理學(xué),其間轉(zhuǎn)向哲學(xué),拿的是心理學(xué)學(xué)士學(xué)位,后來再讀了人工智能博士學(xué)位。
辛頓等人在統(tǒng)計(jì)力學(xué)中得到靈感,于1986 年提出的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)玻爾茲曼機(jī),向有隱藏單元的網(wǎng)絡(luò)引入了玻爾茲曼機(jī)器學(xué)習(xí)算法。
如下圖,所有節(jié)點(diǎn)之間的連線都是雙向的。所以玻爾茲曼機(jī)具有負(fù)反饋機(jī)制,節(jié)點(diǎn)向相鄰節(jié)點(diǎn)輸出的值會再次反饋到節(jié)點(diǎn)本身。
玻爾茲曼機(jī)在神經(jīng)元狀態(tài)變化中引入了統(tǒng)計(jì)概率,網(wǎng)絡(luò)的平衡狀態(tài)服從玻爾茲曼分布,網(wǎng)絡(luò)運(yùn)行機(jī)制基于模擬退火算法。
玻爾茲曼機(jī) 圖片來自《圖解人工智能》一書。
從香農(nóng),再到辛頓,他們都從玻爾茲曼那里獲得了巨大的靈感。將“概率”引入物理學(xué),看起來非常奇怪。??人類直到19世紀(jì)之后,才知道“熱”是物體內(nèi)部大量分子的無規(guī)則運(yùn)動的表現(xiàn)。那么,為什么熱量總從熱的物體傳到冷的物體??????玻
爾茲曼說,原子(分子)完全是隨機(jī)運(yùn)動的。并非是熱量無法從冷的物體傳到熱的物體,只是因?yàn)椋?
從統(tǒng)計(jì)學(xué)的角度看,一個(gè)快速運(yùn)動的熱物體的原子更有可能撞上一個(gè)冷物體的原子,傳遞給它一部分能量;而相反過程發(fā)生的概率則很小。在碰撞的過程中能量是守恒的,但當(dāng)發(fā)生大量偶然碰撞時(shí),能量傾向于平均分布。
這其中,沒有物理定律,只有統(tǒng)計(jì)概率。這看起來非?;闹嚒??堅(jiān)定的科學(xué)主義者費(fèi)曼,后來也提出“概率振幅”,用來描述物理世界的本質(zhì)。
對此,費(fèi)曼解釋道:這是不是意味著物理學(xué)——一門極精確的學(xué)科——已經(jīng)退化到“只能計(jì)算事件的概率,而不能精確地預(yù)言究竟將要發(fā)生什么”的地步了呢?是的!這是一個(gè)退卻!但事情本身就是這樣的:自然界允許我們計(jì)算的只是概率,不過科學(xué)并沒就此垮臺。
也許是因?yàn)槎汲钟小白韵露稀钡氖澜缬^,玻爾茲曼喜歡達(dá)爾文,他在一次講座中宣稱:?????????
“如果你問我內(nèi)心深處的信念,我們的世紀(jì)將被稱為鋼鐵世紀(jì)還是蒸汽或電的世紀(jì)呢?我會毫不猶豫地回答:它將被稱為機(jī)械自然觀的世紀(jì),達(dá)爾文的世紀(jì)?!?/p>
對達(dá)爾文的自然選擇理論,玻爾茲曼認(rèn)識到,生物之間通過資源競爭展開“一種使熵最小化的戰(zhàn)斗”,生命是通過捕獲盡可能多的可用能量來使熵降低的斗爭。
和生命系統(tǒng)一樣,人工智能也是能夠自動化實(shí)現(xiàn)“熵減”的系統(tǒng)。??生命以“負(fù)熵”為食,人工智能系統(tǒng)則消耗算力和數(shù)據(jù)。?楊立昆估算,需要10萬個(gè)GPU才能接近大腦的運(yùn)算能力。一個(gè)GPU的功率約為250瓦,而人類大腦的功率大約僅為25瓦。這意味著硅基智能的效率是碳基智能的一百萬分之一。
所以,辛頓相信克服人工智能局限性的關(guān)鍵,在于搭建“一個(gè)連接計(jì)算機(jī)科學(xué)和生物學(xué)的橋梁”。
十
達(dá)·芬奇曾說過:“簡單是終極的復(fù)雜?!迸nD那一代相信上帝的科學(xué)家,認(rèn)為神創(chuàng)造這個(gè)世界時(shí),一定運(yùn)用了規(guī)則。
他們只管去發(fā)現(xiàn)規(guī)則,而不必在意暫時(shí)的不可理解。例如,萬有引力公式為什么長成那樣?為什么要和距離的平方成反比?
另一方面,牛頓們信奉奧卡姆剃刀的原則,認(rèn)為世界的模型基于某些簡潔的公式。他們至少相信存在某個(gè)這樣的公式,從愛因斯坦到霍金,莫不如是。
然而在不確定性時(shí)代,概率似乎比決定論派更能解釋這個(gè)世界。牛頓式的確定退縮到了有限的領(lǐng)域。
也許費(fèi)曼是對的,科學(xué)家是在用一個(gè)篩網(wǎng)檢驗(yàn)這個(gè)世界,某些時(shí)刻似乎所有的現(xiàn)象都能通過篩孔,但如今我們知道多么完備的科學(xué)都只是暫時(shí)的解釋,只是暫時(shí)未被證偽的篩網(wǎng)。但這并不影響我們向前。
還有一種哲學(xué)認(rèn)為,世界本身就是在為自己建模。試圖用一個(gè)大一統(tǒng)理論解釋世界幾乎是不可能的,更何況宇宙還在繼續(xù)膨脹。
從以上有趣但略顯含混的角度看,ChatGPT是用一種反愛因斯坦的方式為世界建模。它有如下特點(diǎn):
- 是概率的,而非因果的;
- 盡可能地去模擬人類世界這一“大模型”,從經(jīng)驗(yàn)中學(xué)習(xí)和進(jìn)化,而非去探尋第一原理;
- 它信奉(至少暫時(shí)如此)“復(fù)雜是終極的簡單”;
- 它驅(qū)逐了神。因?yàn)樗约涸絹碓较褚粋€(gè)神。
AI和人類別的熱鬧事物一樣,經(jīng)常會有周期性的熱潮。上一波是2016年,熱起來,然后又慢慢靜下來。
七年過去了,AI再次熱起。Open AI照例沒有打開“黑盒子”,卻帶來了影響力更為廣泛的浪潮。
這一次,廣泛性似乎戰(zhàn)勝了專業(yè)性。人們似乎更關(guān)注那個(gè)會畫畫的、可能替代自己摸魚的AI,而不是那個(gè)能戰(zhàn)勝世界冠軍、能研究蛋白質(zhì)折疊解決人類頂尖難題的AI。
這其中有多少是工程的突破和技術(shù)的飛躍?有多少是商業(yè)驅(qū)動下的大力出奇跡?有多少是人類社會慣常的泡沫?
毋庸置疑,人類過往的偉大突破,不少都是在多種理性和非理性力量的交織之下實(shí)現(xiàn)的。
這里面的機(jī)會是:
- 賣水者。如英偉達(dá);
- 新平臺的出現(xiàn);
- 新平臺既有通過生產(chǎn)力的提升創(chuàng)造的新價(jià)值空間,如各種全新的產(chǎn)品和服務(wù),也有對舊有價(jià)值空間的掠奪;
- AI會成為基礎(chǔ)設(shè)施。但是,水和電成為基礎(chǔ)設(shè)施,互聯(lián)網(wǎng)成為基礎(chǔ)設(shè)施,與AI成為基礎(chǔ)設(shè)施,絕非簡單的類比或升級。大概的趨勢也許是,商業(yè)上的壟斷與兩極分化會更加殘酷。職業(yè)上,或許中間階層會更加無望;
- “場景”和“應(yīng)用”會有機(jī)遇。尤其是那些能夠較好地利用AI平臺實(shí)現(xiàn)人機(jī)結(jié)合的場景與應(yīng)用。對個(gè)體而言,我們要問的是,AI還需要人類充當(dāng)新基礎(chǔ)設(shè)施和新系統(tǒng)的類似于“操作員、司機(jī)、程序員、快遞員”的新時(shí)代角色嗎??????????????
十一
哈耶克說:“一個(gè)秩序之所以可取,不是因?yàn)樗屍渲械囊馗骶推湮唬窃谶@個(gè)秩序上能夠生長出其他情況下不能生長出的新力量?!逼駷橹梗覀兩胁荒芏x什么是智能,什么是意識。??????
然而,卻有一個(gè)黑乎乎的盒子,告訴我們可能會超越人類的智能,甚至涌現(xiàn)出人類的意識。
微軟的報(bào)告中這樣寫道:
我們沒有解決為什么以及如何實(shí)現(xiàn)如此卓越的智能的基本問題。它是如何推理、計(jì)劃和創(chuàng)造的?當(dāng)它的核心只是簡單的算法組件–梯度下降和大規(guī)模變換器與極其大量的數(shù)據(jù)的結(jié)合時(shí),它為什么會表現(xiàn)出如此普遍和靈活的智能?
AI研究人員承認(rèn),智能是否可以在沒有任何代理或內(nèi)在動機(jī)的情況下實(shí)現(xiàn),是一個(gè)重要的哲學(xué)問題。
在2023年的這個(gè)并不容易的春天,我對ChatGPT的態(tài)度坦然而期待:
我希望見到它所具備的可能性,為這個(gè)混亂的世界帶來某些“熵減”。??
在所有預(yù)測中,我期待Kurzweil的那個(gè)“2030 年技術(shù)將使人類享受永生”的預(yù)言。
我自己對永生沒興趣,但不想失去身邊的人們。我對世俗的依賴大過對“超人類主義”的擔(dān)憂。
我不太相信意識的上傳,因?yàn)橐坏┥蟼?,就可以?fù)制,就不是唯一的,就失去了自由意志,又談何“意識”呢??
人類會洞察大腦最深層次的秘密嗎?湯姆·斯托帕警告過:
“當(dāng)我們發(fā)現(xiàn)了所有的奧秘,并失去了所有的意義時(shí),我們將會在空蕩蕩的海邊孤身一人。”
哥德爾的“不完備性定理”告訴我們,不確定性是人類認(rèn)識的形式邏輯思維本身所固有的。
“一個(gè)計(jì)算機(jī)可以修改自身的程序,但不能違背自身的指令——充其量只能通過服從自身的指令來改變自身的某些部分?!?/p>
哥德爾算是為AI,為人類劃定了邊界嗎?否則,人類制造超級AI,然后拜其為神,何嘗不是自我奴役??
哥德爾又告訴我們,人類永遠(yuǎn)可以在“實(shí)在主義”中通過“直觀和直覺”引入構(gòu)成高一級形式系統(tǒng)的新東西,建立新公理系統(tǒng),如此推進(jìn)以至無窮。
這就是彭羅斯所持的那種“人心超過計(jì)算機(jī)”的觀念。
上一次,七年前,在阿爾法狗面前,人類曾經(jīng)哭泣過;
這一次,無人哭泣,卻有萬眾狂歡。
在兩次AI高潮之間的7年里,我們經(jīng)歷了許多,失去了許多。
人們渴望擁抱某些希望,某些確定性,即使那些確定性來自一些不確定性的智慧。????
就我自己而言,也遭遇了一些前所未有的艱難時(shí)刻。所謂艱難,并非指一些困難的抉擇,也并非說沒有選項(xiàng)。???????
恰恰相反,依照最優(yōu)決策原理,我很容易通過期望值計(jì)算,得出最佳選項(xiàng),獲得所謂最大化的收益。
然而,我追溯到內(nèi)心的源頭,重新定義了自己的期望效用,然后據(jù)此做出了有點(diǎn)兒辛頓風(fēng)格的“基于信仰的差異化”選擇。??????
對任何一個(gè)人而言,不管是難是易,是聰明是愚蠢,是理性是任性,這種事兒在技術(shù)層面都只算小菜一碟。
可對AI來說,自己去定義期望效用,暫時(shí)難于登天。??
所以,研究人員稱,為“大型語言模型”配備代理權(quán)和內(nèi)在動機(jī)是未來工作的一個(gè)迷人的重要方向。
而“代理權(quán)”與“內(nèi)在動機(jī)”這兩點(diǎn),一個(gè)普通人類只需要一秒鐘或者幾個(gè)不眠之夜即可實(shí)現(xiàn)。??
或許關(guān)鍵不在于得失,不在于效用函數(shù),而在于“存在”。
如伊塔洛·卡爾維諾所言:
“隨著時(shí)光流逝,我慢慢地明白了,只有存在的東西才會消失,不管是城市,愛情,還是父母。”
大概是人類自作多情吧,在斯皮爾伯格的電影《A.I.》里,機(jī)器舞男被抓去銷毀前,最后對小男孩深情地說:
“I am,I was!”
“我存在,我曾經(jīng)存在!”
作者:孤獨(dú)大腦,公眾號:孤獨(dú)大腦(ID:lonelybrain)
本文由 @孤獨(dú)大腦 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
當(dāng)我接觸到chatgpt的時(shí)候,很興奮的告訴身邊的人:我彷佛看到了人們一直在討論的那個(gè)”神“。