【入門(mén)科普】必了解的 20 個(gè) AI 術(shù)語(yǔ)解析(下)

0 評(píng)論 1861 瀏覽 5 收藏 9 分鐘

AI領(lǐng)域的基礎(chǔ)概念和相關(guān)技術(shù)有很多,這篇文章里,作者就深入淺出地介紹了相應(yīng)的內(nèi)容,感興趣的同學(xué)們,不妨來(lái)看一下。

本文專(zhuān)為非技術(shù)背景的AI愛(ài)好者設(shè)計(jì),旨在深入淺出地介紹AI的基礎(chǔ)概念和關(guān)鍵技術(shù),帶您一步步解鎖AI技術(shù)的奧秘。建議先閱讀【入門(mén)科普】必了解的 20 個(gè) AI術(shù)語(yǔ)解析(上)再閱讀本文。

十一、生成對(duì)抗網(wǎng)絡(luò)

想象一下有兩位藝術(shù)家:一位是偽造者,另一位是鑒賞家。偽造者試圖創(chuàng)作出看起來(lái)像真正藝術(shù)品的作品,而鑒賞家則試圖區(qū)分出哪些是真正的藝術(shù)品,哪些是偽造的。他們不斷地相互學(xué)習(xí)會(huì)使得偽造者變得越來(lái)越擅長(zhǎng)創(chuàng)作逼真的作品,而鑒賞家則變得越來(lái)越擅長(zhǎng)識(shí)別真?zhèn)巍?/p>

生成對(duì)抗網(wǎng)絡(luò)GAN由兩部分組成:一個(gè)是生成器(偽造者)和一個(gè)是判別器(鑒賞家)。

十二、強(qiáng)化學(xué)習(xí)

如果說(shuō)對(duì)抗網(wǎng)絡(luò)是真假孫悟空之間的1對(duì)1的斗智斗勇,目標(biāo)是戰(zhàn)勝對(duì)方,那么強(qiáng)化學(xué)習(xí)就是1對(duì)多的一路斬妖除魔,設(shè)定一個(gè)去西天的目標(biāo),取經(jīng)隊(duì)伍總會(huì)去想辦法在真實(shí)環(huán)境中排除萬(wàn)難,那些牛魔王、火焰山、蜘蛛精、女兒國(guó)等等都是在環(huán)境中遇到的不同的挫折,磨煉的是取經(jīng)隊(duì)伍內(nèi)在的佛性。

十三、主成分分析

假設(shè)你有一個(gè)非常雜亂的書(shū)桌,上面堆滿(mǎn)了各種物品。如果你想用一張照片抓住書(shū)桌的“精華”,但又不想讓照片顯得太雜亂,你可能會(huì)選擇從一個(gè)角度拍攝,這個(gè)角度能最好地展示書(shū)桌上最重要的幾樣?xùn)|西。PCA就是在做類(lèi)似的事情:它試圖找到最能代表整個(gè)數(shù)據(jù)集“精華”的幾個(gè)方向(主成分),然后用這些方向來(lái)簡(jiǎn)化和描述數(shù)據(jù)集。

十四、交叉驗(yàn)證

交叉驗(yàn)證是機(jī)器學(xué)習(xí)中的一種評(píng)估方法,旨在測(cè)試模型對(duì)新數(shù)據(jù)的預(yù)測(cè)準(zhǔn)確性。它通過(guò)將數(shù)據(jù)集分成多個(gè)部分來(lái)工作。在k-折交叉驗(yàn)證中,整個(gè)數(shù)據(jù)集被分成k個(gè)等大小的子集。然后,模型會(huì)進(jìn)行k次訓(xùn)練和測(cè)試的循環(huán),每次循環(huán)中,選擇一個(gè)不同的子集作為測(cè)試集,而剩余的k-1個(gè)子集用作訓(xùn)練集。通過(guò)這種方式,每個(gè)數(shù)據(jù)子集都有機(jī)會(huì)作為測(cè)試集使用。完成這k次循環(huán)后,通過(guò)平均所有循環(huán)的測(cè)試結(jié)果來(lái)評(píng)估模型的整體性能。

十五、梯度下降

想象你在一座山上,目標(biāo)是找到山谷的最低點(diǎn)。由于山上濃霧彌漫,你看不清整座山,所以無(wú)法直接找到最低點(diǎn)。梯度下降就像是你決定每次都沿著當(dāng)前位置最陡峭的下坡方向走一步,期望這樣可以帶你到達(dá)山谷的最低點(diǎn)。在機(jī)器學(xué)習(xí)中,梯度下降幫助模型“學(xué)習(xí)”到最佳參數(shù),即找到能讓模型預(yù)測(cè)誤差最小的參數(shù)。

十六、遷移學(xué)習(xí)

假設(shè)你已經(jīng)是一個(gè)鋼琴高手,現(xiàn)在你想學(xué)習(xí)吉他。由于你已經(jīng)掌握了很多關(guān)于音樂(lè)的知識(shí),如音階和節(jié)奏,你可以把這些知識(shí)應(yīng)用到新的學(xué)習(xí)中,這樣你學(xué)吉他的速度就會(huì)更快。在A(yíng)I中,遷移學(xué)習(xí)就是這個(gè)原理,它讓一個(gè)已經(jīng)在一個(gè)任務(wù)上訓(xùn)練好的模型,用于另一個(gè)相關(guān)但不同的任務(wù)。這樣可以節(jié)省大量的訓(xùn)練時(shí)間和資源。

十七、特征工程

模型的學(xué)習(xí)能力很大程度上取決于我們給它提供的信息質(zhì)量。如果信息選得好,模型就能學(xué)得快,預(yù)測(cè)得準(zhǔn);如果信息選得不好,模型就可能學(xué)不會(huì),或者學(xué)錯(cuò)了。這個(gè)過(guò)程包括數(shù)據(jù)預(yù)處理、特征選擇、特征構(gòu)造、特征轉(zhuǎn)化、降緯 等等,比如訓(xùn)練一個(gè)顏值打分模型,訓(xùn)練數(shù)據(jù)是一堆照片,那么特征的工程就是提取眼睛、鼻子、嘴巴的位置、構(gòu)造出新的特征比如面部比例數(shù)據(jù)、并選擇具體哪個(gè)面部特征的顏值權(quán)重更高 等等。

十八、超參數(shù)調(diào)優(yōu)

超參數(shù)是在開(kāi)始訓(xùn)練之前設(shè)置的參數(shù),它們不能通過(guò)訓(xùn)練過(guò)程本身得到。比如決定每次訓(xùn)練模型時(shí)輸入的數(shù)據(jù)量的“批大小”、決定每次權(quán)重更新幅度的學(xué)習(xí)率等等。如果把模型訓(xùn)練過(guò)程比喻成西天取經(jīng)的過(guò)程,那么超參數(shù)調(diào)優(yōu)就是在取經(jīng)出發(fā)前,唐僧從觀(guān)音或唐太宗那里獲得的 通關(guān)文牒、錦襕袈裟。

十九、增強(qiáng)檢索

在大語(yǔ)言模型通常會(huì)發(fā)生“模型幻覺(jué)”的問(wèn)題,就是在處理復(fù)雜事物是產(chǎn)生與事實(shí)不符甚至完全捏造的信息,就像說(shuō)人有時(shí)候也會(huì)說(shuō)夢(mèng)話(huà)一樣胡說(shuō)八道。增強(qiáng)檢索可以緩解這個(gè)問(wèn)題,通過(guò)引入外部知識(shí)來(lái)源來(lái)提高回答問(wèn)題的準(zhǔn)確性和豐富性。以一個(gè)法律咨詢(xún)的場(chǎng)景為例,如果用戶(hù)詢(xún)問(wèn)關(guān)于最新稅法的問(wèn)題,傳統(tǒng)的語(yǔ)言模型可能只能提供基于其訓(xùn)練數(shù)據(jù)的答案,而這些數(shù)據(jù)可能不包括最新的稅法變化,這是需要增強(qiáng)檢索的典型應(yīng)用場(chǎng)景。

二十、通用人工智能

馬斯克在24年4月時(shí)說(shuō):比人類(lèi)更聰明的AGI將在兩年內(nèi)實(shí)現(xiàn)。通用人工智能是指不需要人為干預(yù)而可以自我學(xué)習(xí)、自我調(diào)整從而完全像人類(lèi)一樣可以執(zhí)行原本只有人可以從事的任務(wù),甚至機(jī)器人可以自行進(jìn)行科學(xué)理論探索。這將是地球智能發(fā)展的奇點(diǎn)。

本文由 @李文杰 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

該文觀(guān)點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!