“AI那么火,但我還是勸你謹(jǐn)慎用它!”

0 評(píng)論 375 瀏覽 0 收藏 16 分鐘

盡管AI技術(shù)在全球范圍內(nèi)引發(fā)了廣泛關(guān)注和應(yīng)用熱潮,但其可靠性和準(zhǔn)確性仍備受質(zhì)疑。本文通過(guò)多位專業(yè)人士的真實(shí)案例,探討了AI在實(shí)際應(yīng)用中可能帶來(lái)的“幻覺(jué)”問(wèn)題——即AI生成的內(nèi)容看似合理卻可能完全錯(cuò)誤的現(xiàn)象。

盡管AI已經(jīng)火爆全球,但依然有不少人對(duì)它的使用存在置疑。

曉姐是一名文字工作者,自大模型推出伊始,她便嘗試借助AI工具寫作,但自始至終,她都無(wú)法相信AI。

“大模型剛推出的時(shí)候,大家都知道它‘資料更新不及時(shí)’,后來(lái),隨著應(yīng)用不斷升級(jí),我也習(xí)慣了用大模型,但仍會(huì)對(duì)它生成的內(nèi)容持遲疑態(tài)度。尤其大模型給出的數(shù)據(jù)和時(shí)間,幾乎很少標(biāo)注信息來(lái)源和出處,這點(diǎn)我必須要做一番考證。”

在曉姐看來(lái),大模型的行文方式和生成作品,“更像結(jié)論和觀點(diǎn)?!焙?jiǎn)單來(lái)說(shuō),大模型給出的是邏輯和結(jié)論,但寫文章和做研究,只有遠(yuǎn)遠(yuǎn)是不夠的,“我們講究每一句發(fā)言是有跡可循,只有被敲打和反復(fù)考證過(guò)的傳播,才有價(jià)值。”

實(shí)際上,曉姐遇到的情況,并不是偶發(fā)。近期,越來(lái)越多的博主在社交平臺(tái)發(fā)出警示,告誡網(wǎng)友“警惕AI幻覺(jué)”,不少博主指出,AI的強(qiáng)邏輯,讓網(wǎng)友產(chǎn)生幻覺(jué),認(rèn)為“AI完全正確”,但實(shí)際上,不少跡象表明,AI經(jīng)常出現(xiàn)“一本正經(jīng)胡說(shuō)”的現(xiàn)象。

Vectara平臺(tái)最新發(fā)布的數(shù)據(jù)還顯示,目前市場(chǎng)上AI大模型,均有幻覺(jué)率,即便是OpenAI-o3,也有0.8%的幻覺(jué)率;目前市場(chǎng)大熱的DeepSeek-V3,幻覺(jué)率達(dá)到3.9%。而在更早之前,這一幻覺(jué)率甚至高達(dá)30%。

圖:市場(chǎng)主流大模型幻覺(jué)率(截止2025年1月31日)

來(lái)源:網(wǎng)絡(luò)

公開(kāi)的報(bào)道顯示,此前,Vectara公司聯(lián)合創(chuàng)始人阿姆爾·阿瓦達(dá)拉亦表示,在訓(xùn)練過(guò)程中,AI模型會(huì)壓縮數(shù)萬(wàn)億個(gè)單詞間的關(guān)系,隨后通過(guò)龐大的網(wǎng)絡(luò)模型重新展開(kāi)這些信息。盡管這些模型能夠重構(gòu)出接近98%的訓(xùn)練內(nèi)容,但剩下2%內(nèi)容卻會(huì)“誤入歧途”,生成不準(zhǔn)確或虛假信息。

這就意味著,至少在目前,AI依然無(wú)法完全信任。不少業(yè)內(nèi)人士亦對(duì)《聽(tīng)筒Tech(ID:tingtongtech)》表示,在專業(yè)的領(lǐng)域,建議警惕使用AI,“我們可以借助AI來(lái)輔助我們的工作,而不是依賴AI?!?/p>

01 “AI很強(qiáng)大,但我不怎么用”

曉姐是在朋友安利下開(kāi)始使用AI。

十年文字工作者的曉姐,日常資料梳理的工作量非常大。前兩年,大模型剛興起的時(shí)候,曉姐就在朋友的建議下成為最早使用大模型的那一批人。

“快速響應(yīng),內(nèi)容強(qiáng)大,邏輯也足夠清晰?!边@是曉姐對(duì)大模型的直觀感受。一度,她熱衷使用大模型,每逢寫作都要問(wèn)“?!?。

但很快,曉姐發(fā)現(xiàn),大模型不能滿足她的寫作需求,甚至讓其創(chuàng)作也不夠“絲滑”。

實(shí)際上,大模型剛推出的時(shí)候,有的資料確實(shí)更新不及時(shí),會(huì)誤導(dǎo)曉姐的文字創(chuàng)作。再者,曉姐發(fā)現(xiàn),大模型給出的內(nèi)容通常是結(jié)論和觀點(diǎn),雖然邏輯性很強(qiáng),但一旦出現(xiàn)細(xì)節(jié)和事實(shí)錯(cuò)誤,就會(huì)給曉姐的工作帶來(lái)致命的打擊。

“比如,使用大模型的人會(huì)發(fā)現(xiàn),模型生成內(nèi)容的數(shù)據(jù)和時(shí)間,幾乎不標(biāo)注信息來(lái)源和出處,在寫作過(guò)程中,我還發(fā)現(xiàn)了有名言出處錯(cuò)誤的事實(shí),所以,我現(xiàn)在對(duì)AI持遲疑態(tài)度?!?/p>

高校任職的林哥也一度無(wú)法完全擁抱AI。

“如今AI已經(jīng)非常強(qiáng)悍了,但我還是在堅(jiān)持手工敲字,這與正確錯(cuò)誤無(wú)關(guān),完全是個(gè)人愛(ài)好?!?/p>

林哥在批閱學(xué)生的作業(yè)和論文的時(shí)候發(fā)現(xiàn),“有些學(xué)生的內(nèi)容一看就是AI生成,引用也‘張冠李戴’,甚至出現(xiàn)憑空捏造的‘AI幻覺(jué)’,我改了一部分就堅(jiān)持不下去,AI增加了我的工作量?!?/p>

“這并不是一個(gè)好的引導(dǎo)和風(fēng)向。當(dāng)你越來(lái)越認(rèn)為本就應(yīng)該如此的時(shí)候,那么你就失去了對(duì)文字和內(nèi)容的審美鑒別,也失去了對(duì)事實(shí)的判斷和認(rèn)識(shí)能力?!绷指绫硎尽?/p>

圖:社交平臺(tái)關(guān)于“AI幻覺(jué)”的討論

來(lái)源:小紅書,《聽(tīng)筒Tech》截圖

95后家裝設(shè)計(jì)師小屈告訴《聽(tīng)筒Tech》,盡管自己是網(wǎng)絡(luò)擁護(hù)者,但也很少使用AI繪圖。

其實(shí),在大模型剛出來(lái)的時(shí)候,小屈是興奮的,“畫圖是非常累的,客戶的需求也非常多,現(xiàn)在的家裝行業(yè),通常有了初步的設(shè)計(jì)圖紙,客戶才會(huì)繳納意向金。我每天的工作不是跟客戶溝通設(shè)計(jì)需求,就是在畫圖。且畫的圖都不一定會(huì)被客戶采用,所以工作量非常大。”

AI繪圖出現(xiàn)后,小屈抱著試試的心理去AI作圖。不過(guò),在嘗試了幾次后,小屈放棄了作圖。目前,他只是用AI編輯一些文案。

“主要問(wèn)題在于不夠精準(zhǔn),每個(gè)空間不能統(tǒng)一設(shè)計(jì)手法?!痹谛∏磥?lái),AI繪圖只能作為輔助,或者作為早期工作意向確認(rèn)工具。

同樣的問(wèn)題,也發(fā)生在視頻生成領(lǐng)域。

在AI軟件席卷行業(yè)的最早期,影視就被認(rèn)為是被沖擊的巨大行業(yè)。后來(lái),隨著細(xì)分領(lǐng)域模型的不斷推出和升級(jí),影視行業(yè)從業(yè)者郭哥十分焦慮。他曾和《聽(tīng)筒Tech》交流,要主動(dòng)學(xué)習(xí)AI技術(shù),避免在行業(yè)的內(nèi)卷中被淘汰。

但郭哥發(fā)現(xiàn),以全網(wǎng)都在吹的某平臺(tái)為例,生成的視頻有幾個(gè)明顯的缺點(diǎn),比如圖人和物體之間存在交互失靈、物理引擎失效、對(duì)象突然冒出等使視頻產(chǎn)生“鬼畜感”。

02 “小心AI一本正經(jīng)胡說(shuō)”

在曉姐和小屈看來(lái),目前不敢將專業(yè)的工作交給AI來(lái)做,“或許有一天我會(huì)信任它,但不是現(xiàn)在?!?/p>

關(guān)于“我為什么不用AI”,在社交平臺(tái),網(wǎng)友也眾說(shuō)紛紜。有人表示,“我完全不覺(jué)得AI生成的短片有趣,因?yàn)閯?chuàng)作這個(gè)東西的不知道痛楚為何物”、“有沒(méi)有人感覺(jué)越用AI越蠢,這學(xué)期用AI輔寫,被導(dǎo)師吐槽了幾遍文章寫作水平不行”、“越來(lái)越不會(huì)內(nèi)容輸出了”……

尤其是,“AI幻覺(jué)”一詞最近被提及得越來(lái)越多。

一位博主表示,“小心AI一本正經(jīng)的‘胡說(shuō)’?!睂?shí)際上,AI“強(qiáng)邏輯”幻覺(jué)的背后,存在“一本正經(jīng)胡說(shuō)”的隱患,且不是自己的專業(yè)和領(lǐng)域根本判斷不了。

該博主表示,尤其是AI在回應(yīng)一些嚴(yán)肅知識(shí)性問(wèn)題時(shí),會(huì)存在憑空編造事實(shí)、杜撰不存在文獻(xiàn)的可怕現(xiàn)狀。

科普作家河森堡表示,自己讓某大模型介紹一下“青銅利簋”,它就開(kāi)始一本正經(jīng)地胡扯,說(shuō)這件青銅器是商王帝乙為祭祀自己父親所鑄,還詳述了其內(nèi)壁的銘文。

不過(guò),河森堡曾經(jīng)在博物館看見(jiàn)過(guò)“利簋”這件文物,此物是西周貴族為了紀(jì)念武王推翻商朝而鑄,銘文和祭祀也與商王毫無(wú)關(guān)系。

實(shí)際上,河森堡還繼續(xù)追問(wèn)AI,這些資料都是從哪看來(lái)的,AI列出了一大堆文獻(xiàn),但他發(fā)現(xiàn),文獻(xiàn)和作者介紹不少是“捏造”的。

另一位博主也呼吁大家“警惕AI幻覺(jué)”、“希望大家使用AI時(shí),甄別它的謊言”。

該博主表示,“體驗(yàn)了DeepSeek,一開(kāi)始看到它如此強(qiáng)大的推理能力,特別是它在自我思考的時(shí)候展現(xiàn)出來(lái)的完整思維鏈,確實(shí)非常驚艷?!?/p>

但當(dāng)自己在問(wèn)怎樣看待“創(chuàng)新是一種涌現(xiàn)”這個(gè)話題時(shí)發(fā)現(xiàn),盡管大模型給出了一系列層次和角度的分析,但博主卻總感覺(jué)“有一絲絲的不對(duì)”。

該博主認(rèn)認(rèn)真真地對(duì)內(nèi)容做了核對(duì),發(fā)現(xiàn)這些看似正確的回答卻有很多問(wèn)題。比如,AI在“編造數(shù)據(jù)謊言”。實(shí)際上,針對(duì)DeepSeek表示的“70%的創(chuàng)新出現(xiàn)在跨學(xué)科領(lǐng)域”,該博主查了很多文獻(xiàn)都沒(méi)有找到這個(gè)信息源頭和實(shí)驗(yàn)數(shù)據(jù)。

該博主指出,“如果這種捏造廣泛流傳,不知有多可怕?!?/p>

甚至,如果AI能虛構(gòu)文本、照片乃至視頻的一切內(nèi)容,并且令其彼此之間相互印證和支撐,其制造幻覺(jué)的強(qiáng)度與編撰故事不可同日而語(yǔ)。

“除非你親自見(jiàn)到并本人求證,或者到現(xiàn)場(chǎng)實(shí)地考察,否則你會(huì)被AI創(chuàng)造出的假象玩得死死的?!币晃粯I(yè)內(nèi)人士這樣擔(dān)憂。

然而,在現(xiàn)實(shí)社會(huì)中,有意愿和有能力親自驗(yàn)證事實(shí)的人并不多。也就是說(shuō),稍一個(gè)不留神,你可能就會(huì)被AI污染。

03 別焦慮,現(xiàn)在AI還無(wú)法取代你我

實(shí)際上,AI幻覺(jué)已經(jīng)給人們的工作和現(xiàn)實(shí)生活帶來(lái)了巨大影響。

世界經(jīng)濟(jì)論壇發(fā)布的《2025年全球風(fēng)險(xiǎn)報(bào)告》顯示,錯(cuò)誤和虛假信息是2025年全球面臨的五大風(fēng)險(xiǎn)之一。2023年,美國(guó)律師史蒂文·施瓦茨也曾因“輕信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在醫(yī)學(xué)領(lǐng)域,AI幻覺(jué)提供的錯(cuò)誤診斷和治療建議,可能會(huì)危及患者生命。

從底層技術(shù)來(lái)看,AI幻覺(jué)的產(chǎn)生,是必然的。

AI企業(yè)落地師石云升便告訴《聽(tīng)筒Tech》,“據(jù)我所知,目前AI底層架構(gòu)師無(wú)法解決幻覺(jué)問(wèn)題。因?yàn)樗恳粋€(gè)字符都根據(jù)概率計(jì)算,這就導(dǎo)致它輸出的內(nèi)容會(huì)有幻覺(jué),這是無(wú)解的?!?/p>

不過(guò),石云升指出,在真實(shí)場(chǎng)景中,用戶可以通過(guò)反復(fù)溝通來(lái)幫助AI更精準(zhǔn)的回答問(wèn)題。畢竟,AI給出的答案是否采納,最終還是由人來(lái)決定。

“降低AI幻覺(jué)的問(wèn)題可以通過(guò)’預(yù)訓(xùn)練、微調(diào)和推理‘三個(gè)層級(jí)來(lái)解決。”石云升指出,例如,在公司負(fù)責(zé)AI客服時(shí),用戶主要通過(guò)“提示詞+知識(shí)庫(kù)”來(lái)防止AI輸出幻覺(jué),“如果公司有懂得微調(diào)的技術(shù)人員,并且擁有優(yōu)質(zhì)的企業(yè)數(shù)據(jù),微調(diào)的效果會(huì)更加理想?!?/p>

不過(guò),石云升坦言,微調(diào)通常是針對(duì)企業(yè)專屬的大模型進(jìn)行的,“一般我們會(huì)在通用大模型回復(fù)效果特別不好的情況才會(huì)考慮微調(diào)?!?/p>

比如,在法律領(lǐng)域,通用大模型訓(xùn)練預(yù)料數(shù)量太少,質(zhì)量太差,企業(yè)內(nèi)部有很多更優(yōu)質(zhì)的法律數(shù)據(jù),這種情況就可以考慮微調(diào)一個(gè)專屬公司的法律大模型,微調(diào)后出現(xiàn)幻覺(jué)的概率就小很多。

石云升指出,還有一種手法是使用“RAG增強(qiáng)檢索”,“在提問(wèn)的時(shí)候,先從知識(shí)庫(kù)里查詢資料,然后給到大模型,如果用戶的問(wèn)題在知識(shí)庫(kù)里有資料,那基本也不會(huì)出現(xiàn)AI幻覺(jué)?!?/p>

當(dāng)然,石云升也表示,對(duì)于普通用戶來(lái)說(shuō),AI的幻覺(jué)率,目前沒(méi)有特別有效的解決辦法,“普通用戶很難接觸到預(yù)訓(xùn)練和微調(diào)技術(shù),因此只能在AI推理階段提供更詳細(xì)的信息。這也是為什么在AI剛剛興起時(shí),行業(yè)內(nèi)很多人開(kāi)始教授如何編寫‘提示詞’并建立自己的知識(shí)庫(kù)?!?/p>

也即是說(shuō),至少在現(xiàn)階段,AI還無(wú)法真正取代你我。

此前,張雪峰“回應(yīng)DeepSeek會(huì)讓自己失業(yè)”這一話題時(shí)曾這樣解釋,“第一,我們這個(gè)行當(dāng)不止是打破信息差,還是在提供情緒價(jià)值;第二,大模型只會(huì)有一些公開(kāi)信息,但是你要知道有些信息網(wǎng)上是不公開(kāi)的?!?/p>

那些“網(wǎng)上非公開(kāi)的”、“對(duì)情感的理解”,以及“深度思考引發(fā)的創(chuàng)新”,或許是現(xiàn)階段“你我”存在的價(jià)值和意義所在。

“警惕AI幻覺(jué),這是一種呼吁,也是一種社會(huì)職責(zé)?!憋@然,這不是“曉姐”一個(gè)人所希冀的事。

(文中曉姐、林哥、小屈、郭哥均為化名。)

文?|?小聽(tīng) 編?|?饒言

本文由人人都是產(chǎn)品經(jīng)理作者【聽(tīng)筒Tech】,微信公眾號(hào):【聽(tīng)筒Tech】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!