91情侣在线精品国产，国产欧美一二三区男女交配，国产精品大片免费在线观看，五月天一区二区精品，亚洲AⅤ无码一区东京热，国产在线98视频播放，国产V欧美V日韩在线观看，女人高潮被爽到呻吟在线观看

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

“AI那么火，但我還是勸你謹(jǐn)慎用它！”

聽(tīng)筒Tech

2025-02-14

0 評(píng)論 375 瀏覽 0 收藏

16 分鐘

盡管AI技術(shù)在全球范圍內(nèi)引發(fā)了廣泛關(guān)注和應(yīng)用熱潮，但其可靠性和準(zhǔn)確性仍備受質(zhì)疑。本文通過(guò)多位專業(yè)人士的真實(shí)案例，探討了AI在實(shí)際應(yīng)用中可能帶來(lái)的“幻覺(jué)”問(wèn)題——即AI生成的內(nèi)容看似合理卻可能完全錯(cuò)誤的現(xiàn)象。

盡管AI已經(jīng)火爆全球，但依然有不少人對(duì)它的使用存在置疑。

曉姐是一名文字工作者，自大模型推出伊始，她便嘗試借助AI工具寫作，但自始至終，她都無(wú)法相信AI。

“大模型剛推出的時(shí)候，大家都知道它‘資料更新不及時(shí)’，后來(lái)，隨著應(yīng)用不斷升級(jí)，我也習(xí)慣了用大模型，但仍會(huì)對(duì)它生成的內(nèi)容持遲疑態(tài)度。尤其大模型給出的數(shù)據(jù)和時(shí)間，幾乎很少標(biāo)注信息來(lái)源和出處，這點(diǎn)我必須要做一番考證。”

在曉姐看來(lái)，大模型的行文方式和生成作品，“更像結(jié)論和觀點(diǎn)?！焙?jiǎn)單來(lái)說(shuō)，大模型給出的是邏輯和結(jié)論，但寫文章和做研究，只有遠(yuǎn)遠(yuǎn)是不夠的，“我們講究每一句發(fā)言是有跡可循，只有被敲打和反復(fù)考證過(guò)的傳播，才有價(jià)值。”

實(shí)際上，曉姐遇到的情況，并不是偶發(fā)。近期，越來(lái)越多的博主在社交平臺(tái)發(fā)出警示，告誡網(wǎng)友“警惕AI幻覺(jué)”，不少博主指出，AI的強(qiáng)邏輯，讓網(wǎng)友產(chǎn)生幻覺(jué)，認(rèn)為“AI完全正確”，但實(shí)際上，不少跡象表明，AI經(jīng)常出現(xiàn)“一本正經(jīng)胡說(shuō)”的現(xiàn)象。

Vectara平臺(tái)最新發(fā)布的數(shù)據(jù)還顯示，目前市場(chǎng)上AI大模型，均有幻覺(jué)率，即便是OpenAI-o3，也有0.8%的幻覺(jué)率；目前市場(chǎng)大熱的DeepSeek-V3，幻覺(jué)率達(dá)到3.9%。而在更早之前，這一幻覺(jué)率甚至高達(dá)30%。

圖：市場(chǎng)主流大模型幻覺(jué)率（截止2025年1月31日）

來(lái)源：網(wǎng)絡(luò)

公開(kāi)的報(bào)道顯示，此前，Vectara公司聯(lián)合創(chuàng)始人阿姆爾·阿瓦達(dá)拉亦表示，在訓(xùn)練過(guò)程中，AI模型會(huì)壓縮數(shù)萬(wàn)億個(gè)單詞間的關(guān)系，隨后通過(guò)龐大的網(wǎng)絡(luò)模型重新展開(kāi)這些信息。盡管這些模型能夠重構(gòu)出接近98%的訓(xùn)練內(nèi)容，但剩下2%內(nèi)容卻會(huì)“誤入歧途”，生成不準(zhǔn)確或虛假信息。

這就意味著，至少在目前，AI依然無(wú)法完全信任。不少業(yè)內(nèi)人士亦對(duì)《聽(tīng)筒Tech（ID：tingtongtech）》表示，在專業(yè)的領(lǐng)域，建議警惕使用AI，“我們可以借助AI來(lái)輔助我們的工作，而不是依賴AI?！?/p>

01 “AI很強(qiáng)大，但我不怎么用”

曉姐是在朋友安利下開(kāi)始使用AI。

十年文字工作者的曉姐，日常資料梳理的工作量非常大。前兩年，大模型剛興起的時(shí)候，曉姐就在朋友的建議下成為最早使用大模型的那一批人。

“快速響應(yīng)，內(nèi)容強(qiáng)大，邏輯也足夠清晰?！边@是曉姐對(duì)大模型的直觀感受。一度，她熱衷使用大模型，每逢寫作都要問(wèn)“?！?。

但很快，曉姐發(fā)現(xiàn)，大模型不能滿足她的寫作需求，甚至讓其創(chuàng)作也不夠“絲滑”。

實(shí)際上，大模型剛推出的時(shí)候，有的資料確實(shí)更新不及時(shí)，會(huì)誤導(dǎo)曉姐的文字創(chuàng)作。再者，曉姐發(fā)現(xiàn)，大模型給出的內(nèi)容通常是結(jié)論和觀點(diǎn)，雖然邏輯性很強(qiáng)，但一旦出現(xiàn)細(xì)節(jié)和事實(shí)錯(cuò)誤，就會(huì)給曉姐的工作帶來(lái)致命的打擊。

“比如，使用大模型的人會(huì)發(fā)現(xiàn)，模型生成內(nèi)容的數(shù)據(jù)和時(shí)間，幾乎不標(biāo)注信息來(lái)源和出處，在寫作過(guò)程中，我還發(fā)現(xiàn)了有名言出處錯(cuò)誤的事實(shí)，所以，我現(xiàn)在對(duì)AI持遲疑態(tài)度?！?/p>

高校任職的林哥也一度無(wú)法完全擁抱AI。

“如今AI已經(jīng)非常強(qiáng)悍了，但我還是在堅(jiān)持手工敲字，這與正確錯(cuò)誤無(wú)關(guān)，完全是個(gè)人愛(ài)好?！?/p>

林哥在批閱學(xué)生的作業(yè)和論文的時(shí)候發(fā)現(xiàn)，“有些學(xué)生的內(nèi)容一看就是AI生成，引用也‘張冠李戴’，甚至出現(xiàn)憑空捏造的‘AI幻覺(jué)’，我改了一部分就堅(jiān)持不下去，AI增加了我的工作量?！?/p>

“這并不是一個(gè)好的引導(dǎo)和風(fēng)向。當(dāng)你越來(lái)越認(rèn)為本就應(yīng)該如此的時(shí)候，那么你就失去了對(duì)文字和內(nèi)容的審美鑒別，也失去了對(duì)事實(shí)的判斷和認(rèn)識(shí)能力?！绷指绫硎尽?/p>

圖：社交平臺(tái)關(guān)于“AI幻覺(jué)”的討論

來(lái)源：小紅書，《聽(tīng)筒Tech》截圖

95后家裝設(shè)計(jì)師小屈告訴《聽(tīng)筒Tech》，盡管自己是網(wǎng)絡(luò)擁護(hù)者，但也很少使用AI繪圖。

其實(shí)，在大模型剛出來(lái)的時(shí)候，小屈是興奮的，“畫圖是非常累的，客戶的需求也非常多，現(xiàn)在的家裝行業(yè)，通常有了初步的設(shè)計(jì)圖紙，客戶才會(huì)繳納意向金。我每天的工作不是跟客戶溝通設(shè)計(jì)需求，就是在畫圖。且畫的圖都不一定會(huì)被客戶采用，所以工作量非常大。”

AI繪圖出現(xiàn)后，小屈抱著試試的心理去AI作圖。不過(guò)，在嘗試了幾次后，小屈放棄了作圖。目前，他只是用AI編輯一些文案。

“主要問(wèn)題在于不夠精準(zhǔn)，每個(gè)空間不能統(tǒng)一設(shè)計(jì)手法?！痹谛∏磥?lái)，AI繪圖只能作為輔助，或者作為早期工作意向確認(rèn)工具。

同樣的問(wèn)題，也發(fā)生在視頻生成領(lǐng)域。

在AI軟件席卷行業(yè)的最早期，影視就被認(rèn)為是被沖擊的巨大行業(yè)。后來(lái)，隨著細(xì)分領(lǐng)域模型的不斷推出和升級(jí)，影視行業(yè)從業(yè)者郭哥十分焦慮。他曾和《聽(tīng)筒Tech》交流，要主動(dòng)學(xué)習(xí)AI技術(shù)，避免在行業(yè)的內(nèi)卷中被淘汰。

但郭哥發(fā)現(xiàn)，以全網(wǎng)都在吹的某平臺(tái)為例，生成的視頻有幾個(gè)明顯的缺點(diǎn)，比如圖人和物體之間存在交互失靈、物理引擎失效、對(duì)象突然冒出等使視頻產(chǎn)生“鬼畜感”。

02 “小心AI一本正經(jīng)胡說(shuō)”

在曉姐和小屈看來(lái)，目前不敢將專業(yè)的工作交給AI來(lái)做，“或許有一天我會(huì)信任它，但不是現(xiàn)在?！?/p>

關(guān)于“我為什么不用AI”，在社交平臺(tái)，網(wǎng)友也眾說(shuō)紛紜。有人表示，“我完全不覺(jué)得AI生成的短片有趣，因?yàn)閯?chuàng)作這個(gè)東西的不知道痛楚為何物”、“有沒(méi)有人感覺(jué)越用AI越蠢，這學(xué)期用AI輔寫，被導(dǎo)師吐槽了幾遍文章寫作水平不行”、“越來(lái)越不會(huì)內(nèi)容輸出了”……

尤其是，“AI幻覺(jué)”一詞最近被提及得越來(lái)越多。

一位博主表示，“小心AI一本正經(jīng)的‘胡說(shuō)’?！睂?shí)際上，AI“強(qiáng)邏輯”幻覺(jué)的背后，存在“一本正經(jīng)胡說(shuō)”的隱患，且不是自己的專業(yè)和領(lǐng)域根本判斷不了。

該博主表示，尤其是AI在回應(yīng)一些嚴(yán)肅知識(shí)性問(wèn)題時(shí)，會(huì)存在憑空編造事實(shí)、杜撰不存在文獻(xiàn)的可怕現(xiàn)狀。

科普作家河森堡表示，自己讓某大模型介紹一下“青銅利簋”，它就開(kāi)始一本正經(jīng)地胡扯，說(shuō)這件青銅器是商王帝乙為祭祀自己父親所鑄，還詳述了其內(nèi)壁的銘文。

不過(guò)，河森堡曾經(jīng)在博物館看見(jiàn)過(guò)“利簋”這件文物，此物是西周貴族為了紀(jì)念武王推翻商朝而鑄，銘文和祭祀也與商王毫無(wú)關(guān)系。

實(shí)際上，河森堡還繼續(xù)追問(wèn)AI，這些資料都是從哪看來(lái)的，AI列出了一大堆文獻(xiàn)，但他發(fā)現(xiàn)，文獻(xiàn)和作者介紹不少是“捏造”的。

另一位博主也呼吁大家“警惕AI幻覺(jué)”、“希望大家使用AI時(shí)，甄別它的謊言”。

該博主表示，“體驗(yàn)了DeepSeek，一開(kāi)始看到它如此強(qiáng)大的推理能力，特別是它在自我思考的時(shí)候展現(xiàn)出來(lái)的完整思維鏈，確實(shí)非常驚艷?！?/p>

但當(dāng)自己在問(wèn)怎樣看待“創(chuàng)新是一種涌現(xiàn)”這個(gè)話題時(shí)發(fā)現(xiàn)，盡管大模型給出了一系列層次和角度的分析，但博主卻總感覺(jué)“有一絲絲的不對(duì)”。

該博主認(rèn)認(rèn)真真地對(duì)內(nèi)容做了核對(duì)，發(fā)現(xiàn)這些看似正確的回答卻有很多問(wèn)題。比如，AI在“編造數(shù)據(jù)謊言”。實(shí)際上，針對(duì)DeepSeek表示的“70%的創(chuàng)新出現(xiàn)在跨學(xué)科領(lǐng)域”，該博主查了很多文獻(xiàn)都沒(méi)有找到這個(gè)信息源頭和實(shí)驗(yàn)數(shù)據(jù)。

該博主指出，“如果這種捏造廣泛流傳，不知有多可怕?！?/p>

甚至，如果AI能虛構(gòu)文本、照片乃至視頻的一切內(nèi)容，并且令其彼此之間相互印證和支撐，其制造幻覺(jué)的強(qiáng)度與編撰故事不可同日而語(yǔ)。

“除非你親自見(jiàn)到并本人求證，或者到現(xiàn)場(chǎng)實(shí)地考察，否則你會(huì)被AI創(chuàng)造出的假象玩得死死的?！币晃粯I(yè)內(nèi)人士這樣擔(dān)憂。

然而，在現(xiàn)實(shí)社會(huì)中，有意愿和有能力親自驗(yàn)證事實(shí)的人并不多。也就是說(shuō)，稍一個(gè)不留神，你可能就會(huì)被AI污染。

03 別焦慮，現(xiàn)在AI還無(wú)法取代你我

實(shí)際上，AI幻覺(jué)已經(jīng)給人們的工作和現(xiàn)實(shí)生活帶來(lái)了巨大影響。

世界經(jīng)濟(jì)論壇發(fā)布的《2025年全球風(fēng)險(xiǎn)報(bào)告》顯示，錯(cuò)誤和虛假信息是2025年全球面臨的五大風(fēng)險(xiǎn)之一。2023年，美國(guó)律師史蒂文·施瓦茨也曾因“輕信”ChatGPT，在法庭文件中引用了并不存在的法律案例。而在醫(yī)學(xué)領(lǐng)域，AI幻覺(jué)提供的錯(cuò)誤診斷和治療建議，可能會(huì)危及患者生命。

從底層技術(shù)來(lái)看，AI幻覺(jué)的產(chǎn)生，是必然的。

AI企業(yè)落地師石云升便告訴《聽(tīng)筒Tech》，“據(jù)我所知，目前AI底層架構(gòu)師無(wú)法解決幻覺(jué)問(wèn)題。因?yàn)樗恳粋€(gè)字符都根據(jù)概率計(jì)算，這就導(dǎo)致它輸出的內(nèi)容會(huì)有幻覺(jué)，這是無(wú)解的?！?/p>

不過(guò)，石云升指出，在真實(shí)場(chǎng)景中，用戶可以通過(guò)反復(fù)溝通來(lái)幫助AI更精準(zhǔn)的回答問(wèn)題。畢竟，AI給出的答案是否采納，最終還是由人來(lái)決定。

“降低AI幻覺(jué)的問(wèn)題可以通過(guò)’預(yù)訓(xùn)練、微調(diào)和推理‘三個(gè)層級(jí)來(lái)解決。”石云升指出，例如，在公司負(fù)責(zé)AI客服時(shí)，用戶主要通過(guò)“提示詞+知識(shí)庫(kù)”來(lái)防止AI輸出幻覺(jué)，“如果公司有懂得微調(diào)的技術(shù)人員，并且擁有優(yōu)質(zhì)的企業(yè)數(shù)據(jù)，微調(diào)的效果會(huì)更加理想?！?/p>

不過(guò)，石云升坦言，微調(diào)通常是針對(duì)企業(yè)專屬的大模型進(jìn)行的，“一般我們會(huì)在通用大模型回復(fù)效果特別不好的情況才會(huì)考慮微調(diào)?！?/p>

比如，在法律領(lǐng)域，通用大模型訓(xùn)練預(yù)料數(shù)量太少，質(zhì)量太差，企業(yè)內(nèi)部有很多更優(yōu)質(zhì)的法律數(shù)據(jù)，這種情況就可以考慮微調(diào)一個(gè)專屬公司的法律大模型，微調(diào)后出現(xiàn)幻覺(jué)的概率就小很多。

石云升指出，還有一種手法是使用“RAG增強(qiáng)檢索”，“在提問(wèn)的時(shí)候，先從知識(shí)庫(kù)里查詢資料，然后給到大模型，如果用戶的問(wèn)題在知識(shí)庫(kù)里有資料，那基本也不會(huì)出現(xiàn)AI幻覺(jué)?！?/p>

當(dāng)然，石云升也表示，對(duì)于普通用戶來(lái)說(shuō)，AI的幻覺(jué)率，目前沒(méi)有特別有效的解決辦法，“普通用戶很難接觸到預(yù)訓(xùn)練和微調(diào)技術(shù)，因此只能在AI推理階段提供更詳細(xì)的信息。這也是為什么在AI剛剛興起時(shí)，行業(yè)內(nèi)很多人開(kāi)始教授如何編寫‘提示詞’并建立自己的知識(shí)庫(kù)?！?/p>

也即是說(shuō)，至少在現(xiàn)階段，AI還無(wú)法真正取代你我。

此前，張雪峰“回應(yīng)DeepSeek會(huì)讓自己失業(yè)”這一話題時(shí)曾這樣解釋，“第一，我們這個(gè)行當(dāng)不止是打破信息差，還是在提供情緒價(jià)值；第二，大模型只會(huì)有一些公開(kāi)信息，但是你要知道有些信息網(wǎng)上是不公開(kāi)的?！?/p>

那些“網(wǎng)上非公開(kāi)的”、“對(duì)情感的理解”，以及“深度思考引發(fā)的創(chuàng)新”，或許是現(xiàn)階段“你我”存在的價(jià)值和意義所在。

“警惕AI幻覺(jué)，這是一種呼吁，也是一種社會(huì)職責(zé)?！憋@然，這不是“曉姐”一個(gè)人所希冀的事。

（文中曉姐、林哥、小屈、郭哥均為化名。）

文?|?小聽(tīng) 編?|?饒言

本文由人人都是產(chǎn)品經(jīng)理作者【聽(tīng)筒Tech】，微信公眾號(hào)：【聽(tīng)筒Tech】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App