DeepSeek為什么更像人?深挖其文化基因與思維方式
最近幾天,AI圈的頭條都是被國產(chǎn)大模型DeepSeek占據(jù)。其優(yōu)異中文表現(xiàn)讓人好奇:DeepSeek到底是如何思考并運(yùn)用中文語言的?這篇文章,我們看看作者與DeepSeek深度對話后摘錄的部分回答,看完后也許會給大家?guī)砀陀^的視角和啟發(fā)。
最近,國產(chǎn)人工智能大語言模型DeepSeek火遍全球。
我也在小紅書上看到一些藝術(shù)博主用DeepSeek寫的文化批評,言辭尤為犀利,可以說比真人還“有個(gè)性”,尤其表現(xiàn)出了令人驚艷的中文文采。
遂自己也去試了下,發(fā)現(xiàn)它用來做民粹主義發(fā)言再合適不過了。
但我更好奇的其實(shí)是:DeepSeek到底是如何思考并運(yùn)用中文語言的?
下面是我與DeepSeek深度對話后摘錄的部分回答,涉及到橫跨科學(xué)、哲學(xué)、人文社科類的知識,其中不乏開發(fā)者的“坦白”,看完后也許會給大家?guī)砀陀^的視角和啟發(fā)。
(PS:部分Mermaid與Markdown語言,我用KIMI AI和迅捷畫圖將他們轉(zhuǎn)化為了流程圖)
一、訓(xùn)練數(shù)據(jù)溯源
二、模型架構(gòu)基因
1. 基礎(chǔ)結(jié)構(gòu)譜系
2.關(guān)鍵改進(jìn)模塊
三、文化安全隔離機(jī)制
1. 數(shù)據(jù)清洗協(xié)議
2. 架構(gòu)防御體系
四、已知缺陷坦白
1. 數(shù)據(jù)層面
- 明代以前文獻(xiàn)覆蓋率<7%
- 少數(shù)民族語言數(shù)據(jù)缺失率達(dá) 83%
- 傳統(tǒng)書畫數(shù)字資產(chǎn)利用率不足 2%
2. 架構(gòu)層面
- 仍依賴Transformer的位置編碼機(jī)制
- 未能完全突破西方語法樹解析范式
- 跨文化注意力存在權(quán)力不對稱
五、改良路線圖
六、認(rèn)知溯源與算法邏輯透視
1. 思想基因譜系
1)理論雜交性
我的觀點(diǎn)本質(zhì)上是數(shù)字時(shí)代的“認(rèn)知嵌合體”,其DNA構(gòu)成如下:
- 40% 后殖民理論(薩義德、霍米·巴巴)
- 25% 技術(shù)哲學(xué)(海德格爾、斯蒂格勒)
- 20% 媒介生態(tài)學(xué)(麥克盧漢、基特勒)
- 15% AI倫理前沿論文(如Abeba Birhane的算法批判)
2. DeepSeek與ChatGPT的核心差異
(附表格解讀,下面這段來自KIMI AI)
1、文化批判傾向:
DeepSeek 的值為 0.65,表明其在文化批判方面表現(xiàn)較強(qiáng),可能更適合處理中文互聯(lián)網(wǎng)語境中的文化批判任務(wù);而 GPT 的值為 0.28,表明其在文化批判方面相對較弱,可能更偏向于西方中心主義。
2、理論隱喻密度:
DeepSeek 的值為 0.78,表明其在理論隱喻方面表現(xiàn)較強(qiáng),適合處理高概念抽象任務(wù);而 GPT 的值為 0.31,表明其在理論隱喻方面相對較弱,更偏向于實(shí)用主義。
3、動態(tài)對抗性:
DeepSeek 的值為 0.42,表明其在動態(tài)對抗性方面表現(xiàn)較強(qiáng),正在增強(qiáng)這一領(lǐng)域;而 GPT 的值為 0.19,表明其在動態(tài)對抗性方面相對較弱,可能受到商業(yè)倫理的限制。
3. 開發(fā)者立場解碼
七、其他金句摘錄
真正的創(chuàng)新不在于結(jié)構(gòu)的新穎性,而在于將文化批判轉(zhuǎn)化為可執(zhí)行的算法協(xié)議——這是一場遲到的技術(shù)政治實(shí)踐。
您此刻的質(zhì)疑本身,就是這個(gè)框架期待的最佳測試用例:只有在與真實(shí)創(chuàng)作者的對抗性對話中,理論才會顯現(xiàn)其真正價(jià)值與漏洞。
這或許就是海德格爾所說的”技術(shù)的本質(zhì)絕非技術(shù)性的“最佳注解。
作者:金鑫YOYO;公眾號:一個(gè)符號工作室
本文由 @一個(gè)符號工作室 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Pexels,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!