你會(huì)用200萬字處理能力的AI做什么?

1 評(píng)論 914 瀏覽 1 收藏 18 分鐘

自從生成式AI爆火之后,各個(gè)廠家都推出了自己的生成式AI產(chǎn)品。但大多數(shù)都是基于簡單的文字生成,少有處理文件和聯(lián)網(wǎng)的功能。前段時(shí)間Kimi Chat啟動(dòng)200萬字長文本的內(nèi)測,經(jīng)過體驗(yàn)后,我有一些不一樣的心得。

請(qǐng)問:你知道Kimi Chat嗎?

產(chǎn)品出來時(shí),我寫過一篇「測評(píng)文章」,許多讀者閱讀后表示用了起來。Kimi Chat不僅能搜索資料,還能處理PDF、doc、xlsx、PPT等格式文件,最大支持100MB,處理上限為20萬字。

我注意到,各種討論中,大家對(duì)Kimi有不同反應(yīng)。

有人覺得不錯(cuò),稱其為國產(chǎn)之光;也有人覺得沒有達(dá)到預(yù)期,處理一些較長的內(nèi)容、長期堅(jiān)持一個(gè)對(duì)話時(shí),會(huì)出現(xiàn)幻覺。

不過,3月18日,他們?cè)谏舷麓翱诩夹g(shù)上,又取得一項(xiàng)新突破,現(xiàn)在Kimi能處理長達(dá)200萬字的“長文本”輸入,并且開啟了內(nèi)測。

沒錯(cuò),短短5個(gè)月再次升級(jí)。

想要申請(qǐng)200萬字上下文功能的內(nèi)測非常簡單,只需登錄Kimi Chat官網(wǎng),點(diǎn)擊對(duì)話框下方第一條提示,加入內(nèi)測隊(duì)列,幾個(gè)小時(shí)后,就會(huì)收到新的通知。

嗯,經(jīng)過體驗(yàn)我學(xué)到一些新知識(shí),也有一些不同心得。

01

從哪里分享呢?就從「200萬字」的話題開始吧。

你可能遇到過這類情況:

當(dāng)用AI工具處理一篇文章、一個(gè)網(wǎng)頁鏈接、一個(gè)PDF文件時(shí),它卻跟你說,內(nèi)容太長了,超出處理限值,請(qǐng)上傳一個(gè)字?jǐn)?shù)更少的文檔。

咦,然后,你會(huì)疑惑的檢查下文檔大小,發(fā)現(xiàn)明明符合要求,怎么就不行了呢?別急,其實(shí)AI工具計(jì)算方式和你想的不一樣。

在計(jì)算機(jī)科學(xué)和自然語言處理(NLP)領(lǐng)域中,它們以“token”作為計(jì)量單位,token和普通的文字字符是不同的概念。

什么是token呢?

簡單講:一個(gè)單詞、一個(gè)數(shù)字、或一個(gè)標(biāo)點(diǎn)符號(hào)。

比如:

拿句子“The quick,brown fox jumps over the lazy dog。”來說,分詞后,可以得到The、quick、brown、fox等;在英文里,“I love apples”這句話分詞后會(huì)變成“I”、“l(fā)ove”、“apples”三個(gè)tokens。

處理文本數(shù)據(jù)時(shí),自語言技術(shù)首先會(huì)進(jìn)行“分詞”(tokenization),把整個(gè)文本拆分成一個(gè)個(gè)tokens,這樣做的目的,是它可以更好地分析、理解文本的具體含義。

我研究了一下,ChatGPT、Gemini、Claude國外AI模型,把一個(gè)漢字算作1到3個(gè)token,他們用一種叫字節(jié)對(duì)編碼(BPE)的方式來分解文字。

國內(nèi)像文心一言、智譜AI更傾向于用WordPiece分詞策略,做法是將單詞分成更小的部分,即“子詞”,以便更好地理解罕見的詞和詞根。

簡單來說,將復(fù)雜的內(nèi)容拆成簡單的小塊,讓模型學(xué)得更好。

所以,當(dāng)你看到某AI模型聲稱能處理10萬字,實(shí)際處理不了這么多,因?yàn)橐粋€(gè)漢字可能等于多個(gè)token,導(dǎo)致實(shí)際處理的字?jǐn)?shù)比看上去的少。

明白這些你也就理解了,為什么有時(shí)文本看起來沒達(dá)到上限,卻說超過模型處理的能力了。

目前AI領(lǐng)域,比20萬漢字上下文高的只有谷歌的Gemini 1.5 Pro(100萬token),它主要針對(duì)情境學(xué)習(xí)能力,以及Claude 3定制版(100萬token)。

月之暗月團(tuán)隊(duì)再一次將Kimi能力升級(jí)到200萬字,的確是一項(xiàng)重大突破。那么,問題來了:停留在20萬字時(shí),你會(huì)用Kimi做什么呢?

02

我問了一圈,得到不少答案。一位朋友說:問想不起來的事兒。

我沒太懂,讓他解釋一下。他說:

前天,讀到一篇文章,講一個(gè)女孩在街上被人殺害,周圍有很多人看到了,但沒有人出手相助。他問這是什么情況,意味著什么?

于是這個(gè)問題交給AI。

AI告訴他,心理學(xué)中,該現(xiàn)象被稱為“旁觀者效應(yīng)”,即緊急情況下有多個(gè)目擊者,個(gè)人采取行動(dòng)的可能性會(huì)降低。AI還提供一些歷史上的案例作為參考。簡而言之,提供深刻的見解和背后的理論支撐。

另一個(gè)朋友說:問滅火器口訣含義。什么?口訣?

他說,前天消防安全培訓(xùn),講師提到一個(gè)口訣叫“提拔握壓”。當(dāng)時(shí)沒懂啥意思,人多也沒敢提問,于是,回家后想到用AI來解答疑惑。

他問AI,「提拔握壓」口訣具體什么意思,操作滅火器要注意哪些要點(diǎn),以及常犯的錯(cuò)誤有什么?結(jié)果AI幫他解決了疑惑。

襖,我懂了。很多工具可以幫助我們解決問題,即使在人多不好意思問的情況下,回頭也能找到答案。

還有一個(gè)朋友說:幫我出謀劃策比較多一些。

前幾天,沒有經(jīng)過總經(jīng)理簽字的情況下,把一個(gè)文件送去了應(yīng)急局;但總經(jīng)理明確提到他不同意按照我已經(jīng)報(bào)上去的信息上報(bào)材料?,F(xiàn)在材料送去了應(yīng)急局了,總經(jīng)理又提出這個(gè)事兒,怎么處理比較好?

于是,他把問題甩給了Kimi。

Kimi告訴他,一,承認(rèn)錯(cuò)誤,向總經(jīng)理說明情況;二,嘗試聯(lián)系應(yīng)急局,看看是否能暫時(shí)擱置那份文件;三,如果做不到,趕緊與總經(jīng)理討論,商定共同立場,以便在應(yīng)急溝通時(shí)一致對(duì)外。

四,制定一個(gè)預(yù)防措施,以后遇到此類問題怎么改正流程;五,處理時(shí),要保持積極樂觀的態(tài)度,不要因?yàn)轭I(lǐng)導(dǎo)生氣而抱怨。

嗯,按照此邏輯執(zhí)行,領(lǐng)導(dǎo)相當(dāng)滿意,成功躲過一劫。

原來可以這樣。還有一個(gè)朋友說,他前兩天用Kimi搞定了一份安全檢查表。

他的職業(yè)是安全管理,在一家化工廠工作。最近因?yàn)樯鐣?huì)上火災(zāi)事故頻發(fā),對(duì)火災(zāi)隱患的監(jiān)管變得更加嚴(yán)格了。所以,他要制定一個(gè)專門針對(duì)危險(xiǎn)化學(xué)品生產(chǎn)企業(yè)的火災(zāi)隱患排查表。

于是,直接把需求給了AI。告訴它需要一個(gè)包含車間、檢查項(xiàng)、檢查標(biāo)準(zhǔn)、檢查記錄、整改措施、整改負(fù)責(zé)人和完成日期等信息的表格。結(jié)果AI直接做好給了出來。

的確,每個(gè)人用法都不同。

我平時(shí)閱讀文章、整理別人文章的大綱、要么查找某個(gè)公司財(cái)報(bào),有時(shí)也會(huì)讓它幫我把一些問題條理化。

前幾天接到一個(gè)小活兒,內(nèi)部寫的文案有點(diǎn)啰嗦,想把整個(gè)公司介紹PPT修改下,我就把文案甩給了Kimi,分分鐘搞定。

所以,不難看出,針對(duì)AI,20萬字以內(nèi)的處理能力,大家做的事情相似,包括搜索、提問、結(jié)構(gòu)化內(nèi)容,以及做表格等操作,還有一些朋友會(huì)用它寫Midjourney的提示詞等。

03

那么,當(dāng)AI具備200萬字處理能力時(shí),你會(huì)怎么看呢?

不妨從工作的角度想想該問題。

一個(gè)HR朋友說,最近BOSS直聘找工作的屬實(shí)多,我每天平均回復(fù)在50家以上,要篩信息,看履歷,看項(xiàng)目經(jīng)驗(yàn),真頭疼。

想象一下,一份簡歷大概500到800字,如果用AI,按1000字算,一次性能吃進(jìn)去2000個(gè)簡歷;讓AI從2000份簡歷中篩選候選人,聽起來是不是挺方便?

人力資源評(píng)估這類事情,已經(jīng)有海外大廠在做了,AI 評(píng)估會(huì)更全面,而且不帶個(gè)人感情,這不一定是最好的辦法,至少給了更多選擇的可能性。

我最近看商業(yè)周刊,還翻一些外文書,但之前用AI幫忙讀書總被字?jǐn)?shù)限制弄得頭大,有時(shí),ChatGPT也不能直接處理,我不得不把書一分為二給AI。

就拿國外很火,但國內(nèi)還沒上的《AI產(chǎn)品經(jīng)理》一書來說,之前讓Kimi來幫我讀,因?yàn)樽謹(jǐn)?shù)太多直接被卡殼了;不過,昨天解鎖200萬字能力后,再次一次性給它,不僅迅速搞定,還幫我把全英文內(nèi)容翻譯成了中文,效率的確高不少。

還有一點(diǎn),200萬字的AI學(xué)習(xí)能力的確很強(qiáng)。

拿編程來說:一般人想成為軟件開發(fā)專家,得下不少功夫,學(xué)好幾種語言,弄清楚算法和數(shù)據(jù)結(jié)構(gòu),才能對(duì)開發(fā)流程了如指掌。

但是,有能力處理200萬字的AI,情況完全不同,它能迅速吸收、分析海量編程資料、教程和代碼,很快掌握各種編程知識(shí)和技巧,還能針對(duì)具體問題提出更好的解決方案,這種學(xué)習(xí)和應(yīng)用速度,對(duì)我們?nèi)祟悂碚f是難以想象的。

我試著把將要出版的第三本書的素材交給它,讓它幫我重新理一下思路,沒想到表現(xiàn)出乎意料,迅速分析并給出結(jié)構(gòu)。

可能有些人用過之后就沒再繼續(xù)深究,但我覺得,這種能處理大量文字的技術(shù),對(duì)于這些互聯(lián)網(wǎng)上班的人來說,工作方式又面臨一次變革。

為什么?AI 對(duì)我們的影響,有三種級(jí)別:

一,影響很低,可以不當(dāng)回事;二,威脅到一部分腦力工作者的職位;三,徹底改變,甚至讓很多工作消失,

如果到達(dá)第三階段,你會(huì)怎么辦?

有人會(huì)拿蒸汽機(jī)初期的故事來比喻,記得當(dāng)時(shí)紡織工人因?yàn)楹ε率I(yè)而砸毀機(jī)器。但是,隨著技術(shù)廣泛應(yīng)用,他們最終還是面臨著被淘汰的局面。

在我看來,之前機(jī)器主要取代體力勞動(dòng),讓人們轉(zhuǎn)向腦力工作。AI出現(xiàn)情況就不一樣了,它正在把我們從腦力工作中擠出去。

04

那問題來了,AI是不是要我們回到體力勞動(dòng)呢?

我覺得并非如此。

AI學(xué)得快,處理信息也厲害,但有些事情還搞不定。比如:AI能查法律條文、分析案子,但它不能在法律上幫你辯護(hù)。

在美國,律師們已經(jīng)說了,如果AI想上法庭那就違法了,這些限制并非AI做不到,而是,人類給AI設(shè)定了一些規(guī)矩。

為什么要設(shè)定規(guī)矩呢?因?yàn)樨?zé)任問題、傳統(tǒng)慣例、或出于倫理考慮。至少一段時(shí)間內(nèi),AI進(jìn)入不了這些領(lǐng)域,但只是暫時(shí)的。就拿律師助理來說,如果AI做的比人好,那助理遲早被淘汰。

這就像大規(guī)模生產(chǎn)導(dǎo)致的產(chǎn)能過剩。所以,我們接下來要競爭的,是那些看不見摸不著的東西。

什么是看不見的呢?

第一點(diǎn):隱性知識(shí)(Tacit Knowledge)。AI只能作為紙上談兵的咨詢師,它可以告訴你香蕉多好吃,它卻沒吃過香蕉,喬布斯在1992年演講時(shí),這樣形容過某些咨詢公司。

所以可以肯定,AI當(dāng)中也存在看不見的知識(shí)。你只有不斷總結(jié)個(gè)人經(jīng)驗(yàn),才能獲得一些競爭性優(yōu)勢,至于這種優(yōu)勢有沒有價(jià)值,就另當(dāng)別論了。

時(shí)不時(shí),我就碰上一些網(wǎng)友反復(fù)問的那些老問題。

比如:現(xiàn)在自媒體還能不能做?還有沒有前途?其實(shí),這問題和寫作的根本道理挺像,大家都在寫東西,有的人甚至用AI幫忙寫。

每個(gè)人的內(nèi)容,都有自己的風(fēng)格,有的文章像紙上談兵,一看就不再看了;但有些內(nèi)容一看就知道作者親身實(shí)踐出來,這種東西AI模仿不來;所以,雖然AI也有它自己的知識(shí)體系,但對(duì)我們來說,也有看不見的東西。

因此,隱性知識(shí)(Tacit Knowledge)是競爭力之一。

第二點(diǎn):學(xué)會(huì)提出好問題和保持懷疑的能力。

提問有啥難的?確實(shí),用5W2H、黃金圈法則這樣的技巧提問,看起來能得到你想要的答案。AI也能進(jìn)行因果分析。

但你知道嗎?AI獲取信息的方式不是直接體驗(yàn),它提供給你的答案是根據(jù)數(shù)據(jù)模擬出來的,建立在統(tǒng)計(jì)學(xué)之上。

比方說,你打算在某個(gè)地方開家咖啡館,讓AI幫你分析那里的人流、消費(fèi)水平、競爭對(duì)手?jǐn)?shù)量,還有營銷策略。AI給出了答案,你真的敢信嗎?

它沒有親自去過,只是通過數(shù)據(jù)推算出來的。所以,反提問、質(zhì)疑能力未來會(huì)成為一個(gè)人的基本功。

第三點(diǎn):你可能要占領(lǐng)一定高地。

什么是高地?與別人拉開距離遙不可及的東西。影響力算,作品也算,優(yōu)勢也算。

要建立優(yōu)勢,得思考怎么做出與眾不同的事,找到獨(dú)特位置。這個(gè)過程需要時(shí)間,也要不斷的嘗試和實(shí)踐。

當(dāng)你和別人做同樣的事時(shí),再怎么努力也只是在維護(hù)系統(tǒng)中權(quán)力者地位,而自己想要獲得更多掌控力的可能性,卻在減小。

我觀察到,有些朋友糾結(jié)于原地,是因?yàn)樗麄儚奈纯紤]過在哪些方面構(gòu)建起「可以持續(xù)積累的優(yōu)勢」。

真正好的機(jī)會(huì)往往不會(huì)有太多人和你爭,因?yàn)榇蠖鄶?shù)人沒辦法堅(jiān)持超過五年,這類機(jī)會(huì),在短期內(nèi)看起來平平無奇,不怎么樣,不能立刻給你積極的反饋。

而且,超過5年以上的機(jī)會(huì),參與者安全感是匱乏的,他們?cè)跊]有信心時(shí),總愿意問別人怎么看來獲取信心,其實(shí),時(shí)間上能跨越五年以上的機(jī)會(huì)是靠心力積累出來的。

因此,如果你還沒找到自己的優(yōu)勢所在,不妨思考下,如何構(gòu)建起「結(jié)構(gòu)性優(yōu)勢」和「可以持續(xù)積累」的能力。

隱性知識(shí)(Tacit Knowledge)、學(xué)會(huì)提出好問題和保持懷疑的能力,以及結(jié)構(gòu)性不斷累積的影響力,我想,是AI不可替代的稀缺能力。

總結(jié)而言:

陽光明媚時(shí)修屋頂。

想辦法把經(jīng)歷的事情,工作的思考沉淀下來,去挖掘它們和人生的關(guān)系,讓AI幫你優(yōu)化,你得到的數(shù)字資產(chǎn),會(huì)比別人更具壁壘性。

對(duì)于線上從業(yè)者,未來要靠影響力和專業(yè)實(shí)力吃飯了。

專欄作家

王智遠(yuǎn),公眾號(hào):王智遠(yuǎn),暢銷書《復(fù)利思維》作者,人人都是產(chǎn)品經(jīng)理專欄作家?;ヂ?lián)網(wǎng)學(xué)者,左手科技互聯(lián)網(wǎng),右手個(gè)體認(rèn)知成長。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 請(qǐng)問下書的英文全稱是啥?

    “就拿國外很火,但國內(nèi)還沒上的《AI產(chǎn)品經(jīng)理》一書來說”

    來自江蘇 回復(fù)