十問AI搜索
在人工智能的浪潮中,AI搜索技術(shù)正迅速發(fā)展,成為信息檢索領(lǐng)域的新熱點。本文探討了AI搜索的多個關(guān)鍵問題,包括數(shù)據(jù)壁壘、索引庫的重要性、垂直搜索的機(jī)遇與挑戰(zhàn),以及用戶習(xí)慣對AI搜索的影響等。文章還對模型微調(diào)的必要性、AI搜索與Agent結(jié)合的趨勢、AI搜索生成內(nèi)容的潛力,以及AI SEO的未來進(jìn)行了深入分析。
一、AI搜索最大的壁壘在數(shù)據(jù)?
閉門會有一個小伙伴在某大廠做搜索,給出的洞察是:
沒有數(shù)據(jù)的話都是白扯!
后面在和胡寧交流的時候,她也明確指出了這一點。
否則外殼做得再好、交互做的再好,用戶一問,出來的內(nèi)容渣渣!
這也是內(nèi)容型產(chǎn)品做自己AI搜索的巨大優(yōu)勢:微信讀書的AI問書、知乎&抖音&小紅書等產(chǎn)品的AI搜索、騰訊元寶整合了公眾號的數(shù)據(jù)。
我最近使用了小紅書的達(dá)芬奇AI搜索,效果出奇的驚人:
為什么呢?小紅書在旅游、美食、美妝、寵物、健身等等品類上,有全網(wǎng)最優(yōu)質(zhì)的內(nèi)容,只要在它優(yōu)質(zhì)內(nèi)容的垂域里搜索,自然也最容易得到優(yōu)質(zhì)的答案!
當(dāng)然這也帶來了國內(nèi)過去這么多年百度逐漸沒落的老問題:數(shù)據(jù)被分散在各個App內(nèi)。
二、索引庫必備么?
結(jié)論:做通用AI搜索不必,但垂直搜索必備!
很多AI搜索依賴Google或者Bing的API來獲得檢索結(jié)果,為何呢?
這是因為Google和Bing自建了非常強(qiáng)大的搜索引擎,其中包含了強(qiáng)大的索引庫,可以較好的保證搜索結(jié)果的質(zhì)量,以及提供了不錯的排序。
此時依靠這些傳統(tǒng)搜索引擎,已經(jīng)能解決95%的問題了!
(以上是公眾號 艾逗筆 在《我做了一個AI搜索引擎》一文內(nèi)的流程圖,在信息源檢索下面我加了兩個小方框)
從上圖來看,自檢索引庫的關(guān)鍵在于要能提供比Google和Bing返回的結(jié)果更優(yōu)的內(nèi)容!想要做到,那就需要付出極大的成本和時間。
所以上面的結(jié)論就是如果你要做通用AI搜索,就別考慮自建索引庫了,不管是資源的消耗還是時間的投入,都極其困難??康谌教峁┑腁PI快速的把商業(yè)模式跑通,可能才是王道。
當(dāng)然這是大多數(shù)人不看好創(chuàng)業(yè)公司做通用AI搜索的一個主要原因。
那垂直搜索呢?這里進(jìn)行到第二點:優(yōu)質(zhì)索引庫!
索引庫分很多種,剛才說的是一個最大的索引庫,要在里面去撈到合適的內(nèi)容,其實效率還是比較低的??梢栽谶@個大庫上面再整一個優(yōu)質(zhì)索引庫,里面存著更優(yōu)質(zhì)、更權(quán)威的內(nèi)容,這樣的優(yōu)質(zhì)索引庫對于垂直AI搜索就會很有幫助。
因為前面第一章節(jié)也說了,AI搜索最大的關(guān)鍵點是數(shù)據(jù)!你知道這個垂直品類的優(yōu)質(zhì)內(nèi)容和信息或者數(shù)據(jù)在哪里的話,是不是就能讓AI搜索的結(jié)果質(zhì)量更高了?
這是為何Perplexity在一開始從Academic啟動,也是錨定垂類也方便去提前構(gòu)建垂直索引庫,保證初始的AI搜索效果非常優(yōu)質(zhì)。
打個比喻來幫助大家理解索引庫是否必備:
我們設(shè)想一個各種菜系都提供的餐館,思考一下,你增加了一個菜品的供貨渠道,能讓餐館有更多客人嗎?這個就離得有點遠(yuǎn)了。
但如果你只做大阪和牛,找到了一個精品貨源,對于用戶的口碑可能就會有很大的幫助。
三、垂類更方便于AI搜索初創(chuàng)公司切入?
結(jié)合前兩點,我們可以發(fā)現(xiàn),不管是數(shù)據(jù),還是索引庫,給到創(chuàng)業(yè)者的選擇都是先從垂直切入會是更好的一種方式。
toC層面有兩點:有利于用戶口碑和心智的建立;垂類更好整合進(jìn)用戶的工作流。
秘塔之所以被口口相傳,也是科技工作者,或者學(xué)生,查詢資料時,可以快速獲得海量的結(jié)構(gòu)化信息,相信秘塔本身索引庫也會在這些用戶群體關(guān)注的內(nèi)容品類上做更多覆蓋,提高AI生成的內(nèi)容質(zhì)量。
前陣子秘塔又上線了播客搜索,這也是秘塔的用戶群體喜聞樂見的:
Repotify則更加具體,聚焦在財報研報等投融資用戶的需求方向上:
有時我自己查詢一些企業(yè)的財報、電話會信息,也會打開使用。
再比如Devv,可以指定信息源,連接到指定的Github倉庫來進(jìn)行搜索:
這種深入就是心智的建立:知道這款A(yù)I搜索產(chǎn)品能解決自己的問題!
對應(yīng)的,垂直AI搜索也知道很多信息源在哪里,包括還有一些獨(dú)到的用戶需求能夠更好地滿足。
四、用戶習(xí)慣的慣性對于AI搜索的意義?
結(jié)論:非常重要!
上圖是夸克瀏覽器最近全面更新的AI搜索。
如果你是夸克的用戶,會不會天然的就體驗到了AI搜索呢?
我們設(shè)想一下,即使是過去百度最鼎盛的時期,依然有大量的用戶不會去用它,為什么?還有其他的產(chǎn)品會占據(jù)用戶的習(xí)慣呀,比如說搜狗和360的三級火箭里面,就會用瀏覽器來滿足用戶的搜索需求,你百度做的比Google更好也不可能搶走那批用戶。
通用AI搜索很難做的一點是,用戶習(xí)慣很難遷移,他用慣了夸克瀏覽器,就會繼續(xù)用夸克的AI搜索,并且各家大廠包括Google都已經(jīng)很堅決的推進(jìn)AI搜索的情況下,你很難做的遠(yuǎn)超出Google去讓用戶轉(zhuǎn)過來用你的,或者說,在Google全量上AI搜索之前,只會留出很短的時間窗口。
五、模型微調(diào)是必備的么?
結(jié)論:當(dāng)前階段非常有價值!
搜索是一個用戶需求很泛化的場景,用戶會問各種各樣的問題,比如說:
黃河有多長?這種問題簡短回答就行了
怎么哄小孩睡覺?這種問題可能需要給你個手把手的教程
所以搜索依賴的大模型能力需要在不同分支下,具備不同的回答能力。
360AI搜索已經(jīng)把query的意圖識別分類做到了4000多種,每一種需求配對應(yīng)的Prompt。工作做得已經(jīng)相當(dāng)精細(xì)了,但梁志輝告訴我,這仍然只是很粗顆粒度的匹配。
你會好奇的是,為何360要做這么多Prompt工程,似乎也沒說到微調(diào)的事情呀。
是的,這就是不同的解決方案。
Prompt也好,微調(diào)也罷,是對模型做不同力度的勸導(dǎo)!
目前階段大模型對于指令的跟隨效果不是特別優(yōu)秀,所以當(dāng)前階段下,微調(diào)非常有價值。
六、AI搜索+Agent會逐漸盛行?
結(jié)論:大模型提供信息,Agent提供服務(wù)
未來大概率會演變成AI搜索是平臺,上面的Agent是一個個的服務(wù)。
目前的Agent更多是用Prompt調(diào)教的,對于垂直的能力深度還是非常有限的,如果未來能做到AI搜索和AI Agent之間的緊密配合,就很厲害了。
換個思路,思考下微信平臺里的小程序。微信提供基礎(chǔ)的服務(wù)/信息,小程序提供各種垂直的服務(wù)。
Agent進(jìn)階的一種形態(tài)是:Multi-Agent
Miku AI搜索就很典型是一個基于Agent框架開發(fā)的AI搜索,吳恩達(dá)在AI Ascent 2024大會上指出:“基于GPT-3.5構(gòu)建的AI智能體工作流在實際應(yīng)用中表現(xiàn)比GPT-4更好”
除此之外,ThinkAny的創(chuàng)始人idoubi也考慮后續(xù)增加工作流Workflow,就是Multi-Agents,你可以認(rèn)為前端是AI搜索,去檢索信息,然后進(jìn)入到用戶自定義的Multi-Agnets里,最后經(jīng)過智能體們的處理,獲得用戶自己想要的信息:
或者說,AI搜索+Coze。
七、AI搜索生成內(nèi)容,AI小紅書會來么?
結(jié)論:是一個明確的趨勢
我們在《拳打Google,腳踢Perplexity,Genspark要做美女給你打好飯還喂進(jìn)嘴!的新物種》一文里,也提到了Sparkpage這套邏輯:
AI可以先生成一次結(jié)果,用戶再在此基礎(chǔ)上進(jìn)行修改,相當(dāng)于AI+人共同生成一個網(wǎng)頁。
包括Perplexity也做了一樣的Page能力。
從某種角度來說,這種邏輯是直接和人類創(chuàng)作者PK,是AI搜索+人去PK人類創(chuàng)作者。
參考即刻@余一 的普通人的AI使用說明書,相當(dāng)于中間那一層。
其實AI搜索走到這一步非常自然,就像我們理解各大廠和各大模型廠的效率工具都會加入搜索能力一樣,只要理解搜索是為了后續(xù)效率工具獲取信息,就可以很絲滑的get到這一點。
也就容易理解小紅書很擔(dān)心類似的產(chǎn)品:未來如果是AI+人也能生成高質(zhì)量的內(nèi)容,并且形成自己的社區(qū)生態(tài),那必然和小紅書是帶來競爭關(guān)系。
八、AI SEO會逐漸形成共識?
上面這一點,其實衍生出一個結(jié)論:AI SEO馬上就會成為共識
新的產(chǎn)品如何獲得流量,已經(jīng)開始逐步變成大家關(guān)注的話題了,那AI搜索也同樣會面臨這個困境,我們在Genspark一文里,提到了Genspark通過Agent生成Sparkpage的內(nèi)容質(zhì)量“很高”,這樣的內(nèi)容可以被Google收錄,從而獲得源源不斷的流量:
類似的流量獲取機(jī)制,Perplexity已經(jīng)深深受益了:
同樣的,360AI搜索也通過每天晚上定時跑任務(wù),并且通過更高優(yōu)先級的方式插入到360搜索的索引內(nèi),用AI生成網(wǎng)頁的方式,既滿足了用戶的長尾Query,又給AI搜索本身帶去了流量。
AI搜索本身就是非常好的內(nèi)容生成框架,結(jié)合AI SEO從傳統(tǒng)搜索引擎吸取流量,也是前期快速成長的好方式。
九、有人說Sparkpage的內(nèi)容質(zhì)量一般,重要么?
結(jié)論:可能并不重要
沿著上面的思路,我們可以嘗試去思考一個點:
不是所有問題都要直達(dá)終點
答案可以是一個過程,是一個中間態(tài),這依然有很大的價值。
直白點說,Sparkpage能給到你一些啟發(fā),幫助你去優(yōu)化自己的攻略/購買決策,已經(jīng)很有效了。如果未來更多用戶基于它去生成高質(zhì)量的人+AI共創(chuàng)的內(nèi)容,那真的就是AI小紅書。
換個角度:傳統(tǒng)搜索里,Top10%的Query占據(jù)了95%以上的流量。這意味著AI搜索有一定的可能性把用戶最關(guān)注的答案優(yōu)先生成好!
十、AI搜索是一種退化?
結(jié)論:搜索從10個鏈接到1個答案是進(jìn)化,但從視頻到文字是退化
這是閉門會的一位小伙伴說的,傳統(tǒng)搜索是菜市場,AI搜索是送外賣,但是,從視頻到文字是退化!
相信你也會思考,為何AI搜索大部分都是文字結(jié)果的呢?
我們來看看一些可能性:
這里面廣義的AI搜索可以包含,并且可以實現(xiàn)的擴(kuò)展能力有:
輸入變得更加豐富和自由:
Query多模態(tài):從只能文字+語音轉(zhuǎn)文字輸入,到Circle to Search、智能鏡頭,圖片、視頻輸入等等
360AI搜索App已經(jīng)上線了AI圖片識別搜索能力:
Google的Take a video,微軟的Copilot陪你一起玩,在技術(shù)層面已經(jīng)開始進(jìn)入到了視頻交互層面了,這是非常大的一個跨越。不難想象的是,一旦這類能力進(jìn)一步整合到隨身的硬件上,會有多么大的體驗提升。
輸出也會更多元:
1.信息整合:AI OverView(鏈接、圖片、POI、郵件、文檔等),典型的可見產(chǎn)品為Genspark的Sparkpage;Perplexity和Tako信息卡片合作,使得輸出內(nèi)容可以支持圖標(biāo),還有秘塔AI搜索可以直接把生成的結(jié)果信息生成PPT;
(秘塔AI搜索實現(xiàn):Search Query to PPT)
2.服務(wù)整合:Planning、Agent、Prompt-pic-Shopping等等
兩者的邊界同時在擴(kuò)充,并且都可以更深度的理解用戶的意圖,這會讓AI搜索可滿足的用戶需求,從過去僅僅提供信息/內(nèi)容整理,擴(kuò)充到工作生活學(xué)習(xí)的方方面面。
最近的一步,AI搜索更應(yīng)該是把答案組織成用戶更喜歡的載體,這可能是圖文混排,或者包含視頻,這涉及到的是信息的組織,Genspark的Sparkpage就非常典型,我們之前畫過結(jié)構(gòu)圖:
所以,目前看只能生成文字的AI搜索,在局部確實是退化的。
十一、總結(jié)
這篇文章,是一個階段性的思考,期間有大量的使用AI搜索完成日常信息的搜集,有大量和行業(yè)從業(yè)者的溝通交流,這里感謝參與其中的各位。
這里感謝愿意署名的共創(chuàng)者:
AI產(chǎn)品經(jīng)理 小邵,即刻 “小邵嘚啵嘚”
Miku AI創(chuàng)始人 Franco,微信:aigeek2024
ThinkAny 創(chuàng)始人 idoubi,即刻: 艾逗筆
參考:
我做了一個 AI 搜索引擎 from 艾逗筆
《普通人的AI使用說明書》 from 即刻@余一
https://gamma.app/docs/AI-Dev-9y7n4vslcp2bol2?mode=doc
本文由人人都是產(chǎn)品經(jīng)理作者【Super黃】,微信公眾號:【AI產(chǎn)品黃叔】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!