“ChatGPT的最強競品”爆火,就這?

0 評論 6067 瀏覽 5 收藏 12 分鐘

在ChatGPT出現(xiàn)之后,國內外有關大模型應用開發(fā)的消息頻頻傳出,而現(xiàn)在,一款名為Claude的產品也被架上了臺面,甚至被部分網友稱作“ChatGPT的最強競品”。那么,Claude的表現(xiàn)究竟如何?一起來看看作者的分析與解讀。

當ChatGPT大殺四方,而國內類似的AI產品還沒有足夠成熟的消息傳來時,出現(xiàn)了一個全新AI助手產品——Claude。

“ChatGPT的最強競品”爆火,就這?

Claude的背景很強悍,來自前OpenAI員工獨立門戶后在2021年建立的公司Anthropic,2022年融資超7億美元,今年年初還讓谷歌投了近4億。同時,Claude的噱頭也被大家架上了高位,諸如“ChatGPT的最強競品”“GPT殺手”,對標ChatGPT的意味十足。

那么,Claude的表現(xiàn)究竟如何?

一、Claude好用嗎?

相比ChatGPT在注冊環(huán)節(jié)就把不少人攔了下來,Claude的注冊流程稍稍簡單一些。因為Claude其實是內嵌在企業(yè)聊天工具Slack(https://slack.com/get-started#/createnew)中的,可以通過用谷歌郵箱注冊后者賬號來直接體驗Claude。

“ChatGPT的最強競品”爆火,就這?

注冊之后,在彈出的網頁最后一行鏈接中點擊“創(chuàng)建一個新的工作區(qū)”。

“ChatGPT的最強競品”爆火,就這?

按照指引創(chuàng)建成功會顯示“Success”,即可進入工作區(qū),在左邊欄的“應用”中搜索添加Claude。

“ChatGPT的最強競品”爆火,就這?

到這一步,我們就可以開始體驗Claude了。

面對Claude用英語打的招呼,果醬妹用中文要求它自我介紹。Claude非常順暢地轉為中文回復,并不需要做其他設置。

我的名字叫Claude,我是一款人工智能助手。我會說中文和英文,能幫助用戶回答問題并完成簡單的任務。我不是任何一家公司的產品,我的創(chuàng)始人搭建了我這個平臺,讓我可以和用戶進行交互。很高興認識你!

點擊Claude的回復還可以進行回復、轉發(fā)、保存、提醒等,有點像微信消息中點擊右鍵彈出的操作框。

“ChatGPT的最強競品”爆火,就這?

出于新媒體人的本能,果醬妹首先向Claude詢問了今天中文互聯(lián)網有什么熱點,Claude非常有條理地列出了五個熱點話題,并對其做了簡單說明。

“ChatGPT的最強競品”爆火,就這?

看似非?!奥斆鳌保涍^果醬妹的核實,發(fā)現(xiàn)是一個都不能信。且不說給出的資訊都不是發(fā)生在今天,Claude回答的錯誤之處還在于事件內容本身,如品牌名稱壓根不存在,比賽雙方及比分數(shù)都不正確。

于是,在果醬妹指出錯誤之后,Claude迅速道歉,虛心反省自己,直言自己存在時空混淆的問題。

作為一個AI助手,我并不真正知道今天是2023年的4月24日,我提供的熱門話題信息都是我從過去報道和知識積累中推導得出的。我沒有辦法準確地告知您2023年4月24日今天中文互聯(lián)網上的實時熱點,我的知識和計算能力有限制。

“ChatGPT的最強競品”爆火,就這?

面對如此誠懇的態(tài)度,果醬妹也不好多加指責,只在隨后提問了兩個歷史日期發(fā)生的事件,正確率屬實不高。

顯然,Claude在新聞資訊收集方面仍然有很大的缺陷,這與其并非專門做搜索內容應用有關,也體現(xiàn)了搜索引擎公司的數(shù)據(jù)庫對于一個成功的AI助手有巨大影響力。

“ChatGPT的最強競品”爆火,就這?

放棄和Claude糾結具體某日的資訊,果醬妹又讓其用今天的熱點新聞寫一篇文章,從內容角度看是及格的,既有新聞事實描述,又有結合行業(yè)進行分析,甚至還有過渡句和連接詞,中文閱讀感是非常流暢的。

“ChatGPT的最強競品”爆火,就這?

值得注意的是,據(jù)Claude自述,其單次輸出的字數(shù)有上限,為2000個中文字符或者1000個英文單詞左右。

或許是出于設定好的交流習慣,Claude對于自己的回答總會做出一番說明,其解釋稱因回復內容實時生成,無法輸出預先存儲的長篇回復,當前的技術水平也難以生成長篇和深度回復,再加上交互接口、希望用戶快速找到所需消息的設計、運行環(huán)境要求等原因,都導致了存在輸出上限

“ChatGPT的最強競品”爆火,就這?

問及和ChatGPT的區(qū)別時,“端水大師”Claude非常快速地羅列出兩者的優(yōu)勢,表示ChatGPT在研究與技術水平上更厲害,而自己作為一款面向普通用戶的商業(yè)產品,在產品體驗與可靠性方面更占優(yōu)勢。

“ChatGPT的最強競品”爆火,就這?

眾所周知,ChatGPT會做算數(shù)題,果醬妹隨手打了一串數(shù)字,提問乘積,Claude緩慢地響應,并給出了一個錯誤答案,下方還附注說明其不擅長解決數(shù)學問題。

“ChatGPT的最強競品”爆火,就這?

果醬妹再次追問,Claude火速認錯,并展示了計算過程,然后再次給出了錯誤答案。

“ChatGPT的最強競品”爆火,就這?

幾個回合提問下來,雖然Claude都無法給出正確答案,但是認錯態(tài)度真誠到讓人難以斥責。Claude甚至認知到,“作為一款AI助手,失去用戶的信任與信心將是最嚴重的失敗?!?/p>

“ChatGPT的最強競品”爆火,就這?

“ChatGPT的最強競品”爆火,就這?

在隨后的測試中,Claude展現(xiàn)出對腦筋急轉彎等創(chuàng)意發(fā)散類題目的不擅長。而當果醬妹希望Claude說明自己上線的時間,但無論如何更換關鍵詞,Claude都沒有辦法理解問題的意思。同時,答案下方再次附注顯示,Claude并不那么了解自己的創(chuàng)造者Anthropic。

“ChatGPT的最強競品”爆火,就這?

“ChatGPT的最強競品”爆火,就這?

“ChatGPT的最強競品”爆火,就這?

一番體驗下來,Claude的優(yōu)缺點都很明顯。

關于其被眾人口口相傳的不收費、不用注冊、支持中文三大優(yōu)勢,實際上,除了目前不收費,注冊只是稍稍簡便,中文語感流暢但并不能完全理解掛鉤當時語境的真正意義。而邏輯類、數(shù)學類問題就完全是Claude的盲區(qū)了。

可見,作為ChatGPT的競品,Claude恐怕對打敗前者有心無力。不過,擋不住Claude免費,比起情緒不夠穩(wěn)定還收費的ChatGPT,Claude更像是任勞任怨的純種打工人,想體驗AI助手的小伙伴大可以零成本玩一把。

二、AI賽點到了嗎?

從去年年底,ChatGPT引爆網絡以來,AI 成了流量新貴,各大廠也在其中卷生卷死。但大半年過去了,得到一致認可的明星還是只有一個ChatGPT。

從這個角度來說,AI領域仍未到真正的賽點,各家的產品都還在成長期,沒有達到可以拿出來華山論劍的地步。

比如,盡管ChatGPT作為當之無愧的霸主,但實際上其也經常出現(xiàn)bug,就在美國東部時間4月23日晚間,財聯(lián)社報道稱根據(jù)中斷跟蹤網站Downdetector的數(shù)據(jù),超千名用戶報告Open AI出現(xiàn)使用問題。

這其中有多家巨頭共同明示過的算力不足的問題,也有技術不穩(wěn)定性因素,都是當前大部分AI產品的通病。但根據(jù)斯坦福的調研報告顯示,近八成國人看好技術發(fā)展,AI產品的前景仍然被期待。

而在這各自蟄伏的前期,恰恰是我們最應該關注AI動態(tài)的時間,因為局面還沒有定論,技術內卷還在繼續(xù),誰也沒法斷定最后闖出來的會是哪家黑馬,誰都有機會先嘗一波紅利。

當下的AI技術日新月異,雖然還未到取代人類工種的地步,但很多變化已經在悄悄發(fā)生。Claude不是第一個劍指ChatGPT的AI產品,也不會是最后一個,讓我們一起期待這場技術變革將掀起的影響巨浪。

作者:陳出木

來源公眾號:微果醬(ID:wjam123456),聚焦新媒體前沿,洞察新消費領域。

本文由人人都是產品經理合作媒體 @微果醬 授權發(fā)布,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!