蜜桃欧美成人一区二区三区，新国产三级在线观看播放，色久综合网精品一区二区，国产一线天在线观，亚洲欧美日韩精品专区52，国产精品免费小视频久久，亚洲国产精品无码成人片久久，亚洲日韩国产欧美一本大道

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

{{ userInfo.member ? '查看權(quán)益' : '開通會員' }}

發(fā)布

注冊 | 登錄

微軟推出iPhone能跑的ChatGPT級模型，網(wǎng)友：OpenAI得把GPT-3.5淘汰了

量子位

2024-04-24

0 評論 511 瀏覽 1 收藏

6 分鐘

微軟發(fā)布的Phi-3系列小模型，以其在手機(jī)上即可運行的強大性能，引起了AI界的廣泛關(guān)注。這一創(chuàng)新不僅展示了小模型的潛力，也對OpenAI的GPT-3.5提出了挑戰(zhàn)。

Llama 3發(fā)布剛幾天，微軟就出手截胡了？

剛剛發(fā)布的Phi-3系列小模型技術(shù)報告，引起AI圈熱議。

其中僅3.8B參數(shù)的Phi-3-mini在多項基準(zhǔn)測試中超過了Llama 3 8B。

為了方便開源社區(qū)使用，還特意設(shè)計成了與Llama系列兼容的結(jié)構(gòu)。

微軟這次打出“手機(jī)就能直接跑的小模型”的旗號，4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的蘋果A16芯片上跑到每秒12 token。

這意味著，現(xiàn)在手機(jī)上能本地運行的最佳開源模型，已經(jīng)做到ChatGPT水平。

在技術(shù)報告中還玩了一把花活，讓phi-3-mini自己解釋為什么構(gòu)建小到手機(jī)能跑的模型很令人驚嘆。

除了mini杯之外，小杯中杯也一并發(fā)布：

Phi-3-small，7B參數(shù)，為支持多語言換用了tiktoken分詞器，并額外增加10%多語種數(shù)據(jù)。

Phi-3-medium，14B參數(shù)，在更多數(shù)據(jù)上訓(xùn)練，多數(shù)測試中已超越GPT-3.5和Mixtral 8x7b MoE。

（大杯他們目前不打算做）

作者陣容一看也不簡單，一眼掃過去MSRA和MSR雷蒙德團(tuán)隊都投入了不少人。

那么，Phi-3系列到底有什么獨特之處呢？

根據(jù)技術(shù)報告中披露，其核心秘訣就在于數(shù)據(jù)。

去年團(tuán)隊就發(fā)現(xiàn)，單純堆砌參數(shù)量并不是提升模型性能的唯一路徑。

反而是精心設(shè)計訓(xùn)練數(shù)據(jù)，尤其是利用大語言模型本身去生成合成數(shù)據(jù)，配合嚴(yán)格過濾的高質(zhì)量數(shù)據(jù)，反而能讓中小模型的能力大幅躍升。

也就是訓(xùn)練階段只接觸教科書級別的高質(zhì)量數(shù)據(jù)，Textbooks are all you need。

Phi-3也延續(xù)了這一思路，這次他們更是下了血本:

投喂了多達(dá)3.3萬億token的訓(xùn)練數(shù)據(jù)（medium中杯是4.8萬億）
大幅強化了數(shù)據(jù)的”教育水平”過濾
更多樣化的合成數(shù)據(jù)，涵蓋邏輯推理、知識問答等多種技能
獨特的指令微調(diào)和RLHF訓(xùn)練，大幅提升對話和安全性

舉個例子，比如某一天足球比賽的結(jié)果可能對于大模型是良好的訓(xùn)練數(shù)據(jù)，但微軟團(tuán)隊刪除了這些加強知識的數(shù)據(jù)，留下更多能提高模型推理能力的數(shù)據(jù)。

這樣一來，對比Llama-2系列，就可以用更小的參數(shù)獲得更高的MMLU測試分?jǐn)?shù)了。

不過小模型畢竟是小模型，也不可避免存在一些弱點。

微軟透露，模型本身參數(shù)中沒能力存儲太多事實和知識，這一點也可以從TriviaQA測試分?jǐn)?shù)低看出來。

緩解辦法就是聯(lián)網(wǎng)接入搜索引擎增強。

總之，微軟研究院團(tuán)隊是鐵了心了要在小模型+數(shù)據(jù)工程這條路上走下去，未來還打算繼續(xù)增強小模型的多語言能力、安全性等指標(biāo)。

對于開源小模型超過ChatGPT這回事，不少網(wǎng)友都認(rèn)為壓力現(xiàn)在給到OpenAI這邊，需要趕快推出GPT-3.5的繼任者了。

參考鏈接：

[1]https://arxiv.org/abs/2404.14219

作者：夢晨

來源公眾號：量子位（ID：QbitAI），追蹤人工智能新趨勢，關(guān)注科技行業(yè)新突破

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位授權(quán)發(fā)布，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自 Unsplash，基于CC0協(xié)議

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

量子位

追蹤人工智能新趨勢，關(guān)注科技行業(yè)新突破

71篇作品 186167總閱讀量

產(chǎn)品經(jīng)理需要的八大核心能力

05-1813617 瀏覽

產(chǎn)品經(jīng)理需要的八大核心能力

BAT出走創(chuàng)業(yè)的「她們」

03-091797 瀏覽

BAT出走創(chuàng)業(yè)的「她們」

搜廣推策略產(chǎn)品干貨課堂之廣告歸因策略（上篇）

01-104748 瀏覽

搜廣推策略產(chǎn)品干貨課堂之廣告歸因策略（上篇）

產(chǎn)品經(jīng)理|如何學(xué)習(xí)產(chǎn)品架構(gòu)能力

03-3111871 瀏覽

產(chǎn)品經(jīng)理|如何學(xué)習(xí)產(chǎn)品架構(gòu)能力

2023年裝備制造企業(yè)CRM選型與應(yīng)用指南

03-093886 瀏覽

2023年裝備制造企業(yè)CRM選型與應(yīng)用指南

評論

目前還沒評論，等你發(fā)揮！

Axure高保真教程：橡皮擦的擦除效果——刮獎原型

03-026536 瀏覽
“扎堆讀書”的博主們，困在變現(xiàn)里

09-262660 瀏覽
零基礎(chǔ)5分鐘搭建一個私有知識的AI機(jī)器人，接入微信、抖音和飛書

09-0411673 瀏覽

2021亚洲中文字幕在线第99,日韩一级无码国产精品,日韩精品无码一级毛片免费丿,免费在线观看毛片黄片亚太影院柯西贝尔-游戏赚网