【真實測評】GPT 4o秒殺圖像類套殼應(yīng)用?

0 評論 484 瀏覽 0 收藏 6 分鐘

前段時間GPT 4o更新之后,可以直接生成圖片。而吉卜力圖片的出圈,讓這個功能更為廣為人知。但具體的表現(xiàn)怎么樣?我們看看作者測評的結(jié)果。

一、為什么要進行測評

GPT 4o發(fā)布后,自媒體又迎來了一波空前活躍,但是主要聚焦在吉卜力頭像上。但鑒于筆者對各類圖像類AI應(yīng)用和對應(yīng)的付費情況比較了解,所以主要測試了GPT-4o在其他圖像類To B、To C領(lǐng)域的效果及穩(wěn)定性。

驗證我的一個猜想:即簡單工程化的工作流(比如標題里說的套殼應(yīng)用)是否在當下已經(jīng)被進步后的模型碾碎。

二、此文適合誰看

1、目前在做AI應(yīng)用創(chuàng)業(yè)的創(chuàng)業(yè)團隊

2、想用AI做副業(yè)的自媒體從業(yè)者、教培從業(yè)者

3、想要在工作場景更好使用AI的打工人,如設(shè)計師等

【說明】:

來自于本人為期12小時的不權(quán)威測試,為了公平起見,僅使用GPT 4o直出,不使用PS、美圖等后期工具處理效果,亦不使用其他AI大模型&應(yīng)用進行二次處理。

Part 1、電商素材場景——白底圖一鍵生成場景圖

效果:??????????

優(yōu)點:生成的背景圖明顯非常符合物理世界的特征,比如打光、質(zhì)感、商品擺放位置等之前基于SD的應(yīng)用會容易出問題的check point。從護手霜+海浪圖可以看出,場景圖容易出現(xiàn)的主體和背景脫節(jié)等問題也沒有出現(xiàn)。

缺點:

1)商品圖原圖的形狀稍有變形(偶發(fā)性,非必現(xiàn))。

2)可能需要猶豫一下的是貨架電商(淘寶)表示對AI場景圖要上限制,不確定是否會嚴格執(zhí)行。

Part 2、AI頭像——吉卜力/3D模板

效果:??????????

點評:4o最近最出圈的項目沒有之一了,果然最適合傳播的還是頭像、照片類。

明顯勝過SD的是對于衣服的還原(LV老花都給畫出來了)

缺點:

1)頭像類的火基本都是一過性的,覆蓋完應(yīng)該覆蓋的用戶后,最多也就是一個周的熱度。

2)和下面說的問題有點接近,生成的照片不像本人。

Part 3、生成藝術(shù)寫真

效果:????

點評:從AI頭像延伸出來的需求,不過經(jīng)過我多次嘗試,不管prompt怎么強調(diào)不能修改人物長相,4o始終無法保留人臉的特征。甚至達不到妙鴨那種似像非像的境界……僅就這個項目而言,SD還是能保有一些壁壘的。所以4o的效果暫時還無法把妙鴨砍死。

缺點:既然不像,就無法交付藝術(shù)寫真本身的產(chǎn)品價值了。

Part 4、一鍵換裝

效果:????????

優(yōu)點:簡單的衣服一鍵換裝是沒毛病的,但是模特圖如果非白底圖,且動作比較復(fù)雜,4o可能就搞不定了。所以1、挑素材 2、可能的素材與處理。

缺點:除了上述的局限性,冷光暖光打的也比較生硬。

階段小結(jié):后續(xù)會測評其他更復(fù)雜的工作流,并且引入其他AI模型和應(yīng)用的能力,比如生成知識圖譜,生成視頻分鏡等。

最終,我們曾經(jīng)引以為傲的復(fù)雜工作流程——精心調(diào)教的提示詞,層層疊疊的插件,環(huán)環(huán)相扣的模型鏈,都將會被一個簡單的對話界面,甚至幾句口述所取代。

本文由 @只做好20%的事 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!