編者按:本文來(lái)自微信公眾號(hào) 白鯨出海(ID:baijingapp),作者:殷觀曉,編輯:智婷,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
在過(guò)去近一年對(duì)全球 AI 圖片賽道進(jìn)行數(shù)據(jù)追蹤后,會(huì)有一個(gè)比較清晰的感知是 AI 商品圖的頭部產(chǎn)品在 web 端訪問(wèn)量屢創(chuàng)新高,App 端每個(gè)月流水雖然不太穩(wěn)定、但也在千萬(wàn)人民幣之上,我們就預(yù)告了 AI 商品圖的選題。沒(méi)想到第一個(gè)加作者卡片的讀者,就是一個(gè)在 AI 圈比較知名的創(chuàng)業(yè)者,上來(lái)直言,“這不是一個(gè)好賽道,太卷了”。而與這類產(chǎn)品從業(yè)者交流時(shí),我們也差不多得到了同樣的反饋。
不得不說(shuō),卷,確實(shí)符合我們對(duì)這個(gè)賽道的一貫觀察。在玩家層面,因?yàn)殄^定的是巨大的電商市場(chǎng)的作圖痛點(diǎn),在早期驗(yàn)證了 PMF 之后(Photoroom),被越來(lái)越多的創(chuàng)企和大廠看上,近一年,稿定科技、快手、阿里等先后入局。在流量層面,賽道頭部產(chǎn)品的數(shù)據(jù)屢創(chuàng)新高,而中尾部產(chǎn)品/后入局者則數(shù)據(jù)慘淡,包括大廠在內(nèi),也難以起量。
但市場(chǎng)上同時(shí)也釋放著另一層信號(hào)。隨著技術(shù)不斷創(chuàng)新,像是 Photoroom 這樣原本主攻商品圖(圖片中沒(méi)有“人”)的產(chǎn)品,開(kāi)始做 Virtual model 這樣生成模特圖(圖片中有人穿著或者佩戴產(chǎn)品)的功能。另外還有不少創(chuàng)企基于 Kontext(黑森林最新模型,可多輪編輯保證一致性)開(kāi)始推出與商品圖和模特圖相關(guān)的產(chǎn)品。
AI 電商圖片賽道,成了一座“圍城”。
一、卷起來(lái),難以進(jìn)入的后來(lái)者
先以我們持續(xù)追蹤的 4 款 AI 商品圖產(chǎn)品的 web 端數(shù)據(jù)來(lái)觀察分析。上圖是過(guò)去 12 個(gè)月(2024 年 7 月- 2025 年 6 月)4 款產(chǎn)品的月訪問(wèn)數(shù)據(jù),很容易得出賽道呈現(xiàn)兩極分化走勢(shì)的結(jié)論。
數(shù)據(jù)來(lái)源:非凡產(chǎn)研&點(diǎn)點(diǎn)數(shù)據(jù)/Sensor Tower/Product Hunt以及結(jié)合網(wǎng)頁(yè)歷史頁(yè)面快照判斷,僅供參考
從上線時(shí)間來(lái)看,海外創(chuàng)企是移動(dòng)端 App 先行,后因?yàn)闃I(yè)務(wù)需要拓展到 web 端,而國(guó)內(nèi)創(chuàng)企則是 web 端先行,符合 AI 這一波先做網(wǎng)頁(yè)的典型特征。其中網(wǎng)旭科技的 PicWish web 端入局最早,但卻在近一年一頭扎入下降通道,稿定科技 insMind 入局最晚,曾憑借“吉卜力熱潮”站上 1000w+ 訪問(wèn)量水平線,但因?yàn)榱髁颗c產(chǎn)品本身定位不符,終究猶如黃粱一夢(mèng)。
如今的局面看來(lái),AI 商品圖的新增流量基本被頭部 2 個(gè)產(chǎn)品“截流”,中部產(chǎn)品只能固守、甚至守不住自己的流量,更遑論市場(chǎng)上還有一堆每月幾萬(wàn)到幾十萬(wàn)訪問(wèn)量的尾部產(chǎn)品。
究其原因,電商圖片,屬于垂類領(lǐng)域(相對(duì)于所有泛化的 AI 圖片編輯與生成)。在垂類場(chǎng)景下,一、數(shù)據(jù)的累積作為行業(yè) know-how 反饋到技術(shù)和產(chǎn)品的改進(jìn)中,會(huì)賦予頭部產(chǎn)品更強(qiáng)的動(dòng)能,最終體現(xiàn)為更強(qiáng)的產(chǎn)品力,2 個(gè)頭部產(chǎn)品的功能迭代也都更快一些。二、在形成較強(qiáng)的用戶心智之后,對(duì)流量形成了一定的壟斷(更多 指web 端,頭部產(chǎn)品直接訪問(wèn)和自然搜索流量的同比增幅都在 20-30% 之間,并且 2 個(gè)頭部產(chǎn)品的付費(fèi)搜索和展示廣告相較于之前,也都有了更大的預(yù)算投入| 數(shù)據(jù)來(lái)自SimilarWeb)。
以 Photoroom 為例,它最早在移動(dòng)端驗(yàn)證了為電商賣(mài)家作圖的需求,并基于使用數(shù)據(jù)不斷訓(xùn)練和優(yōu)化自己的圖像分割模型;隨后上線web端,穩(wěn)穩(wěn)占住「去除背景」這一關(guān)鍵詞的流量,拓展 AI 背景(踩坑,參閱之前選題《AIGC風(fēng)潮下修圖App 出路在哪?PhotoRoom 示范如何月流水大漲破千萬(wàn)》)、AI 陰影等相關(guān)功能;在 GPT-image-1 出來(lái)后,又最快與 OpenAI 聯(lián)合研發(fā)、迅速上線 AI 模特圖、產(chǎn)品美化器、場(chǎng)景設(shè)計(jì)圖等功能;近期又開(kāi)始布局“批量生成適配不同平臺(tái)素材”的功能。
而 Pixelcut 作為更晚入局、卻在近一年時(shí)間斬獲最多新增流量的產(chǎn)品(web 端新增流量 1000w+,差不多是 Photoroom 新增訪問(wèn)量的 2 倍),則完全奉行了差異化原則,讓其在用戶獲取上更有發(fā)揮空間。
AI 做商品圖,大概遵循上傳產(chǎn)品實(shí)拍圖-->去背景-->加背景、陰影等-->導(dǎo)出高清圖片(甚至有的用戶要求能達(dá)到打印標(biāo)準(zhǔn))的路徑,因而大部分有做商品圖需求的用戶去搜索的關(guān)鍵詞,首先就是 #去除背景、然后這條路徑上還能產(chǎn)出的關(guān)鍵詞包括 #圖片變清晰、以及 # AI 背景(因?yàn)榧夹g(shù)限制落地水平、流量最弱)。
Top關(guān)鍵詞、及關(guān)鍵詞的平均點(diǎn)擊量、以及主要流量的網(wǎng)站 | 圖片來(lái)源:白鯨出海根據(jù)SimilarWeb數(shù)據(jù)繪制
這 3 個(gè)功能點(diǎn)的相關(guān)關(guān)鍵詞、其對(duì)應(yīng)的規(guī)模,以及 2 個(gè)頭部產(chǎn)品在其中的占位,能夠很好地反應(yīng)出 pixelcut 為什么能后來(lái)居上。
雖然 #去除背景關(guān)鍵詞流量規(guī)模最大(Top10 關(guān)鍵詞有 7 個(gè)為去除背景及其各種變體)、且 Photoroom 其實(shí)占到了絕大部分流量(參見(jiàn)下圖),但 Pixelcut 依然能在這種圍困中,拿到最大流量關(guān)鍵詞 #background remover 的 Top3 流向網(wǎng)站,而 Photoroom 并不在其中。在流量稍次一級(jí)的 #圖片增強(qiáng)的關(guān)鍵詞中,Pixelcut 更是能穩(wěn)定獲取相關(guān)流量。
為同類網(wǎng)站帶來(lái)最多點(diǎn)擊量的Top10關(guān)鍵詞,有7個(gè)與背景相關(guān),3個(gè)與圖片變清晰相關(guān),對(duì)應(yīng)使用流程的2個(gè)非AI生成環(huán)節(jié) | 圖片來(lái)源:Similarweb這背后是 Pixelcut 針對(duì) Photoroom 產(chǎn)品的 2 點(diǎn)差異化努力。
(1)、在 #background remover 這一關(guān)鍵詞上,Pxielcut 的承接頁(yè)面的設(shè)計(jì),使其相較于Photoroom 額外出現(xiàn)在了相關(guān)問(wèn)題、和圖片搜索的結(jié)果頁(yè)面中;頁(yè)面細(xì)節(jié)之外,Pixelcut 在去掉背景的體驗(yàn)上做了更多優(yōu)化。
2 個(gè)產(chǎn)品提供的去除背景的體驗(yàn)流程都很流暢,也都能無(wú)限制導(dǎo)出非高清圖片。但相較于以去除背景見(jiàn)長(zhǎng)的 Photoroom,Pixelcut 提供了更優(yōu)質(zhì)的體驗(yàn)。除了背景去除+純色背景之外,Pixelcut 在加背景這一環(huán)節(jié)還另外提供了 #圖片背景、#生成背景 2 個(gè)選項(xiàng)。圖片背景可以在不登錄狀態(tài)下嘗試,而生成背景則要登陸(以彈窗形式登陸),無(wú)需離開(kāi)承接頁(yè)面。登錄后,生成頁(yè)面也是按類別提供了非常多的選項(xiàng),例如下圖中,筆者上傳T恤,產(chǎn)品提供了極簡(jiǎn)工作室和流行的街頭風(fēng)格等多種 AI 背景選項(xiàng)。而當(dāng)我上傳耳機(jī),它又會(huì)根據(jù)品類推送極簡(jiǎn)科技工作室、木質(zhì)桌面等 AI 背景選項(xiàng)。
2 款產(chǎn)品主要用于接 #background remover關(guān)鍵詞流量的子功能頁(yè)面 | Photoroom(上)& Pixelcut(下)
筆者測(cè)試的過(guò)程中, 會(huì)嘗試更多不同背景,很容易就拉長(zhǎng)了停留時(shí)長(zhǎng);而圖片處理結(jié)果雖然有瑕疵、但整體效果還可以,基本能滿足用戶的基礎(chǔ)需求,而無(wú)需再跳出尋找其他替代產(chǎn)品。這樣的 SEO 操作,毫無(wú)疑問(wèn)有利于優(yōu)化 Google 搜索引擎排序算法中 #用戶停留時(shí)長(zhǎng)和 #last click 這 2 個(gè)核心指標(biāo)。(注:谷歌排序算法中,有 2 個(gè)關(guān)鍵維度,#用戶停留時(shí)長(zhǎng)、#Last Click,第 2 個(gè)不好理解,其實(shí)是評(píng)估當(dāng)前頁(yè)面是否能滿足用戶完整的搜索意圖,而不再去查看其他搜索結(jié)果。)
2款產(chǎn)品都可導(dǎo)出非高清圖片 | Photoroom(左)& pixelcut(右)
(2)、而在圖片增強(qiáng)的關(guān)鍵詞上,Pixelcut 也主要打在了 Photoroom 的軟肋上。
為同類網(wǎng)站帶來(lái)最多點(diǎn)擊量的Top10關(guān)鍵詞,有7個(gè)與背景相關(guān),3個(gè)與圖片變清晰相關(guān),對(duì)應(yīng)使用流程的2個(gè)非AI生成環(huán)節(jié) | 圖片來(lái)源:Similarweb
圖片增強(qiáng),除了是 AI 做商品圖流程中的一個(gè)關(guān)鍵節(jié)點(diǎn),也真的是 Photoroom 的弱點(diǎn)。首先,我們?cè)?web 端并沒(méi)有找到相關(guān)功能。而在 App 端,雖然放大增強(qiáng)被作為 Pro 會(huì)員功能被列示在編輯工具中,但最終生產(chǎn)的圖片清晰度,是不少用戶的吐槽點(diǎn)。(我們對(duì) Photoroom 近一年移動(dòng)應(yīng)用商店的評(píng)論做了分析,我們用#resolution、#image quality、#low quality、#low res、#blur 等 5 個(gè)詞做搜索,得到多條與分辨率相關(guān)的差評(píng))
SimilarWeb 顯示,在與 Pixelcut 的關(guān)鍵詞競(jìng)爭(zhēng)中,Photoroom 失敗的關(guān)鍵詞主要集中在#圖片增強(qiáng)和一些例如刪掉圖片文字的長(zhǎng)尾詞上。而在流量獲取之外,Pixelcut 相對(duì) Photoroom 也呈現(xiàn)出更開(kāi)放式的設(shè)計(jì)(集成各家模型供用戶選擇vs.Photoroom 的“模型隱藏”)、更便宜的價(jià)格等差異點(diǎn),并在用戶心智上,放大 Photoroom 踩坑的 AI 背景,Reddit 上多名用戶對(duì) pixelcut 的認(rèn)知是,圖片背景的模板更多樣、AI 背景更厲害(2025 年 7 月份 Photoroom 才把之前踩坑的 AI 背景功能做了大升級(jí))。
在分析了 pixelcut 網(wǎng)頁(yè)和 SEO 策略后,我們認(rèn)為其之所以能在競(jìng)爭(zhēng)的激烈中快速增長(zhǎng),主要原因有以下幾點(diǎn):
1、使用流程上可提取的關(guān)鍵詞(例如去除背景、高清圖片)流量規(guī)模最大,但占住該關(guān)鍵詞有窗口期;面對(duì)對(duì)手多個(gè)頁(yè)面圍追堵截,可以選擇火力主攻 1 個(gè)頁(yè)面,提高其搜索權(quán)重以獲得流量。
Photoroom 用多個(gè)功能子頁(yè)面和不同語(yǔ)言頁(yè)面承接 # 去除背景的流量,而 pixelcut 將流量主要集中在 1 個(gè)頁(yè)面,并多采用彈窗不跳轉(zhuǎn)拉長(zhǎng)時(shí)長(zhǎng)、提高權(quán)重
2、錯(cuò)過(guò)窗口期后,觀察競(jìng)爭(zhēng)對(duì)手的劣勢(shì)功能、用戶吐槽點(diǎn),可在功能差異化層面進(jìn)行優(yōu)化,SEO 上同時(shí)發(fā)力;(例如,放大圖片清晰 vs 競(jìng)對(duì)圖片質(zhì)量降級(jí);主攻 AI 背景和圖片背景多樣性 vs 競(jìng)對(duì) AI 背景踩坑)
3、SEO 的努力方向與產(chǎn)品本身/優(yōu)勢(shì)功能契合,才能真正鎖住流量,SEO 的精髓,要回歸用戶體驗(yàn)。insMind 的“失敗”,剛好是太過(guò)于流量導(dǎo)向而又缺少關(guān)鍵差異點(diǎn)來(lái)確保留存。
“現(xiàn)在的創(chuàng)業(yè),時(shí)機(jī)非常重要,在合適的時(shí)間點(diǎn)去發(fā)布一款產(chǎn)品,然后不斷去強(qiáng)化自己的競(jìng)爭(zhēng)力,如果錯(cuò)過(guò)那個(gè)時(shí)間點(diǎn),你又沒(méi)有差異化,根本不能可能做過(guò)別人?!痹龀鲞^(guò) 2 款訪問(wèn)量幾百萬(wàn)的 AI web 的創(chuàng)業(yè)者如是說(shuō)。
也許在 AI 商品圖這個(gè)賽道,很難再出現(xiàn)出海企業(yè)后來(lái)居上的景象?!拔覀儾挥X(jué)得在這個(gè)時(shí)間段,與 Photoroom 競(jìng)爭(zhēng) AI 商品圖,還有什么意義。”面對(duì)整個(gè) AI 商品圖的競(jìng)爭(zhēng)格局,一位從業(yè)者這樣告訴白鯨出海。
這種流量的兩極分化,不僅僅體現(xiàn)在腰尾部初創(chuàng)產(chǎn)品上,幾個(gè)大廠近期上線的產(chǎn)品也難逃趨勢(shì)。
快手的 AI 商品圖產(chǎn)品 poify上線 3 個(gè)月,現(xiàn)在流量不到 1w;阿里的 Pic Copilot 5 月份流量 25w 左右,2 個(gè)月前還有 50w 左右。背后原因除了工具類產(chǎn)品對(duì)大廠吸引力不足、投入有限之外,其實(shí)也有 AI 商品圖/模特圖面臨的另一個(gè)問(wèn)題,即更傾向于“討好”消費(fèi)者的電商平臺(tái)方,面對(duì) AI 生成的商品圖可謂左右為難,典型例子就是淘寶上半年整治 AI 假圖,雖說(shuō) AI 商品圖不等于假圖,但這也表明 AI 參與到電商行業(yè)后,已經(jīng)引發(fā)了一些問(wèn)題,現(xiàn)階段的技術(shù)能解決的問(wèn)題依然有限,難以真正有效地大商用范圍。
綜合起來(lái),就有了創(chuàng)業(yè)者們感受到的“太卷”—— 隨著 AI 技術(shù)迭代,頭部企業(yè)努力優(yōu)化產(chǎn)品來(lái)擴(kuò)充用戶盤(pán)子,但實(shí)際落地效果短期內(nèi)難有飛躍,形成增量有限的局面;與此同時(shí),賽道參與者眾多,給流量獲取帶了更大的難度。
二、Kontext 來(lái)了,機(jī)會(huì)來(lái)了?
從流量回歸產(chǎn)品,我們?cè)谡{(diào)研這類產(chǎn)品的時(shí)候,會(huì)發(fā)現(xiàn)在商品圖的美好宣傳與使用者的實(shí)際體驗(yàn)之間,始終隔著一道溝壑。
“摳圖放在純色或者簡(jiǎn)單背景里,其實(shí)已經(jīng)差不多能夠落地。但如果放到一些復(fù)雜好看的背景里,如果僅用 AI 工具,產(chǎn)品幾乎都會(huì)變?!痹谝患页鲂挟a(chǎn)品品牌做商品圖的賈浩表示?!吧唐穲D第一要真實(shí),第二才是好看,產(chǎn)品變了就失去了意義。老板們看了 AI 產(chǎn)品的宣傳,感覺(jué)立省幾十萬(wàn),但實(shí)際上之前作圖的流程,都不能省。
復(fù)雜的產(chǎn)品,我們會(huì)訓(xùn)練 LoRA,但出圖有時(shí)候還是會(huì)變。后來(lái),有些情況下我們就讓 AI 出圖,然后把產(chǎn)品去掉,剩下AI發(fā)揮創(chuàng)意做出的背景圖,再用 PS 把產(chǎn)品和背景融合在一起。這其中所消耗的時(shí)間也不少?!?/p>
去掉背景之后的耳機(jī)原圖
左右滑動(dòng)查看更多,測(cè)試的3個(gè)AI背景里,后2張圖都出現(xiàn)了與原產(chǎn)品的不一致,主要集中在頭梁和耳罩之間的連接結(jié)構(gòu) | 測(cè)試產(chǎn)品_pixelcut
對(duì)于當(dāng)初更多出海企業(yè)押注的 AI 模特圖賽道,服裝的一致性則更難以保證。
“聽(tīng)話等于服裝細(xì)節(jié)不變,包括紋理、材質(zhì)、面料、版型都不能變化、而且加了一些光影進(jìn)來(lái)也不能變,而客戶要求的結(jié)果是聽(tīng)話+AI model 做出指定 Pose+優(yōu)秀攝影師作品的質(zhì)感。”很多創(chuàng)企已經(jīng)轉(zhuǎn)型但一直堅(jiān)持做 AI模特圖(AI 商拍)的 WeShop 的 GM 吳海波告訴我們,“AI 是自由的,客戶要的是‘聽(tīng)話’。當(dāng)你想讓自由的 AI 去對(duì)齊客戶想要的‘聽(tīng)話’,生成的質(zhì)量就會(huì)變差、甚至產(chǎn)品和衣服變形。
當(dāng)時(shí) AIGC 火了之后,電商這個(gè)事情,大家想的都很大,國(guó)內(nèi)的圖片量又很大,這是當(dāng)時(shí)很多創(chuàng)企都切到模特圖的一個(gè)原因,但是做著做著就會(huì)發(fā)現(xiàn)技術(shù)很難實(shí)現(xiàn)預(yù)期結(jié)果,很多人就不做了?!?/p>
吳海波告訴我們,對(duì)于 AI 商拍(AI 模特圖),其實(shí)難點(diǎn)也是一樣。第一步請(qǐng)模特、第二步找場(chǎng)景,兩者結(jié)合形成氛圍感。WeShop 其實(shí)是在服飾保持和場(chǎng)景生成中間,做一個(gè)平衡。而事實(shí)上,對(duì)于圖的要求,國(guó)內(nèi)會(huì)比海外更高,這也是海外的增速會(huì)更快一些的原因。他認(rèn)為,現(xiàn)象背后主要是2點(diǎn):
1、國(guó)內(nèi)在 AI 商拍上,供應(yīng)端更卷一些。
從淘寶和 SHEIN 的圖就能看出來(lái),都比海外本地平臺(tái)拍攝上傳的電商圖片要更復(fù)雜。這背后是國(guó)內(nèi)的商家和品牌從下游或者拍攝公司拿到一張實(shí)拍圖的成本不高。海外的拍攝成本更高,所以模特圖和商品圖都會(huì)選擇更簡(jiǎn)單干凈的背景。因而單純的 AI 工具,其實(shí)很難能夠滿足國(guó)內(nèi)商家的要求。
2、海外有一類場(chǎng)景是一些 KOL 會(huì)發(fā)一些東西,他們更追求自然、對(duì)細(xì)節(jié)的要求會(huì)弱一些。
現(xiàn)階段,在用戶需求中做平衡,給出盡可能可以落地的方案,是 AI 商品圖和模特圖努力的方向?!?025 年之后,這也是我們跟競(jìng)品之間的一個(gè)最大區(qū)別,人和背景去放在一起。因?yàn)榇蠹易隹顣?huì)參考最近流行的打卡地點(diǎn)、拍照姿勢(shì),我們做的就是讓產(chǎn)品和背景更好的結(jié)合在一起?!眳呛2ū硎尽?/p>
但是當(dāng)我們拿著最近被各路自媒體猛吹一致性的 Kontext,問(wèn)吳海波,是否可能解決 AI 商品圖、甚至 AI 模特圖一致性的難題,帶來(lái)“翻身機(jī)會(huì)”的時(shí)候,吳海波認(rèn)為 Kontext 無(wú)疑是對(duì)行業(yè)的利好,但并不是他期望中的理想架構(gòu),用于解決之前存在的一些問(wèn)題,還需要大家努力做很多適配工作。
直接在 Krea 平臺(tái)使用 Kontext 模型(非 comfyUI 的工作流),耳機(jī)的材質(zhì)顏色和模型都發(fā)生了變化
基于 Kontext 模型的 ComfyUI 工作流,給實(shí)拍的耳機(jī)加背景,一致性得到了比較不錯(cuò)的保障
人臺(tái)圖 | 來(lái)源:網(wǎng)絡(luò)
AI模特圖 | 某產(chǎn)品A
AI模特圖 | Photoroom 平臺(tái)的Virtual Model功能
AI模特圖 | WeShop
AI模特圖 | Liblib認(rèn)證創(chuàng)作者Li魚(yú)服裝生成模特kontext工作流
面對(duì) Kontext 工作流實(shí)現(xiàn)的還不錯(cuò)的效果,吳海波表示,“就我們自己的訓(xùn)練來(lái)看,Kontext 去做一個(gè)工作流或者 showcase 還是挺好的,但是還沒(méi)有變成一個(gè)成功率大于某一個(gè)數(shù)值的輸出,這樣就不會(huì)形成客戶去購(gòu)買(mǎi)算力穩(wěn)定使用,簡(jiǎn)而言之,就是不能商用。工作流用戶分 2 種,偏技術(shù)類的專家和嘗鮮用戶,前者能夠在工作流報(bào)錯(cuò)的時(shí)候自己解決,而工作流報(bào)錯(cuò)是大概率事件,后者本來(lái)對(duì)圖片的要求也不高。”(ps: 后續(xù)我們用服裝平面圖測(cè)試同一個(gè) kontext 穿衣工作流,出現(xiàn)了衣服直接覆蓋在人身上等意外情況)
但對(duì)于我們的商業(yè)用戶來(lái)說(shuō),他每天是有必須要完成的圖片處理量。以我們目前的情況來(lái)看,如果抽卡成功率在 20-30%,用 Kontext 可能會(huì)降到 5%。
BFL 團(tuán)隊(duì)(kontext 模型廠商)還在于將天花板拉高,他們并不 care 這個(gè)模型被什么人用于什么領(lǐng)域。而我們做 AI 商拍,雖然在海外某些場(chǎng)景有一些取舍,但一致性依然是最重要的,Kontext 在語(yǔ)言信息的處理上、也就是指令聽(tīng)從還是比較差,他還不是我期望架構(gòu)的‘完全體’,這個(gè)模型的技術(shù)思想還是偏傳統(tǒng)的,我們希望看到一個(gè)開(kāi)源版本的 GPT-4o 的架構(gòu)。
但是,在 Kontext 發(fā)布之前會(huì)有一些難題需要復(fù)雜解法,Kontext 出來(lái)后,可以做到用比較簡(jiǎn)單的方案就能解決問(wèn)題。例如我們之前有一個(gè)改變角度來(lái)展示服裝的功能 #change pose,其實(shí)技術(shù)思路和 Kontext 有類似之處,因?yàn)橛幸恍┘夹g(shù)積累,當(dāng) Kontext 出現(xiàn)之后我們能很快應(yīng)用起來(lái),解決方案會(huì)變得更簡(jiǎn)單一些。
WeShop的操作界面及change pose功能
面對(duì)最近又有不少創(chuàng)企嘗試進(jìn)入這一賽道,吳海波認(rèn)為,做應(yīng)用層的公司,最重要的就是怎樣將行業(yè) know-how 做成一個(gè)控制模塊加入進(jìn)去。有沒(méi)有 know-how 非常重要。實(shí)際上,整個(gè)行業(yè)確實(shí)在快速增長(zhǎng),但依然很小。加入競(jìng)爭(zhēng)要思考自己的優(yōu)勢(shì)是什么才能活下來(lái)。
吳海波解釋:“以 WeShop 為例,ARR 每年翻一番、增速很快,但還是一個(gè)小事情。技術(shù)選型,3-6 個(gè)月技術(shù)必革新,所以 AI 時(shí)代,用戶會(huì)特別喜新厭舊、到處遷移,ARR 沒(méi)有意義。
或者打一個(gè)比喻,淘寶上自己有貨、能投得了直通車(chē)、一年的收入能維持一個(gè)小團(tuán)隊(duì),在這個(gè)標(biāo)準(zhǔn)之上的品牌和賣(mài)家對(duì) AI 商拍圖,現(xiàn)在是不滿意的。他們是現(xiàn)在的這部分需求其實(shí)是被“人力密集型”團(tuán)隊(duì)承接掉的,說(shuō)是用 AI,但其實(shí)用的是 AI+人工,我們的目標(biāo)是做純 AI 工具去服務(wù)這批人,但現(xiàn)在行業(yè)技術(shù)還沒(méi)有達(dá)到那條線?!?/p>
參考文章:
1、《被賣(mài)家追著跑,這一波AI商拍真香了?》,白鯨出海
2、《AIGC風(fēng)潮下修圖App出路在哪?PhotoRoom示范如何月流水大漲破千萬(wàn)》,白鯨出海
3、《谷歌 SEO 新卷王 Pollo.ai,讓我放棄研究 Canva 和Wondershare》,侃侃而亮
4、《OpenAI復(fù)制吉卜力,大模型正在吞噬一切產(chǎn)品》,晚點(diǎn)LatePost
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。