編者按:本文來自微信公眾號 峰瑞資本(ID:freesvc),創(chuàng)業(yè)邦經(jīng)授權(quán)發(fā)布。
最近,AIGC(AI-generated content,AI生產(chǎn)內(nèi)容)這股洪流涌入了我們的生活以及商業(yè)世界。
OpenAI發(fā)布多模態(tài)GPT-4模型,讓GPT能理解圖片的內(nèi)涵。Midjourney發(fā)布第五版商業(yè)AI圖像生成服務(wù),解決了以往AI工具無法正確渲染手部的難題。百度發(fā)布文心一言,包含文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解與多模態(tài)生成這幾大能力。
與AIGC相關(guān)的技術(shù)問題已經(jīng)被比較充分地討論。我們好奇的是,這股洪流可能會產(chǎn)生哪些分支?流入哪些小徑?置身其中的創(chuàng)業(yè)者們會選擇奔赴哪個方向?
目前已經(jīng)有不少團(tuán)隊選擇在模型層創(chuàng)業(yè),做語言模型或者圖像生成模型。除此之外,創(chuàng)業(yè)者或許還可以立足垂直行業(yè),往行業(yè)的縱深方向發(fā)展。
在「趨勢2023——峰瑞中美創(chuàng)投峰會」,峰瑞資本投資合伙人陳石與AI科技運動公司BodyPark型動公園(以下簡稱BodyPark)創(chuàng)始人兼CEO阿立Alex,閣樓創(chuàng)始人兼CEO劉秋陽、特看科技創(chuàng)始人兼CEO吳春松(樂乘)一起深入探討了AIGC如何影響垂直行業(yè)。
主持人陳石擁有15+年連續(xù)創(chuàng)業(yè)經(jīng)歷,作為核心管理團(tuán)隊成員深度參與UC瀏覽器和第三方支付公司拉卡拉的創(chuàng)業(yè)過程,分別擔(dān)任副總裁和CTO。他曾擔(dān)任阿里大文娛、移動事業(yè)群高管,深度參與UC、高德、優(yōu)酷、土豆、神馬搜索、UC國際等產(chǎn)品線的業(yè)務(wù)決策和管理執(zhí)行。
嘉賓阿立創(chuàng)立的BodyPark結(jié)合了「AI算法+真人私教+游戲化」等關(guān)鍵要素,推出「AI+真人」在線私教課。嘉賓劉秋陽碩士畢業(yè)于南加州大學(xué)計算機(jī)科學(xué)系。他創(chuàng)辦了深圳謹(jǐn)啟科技有限公司,旗下的“閣樓”是一款線上心理服務(wù) App。嘉賓吳春松是特看科技創(chuàng)始人&CEO,前阿里智能設(shè)計實驗室負(fù)責(zé)人,阿里魯班創(chuàng)始人。特看科技切入的是短視頻及直播SAAS服務(wù)領(lǐng)域。
我們將他們的部分討論編輯成文,期待能提供新的思考角度。
分析式AI與生成式AI 在場景使用上有什么區(qū)別?
陳石:這幾年AI有兩波浪潮,第一波叫分析式AI,第二波叫生成式AI。你們是怎么感受這兩波創(chuàng)業(yè)熱潮的?這兩波創(chuàng)業(yè)熱潮針對的使用場景有什么區(qū)別?
吳春松:我經(jīng)歷過這兩波不同輪次的高潮。2015年到2016年那一波AI浪潮時,剛好那時我在阿里內(nèi)部做了“阿里魯班”(后改名為“鹿班”)這款產(chǎn)品。這款產(chǎn)品借助AI來生成海報,能夠?qū)崿F(xiàn)自動排版、自動更改圖片尺寸。
當(dāng)時我們大多還是通過限定范圍內(nèi)的小模型的方式去做。我們做海報,還要人工去準(zhǔn)備好大量的設(shè)計的基礎(chǔ)元素和物料,生成的圖像是元素級的組合?,F(xiàn)在這一波的大模型,已經(jīng)能真正實現(xiàn)像素級生成,這在圖像領(lǐng)域是一次重大的變化。
▲ Midjourney生成的圖片,
關(guān)鍵詞為90年代的中國情侶。
另外在控制生成的過程中,上一波我們要給很多元素打好標(biāo)簽,用專家支持的方式去組合后做優(yōu)化。
現(xiàn)在這一波Midjourney或者Stable Diffusion這些模型,已經(jīng)改成prompt(輸入關(guān)鍵詞)這種接近人類自然語言的方式,去生成圖片。所以這一波AI產(chǎn)品在交互方式上也發(fā)生了很大的變化。
我感覺這一波生成式AI站在了巨人的肩膀上,它把人類歷史已經(jīng)沉淀的過往信息聚集在一起,用深層次AI大模型的方法做了組裝升級。所以我覺得這一波AI熱潮帶來的變化比上一次影響更深。
陳石:阿立是AI行業(yè)的一名“老兵”。 之前在AI獨角獸公司出門問問,做產(chǎn)品的VP,剛好經(jīng)歷了這兩波AI熱潮。
阿立:上一波的語音助手類AI以及視覺類AI更多是偏向被動式的分析,預(yù)置任務(wù)場景下的簡單問答,更多是為了在特定任務(wù)上提高搜索交互效率。
過去一兩年,尤其是最近生成式AI這一波,讓AI從被動式的分析或者響應(yīng),變成了可以更主動地去生成內(nèi)容,能夠在很多垂直的應(yīng)用場景上給出很多新可能,結(jié)構(gòu)性地改變用戶體驗和行業(yè)生態(tài)。
我們確實也看到了這一波新的基礎(chǔ)設(shè)施,或者說底層技術(shù)的突破,能夠給很多垂直的應(yīng)用場景帶來新的可能。
陳石:確實,原先我們覺得AI好像只能做一些比較局部的技術(shù)性工作,現(xiàn)在生成式AI讓我們打開了腦洞,發(fā)現(xiàn)它能做更多事情。
劉秋陽:我沒有經(jīng)歷過完整的兩撥AI浪潮,但我們一直在用AI 相關(guān)的產(chǎn)品。現(xiàn)在的語言模型更加通用,我們可以不用像以前那樣,只在一個細(xì)分領(lǐng)域中用一個產(chǎn)品去生成?,F(xiàn)在你可以用GPT去生成任何你想要的內(nèi)容。我覺得它會變成每個人工作的基礎(chǔ)設(shè)施,而不是僅僅是科學(xué)家或者工程師的基礎(chǔ)設(shè)施。
AIGC如何賦能心理咨詢行業(yè)?
陳石:現(xiàn)在我們進(jìn)入垂直行業(yè)賽道的討論。三位嘉賓來自三個垂直行業(yè),秋陽是心理咨詢服務(wù)賽道,春松是內(nèi)容營銷的賽道,阿立是在線健身賽道,都不太一樣。剛好借這個機(jī)會,請大家介紹一下各自的賽道。
先從秋陽開始,我比較關(guān)心一個問題,當(dāng)前心理咨詢服務(wù)賽道是什么情況?為什么AIGC可以幫助它?
劉秋陽:心理咨詢賽道其實發(fā)展了很久,這個賽道不同時期也都有不同的產(chǎn)品涌現(xiàn)。但這個行業(yè)一直都沒有解決非標(biāo)性問題,比如咨詢師的學(xué)派、學(xué)習(xí)經(jīng)歷各異,不同平臺的服務(wù)方式各有不同。
這些非標(biāo)性會造成很多用戶痛點,比如預(yù)約要很久;可能通勤時間很長;你找的咨詢師可能不太適合你,要試錯很多次才能找到一個合適的咨詢師。
這些問題看起來都是需求端的問題,但最終都要在供應(yīng)鏈端尋找解決辦法。所以我們做的第一件事就是把咨詢和服務(wù)的流程標(biāo)準(zhǔn)化。
當(dāng)我們在思考AIGC怎么幫助我們時,并不是思考如何讓它給用戶做心理咨詢,而是思考它如何在供應(yīng)鏈側(cè),賦能心理咨詢師。
如果我們要把一個人從抑郁或者焦慮的狀態(tài)中治好,本質(zhì)上是要讓這個人和心理咨詢師建立新的關(guān)系,這是人和人的情感交互。如今ChatGPT雖然在語義和推斷領(lǐng)域已做得非常厲害了,但在建立關(guān)系,進(jìn)行情感和人倫層面上的交流上,ChatGPT還比較難實現(xiàn)。
除了咨詢之外,心理咨詢師還有非常多工作要做,比如寫案例報告、工作安排。每個人寫得都有自己的風(fēng)格,但如果用AIGC去寫,首先它能保證質(zhì)量,另外,AI生成的內(nèi)容格式相對統(tǒng)一。更重要的是,之前供應(yīng)鏈端的所有的書面材料都要咨詢師做,現(xiàn)在可 AIGC可以直接生成,能讓咨詢師更專注于業(yè)務(wù)本身,提升了幾倍的工作效率。
在實際應(yīng)用AIGC的過程中,我們也遇到了一些坎,比如怎么更好地生成prompt(關(guān)鍵詞指令)。心理行業(yè)和其他行業(yè)不同的一個點在于,心理咨詢行業(yè)有非常多專業(yè)的詞匯,你需要把這些專業(yè)的詞匯都嘗試一遍,才能生成出你覺得不錯的產(chǎn)品。
AIGC如何改變視頻營銷?
陳石:接下來我們進(jìn)入第二個賽道,春松你來簡單介紹一下,你在做什么樣的產(chǎn)品?
吳春松:特看科技把 AI 和數(shù)據(jù)技術(shù)用在視頻直播產(chǎn)品里,是內(nèi)容生產(chǎn)賽道里面的一個典型應(yīng)用。我們是AIGC 里面的“GC”(生成內(nèi)容)。
在內(nèi)容生產(chǎn)賽道,以前的主流方式是PGC(專業(yè)生產(chǎn)內(nèi)容) 或者UGC(用戶生產(chǎn)內(nèi)容)。PGC對應(yīng)的工具是像 Pr(Adobe Premiere Pro,簡稱Pr,由Adobe公司開發(fā)的一款視頻編輯軟件。) 這種專業(yè)深度的工具。
UGC更多是借助移動端比較輕量的模板化的內(nèi)容生產(chǎn)工具。如今AIGC改變了內(nèi)容生產(chǎn)的方式,對我們所處的領(lǐng)域改變很大。
我們切入的是視頻及直播工具賽道。視頻制作這件事可以被分為三段。第一段,策劃、創(chuàng)作環(huán)節(jié),要產(chǎn)出內(nèi)容腳本。第二段是拍攝跟制片環(huán)節(jié),產(chǎn)出畫面跟素材。第三段是剪輯環(huán)節(jié),形成最終的作品。
我們盡可能在每個環(huán)節(jié)都用上AIGC最新的能力,正在研發(fā)一鍵生成視頻的工具。我們內(nèi)部很關(guān)注一個指標(biāo),叫AI替代率。可能對于其他行業(yè)而言,是否使用AI是可選項,但對我們來說,是必選項。
陳石:當(dāng)時峰瑞投資特看科技時,它原先定位在短視頻制作,特別是在海外短視頻賽道里頭做內(nèi)容的創(chuàng)作、編輯、數(shù)據(jù)歸集以及生意參謀。早期特看科技用GAN(對抗生成網(wǎng)絡(luò)),來給主播換臉,滿足跨境電商海外直播的需求。新的語言模型和圖像生成模型,比如GPT-3和Stable diffusion等面世并逐步成熟之后,特看科技很快就把新技術(shù)用在了業(yè)務(wù)里。
想問一下你們在運用新技術(shù)的過程中,有沒有發(fā)生過一些有趣的情況?有什么新發(fā)現(xiàn),碰到了什么困難?
吳春松:我們比較意外的是,GPT是一個“抄作業(yè)”的高手。比如在撰寫直播話術(shù)跟策劃視頻腳本環(huán)節(jié),我們給它看了一些樣例之后,它很快就學(xué)會了。它的通用能力讓大家都感覺到了,但它在專業(yè)領(lǐng)域里面也學(xué)得很快。比如我們在美妝類目下給了它幾百條優(yōu)質(zhì)的視頻腳本后,它可以有模有樣地做出來,它的泛化能力跟涌現(xiàn)能力讓我們感觸深刻。
難點則是我們切入的視頻領(lǐng)域天然是多模態(tài)的,涉及文本、語音、圖像等多方面的內(nèi)容形態(tài),之前的語言模型大多是單一模態(tài),我們需要自己來“組裝”。GPT-4這樣的多模態(tài)的語言模型,一定是大勢所趨。
AIGC如何助力線上健身?
陳石:我們現(xiàn)在進(jìn)入在線健身賽道,請阿立來分享一下這個行業(yè)當(dāng)前是什么情況?為什么AIGC可以幫助它?
阿立:我聊一下我們創(chuàng)業(yè)的一些判斷和想法,以及跟 AI 的關(guān)系。
很多人會認(rèn)為線下面對面的交付才能把體驗做好。但我們看到,不管是線上還是線下,健身行業(yè)存在不少亟待解決的問題,比如續(xù)費和用戶留存不太好。
我們?yōu)槭裁匆龀鰜韯?chuàng)業(yè),切入線上運動健身賽道?
首先,由于5G 、在線音視頻、 RTC技術(shù)(Real time communication,實時通信,是實時音視頻的簡稱。)以及AI技術(shù)加成,線上反而有機(jī)會做出不一樣的用戶體驗。
第二,我們看到在很多次技術(shù)周期里,因為出現(xiàn)新技術(shù),使得老需求有一個更方便、體驗更好的方案,可以解鎖大量的新市場。你不能用“歷史的眼光”,來看新市場。
從底層邏輯來講,閣樓、特看科技和BodyPark都在做同一件事,就是降低了人們使用服務(wù)的門檻,這是核心。
我們開創(chuàng)性地做了一個“AI+真人”的在線私教課產(chǎn)品,在市面上已經(jīng)跑了一年多。我們的信心來自于真真切切地看到了消費者愿意去線上,愿意掏錢,并且續(xù)費留存顯著優(yōu)于傳統(tǒng)方案。
我們還搭建了一套AI Coach Copilot遠(yuǎn)程授課系統(tǒng),幫助全國各地的教練,高效率遠(yuǎn)程授課,讓他們在每節(jié)課都能收到一筆不錯的課時費收入。疫情期間,我們這套系統(tǒng)幫助很多教練解決了生計問題。
我們之所以能做到這些事,就是因為我們利用了最前沿的技術(shù),切入了一個垂直場景,將非常傳統(tǒng)的線下健身行業(yè)進(jìn)行線上化和智能化改造,創(chuàng)造了新的服務(wù)交付方式。這也是我們相信AI要做垂、做深、做透的邏輯。
陳石:同樣的問題,BodyPark在運用新技術(shù)的過程中,有沒有發(fā)生過一些有趣的情況?有什么新發(fā)現(xiàn),碰到了什么困難?
Alex: 難點在于,第一,怎么用AI深度學(xué)習(xí)的方式來精準(zhǔn)捕捉人體的運動。市面上開源的人體姿態(tài)識別和動作捕捉系統(tǒng)識別準(zhǔn)確度還不夠高,我們采用自有模型和算法,做了很多優(yōu)化,提高識別準(zhǔn)確度。
另外,挑戰(zhàn)還在于怎么把動作識別、實時音視頻互動這套技術(shù),用比較“絲滑”的工程和產(chǎn)品方案,交付給消費者,這里面要解決不少技術(shù)難點。
運用新技術(shù)的過程里也有不少有趣的發(fā)現(xiàn),AIGC在垂直行業(yè)可以找到有意思的應(yīng)用場景。比如我們用stable diffusion算法模型,上線了AI健身濾鏡的功能。用戶上完一節(jié)課,BodyPark會給用戶生成這節(jié)課的高光時刻圖片,既保護(hù)了用戶隱私又非常有趣,用戶的分享率也非常高。
▲ 圖片來源: BodyPark
再比如,我們最新上線的一款 AI互動游戲化健身APP“JustFive”,既能讓用戶在歡快的音樂節(jié)奏中,進(jìn)行有趣熱烈的游戲PK,不知不覺的完成5分鐘有氧HIIT鍛煉,也能在課后生成非常有趣鬼畜的短視頻,便于用戶分享。
陳石:BodyPark和閣樓這兩家企業(yè)都定位在服務(wù)行業(yè),它們都在經(jīng)歷我們稱之為服務(wù)行業(yè)的“三化”過程,即線上化、數(shù)字化、智能化。表面上看,從線下到線上會有服務(wù)體驗上的損失,但最終,數(shù)字化和智能化的優(yōu)勢能彌補(bǔ)這些損失,實現(xiàn)更好的服務(wù)效果,提高服務(wù)4效率。
AIGC還有哪些落地場景和機(jī)會?
陳石:除了心理咨詢、短視頻、健身這三個垂直行業(yè)之外,你們還看好哪些垂直行業(yè),能讓生成式AI有更好的落地場景和機(jī)會?
吳春松:我覺得首先是內(nèi)容創(chuàng)作行業(yè),不管是圖片、文本還是視頻,應(yīng)該是最直接被改變的一個領(lǐng)域。如果是站在普通消費者的角度,我現(xiàn)在最期待的換掉手機(jī)里的語音助理,改成真正聰明的ChatGPT這種水平的智能交互。比如我拿起手機(jī),點一個按鈕,就可以把我的問題全問完,也能及時得到我想要的答案。把交互的“距離”縮短,這是我最迫切的需求。當(dāng)然可能這種機(jī)會可能不在創(chuàng)業(yè)公司手里,更像是在巨頭手里的機(jī)會。
阿立:如果大家考慮創(chuàng)業(yè)或者加入創(chuàng)業(yè)公司,我覺得有幾個大的方向。第一個去做基建和大模型創(chuàng)業(yè)。如果你對前沿科技感興趣,可以選擇加入一個大模型的公司。但這個機(jī)會可能會在少數(shù)巨頭手里,或者在資金充裕、技術(shù)實力比較強(qiáng)的創(chuàng)業(yè)團(tuán)隊。
對于創(chuàng)業(yè)公司而言,更多的機(jī)會是做中間層或者應(yīng)用層,或者把中間層和應(yīng)用層一塊做。
此外,可以多從服務(wù)業(yè)里找找應(yīng)用層的創(chuàng)業(yè)機(jī)會,不管是去重構(gòu)線下,還是把線下的體驗搬到線上,或者做一些全球化的事情,出海其實也會有很多機(jī)會。在新的增長周期,去觀察用戶有沒有新的需求變化,去觀察有沒有機(jī)會通過最前沿的技術(shù),去做結(jié)構(gòu)性的降本增效或者體驗創(chuàng)新。
劉秋陽:我覺得應(yīng)用層的服務(wù)行業(yè)會有非常多的機(jī)會,比如金融、法律、醫(yī)療,其實都會有從線下翻上來的機(jī)會。如果未來AIGC應(yīng)用得越來越廣泛,很多內(nèi)容信息可能需要我們加以甄別。比如,我們怎么判斷和自己視頻連線的人是不是真人?中間層的數(shù)據(jù)安全領(lǐng)域也是一個機(jī)會。有一部英劇叫作《真相捕捉》,其實就在講AIGC帶來的數(shù)據(jù)安全、隱私安全以及真實性等方面的問題。
▲ 英劇《真相捕捉》海報。
圖片來源:豆瓣
如何建立自己的競爭壁壘?
陳石:還有個話題大家比較關(guān)心?,F(xiàn)在大模型占主導(dǎo)地位,圍繞著大模型的周邊應(yīng)用,其實在某種程度上都是被平等賦能。所以,我們?nèi)绾谓⒆约旱母偁幈趬荆?/p>
劉秋陽:今天很多人都在用大模型,其實沒有所謂的技術(shù)壁壘概念。我覺得比較重要的幾個事情,第一是工程。工程本身是一個壁壘,需要大量試錯。第二是在早期形成knowhow(專業(yè)知識)。knowhow可以節(jié)約很多時間,你早做一點,可能突出人家半年。第三,你要想辦法去驗證模型的有效性,比如提升效率是一個方面,另一個方面可能是改進(jìn)商業(yè)模式。此外,你還需要去驗證模型有效性的方法本身,是不是真實有效的。
陳石:AI 確實在平等賦能,大家在同一個起跑線上。所以最后可能還是要把我們的壁壘建設(shè)在基于行業(yè)的knowhow和場景里。
阿立:我覺得這一輪AI 應(yīng)用的創(chuàng)業(yè)機(jī)會里,壁壘可能來自于你的路線選擇。如果僅僅是做了一層很薄的基于通用的大模型,來做單一維度的應(yīng)用創(chuàng)新,壁壘會比較低。就我們自己而言,BodyPark 目前更傾向于做垂直的,端到端的技術(shù)和工程的產(chǎn)品整合,會用到不同的技術(shù)棧。
對我們而言,人體關(guān)鍵點識別的引擎、虛擬教練跟用戶的多模態(tài)交互的中間件和應(yīng)用層,一定要牢牢掌握在我們自己手里。但我們也會主動擁抱新技術(shù),比如像ChatGPT、文心一言這樣的一些新的基礎(chǔ)設(shè)施,我們一定會open地接入。
在一個行業(yè)變革的早期,在共識沒有形成的時間點,做垂直的整合(Vertical Integration),會相對比較容易交付產(chǎn)品,把現(xiàn)金營收做起來,同時持續(xù)構(gòu)建壁壘。
陳石:總結(jié)來看,基于垂直行業(yè)的創(chuàng)業(yè),AI 本身可能還形成不了太多的壁壘,真正的壁壘還是在場景、商業(yè)模式、用戶規(guī)模、行業(yè)knowhow里頭。仍然是:“技術(shù)為先,場景為重?!弊罱K還是要有自己的業(yè)務(wù)縱深和場景壁壘。
垂直賽道有沒有必要 自己做AI大模型?
陳石:有個話題不少創(chuàng)業(yè)者比較關(guān)心,目前市場上有不少大模型,在垂直領(lǐng)域的創(chuàng)業(yè)者,未來需要自己做模型嗎,還是用已有的模型就好?
劉秋陽:長期看,肯定是要自己做的。對于我們這種應(yīng)用層的公司來講,路程其實比較長,需要大量的積累。首先要積累一種方式來驗證你模型的有效性,還要再有一個方法,來檢驗?zāi)阒膀炞C的方法本身是不是有效的。走到比較遠(yuǎn)的時候,才有辦法建立自己的大模型。
對于我們來說,大模型是為了應(yīng)用本身服務(wù)的,它不是服務(wù)于所有通用的場景。我還是希望它最終能夠驗證商業(yè)價值,而不僅僅是對話價值。但我們也不知道,未來GPT會發(fā)展到什么樣。
吳春松:短期內(nèi)我們不會有這層考慮。我們會更聚焦在應(yīng)用層,做深做透。AI 創(chuàng)業(yè)生態(tài)里,底層大模型公司跟上層應(yīng)用公司之間分工跟協(xié)作,可能形成新的公約,比如哪些地方應(yīng)該應(yīng)用端來做,哪些地方應(yīng)該底層的巨頭或者新興的公司來做。
在我眼里,大模型是新時代的水電煤。我們可能更關(guān)注的是如何用好新基建。以新能源車行業(yè)舉例,我們可能更像是造車新勢力的角色,而不是新能源電池廠商的角色。我們要考慮的是產(chǎn)品服務(wù)的是什么樣的群體,我們做什么樣的產(chǎn)品去服務(wù)好客戶?我們也盡可能地做到不依賴某一類“電池”,不能被一家大模型全部“鎖死”。以后AIGC生態(tài)里,可能會形成類似新能源車與電池廠商這樣的協(xié)作關(guān)系。
本文(含圖片)為合作媒體授權(quán)創(chuàng)業(yè)邦轉(zhuǎn)載,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。