8月30日,由創(chuàng)業(yè)邦主辦的2023AIGC技術(shù)應(yīng)用大會(huì)在深圳舉行。本屆大會(huì)以“元載萬(wàn)物·智啟新界”為主題,旨在聚焦AIGC技術(shù)的創(chuàng)新應(yīng)用,打造深入探索AIGC產(chǎn)業(yè)落地的交流平臺(tái)。
會(huì)上,無(wú)界AI聯(lián)合創(chuàng)始人馬千里、生數(shù)科技首席執(zhí)行官唐家渝、登臨科技聯(lián)合創(chuàng)始人兼首席架構(gòu)師王平進(jìn)行了一場(chǎng)名為《應(yīng)對(duì)策略—AIGC重塑百業(yè)千行,企業(yè)升級(jí)如何借勢(shì)》的圓桌對(duì)話,圓桌對(duì)話由BV百度風(fēng)投AI應(yīng)用賽道負(fù)責(zé)人溫永騰主持。精彩觀點(diǎn)如下:
馬千里:未來(lái)可能算法推薦不是特別重要了,算法創(chuàng)造變得特別重要,大家看的內(nèi)容不是算法給你推薦的,而是算法時(shí)時(shí)刻刻給你創(chuàng)造的。
唐家渝:未來(lái)AIGC會(huì)普惠到每個(gè)人的生活中,圖像、視頻等信息表達(dá)將變得像打字、刷短視頻一樣簡(jiǎn)單,我們自然而然地就能開(kāi)展創(chuàng)造、編輯等工作,極大提升每個(gè)人的信息交互效率和創(chuàng)造力。
王平:國(guó)內(nèi)的企業(yè)越來(lái)越難拿到美國(guó)的高端芯片,在這樣的大背景下,本土化的算力需求肯定會(huì)越來(lái)越多。
溫永騰:生成式AI落地或?qū)?lái)生產(chǎn)方式與交互方式的變化,這其中蘊(yùn)藏著許多重塑、增強(qiáng),甚至是顛覆傳統(tǒng)應(yīng)用的機(jī)會(huì)。
以下為對(duì)話內(nèi)容,由創(chuàng)業(yè)邦整理:
溫永騰:第一個(gè)問(wèn)題想請(qǐng)教一下無(wú)界的馬總,是否可以跟我們分享一下,無(wú)界是如何利用AIGC技術(shù)去為各種不同的行業(yè)提供個(gè)性化的內(nèi)容解決方案,幫助企業(yè)去升級(jí)他們的內(nèi)容創(chuàng)作。
馬千里:各行各業(yè)他們?nèi)ビ肁IGC的時(shí)候有一個(gè)很大的瓶頸問(wèn)題,就是他們要么有場(chǎng)景但是沒(méi)有算力,要么沒(méi)有專(zhuān)業(yè)的團(tuán)隊(duì),要么沒(méi)有把數(shù)據(jù)去歸集起來(lái),去做相關(guān)的行業(yè)應(yīng)用。我們?cè)诤虰端合作的時(shí)候,會(huì)由輕到重和他們做應(yīng)用的合作。AIGC最輕的一個(gè)結(jié)合我們認(rèn)為是營(yíng)銷(xiāo)的結(jié)合,因?yàn)槿魏蜝端的企業(yè)都需要營(yíng)銷(xiāo),他們會(huì)發(fā)現(xiàn)AIGC是一種非常容易觸達(dá)到C端的營(yíng)銷(xiāo)工具。稍微重一點(diǎn)的應(yīng)用行業(yè)結(jié)合是利用我們的現(xiàn)實(shí)能力,比如說(shuō)你有場(chǎng)景但是沒(méi)有算力,那直接使用我們的接口服務(wù)就行了。所以B端的企業(yè)在去做AIGC的時(shí)候,不用著急去采購(gòu)很貴的服務(wù)器,可以先看看市面上的解決方案。最深的一層合作就是對(duì)于AIGC行業(yè)有產(chǎn)業(yè)認(rèn)知。比如說(shuō)我就知道我的行業(yè)有什么痛點(diǎn),我要做一個(gè)什么樣的行業(yè)模型,然后我用模型的方案去解決它,這種合作我們也有一些。
溫永騰:好,謝謝馬總。接下來(lái)我想問(wèn)一下生數(shù)科技的唐總,現(xiàn)在我們都比較堅(jiān)信底層模型是往多模態(tài)方向發(fā)展,我知道生數(shù)科技在整個(gè)多模態(tài)的生成式大模型上有非常好的積累。唐總能不能今天跟大家分享一下,我們?nèi)绾?/strong>將多模態(tài)的生成式大模型應(yīng)用在不同的領(lǐng)域,并且去促進(jìn)這些領(lǐng)域的內(nèi)容的創(chuàng)新和升級(jí)。
唐家渝:剛剛馬總從不同合作的深度出發(fā)去講產(chǎn)業(yè)化落地。因?yàn)槲覀冏龆嗄B(tài)模型,所以我們就從不同模態(tài)的維度去聊一下這個(gè)事情。
就圖像生成來(lái)說(shuō),目前已經(jīng)有比較多的產(chǎn)品應(yīng)用推出。整體上看,目前生成的圖片在畫(huà)面細(xì)致程度和美觀度方面已經(jīng)做得比較好,但相對(duì)而言可控性還比較差,所謂可控性就是說(shuō)如何將用戶(hù)腦海里所想的畫(huà)面準(zhǔn)確地生成出來(lái)。目前用戶(hù)在使用圖像生成的時(shí)候,會(huì)結(jié)合現(xiàn)有技術(shù)成熟度的特點(diǎn),將它的優(yōu)點(diǎn)發(fā)揮在比較擅長(zhǎng)的領(lǐng)域。比如游戲美術(shù)領(lǐng)域,因?yàn)樯傻目煽匦员容^差,所以去做精細(xì)的道具設(shè)計(jì)、人物設(shè)計(jì)還是比較困難的,但可以用它來(lái)做主美術(shù)風(fēng)格的設(shè)計(jì),設(shè)定游戲整體的視覺(jué)風(fēng)格。這是游戲開(kāi)發(fā)非常核心的一環(huán),傳統(tǒng)做法需要原畫(huà)師花一到兩個(gè)月的時(shí)間不斷打磨。現(xiàn)在利用生成技術(shù),可以快速生成大量的概念圖,從中挑選風(fēng)格契合的圖像,再在這個(gè)基礎(chǔ)去調(diào)整,這樣一周左右就可以確定一個(gè)主美術(shù)風(fēng)格,大大提升了開(kāi)發(fā)效率。
3D方面最核心的就是如何快速創(chuàng)建3D資產(chǎn)?,F(xiàn)在我們能做到通過(guò)輸入一段描述或者是輸入一個(gè)單視圖或多視圖,自動(dòng)化地創(chuàng)建出3D模型。目前,我們團(tuán)隊(duì)生成的3D模型在分辨率、貼圖精細(xì)度等方面已經(jīng)做到業(yè)內(nèi)最好水平,但距離實(shí)際落地還有差距,還不能完全替代人工,所以目前更多是將它使用在精度要求沒(méi)那么高的場(chǎng)景中,比如游戲道具、背景等的生成。
還有視頻生成,目前業(yè)內(nèi)初步能夠?qū)崿F(xiàn)文生視頻、元素編輯和風(fēng)格轉(zhuǎn)換等能力,但生成的視頻在連續(xù)性、時(shí)長(zhǎng)、清晰度方面都還有待提升,所以更多還是使用在概念設(shè)計(jì)的初級(jí)階段,或者是更進(jìn)一步的分鏡設(shè)計(jì)階段。
除了上面提到的2B場(chǎng)景應(yīng)用,還有更普適的面向2C場(chǎng)景的應(yīng)用。多模態(tài)大模型的發(fā)展未來(lái)一定會(huì)大大降低內(nèi)容創(chuàng)作門(mén)檻。降低到什么程度?類(lèi)比來(lái)看,以前有打字機(jī)、打字員這樣的概念,但現(xiàn)在打字已經(jīng)是我們自然而言、隨時(shí)隨地都在做的一件事。未來(lái)AIGC會(huì)普惠到每個(gè)人的生活中,圖像、視頻等信息表達(dá)將變得像打字、刷短視頻一樣簡(jiǎn)單,我們自然而然地就能開(kāi)展創(chuàng)造、編輯等工作,極大提升每個(gè)人的信息交互效率和創(chuàng)造力。
溫永騰:謝謝唐總。唐總的分享讓我們感覺(jué)到多模態(tài)的進(jìn)展是非??斓?,我還是想再問(wèn)一下有關(guān)于比如說(shuō)生數(shù)科技在生態(tài),或者說(shuō)產(chǎn)業(yè)合作構(gòu)建上的想法,生數(shù)科技作為一個(gè)多模態(tài)的生成式底層模型的公司,是怎么跟這些合作方去構(gòu)建相關(guān)的生態(tài)和合作的關(guān)系。
唐家渝:我覺(jué)得,AIGC的發(fā)展離不開(kāi)“算法、算力、數(shù)據(jù)、場(chǎng)景”完整生態(tài)鏈的打造。以我們自身為例,作為具備底層研發(fā)能力的團(tuán)隊(duì),我們持續(xù)研發(fā)和優(yōu)化模型算法,但同時(shí)也在算力方面與硬件廠商開(kāi)展合作,以獲取更有性?xún)r(jià)比的計(jì)算資源。
在數(shù)據(jù)方面,我們也積極引入特定領(lǐng)域的優(yōu)質(zhì)數(shù)據(jù)。AI其實(shí)就像孩子一樣,需要讓他學(xué)各種各樣的東西,它才能去創(chuàng)造各種各樣的東西。比如在文生圖場(chǎng)景,我們會(huì)引入高質(zhì)量的美學(xué)數(shù)據(jù),讓模型去學(xué)到什么樣的圖是美的、為什么美等等,這樣它才能創(chuàng)作出同樣美的圖像。
另外從產(chǎn)品能力的維度,我們通過(guò)MaaS的形式與不同領(lǐng)域的服務(wù)機(jī)構(gòu)開(kāi)展垂直場(chǎng)景下的合作,將底層通用能力與行業(yè)know-how相結(jié)合,最大化的提升產(chǎn)品價(jià)值。
溫永騰:我想問(wèn)一下登臨的王總,我們都知道整個(gè)生成式大模型底座的核心還是算力,登臨在國(guó)內(nèi)是非常突出的通用GPU的玩家。我們想聽(tīng)聽(tīng),從您的角度,登臨是如何看待這樣一個(gè)機(jī)會(huì),以及如何發(fā)揮自己的產(chǎn)品和技術(shù)的優(yōu)勢(shì),為這些上游的公司賦能的。
王平:有以下幾個(gè)方面,目前行業(yè)進(jìn)入了算力熱潮的時(shí)代,算力非常緊張,企業(yè)對(duì)算力的需求非常迫切。那從登臨的角度,我們看到這是一個(gè)很大的機(jī)遇,這個(gè)機(jī)遇提供一個(gè)更好的、更便宜的算力。但這有一個(gè)前提是要解決通用性的問(wèn)題。對(duì)于AIGC的客戶(hù)來(lái)說(shuō),他們不僅僅是做一個(gè)文本生成圖片或者是其他解決方案,而是用戶(hù)能夠真正用起來(lái)的產(chǎn)品。這個(gè)產(chǎn)品可能會(huì)有一些傳統(tǒng)的模型甚至傳統(tǒng)的算法集成進(jìn)來(lái)。作為一個(gè)完整的方案,這個(gè)時(shí)候去移植其他的東西,用其他的架構(gòu)會(huì)非常痛苦,移植成本也非常高。
再基礎(chǔ)一點(diǎn),我們的客戶(hù)希望得到更好的、更具性?xún)r(jià)比的算力,這個(gè)本身也是登臨希望自身能夠帶給客戶(hù)的價(jià)值。我們?cè)贏I這方面有特別的優(yōu)化,可以有一個(gè)更高的性?xún)r(jià)比,一般來(lái)講就是對(duì)比國(guó)際主流通用GPU產(chǎn)品有2到3倍性能的一個(gè)能耗比的優(yōu)勢(shì)。尤其在大模型這個(gè)領(lǐng)域,我們也會(huì)有自己更有優(yōu)勢(shì)的地方。
我們還有一個(gè)很大的優(yōu)勢(shì)就是可以做單機(jī)大模型,有些客戶(hù)他對(duì)自己的數(shù)據(jù)比較敏感,單機(jī)的大模型在提高算力的同時(shí),能夠讓他自己在本地就可以完成使用。
溫永騰:我也想再追問(wèn)一個(gè)問(wèn)題,因?yàn)楝F(xiàn)在芯片缺貨還是比較嚴(yán)重的。那對(duì)未來(lái)比如說(shuō)2到3年內(nèi)芯片供應(yīng)情況,或者說(shuō)芯片格局,您有一些看法可以跟我們分享一下嗎?
王平:如果從供應(yīng)情況的基本面來(lái)講就牽扯一個(gè)國(guó)際關(guān)系—中美關(guān)系了。咱們國(guó)內(nèi)的企業(yè)越來(lái)越難拿到美國(guó)的高端芯片,坦白地說(shuō),我個(gè)人認(rèn)為國(guó)內(nèi)沒(méi)有哪家企業(yè)生產(chǎn)的芯片能夠真正替代美國(guó)高端芯片。但也是在這樣的大背景下,我相信國(guó)產(chǎn)的算力肯定是會(huì)越來(lái)越多。芯片是一定要迭代的,大家使用國(guó)產(chǎn)算力越多,客戶(hù)前場(chǎng)的問(wèn)題才能夠反饋,我們?cè)诤罄m(xù)迭代中才能夠改進(jìn),提升使用體驗(yàn)。
溫永騰:好,感謝王總。那我們進(jìn)入下一個(gè)問(wèn)題。我們看到無(wú)論是底層模型,還是上層的Rola,還有各種工具鏈,都有很快的進(jìn)展。那三位嘉賓是否可以在各自的領(lǐng)域去展望一下未來(lái)技術(shù)的發(fā)展方向。
馬千里:首先我認(rèn)為非常有意思的東西仍會(huì)出現(xiàn),AIGC的生產(chǎn)量很大,它對(duì)UGC的替代會(huì)是一個(gè)非常碾壓性的事情。而與此相對(duì)應(yīng),剛才提到了算力這一塊,我們無(wú)比希望摩爾定律持續(xù)地發(fā)揮作用,算力會(huì)持續(xù)地去擴(kuò)張。還有一個(gè)點(diǎn)就是模型也在去做小型化,每個(gè)人未來(lái)都可能會(huì)有一個(gè)模型在自己的手機(jī)里。
結(jié)合這三個(gè)點(diǎn),一個(gè)是算力,一個(gè)是模型的小型化,再有一個(gè)就是AIGC生產(chǎn)量的極度擴(kuò)張。那未來(lái)可能會(huì)產(chǎn)生這樣一個(gè)場(chǎng)景,就是以后可能算法推薦不是特別重要了,算法創(chuàng)造變得特別重要,大家以后每天去看的內(nèi)容,不是算法給你推薦的,而是算法時(shí)時(shí)刻刻給你創(chuàng)造的。
回到一個(gè)和我們產(chǎn)業(yè)息息相關(guān)的觀點(diǎn),未來(lái)可能技術(shù)競(jìng)爭(zhēng)都變得不是特別重要,而是生態(tài)競(jìng)爭(zhēng)會(huì)變得非常重要,就是你的一個(gè)模型和另外一個(gè)模型之間可能不會(huì)有特別強(qiáng)的差距,但是有很多人在你這個(gè)模型之上去做研發(fā),那么它的生態(tài)會(huì)長(zhǎng)得很大,哪怕有另外一個(gè)做模型的公司也都干不過(guò)它,所以生態(tài)會(huì)是更重要的事情。
唐家渝:我覺(jué)得未來(lái)的技術(shù)變革將主要發(fā)生在兩方面,一是信息,二是能耗。
信息這一塊是指需要實(shí)現(xiàn)更高效的信息流通。真實(shí)世界中,人類(lèi)無(wú)論是在數(shù)字世界交互還是物理世界交互,信息都是多模態(tài)的,基于一個(gè)大腦同時(shí)處理不同模態(tài)信息。所以,AI的未來(lái)發(fā)展也必然是多模態(tài)融合,在統(tǒng)一化的架構(gòu)下實(shí)現(xiàn)多模態(tài)輸入與多模態(tài)輸出,這對(duì)信息的處理是最高效、最準(zhǔn)確的。
但在技術(shù)層面還存在非常多的難點(diǎn),比如說(shuō)多模態(tài)的信息如何去有效地進(jìn)行統(tǒng)一表示。目前常見(jiàn)的方式是把各種信息用一個(gè)個(gè)序列化的形式去表示,對(duì)于像圖像或者視頻這種多維的模態(tài),這實(shí)際上天然地破壞掉了數(shù)據(jù)結(jié)構(gòu)。如果對(duì)信息的表示是不充分的,那么模型學(xué)習(xí)到的知識(shí)也是不充分的。另外還包括如何有效提取到不同模態(tài)數(shù)據(jù)的特征與隱含信息、如何設(shè)計(jì)高效統(tǒng)一的架構(gòu)等等難題,目前我們團(tuán)隊(duì)正在進(jìn)行一系列攻關(guān)并取得了很好的進(jìn)展。
另外就是能耗層面。人是一個(gè)典型的“低能耗、高智能”的智能體,只靠攝入簡(jiǎn)單的食物就能涌現(xiàn)非常高的智能。未來(lái)AI技術(shù)的發(fā)展也需要去實(shí)現(xiàn)利用更少的能源、產(chǎn)生更大的智能化。我們?cè)谶@方面也做了相關(guān)工作,在數(shù)月內(nèi)實(shí)現(xiàn)了大模型訓(xùn)練速度數(shù)十倍的提升,同時(shí)也正開(kāi)展一系列部署優(yōu)化工作,讓大模型能夠在移動(dòng)端上運(yùn)行,實(shí)現(xiàn)從云端到本地智能化的演進(jìn)。
王平:從技術(shù)路線上來(lái)說(shuō),我們更多地是在這個(gè)潮流下去優(yōu)化我們的微架構(gòu),使用更新的工具或者是通過(guò)互聯(lián)之類(lèi)的來(lái)提升我們能力,從而更好地服務(wù)客戶(hù)。
另外一點(diǎn)剛才唐總也提到,我們還要有合作。在底層上,在不丟失精度的情況下,大家做一些合作,可以有效地降低延遲,或者是提高吞吐率,解決客戶(hù)的真實(shí)問(wèn)題。就像一開(kāi)始神經(jīng)網(wǎng)絡(luò)的模型出來(lái)的時(shí)候,它對(duì)算力要求也很高,但很多都是無(wú)用算力。經(jīng)過(guò)幾年的演變以后,它的精度和之前是一樣的,甚至更好,但它的算力需求降低了很多。這其實(shí)是應(yīng)用側(cè)大家共同合作的結(jié)果。我相信未來(lái)在算法層上會(huì)有很多很多這樣一個(gè)往下走的過(guò)程,在這個(gè)過(guò)程中我也希望大家能夠合作,為客戶(hù)創(chuàng)造更大的價(jià)值。
溫永騰:最后回到今天的話題,我們也想分享一下關(guān)于生成式AI落地的一些看法。
我覺(jué)得這里有兩個(gè)比較大的變化。第一個(gè)是整個(gè)生產(chǎn)方式的變化,因?yàn)檎Z(yǔ)言模型和生成式模型的出現(xiàn),各行各業(yè)的整個(gè)業(yè)務(wù)流產(chǎn)生了很大的變化。以應(yīng)用開(kāi)發(fā)為例,雖然前端、后端、數(shù)據(jù)庫(kù)依然重要,但我們不可否認(rèn),模型的重要性還是大大增加了了,因其使基于底層模型進(jìn)行產(chǎn)品開(kāi)發(fā)的門(mén)檻大幅降低。這不僅可以?xún)?yōu)化和改變傳統(tǒng)的開(kāi)發(fā)流程,也為下一代算力芯片、開(kāi)發(fā)平臺(tái)和應(yīng)用市場(chǎng)創(chuàng)造了新的機(jī)會(huì)。
其次,是用戶(hù)交互方式的革新。過(guò)去,我們總是先預(yù)設(shè)用戶(hù)如何使用產(chǎn)品,然后再設(shè)計(jì)相應(yīng)的交互流程。而現(xiàn)在,以Language User Interface(語(yǔ)言用戶(hù)界面)為核心,我們開(kāi)始有機(jī)會(huì)為用戶(hù)的每一次新的需求直接構(gòu)建或鏈接內(nèi)容與服務(wù),這里我們發(fā)現(xiàn)還有大量未被充分挖掘的應(yīng)用場(chǎng)景。這種變化為重塑、增強(qiáng)乃至顛覆傳統(tǒng)應(yīng)用提供了大量的機(jī)會(huì),也是我們BV百度風(fēng)投一直在尋找和探索的方向。
更多活動(dòng)大會(huì)一手信息,歡迎加入創(chuàng)業(yè)邦會(huì)員,現(xiàn)場(chǎng)聆聽(tīng)一線投資人、頭部企業(yè)家精彩分享,掌握最新創(chuàng)投趨勢(shì)!