五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

如何理解“大模型時(shí)代”的狂飆趨勢(shì)?

支撐大模型運(yùn)作的要素是什么?

0277bfb350ea2f2c151ec7a25d854c6.jpg

后疫情時(shí)代,虛擬場(chǎng)景的運(yùn)用頻率顯著增加,尤其是演唱會(huì)和發(fā)布會(huì)等大型活動(dòng)。虛擬場(chǎng)景由重新建模的虛擬畫(huà)面組合而成,可以讓表演者在任何環(huán)境下演出。

如果說(shuō)在過(guò)去的半年中,全球的科技行業(yè)中有什么風(fēng)口是如同乘上了火箭速度般一騎絕塵的,那么非「大模型」莫屬了。

創(chuàng)業(yè)者們已經(jīng)站在了集合的十字路口。拋開(kāi)他們的上一個(gè)身份——比如,從業(yè)幾十年的相關(guān)科學(xué)家、剛剛離開(kāi)象牙塔的博士、各大互聯(lián)網(wǎng)巨頭的技術(shù)業(yè)務(wù)負(fù)責(zé)人,如今他們的身份都是:大模型創(chuàng)業(yè)者。

大模型創(chuàng)業(yè)賽道似乎已經(jīng)迎來(lái)新一波「群星閃耀時(shí)」。大模型奠基之作、也就是Transformer論文的八位作者,到2023年7月,已經(jīng)全部都離開(kāi)了谷歌,選擇自立門戶投身創(chuàng)業(yè)——并且基本是一離開(kāi)谷歌就能拿到頂級(jí)投資者的支持。中國(guó)的大模型創(chuàng)業(yè)名單里還有不少明星創(chuàng)業(yè)者的公司,比如創(chuàng)業(yè)工場(chǎng)CEO李開(kāi)復(fù)在年初上線的公司「零一萬(wàn)物」,前搜狗CEO王小川的「百川智能」,前京東AI掌門人周伯文的「銜遠(yuǎn)科技」等等。

大模型狂飆的背后,我們要如何理解它短期內(nèi)產(chǎn)生的熱度,和長(zhǎng)期可能帶來(lái)的影響?支撐大模型運(yùn)作的要素是什么?而在大模型創(chuàng)業(yè)潮似乎席卷了每個(gè)科技從業(yè)者的當(dāng)下,站在不同視角的投資人和創(chuàng)業(yè)者,他們又是如何理解這一趨勢(shì)的?

AI與大模型的進(jìn)化歷程


f523a5c79da3538cc66f3c4480cdfd6.jpg

我們今天之所以會(huì)對(duì)大模型感到振奮,一方面是因?yàn)檎Z(yǔ)言大模型所展現(xiàn)出來(lái)的表達(dá)能力、知識(shí)容量以及提煉能力讓很多人嘆為觀止,另一方面是因?yàn)樵趫D像生成和一些素材創(chuàng)造方面,大模型正逐步釋放大量生產(chǎn)力。所以如果簡(jiǎn)單來(lái)說(shuō)我們?nèi)绾慰创竽P?,我認(rèn)為它給了全行業(yè)甚至是整個(gè)人類文明一個(gè)很重要的信號(hào),就是這條路線具有長(zhǎng)期且深遠(yuǎn)的價(jià)值和產(chǎn)出潛力。

這是投資人羅超。他用「振奮」這個(gè)詞來(lái)形容大模型給他帶來(lái)的震動(dòng),事實(shí)上,這也成為了科技行業(yè)大多數(shù)人的普遍認(rèn)知——圍繞大模型展開(kāi)的角逐早已達(dá)到白熱化的程度。

盡管時(shí)至如今,大模型這個(gè)概念正在逐漸祛魅,市場(chǎng)也逐漸回歸理性,但國(guó)內(nèi)外的大廠與創(chuàng)業(yè)者仍然沒(méi)有放棄追逐風(fēng)口。Meta、華為、京東、科大訊飛、字節(jié)等公司都持續(xù)有大模型研發(fā)的新動(dòng)態(tài),而回歸「大模型」的價(jià)值本身,在流量與資本紅利之外,人們更看重的,或許就是羅超說(shuō)的——它給全行業(yè)乃至整個(gè)人類文明的重要信號(hào),這條路線本身是有長(zhǎng)遠(yuǎn)價(jià)值輸出的。

讓我們回到大模型誕生之初,把它放到一個(gè)更大的范疇里看——也就是AI。

最早不被看好的OpenAI通過(guò)ChatGPT的成功把大模型的訓(xùn)練成果帶入大眾眼前,而創(chuàng)始人Sam Altman曾經(jīng)說(shuō),如果你覺(jué)得你已經(jīng)懂了AI對(duì)人類社會(huì)帶來(lái)的影響,那你大概率是沒(méi)懂,而且需要再更多地研究一下。如果你覺(jué)得你已經(jīng)搞不懂AI了,那你才是真的懂了。

這背后對(duì)應(yīng)的一件事或許是,作為AI應(yīng)用分支的大模型,它所涌現(xiàn)出的能力遠(yuǎn)遠(yuǎn)超出人們對(duì)它的常規(guī)預(yù)期,而未來(lái)甚至可能超出更多。新一代的AI可以說(shuō)是「任何人都能以最低的門檻使用它們以提高生產(chǎn)力,或者完成創(chuàng)作」。

那么,這種能提高生產(chǎn)力的新一代AI是如何一步步走到今天的?

我們都知道最早的AI概念是上個(gè)世紀(jì)由圖靈提出的,同時(shí)代的另一位科學(xué)家馮·諾依曼提出了一套電子計(jì)算機(jī)通用架構(gòu),可以說(shuō)是現(xiàn)代意義上的AI雛形,這套架構(gòu)也沿用了幾乎七十年。

此后的劃時(shí)代事件是1997年,當(dāng)時(shí)IBM的機(jī)器人深藍(lán)打敗了國(guó)際象棋冠軍卡斯帕羅夫,在全球范圍內(nèi)引起了轟動(dòng);不過(guò)當(dāng)時(shí)的AI是基于logic也就是「邏輯」的——簡(jiǎn)單來(lái)說(shuō),當(dāng)時(shí)的電腦遵循的基本是“If...then”的邏輯,人類給計(jì)算機(jī)輸入大量的規(guī)則和邏輯,計(jì)算機(jī)在面對(duì)問(wèn)題的時(shí)候,根據(jù)設(shè)定好的邏輯法則,檢索知識(shí)庫(kù)或是推演來(lái)找到答案。本質(zhì)上,機(jī)器并不具有自主學(xué)習(xí)的能力,而且人類能夠?yàn)闄C(jī)器輸入的邏輯法則是有限的,也無(wú)法做到無(wú)限地窮舉所有可能性。

在這之后,「機(jī)器學(xué)習(xí)」和「深度學(xué)習(xí)」的概念出現(xiàn)了,但更多是落在研究層面的。真正迎來(lái)爆發(fā)之前,業(yè)內(nèi)經(jīng)歷了大大小小的眾多突破性時(shí)間點(diǎn)——比如2006年,英偉達(dá)推出了革命性的統(tǒng)一編程軟件CUDA,降低了GPU的應(yīng)用門檻;2009年,斯坦福的計(jì)算機(jī)科學(xué)家創(chuàng)建了ImageNet,用于訓(xùn)練計(jì)算機(jī)視覺(jué)算法。

深度學(xué)習(xí)的真正爆發(fā)是2012年。這一年的關(guān)鍵詞是名為AlexNet的深度神經(jīng)網(wǎng)絡(luò)。當(dāng)年的大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽上,獲勝的冠軍第一次使用了這種深度學(xué)習(xí)架構(gòu),圖像識(shí)別正確率達(dá)到了84%。對(duì)于大眾來(lái)說(shuō)這意味著什么呢?——當(dāng)今我們已經(jīng)習(xí)以為常的圖像搜索、看圖識(shí)別等功能,某種意義上就是由AlexNet奠定了基礎(chǔ)。所以如果我們回看2012年的《紐約時(shí)報(bào)》,11年前的主流媒體才剛開(kāi)始為「機(jī)器也能夠精準(zhǔn)識(shí)別圖片」這件事感到驚嘆。

2012年后,包括計(jì)算機(jī)視覺(jué)在內(nèi),還有語(yǔ)音識(shí)別、自然語(yǔ)言識(shí)別,這類「識(shí)別型AI」一度風(fēng)頭無(wú)兩,且被寄予厚望。但在2019年,AI繁榮一度戛然而止——當(dāng)年的AI融資金額比起2018年幾乎縮水了一個(gè)0,AI初創(chuàng)企業(yè)的數(shù)量也大幅縮水。當(dāng)時(shí)的一個(gè)門檻就在于,識(shí)別性AI大多采用的是專門為特定任務(wù)訓(xùn)練的小模型,但它很難在更大范圍內(nèi)解決多個(gè)不同的問(wèn)題。在落地應(yīng)用時(shí)就帶來(lái)了問(wèn)題:沒(méi)有通用型的AI,一個(gè)需求需要定制不止一個(gè)AI,而這么做成本太高了。

而且你大概會(huì)有同感:早期的AI好像多少有點(diǎn)不太聰明,有時(shí)甚至它的回答方式,文不對(duì)題中還帶著點(diǎn)油膩。一直到——ChatGPT橫空出世。

a8ddf4319340ce5b03fb9e248fd217a.jpg

上一代產(chǎn)品之所以會(huì)采用俏皮的態(tài)度來(lái)回答用戶的問(wèn)題,是出于產(chǎn)品形式上的需要。因當(dāng)時(shí)的技術(shù)還做不到對(duì)所有問(wèn)題都給出正確的答案,這是只有模型達(dá)到一定規(guī)模后才能去做到的事情,既然做不到,那么就要在產(chǎn)品形式上采取一種更容易被用戶接受的方式,比如俏皮或油膩,以掩蓋模型在能力上的不足。

因此這是產(chǎn)品選擇而非故意如此,這樣用戶可能會(huì)把它看成小孩,而大人對(duì)小孩總是寬容一些。如果它一本正經(jīng)地回答,你會(huì)覺(jué)得不行,相反它用這種語(yǔ)調(diào)來(lái)回答的時(shí)候,你會(huì)感覺(jué)還可以,好像它能理解你的意思,這都是之前技術(shù)的限制。

為什么大模型這個(gè)概念特別火?我覺(jué)得是因?yàn)镃hatGPT這樣的產(chǎn)品使人們真切感受到大模型在體驗(yàn)上已經(jīng)具備智能。我們并不認(rèn)為AlphaGo具備思考能力,對(duì)于圍棋的任何一個(gè)局面,它都能很快地計(jì)算出勝率,即這樣走下去以后獲勝的概率是多少,但它只是按照傳統(tǒng)的辦法查看后續(xù)幾步然后找一個(gè)勝率最高的走法,而人類對(duì)于勝率的判斷可能沒(méi)有它準(zhǔn)確,因此在水平上存在明顯差距。

與此相比,我們認(rèn)為ChatGPT具備智力,因?yàn)樗宫F(xiàn)出推理能力,能夠按照有條理的思維邏輯逐步回答問(wèn)題,甚至能夠糾正用戶的錯(cuò)誤,這些都表現(xiàn)為一種智力,與AlphaGo的表現(xiàn)完全不同。

這是徐串。架構(gòu)師出身的他,在2022年成立了一家初創(chuàng)公司,專注于人工智能平臺(tái)的研發(fā)。在他看來(lái),在參數(shù)達(dá)到一定程度、用了最基本的訓(xùn)練之后,大模型自己本身已經(jīng)具備了問(wèn)答的能力,而人類要做的是「如何把它激發(fā)出來(lái)」。


a8ddf4319340ce5b03fb9e248fd217a.jpg

模型已經(jīng)存儲(chǔ)了許多知識(shí),但人類語(yǔ)言表達(dá)相對(duì)復(fù)雜,需要通過(guò)instruction來(lái)訓(xùn)練模型。比如寫好問(wèn)題后,應(yīng)該這么回答,應(yīng)該分步驟,怎么用思維鏈的方式,這些都要全部輸入進(jìn)去,訓(xùn)練以后,它就自然地涌現(xiàn)出了這樣的能力。

目前真正要做出一個(gè)這樣的大模型,可能門票是10億人民幣。然后能不能做出來(lái),還要看這方面的經(jīng)驗(yàn)之類的,因?yàn)樵谟?xùn)練模型的過(guò)程中會(huì)遇到很多的問(wèn)題,就像有時(shí)候不收斂,有時(shí)候崩了,突然開(kāi)始胡說(shuō)八道了,怎么樣訓(xùn)練,怎么樣讓它在各種反饋上更像人類的思考方式,這需要很細(xì)致的工作,沒(méi)辦法一下子就突破。因此,當(dāng)前模型之間的差距主要在于時(shí)間積累,就像谷歌、OpenAI做的東西讓人感覺(jué)有智能,但其他的公司總覺(jué)得有點(diǎn)差距,就是因?yàn)檫@方面的積累還不夠。

他所說(shuō)的「時(shí)間積累」,背后的另一層含義是——你需要有足夠的資金與人力來(lái)支撐模型的訓(xùn)練與技術(shù)革新,而這一周期或許是相當(dāng)漫長(zhǎng)的、且投入產(chǎn)出比并不確定。OpenAI的成功遠(yuǎn)遠(yuǎn)不是「天時(shí)地利人和」,GPT也不是突然達(dá)到今天的水平的;在ChatGPT引爆全球之前,OpenAI也經(jīng)歷了GPT-1、GPT-2的蟄伏期,但關(guān)鍵的是,他們?cè)敢馔度胭Y金為創(chuàng)新的邊界買單——即使它成功的概率可能只有1%。

另一方面,要讓機(jī)器能夠處理復(fù)雜的文本,達(dá)到甚至超越人類智慧的水平——資金量、算法、算力和數(shù)據(jù)規(guī)模都至關(guān)重要。這也就是業(yè)內(nèi)常常說(shuō)的,算力、算法和數(shù)據(jù)是做好大模型的三要素。

從算力角度來(lái)看,大模型對(duì)訓(xùn)練算力需求非常高,ChatGPT的公開(kāi)數(shù)據(jù)顯示,它的整個(gè)訓(xùn)練算力消耗如果折算成時(shí)間,按照每秒計(jì)算一千萬(wàn)億次來(lái)算,也需要計(jì)算3640天。而算力的相關(guān)設(shè)備就是GPU芯片,行業(yè)內(nèi)有人估算,ChatGPT硬件需求的最低門檻是1萬(wàn)塊英偉達(dá)的A100芯片,算力的硬件投資規(guī)模達(dá)到10億人民幣。

而算法拼的是人才,它背后的本質(zhì)要求也是資本——當(dāng)公司擁有了足夠大的體量,才有可能匯集更多優(yōu)秀人才去為大模型服務(wù)。

f523a5c79da3538cc66f3c4480cdfd6.jpg

今天要做好一個(gè)真正意義上的通用大模型,所需要的前期投入成本是非常高的,可能幾千萬(wàn)美金只是一個(gè)入場(chǎng)券而已。這三件事情背后所對(duì)應(yīng)的,就是你是否有足夠的資金量、是否有足夠的底層的科研人才和算法人才,以及是否有對(duì)應(yīng)的場(chǎng)景所需要的數(shù)據(jù),Know-How這些東西,來(lái)幫助你去完成好一個(gè)更完整的產(chǎn)品。

但在算力這件事情上,越有錢就越能夠掌握更多算力,更能支撐起這么大的算力去做,所以它是傾向于更集中。算法這件事情,其實(shí)全球目前來(lái)看,雖然還是有一些小的細(xì)微差別,但是在大模型這件事情上,大家的認(rèn)知和算法的起點(diǎn)是高度一致的。在這種情況下,算法上其實(shí)拼的是人才,而人才又會(huì)傾向于集中,因?yàn)槔碚撋显蕉嗟膬?yōu)秀人才聚在一起去為一個(gè)大模型服務(wù),產(chǎn)生的效能一定是很高的。

大模型是只有巨頭才有入場(chǎng)券的游戲嗎?

對(duì)資本的要求,多少?zèng)Q定了我們?nèi)缃窨吹降拇竽P唾惖赖臒狒[,大多都是巨頭的狂歡。

大模型這個(gè)市場(chǎng)似乎容不下太多的公司——初創(chuàng)企業(yè)在入局大模型的時(shí)候,多少會(huì)考慮投入產(chǎn)出比。晚點(diǎn)的報(bào)道里提到,在ChatGPT教育中國(guó)市場(chǎng)以前,創(chuàng)業(yè)公司算力資源有限,注定向投入產(chǎn)出比更高的主營(yíng)業(yè)務(wù)傾斜,投資界的關(guān)注點(diǎn)更集中于應(yīng)用,而不是底層的大模型。而最早的企業(yè)客戶也是猶疑的態(tài)度:你做大模型,但我們用不起。


9919889754eb272a88c30ab87f3d861.jpg

基礎(chǔ)性大模型在當(dāng)前階段一定是一個(gè)非常燒錢的生意。我看到一組OpenAI的數(shù)字,包括數(shù)據(jù)中心和整體模型投入,成本大約為440億美元,再加上人工等成本,訓(xùn)練這一模型需要巨額資金。同時(shí)全球各地的用戶提問(wèn)會(huì)導(dǎo)致model serving成本上升,因?yàn)槊看翁釂?wèn)都需要調(diào)用算力進(jìn)行計(jì)算,成本相應(yīng)增加。但是隨著時(shí)間推移,問(wèn)題可能會(huì)呈現(xiàn)收斂,如果通過(guò)把一部分的結(jié)果緩存的方式,成本、開(kāi)銷應(yīng)該會(huì)有壓縮和下降的拐點(diǎn),但這個(gè)拐點(diǎn)現(xiàn)在有沒(méi)有到,我還不太清楚。

這是堵俊平,同為AI賽道創(chuàng)業(yè)者的他此前主要從事的是開(kāi)源相關(guān)的工作。在他看來(lái),大模型燒錢,未來(lái)勢(shì)必會(huì)走向集中,但這并不意味著容不下更多入局者。基礎(chǔ)性的大模型,或者說(shuō)通用大模型,或許更多是巨頭的游戲;但是當(dāng)模型面向行業(yè)、面向應(yīng)用,也會(huì)誕生一些結(jié)合行業(yè)的、趨向中型的模型,也就是垂直領(lǐng)域模型。

9919889754eb272a88c30ab87f3d861.jpg

在這個(gè)領(lǐng)域里有很多新的機(jī)會(huì)出現(xiàn)了,很多公司,包括一些初創(chuàng)企業(yè)會(huì)往這個(gè)方向在走,一方面做自己行業(yè)的模型、應(yīng)用的模型,另外一方面想通過(guò)模型構(gòu)建競(jìng)爭(zhēng)壁壘,所以在很多個(gè)行業(yè)其實(shí)都存在著被顛覆的可能。

OpenAI在做的通用大模型仰賴技術(shù)團(tuán)隊(duì)與資金支持,在這個(gè)賽道中,創(chuàng)業(yè)公司很難獲得先發(fā)優(yōu)勢(shì);但偏應(yīng)用的垂直大模型,更多地是利用行業(yè)數(shù)據(jù),提供更精準(zhǔn)的解決方案,只關(guān)注某個(gè)特定的領(lǐng)域或場(chǎng)景。此外,它還可以利用一些開(kāi)源或閉源的通用大模型,依據(jù)自己的目標(biāo)領(lǐng)域的需求,做指令的微調(diào),使其更好地匹配特定需求。

在HR Tech賽道,從業(yè)者們就正在探索大模型的垂直應(yīng)用嘗試。

bee038a90917b128a936b376aa8a023.jpg

我們現(xiàn)在絕大多數(shù)產(chǎn)品的形態(tài),還是以商業(yè)化的大模型為基礎(chǔ),通過(guò)調(diào)用其能力,結(jié)合特定的數(shù)據(jù)、場(chǎng)景和API去實(shí)現(xiàn),其他可能的形式仍處于探索和構(gòu)想階段。

目前,大多數(shù)產(chǎn)品仍然以商業(yè)化的大型模型為基礎(chǔ),通過(guò)調(diào)用其能力,結(jié)合特定數(shù)據(jù)、場(chǎng)景和API進(jìn)行定制改造。其他可能的形式仍處于探索和構(gòu)想階段。

這是HR SaaS廠商Moka的CEO李國(guó)興。在他的觀察中,大模型如今應(yīng)用在HR領(lǐng)域還是有一些細(xì)微的偏差存在,這也是HR領(lǐng)域垂直大模型的價(jià)值——

bee038a90917b128a936b376aa8a023.jpg

其實(shí)任何一個(gè)專業(yè)領(lǐng)域的知識(shí),往往跨度大且難以獲取或理解,這些知識(shí)構(gòu)成了業(yè)務(wù)或職業(yè)所需的技能和積累。比如在與人事打交道時(shí),就需要知道專項(xiàng)、補(bǔ)償金的概念。另外存在一些專業(yè)術(shù)語(yǔ),GPT的理解沒(méi)有那么深。比如我們?nèi)?wèn)它,在一些場(chǎng)景里面的匯報(bào)上級(jí)是誰(shuí),它可能會(huì)答出來(lái),但如果問(wèn)它直接上級(jí)是誰(shuí),它不一定能理解這個(gè)概念,這種細(xì)微的語(yǔ)言差異可能導(dǎo)致其對(duì)概念的誤解,這種概念的背后其實(shí)都是知識(shí)。

而垂直模型的落地如今也有不少相對(duì)成形的嘗試。比如彭博就在今年4月推出了首個(gè)金融垂直領(lǐng)域的模型,這個(gè)叫BloombergGPT的模型專門使用大量金融數(shù)據(jù)進(jìn)行訓(xùn)練,能夠改進(jìn)現(xiàn)在很多金融企業(yè)的自然語(yǔ)言處理任務(wù),金融相關(guān)的新聞分類、問(wèn)答、情緒分析、命名識(shí)別都會(huì)更成熟。在國(guó)內(nèi),學(xué)而思也曾表示過(guò),正在自研名叫MathGPT的數(shù)學(xué)大模型,行業(yè)內(nèi)的大模型大多以閱讀、寫作應(yīng)用為主,而他們的垂直模型,則以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心。

從投資人的角度,羅超是這么解讀的:

f523a5c79da3538cc66f3c4480cdfd6.jpg

通用大模型長(zhǎng)期來(lái)看,它一定會(huì)是高度集中,但不會(huì)是一家獨(dú)大,這是我初步的一個(gè)判斷。高度集中的原因很簡(jiǎn)單,因?yàn)橥ㄓ么竽P偷那捌谕度敕浅4?,而它后續(xù)的使用成本,也就是邊際使用成本恰恰是不高的。也就是說(shuō)前期需要投入大量的錢,但一旦開(kāi)始商業(yè)化,每一次調(diào)用的邊際成本相對(duì)是偏低的,所以它一定是需要重資本密集型投入,并且需要非常長(zhǎng)的時(shí)間和人力和資本累積才能夠做出來(lái)的。

世界上不可能存在數(shù)百個(gè)、數(shù)千個(gè)大模型。一方面是因?yàn)槲覀兘裉烊祟愇拿魉莆盏乃懔Y源、電力資源、人才資源都不足以支撐全世界有數(shù)千個(gè)甚至更多的大模型同時(shí)發(fā)生。另一方面一旦大模型做出來(lái)之后,因?yàn)檫呺H使用成本很低,所以越集中的巨頭越有優(yōu)勢(shì)把這樣的服務(wù)提供給更多的使用者和應(yīng)用開(kāi)發(fā)者。

在互聯(lián)網(wǎng)時(shí)代,大量的公域數(shù)據(jù)都可以被抓來(lái),這也是為什么今天ChatGPT可以達(dá)到這樣一個(gè)水準(zhǔn)。其中存在的一個(gè)問(wèn)題是:當(dāng)移動(dòng)互聯(lián)網(wǎng)產(chǎn)生,尤其是在很多國(guó)家,它的大量數(shù)據(jù)都是切割開(kāi)的,分散在不同的私域里,所以這個(gè)時(shí)候其實(shí)很多數(shù)據(jù)并沒(méi)有被互通好,各家有各家的所謂的Proprietary Data。如果這些數(shù)據(jù)能被很好地使用和利用的話,就可以產(chǎn)生各種各樣的不同方向的模型。

高質(zhì)量的行業(yè)數(shù)據(jù)是細(xì)分企業(yè)入局垂直大模型的優(yōu)勢(shì)。

OpenAI之前曾披露,研發(fā)人員給GPT-3.5提供了45TB的文本語(yǔ)料,這是什么概念呢?是472萬(wàn)套中國(guó)四大名著的規(guī)模。而程序員「喂」給機(jī)器的語(yǔ)料,包括了百科、網(wǎng)絡(luò)文章、書(shū)籍期刊等等,甚至代碼開(kāi)源平臺(tái)Github也被納入其中。

而正如羅超提到的,在細(xì)分行業(yè),很多企業(yè)由于數(shù)據(jù)風(fēng)險(xiǎn)問(wèn)題,不可能將數(shù)據(jù)放在通用大模型中做訓(xùn)練;由此企業(yè)所持有的私域數(shù)據(jù)擁有極高的價(jià)值,比如醫(yī)療公司擁有大量的醫(yī)療數(shù)據(jù)和病例數(shù)據(jù),那么它就有機(jī)會(huì)開(kāi)發(fā)醫(yī)療垂直大模型產(chǎn)品。

從投資人和創(chuàng)業(yè)者的角度,如何看待大模型

如果說(shuō)巨頭是高調(diào)入局大模型,那么對(duì)于創(chuàng)業(yè)公司而言,他們的商業(yè)道路也逐漸清晰。首先需要想清楚的問(wèn)題或許是:我是要做To B的垂直應(yīng)用,還是To C的產(chǎn)品?

f523a5c79da3538cc66f3c4480cdfd6.jpg

我覺(jué)得如果你今天是一個(gè)相對(duì)草根的初創(chuàng)團(tuán)隊(duì),機(jī)會(huì)其實(shí)還是很多的。因?yàn)樵谝苿?dòng)互聯(lián)網(wǎng)的初期,當(dāng)時(shí)也有所謂的巨頭,但是只要想法足夠新穎且能夠抓住自己的創(chuàng)業(yè)優(yōu)勢(shì),那么你依然可以在自己的垂直領(lǐng)域,無(wú)論是去做一個(gè)To B的垂直應(yīng)用,還是做好積累去做一個(gè) To C的未來(lái)爆款級(jí),這種可能性我認(rèn)為都是存在的。

如果TA是一個(gè)To B領(lǐng)域的創(chuàng)業(yè)者,今天已經(jīng)有一些客戶在使用TA的產(chǎn)品,那么TA需要更多地回答:

“我能否把我的服務(wù)價(jià)值做到更好,我能否讓我的客戶留存做到更好?”然后我慢慢把客單價(jià)提起來(lái),在做扎實(shí)基本盤之后,逐步滲透到越來(lái)越多的客戶。

在把拉新和留存這兩個(gè)維度的事情做完之后,它是一個(gè)非常正常的飛輪的循環(huán)過(guò)程。如果今天TA的產(chǎn)品還沒(méi)有找到PMI,即在做一個(gè)To B的業(yè)務(wù),但同時(shí)產(chǎn)品還沒(méi)有人開(kāi)始用,那我覺(jué)得TA需要花更多時(shí)間去和TA的客戶交流:“我的技術(shù)對(duì)你是否真的有幫助?我的技術(shù)如果對(duì)你有幫助,應(yīng)該如何更好地產(chǎn)品化,才能讓你真的用得上?”

如果是To C的話,簡(jiǎn)單來(lái)說(shuō)還是需要更多耐心。移動(dòng)互聯(lián)網(wǎng)這么長(zhǎng)的時(shí)間,幾乎大家能夠想到的在C端應(yīng)用上的創(chuàng)新,都被無(wú)數(shù)創(chuàng)業(yè)者試過(guò)無(wú)數(shù)遍。所以創(chuàng)業(yè)者今天想通過(guò)一個(gè)很好的、之前沒(méi)人想到的想法,就去抓到一波用戶實(shí)現(xiàn)暴漲的可能性雖不是0,但它確實(shí)不高,所以這個(gè)時(shí)候創(chuàng)業(yè)者其實(shí)需要考慮的是有耐心地等待一個(gè)新的范式轉(zhuǎn)移。

9919889754eb272a88c30ab87f3d861.jpg

To C 的發(fā)展我會(huì)認(rèn)為更偏向于應(yīng)用驅(qū)動(dòng)。以手機(jī)為例,比如 iPhone 的Siri,它是一個(gè)天然和模型結(jié)合的場(chǎng)景,因?yàn)槲覀儐?wèn) Siri 的期待是停留在 iPhone 剛出來(lái)的那個(gè)時(shí)刻,很長(zhǎng)時(shí)間已經(jīng)沒(méi)有變化了,可能就是逗它一下,問(wèn)一下天氣,跟它講笑話。但是如果它和 GPT-4 甚至更高級(jí)的模型聯(lián)合起來(lái)的話,就會(huì)是一個(gè)真正更好的助手,甚至是生活助理,它會(huì)更了解你。也就是說(shuō)應(yīng)用級(jí)的 AI 或者 C端的AI,一定是和人的日常生活會(huì)更緊密,所以應(yīng)用級(jí)的創(chuàng)新會(huì)更多。

但是在B端是另外一回事。B端的問(wèn)題在于,一個(gè) AI模型離企業(yè)的落地創(chuàng)造價(jià)值還是有很長(zhǎng)的一個(gè)路徑要走?,F(xiàn)在有AI生成的文檔,能夠替換掉一些純粹意義上的paperwork,但是在未來(lái)它其實(shí)能改變很多,比如說(shuō)提高我們決策的質(zhì)量。企業(yè)要做很多的商業(yè)決策,決策的質(zhì)量現(xiàn)在是基于歷史上的數(shù)據(jù)來(lái)做,但是得到數(shù)據(jù)的過(guò)程其實(shí)涉及了大量的人工,也會(huì)有很多的偏差,因?yàn)槿说呐袛嗷蛘叻治鲇袝r(shí)可能會(huì)有些問(wèn)題,但是 AI 做這樣的事情,精確度會(huì)高很多。再比如說(shuō)通過(guò) AI 來(lái)壓縮整個(gè)流程,比如說(shuō)在公司場(chǎng)景里面的采購(gòu)流程、銷售流程、業(yè)務(wù)流程,其實(shí)有很多的鏈條,這些實(shí)際上是可以用AI來(lái)提升效率,甚至是取代一部分的。

當(dāng)然,在人們依然處于探索大模型創(chuàng)新邊界的當(dāng)下,通用大模型還是垂直大模型,這個(gè)問(wèn)題或許沒(méi)有標(biāo)準(zhǔn)答案。

a8ddf4319340ce5b03fb9e248fd217a.jpg

大模型到底會(huì)怎么變化,其實(shí)現(xiàn)在是有爭(zhēng)議的。有人認(rèn)為通用模型能做所有事情,有的人則認(rèn)為通用模型一定做不過(guò)專業(yè)模型,專業(yè)模型依然有存在的價(jià)值。因?yàn)橐坏┰酵ㄓ?,在專業(yè)領(lǐng)域的知識(shí)就不可能像專業(yè)模型一樣好,這就涌現(xiàn)了行業(yè)垂直模型的價(jià)值。

但這方面也存在爭(zhēng)議,比如理論上如果通用模型做得足夠好,那么每一個(gè)細(xì)分行業(yè)就沒(méi)有太大價(jià)值,就像搜索引擎,以前有很多針對(duì)特定行業(yè)的搜索,但這個(gè)市場(chǎng)已經(jīng)被通用搜索擠壓得很小,絕大部分的需求已經(jīng)可以被通用搜索滿足。同樣的,當(dāng)通用模型做得足夠好,已經(jīng)能夠滿足大部分人的需求,是否會(huì)使得行業(yè)模型變得不成立?如果是一個(gè)很標(biāo)準(zhǔn)的垂直細(xì)分行業(yè),需要的是考慮行業(yè)里的用戶有多少,值不值得為這些用戶專門做一套行業(yè)模型?永遠(yuǎn)存在這樣的需求是不能被滿足的,但是需求夠不夠大是一個(gè)很關(guān)鍵的問(wèn)題,一定要有一個(gè)足夠大的市場(chǎng),這樣才會(huì)有產(chǎn)品的價(jià)值。

無(wú)論如何,大模型從沉淀到爆發(fā),它確實(shí)在人類歷史上留下了濃墨重彩的一筆。

行業(yè)里的人習(xí)慣用「涌現(xiàn)」這個(gè)詞形容機(jī)器在某個(gè)階段突然爆發(fā)出的能力;這并不是個(gè)新鮮詞匯,在自然界中「涌現(xiàn)」很常見(jiàn)——成千上萬(wàn)只螞蟻用身體搭建起能夠跨越巨大縫隙的橋梁,小鳥(niǎo)遷徙時(shí)在空中組成的復(fù)雜隊(duì)列,或者是更微觀的,無(wú)數(shù)個(gè)水分子與空氣分子形成了颶風(fēng)——研究人員針對(duì)這些自然界中跨尺度的自組織現(xiàn)象,提出了「涌現(xiàn)」的概念。

那么在機(jī)器也涌現(xiàn)出人類無(wú)法預(yù)估的、龐大能力的當(dāng)下,我們又要如何剔除噪音與泡沫,找到大模型賽道背后的真正邏輯?

f523a5c79da3538cc66f3c4480cdfd6.jpg

AI 是一個(gè)被談?wù)摿撕荛L(zhǎng)時(shí)間的話題,歷史上也有非常多相關(guān)的預(yù)言。AI 類型的技術(shù)產(chǎn)生并得到了廣為的認(rèn)知,但隨著時(shí)間推移,很多人會(huì)認(rèn)為它并不能滿足預(yù)期,于是感到失望并跌入谷底,然后又逐漸恢復(fù),所以我認(rèn)為AI會(huì)經(jīng)歷這樣一個(gè)長(zhǎng)期的震蕩反復(fù)過(guò)程。

因此,作為一個(gè)投資人,我們今天在看AI、大模型以及AIGC的時(shí)候,一是要保持足夠的樂(lè)觀和好奇心,去了解它究竟能夠帶來(lái)什么,但同時(shí)也要保持足夠的耐心,時(shí)常剔除短期的泡沫,短期的噪音,去看它更長(zhǎng)期的發(fā)展趨勢(shì)和價(jià)值。

9919889754eb272a88c30ab87f3d861.jpg

我覺(jué)得這里面可以找?guī)讉€(gè)特質(zhì)。首先得看人才密度,經(jīng)歷了大模型這波還能生存下來(lái)的,一定是人才密度比較高的公司。第二點(diǎn)是數(shù)據(jù),它一定有大量的數(shù)據(jù)作為儲(chǔ)備,有助于模型訓(xùn)練的樣本和它的精度調(diào)優(yōu)的一系列工作。第三個(gè)是長(zhǎng)期的投入,并不指望這樣的過(guò)程是投入3到6個(gè)月、6個(gè)月到12個(gè)月就能完成的,大模型的探索一定不會(huì)是一帆風(fēng)順的,就像OpenAI也不是一路鮮花掌聲過(guò)來(lái)的,因此這個(gè)公司要有屢敗屢戰(zhàn)的氣質(zhì)。所以要有韌性,要有人才密度,再加上大量的數(shù)據(jù),我認(rèn)為這三個(gè)要素一個(gè)都不能少。

a8ddf4319340ce5b03fb9e248fd217a.jpg

在大家只是在趕風(fēng)口,隨著市場(chǎng)競(jìng)爭(zhēng),最終可能只剩下兩三家最出色的公司。雖然 ChatGPT 的中文能力不錯(cuò),但是和英文對(duì)比就能發(fā)現(xiàn)它在中文方面存在一些缺陷,因?yàn)樗?xùn)練的中文數(shù)據(jù)不夠多,如果想要做好,需要引入更多中文數(shù)據(jù),特別是各種文章和古文。從這個(gè)角度考慮,我認(rèn)為中國(guó)還是會(huì)有自己的大模型,但是也容不下太多家公司,最終只會(huì)留下極少數(shù),因?yàn)楣拘枰紤]投入高成本是否值得。

ChatGPT目前著面臨很大的問(wèn)題,就是它現(xiàn)在的收入完全不可能cover成本,還是要靠微軟的Office和Bing搜索來(lái)彌補(bǔ)。國(guó)內(nèi)公司也面臨類似情況,要確保大模型的日常投入能依靠其他業(yè)務(wù)產(chǎn)生的收益來(lái)彌補(bǔ),然而對(duì)很多公司來(lái)說(shuō),這種平衡可能并不成立,因此有些公司可能會(huì)因?yàn)楦叱杀径艞夁@個(gè)領(lǐng)域。

但無(wú)論如何,大模型終究不會(huì)是巨頭的游戲,也不會(huì)只誕生于英文世界的語(yǔ)境中。哪怕前路模糊也愿意投身其中的創(chuàng)業(yè)者,經(jīng)歷了無(wú)數(shù)次失敗也愿意為了1%創(chuàng)新可能繼續(xù)投身研發(fā)的科學(xué)家......當(dāng)我們觸摸到創(chuàng)新與科技的邊界,向外探索一步、再探索一步......有足夠的理由相信,人類一定可以賦予機(jī)器更廣闊的價(jià)值。

f523a5c79da3538cc66f3c4480cdfd6.jpg

我沒(méi)有辦法回答中國(guó)是否會(huì)產(chǎn)生OpenAI,但我相信中文世界一定會(huì)產(chǎn)生OpenAI,我這里指的并非將OpenAI的回復(fù)轉(zhuǎn)為中文,而是指完全由中文native生成的大模型必然會(huì)出現(xiàn)。我相信在有生之年,甚至在短時(shí)間內(nèi)我們就能看到非常優(yōu)秀的中文大語(yǔ)言模型的出現(xiàn)。我們需要保持耐心,不應(yīng)該讓短期噪聲或是浮躁影響我們對(duì)于長(zhǎng)期事物的判斷,我覺(jué)得這是一件不亞于芯片的需要積累的事情。

關(guān)于巨頭是否會(huì)和你做一樣的事情,這一問(wèn)題不僅存在于AI領(lǐng)域,比如在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,甚至在沒(méi)有互聯(lián)網(wǎng)的時(shí)代,當(dāng)有人要做一輛新的車時(shí),人們都會(huì)問(wèn)通用汽車或福特會(huì)不會(huì)做。因此,傳統(tǒng)巨頭是否會(huì)涉足相似的創(chuàng)新業(yè)務(wù)不是問(wèn)題的關(guān)鍵,因?yàn)閭鹘y(tǒng)公司始終在尋找新的機(jī)會(huì)和方向,而新興創(chuàng)業(yè)公司也一定會(huì)面臨傳統(tǒng)大公司的競(jìng)爭(zhēng)和挑戰(zhàn),所以這個(gè)問(wèn)題永遠(yuǎn)存在。

但是回答這個(gè)問(wèn)題的核心在于獲勝的核心資源。因此,如果一個(gè)創(chuàng)業(yè)者是潛心追求長(zhǎng)期價(jià)值,是使命驅(qū)動(dòng)而非機(jī)會(huì)驅(qū)動(dòng),對(duì)于長(zhǎng)期價(jià)值保持信念而不只是對(duì)短期價(jià)值保持信仰,那么現(xiàn)在是一個(gè)特別好的創(chuàng)業(yè)時(shí)機(jī)。這樣的創(chuàng)業(yè)者更有可能匯聚一批志同道合、有耐心的人,共同致力于一個(gè)既有長(zhǎng)期價(jià)值又能在短期內(nèi)充分沉淀的事業(yè)。

反饋
聯(lián)系我們
推薦訂閱