編者按:本文來自微信公眾號(hào) 阿爾法公社(ID:alphastartups),作者:許四清,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
18個(gè)小時(shí)前, Meta(Facebook)發(fā)布了Llama 2。
它最大的亮點(diǎn)不是多大參數(shù)或多強(qiáng)的能力,而是不再猶抱琵琶半遮面,向所有開發(fā)和商業(yè)用途開源! 另外,還結(jié)盟了對(duì)手Open AI的盟友微軟作為優(yōu)選伙伴, 直搗OpenAI最大的商業(yè)用戶老巢。
走封閉路線的OpenAI商業(yè)化的腳跟還沒站穩(wěn),Meta就掀翻了牌桌。
對(duì)中國的創(chuàng)業(yè)者和投資人,這到底意味著什么?做什么、怎么做?
1.開源解放生產(chǎn)力
開源絕不僅僅是免費(fèi)那么簡單,開發(fā)者省去了昂貴的大語言模型使用成本,使用者免除了向OpenAI交“使用稅”。
在此之前,隨著AIGC領(lǐng)導(dǎo)者OpenAI的版本升級(jí),無論使用或是開發(fā),都要直接交費(fèi),就像用Office365要交費(fèi),天經(jīng)地義。尤其對(duì)于利用LLM提供服務(wù)的商家,這筆費(fèi)用都是減不掉得成本。如今,人們多了一個(gè)選擇,如同Office365免費(fèi)用。
在Llama 2商用免費(fèi)后,無數(shù)開發(fā)者可以在Llama上開發(fā)基礎(chǔ)設(shè)施工具和應(yīng)用,我們一下看到了繁榮的曙光。
信息化、數(shù)字化之后,產(chǎn)業(yè)AI化的革命會(huì)來得更迅猛。
2.Llama 2 為大模型參與者省了多少錢?
國內(nèi)有很多有實(shí)力的商家,在考慮開發(fā)自用模型(俗稱甲方模型)。現(xiàn)在可以直接用開放模型做自己的甲方模型了,而且還是一個(gè)能力超群的大模型。這里有一個(gè)經(jīng)典圖,說明了Llama 2 為平臺(tái)開發(fā)者節(jié)約了為開發(fā)模型要付出的99%算力成本。
圖中大模型訓(xùn)練的四大步驟,pre-training, supervised fine tuning, reward modeling和reinforcement learning, 第一步堪稱鴻溝,粗算下來,算力時(shí)長占全部四個(gè)步驟的99%以上。這個(gè)比例,就是Llama 2 的開放為自己準(zhǔn)備擁有大模型的人節(jié)約的算力成本。
領(lǐng)導(dǎo)者走封閉路線并靠此獲利,如同蘋果手機(jī)。追隨者為了生存毫不猶豫的選擇開放,如同安卓。Llama 2 的開放只是帶了個(gè)頭,Cohere、Anthropic的開放平臺(tái)同樣值得期待 - 再后進(jìn)者要想方設(shè)法取悅開發(fā)者,提供更獨(dú)特的價(jià)值。
這,就是開放的商業(yè)世界的beauty。
3.創(chuàng)業(yè)者做什么
“to B, or not to B”, 是莎士比亞的《王子復(fù)仇記》第一句臺(tái)詞,經(jīng)常被我們用來形容AIGC創(chuàng)業(yè)者的選擇。toC毫無疑問大廠占據(jù)了大機(jī)會(huì),然而LLM智力的涌現(xiàn),給無數(shù)toB服務(wù)帶了了機(jī)會(huì)。節(jié)約上面說的99%算力成本后,企業(yè)可以訓(xùn)練自己的大模型。萬事數(shù)為先,數(shù)據(jù)必須是私有的,所以模型也必須是私有的,否則丟了模型比丟了數(shù)據(jù)更恐怖。
上周和一個(gè)大廠模型參與者交流,大家明顯看到只有500強(qiáng)段位的企業(yè)有能力訓(xùn)練自己的模型。99%以上需要模型的企業(yè)需要大量的模型服務(wù)著,為企業(yè)量身定做自己的模型。
我們?cè)?jīng)說過,得人才著得模型,得模型者得天下, 現(xiàn)在再加一句,產(chǎn)品制勝。把模型訓(xùn)練、服務(wù)產(chǎn)品化, 靠產(chǎn)品化實(shí)現(xiàn)規(guī)?;?、低成本,是AIGC創(chuàng)業(yè)的王道。
模型是生產(chǎn)力,AI化是趨勢(shì)。這一輪產(chǎn)業(yè)進(jìn)步,新貴肯定不止四小龍,產(chǎn)生數(shù)十個(gè)上市公司不足為怪。
Llama 2 幫助節(jié)省了99%的算力時(shí)長,99%的企業(yè)需要第三方模型服務(wù),這兩個(gè)99%,就是創(chuàng)業(yè)的機(jī)會(huì)。
4.再看“周明曲線”
5月27日合肥,中國科學(xué)技術(shù)大學(xué)校園里,阿爾法公社參與主辦的科大校友創(chuàng)業(yè)投資論壇ChatGPT全球論壇上,科大博導(dǎo),著名NLP專家周明教授拋出了一個(gè)曲線,經(jīng)我提議,當(dāng)場(chǎng)被科大理工男們命名為“周明曲線”。
這條曲線說明大多數(shù)垂類模型根本不需要175B的大參數(shù),當(dāng)然也不需要那么多的GPU算力。這讓大家想起了本科物理課某些超級(jí)牛的定理,簡單而又深刻。
Llama 2 也只有區(qū)區(qū)20B參數(shù),它的發(fā)布和開源,說明打仗何須核武器,只要有了會(huì)搞算法、練模型的人,就占有了商機(jī)。
5.為什么是個(gè)大機(jī)會(huì)
過往的SaaS市場(chǎng)在中國發(fā)展得磕磕絆絆,究其原因是客戶付費(fèi)愿望不強(qiáng),導(dǎo)致超大型客戶主導(dǎo)了市場(chǎng)話語權(quán),創(chuàng)業(yè)公司能生存、難長大。AI化的根本是模型的比拼,不斷喂數(shù)據(jù)、不斷優(yōu)化才是王道。當(dāng)然,模型持續(xù)使用中的算力需求也是工業(yè)界收入機(jī)會(huì)的純?cè)隽?,如同Snowflake有一大筆收入是轉(zhuǎn)售Amazon和微軟Azure云服務(wù)一樣,這一輪AIGC既有持續(xù)產(chǎn)品改進(jìn)的收入機(jī)會(huì),又平添了一份云算力整合服務(wù)的收入機(jī)會(huì),都是增量。
6.哪些服務(wù)是機(jī)會(huì)
三層架構(gòu):大模型、基礎(chǔ)設(shè)施類工具和應(yīng)用。傳統(tǒng)軟件服務(wù)商、SaaS服務(wù)商既面臨增量機(jī)會(huì),又有被“掀翻”的風(fēng)險(xiǎn)。懂企業(yè)服務(wù)的AI創(chuàng)新者機(jī)會(huì)更多。此處不贅述,我們不久另外做討論。
大模型的開放之路,讓人們看到了產(chǎn)業(yè)AI化的曙光。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。