五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

為什么模型還在開源?

關(guān)鍵在于客戶選擇

編者按:本文來自微信公眾號(hào) 王智遠(yuǎn),作者:王智遠(yuǎn),創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

上半年就討論過這個(gè)問題。

4月份時(shí),百度創(chuàng)始人李彥宏說大模型一定要閉源,當(dāng)時(shí)我記得,周鴻祎在海外演講時(shí),還反駁說:有些名人亂說,沒有開源哪有互聯(lián)網(wǎng)。

李彥宏覺得,閉源才能賺到錢,能吸引人才和算力,開源沒啥用,閉源能力會(huì)一直領(lǐng)先,做模型的創(chuàng)業(yè)公司,即做模型又做應(yīng)用不是好辦法。

可半年過去了,到2025年1月初,我仍然看到不少企業(yè)在開源模型。比如:

1月15日,MiniMax開源了兩個(gè)模型。一個(gè)是基礎(chǔ)語言大模型MiniMax - Text - 01,另一個(gè)是視覺多模態(tài)大模型MiniMax - VL - 01。

這兩個(gè)模型厲害之處在于,它們用了一種線性注意力機(jī)制,好比給模型裝了一副更高級(jí)的“眼睛”,讓它能更快速、高效地處理信息。

而且,一次能處理400萬token,是別的模型的20 - 30倍。前天這新聞出來時(shí),我在群里還吐槽:Deepseek被偷家了,它們用的是傳統(tǒng)Transformer架構(gòu),MiniMax新模型MiniMax - 01用了新型Lightning Attention架構(gòu),把架構(gòu)都替換了。

還有,1月15號(hào),CES展上,NVIDIA也開源了自己的世界模型,分別有三個(gè)型號(hào):NVIDIA Cosmos的Nano、Super和Ultra。

Nano主要是實(shí)時(shí)推理,訓(xùn)練反應(yīng)能力,用在智能交通、工業(yè)自動(dòng)化這些地方;Super和Ultra則擅長處理復(fù)雜任務(wù)和大規(guī)模數(shù)據(jù),能生成很逼真的物理感知視頻,模擬和預(yù)測機(jī)器人和自主系統(tǒng)的真實(shí)結(jié)果。

昨天(1月16號(hào))阿里云通義也開源了一個(gè)模型,叫PRM的數(shù)學(xué)推理過程獎(jiǎng)勵(lì)模型,尺寸為7B。這個(gè)模型像個(gè)數(shù)學(xué)老師,比GPT - 4o更能發(fā)現(xiàn)數(shù)學(xué)推理中的錯(cuò)誤,幫助人們更好地學(xué)習(xí)和研究數(shù)學(xué)。

你看,模型開源的信息一直沒斷過。我讓Kimi chat幫我統(tǒng)計(jì)了一下,2024年全年開源大模型中,品牌有10個(gè)以上。

種類和數(shù)量多得數(shù)不過來,像Llama 3、GLM - 4、Qwen系列、DeepSeek、Falcon 40B、Gemma、FLUX.1、MPT - 7B、Phi - 2等等。

你不了解它們沒關(guān)系,只要記住,它們有的能處理文本、有的能生成圖片、還有的能處理多模態(tài)信息就夠了。

然而,一年快過去了,又回到那個(gè)問題上:模型要不要開源?開源好、閉源好?

要解答這兩個(gè)問題,我認(rèn)為要從最底層原理思考。什么是最底層原理呢?例如:我們得知道模型這個(gè)東西,它到底是什么?怎么用的,用在哪里的。

如果用維基百科的介紹,那我能寫幾千個(gè)字的模型是什么。然而,這種理論性較強(qiáng)的知識(shí),并不能通俗地理解。

我來打個(gè)比方:

可以想象,現(xiàn)在有一個(gè)人,有一個(gè)超級(jí)大腦。大腦能處理語言、圖片,甚至有的還能把多個(gè)模型整理起來處理復(fù)雜的任務(wù)。

而模型呢,像一個(gè)個(gè)強(qiáng)大的工具,通過學(xué)習(xí)大量數(shù)據(jù)變得更聰明,就像你學(xué)習(xí)新技能一樣,練習(xí)得越多,就越熟練。

所以,模型可以看做是一個(gè)個(gè)多功能的助手,每個(gè)助手都有自己的專長、干自己的事兒,這樣才能分工明確,各司其職。

問題是,開源好,還是閉源好呢?

我認(rèn)為這一定要看兩點(diǎn),動(dòng)機(jī)和用途。什么是開源?簡單講,把你的工具箱免費(fèi)分享給大家,任何人都可以拿去用,還可以根據(jù)自己的需要進(jìn)行改進(jìn)和擴(kuò)展。

這么做的好處很明顯,一,能很快拉起一幫開發(fā)者,間接給自己儲(chǔ)備人才。比如,大家都用LLaMA來練手、調(diào)教,市場上就有好多懂LLaMA的人,你招人時(shí)就可以在里面挑選需要的技術(shù)人才。

其次,全世界的工程師都能交流經(jīng)驗(yàn),就像有好多工程師幫你試模型,給后續(xù)改進(jìn)提建議,能讓開源模型更快追上閉源模型。

從做生意的角度講,開源還能打擊對(duì)手。有了免費(fèi)的開源模型,那些收費(fèi)的閉源模型在市場上就不好混了。

再者,開源模型能鼓勵(lì)大家一起玩、一起干,加快解決問題和創(chuàng)新的速度。源代碼公開了,全球開發(fā)者、研究者都能隨便用、隨便改,這樣一來,技術(shù)更新?lián)Q代快,門檻也低了,更多人就能參與AI研發(fā)了。

在Stability AI發(fā)布的關(guān)于新模型FreeWilly的報(bào)告里,明確指出了,LLaMA模型開源沒幾天,旗下衍生的大模型FreeWilly2就跑贏了LLaMA。

這說明,開源模型就像一群人在幫忙,大家一起出力,能讓模型變得更好更快。

不過,開源也有一些潛在風(fēng)險(xiǎn)。比如:模型被濫用進(jìn)行不當(dāng)內(nèi)容的生成,這就需要開發(fā)者和使用者共同關(guān)注和規(guī)范。

還有,數(shù)據(jù)隱私泄露的問題,模型的使用和改進(jìn)涉及到大量數(shù)據(jù)的處理和傳輸,如何在開源的同時(shí)保護(hù)用戶數(shù)據(jù)隱私,是需要解決的重要問題。

讀懂了開源,閉源就容易理解了。

相當(dāng)于一本書把它鎖起來,只給特定的人才能用,這樣,發(fā)明這個(gè)大腦的公司可以更好地控制它,確保它的安全和穩(wěn)定,同時(shí),也可以通過這種方式賺錢,因?yàn)閯e人要使用這個(gè)大腦,就需要付錢。

閉源有什么優(yōu)勢呢?

一,閉源能很好地保護(hù)公司的技術(shù)和知識(shí)產(chǎn)權(quán)。你辛辛苦苦寫好的模型代碼,不用擔(dān)心公開后被別人“偷家”。

二,閉源能更專注于特定的場景和用戶。比如,有些金融公司、銀行不需要開源模型,它們只要一個(gè)專門處理金融數(shù)據(jù)的模型就行。閉源就能很好地解決這個(gè)問題。

還有一點(diǎn),閉源后,公司可以持續(xù)投入有限的資源來優(yōu)化、改進(jìn)模型。因?yàn)橹挥兴麄兡芙佑|模型的核心代碼,所以,能根據(jù)數(shù)據(jù)的反饋,不斷微調(diào),讓模型變得更精準(zhǔn)、更強(qiáng)大。

而且,閉源模型在商業(yè)應(yīng)用上更靈活。公司根據(jù)市場需求和客戶反饋,快速調(diào)整模型的功能和性能,推出新的版本,這樣,就能滿足不同類別的客戶了。

問題是,任何技術(shù)的發(fā)展都需要商業(yè)的支持,商業(yè)的發(fā)展會(huì)推動(dòng)技術(shù)的更新,所以,到底要不要開源,得看掌握「模型」的企業(yè),想讓模型在特定的環(huán)境下干啥。

我來舉個(gè)例子:

拿MiniMax來說。這家公司有四種模型布局:大模型MiniMax - 01系列、視頻模型(abab - video - 1、video - 01)、語音生成模型(speech - 01、T2A - 01 - HD),還有音樂生成模型music - 01。

發(fā)這么多模型,主要是為了建立「競爭壁壘」和滿足不同場景的需求,從文本到音頻,模型幾乎涵蓋了MiniMax的基礎(chǔ)設(shè)施。

什么是基礎(chǔ)設(shè)施呢?

就像一個(gè)底座。有了底座,可以在上面做很多事情。

比如,有視頻模型,各種企業(yè)可以用這個(gè)模型開發(fā)不同的應(yīng)用。TOB(面向企業(yè))的企業(yè)可能會(huì)用它的API來開發(fā)AI剪輯視頻的產(chǎn)品。

電影動(dòng)畫領(lǐng)域,這個(gè)視頻模型可以用來生成動(dòng)畫場景,提高制作效率;甚至在教育領(lǐng)域,可以用來制作教學(xué)視頻,讓學(xué)習(xí)更加生動(dòng)有趣等等。

再比如,有了語音生成模型,就像有一個(gè)會(huì)說話的機(jī)器人。這個(gè)機(jī)器人在智能家居中,可以通過語音控制家電,在客服領(lǐng)域,它可以用來生成自然的語音回復(fù),提高客戶滿意度。

這些模型一起,構(gòu)成MiniMax在AI領(lǐng)域的基礎(chǔ)設(shè)施,就像建房子的地基,有了地基,才能蓋起各種各樣的房子;這樣,MiniMax不僅能夠滿足不同場景的需求,還能在市場競爭中建立起自己的優(yōu)勢。這就是TOB的力量。

再來看看TOC。

MiniMax這家公司,有兩個(gè)原生應(yīng)用,一個(gè)叫海螺AI,類似于豆包、Kimi chat、通義和文小言,它有多模態(tài)能力,支持文本、語音、圖像等多種輸入方式。

還有一個(gè)叫星野。星野是什么?基于AI的內(nèi)容社區(qū),用戶可以創(chuàng)建虛擬角色進(jìn)行互動(dòng),形成類似于小紅書、抖音、B站等社區(qū)的形態(tài)。

所以,兩個(gè)放在一起看,就形成了C端壁壘,一個(gè)滿足日常使用,一個(gè)滿足產(chǎn)生內(nèi)容后發(fā)布出去,在社區(qū)幫助創(chuàng)作者形成商業(yè)閉環(huán)。這樣,用戶不僅不會(huì)流失,還會(huì)愿意一直留在平臺(tái)上,從而形成C端市場的競爭力。

了解這一點(diǎn),就明白了“開源、閉源”的動(dòng)機(jī)。

互聯(lián)網(wǎng)上的所有數(shù)據(jù),總有一天會(huì)被AI學(xué)習(xí)完。僅僅靠自己社區(qū)生態(tài)內(nèi)的一點(diǎn)內(nèi)容,完全無法滿足一個(gè)模型的訓(xùn)練需求。

除非一個(gè)新的模型廠商能像淘寶、京東、小紅書那樣,擁有海量的數(shù)據(jù)和標(biāo)簽。只有開源,才能保證模型有足夠的“食物”來不斷學(xué)習(xí)和進(jìn)化,保持其競爭力和準(zhǔn)確性。

而支持閉源的人呢?

大部分更偏向于TOB客戶,這些客戶急需將AI的能力融入到工作場景中。例如,京東這樣的公司,如果要養(yǎng)10萬個(gè)在線客服,肯定是不劃算的。

怎么辦呢?可以做一個(gè)閉源模型,讓它學(xué)習(xí)所有客服的知識(shí)庫和QA,然后通過API接入。這樣,就可以利用閉源模型自動(dòng)回答客戶的常見問題,提高客服效率,同時(shí)減少人力成本。

所以,閉源模型的這種定制化和專用性,在特定的場景中表現(xiàn)得會(huì)很好。因此,一個(gè)結(jié)論是:模型是否開源,應(yīng)該站在客戶選擇的角度來看,而不是僅僅考慮「模型本身」。

這句話怎么理解呢?

簡單講:決定一個(gè)模型是否開源,不應(yīng)該只從技術(shù)角度出發(fā),而應(yīng)該考慮客戶的需求和選擇。

國外有兩家公司,一個(gè)叫VMWare,它的軟件像“電腦管家”,主要幫客戶的企業(yè)把電腦、服務(wù)器管理得井井有條。

還有一家公司叫HuggingFace,它是一個(gè)專門做人工智能的公司,他們有很多很厲害的AI模型。StarCoder是其中一個(gè)模型,功能是幫助開發(fā)人員(就是寫電腦程序的人)生成代碼。

但是,VMWare選擇自己把StarCoder模型放在自己的服務(wù)器上,而不是用微軟的Github的Copilot這樣的外部系統(tǒng)。因?yàn)閂MWare對(duì)自己的代碼庫(就是他們所有的代碼集合)非常小心,不希望讓微軟(另一家大公司)看到這些代碼。

而HuggingFace呢,它把StarCoder模型開源,讓所有人都可以免費(fèi)使用。

這樣做的好處是,很多開發(fā)者都可以用這個(gè)模型來生成代碼,提高他們的工作效率。開源還意味著社區(qū)的力量,全球的開發(fā)者都可以一起改進(jìn)這個(gè)模型,讓它變得更好。

所以,你看,VMWare更注重保護(hù)自己的代碼庫,雖然它也用了HuggingFace的StarCoder,但它選擇閉源的方式來保護(hù)自己的數(shù)據(jù)安全。

而HuggingFace本身,把StarCoder做了開源,讓更多人可以使用和改進(jìn)這個(gè)模型,促進(jìn)技術(shù)的快速發(fā)展和創(chuàng)新,這就是不同的選擇,一個(gè)模型面對(duì)的客戶不一樣,開源閉源也不一樣。

國內(nèi)這樣的操作更多。

阿里、騰訊都是雙輪驅(qū)動(dòng)。我記得,阿里云在2024年9月的云棲大會(huì)上發(fā)布的模型Qwen2.5系列,最近大半占據(jù)Hugging Face榜單,這些模型,一些對(duì)開發(fā)者,一些對(duì)企業(yè)。

騰訊2024年11月份宣布的兩款產(chǎn)品,Hunyuan - Large(大語言模型)、Hunyuan3D - 1.0(文本加圖像)也是這樣。因此,這種模式不僅推動(dòng)了技術(shù)的迭代,還滿足了不同客戶群體的需求。

說到底,到底開源好,還是閉源好?

我覺得,關(guān)鍵在于客戶選擇。如果一個(gè)模型上面做了TOC的產(chǎn)品,那開源肯定有利于發(fā)展。反而,這個(gè)模型是直接面對(duì)公司用的,閉源是最佳選擇。

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。


反饋
聯(lián)系我們
推薦訂閱