編者按:本文來自微信公眾號(hào) “量子位”(ID:QbitAI),作者:克雷西,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
終于,免費(fèi)用戶也能用上OpenAI的DeepResearch了,量子位也進(jìn)行了新鮮實(shí)測(cè)!
OpenAI深夜官宣,基于o4-mini某個(gè)版本的輕量版DeepResearch正式上線。
按照官方說法,輕量版的回答會(huì)更短,但智能水平將幾乎無異于滿血版本。
與此同時(shí),輕量版的上線也意味著付費(fèi)用戶可以有更多的使用次數(shù)。
具體來說,付費(fèi)用戶的滿血版用量不變,但每月可以獲得額外的輕量版使用機(jī)會(huì),在滿血額度用完后會(huì)自動(dòng)切換。
那么,兩個(gè)版本表現(xiàn)究竟有何異同,來看量子位實(shí)測(cè)~
實(shí)測(cè)輕量版DeepResearch
我們一共找了10個(gè)話題讓ChatGPT進(jìn)行深度研究,首先一并展示下用時(shí)、資料數(shù)量等能夠直接統(tǒng)計(jì)的數(shù)據(jù)。
整體來看,輕量版的用時(shí)和生成內(nèi)容字?jǐn)?shù)都明顯要比滿血版更少,至于參考資料數(shù)量則沒有明顯規(guī)律。
接下來,我們選擇其中三個(gè),仔細(xì)對(duì)比一下滿血版和輕量版形成的報(bào)告質(zhì)量:
印歐語系語言的演變歷史
2024年AI穿戴市場(chǎng)發(fā)展情況
推理大模型中的關(guān)鍵技術(shù)
無論是哪個(gè)版本,在我們提出研究話題時(shí),都會(huì)詢問研究的具體內(nèi)容、側(cè)重點(diǎn)等信息。
話題1:印歐語系語言的演變歷史
以第一個(gè)話題“印歐語系語言的演變歷史”為例,滿血版和輕量版在問題細(xì)化方面詢問的思路基本一致(下圖中上方為滿血版,下方為輕量版):
我們回復(fù)“整體梳理,從古至今”。
然后模型便會(huì)開始規(guī)劃?rùn)z索,關(guān)于這個(gè)話題,兩個(gè)版本引用的資料都是主要來自維基百科和大英百科全書,而滿血版還多引用了部分中文資源(僅限于當(dāng)前話題,其他話題中輕量版也會(huì)引用非英語資源)。
(下圖中左側(cè)為滿血版,右側(cè)為輕量版)
通過二級(jí)標(biāo)題來看最終報(bào)告的結(jié)構(gòu),滿血版采用了總-分-總的結(jié)構(gòu),并將印歐語系下屬各個(gè)語族分別作為一個(gè)部分進(jìn)行了詳細(xì)介紹。
而輕量版的結(jié)構(gòu)更加注重整體,每一部分都是分別從不同角度在講述演變的過程。(下圖中左側(cè)為滿血版,右側(cè)為輕量版)
滿血版的報(bào)告當(dāng)中,每一個(gè)下屬語族的介紹都非常詳細(xì)。
輕量版則更側(cè)重于展示脈絡(luò),將演變的大致過程做了簡(jiǎn)要介紹,詳細(xì)程度則比不上滿血版本。
話題2:2024年AI穿戴市場(chǎng)發(fā)展情況
前面一個(gè)問題主要是讓模型在時(shí)間維度上進(jìn)行信息梳理,接下來的這個(gè)話題則圍繞空間維度進(jìn)行展開。
問題細(xì)化的過程是這樣,兩個(gè)版本區(qū)別不大(圖中還是上面滿血下面輕量版),我們則是直接這些內(nèi)容全都要。
中間過程就不多贅述,兩個(gè)版本從結(jié)構(gòu)上依然是大致相似(左滿血右輕量)。
市場(chǎng)規(guī)模的部分,滿血版分為了全球、國內(nèi)和增長(zhǎng)趨勢(shì)三個(gè)部分進(jìn)行介紹,包含了大量具體數(shù)據(jù)和部分原因簡(jiǎn)析,之后的增長(zhǎng)趨勢(shì)還根據(jù)產(chǎn)品的具體類型進(jìn)行了細(xì)分。
并且還根據(jù)IDC的數(shù)據(jù)繪制出了表格:
相比之下,輕量版也覆蓋了其中的一部分要點(diǎn)并同樣是全球-國內(nèi)-趨勢(shì)這樣的結(jié)構(gòu),但每部分都只用一兩句話帶過。
至于表格,則是沒有的。
不過到了廠商部分,又變成了輕量版(下圖右側(cè))的展示更加條理清晰。
后面的內(nèi)容就不一一拆解了,整體來看,無論是從時(shí)間還是空間維度上梳理,滿血版都比輕量版多了大量的細(xì)節(jié)(下圖為滿血版)。
話題3:推理大模型中的關(guān)鍵技術(shù)
第三個(gè)話題關(guān)于推理大模型中的關(guān)鍵技術(shù),這次兩個(gè)版本問出的細(xì)化問題稍有不同。
我們回復(fù)重點(diǎn)關(guān)注模型架構(gòu)、訓(xùn)練算法和推理優(yōu)化這三部分的信息。
對(duì)于模型架構(gòu)的部分,輕量版(下圖右側(cè))做出了表格整理,而滿血版分成了三個(gè)段進(jìn)行文字?jǐn)⑹觥?/p>
算法部分,輕量版提到了SFT、RLHF、對(duì)比學(xué)習(xí)與自監(jiān)督等內(nèi)容,而滿血版則分成了指令微調(diào)與多任務(wù)訓(xùn)練、鏈?zhǔn)剿季S訓(xùn)練與過程監(jiān)督、反事實(shí)訓(xùn)練與自我監(jiān)督機(jī)制這三個(gè)部分。
最后關(guān)于推理優(yōu)化,輕量版提及了量化、蒸餾、剪枝、KV緩存優(yōu)化等技術(shù),滿血版在此之外還提到了自適應(yīng)推理、并行解碼等內(nèi)容。
總得來看,如果比較詳細(xì)程度,滿血版是當(dāng)之無愧的獲勝者。
但如果只是用來幫助我們確定大概的研究思路和可能涉獵的內(nèi)容,輕量版,也足以解決一部分需求。
甚至對(duì)于不喜歡長(zhǎng)篇大論的用戶來說,輕量版看上去會(huì)更加簡(jiǎn)潔。
關(guān)鍵是,免費(fèi)用戶也能用啊。
參考鏈接:
https://x.com/OpenAI/status/1915505961500070245
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。