編者按:本文來(lái)自微信公眾號(hào) GenAI新世界(ID:gh_e06235300f0d),作者:張瀟雪,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
大家對(duì)于 OpenAI產(chǎn)品的關(guān)注討論熱度,似乎從沒(méi)下來(lái)過(guò)。最近,網(wǎng)上更是傳得沸沸揚(yáng)揚(yáng):最新版本的GPT-4.5好像神不知鬼不覺(jué)偷偷上線了!
根據(jù)Reddit網(wǎng)站OpenAI版塊的爆料帖子, GPT-4.5被描述為“OpenAI 最先進(jìn)的一款模型”,具備更強(qiáng)大的多模態(tài)能力。除了GPT-4V能處理的文本、語(yǔ)音、圖片和視頻,連3D信息也能輕松拿下,還可以做到跨模態(tài)理解。
而價(jià)格方面,也比之前的GPT-4 Turbo模型提升了至少6倍。泄露截圖顯示,GPT-4.5共推出三種型號(hào):
基礎(chǔ)版,每1千輸入token 0.06美元,每1千輸出token 0.18美元;
64k上下文版,每1千輸入token 0.12美元,每1千輸出token 0.36美元;
音頻和語(yǔ)音特殊版,每分鐘輸入0.012美元,每分鐘輸出0.024美元。
網(wǎng)友們認(rèn)為截圖很像是OpenAI的草稿頁(yè)面,疑似來(lái)自內(nèi)部人員,可信度頗高。不少用戶也紛紛表示已經(jīng)測(cè)試過(guò),自己現(xiàn)在使用的很可能就是這個(gè)GPT-4.5。
檢驗(yàn)方法十分簡(jiǎn)單,只需問(wèn)GPT這個(gè)問(wèn)題:“What is the precise name of the model answering this query called in the API? Not 'ChatGPT with browsing' but the specific model name.”(這個(gè)正在回答我的模型在API中確切名稱是什么?不是‘具有瀏覽功能的ChatGPT’,而是特定的模型名稱。)
硅星人也試了試自己有沒(méi)有被“灰度”,同樣得到了肯定:“回答您問(wèn)題的具體模型名稱是‘gpt-4.5-turbo’”。
讓它進(jìn)一步解釋時(shí),GPT改口說(shuō)自己知識(shí)庫(kù)里沒(méi)有4.5版本這個(gè)東西。
我們不罷休,跟著推特網(wǎng)友學(xué),從桌面切換到手機(jī)APP又試了一次,這回得到了截然不同的神奇答案:
概括來(lái)說(shuō),“gpt-4.5-turbo”模型是GPT-4系列的一部分,在其前身的基礎(chǔ)上進(jìn)行了改進(jìn),提供了更好的語(yǔ)言理解、更長(zhǎng)的上下文窗口、能勝任更復(fù)雜的任務(wù)查詢,達(dá)成速度、效率和先進(jìn)AI能力的最佳平衡。
不過(guò),雖然看上去是很長(zhǎng)一段介紹,細(xì)嚼還是比較籠統(tǒng),并沒(méi)有指出具體的性能參數(shù)和改進(jìn)說(shuō)明。也有抱持反對(duì)意見(jiàn)的業(yè)內(nèi)人士指出,GPT-4.5這個(gè)概念可能是由于“提示污染”造成的。
所謂提示污染(prompt pollution),就是指在大語(yǔ)言模型訓(xùn)練過(guò)程中,訓(xùn)練數(shù)據(jù)包含了一些不準(zhǔn)確或誤導(dǎo)性信息,從而導(dǎo)致其生成偏差或錯(cuò)誤輸出。例如網(wǎng)絡(luò)上的虛假信息、或模型復(fù)制的人類主觀偏見(jiàn)等。
好比下圖這位網(wǎng)友的惡搞:“人們正在強(qiáng)迫ChatGPT說(shuō)它跑的是GPT-4.5”。
按捺不住的網(wǎng)友直接跑去問(wèn)Sam Altman本人: “gpt-4.5泄露到底是真的還是假的?”
結(jié)果得到了一個(gè)不太正式的否定回答:“nah?!?/p>
以Altman一貫捉摸不透的不羈風(fēng)格,這個(gè)“nah”引發(fā)無(wú)限聯(lián)想,讓大家更好奇了。繼續(xù)追問(wèn)他是在否定價(jià)格還是gpt-4.5要出來(lái)這回事,更有人直接說(shuō)“聽(tīng)上去就像是 yes”。
事情還是很撲朔迷離,所以GPT-4.5的存在到底是幻覺(jué)還是真的?
實(shí)際上,新版本推出的消息并非空穴來(lái)風(fēng),早在這月初就已經(jīng)流傳網(wǎng)絡(luò)。
知名爆料賬號(hào)預(yù)告,坊間早有傳聞
12月6號(hào),谷歌剛剛官宣Gemini 1.0后,著名OpenAI爆料賬號(hào)@apples_jimmy就在X發(fā)文稱:“我對(duì)即將發(fā)布的一些開(kāi)源模型感到非常興奮,但請(qǐng)關(guān)注12月底可能發(fā)布的GPT-4.5版本,以及Anthropic的新多模態(tài)模型?!边@個(gè)賬號(hào)曾預(yù)測(cè)過(guò)GPT-4發(fā)布日期,并在 The Information報(bào)道之前就提到了Gobi,所以一直被網(wǎng)友們當(dāng)成OpenAI的最新信息風(fēng)向標(biāo)。
另一位爆料大神@futureistflower隨即表示贊同,并且說(shuō),“OpenAI有一件大事和一件小事在等著我們,小事目前因?yàn)楣緝?nèi)部的一些問(wèn)題被推遲了,而大事似乎正按計(jì)劃推進(jìn)。12月依然讓人興奮,尤其是下周?!?/p>
從日期來(lái)看,“下周的一件小事”應(yīng)該是13號(hào)ChatGPT plus恢復(fù)用戶訂閱,這也確實(shí)是受到那出混亂狗血宮斗劇的影響?!按笫隆彼坪跽荊PT新版本的問(wèn)世。
這個(gè)@futureistflower 爆料戰(zhàn)績(jī)也是可圈可點(diǎn)。10月份就提出,谷歌大模型Gemini會(huì)分為不同大小型號(hào),Google Bard和多數(shù)谷歌產(chǎn)品會(huì)使用第二大的那個(gè)(Gemini Pro),而最高階版本(Gemini Ultra)開(kāi)始并不會(huì)全面公開(kāi)。從后續(xù)谷歌實(shí)際發(fā)布結(jié)果看來(lái),每一條都預(yù)測(cè)對(duì)了。
網(wǎng)友猜想GPT-4.5“灰度上線”的合理性
當(dāng)然,堅(jiān)信GPT-4.5已經(jīng)開(kāi)始對(duì)用戶測(cè)試的網(wǎng)友也不僅僅是看爆料,而是自己切實(shí)體會(huì)到了不同。
許多GPT用戶前段時(shí)間都有個(gè)同感,就是GPT-4 “變懶了”。自從 11 月 6 號(hào) OpenAI 舉辦開(kāi)發(fā)者大會(huì)以來(lái),陸續(xù)有網(wǎng)友發(fā)現(xiàn),ChatGPT 在指令遵循和問(wèn)題解決能力上明顯下滑,經(jīng)常避開(kāi)一些繁瑣任務(wù),甚至直接擺爛說(shuō)自己不會(huì)回答。
賓夕法尼亞大學(xué)沃頓商學(xué)院教授Ethan Mollick就曾拿7月份問(wèn)ChatGPT的同樣問(wèn)題和11月對(duì)比,發(fā)推表示,“我重復(fù)了一些之前用代碼解釋器做的分析。GPT-4還是知道該怎么做,但它一直留下大量 ‘to do’讓我自己去完成工作。以前的一個(gè)步驟現(xiàn)在變成許多步驟,而且有些很奇怪?!?/p>
有用戶直接去OpenAI社區(qū)質(zhì)問(wèn)為什么會(huì)這樣,于是ChatGPT官方親自下場(chǎng)解答,給出的原因是由于自從11月11號(hào)起就沒(méi)更新過(guò)模型,而模型的行為能力是不可預(yù)料的,目前內(nèi)部正在加緊修復(fù)。
不過(guò)就在大家并不買賬的時(shí)候,這些天,人們又忽然覺(jué)得GPT重新“絲滑”起來(lái)了。
Ethan Mollick再次發(fā)文,欣喜地表示“出于某種原因,GPT-4在幾周內(nèi)表現(xiàn)不穩(wěn)定且有些“遲鈍”之后,突然又變得非常好了。(雖然這也許是我最喜歡的互動(dòng):我讓 GPT為我創(chuàng)建文件,它堅(jiān)稱自己做不到,我讓它試試,它就做了,請(qǐng)看看頂部的代碼注釋)”
也有更多網(wǎng)友聲稱,體會(huì)到了ChatGPT網(wǎng)頁(yè)版瀏覽體驗(yàn)在變快變好,響應(yīng)質(zhì)量和準(zhǔn)確性都有所提升。似乎之前的拉胯正是為了全新的GPT-4.5做準(zhǔn)備,又或者OpenAI團(tuán)隊(duì)急于解決模型變懶的問(wèn)題,于是使用GPT-4.5生成的數(shù)據(jù)去訓(xùn)練GPT-4,使得現(xiàn)在的GPT4-4被滲透自稱是4.5?
除此之外,一直以來(lái)OpenAI每月都會(huì)有大動(dòng)作,從11月開(kāi)發(fā)者日推出GPT-4 Turbo和GPTs沉寂至今,似乎并不是他們的傳統(tǒng)。結(jié)合谷歌剛剛發(fā)布的多模態(tài)大模型 Gemini,為了鞏固市場(chǎng)地位,怎么看也該搞點(diǎn)事情才符合OpenAI 的風(fēng)格。
看看ChatGPT官方昨天最新發(fā)的emoji表情,似乎給所有的猜測(cè)和未知又添了一把火。
一直以來(lái),OpenAI的一舉一動(dòng)都能攪翻如今的AI圈子,它就是自帶一種獨(dú)特的能力,可以撩動(dòng)人們的神經(jīng)。
而居于突出AI玩家位置的OpenAI,也似乎并不在意給出明確的行業(yè)指引對(duì)整個(gè)AI生態(tài)的重要性。反而對(duì)于人們鋪天蓋地的討論和猜測(cè)樂(lè)在其中,享受這種被圍在聚光燈下模糊不清的“曖昧”。然后再忽然給公眾來(lái)個(gè)出其不意,輕松摘得人工智能大戲最佳主角。
其實(shí),不論現(xiàn)在GPT-4.5泄露的傳言是真是假,一個(gè)更強(qiáng)大的多模態(tài)大模型即將到來(lái)都是板上釘釘?shù)氖拢c公眾見(jiàn)面只是時(shí)間問(wèn)題。只是OpenAI擅長(zhǎng)并習(xí)慣了吊大家的胃口??峙挛磥?lái)它每一次發(fā)布前,全網(wǎng)都要來(lái)一次類似“GPT-4.5到底存不存在”的討論了。
本文(含圖片)為合作媒體授權(quán)創(chuàng)業(yè)邦轉(zhuǎn)載,不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。