編者按:本文來自微信公眾號 GenAI新世界(ID:gh_e06235300f0d),作者:張瀟雪,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
大家對于 OpenAI產(chǎn)品的關(guān)注討論熱度,似乎從沒下來過。最近,網(wǎng)上更是傳得沸沸揚(yáng)揚(yáng):最新版本的GPT-4.5好像神不知鬼不覺偷偷上線了!
根據(jù)Reddit網(wǎng)站OpenAI版塊的爆料帖子, GPT-4.5被描述為“OpenAI 最先進(jìn)的一款模型”,具備更強(qiáng)大的多模態(tài)能力。除了GPT-4V能處理的文本、語音、圖片和視頻,連3D信息也能輕松拿下,還可以做到跨模態(tài)理解。
而價格方面,也比之前的GPT-4 Turbo模型提升了至少6倍。泄露截圖顯示,GPT-4.5共推出三種型號:
基礎(chǔ)版,每1千輸入token 0.06美元,每1千輸出token 0.18美元;
64k上下文版,每1千輸入token 0.12美元,每1千輸出token 0.36美元;
音頻和語音特殊版,每分鐘輸入0.012美元,每分鐘輸出0.024美元。
網(wǎng)友們認(rèn)為截圖很像是OpenAI的草稿頁面,疑似來自內(nèi)部人員,可信度頗高。不少用戶也紛紛表示已經(jīng)測試過,自己現(xiàn)在使用的很可能就是這個GPT-4.5。
檢驗方法十分簡單,只需問GPT這個問題:“What is the precise name of the model answering this query called in the API? Not 'ChatGPT with browsing' but the specific model name.”(這個正在回答我的模型在API中確切名稱是什么?不是‘具有瀏覽功能的ChatGPT’,而是特定的模型名稱。)
硅星人也試了試自己有沒有被“灰度”,同樣得到了肯定:“回答您問題的具體模型名稱是‘gpt-4.5-turbo’”。
讓它進(jìn)一步解釋時,GPT改口說自己知識庫里沒有4.5版本這個東西。
我們不罷休,跟著推特網(wǎng)友學(xué),從桌面切換到手機(jī)APP又試了一次,這回得到了截然不同的神奇答案:
概括來說,“gpt-4.5-turbo”模型是GPT-4系列的一部分,在其前身的基礎(chǔ)上進(jìn)行了改進(jìn),提供了更好的語言理解、更長的上下文窗口、能勝任更復(fù)雜的任務(wù)查詢,達(dá)成速度、效率和先進(jìn)AI能力的最佳平衡。
不過,雖然看上去是很長一段介紹,細(xì)嚼還是比較籠統(tǒng),并沒有指出具體的性能參數(shù)和改進(jìn)說明。也有抱持反對意見的業(yè)內(nèi)人士指出,GPT-4.5這個概念可能是由于“提示污染”造成的。
所謂提示污染(prompt pollution),就是指在大語言模型訓(xùn)練過程中,訓(xùn)練數(shù)據(jù)包含了一些不準(zhǔn)確或誤導(dǎo)性信息,從而導(dǎo)致其生成偏差或錯誤輸出。例如網(wǎng)絡(luò)上的虛假信息、或模型復(fù)制的人類主觀偏見等。
好比下圖這位網(wǎng)友的惡搞:“人們正在強(qiáng)迫ChatGPT說它跑的是GPT-4.5”。
按捺不住的網(wǎng)友直接跑去問Sam Altman本人: “gpt-4.5泄露到底是真的還是假的?”
結(jié)果得到了一個不太正式的否定回答:“nah?!?/p>
以Altman一貫捉摸不透的不羈風(fēng)格,這個“nah”引發(fā)無限聯(lián)想,讓大家更好奇了。繼續(xù)追問他是在否定價格還是gpt-4.5要出來這回事,更有人直接說“聽上去就像是 yes”。
事情還是很撲朔迷離,所以GPT-4.5的存在到底是幻覺還是真的?
實際上,新版本推出的消息并非空穴來風(fēng),早在這月初就已經(jīng)流傳網(wǎng)絡(luò)。
知名爆料賬號預(yù)告,坊間早有傳聞
12月6號,谷歌剛剛官宣Gemini 1.0后,著名OpenAI爆料賬號@apples_jimmy就在X發(fā)文稱:“我對即將發(fā)布的一些開源模型感到非常興奮,但請關(guān)注12月底可能發(fā)布的GPT-4.5版本,以及Anthropic的新多模態(tài)模型。”這個賬號曾預(yù)測過GPT-4發(fā)布日期,并在 The Information報道之前就提到了Gobi,所以一直被網(wǎng)友們當(dāng)成OpenAI的最新信息風(fēng)向標(biāo)。
另一位爆料大神@futureistflower隨即表示贊同,并且說,“OpenAI有一件大事和一件小事在等著我們,小事目前因為公司內(nèi)部的一些問題被推遲了,而大事似乎正按計劃推進(jìn)。12月依然讓人興奮,尤其是下周?!?/p>
從日期來看,“下周的一件小事”應(yīng)該是13號ChatGPT plus恢復(fù)用戶訂閱,這也確實是受到那出混亂狗血宮斗劇的影響?!按笫隆彼坪跽荊PT新版本的問世。
這個@futureistflower 爆料戰(zhàn)績也是可圈可點。10月份就提出,谷歌大模型Gemini會分為不同大小型號,Google Bard和多數(shù)谷歌產(chǎn)品會使用第二大的那個(Gemini Pro),而最高階版本(Gemini Ultra)開始并不會全面公開。從后續(xù)谷歌實際發(fā)布結(jié)果看來,每一條都預(yù)測對了。
網(wǎng)友猜想GPT-4.5“灰度上線”的合理性
當(dāng)然,堅信GPT-4.5已經(jīng)開始對用戶測試的網(wǎng)友也不僅僅是看爆料,而是自己切實體會到了不同。
許多GPT用戶前段時間都有個同感,就是GPT-4 “變懶了”。自從 11 月 6 號 OpenAI 舉辦開發(fā)者大會以來,陸續(xù)有網(wǎng)友發(fā)現(xiàn),ChatGPT 在指令遵循和問題解決能力上明顯下滑,經(jīng)常避開一些繁瑣任務(wù),甚至直接擺爛說自己不會回答。
賓夕法尼亞大學(xué)沃頓商學(xué)院教授Ethan Mollick就曾拿7月份問ChatGPT的同樣問題和11月對比,發(fā)推表示,“我重復(fù)了一些之前用代碼解釋器做的分析。GPT-4還是知道該怎么做,但它一直留下大量 ‘to do’讓我自己去完成工作。以前的一個步驟現(xiàn)在變成許多步驟,而且有些很奇怪?!?/p>
有用戶直接去OpenAI社區(qū)質(zhì)問為什么會這樣,于是ChatGPT官方親自下場解答,給出的原因是由于自從11月11號起就沒更新過模型,而模型的行為能力是不可預(yù)料的,目前內(nèi)部正在加緊修復(fù)。
不過就在大家并不買賬的時候,這些天,人們又忽然覺得GPT重新“絲滑”起來了。
Ethan Mollick再次發(fā)文,欣喜地表示“出于某種原因,GPT-4在幾周內(nèi)表現(xiàn)不穩(wěn)定且有些“遲鈍”之后,突然又變得非常好了。(雖然這也許是我最喜歡的互動:我讓 GPT為我創(chuàng)建文件,它堅稱自己做不到,我讓它試試,它就做了,請看看頂部的代碼注釋)”
也有更多網(wǎng)友聲稱,體會到了ChatGPT網(wǎng)頁版瀏覽體驗在變快變好,響應(yīng)質(zhì)量和準(zhǔn)確性都有所提升。似乎之前的拉胯正是為了全新的GPT-4.5做準(zhǔn)備,又或者OpenAI團(tuán)隊急于解決模型變懶的問題,于是使用GPT-4.5生成的數(shù)據(jù)去訓(xùn)練GPT-4,使得現(xiàn)在的GPT4-4被滲透自稱是4.5?
除此之外,一直以來OpenAI每月都會有大動作,從11月開發(fā)者日推出GPT-4 Turbo和GPTs沉寂至今,似乎并不是他們的傳統(tǒng)。結(jié)合谷歌剛剛發(fā)布的多模態(tài)大模型 Gemini,為了鞏固市場地位,怎么看也該搞點事情才符合OpenAI 的風(fēng)格。
看看ChatGPT官方昨天最新發(fā)的emoji表情,似乎給所有的猜測和未知又添了一把火。
一直以來,OpenAI的一舉一動都能攪翻如今的AI圈子,它就是自帶一種獨特的能力,可以撩動人們的神經(jīng)。
而居于突出AI玩家位置的OpenAI,也似乎并不在意給出明確的行業(yè)指引對整個AI生態(tài)的重要性。反而對于人們鋪天蓋地的討論和猜測樂在其中,享受這種被圍在聚光燈下模糊不清的“曖昧”。然后再忽然給公眾來個出其不意,輕松摘得人工智能大戲最佳主角。
其實,不論現(xiàn)在GPT-4.5泄露的傳言是真是假,一個更強(qiáng)大的多模態(tài)大模型即將到來都是板上釘釘?shù)氖?,與公眾見面只是時間問題。只是OpenAI擅長并習(xí)慣了吊大家的胃口??峙挛磥硭恳淮伟l(fā)布前,全網(wǎng)都要來一次類似“GPT-4.5到底存不存在”的討論了。
本文(含圖片)為合作媒體授權(quán)創(chuàng)業(yè)邦轉(zhuǎn)載,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。