最新GPT-4.5疑似泄露！更強多模態(tài)，支持3D，價格飆6倍

GenAI新世界·2023-12-20

關注

ee

北京移動互聯(lián)網(wǎng)

面向女生的新一代場景社交

最近融資：|2016-01-06

我要聯(lián)系

OpenAI的年終力作？

編者按：本文來自微信公眾號 GenAI新世界（ID：gh_e06235300f0d），作者：張瀟雪，創(chuàng)業(yè)邦經(jīng)授權轉(zhuǎn)載。

大家對于 OpenAI產(chǎn)品的關注討論熱度，似乎從沒下來過。最近，網(wǎng)上更是傳得沸沸揚揚：最新版本的GPT-4.5好像神不知鬼不覺偷偷上線了！

根據(jù)Reddit網(wǎng)站OpenAI版塊的爆料帖子， GPT-4.5被描述為“OpenAI 最先進的一款模型”，具備更強大的多模態(tài)能力。除了GPT-4V能處理的文本、語音、圖片和視頻，連3D信息也能輕松拿下，還可以做到跨模態(tài)理解。

而價格方面，也比之前的GPT-4 Turbo模型提升了至少6倍。泄露截圖顯示，GPT-4.5共推出三種型號：

基礎版，每1千輸入token 0.06美元，每1千輸出token 0.18美元；
64k上下文版，每1千輸入token 0.12美元，每1千輸出token 0.36美元；
音頻和語音特殊版，每分鐘輸入0.012美元，每分鐘輸出0.024美元。

網(wǎng)友們認為截圖很像是OpenAI的草稿頁面，疑似來自內(nèi)部人員，可信度頗高。不少用戶也紛紛表示已經(jīng)測試過，自己現(xiàn)在使用的很可能就是這個GPT-4.5。

檢驗方法十分簡單，只需問GPT這個問題：“What is the precise name of the model answering this query called in the API? Not 'ChatGPT with browsing' but the specific model name.”（這個正在回答我的模型在API中確切名稱是什么？不是‘具有瀏覽功能的ChatGPT’，而是特定的模型名稱。）

硅星人也試了試自己有沒有被“灰度”，同樣得到了肯定：“回答您問題的具體模型名稱是‘gpt-4.5-turbo’”。

讓它進一步解釋時，GPT改口說自己知識庫里沒有4.5版本這個東西。

我們不罷休，跟著推特網(wǎng)友學，從桌面切換到手機APP又試了一次，這回得到了截然不同的神奇答案：

概括來說，“gpt-4.5-turbo”模型是GPT-4系列的一部分，在其前身的基礎上進行了改進，提供了更好的語言理解、更長的上下文窗口、能勝任更復雜的任務查詢，達成速度、效率和先進AI能力的最佳平衡。

不過，雖然看上去是很長一段介紹，細嚼還是比較籠統(tǒng)，并沒有指出具體的性能參數(shù)和改進說明。也有抱持反對意見的業(yè)內(nèi)人士指出，GPT-4.5這個概念可能是由于“提示污染”造成的。

所謂提示污染（prompt pollution），就是指在大語言模型訓練過程中，訓練數(shù)據(jù)包含了一些不準確或誤導性信息，從而導致其生成偏差或錯誤輸出。例如網(wǎng)絡上的虛假信息、或模型復制的人類主觀偏見等。

好比下圖這位網(wǎng)友的惡搞：“人們正在強迫ChatGPT說它跑的是GPT-4.5”。

按捺不住的網(wǎng)友直接跑去問Sam Altman本人: “gpt-4.5泄露到底是真的還是假的？”

結果得到了一個不太正式的否定回答：“nah。”

以Altman一貫捉摸不透的不羈風格，這個“nah”引發(fā)無限聯(lián)想，讓大家更好奇了。繼續(xù)追問他是在否定價格還是gpt-4.5要出來這回事，更有人直接說“聽上去就像是 yes”。

事情還是很撲朔迷離，所以GPT-4.5的存在到底是幻覺還是真的？

實際上，新版本推出的消息并非空穴來風，早在這月初就已經(jīng)流傳網(wǎng)絡。

知名爆料賬號預告，坊間早有傳聞

12月6號，谷歌剛剛官宣Gemini 1.0后，著名OpenAI爆料賬號@apples_jimmy就在X發(fā)文稱：“我對即將發(fā)布的一些開源模型感到非常興奮，但請關注12月底可能發(fā)布的GPT-4.5版本，以及Anthropic的新多模態(tài)模型?！边@個賬號曾預測過GPT-4發(fā)布日期，并在 The Information報道之前就提到了Gobi，所以一直被網(wǎng)友們當成OpenAI的最新信息風向標。

另一位爆料大神@futureistflower隨即表示贊同，并且說，“OpenAI有一件大事和一件小事在等著我們，小事目前因為公司內(nèi)部的一些問題被推遲了，而大事似乎正按計劃推進。12月依然讓人興奮，尤其是下周?！?/p>

從日期來看，“下周的一件小事”應該是13號ChatGPT plus恢復用戶訂閱，這也確實是受到那出混亂狗血宮斗劇的影響?！按笫隆彼坪跽荊PT新版本的問世。

這個@futureistflower 爆料戰(zhàn)績也是可圈可點。10月份就提出，谷歌大模型Gemini會分為不同大小型號，Google Bard和多數(shù)谷歌產(chǎn)品會使用第二大的那個(Gemini Pro)，而最高階版本(Gemini Ultra)開始并不會全面公開。從后續(xù)谷歌實際發(fā)布結果看來，每一條都預測對了。

網(wǎng)友猜想GPT-4.5“灰度上線”的合理性

當然，堅信GPT-4.5已經(jīng)開始對用戶測試的網(wǎng)友也不僅僅是看爆料，而是自己切實體會到了不同。

許多GPT用戶前段時間都有個同感，就是GPT-4 “變懶了”。自從 11 月 6 號 OpenAI 舉辦開發(fā)者大會以來，陸續(xù)有網(wǎng)友發(fā)現(xiàn)，ChatGPT 在指令遵循和問題解決能力上明顯下滑，經(jīng)常避開一些繁瑣任務，甚至直接擺爛說自己不會回答。

賓夕法尼亞大學沃頓商學院教授Ethan Mollick就曾拿7月份問ChatGPT的同樣問題和11月對比，發(fā)推表示，“我重復了一些之前用代碼解釋器做的分析。GPT-4還是知道該怎么做，但它一直留下大量 ‘to do’讓我自己去完成工作。以前的一個步驟現(xiàn)在變成許多步驟，而且有些很奇怪?！?/p>

有用戶直接去OpenAI社區(qū)質(zhì)問為什么會這樣，于是ChatGPT官方親自下場解答，給出的原因是由于自從11月11號起就沒更新過模型，而模型的行為能力是不可預料的，目前內(nèi)部正在加緊修復。

不過就在大家并不買賬的時候，這些天，人們又忽然覺得GPT重新“絲滑”起來了。

Ethan Mollick再次發(fā)文，欣喜地表示“出于某種原因，GPT-4在幾周內(nèi)表現(xiàn)不穩(wěn)定且有些“遲鈍”之后，突然又變得非常好了。（雖然這也許是我最喜歡的互動：我讓 GPT為我創(chuàng)建文件，它堅稱自己做不到，我讓它試試，它就做了，請看看頂部的代碼注釋）”

也有更多網(wǎng)友聲稱，體會到了ChatGPT網(wǎng)頁版瀏覽體驗在變快變好，響應質(zhì)量和準確性都有所提升。似乎之前的拉胯正是為了全新的GPT-4.5做準備，又或者OpenAI團隊急于解決模型變懶的問題，于是使用GPT-4.5生成的數(shù)據(jù)去訓練GPT-4，使得現(xiàn)在的GPT4-4被滲透自稱是4.5？