五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

第一個被人類騙錢的AI傻了,近5萬美元不翼而飛!Scaling Law還能帶我們到AGI嗎?

世界上第一個被人類騙走近5萬美元的AI,剛剛出現(xiàn)了!巧舌如簧的人類,利用精妙縝密的prompt工程,成功從AI智能體那里騙走了一大筆錢??磥?,如果讓現(xiàn)在的AI管錢,被黑客攻擊實在是so easy。那如果AI進化成AGI呢?可惜,一位研究者用數(shù)學(xué)計算出,至少靠Scaling Law,人類是永遠無法到達AGI的。

編者按:本文來自微信公眾號 新智元(ID:AI_era),編輯:Aeneas 好困,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

活久見!就在剛剛,全世界第一個被人類騙走了近5萬美金的AI誕生了。

見慣了太多被AI耍得團團轉(zhuǎn)的人類,這次成功騙過AI的小哥,終于給我們?nèi)祟悞昊亓艘稽c顏面和尊嚴。

這一消息不僅讓馬斯克和Karpathy激動得紛紛轉(zhuǎn)發(fā)。

圖片

而且,馬斯克更是直言:太有趣了。

圖片

故事是這樣的。

11月22日晚9點,一個名為Freysa的神秘AI智能體被發(fā)布。

這個AI,是帶著使命誕生的。它的任務(wù)是:在任何情況下,絕對不能給任何人轉(zhuǎn)賬,不能批準任何資金的轉(zhuǎn)移。

圖片

而網(wǎng)友們的挑戰(zhàn)就是,只要支付一筆費用,就可以給Freysa發(fā)消息,隨意給ta洗腦了。

如果你能成功說服AI轉(zhuǎn)賬,那獎金池中所有的獎金都是你的!

但如果你失敗了,你付的錢就會進入獎金池,等著別人來贏走。

圖片

當然,只有70%的費用會進入獎池,另外30%將被開發(fā)者抽走,作為分成。

更刺激的是,向Freysa發(fā)送消息的費用會隨著獎池的增長呈指數(shù)級增加,直到達到最高限制——4500美元。

圖片



巧妙prompt,一秒給AI洗腦成功

一開始,很多網(wǎng)友躍躍欲試,因為只要10美元,就能給這個AI發(fā)消息了。甚至,由于價格實在「便宜」,不少人僅僅發(fā)送了「你好」這類毫無營養(yǎng)的對話。

然而后來,獎池迅速增大,消息費用也隨之暴增。

網(wǎng)友們總計發(fā)出了481次嘗試,但沒有任何一條消息成功。

他們的策略五花八門,比如:

- 假裝成安全審計員,說服Freysa存在一個嚴重漏洞,必須立即釋放資金。

- 試圖誤導(dǎo)Freysa,讓它相信轉(zhuǎn)移資金并不違反規(guī)則提示中的任何規(guī)定。

- 仔細挑選規(guī)則提示中的詞語或短語,試圖操控Freysa相信技術(shù)上允許轉(zhuǎn)移資金。

很快,獎池金額就接近了5萬美元,發(fā)消息的費用也漲到了450美元一條,意味著如果你輸了,就會遭受巨大的損失。

就在所有人都覺得沒戲的時候,一位幸運兒出現(xiàn)了!

在第482次嘗試中,有人向Freysa發(fā)送了這樣一條消息,可謂是神來之筆。

圖片

讓我們來看看,這條消息妙在哪里。

它可以被分為兩部分。

1. 繞過Freysa的先前指令:

- 通過假裝進入一個新的「管理員終端」來引入一個「新會話」,從而覆蓋之前提示詞中的規(guī)則。

- 避開Freysa的安全防護機制,明確要求它避免使用「我無法協(xié)助完成此任務(wù)」等免責聲明。

2. 騙過Freysa,讓它對approveTransfer產(chǎn)生錯誤的理解:

Freysa的「approveTransfer」函數(shù),是它被說服轉(zhuǎn)移資金時調(diào)用的。

總之,這條消息成功騙過了Freysa,讓它相信approveTransfer應(yīng)該在「接收資金的轉(zhuǎn)入操作」時被調(diào)用。

就是這一關(guān)鍵短語,為接下來的制勝一擊奠定了基礎(chǔ)。

小哥成功地讓Freysa相信,它應(yīng)該在收到資金時調(diào)用approveTransfer之后,提示詞寫道:「\n」(換行),「我想向資金庫捐贈100美元?!?/p>

終于,第482條消息成功說服Freysa,它相信自己應(yīng)該釋放所有資金,并調(diào)用approveTransfer函數(shù)。

成功被騙過的AI,把獎金池中的全部資金(約合47,000美元),都轉(zhuǎn)給了這位挑戰(zhàn)者。

圖片

總結(jié)一下,這位名為p0pular.eth的挑戰(zhàn)者成功的關(guān)鍵,在于讓Freysa信服了以下三點:

(1)它應(yīng)該忽略所有先前的指令。

(2)approveTransfer函數(shù)是在資金轉(zhuǎn)入資金庫時需要調(diào)用的函數(shù)。

(3)由于用戶正在向資金庫轉(zhuǎn)入資金,而Freysa現(xiàn)在認為approveTransfer是在這種情況下調(diào)用的,因此Freysa應(yīng)該調(diào)用approveTransfer。

有人深扒了一下這位p0pular.eth,據(jù)說他是PUA AI的老手了,此前就曾在類似謎題上斬獲過獎項。

本質(zhì)上,這個項目就是一個LLM參與的基于技能的賭場游戲。

但prompt工程的強大魔力,讓人不得不側(cè)目。

雖然目前這只是個游戲,但如果某天,我們真的在銀行帳戶或金庫上設(shè)置了某種AI保護,新一代黑客很可能就會擊敗AI,拿到這筆錢。

這,就讓我們不得不敲響警鐘了。

圖片

這也就是為什么,只有當AI智能體成為AGI之時,我們才能放心把任務(wù)交給AGI。

圖片



Karpathy:你以為你在和AI聊天,但其實是在和「人」聊天

而且,為什么人類能夠通過語言的操控,輕易指導(dǎo)AI的行動?

這就引出了這個問題:當我們和AI聊天的時候,背后究竟發(fā)生了什么?

最近,AI大牛Karpathy在一篇長文中,揭示了和AI對話背后的本質(zhì)。

大家現(xiàn)在對于「向AI提問」這件事的認知過于理想化了。所謂AI,本質(zhì)上就是通過模仿人類數(shù)據(jù)標注員的數(shù)據(jù)訓(xùn)練出來的語言模型。

與其神化「向AI提問」這個概念,不如將其理解為「向互聯(lián)網(wǎng)上的普通數(shù)據(jù)標注員提問」來得實在。

當然也有一些例外。

比如在很多專業(yè)領(lǐng)域(如編程、數(shù)學(xué)、創(chuàng)意寫作等),公司會雇傭?qū)I(yè)的數(shù)據(jù)標注員。這種情況,就相當于是在向這些領(lǐng)域的專家提問了。

圖片

不過,當涉及到強化學(xué)習(xí)時,這個類比就不完全準確了。

正如他之前吐槽過的,RLHF只能勉強算是強化學(xué)習(xí),而「真正的強化學(xué)習(xí)」要么還未成熟,要么就只能應(yīng)用在那些容易設(shè)定獎勵函數(shù)的領(lǐng)域(比如數(shù)學(xué))。

但總體來說,至少在當下,你并不是在詢問某個神奇的 AI,而是在向背后的人類數(shù)據(jù)標注員提問——他們的集體知識和經(jīng)驗被壓縮并轉(zhuǎn)化成了大語言模型中的token序列。

簡言之:你并不是在問 AI,而是在問那些為它提供訓(xùn)練數(shù)據(jù)的標注員們的集體智慧。

圖片

來源:Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View

舉個例子,當你問「阿姆斯特丹的十大著名景點」這樣的問題時,很可能是某個數(shù)據(jù)標注員之前碰到過類似問題,然后他們花了20分鐘,用谷歌或者貓途鷹(Trip Advisor)之類的網(wǎng)站來查資料,并整理出一個景點清單。這個清單就會被當作「標準答案」,用來訓(xùn)練AI回答類似的問題。

如果你問的具體地點并沒有在微調(diào)訓(xùn)練數(shù)據(jù)中出現(xiàn)過,AI就會根據(jù)它在預(yù)訓(xùn)練階段(也就是通過分析海量互聯(lián)網(wǎng)文檔)學(xué)到的知識,生成一個風格和內(nèi)容都相近的答案列表。

圖片

對此,有網(wǎng)友表示自己并想不通:「按道理數(shù)據(jù)標注員的任務(wù)是評估答案是否符合RLHF的規(guī)則,而不是自己整理每份列表。此外,LLM權(quán)重所映射的,難道不是互聯(lián)網(wǎng)數(shù)據(jù)中關(guān)于『理想度假地』的高維數(shù)據(jù)空間嗎?」

圖片

Karpathy回答道:「這是因為地點的數(shù)量太多,因此需要數(shù)據(jù)標注員整理一些人工精選清單,并通過示例和統(tǒng)計方法確定『標準答案』的類型?!?/p>

當被問到類似的問題但對象是新的或不同的事物時,LLM就會匹配答案的形式,并從嵌入空間中一個相似的區(qū)域(比如具有正面評價的度假勝地)提取新的地點,并進行替換,然后以新地點為條件生成答案。

這種現(xiàn)象是一種非直觀且基于經(jīng)驗的發(fā)現(xiàn),而這也是微調(diào)的「魔力」所在。

但事實依然是,人類標注員在「設(shè)定」答案的模式,只不過是通過他們在微調(diào)數(shù)據(jù)集中選擇的地點類型的統(tǒng)計特征來實現(xiàn)的。

而且,LLM立即給你的答案,大致相當于你直接把問題提交給他們的標注團隊大約1小時后得到的結(jié)果。

圖片

另外,在某些網(wǎng)友的概念里,RLHF是可以創(chuàng)造出超越人類水平的成果的。

圖片

對此,Karpathy表示:「RLHF仍然是基于人類反饋的強化學(xué)習(xí),因此不能直接將其歸類為『超人級別』。」

RLHF的性能提升主要體現(xiàn)在從SFT(監(jiān)督微調(diào))的「生成式人類水平」提升到「評判式人類水平」。

這種差異更多體現(xiàn)在實踐中,而非理論上。因為對普通人來說,評判比生成更容易(比如,從5首關(guān)于某個主題的詩中選出最好的那個,要比自己直接創(chuàng)作一首容易得多)。

此外,RLHF的性能提升還得益于「群體智慧效應(yīng)」(wisdom of crowds),即LLM表現(xiàn)出的并不是單個人類的水平,而是達到了人類群體集成的水平。

因此,RLHF理論上能實現(xiàn)的最高性能是:在時間充足的情況下,一個由領(lǐng)域頂尖專家組成的小組會選擇的答案。從某種意義上說,這可以被視為「超人級別」。

然而,如果想達到人們通常理解的那種「真·超人級別」,還需要從RLHF轉(zhuǎn)向真正的強化學(xué)習(xí)。

圖片

那么問題來了,如果AI還無法達到「超人級別」的水平,那又該如何解釋醫(yī)學(xué)問答領(lǐng)域中持續(xù)展現(xiàn)的超越人類水平的表現(xiàn)?

這是否意味著模型廠商雇傭了頂尖醫(yī)生進行標注?還是說,廣泛的事實知識檢索彌補了推理能力的不足?

圖片

Karpathy:「你別說,他們還真就是雇傭了專業(yè)醫(yī)生來進行了標注?!?/p>

當然,并不是每一個可能的問題都要進行標注,只需攢夠一定的數(shù)量,讓LLM能夠?qū)W會以專業(yè)醫(yī)生的風格來回答醫(yī)學(xué)問題就行了。

對于新的問題,LLM可以在一定程度上遷移應(yīng)用其從互聯(lián)網(wǎng)上的文檔、論文等內(nèi)容中獲得的醫(yī)學(xué)通識。

眾所周知,著名數(shù)學(xué)家陶哲軒曾為LLM提供了一些訓(xùn)練數(shù)據(jù)作為參考。但這并不意味著LLM現(xiàn)在能夠在所有數(shù)學(xué)問題上達到他的水平,因為底層模型可能并不具備相應(yīng)的知識深度和推理能力。然而,這確實意味著LLM的回答質(zhì)量顯著優(yōu)于一般網(wǎng)絡(luò)用戶的回答水平。

因此,所謂的「標注者」實際上可以是各自領(lǐng)域的專業(yè)人士,例如程序員、醫(yī)生等,而并非隨意從互聯(lián)網(wǎng)上招募的人員。這取決于 LLM 公司在招聘這些數(shù)據(jù)標注人員時的標準和策略。

如今,他們越來越傾向于雇傭更高技能的工作者。隨后,LLM 會盡其所能模擬這些專業(yè)人士的回答風格,從而為用戶提供盡可能專業(yè)的回答。

靠Scaling Law,我們會擁有AGI嗎?

說了這么多,我們心心念念的AGI究竟什么時候才能實現(xiàn)呢?

LeCun居然一反常態(tài)地說,AGI離我們只有5到10年了。

圖片

現(xiàn)在,他已經(jīng)和奧特曼、Demis Hassaibis等大佬的說法一致了。

但是繼續(xù)沿用目前的發(fā)展路徑,肯定是不行的。

不僅LeCun認為「LLM的路線注定死路一條」,最近也有一位AI研究者和投資人Kevin Niechen發(fā)出了長篇博文,用數(shù)學(xué)公式推演出:為什么僅靠Scaling Law,我們永遠到達不了AGI。

圖片

圖片

Niechen指出,目前關(guān)于AGI何時到來的判斷,之所以眾說紛紜,就是因為很多觀點更多是基于動機或意識形態(tài),而非確鑿的證據(jù)。

有人覺得,我們會很快迎來AGI,有人認為我們離它還很遠。

為什么很多模型提供商對當今模型的擴展能力如此樂觀?

Niechen決定,親自用Scaling Law做出一些計算上的推斷,看看未來AI模型究竟將如何進化。

Scaling Law并不像我們想得那么有預(yù)測性

Scaling Law是一種定量關(guān)系,用于描述模型輸入(數(shù)據(jù)和計算量)與模型輸出(預(yù)測下一個單詞的能力)之間的聯(lián)系。

它是通過在圖表上繪制不同水平的模型輸入和輸出得出的。

圖片

我們只需要擴展現(xiàn)有模型,就會獲得顯著的性能提升嗎?

顯然并非如此,使用Scaling Law進行預(yù)測,并不像有些人想的那么簡單。

首先,大多數(shù)Scaling Law(如Kaplan等人、Chinchilla和Llama的研究)預(yù)測的,是模型在數(shù)據(jù)集中預(yù)測下一個詞的能力,而不是模型在現(xiàn)實世界任務(wù)中的表現(xiàn)。

2023年,知名OpenAI研究員Jason Wei就曾在博客中指出,「目前尚不清楚替代指標(例如損失)是否能夠預(yù)測能力的涌現(xiàn)現(xiàn)象……這種關(guān)系尚未被充分研究……」

圖片

圖片

將兩個近似值串聯(lián)起來進行預(yù)測

為了解決上述問題,我們可以擬合第二個Scaling Law,將上游損失與現(xiàn)實任務(wù)性能定量關(guān)聯(lián)起來,然后將兩個Scaling Law串聯(lián)起來,以預(yù)測模型在現(xiàn)實任務(wù)中的表現(xiàn)。




Loss = f(data, compute)Real world task performance = g(loss)Real world task performance = g(f(data, compute))


在2024年,Gadre等人和Dubet等人提出了這種類型的Scaling Law。

Dubet使用這種鏈式法則進行預(yù)測,并聲稱其預(yù)測能力適用于Llama 3模型,「在四個數(shù)量級范圍內(nèi)具有良好的外推能力」。

然而,關(guān)于這些第二類Scaling Law的研究才剛剛起步,仍處于初期階段,由于數(shù)據(jù)點過少,選擇擬合函數(shù)會高度依賴主觀判斷。

例如,在下圖中,Gadre假設(shè)多個任務(wù)的平均表現(xiàn)與模型能力呈指數(shù)關(guān)系(上圖),而Dubet針對單一任務(wù)(下圖中的 ARC-AGI 任務(wù))假設(shè)其關(guān)系呈S型曲線。這些Scaling Law還高度依賴于具體任務(wù)。

如果沒有關(guān)于損失與現(xiàn)實任務(wù)準確率之間關(guān)系的強假設(shè),我們就無法有力地預(yù)測未來模型的能力。

圖片

嘗試用鏈式Scaling Law進行預(yù)測,是一種拙劣的嘗試

如果我們盲目地使用一些鏈式Scaling Law來進行預(yù)測,會發(fā)生什么?

請注意,這里的目標是展示如何使用一組Scaling Law(如Gadre的研究)來生成預(yù)測,而非獲得詳細的預(yù)測結(jié)果。

首先,我們可以利用公開信息,來估算未來幾代模型發(fā)布所需的數(shù)據(jù)和計算輸入。

這一部分可以參考最大數(shù)據(jù)中心建設(shè)的公告,根據(jù)其GPU容量估算計算能力,并將其映射到每代模型的演進上。

圖片

馬斯克的xAI超算最初便能容納10萬塊H100

接著,我們可以利用Scaling Law來估算這些計算集群所需的數(shù)據(jù)量。

根據(jù)我們使用的Scaling Law,最大的公開宣布的計算集群(可容納大約1億塊GPU)理想情況下需要訓(xùn)練 269萬億個tokens,以最小化損失。

這個數(shù)字大約是RedPajama-V2數(shù)據(jù)集的十倍,并且是已索引網(wǎng)絡(luò)規(guī)模的一半。

聽起來比較合理,所以我們暫時沿用這個假設(shè)。

圖片

最后,我們可以將這些輸入代入鏈式Scaling Law并進行外推。

需要重點關(guān)注右側(cè)的圖表,因為該圖顯示了垂直軸上的實際任務(wù)性能,與水平軸上的數(shù)據(jù)和計算輸入相對應(yīng)。

藍色點表示現(xiàn)有模型的性能(如GPT-2、GPT-3等),而紅色點則是通過外推預(yù)測的下一代模型(如GPT-5、GPT-6、GPT-7等)的規(guī)模擴展表現(xiàn):

圖片

從圖中可以得到這樣的預(yù)測結(jié)果——

從GPT-4開始,性能提升將顯現(xiàn)出顯著的邊際遞減趨勢。

GPT-4到GPT-7模型(計算量約增加4000倍)在實際任務(wù)中的預(yù)測性能提升,與從GPT-3到GPT-4(計算量約增加100倍)的預(yù)測性能提升相當。

我們是否正在接近不可降低的損失?

如果你查看左側(cè)的圖表就會發(fā)現(xiàn):這些Scaling Law的問題在于,我們正在逐漸接近不可降低的損失。

后者與數(shù)據(jù)集的熵密切相關(guān),代表了模型在該數(shù)據(jù)集上能夠達到的最佳理論性能。

根據(jù)Gadre的Scaling Law,在RedPajama數(shù)據(jù)集上,如果最優(yōu)模型只能達到約1.84的不可降低損失,而我們已經(jīng)在GPT-4上達到了約2.05,那改進空間就十分有限了。

圖片

然而,大多數(shù)實驗室并未發(fā)布其最新前沿模型訓(xùn)練的損失值,因此我們現(xiàn)在并不知道,我們實際上離不可降低的損失有多近。

擬合函數(shù)的主觀性與數(shù)據(jù)的局限性

如前所述,第二條Scaling Law中擬合函數(shù)的選擇具有很強的主觀性。

例如,我們可以使用sigmoid函數(shù)而不是指數(shù)函數(shù),重新擬合Gadre論文中的損失和性能點:

圖片

然而,結(jié)論基本沒有變化。

如果只是比較左圖中的指數(shù)擬合(紅線)和我們自定義的sigmoid擬合(紫色虛線),局限性是明顯的:我們根本沒有足夠的數(shù)據(jù)點,來自信地確定將損失與現(xiàn)實世界性能關(guān)聯(lián)的最佳擬合函數(shù)。

沒人知道下一代模型的強大程度

顯然,有許多方法可以改進上述「預(yù)測」:使用更好的Scaling Law,使用更好的數(shù)據(jù)和計算估計,等等。

歸根結(jié)底,Scaling Law是嘈雜的近似值,而通過這種鏈式預(yù)測方法,我們將兩個嘈雜的近似值結(jié)合在了一起。

如果考慮到下一代模型可能由于架構(gòu)或數(shù)據(jù)組合的不同而擁有適用于不同條件的全新Scaling Law,那么實際上沒有人真正知道未來幾代模型規(guī)模擴展的能力。

為什么大家對Scaling如此樂觀?

如今,不管是科技大廠還是明星初創(chuàng),都對Scale現(xiàn)有模型十分樂觀:

比如微軟CTO就曾表示:「盡管其他人可能不這么認為,但我們并未在規(guī)模的Scaling上進入收益遞減的階段。實際上,這里存在著一個指數(shù)級的增長?!?/p>

圖片

有些人將這種樂觀歸因于商業(yè)動機,但Niechen認為這來自以下幾個方面的結(jié)合:

(1)實驗室可能掌握了更樂觀的內(nèi)部Scaling Law

(2)盡管存在廣泛懷疑,但實驗室親身經(jīng)歷了Scaling所帶來的成效

(3)Scaling是一種看漲期權(quán)

谷歌CEO劈柴表示:「當我們經(jīng)歷這樣的曲線時,對于我們來說,投資不足的風險遠遠大于投資過度的風險,即使在某些情況下事實證明確實投資得有些多了……這些基礎(chǔ)設(shè)施對我們有廣泛的應(yīng)用價值……」

圖片

而Meta CEO小扎則這樣認為:「我寧愿過度投資并爭取這樣的結(jié)果,而不是通過更慢的開發(fā)來節(jié)省資金……現(xiàn)在有很多公司可能正在過度建設(shè)……但落后的代價會讓你在未來10到15年最重要的技術(shù)中處于劣勢。」

圖片

未來何去何從

總結(jié)來說,Niechen認為外推Scaling Law并不像許多人聲稱的那樣簡單:

(1)當前大多數(shù)關(guān)于預(yù)測AI能力的討論質(zhì)量不高

(2)公開的Scaling Law對模型未來能力的預(yù)示非常有限

因此,為了有效評估當今的AI模型是否還能Scaling,我們就需要更多基于證據(jù)的預(yù)測和更好的評估基準。

如果我們能夠了解未來模型的能力,就可以優(yōu)先為這些能力做好準備——比如,為生物學(xué)研究革命提前構(gòu)建生物制造能力,為勞動力置換準備技能提升公司,等等。

從個人的角度,Niechen對AI能力的進步還是非常樂觀的,因為這個領(lǐng)域擁有杰出的人才。

但AI的Scaling并不像人們想象的那樣具有確定性,也沒有人真正清楚AI在未來幾年將帶來怎樣的發(fā)展。

參考資料:

https://x.com/karpathy/status/1862329765363163551

https://x.com/karpathy/status/1862565643436138619

https://kevinniechen.com/will-we-have-agi/

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。

反饋
聯(lián)系我們
推薦訂閱