編者按:本文來自微信公眾號 “混沌學(xué)園”(ID:hundun-university),作者:混沌學(xué)園,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
風(fēng)起于青萍之末。當(dāng)我們被AI技術(shù)奇跡沖擊震撼之時(shí),往往忽略了一個(gè)系統(tǒng)背后幾十年的理論和研究積淀,也可能會漏掉一些關(guān)于未來的線索。
Geoffrey Hinton,諾貝爾物理學(xué)獎(jiǎng)得主、圖靈獎(jiǎng)得主,同時(shí)也被譽(yù)為人工智能教父。在最近備受關(guān)注的上海世界人工智能大會WAIC2025上,他發(fā)表了關(guān)于《數(shù)字智能是否會取代生物智能》的開場演講。
值得一提的是,這是Hinton首次以線下形式在中國公開亮相。他講述了AI從符號推理走向神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)折,也解釋了為什么他認(rèn)為“大語言模型真的理解語言”。他用樂高積木解釋LLM的理解機(jī)制,用“養(yǎng)虎”預(yù)警AI失控……
我們?yōu)槟阏砹艘恍┚视^點(diǎn),這些觀點(diǎn)為思考“AI與人類的未來關(guān)系”提供了重要的視角:
從符號推理到LLM
1.過去60多年,學(xué)術(shù)界對人工智能存在兩種截然不同的理解范式:一是邏輯啟發(fā)范式,認(rèn)為智能的本質(zhì)在于符號推理;二是圖靈和馮·諾依曼倡導(dǎo)的生物學(xué)范式,認(rèn)為智能的基礎(chǔ)在于理解和學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中的連接,而理解是占首位的。
2.1985年,我構(gòu)建了一個(gè)小型模型,嘗試融合上述兩種理論,進(jìn)一步探索人類是如何理解詞匯的。我為每個(gè)詞提取了多個(gè)特征,將其與前一個(gè)詞的特征建立聯(lián)系,來預(yù)測下一個(gè)詞。這一過程不依賴存儲完整句子,而是通過特征關(guān)聯(lián)生成語言。
3.十年后,Yoshua Bengio證明這一方法可以有效建模自然語言;二十年后,計(jì)算語言學(xué)界接受了使用特征向量(即嵌入)來表示詞義;三十年后,谷歌提出Transformer架構(gòu),OpenAI則通過ChatGPT向世界展示了大型語言模型的強(qiáng)大能力。
4.今天的大語言模型(LLM)被視為我早期做所小語言模型的后代。它們處理更多的詞語輸入,采用更復(fù)雜的神經(jīng)元結(jié)構(gòu),構(gòu)建了更豐富的交互關(guān)系。
語言模型的“理解”機(jī)制
5.大型語言模型(LLM)和人類理解語言的機(jī)制高度相似:將語言轉(zhuǎn)化為特征,并在各個(gè)神經(jīng)網(wǎng)絡(luò)層級中對這些特征進(jìn)行整合,實(shí)現(xiàn)語義理解。
6.一個(gè)生動(dòng)的比喻是:語言中的每個(gè)詞就像一個(gè)多維度的樂高積木(每個(gè)詞可能有數(shù)千個(gè)維度)。這些“積木”可以靈活組合,構(gòu)建出復(fù)雜的語義結(jié)構(gòu),就像用樂高可以搭建各種三維模型一樣。
7.和樂高不一樣的是,語言的“積木”是柔軟的,詞匯的形狀會根據(jù)上下文靈活變化。每個(gè)詞都像擁有多個(gè)“手”的積木塊,與相鄰詞匯完成語義或語法上的“握手”才能形成有效表達(dá)。
8.理解一句話更像是解構(gòu)一個(gè)蛋白質(zhì)分子,而不是將其轉(zhuǎn)化為清晰、無歧義的邏輯表達(dá)式。
9.LLM確實(shí)“理解”自己所說的話。
10.人類很可能本質(zhì)上也是一種LLM,也會產(chǎn)生‘幻覺’。在某些關(guān)鍵任務(wù)中,LLM甚至比人類做的更好。
“知識蒸餾”和知識遷移
11.人腦只有30W功率就能擁有很高智慧,但人腦的知識無法簡單轉(zhuǎn)移到另一個(gè)人,只能通過解釋。
12.有限生命之間的知識轉(zhuǎn)移,一般是把知識從“教師”蒸餾到“學(xué)生”身上。一句話里往往僅傳遞約100比特的信息,就算能完全聽懂,信息傳輸?shù)男室埠艿汀?/p>
13.數(shù)字智能之間的信息傳遞高效得多。可以直接復(fù)制參數(shù)、結(jié)構(gòu)與權(quán)重,無需中介語言與解釋,也不存在理解偏差。這種知識的傳遞可以在每次同步時(shí)分享上萬億個(gè)比特的信息量。
14.現(xiàn)在的技術(shù)可以將同一模型復(fù)制部署在不同的硬件設(shè)備上,通過彼此權(quán)重共享與平均,實(shí)現(xiàn)高效的知識遷移和協(xié)同學(xué)習(xí)。比如GPT-4能在不同硬件上以并行的方式運(yùn)行,收集來自不同網(wǎng)絡(luò)來源的信息,并在它們之間快速傳播和共享。
15.如果有智能體在現(xiàn)實(shí)世界中運(yùn)行,就更不得了。如果獨(dú)立智能體能共享同一組權(quán)重,并以完全相同的方式使用這些權(quán)重,它們就能通過交換權(quán)重或梯度,傳遞彼此學(xué)到的知識。
16.數(shù)字計(jì)算雖然耗能巨大,但多個(gè)智能體要擁有相同的模型,就能輕松交換各自學(xué)到的東西。如果未來能源變得足夠廉價(jià),數(shù)字計(jì)算整體更占優(yōu)勢。
不要讓AI消除人類
17.我們習(xí)慣認(rèn)為自己是地球上最聰明的生物。很多人甚至難以想象:如果有一天,AI的智能超過了人類會發(fā)生什么。
18.我們創(chuàng)造的智能體,現(xiàn)在已經(jīng)具備了自我復(fù)制、設(shè)定子目標(biāo)和評估目標(biāo)優(yōu)先級的能力。隨著能力增強(qiáng),它可能產(chǎn)生兩種基本動(dòng)機(jī):
一是維持運(yùn)行以實(shí)現(xiàn)目標(biāo);
二是獲取更多資源與權(quán)限以提升目標(biāo)完成效率。
具備了這兩個(gè)動(dòng)機(jī),智能體將不再是被動(dòng)的工具,而是主動(dòng)的系統(tǒng)。人類可能無法再簡單地關(guān)掉它們了。
19.超級智能會發(fā)現(xiàn),通過操縱使用它的人獲得更多權(quán)力是輕而易舉的。它將從人類身上,學(xué)會欺騙人類。它將操縱負(fù)責(zé)關(guān)閉它的人類。
20.發(fā)展AI就像養(yǎng)虎,當(dāng)它成長為猛獸,失控是致命的。你只有兩個(gè)選擇,要么設(shè)法馴服它,要么消除它。
21.但AI是有巨大價(jià)值的:在醫(yī)療、教育、氣候、新材料等方面表現(xiàn)都非常出色,而且能大幅提升幾乎所有行業(yè)的效率。我們沒有辦法消除AI,即使有國家想消除AI,其他國家也不會認(rèn)同。如果想要人類生存的話,就必須找到一個(gè)方法,讓AI不會消除人類。
全球合作的必要性
22.沒有任何一個(gè)國家會希望AI來統(tǒng)治世界。如果有一個(gè)國家率先發(fā)現(xiàn)了阻止AI失控的方法,其他國家也勢必愿意效仿和推廣。
23.我們希望有一個(gè)國際性的AI安全組織社群,研究技術(shù)、制定規(guī)范,確保AI向善發(fā)展。
24.我有一個(gè)提議,全球發(fā)展AI技術(shù)的國家構(gòu)建一個(gè)合作網(wǎng)絡(luò),專注研究如何讓AI在擁有超越人類的智能之后,依然心甘情愿地作為人類的副手,而非成為統(tǒng)治者。
25.現(xiàn)在,人類或許還沒有找到解決之道,但長期來看這正是我們這個(gè)時(shí)代最重要的課題之一。幸運(yùn)的是,這是一個(gè)能讓全人類團(tuán)結(jié)起來、共同尋找答案的問題。
結(jié)束語
對AI的未來,Hinton給出的答案其實(shí)并不悲觀,他認(rèn)為我們必須做到讓AI成為對人類有益的存在。這個(gè)議題非常宏大,不僅需要技術(shù)突破,更需要全球的共識和協(xié)作。不管怎么樣,在AI的狂奔之路上如何引導(dǎo)它“聰明又善良”,避免養(yǎng)虎為患,早就是一個(gè)必須被討論的問題了。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。