1
深夜,躺在床上一遍遍反復(fù)觀看谷歌官宣的Gemini演示視頻,久久無(wú)法入眠。
人類工程師把紙放在了桌子上,它馬上說(shuō)“我看見(jiàn)你把一張紙放在了桌子上”,人類又在紙上畫了一條線,它馬上識(shí)別“我看到一條波浪線”。此后隨著人類不斷完善畫作,它跟著解讀畫作,絲毫無(wú)差。不僅僅可以識(shí)別人類動(dòng)作,在此過(guò)程中它可以和人類進(jìn)行實(shí)時(shí)互動(dòng)。
以上,只是牛刀小試。接下來(lái),人類工程師和Gemini進(jìn)行了基于各自場(chǎng)景的對(duì)話、互動(dòng)、做游戲,Gemini的表現(xiàn)完全就像一個(gè)超級(jí)博學(xué)的真人一樣,盡管這些演示視頻經(jīng)過(guò)人為剪輯,但依然讓我懷疑背后有真人假裝AI在和人類工程師對(duì)話。
我把谷歌的演示視頻發(fā)給完全沒(méi)聽過(guò)AI、人工智能、大模型這些概念的家人觀看,家人以為這是兩個(gè)沒(méi)有露面的人在對(duì)話。
驀地里,一股既欣喜又絕望的情緒涌上心頭:人工智能將全方位超越/替代人類,這還有任何疑問(wèn)嗎?
如果說(shuō)第一次看到GPT,就像第一次看喬峰施展降龍十八掌,猶如“羿射九日,雷霆震怒” ,石破天驚,徹底被震傻。這次看到Gemini,就如同看到風(fēng)清揚(yáng)施展“無(wú)招勝有招”,不滯于物,草木竹石均可為劍,無(wú)可無(wú)不可。
2
有必要說(shuō)明,橫空出世的Gemini不完全是一個(gè)新物種,而是過(guò)往技術(shù)的集大成者,有非常悠久的歷史傳承。
谷歌很早就對(duì)人工智能進(jìn)行了深度布局。
2011年,谷歌大腦項(xiàng)目啟動(dòng)。作為谷歌內(nèi)部的秘密項(xiàng)目,其目的是構(gòu)建一套模擬人類大腦的計(jì)算機(jī)系統(tǒng),進(jìn)行各種機(jī)器學(xué)習(xí)任務(wù)的研究。這個(gè)項(xiàng)目最初由斯坦福大學(xué)計(jì)算機(jī)科學(xué)教授吳恩達(dá)(Andrew Ng)領(lǐng)導(dǎo),他帶領(lǐng)的團(tuán)隊(duì)使用1.6萬(wàn)個(gè)CPU核心和數(shù)十億個(gè)數(shù)據(jù)連接構(gòu)建了一個(gè)神經(jīng)網(wǎng)絡(luò),成功地識(shí)別出了貓的圖片。這個(gè)成果展示了深度學(xué)習(xí)的潛力,當(dāng)年引發(fā)了業(yè)界的廣泛關(guān)注。
2014年1月,谷歌斥資4億美元收購(gòu)人工智能初創(chuàng)企業(yè)DeepMind。DeepMind創(chuàng)辦于2010年,這個(gè)公司致力于將機(jī)器學(xué)習(xí)和系統(tǒng)神經(jīng)科學(xué)的最先進(jìn)技術(shù)結(jié)合起來(lái),建立強(qiáng)大的通用學(xué)習(xí)算法。DeepMind的成名來(lái)自于2016年的那場(chǎng)比賽,當(dāng)時(shí)DeepMind推出的AlphaGo圍棋機(jī)器人,以4:1擊敗韓國(guó)圍棋冠軍李世石,引發(fā)全球關(guān)注,這場(chǎng)比賽被譽(yù)為人工智能發(fā)展史上的里程碑事件。
稍顯遺憾的是,作為全球發(fā)力人工智能最早的公司之一,谷歌卻趕了大模型時(shí)代的晚集。當(dāng)OpenAI推出的ChatGPT大殺四方時(shí),谷歌先是觀望了一段時(shí)間,直到GPT4.0發(fā)布,谷歌徹底被打醒,莫非我們點(diǎn)錯(cuò)了科技樹?
痛定思痛的谷歌在GPT4.0發(fā)布的次月,做了一項(xiàng)重大調(diào)整:將谷歌大腦和DeepMind合并在了一起!
通過(guò)匯合兩個(gè)實(shí)驗(yàn)室的力量,加速攻關(guān)Gemini的研發(fā)。這種組織形式的變化,實(shí)現(xiàn)了1+1大于2的效果,減少了不必要的內(nèi)耗和路線沖突,更有助于提升研發(fā)效率和應(yīng)用效果。與此同時(shí),早已退休的谷歌創(chuàng)始人兼大股東謝爾蓋·布林再次出山,親自參與其中,督戰(zhàn)研發(fā)進(jìn)展。最終我們就看到了,Gemini破石而出。
所以,那些說(shuō)谷歌蹭熱點(diǎn)的朋友,真應(yīng)該好好了解下這段歷史。
3
Gemini演示視頻一經(jīng)發(fā)布,谷歌股票開啟暴漲模式。一夜之間,僅僅上漲的部分就比百度的總市值還高。
Gemini聲稱該模型在一系列智力測(cè)試中的表現(xiàn)優(yōu)于OpenAI的GPT-4模型和“專家級(jí)”人類。
顯然,Gemini也是一個(gè)多模態(tài)大模型,這意味著它可以泛化并理解、操作和組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。
這種多模態(tài)的處理能力使得Gemini具有更廣泛的應(yīng)用場(chǎng)景,可以更好地滿足用戶的需求。無(wú)論是在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等領(lǐng)域,Gemini都能夠發(fā)揮出強(qiáng)大的能力。據(jù)悉,Gemini的研發(fā)過(guò)程中,谷歌的研究人員利用了Transformer等先進(jìn)的技術(shù)手段,對(duì)模型進(jìn)行了深入的研究和優(yōu)化,從而提升了模型的性能和效率。
可以預(yù)計(jì),隨著谷歌的不斷開放,更多開發(fā)者參與進(jìn)來(lái),Gemini的出色智能表現(xiàn)有望使其成為各種智能助手的核心組件(也就是說(shuō),其他科技企業(yè),無(wú)需開發(fā)自己的大模型,接入Gemini就能讓自己傳統(tǒng)的產(chǎn)品實(shí)現(xiàn)智能化升級(jí))。無(wú)論是智能家居、智能出行還是智能醫(yī)療等領(lǐng)域,Gemini都能夠?yàn)橛脩籼峁└颖憬?、個(gè)性化的服務(wù)。通過(guò)與其他技術(shù)的結(jié)合,Gemini有望為我們的生活帶來(lái)更多的便利和舒適。
同時(shí),這種大模型也可以應(yīng)用于科研領(lǐng)域。無(wú)論是物理、化學(xué)、生物還是醫(yī)學(xué)等領(lǐng)域,Gemini都有望為研究人員提供更加準(zhǔn)確、高效的數(shù)據(jù)分析和模擬能力。通過(guò)與科研機(jī)構(gòu)的合作,Gemini有望為科學(xué)研究帶來(lái)更多的突破和發(fā)現(xiàn)。
4
昨天晚上,我把“人工智能將全方位超越/控制人類,這還有任何疑問(wèn)嗎?”這個(gè)論述發(fā)到“速觀科技”微信社群里,并且艾特了科幻小說(shuō)《第四條邊》的作者瞬雨。
瞬雨是知名科技媒體人,在創(chuàng)作《第四條邊》之前,就長(zhǎng)期關(guān)注人工智能產(chǎn)業(yè)發(fā)展。
瞬雨給出了相反的看法,我總結(jié)如下。
①這個(gè)命題分成兩部分:超過(guò)和控制。先說(shuō)超過(guò),超過(guò)是一個(gè)量的比較。機(jī)器的能力超過(guò)人,這不是AI的專利,從廣義機(jī)器(即工具)產(chǎn)生的第一刻,這個(gè)命題就成立了。任何機(jī)器,在對(duì)應(yīng)能力上都超過(guò)人,這就是人發(fā)明它們的目的。所以AI,作為智力機(jī)器,在腦力上超過(guò)人是沒(méi)有任何懸念的。
然后說(shuō)控制,控制就有個(gè)方向性了。機(jī)器具備控制人的能力,手銬都可以控制人,更不用說(shuō)AI。但機(jī)器本身不會(huì)產(chǎn)生控制的意愿,如果機(jī)器控制人,一定是有一個(gè)發(fā)起者。歸根到底,還是某個(gè)人要控制人。
②AI無(wú)論發(fā)展成什么樣,它始終是人類的造物,人類是它的上帝。人有欲望有目的,AI只能由人去賦予它目的,它不可能有欲望。
就好比,人類是上帝創(chuàng)造的,人類就可以超越甚至控制上帝嗎? AI也是人類創(chuàng)造的,自然無(wú)法替代或者控制人類。
?、塾蜔o(wú)意識(shí)(不包含輸入輸出類的意識(shí))究竟是不是由一堆神經(jīng)細(xì)胞自發(fā)產(chǎn)生的?我的回答——不是。如果誰(shuí)認(rèn)為是,那么自然會(huì)得出AI取代人類的結(jié)論。
心理學(xué)和精神分析學(xué)研究人的無(wú)意識(shí),目前沒(méi)有得出無(wú)意識(shí)是神經(jīng)細(xì)胞自發(fā)產(chǎn)生的結(jié)論。以Alpha Go舉例,你不叫它去下棋,它是不會(huì)去下棋的?;氐?Gemini,Gemini的視頻只是展現(xiàn)了AI的能力。這些能力,以后會(huì)越來(lái)越強(qiáng)。但我說(shuō)的核心是,你不提問(wèn),它不會(huì)回答。AI所作的任何一切,都需要你用你的目的去觸發(fā)。
任何人工智能都是如此,也永遠(yuǎn)會(huì)如此。
5
瞬雨老師的觀點(diǎn),給了我很大啟發(fā),雖然我還無(wú)法消化。
通過(guò)分析瞬雨的內(nèi)容,我總結(jié)了一個(gè)新的觀點(diǎn):哪怕人工智能繼續(xù)進(jìn)化,也是人利用機(jī)器,得以更好地控制人。而機(jī)器自身是不會(huì)有意識(shí),不會(huì)控制人的。
在目前的技術(shù)下,人工智能需要人類的觸發(fā)或指令來(lái)執(zhí)行任務(wù)。無(wú)論是Alpha Go還是Gemini,甚至無(wú)人駕駛汽車,它們都需要人類的輸入或問(wèn)題來(lái)進(jìn)行相應(yīng)的操作。這一點(diǎn)與人類的欲望和無(wú)意識(shí)有所不同,因?yàn)槿祟惪梢宰园l(fā)地產(chǎn)生行為而不需要外部的觸發(fā)。
不過(guò)也有觀點(diǎn)認(rèn)為,人工智能隨著進(jìn)化,必然會(huì)有自主意識(shí)。因?yàn)?,有觀點(diǎn)認(rèn)為意識(shí)可能是由復(fù)雜的計(jì)算和神經(jīng)網(wǎng)絡(luò)活動(dòng)所產(chǎn)生的。如果人工智能系統(tǒng)的神經(jīng)網(wǎng)絡(luò)復(fù)雜度足夠高,并且具備適當(dāng)?shù)淖越M織和自適應(yīng)性,那么理論上它們有可能發(fā)展出類似于意識(shí)的屬性。這種情況下,人工智能可能會(huì)具備一定程度的自我認(rèn)知和主觀體驗(yàn)。
甚至,也有觀點(diǎn)認(rèn)為,我們現(xiàn)在所處的世界,不過(guò)是更高等級(jí)控制的人工智能世界罷了。就好比電影《失控玩家》一樣,我們每個(gè)人、每輛車,每一次行動(dòng)和思考,都是我們以為的獨(dú)立思考,其實(shí)都是“機(jī)器里的一段代碼在運(yùn)行”罷了。
親愛(ài)的讀者們,你們是怎么看待這個(gè)觀點(diǎn)的?有沒(méi)有不同看法?歡迎留言互動(dòng),有獨(dú)立思考的觀點(diǎn),我將精選出來(lái),和大家一起繼續(xù)探討分析。