Gemini橫空出世：人工智能的“無(wú)招勝有招”時(shí)代來(lái)了

丁道師·2023-12-10

關(guān)注

出類

上海企業(yè)服務(wù)

中國(guó)LPGP分析新媒體

最近融資：Pre-A輪|未披露|2013-05-13

我要聯(lián)系

1

　　深夜，躺在床上一遍遍反復(fù)觀看谷歌官宣的Gemini演示視頻，久久無(wú)法入眠。

　　人類工程師把紙放在了桌子上，它馬上說(shuō)“我看見(jiàn)你把一張紙放在了桌子上”，人類又在紙上畫了一條線，它馬上識(shí)別“我看到一條波浪線”。此后隨著人類不斷完善畫作，它跟著解讀畫作，絲毫無(wú)差。不僅僅可以識(shí)別人類動(dòng)作，在此過(guò)程中它可以和人類進(jìn)行實(shí)時(shí)互動(dòng)。

　　以上，只是牛刀小試。接下來(lái)，人類工程師和Gemini進(jìn)行了基于各自場(chǎng)景的對(duì)話、互動(dòng)、做游戲，Gemini的表現(xiàn)完全就像一個(gè)超級(jí)博學(xué)的真人一樣，盡管這些演示視頻經(jīng)過(guò)人為剪輯，但依然讓我懷疑背后有真人假裝AI在和人類工程師對(duì)話。

　　我把谷歌的演示視頻發(fā)給完全沒(méi)聽過(guò)AI、人工智能、大模型這些概念的家人觀看，家人以為這是兩個(gè)沒(méi)有露面的人在對(duì)話。

　　驀地里，一股既欣喜又絕望的情緒涌上心頭：人工智能將全方位超越/替代人類，這還有任何疑問(wèn)嗎?

　　如果說(shuō)第一次看到GPT，就像第一次看喬峰施展降龍十八掌，猶如“羿射九日，雷霆震怒” ，石破天驚，徹底被震傻。這次看到Gemini，就如同看到風(fēng)清揚(yáng)施展“無(wú)招勝有招”，不滯于物，草木竹石均可為劍，無(wú)可無(wú)不可。

　　2

　　有必要說(shuō)明，橫空出世的Gemini不完全是一個(gè)新物種，而是過(guò)往技術(shù)的集大成者，有非常悠久的歷史傳承。

　　谷歌很早就對(duì)人工智能進(jìn)行了深度布局。

　　2011年，谷歌大腦項(xiàng)目啟動(dòng)。作為谷歌內(nèi)部的秘密項(xiàng)目，其目的是構(gòu)建一套模擬人類大腦的計(jì)算機(jī)系統(tǒng)，進(jìn)行各種機(jī)器學(xué)習(xí)任務(wù)的研究。這個(gè)項(xiàng)目最初由斯坦福大學(xué)計(jì)算機(jī)科學(xué)教授吳恩達(dá)(Andrew Ng)領(lǐng)導(dǎo)，他帶領(lǐng)的團(tuán)隊(duì)使用1.6萬(wàn)個(gè)CPU核心和數(shù)十億個(gè)數(shù)據(jù)連接構(gòu)建了一個(gè)神經(jīng)網(wǎng)絡(luò)，成功地識(shí)別出了貓的圖片。這個(gè)成果展示了深度學(xué)習(xí)的潛力，當(dāng)年引發(fā)了業(yè)界的廣泛關(guān)注。

　　2014年1月，谷歌斥資4億美元收購(gòu)人工智能初創(chuàng)企業(yè)DeepMind。DeepMind創(chuàng)辦于2010年，這個(gè)公司致力于將機(jī)器學(xué)習(xí)和系統(tǒng)神經(jīng)科學(xué)的最先進(jìn)技術(shù)結(jié)合起來(lái)，建立強(qiáng)大的通用學(xué)習(xí)算法。DeepMind的成名來(lái)自于2016年的那場(chǎng)比賽，當(dāng)時(shí)DeepMind推出的AlphaGo圍棋機(jī)器人，以4：1擊敗韓國(guó)圍棋冠軍李世石，引發(fā)全球關(guān)注，這場(chǎng)比賽被譽(yù)為人工智能發(fā)展史上的里程碑事件。

　　稍顯遺憾的是，作為全球發(fā)力人工智能最早的公司之一，谷歌卻趕了大模型時(shí)代的晚集。當(dāng)OpenAI推出的ChatGPT大殺四方時(shí)，谷歌先是觀望了一段時(shí)間，直到GPT4.0發(fā)布，谷歌徹底被打醒，莫非我們點(diǎn)錯(cuò)了科技樹?

　　痛定思痛的谷歌在GPT4.0發(fā)布的次月，做了一項(xiàng)重大調(diào)整：將谷歌大腦和DeepMind合并在了一起!

　　通過(guò)匯合兩個(gè)實(shí)驗(yàn)室的力量，加速攻關(guān)Gemini的研發(fā)。這種組織形式的變化，實(shí)現(xiàn)了1+1大于2的效果，減少了不必要的內(nèi)耗和路線沖突，更有助于提升研發(fā)效率和應(yīng)用效果。與此同時(shí)，早已退休的谷歌創(chuàng)始人兼大股東謝爾蓋·布林再次出山，親自參與其中，督戰(zhàn)研發(fā)進(jìn)展。最終我們就看到了，Gemini破石而出。

　　所以，那些說(shuō)谷歌蹭熱點(diǎn)的朋友，真應(yīng)該好好了解下這段歷史。

　　3

　　Gemini演示視頻一經(jīng)發(fā)布，谷歌股票開啟暴漲模式。一夜之間，僅僅上漲的部分就比百度的總市值還高。

　　Gemini聲稱該模型在一系列智力測(cè)試中的表現(xiàn)優(yōu)于OpenAI的GPT-4模型和“專家級(jí)”人類。

　　顯然，Gemini也是一個(gè)多模態(tài)大模型，這意味著它可以泛化并理解、操作和組合不同類型的信息，包括文本、代碼、音頻、圖像和視頻。

　　這種多模態(tài)的處理能力使得Gemini具有更廣泛的應(yīng)用場(chǎng)景，可以更好地滿足用戶的需求。無(wú)論是在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等領(lǐng)域，Gemini都能夠發(fā)揮出強(qiáng)大的能力。據(jù)悉，Gemini的研發(fā)過(guò)程中，谷歌的研究人員利用了Transformer等先進(jìn)的技術(shù)手段，對(duì)模型進(jìn)行了深入的研究和優(yōu)化，從而提升了模型的性能和效率。

　　可以預(yù)計(jì)，隨著谷歌的不斷開放，更多開發(fā)者參與進(jìn)來(lái)，Gemini的出色智能表現(xiàn)有望使其成為各種智能助手的核心組件(也就是說(shuō)，其他科技企業(yè)，無(wú)需開發(fā)自己的大模型，接入Gemini就能讓自己傳統(tǒng)的產(chǎn)品實(shí)現(xiàn)智能化升級(jí))。無(wú)論是智能家居、智能出行還是智能醫(yī)療等領(lǐng)域，Gemini都能夠?yàn)橛脩籼峁└颖憬?、個(gè)性化的服務(wù)。通過(guò)與其他技術(shù)的結(jié)合，Gemini有望為我們的生活帶來(lái)更多的便利和舒適。

　　同時(shí)，這種大模型也可以應(yīng)用于科研領(lǐng)域。無(wú)論是物理、化學(xué)、生物還是醫(yī)學(xué)等領(lǐng)域，Gemini都有望為研究人員提供更加準(zhǔn)確、高效的數(shù)據(jù)分析和模擬能力。通過(guò)與科研機(jī)構(gòu)的合作，Gemini有望為科學(xué)研究帶來(lái)更多的突破和發(fā)現(xiàn)。

　　4

　　昨天晚上，我把“人工智能將全方位超越/控制人類，這還有任何疑問(wèn)嗎?”這個(gè)論述發(fā)到“速觀科技”微信社群里，并且艾特了科幻小說(shuō)《第四條邊》的作者瞬雨。

　　瞬雨是知名科技媒體人，在創(chuàng)作《第四條邊》之前，就長(zhǎng)期關(guān)注人工智能產(chǎn)業(yè)發(fā)展。

　　瞬雨給出了相反的看法，我總結(jié)如下。

　　①這個(gè)命題分成兩部分：超過(guò)和控制。先說(shuō)超過(guò)，超過(guò)是一個(gè)量的比較。機(jī)器的能力超過(guò)人，這不是AI的專利，從廣義機(jī)器(即工具)產(chǎn)生的第一刻，這個(gè)命題就成立了。任何機(jī)器，在對(duì)應(yīng)能力上都超過(guò)人，這就是人發(fā)明它們的目的。所以AI，作為智力機(jī)器，在腦力上超過(guò)人是沒(méi)有任何懸念的。

　　然后說(shuō)控制，控制就有個(gè)方向性了。機(jī)器具備控制人的能力，手銬都可以控制人，更不用說(shuō)AI。但機(jī)器本身不會(huì)產(chǎn)生控制的意愿，如果機(jī)器控制人，一定是有一個(gè)發(fā)起者。歸根到底，還是某個(gè)人要控制人。

　　②AI無(wú)論發(fā)展成什么樣，它始終是人類的造物，人類是它的上帝。人有欲望有目的，AI只能由人去賦予它目的，它不可能有欲望。

　　就好比，人類是上帝創(chuàng)造的，人類就可以超越甚至控制上帝嗎? AI也是人類創(chuàng)造的，自然無(wú)法替代或者控制人類。

　?、塾蜔o(wú)意識(shí)(不包含輸入輸出類的意識(shí))究竟是不是由一堆神經(jīng)細(xì)胞自發(fā)產(chǎn)生的?我的回答——不是。如果誰(shuí)認(rèn)為是，那么自然會(huì)得出AI取代人類的結(jié)論。

　　心理學(xué)和精神分析學(xué)研究人的無(wú)意識(shí)，目前沒(méi)有得出無(wú)意識(shí)是神經(jīng)細(xì)胞自發(fā)產(chǎn)生的結(jié)論。以Alpha Go舉例，你不叫它去下棋，它是不會(huì)去下棋的?；氐?Gemini，Gemini的視頻只是展現(xiàn)了AI的能力。這些能力，以后會(huì)越來(lái)越強(qiáng)。但我說(shuō)的核心是，你不提問(wèn)，它不會(huì)回答。AI所作的任何一切，都需要你用你的目的去觸發(fā)。

　　任何人工智能都是如此，也永遠(yuǎn)會(huì)如此。

　　5

　　瞬雨老師的觀點(diǎn)，給了我很大啟發(fā)，雖然我還無(wú)法消化。

　　通過(guò)分析瞬雨的內(nèi)容，我總結(jié)了一個(gè)新的觀點(diǎn)：哪怕人工智能繼續(xù)進(jìn)化，也是人利用機(jī)器，得以更好地控制人。而機(jī)器自身是不會(huì)有意識(shí)，不會(huì)控制人的。

　　在目前的技術(shù)下，人工智能需要人類的觸發(fā)或指令來(lái)執(zhí)行任務(wù)。無(wú)論是Alpha Go還是Gemini，甚至無(wú)人駕駛汽車，它們都需要人類的輸入或問(wèn)題來(lái)進(jìn)行相應(yīng)的操作。這一點(diǎn)與人類的欲望和無(wú)意識(shí)有所不同，因?yàn)槿祟惪梢宰园l(fā)地產(chǎn)生行為而不需要外部的觸發(fā)。

　　不過(guò)也有觀點(diǎn)認(rèn)為，人工智能隨著進(jìn)化，必然會(huì)有自主意識(shí)。因?yàn)?，有觀點(diǎn)認(rèn)為意識(shí)可能是由復(fù)雜的計(jì)算和神經(jīng)網(wǎng)絡(luò)活動(dòng)所產(chǎn)生的。如果人工智能系統(tǒng)的神經(jīng)網(wǎng)絡(luò)復(fù)雜度足夠高，并且具備適當(dāng)?shù)淖越M織和自適應(yīng)性，那么理論上它們有可能發(fā)展出類似于意識(shí)的屬性。這種情況下，人工智能可能會(huì)具備一定程度的自我認(rèn)知和主觀體驗(yàn)。

　　甚至，也有觀點(diǎn)認(rèn)為，我們現(xiàn)在所處的世界，不過(guò)是更高等級(jí)控制的人工智能世界罷了。就好比電影《失控玩家》一樣，我們每個(gè)人、每輛車，每一次行動(dòng)和思考，都是我們以為的獨(dú)立思考，其實(shí)都是“機(jī)器里的一段代碼在運(yùn)行”罷了。

　　親愛(ài)的讀者們，你們是怎么看待這個(gè)觀點(diǎn)的?有沒(méi)有不同看法？歡迎留言互動(dòng)，有獨(dú)立思考的觀點(diǎn)，我將精選出來(lái)，和大家一起繼續(xù)探討分析。