編者按:本文選自全媒派,創(chuàng)業(yè)邦編輯后發(fā)布。
近期,人工智能頻上熱搜:Facebook直擊現(xiàn)代人“今天穿什么”的痛點,推出Fashion++,通過算法調整服裝穿搭;美國作家安德魯?卡普蘭則將利用對話AI技術和數(shù)字助理設備在云上實現(xiàn)“永生”;ZAO利用deepfake技術實現(xiàn)視頻換臉,“以假亂真”……
從AI換臉到AI試穿,再到AI助“數(shù)字永生”……如今,人工智能正全方位滲透到我們的生活中,重要且不可忽視。
人工智能是如何走到今天的?本期全媒派(ID:quanmeipai)獨家編譯Fast Company文章,盤點與人工智能發(fā)展相關的七十余載,看看這些高光與低潮時刻如何推動人工智能不斷“進化”,改變人類生活的世界。
艾薩克·阿西莫夫提出“機器人三大定律”(1942)
1942年,艾薩克·阿西莫夫(IsaacAsimov)發(fā)表了短篇小說《轉圈圈》(Runaround,又譯作《環(huán)舞》)。這位著名的科幻作家首次完整地闡述了他的“機器人三大定律”:
第一定律:機器人不得傷害人類,或因不作為而讓人類受到傷害。
第二定律:機器人必須服從人類的命令,除非這些命令違背了第一定律。
第三定律:在不違背第一與第二定律的前提下,機器人必須保護自己。
《轉圈圈》講述的是一個名叫速必敵(Speedy)的機器人,它接受了人類的命令,去危險的硒溶池執(zhí)行采集任務。當它越來越靠近目的地,危險的程度越來越高,第三定律讓它不得不離開以保護自己;但當它開始遠離目的地,第二定律又讓它必須服從命令前進。因此,它被置于一個前后兩難的矛盾境地,圍繞著硒溶池不停地轉圈圈。
阿西莫夫的“機器人”系列故事吸引了很多科幻迷,其中的一些科學家開始思考機器擁有思考能力的可能性。直到現(xiàn)在,仍有許多人使用阿西莫夫的三大定律,進行人工智能的智力練習。
艾倫·圖靈提出模仿游戲(1950)
1950年,艾倫·圖靈(Alan Turing)寫道:“我提議考慮一個問題——‘機器能思考嗎?’”
這句話是其開創(chuàng)性的研究論文《計算機器與智能》的開頭。該論文提出了一個思考機器智能的模型。他反問道,如果一臺機器能夠模仿人類有意識的行為,難道它不會有意識嗎?
受到理論性問題的啟發(fā),圖靈經(jīng)典的“模仿游戲”誕生了。游戲設置了三個角色,人、機器和人類“詢問者”?!霸儐栒摺毙枰c其余二者在物理空間上分隔開?!霸儐栒摺卑l(fā)起提問,且根據(jù)二者的純文本回應(避免聲音回答產(chǎn)生干擾),區(qū)分機器和人。如果一臺機器能夠與人類溝通(注:圖靈認為理想情況是使用Teleprinter,即“電傳打字機”),且讓“詢問者”難以分辨人與機器的分別,那么這臺機器就被認為具有智能。
在圖靈時代,沒有一臺機器能夠通過這樣的測試,直到今天也沒有。但他的測試為區(qū)分機器是否具有智能提供了一個簡單的標準。它幫助塑造了人工智能的哲學。
達特茅斯舉辦人工智能大會(1956)
到1955年,世界各地的科學家已經(jīng)開始思考一些概念問題,比如神經(jīng)網(wǎng)絡和自然語言,但還沒有統(tǒng)一的概念來概括這些與機器智能有關的領域。
達特茅斯學院(Dartmouth College)數(shù)學教授約翰·麥卡錫(John McCarthy)創(chuàng)造了“人工智能”這個術語來囊括這一切。
由麥卡錫領導的一個小組申請了撥款,在第二年舉辦了一場人工智能大會。1956年夏天,他們邀請了許多知名科研人員到特茅斯禮堂參加會議??茖W家們討論了人工智能研究諸多的潛在發(fā)展領域,包括學習和搜索、視覺、推理、語言和認知、游戲(尤其是國際象棋),以及人機交互(比如個人機器人)。
這場討論達成的普遍共識是,人工智能具有造福人類的巨大潛力。他們得出了一個“機器智能可能產(chǎn)生影響的研究領域”的總體框架。這次會議規(guī)范并促進了作為一門研究學科的人工智能在此后多年的發(fā)展。
弗蘭克·羅森布拉特創(chuàng)造了感知機 (1957)
神經(jīng)網(wǎng)絡的基本結構被稱為“感知機”(Perceptron),相當于節(jié)點(node),接收一系列輸入并進行計算,對其進行分類和置信水平分析。舉例而言,“輸入”可能會分析一張圖片的不同部分,并對圖像中是否有人臉進行“投票”。節(jié)點將會對投票行為和置信水平進行計算,并得出結論。今天,在強大的計算機上運行的人工神經(jīng)網(wǎng)絡,連接了數(shù)十億計這樣的結構。
但在強大的計算機出現(xiàn)前,感知機就已經(jīng)存在了。20世紀50年代末,一位年輕的心理學家,弗蘭克·羅森布拉特(Frank Rosenblatt),為一臺名為Mark I的感知機建立了一個機械模型。
這臺機器是為圖像識別而設計的。它是一個模擬神經(jīng)網(wǎng)絡,其中的感光單元矩陣通過導線與節(jié)點相連。羅森布拉特開發(fā)了一種“感知機算法”,引導網(wǎng)絡逐漸調整其輸入強度,直到它們始終正確地識別圖像,從而有效地讓它進行學習。
當時,羅森布拉特受到美國海軍的經(jīng)費資助,召開了新聞發(fā)布會?!都~約時報》抓住了發(fā)布會的要點:“海軍透露了一種電子計算機的雛形,希望未來它能夠走、說、寫、看、自我復制并意識到自己的存在。”
如今,這臺最早的感知器存放在美國的史密森尼博物院(Smithsonian)中。
直到20世紀80年代,科學家們還在激烈地討論感知機的相關問題。這對于創(chuàng)建神經(jīng)網(wǎng)絡的物理實體非常重要,而在此之前,神經(jīng)網(wǎng)絡主要是一個學術概念。
人工智能的第一個冬天(20世紀70年代)
人工智能已經(jīng)將其大部分的歷史投入到研究領域中。在20世紀60年代的大部分時間里,美國國防部高級研究計劃局(DARPA)等政府機構為研究投入大量資金,但對于最終的回報要求不多。與此同時,為了保證經(jīng)費充足,人工智能的學者經(jīng)??浯笏麄兊难芯壳熬?。這一切在60年代末70年代初發(fā)生了改變。
1966年,語言自動處理咨詢委員會(ALPAC)向美國政府提交了一份報告;1973年,英國科學研究委員會(SRC)向英國政府提交了一份由知名應用數(shù)學家James Lighthill爵士帶頭起草的報告。兩份報告都對人工智能研究各個領域的實際進展提出了質疑,它們看待技術前景的態(tài)度也非常悲觀。Lighthill報告認為,用于語音識別等任務的人工智能很難擴展到對政府或軍方有用的規(guī)模。
因此,美國政府和英國政府都開始削減大學人工智能研究的資金。在上世紀60年代的大部分時間里,DARPA一直慷慨地提供人工智能研究經(jīng)費。如今,DARPA要求研究計劃必須有明確的時間表,并且詳細描述項目成果。
當時的人工智能似乎是讓人失望的,它的能力可能永遠達不到人類的水平。人工智能第一個“冬天”一直持續(xù)到70年代,并且繼續(xù)蔓延到80年代。
人工智能迎來第二個冬天(1987)
20世紀80年代的人工智能發(fā)展,是隨著“專家系統(tǒng)”(Expert Systems)的發(fā)展與大獲成功開始的。
專家系統(tǒng)是一種模擬人類專家解決領域問題的計算機程序系統(tǒng)。系統(tǒng)內存儲了大量領域知識,并模仿人類專家來做出決策。
這一系統(tǒng)最初是由卡內基梅隆大學為數(shù)字設備公司(Digital Equipment Corporation)開發(fā)的,后者迅速采用了這項技術。
但是專家系統(tǒng)需要昂貴的專用硬件支持,這就出現(xiàn)了一個問題:當時,Sun Microsystems的工作站、Apple和IBM的個人電腦都擁有近似的能力,但價格卻更低。1987年,專家系統(tǒng)計算機的市場崩潰了,主要供應商黯然離場。
上世紀80年代初,專家系統(tǒng)的繁榮讓DARPA增加了對人工智能研究的資金投入。但后來情況再次發(fā)生了改變,除了少數(shù)人為挑選的項目以外,DAPRA再次切斷對于其他人工智能項目的大部分資助。
“人工智能”一詞再次成為研究領域的禁忌。為了避免被視為不切實際、渴求資助的“夢想家”,科研人員開始為人工智能相關的研究冠上不同的名稱——比如“信息學”、“機器學習”和“分析學”。
第二個“人工智能冬天”延續(xù)到了2000年代。
IBM的深藍擊敗卡斯帕羅夫(1997)
1997年,當IBM的深藍國際象棋(Deep Blue chess)電腦在國際象棋比賽中擊敗了當時的世界冠軍加里?卡斯帕羅夫(Garry Kasparov)時,人工智能的公眾形象大幅提升。
在電視直播的六場比賽中,深藍贏了兩場,卡斯帕羅夫贏了一場,其中三場以平局告終。在前一年,卡斯帕羅夫擊敗了早期版本的“深藍”。
深藍擁有強大的計算能力,它使用了一種“蠻力”的方法,每秒評估2億種可能的走法,從而找到最佳走法。而人類每回合只能檢查大約50步。深藍達到的效果就像人工智能一樣,但是計算機此時還并沒有真正地在下棋中思考策略、自主學習。
盡管如此,深藍的勝利還是將人工智能非常高調地帶回了公眾視野。有人很著迷,也有人則對機器打敗知名的人類棋手這件事感到很不自在。令投資者難以忘懷的是:深藍的勝利推動IBM股價上漲了10美元,創(chuàng)下了歷史新高。
神經(jīng)網(wǎng)絡看到貓(2011)
到2011年,世界各地的科學家都在討論并創(chuàng)造神經(jīng)網(wǎng)絡。那一年,谷歌工程師杰夫·迪恩(Jeff Dean)遇到了斯坦福大學計算機科學教授吳恩達(Andrew Ng)。兩人萌生了建立一個大型神經(jīng)網(wǎng)絡的想法,利用谷歌的服務器資源為其提供強大的計算能力,并向它輸送海量的圖像數(shù)據(jù)集。
他們建立的神經(jīng)網(wǎng)絡在16000個服務處理器上運行。他們隨機上傳了1000萬張沒有標簽的來自YouTube的截圖。杰夫和吳恩達并沒有要求神經(jīng)網(wǎng)絡提供任何特定信息,或標記圖像。當神經(jīng)網(wǎng)絡在“無監(jiān)督”的狀態(tài)下運行時,它們自然會試圖在數(shù)據(jù)找到模式,并形成分類。
神經(jīng)網(wǎng)絡對圖像數(shù)據(jù)進行了為期三天的處理。然后,它返回了一個輸出,該輸出包含了三個模糊圖像,這些圖像描述了它在測試圖像中一次又一次看到的“圖案”——人臉、人體和貓。
在計算機視覺任務中使用神經(jīng)網(wǎng)絡和無監(jiān)督學習,該研究是一個重大突破。這個事件也標志著“谷歌大腦項目”(Google Brain Project)的開始。
杰弗里·辛頓解放了深層神經(jīng)網(wǎng)絡(2012)
在杰夫和吳恩達取得突破性進展之后的一年,多倫多大學教授杰弗里·辛頓(Geoffrey Hinton)和他的兩個學生建立了名為AlexNet的計算機視覺神經(jīng)網(wǎng)絡模型。2012年,在著名的ImageNet的圖像識別大賽當中,AlexNet一舉奪冠。參賽者必須使用自己的系統(tǒng)來處理數(shù)百萬的測試圖像,并且以盡可能高的準確率進行識別。AlexNet贏得了比賽,錯誤率不到亞軍的一半。AlexNet的Top-5錯誤率是15.3%;而在2012年以前,最好成績是26%的錯誤率。
注:Top-5錯誤率是ImageNet大賽的評價標準之一。簡而言之,大賽給圖片類別設置了近千項“分類”,而模型識別圖片時,會給出其預測的“分類”概率排名。對于某個圖片,如果該模型預測結果中,預測概率最大的前5項都不吻合實際結果,則算“錯誤”。
這一成功有力地證明,深度神經(jīng)網(wǎng)絡在對圖像進行準確識別和分類方面遠遠優(yōu)于其他系統(tǒng)。這次奪冠影響極其深遠,使深度神經(jīng)網(wǎng)絡得以復興,也為辛頓贏得了“深度學習教父”的綽號。
辛頓和他的同事約舒亞·本喬(Yoshua Bengio)、揚·勒昆(Yann LeCun)一起獲得了2018年圖靈獎。
AlphaGo打敗人類圍棋冠軍(2016)
早在2013年,一家名為DeepMind的英國初創(chuàng)公司的研究人員發(fā)表了一篇論文,展示了他們如何使用神經(jīng)網(wǎng)絡來贏得50種老式的雅達利游戲(Atari)。令人印象深刻的是,谷歌以4億美元的價格收購了這家公司。
不過,DeepMind的光輝歲月還未到來。
幾年后,DeepMind的科學家們(現(xiàn)屬于谷歌)從雅達利游戲轉向人工智能的長期挑戰(zhàn)之一——圍棋。他們開發(fā)了一個名為AlphaGo的神經(jīng)網(wǎng)絡模型用于玩圍棋,并通過玩來學習。該模型與其他版本的AlphaGo進行了數(shù)千場比賽,學習AlphaGo的輸贏策略。
它居然成功了。2016年3月,AlphaGo在一系列比賽中以4比1擊敗了世界上最偉大的韓國棋手李世石(Lee Sedol)。整個事件被拍成了紀錄片。
觀看這部片子的時候,我們很難忘記李世石被擊敗時的悲傷。看起來就好像人類——而不僅僅是一個人——被打敗了。
在深度學習產(chǎn)生了廣泛影響的同時,人工智能的故事只是剛剛開始。
我們已經(jīng)進入一個嶄新的時代。人工智能仍將充滿希望,裹挾著炒作與浮躁。它所帶來的,也許將遠遠超過個人計算和互聯(lián)網(wǎng)在過去30年對世界造成的改變。帶著對未來的期許,讓我們回到圖靈一開始提的問題:“機器能思考嗎?”
可能不需要再次歷經(jīng)70年的求索,答案也許就在這個十年。
本文為專欄作者授權創(chuàng)業(yè)邦發(fā)表,版權歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。