人生速通傳說：博士畢業(yè)后，7年就拿諾貝爾獎

果殼硬科技·2024-10-10

我們理綜獎怎么連程序員都得啦？

編者按：本文來自微信公眾號果殼（ID：Guokr42），作者：見文末，創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

今天的諾貝爾化學(xué)獎授予了兩組研究者，其中大衛(wèi)·貝克（David Baker）推動了蛋白質(zhì)計算設(shè)計的發(fā)展，而戴密斯·哈薩比斯（Demis Hassabis）與約翰·朱默帕（John M. Jumper）則開發(fā)了AI蛋白質(zhì)分析工具Alphafold。

也就是說，諾獎組委會竟然連續(xù)兩天把獎發(fā)給AI研究了！難道這一切都是AI的陰謀嗎……

你咋不叫諾貝爾AI獎呢 | Anjney Midha

哈薩比斯最新的X動態(tài)，是恭喜同樣搞AI的前同事得到物理獎，結(jié)果轉(zhuǎn)頭自己得了化學(xué)獎丨X/@demishassabis

不過，這個選擇其實并沒有那么意外。Alphafold本身就是熱門候選，而與它一同被表彰的蛋白質(zhì)設(shè)計工具也在生物化學(xué)領(lǐng)域起了非常重要的作用。這些工具極大地提高了科研效率，未來說不定還能改變我們的生活（點這里看科學(xué)解讀）

制造了這些好用工具的獲獎?wù)?，他們都是什么來頭呢？

01 哈薩比斯：有點厲害的棋牌大師

哈薩比斯最為人所知的成就，繞不開一個關(guān)鍵詞“圍棋”。

幾年前，AlphaGo打敗圍棋世界冠軍李世乭、柯潔的新聞還記得吧？開發(fā)AlphaGo的公司DeepMind，就是哈薩比斯一手創(chuàng)立的（現(xiàn)在被谷歌收購了）。

AlphaGo的老子哈薩比斯，和AlphaGo的對手柯潔丨the Seattle Times

但實際上，AlphaGo之父哈薩比斯的圍棋水平并不太高。他19歲才開始學(xué)圍棋，現(xiàn)在的水平是業(yè)余1段，只能算是“入了門”而已。

雖然開發(fā)出了下圍棋頂呱呱的人工智能，但制造者自己的圍棋水平有點普通丨bbc

不過，哈薩比斯的國際象棋水平很高：他4歲開始學(xué)國際象棋，13歲時成為這個年齡組的世界第二?，F(xiàn)在哈薩比斯在世界國際象棋聯(lián)合會的排名是全球第17009——畢竟大師如今也不靠國際象棋吃飯，排名低點是正常的，對吧？

1988年，12歲的哈薩比斯丨Marc Aspland

多說一句，哈薩比斯還在世界撲克大賽上拿過幾個名次。這個比賽里包含了撲克的許多種玩法，不知道有沒有斗地主和炸金花啊？

參加2014年世界撲克大賽的哈薩比斯，排名第11丨pokernews.com

玩游戲不如做游戲

《生活大爆炸》給了大家一個刻板印象：從事高科技行業(yè)的高智商男性，都很喜歡玩游戲。哈薩比斯不僅玩，還做游戲。

一個充滿象征意義的擺拍，他旁邊是國際象棋，面前是非常古早的雅達利游戲機丨ellines.com

哈薩比斯在老牌游戲開發(fā)商牛蛙（Bullfrog）干過一陣子。1993年，他在射擊游戲《辛迪加（Syndicate）》系列中當(dāng)游戲測試員，也做一些關(guān)卡設(shè)計，算是進入游戲行業(yè)的開山之作。

《辛迪加》的游戲截圖丨mobygames/Melliuc

《主題公園（Theme Park）》系列，很多人應(yīng)該都玩過吧？玩家可以在一片空地上建立起好玩又賺錢的游樂場。這系列游戲的開山之作誕生于1994年，一經(jīng)推出立刻爆火，銷量百萬、獲獎無數(shù)——游戲項目負責(zé)人之一就是年僅17歲的哈薩比斯。

1994年版的《主題公園》，有游戲考古癖的可以玩一下丨mobygames/B.L. Stryker

這兩款游戲?qū)賹嵱悬c久遠了，大家沒玩過都正常。但如果你小時候玩過《共和國：革命（Republic: The Revolution）》和《邪惡天才（Evil Genius）》，那真的得感謝一下哈薩比斯——他創(chuàng)立的公司開發(fā)了這兩款游戲，也自己做了游戲的執(zhí)行設(shè)計師。

《邪惡天才》的截圖，似乎也是模擬經(jīng)營類的游戲，哈薩比斯真的很喜歡這個類型啊丨mobygames/Der.Archivar

降本增效楷模

還是說回哈薩比斯現(xiàn)在的工作吧。我們知道他開發(fā)的AlphaGo下圍棋贏了人類（沒啥直接經(jīng)濟效益），AlphaFold能分析蛋白質(zhì)結(jié)構(gòu)（研究太基礎(chǔ)了），所以谷歌收購DeepMind到底賺到啥了？

谷歌抹淚：它真的好替我省錢。

2014年，谷歌收購了哈薩比斯創(chuàng)立的DeepMind，據(jù)說收購價高達數(shù)億美元，但DeepMind大概已經(jīng)替谷歌把這筆錢賺回來了。

谷歌的電費大頭，并不是辦公室的照明和燒水，而是用在給數(shù)據(jù)中心降溫上。你手機運行個游戲還會發(fā)熱呢，谷歌處理gmail、google search等的大型數(shù)據(jù)中心，發(fā)熱更厲害，必須降溫才能繼續(xù)用。而且隨著數(shù)據(jù)量爆炸式增長，降溫電費只會越來越高。

在被谷歌收購2年后，DeepMind就開發(fā)出了一個人工智能框架，經(jīng)過挺復(fù)雜（且你們也不感興趣）（我也并不太懂）的過程，成功讓數(shù)據(jù)中心的降溫電費少了40%——據(jù)說能讓谷歌在未來好幾年里，省下幾億美元。

賺了，真的賺大發(fā)了。

來自谷歌母公司首席財務(wù)官的微笑丨Eli Lilly

02 貝克：從哲學(xué)到生物學(xué)

大衛(wèi)·貝克出生于1962年，現(xiàn)在是華盛頓大學(xué)蛋白設(shè)計所的主任。

大衛(wèi)·貝克｜Ian C. Haydon/IPD

他人生的大部分時間都在這所大學(xué)度過，小時候，他的父母都是這里的教授——父親研究弦理論和夸克，母親研究天體物理和大氣科學(xué)。但貝克當(dāng)時對科學(xué)并不感興趣，到哈佛大學(xué)念本科時，他選擇了哲學(xué)和社會科學(xué)，想知道人類大腦是如何做決定的。

直到大學(xué)最后一年，他上了發(fā)育生物學(xué)課程，讀到了《細胞分子生物學(xué)》這本書，才開始對生物學(xué)感興趣。博士時期，他加入了加州大學(xué)伯克利分校的細胞生物學(xué)家蘭迪·謝克曼（Randy Schekman）的實驗室（蘭迪·謝克曼在2013年獲得了諾貝爾生理學(xué)或醫(yī)學(xué)獎），研究細胞是如何組織的。再之后，他的興趣逐漸轉(zhuǎn)移到了結(jié)構(gòu)生物學(xué)上。

90年代末期，貝克實驗室開始開發(fā)計算機軟件Rosetta，這個軟件成功預(yù)測了氨基酸序列如何折疊成最終的蛋白質(zhì)構(gòu)型。貝克隨后意識到，它可以反過來用——從蛋白質(zhì)結(jié)構(gòu)反向推出氨基酸序列，從而讓從頭設(shè)計蛋白質(zhì)成為可能。正是這個想法引領(lǐng)他獲得了諾貝爾化學(xué)獎。

每個人都能參與研究

貝克是徒步愛好者，他在一次徒步旅行中想到：可以讓公眾參與蛋白質(zhì)折疊的研究。

大衛(wèi)·貝克維基頁面上的照片，看來真的很愛徒步｜Jeffreyjgray

2005年，貝克實驗室開始運行志愿分布式計算項目Rosetta@Home。任何人只要在自己的電腦上完成配置后，電腦就會自動利用空閑計算力參與蛋白質(zhì)結(jié)構(gòu)預(yù)測的研究。2008年，他又與兩位計算機教授合作，開發(fā)了蛋白質(zhì)折疊游戲Foldit，希望以此吸引公眾，幫助蛋白質(zhì)結(jié)構(gòu)研究推進。

在游戲中，用戶使用工具，盡可能完美地折疊蛋白質(zhì)的結(jié)構(gòu)。研究人員會對游戲中的最高分方案進行分析，確定這些方案是否可以應(yīng)用于現(xiàn)實世界，為疾病、藥物開發(fā)等研究提供靈感。這并非癡人說夢，比如在2011年，F(xiàn)oldit玩家就幫助破譯了Mason-Pfizer猴病毒的逆轉(zhuǎn)錄病毒蛋白酶的晶體結(jié)構(gòu)。

2019年，貝克在一次TED演講中描述了他對人造蛋白質(zhì)的五個期待：用于流感、艾滋病和癌癥的通用疫苗；治療慢性疼痛的先進藥物；能夠?qū)⒁咽褂玫乃幬镞\送到特定細胞的蛋白質(zhì)納米容器（這或許能消除副作用）；治療神經(jīng)退行性疾??；能用于太陽能捕獲的自組裝蛋白質(zhì)。雖然不知道這些目標(biāo)何時可以實現(xiàn)，但科學(xué)嘛，總能帶給人們突破不可能的希望。

貝克實驗室設(shè)計的一種基于蛋白質(zhì)的納米容器（3D打印模型），其靈感來自病毒的幾何外殼｜Ian C. Haydon/IPD

03 朱默帕：學(xué)物理和數(shù)學(xué)的化學(xué)獎得主

在還是青少年的時候，約翰·朱默帕（John Jumper）就自學(xué)了計算機編程，他在物理上也很有天賦，所以他本科讀了物理和數(shù)學(xué)。

朱默帕說，“我一直很喜歡發(fā)現(xiàn)宇宙真相，以為我會成為一個‘發(fā)現(xiàn)宇宙定律’的物理學(xué)家”。與此同時，他那對都是工程師的父母，在擔(dān)心這孩子以后永遠找不到工作。

本科時的Jumper

在本科階段，他就和費米加速器實驗室的人一起合作，研究被稱為夸克的亞原子粒子的奇怪性質(zhì)。有一天Jumper和研究人員一起吃午餐聊天，朱默帕問，“我們正在進行的這個實驗，什么時候才能啟動呢?”其中一個教授說他可能會先退休，另一個更老的教授說他可能活不到那一天了。于是，朱默帕決定要去搞點速度更快、能在更短時間內(nèi)完成的科學(xué)研究。

本科畢業(yè)后，他去了劍橋大學(xué)讀凝聚態(tài)物理的博士——但因為不喜歡研究課題，他沒讀完就走了。然后朱默帕去了一家私人研究機構(gòu)D.E.Shaw 研究公司，從事蛋白質(zhì)的計算機模擬工作。

“我當(dāng)年加入的時候都不知道蛋白質(zhì)是啥。”朱默帕回憶說。但研究公司里提供了很好的硬件環(huán)境，他可以用超級計算機來模擬分子，“我在一個周二做的模擬比我整個（劍橋）讀博期間做的還要多。”

然后朱默帕決定再讀一次博士，這次他去了芝加哥大學(xué)讀博，他仍然對蛋白質(zhì)結(jié)構(gòu)感興趣，而且開始轉(zhuǎn)向機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)。他博士論文的標(biāo)題是《基于嚴格機器學(xué)習(xí)的粗粒度蛋白質(zhì)折疊與動力學(xué)新方法》，在第一頁，他引用了英國統(tǒng)計學(xué)家喬治· 鮑克斯(George Box)的名言，“所有模型都是錯的，但有些模型是有用的。”

這句話也非常適合用來形容AI。

2017年Jumper拿到博士學(xué)位，博士畢業(yè)7年后就拿了諾貝爾化學(xué)獎。從諾貝爾化學(xué)獎經(jīng)常不發(fā)給傳統(tǒng)化學(xué)家的角度來說，也非常合理。

要不是加入Deepmind，可能就不搞科研了

從芝加哥大學(xué)博士畢業(yè)的2017年，朱默帕加入了谷歌DeepMind團隊。

當(dāng)時他已經(jīng)聽說了Deepmind有計劃解決蛋白質(zhì)結(jié)構(gòu)預(yù)測的問題，不過那時這個項目還在保密階段。在去Deepmind面試時，他只要一提蛋白質(zhì)折疊，Deepmind團隊就轉(zhuǎn)移話題。

不過，朱默帕對此很感興趣，也決意加入。“如果不是為了 DeepMind，我可能會離開科學(xué)界?！?/p>

敢于轉(zhuǎn)向的Alphafold功臣

2018年，DeepMind團隊拿出了第一代AlphaFold，參加了第十三屆全球蛋白質(zhì)結(jié)構(gòu)預(yù)測比賽（CASP），這個比賽相當(dāng)于蛋白結(jié)構(gòu)預(yù)測界的奧林匹克，比的是預(yù)測的結(jié)構(gòu)與實驗室里實際確定的蛋白質(zhì)實際結(jié)構(gòu)有多接近。

當(dāng)時他們還討論過要不要匿名參加，因為如果是一個學(xué)術(shù)界的團隊參加而且慘敗了，也沒什么，但是如果是谷歌這樣市值數(shù)十億美元的科技公司參與還失敗了，那就搞不好是個大新聞，而且股價也要波動了。不過，他們最后還是決定以谷歌 DeepMind 的名義實名參賽。

第一代AlphaFold表現(xiàn)得很好，但還沒有達到足夠高的準確率。當(dāng)時，正是朱默帕決定拋棄原本的路線，重頭開始。同事回憶說，早期版本的“ AlphaFold2”表現(xiàn)比它的前輩差得多，但朱默帕堅持了下來，“他不害怕接受新的方向。”

僅僅2年后的2020年，朱默帕就帶著第二代AlphaFold參加了第十四屆全球蛋白質(zhì)結(jié)構(gòu)預(yù)測比賽（CASP14），預(yù)測了幾十種蛋白質(zhì)的結(jié)構(gòu)，誤差范圍僅為1.6?！@意味著預(yù)測精度已經(jīng)達到了單個原子的級別，在研究中已經(jīng)很實用了。

順便一提，2020年正值新冠大流行，所以CASP14這場比賽是在線上舉辦，通過zoom遠程召開的。在Alphafold2的比賽結(jié)果出來后，很多結(jié)構(gòu)科學(xué)家們呆在自己家里，盯著屏幕，意識到蛋白質(zhì)科學(xué)的世界被永久改變了。

ZOOM會議中的AlphaFold團隊 | DeepMind

“人類在預(yù)測蛋白質(zhì)結(jié)構(gòu)方面是垃圾”

朱默帕認為，在有些方面，AI比人類有明顯優(yōu)勢。他說過，“我們?nèi)祟愒陬A(yù)測蛋白質(zhì)結(jié)構(gòu)方面是垃圾?！?/p>

AlphaFold并不會完全取代實驗方法?？茖W(xué)家們還需要用實驗來驗證AI的猜測，尤其是那些AI自己都拿不太準的區(qū)域。但它能夠?qū)⑿枰炞C的范圍大幅縮小，由此省下相當(dāng)可觀的研究費用與時間。

朱默帕說，“我最自豪的是，AlphaFold2讓所有所有結(jié)構(gòu)生物學(xué)的速度提高了5% 或10% ，生物學(xué)家現(xiàn)在可以節(jié)省一到兩年時間。”他們可以更快地去檢驗和確定某種蛋白質(zhì)的結(jié)構(gòu)。

已經(jīng)有科學(xué)家用Alphafold2來繪制更好的人類心臟圖表，建立抗生素耐藥模型，鑒定澳大利亞5萬年前滅絕的鳥類的蛋。

AlphaFold此前兩代都是開源的，但出于商業(yè)的考慮，Jumper 團隊2024年5月發(fā)布的 AlphaFold 3是不開源的。

AlphaFold 3是目前最強大的結(jié)構(gòu)預(yù)測工具之一，它可以預(yù)測相互結(jié)合的蛋白質(zhì)、DNA 和、RNA 以及其他小分子的結(jié)構(gòu)。不過，因為AlphaFold 3引入了“diffusion模型”，也就是那些文字生圖、文字生視頻的底層技術(shù)，所以也無可避免地會引入這個模型的“幻覺”問題。

至于AlphaFold 3，以及未來的第n代AlphaFold會不會胡說八道……就交給諾獎得主們?nèi)ゲ傩陌伞?/p>

參考文獻

[1]https://www.163.com/sports/article/BHLG664200051CAQ.html

[2]https://achievement.org/achiever/demis-hassabis-ph-d/#interview

[3]https://achievement.org/achiever/demis-hassabis-ph-d/

[4]https://www.nural.cc/deepmind-ai-framework/

[5]https://deepmind.google/discover/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-by-40/

[6]https://www.businessinsider.com/the-incredible-life-of-deepmind-cofounder-demis-hassabis-2017-5

[7]Jumper, J. M. (2017). New Methods Using Rigorous Machine Learning for Coarse-Grained Protein Folding and Dynamics. Knowledge UChicago. Retrieved from [8]https://knowledge.uchicago.edu/record/229?v=pdf

[9]How AI Revolutionized Protein Science, but Didn’t End It | Quanta Magazine. (2024, June 28). Retrieved from [10]https://www.quantamagazine.org/how-ai-revolutionized-protein-science-but-didnt-end-it-20240626

[11]Booth, H. (2024). See Everyone on the 2024 TIME100 AI List. Time. Retrieved from https://time.com/7012710/john-jumper-2

[12]Nature’s 10. (2021, December 15). Retrieved from https://www.nature.com/immersive/d41586-021-03621-0/index.html#section-7cgEBpkV9L

[13]Sosnick, T. R. (2023). AlphaFold developers Demis Hassabis and John Jumper share the 2023 Albert Lasker Basic Medical Research Award. J. Clin. Invest., 133(19). doi: 10.1172/JCI174915

[14]Browne, G. (2021). DeepMind’s AI has finally shown how useful it can be. WIRED. Retrieved from https://www.wired.com/story/deepmind-protein-folding-database

[15]Heaven, W. D. (2021). DeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology. MIT Technology Review. Retrieved from https://www.technologyreview.com/2020/11/30/1012712/deepmind-protein-folding-ai-solved-biology-science-drugs-disease

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表，版權(quán)歸原作者所有。文章系作者個人觀點，不代表創(chuàng)業(yè)邦立場，轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問，請聯(lián)系editor@cyzone.cn。