編者按:本文來(lái)自微信公眾號(hào) 果殼(ID:Guokr42),作者:見文末,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
今天的諾貝爾化學(xué)獎(jiǎng)授予了兩組研究者,其中大衛(wèi)·貝克(David Baker)推動(dòng)了蛋白質(zhì)計(jì)算設(shè)計(jì)的發(fā)展,而戴密斯·哈薩比斯(Demis Hassabis)與約翰·朱默帕(John M. Jumper)則開發(fā)了AI蛋白質(zhì)分析工具Alphafold。
也就是說,諾獎(jiǎng)組委會(huì)竟然連續(xù)兩天把獎(jiǎng)發(fā)給AI研究了!難道這一切都是AI的陰謀嗎……
你咋不叫諾貝爾AI獎(jiǎng)呢 | Anjney Midha
哈薩比斯最新的X動(dòng)態(tài),是恭喜同樣搞AI的前同事得到物理獎(jiǎng),結(jié)果轉(zhuǎn)頭自己得了化學(xué)獎(jiǎng)丨X/@demishassabis
不過,這個(gè)選擇其實(shí)并沒有那么意外。Alphafold本身就是熱門候選,而與它一同被表彰的蛋白質(zhì)設(shè)計(jì)工具也在生物化學(xué)領(lǐng)域起了非常重要的作用。這些工具極大地提高了科研效率,未來(lái)說不定還能改變我們的生活(點(diǎn)這里看科學(xué)解讀)
制造了這些好用工具的獲獎(jiǎng)?wù)?,他們都是什么?lái)頭呢?
01 哈薩比斯:有點(diǎn)厲害的棋牌大師
哈薩比斯最為人所知的成就,繞不開一個(gè)關(guān)鍵詞“圍棋”。
幾年前,AlphaGo打敗圍棋世界冠軍李世乭、柯潔的新聞還記得吧?開發(fā)AlphaGo的公司DeepMind,就是哈薩比斯一手創(chuàng)立的(現(xiàn)在被谷歌收購(gòu)了)。
AlphaGo的老子哈薩比斯,和AlphaGo的對(duì)手柯潔丨the Seattle Times
但實(shí)際上,AlphaGo之父哈薩比斯的圍棋水平并不太高。他19歲才開始學(xué)圍棋,現(xiàn)在的水平是業(yè)余1段,只能算是“入了門”而已。
雖然開發(fā)出了下圍棋頂呱呱的人工智能,但制造者自己的圍棋水平有點(diǎn)普通丨bbc
不過,哈薩比斯的國(guó)際象棋水平很高:他4歲開始學(xué)國(guó)際象棋,13歲時(shí)成為這個(gè)年齡組的世界第二。現(xiàn)在哈薩比斯在世界國(guó)際象棋聯(lián)合會(huì)的排名是全球第17009——畢竟大師如今也不靠國(guó)際象棋吃飯,排名低點(diǎn)是正常的,對(duì)吧?
1988年,12歲的哈薩比斯丨Marc Aspland
多說一句,哈薩比斯還在世界撲克大賽上拿過幾個(gè)名次。這個(gè)比賽里包含了撲克的許多種玩法,不知道有沒有斗地主和炸金花?。?/p>
參加2014年世界撲克大賽的哈薩比斯,排名第11丨pokernews.com
玩游戲不如做游戲
《生活大爆炸》給了大家一個(gè)刻板印象:從事高科技行業(yè)的高智商男性,都很喜歡玩游戲。哈薩比斯不僅玩,還做游戲。
一個(gè)充滿象征意義的擺拍,他旁邊是國(guó)際象棋,面前是非常古早的雅達(dá)利游戲機(jī)丨ellines.com
哈薩比斯在老牌游戲開發(fā)商牛蛙(Bullfrog)干過一陣子。1993年,他在射擊游戲《辛迪加(Syndicate)》系列中當(dāng)游戲測(cè)試員,也做一些關(guān)卡設(shè)計(jì),算是進(jìn)入游戲行業(yè)的開山之作。
《辛迪加》的游戲截圖丨mobygames/Melliuc
《主題公園(Theme Park) 》系列,很多人應(yīng)該都玩過吧?玩家可以在一片空地上建立起好玩又賺錢的游樂場(chǎng)。這系列游戲的開山之作誕生于1994年,一經(jīng)推出立刻爆火,銷量百萬(wàn)、獲獎(jiǎng)無(wú)數(shù)——游戲項(xiàng)目負(fù)責(zé)人之一就是年僅17歲的哈薩比斯。
1994年版的《主題公園》,有游戲考古癖的可以玩一下丨mobygames/B.L. Stryker
這兩款游戲?qū)賹?shí)有點(diǎn)久遠(yuǎn)了,大家沒玩過都正常。但如果你小時(shí)候玩過《共和國(guó):革命(Republic: The Revolution)》和《邪惡天才(Evil Genius)》,那真的得感謝一下哈薩比斯——他創(chuàng)立的公司開發(fā)了這兩款游戲,也自己做了游戲的執(zhí)行設(shè)計(jì)師。
《邪惡天才》的截圖,似乎也是模擬經(jīng)營(yíng)類的游戲,哈薩比斯真的很喜歡這個(gè)類型啊丨mobygames/Der.Archivar
降本增效楷模
還是說回哈薩比斯現(xiàn)在的工作吧。我們知道他開發(fā)的AlphaGo下圍棋贏了人類(沒啥直接經(jīng)濟(jì)效益),AlphaFold能分析蛋白質(zhì)結(jié)構(gòu)(研究太基礎(chǔ)了),所以谷歌收購(gòu)DeepMind到底賺到啥了?
谷歌抹淚:它真的好替我省錢。
2014年,谷歌收購(gòu)了哈薩比斯創(chuàng)立的DeepMind,據(jù)說收購(gòu)價(jià)高達(dá)數(shù)億美元,但DeepMind大概已經(jīng)替谷歌把這筆錢賺回來(lái)了。
谷歌的電費(fèi)大頭,并不是辦公室的照明和燒水,而是用在給數(shù)據(jù)中心降溫上。你手機(jī)運(yùn)行個(gè)游戲還會(huì)發(fā)熱呢,谷歌處理gmail、google search等的大型數(shù)據(jù)中心,發(fā)熱更厲害,必須降溫才能繼續(xù)用。而且隨著數(shù)據(jù)量爆炸式增長(zhǎng),降溫電費(fèi)只會(huì)越來(lái)越高。
在被谷歌收購(gòu)2年后,DeepMind就開發(fā)出了一個(gè)人工智能框架,經(jīng)過挺復(fù)雜(且你們也不感興趣)(我也并不太懂)的過程,成功讓數(shù)據(jù)中心的降溫電費(fèi)少了40%——據(jù)說能讓谷歌在未來(lái)好幾年里,省下幾億美元。
賺了,真的賺大發(fā)了。
來(lái)自谷歌母公司首席財(cái)務(wù)官的微笑丨Eli Lilly
02 貝克:從哲學(xué)到生物學(xué)
大衛(wèi)·貝克出生于1962年,現(xiàn)在是華盛頓大學(xué)蛋白設(shè)計(jì)所的主任。
大衛(wèi)·貝克|Ian C. Haydon/IPD
他人生的大部分時(shí)間都在這所大學(xué)度過,小時(shí)候,他的父母都是這里的教授——父親研究弦理論和夸克,母親研究天體物理和大氣科學(xué)。但貝克當(dāng)時(shí)對(duì)科學(xué)并不感興趣,到哈佛大學(xué)念本科時(shí),他選擇了哲學(xué)和社會(huì)科學(xué),想知道人類大腦是如何做決定的。
直到大學(xué)最后一年,他上了發(fā)育生物學(xué)課程,讀到了《細(xì)胞分子生物學(xué)》這本書,才開始對(duì)生物學(xué)感興趣。博士時(shí)期,他加入了加州大學(xué)伯克利分校的細(xì)胞生物學(xué)家蘭迪·謝克曼(Randy Schekman)的實(shí)驗(yàn)室(蘭迪·謝克曼在2013年獲得了諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)),研究細(xì)胞是如何組織的。再之后,他的興趣逐漸轉(zhuǎn)移到了結(jié)構(gòu)生物學(xué)上。
90年代末期,貝克實(shí)驗(yàn)室開始開發(fā)計(jì)算機(jī)軟件Rosetta,這個(gè)軟件成功預(yù)測(cè)了氨基酸序列如何折疊成最終的蛋白質(zhì)構(gòu)型。貝克隨后意識(shí)到,它可以反過來(lái)用——從蛋白質(zhì)結(jié)構(gòu)反向推出氨基酸序列,從而讓從頭設(shè)計(jì)蛋白質(zhì)成為可能。正是這個(gè)想法引領(lǐng)他獲得了諾貝爾化學(xué)獎(jiǎng)。
每個(gè)人都能參與研究
貝克是徒步愛好者,他在一次徒步旅行中想到:可以讓公眾參與蛋白質(zhì)折疊的研究。
大衛(wèi)·貝克維基頁(yè)面上的照片,看來(lái)真的很愛徒步|Jeffreyjgray
2005年,貝克實(shí)驗(yàn)室開始運(yùn)行志愿分布式計(jì)算項(xiàng)目Rosetta@Home。任何人只要在自己的電腦上完成配置后,電腦就會(huì)自動(dòng)利用空閑計(jì)算力參與蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的研究。2008年,他又與兩位計(jì)算機(jī)教授合作,開發(fā)了蛋白質(zhì)折疊游戲Foldit,希望以此吸引公眾,幫助蛋白質(zhì)結(jié)構(gòu)研究推進(jìn)。
在游戲中,用戶使用工具,盡可能完美地折疊蛋白質(zhì)的結(jié)構(gòu)。研究人員會(huì)對(duì)游戲中的最高分方案進(jìn)行分析,確定這些方案是否可以應(yīng)用于現(xiàn)實(shí)世界,為疾病、藥物開發(fā)等研究提供靈感。這并非癡人說夢(mèng),比如在2011年,F(xiàn)oldit玩家就幫助破譯了Mason-Pfizer猴病毒的逆轉(zhuǎn)錄病毒蛋白酶的晶體結(jié)構(gòu)。
2019年,貝克在一次TED演講中描述了他對(duì)人造蛋白質(zhì)的五個(gè)期待:用于流感、艾滋病和癌癥的通用疫苗;治療慢性疼痛的先進(jìn)藥物;能夠?qū)⒁咽褂玫乃幬镞\(yùn)送到特定細(xì)胞的蛋白質(zhì)納米容器(這或許能消除副作用);治療神經(jīng)退行性疾病;能用于太陽(yáng)能捕獲的自組裝蛋白質(zhì)。雖然不知道這些目標(biāo)何時(shí)可以實(shí)現(xiàn),但科學(xué)嘛,總能帶給人們突破不可能的希望。
貝克實(shí)驗(yàn)室設(shè)計(jì)的一種基于蛋白質(zhì)的納米容器(3D打印模型),其靈感來(lái)自病毒的幾何外殼|Ian C. Haydon/IPD
03 朱默帕:學(xué)物理和數(shù)學(xué)的化學(xué)獎(jiǎng)得主
在還是青少年的時(shí)候,約翰·朱默帕(John Jumper)就自學(xué)了計(jì)算機(jī)編程,他在物理上也很有天賦,所以他本科讀了物理和數(shù)學(xué)。
朱默帕說,“我一直很喜歡發(fā)現(xiàn)宇宙真相,以為我會(huì)成為一個(gè)‘發(fā)現(xiàn)宇宙定律’的物理學(xué)家”。與此同時(shí),他那對(duì)都是工程師的父母,在擔(dān)心這孩子以后永遠(yuǎn)找不到工作。
本科時(shí)的Jumper
在本科階段,他就和費(fèi)米加速器實(shí)驗(yàn)室的人一起合作,研究被稱為夸克的亞原子粒子的奇怪性質(zhì)。有一天Jumper和研究人員一起吃午餐聊天,朱默帕問,“我們正在進(jìn)行的這個(gè)實(shí)驗(yàn),什么時(shí)候才能啟動(dòng)呢?”其中一個(gè)教授說他可能會(huì)先退休,另一個(gè)更老的教授說他可能活不到那一天了。于是,朱默帕決定要去搞點(diǎn)速度更快、能在更短時(shí)間內(nèi)完成的科學(xué)研究。
本科畢業(yè)后,他去了劍橋大學(xué)讀凝聚態(tài)物理的博士——但因?yàn)椴幌矚g研究課題,他沒讀完就走了。然后朱默帕去了一家私人研究機(jī)構(gòu)D.E.Shaw 研究公司,從事蛋白質(zhì)的計(jì)算機(jī)模擬工作。
“我當(dāng)年加入的時(shí)候都不知道蛋白質(zhì)是啥。”朱默帕回憶說。但研究公司里提供了很好的硬件環(huán)境,他可以用超級(jí)計(jì)算機(jī)來(lái)模擬分子,“我在一個(gè)周二做的模擬比我整個(gè)(劍橋)讀博期間做的還要多?!?/p>
然后朱默帕決定再讀一次博士,這次他去了芝加哥大學(xué)讀博,他仍然對(duì)蛋白質(zhì)結(jié)構(gòu)感興趣,而且開始轉(zhuǎn)向機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)。他博士論文的標(biāo)題是《基于嚴(yán)格機(jī)器學(xué)習(xí)的粗粒度蛋白質(zhì)折疊與動(dòng)力學(xué)新方法》,在第一頁(yè),他引用了英國(guó)統(tǒng)計(jì)學(xué)家喬治· 鮑克斯(George Box)的名言,“所有模型都是錯(cuò)的,但有些模型是有用的?!?/p>
這句話也非常適合用來(lái)形容AI。
2017年Jumper拿到博士學(xué)位,博士畢業(yè)7年后就拿了諾貝爾化學(xué)獎(jiǎng)。從諾貝爾化學(xué)獎(jiǎng)經(jīng)常不發(fā)給傳統(tǒng)化學(xué)家的角度來(lái)說,也非常合理。
要不是加入Deepmind,可能就不搞科研了
從芝加哥大學(xué)博士畢業(yè)的2017年,朱默帕加入了谷歌DeepMind團(tuán)隊(duì)。
當(dāng)時(shí)他已經(jīng)聽說了Deepmind有計(jì)劃解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的問題,不過那時(shí)這個(gè)項(xiàng)目還在保密階段。在去Deepmind面試時(shí),他只要一提蛋白質(zhì)折疊,Deepmind團(tuán)隊(duì)就轉(zhuǎn)移話題。
不過, 朱默帕對(duì)此很感興趣,也決意加入。“如果不是為了 DeepMind,我可能會(huì)離開科學(xué)界?!?/p>
敢于轉(zhuǎn)向的Alphafold功臣
2018年,DeepMind團(tuán)隊(duì)拿出了第一代AlphaFold,參加了第十三屆全球蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽(CASP),這個(gè)比賽相當(dāng)于蛋白結(jié)構(gòu)預(yù)測(cè)界的奧林匹克,比的是預(yù)測(cè)的結(jié)構(gòu)與實(shí)驗(yàn)室里實(shí)際確定的蛋白質(zhì)實(shí)際結(jié)構(gòu)有多接近。
當(dāng)時(shí)他們還討論過要不要匿名參加,因?yàn)槿绻且粋€(gè)學(xué)術(shù)界的團(tuán)隊(duì)參加而且慘敗了,也沒什么,但是如果是谷歌這樣市值數(shù)十億美元的科技公司參與還失敗了,那就搞不好是個(gè)大新聞,而且股價(jià)也要波動(dòng)了。不過,他們最后還是決定以谷歌 DeepMind 的名義實(shí)名參賽。
第一代AlphaFold表現(xiàn)得很好,但還沒有達(dá)到足夠高的準(zhǔn)確率。當(dāng)時(shí),正是朱默帕決定拋棄原本的路線,重頭開始。同事回憶說,早期版本的“ AlphaFold2”表現(xiàn)比它的前輩差得多,但朱默帕堅(jiān)持了下來(lái),“他不害怕接受新的方向。”
僅僅2年后的2020年,朱默帕就帶著第二代AlphaFold參加了第十四屆全球蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽(CASP14),預(yù)測(cè)了幾十種蛋白質(zhì)的結(jié)構(gòu),誤差范圍僅為1.6?!@意味著預(yù)測(cè)精度已經(jīng)達(dá)到了單個(gè)原子的級(jí)別,在研究中已經(jīng)很實(shí)用了。
順便一提,2020年正值新冠大流行,所以CASP14這場(chǎng)比賽是在線上舉辦,通過zoom遠(yuǎn)程召開的。在Alphafold2的比賽結(jié)果出來(lái)后,很多結(jié)構(gòu)科學(xué)家們呆在自己家里,盯著屏幕,意識(shí)到蛋白質(zhì)科學(xué)的世界被永久改變了。
ZOOM會(huì)議中的AlphaFold團(tuán)隊(duì) | DeepMind
“人類在預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)方面是垃圾”
朱默帕認(rèn)為,在有些方面,AI比人類有明顯優(yōu)勢(shì)。他說過,“我們?nèi)祟愒陬A(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)方面是垃圾。”
AlphaFold并不會(huì)完全取代實(shí)驗(yàn)方法。科學(xué)家們還需要用實(shí)驗(yàn)來(lái)驗(yàn)證AI的猜測(cè),尤其是那些AI自己都拿不太準(zhǔn)的區(qū)域。但它能夠?qū)⑿枰?yàn)證的范圍大幅縮小,由此省下相當(dāng)可觀的研究費(fèi)用與時(shí)間。
朱默帕說,“我最自豪的是,AlphaFold2讓所有所有結(jié)構(gòu)生物學(xué)的速度提高了5% 或10% ,生物學(xué)家現(xiàn)在可以節(jié)省一到兩年時(shí)間?!彼麄兛梢愿斓厝z驗(yàn)和確定某種蛋白質(zhì)的結(jié)構(gòu)。
已經(jīng)有科學(xué)家用Alphafold2來(lái)繪制更好的人類心臟圖表,建立抗生素耐藥模型,鑒定澳大利亞5萬(wàn)年前滅絕的鳥類的蛋。
AlphaFold此前兩代都是開源的,但出于商業(yè)的考慮,Jumper 團(tuán)隊(duì)2024年5月發(fā)布的 AlphaFold 3是不開源的。
AlphaFold 3是目前最強(qiáng)大的結(jié)構(gòu)預(yù)測(cè)工具之一,它可以預(yù)測(cè)相互結(jié)合的蛋白質(zhì)、DNA 和、RNA 以及其他小分子的結(jié)構(gòu)。不過,因?yàn)锳lphaFold 3引入了“diffusion模型”,也就是那些文字生圖、文字生視頻的底層技術(shù),所以也無(wú)可避免地會(huì)引入這個(gè)模型的“幻覺”問題。
至于AlphaFold 3,以及未來(lái)的第n代AlphaFold會(huì)不會(huì)胡說八道……就交給諾獎(jiǎng)得主們?nèi)ゲ傩陌伞?/p>
參考文獻(xiàn)
[1]https://www.163.com/sports/article/BHLG664200051CAQ.html
[2]https://achievement.org/achiever/demis-hassabis-ph-d/#interview
[3]https://achievement.org/achiever/demis-hassabis-ph-d/
[4]https://www.nural.cc/deepmind-ai-framework/
[5]https://deepmind.google/discover/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-by-40/
[6]https://www.businessinsider.com/the-incredible-life-of-deepmind-cofounder-demis-hassabis-2017-5
[7]Jumper, J. M. (2017). New Methods Using Rigorous Machine Learning for Coarse-Grained Protein Folding and Dynamics. Knowledge UChicago. Retrieved from [8]https://knowledge.uchicago.edu/record/229?v=pdf
[9]How AI Revolutionized Protein Science, but Didn’t End It | Quanta Magazine. (2024, June 28). Retrieved from [10]https://www.quantamagazine.org/how-ai-revolutionized-protein-science-but-didnt-end-it-20240626
[11]Booth, H. (2024). See Everyone on the 2024 TIME100 AI List. Time. Retrieved from https://time.com/7012710/john-jumper-2
[12]Nature’s 10. (2021, December 15). Retrieved from https://www.nature.com/immersive/d41586-021-03621-0/index.html#section-7cgEBpkV9L
[13]Sosnick, T. R. (2023). AlphaFold developers Demis Hassabis and John Jumper share the 2023 Albert Lasker Basic Medical Research Award. J. Clin. Invest., 133(19). doi: 10.1172/JCI174915
[14]Browne, G. (2021). DeepMind’s AI has finally shown how useful it can be. WIRED. Retrieved from https://www.wired.com/story/deepmind-protein-folding-database
[15]Heaven, W. D. (2021). DeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology. MIT Technology Review. Retrieved from https://www.technologyreview.com/2020/11/30/1012712/deepmind-protein-folding-ai-solved-biology-science-drugs-disease
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。