Anthropic CEO最新預(yù)言：90%程序員的飯碗年內(nèi)不保

AI鯨選社·2025-03-13

AI唯一取代不了就是編程背鍋。

本文來自微信公眾號(hào)“鯨選AI”，作者：點(diǎn)贊關(guān)注，36氪經(jīng)授權(quán)發(fā)布。

編者按：本文來自微信公眾號(hào) “筆記俠”（ID：Notesman），作者：老賈，創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

最新消息，Anthropic首席執(zhí)行官Dario Amodei更在近日直言：未來3到6個(gè)月，AI將編寫90%的代碼，而在12個(gè)月內(nèi)，幾乎所有的代碼都可能由AI編寫。

之所以敢于如此預(yù)言，是隨著最近一系列重磅AI 產(chǎn)品的發(fā)布，程序員這個(gè)群體的危機(jī)感越來越強(qiáng)。AI進(jìn)化，導(dǎo)致代碼中很多工作都可以被代替了。

尤其編碼能力再次打破天花板的Claude3.7，以及Windsurf’s Wave 4。此前大火的OpenAI o3大模型，以及已經(jīng)成為獨(dú)立開發(fā)者口中經(jīng)典的Cursor，都是標(biāo)桿型產(chǎn)品，以至于有人驚呼：程序員飯碗要不保了。

重點(diǎn)提及下，最新的Agentic Coding Evalution榜單中，Sonnet 3.7 以67%的得分率，在初級(jí)人員開發(fā)評(píng)估達(dá)成度中位列所有模型第一。第二三名中GPT-4.5和Sonnet 3.5也相差相差無幾，都超過了60%。顯示了這幾款模型的編程能力強(qiáng)大。

實(shí)際上，兩大模型在編程方面略有側(cè)重， GPT-4.5 在涉及架構(gòu)和跨系統(tǒng)交互的任務(wù)上峰值更高，而 Claude 3.7 Sonnet 在原始編碼和代碼編輯上的峰值更高。

可能單純說分?jǐn)?shù)，并不好直觀理解大模型的能力，換個(gè)方式用實(shí)際案例來講述。

此前，o3 模型在 Elo 得分（2727 分）所對(duì)應(yīng)的排名高居175 名。這是個(gè)人類編程測試比賽，類似高考前大家都不知道考試題內(nèi)容，所以不存在大模型已經(jīng)刷過題的可能。

這個(gè)競賽一共有全球 168076 名程序員參賽，175名是前0.1%選手（1-175/168076=99.9%），換句話說：o3 已經(jīng)在編程競技中擊敗了世界上 99.9% 的程序員，Claude 3.7 sonnet應(yīng)該還會(huì)更好一點(diǎn)。

不只在模型層AI Coding實(shí)現(xiàn)了巨大的跨越，在產(chǎn)品開發(fā)層面也有了重大的升級(jí)。

字節(jié)跳動(dòng)的Trae海外版就接入了 Claude-3.7-Sonnet、GPT-4o 等國際大模型，也具備IDE的能力。小白也能編程的目的接近實(shí)現(xiàn)，程序員的門檻被進(jìn)一步降低。

最最重要的是，Trae 海外版完全免費(fèi)，用戶可以無成本地使用其所有功能。而 Cursor 需要付費(fèi)訂閱，價(jià)格為每月 20 美元。

國外就有網(wǎng)友利用Trae和里面內(nèi)置的Claude3.7，只需一個(gè)設(shè)計(jì)草圖和一個(gè)超級(jí)簡單的提示，它就會(huì)自動(dòng)生成 3D 動(dòng)畫地球的代碼。 Prompt:

構(gòu)建一個(gè) 3D 地球，讓用戶可以改變視點(diǎn)、使用衛(wèi)星圖像地圖并突出顯示南極洲。
這個(gè) 3D 地球包含以下功能：使用 Three.js 構(gòu)建了一個(gè)交互式 3D 地球模型。

也有人靠此賺到了真金白銀的收益。海外一位叫 Pieter Levels 的大神只用了 3 個(gè)小時(shí)，完全依靠 AI 開發(fā)了一款游戲。上線 13 天已經(jīng)賺了 67,000 美元，折合人民幣接近 50 萬元，馬斯克都為此點(diǎn)贊！

是不是有這么神奇，鯨哥自己也做了個(gè)Case 。鑒于我是完全的小白，我打算做一個(gè)不是特別難，但是蘋果和國內(nèi)軟件企業(yè)都沒做好的產(chǎn)品—“To do日歷”（個(gè)人認(rèn)為我做的最好，可能是我用的日歷產(chǎn)品比較少）。

Trae編寫程序頁面

我們使用字節(jié)剛剛推出的AI Coding產(chǎn)品Trae，具體是用Trae的Builder模式，這個(gè)模式支持一鍵從0到1生成應(yīng)用；Chat模式適合不斷修改的模式。我們輸入了如下Prompt:

生成一個(gè)To do list小程序，要求結(jié)合日歷。左側(cè)是日歷，日歷上每天可以添加簡單事項(xiàng)，右側(cè)是這天的詳細(xì)To do list。每件事后面可以打?qū)椿蛘卟妫硎久考乱呀?jīng)完成或者未完成，未完成事項(xiàng)自動(dòng)進(jìn)下一天list，并且可以編輯。

幾分鐘就生成了應(yīng)用代碼，而在預(yù)覽的過程中，Trae最牛的地方還是幫你缺啥補(bǔ)啥，開發(fā)環(huán)境一步步幫你部署到電腦上，運(yùn)行監(jiān)測一步步落實(shí)。

最終呈現(xiàn)的效果大家可以看看,我個(gè)人想要的幾個(gè)邏輯都復(fù)現(xiàn)了。

鯨哥用自然語言編寫出的程序

第一是右側(cè)list完成的打?qū)?，事?xiàng)就會(huì)被畫橫線，顯示已經(jīng)完成；未完成的事項(xiàng)打叉，會(huì)自動(dòng)加入到第二天的To do list。

第二是每件事可以任務(wù)分類，寫的時(shí)候選擇是工作還是生活學(xué)習(xí)類的標(biāo)簽；然后單獨(dú)點(diǎn)擊工作等某個(gè)標(biāo)簽，會(huì)顯示這個(gè)月內(nèi)要做的工作list。

第三是長短期任務(wù)結(jié)合，都可以添加和顯示，尤其長期任務(wù)是每天顯示進(jìn)度，起到很好的督促作用。

而實(shí)現(xiàn)以上完整邏輯，鯨哥也是和Trae連續(xù)對(duì)話一下午，期間Trae調(diào)用Claude 3.7模型，動(dòng)不動(dòng)就要排隊(duì)200多名，以及復(fù)雜任務(wù)還經(jīng)常報(bào)錯(cuò)，鯨哥最開始想做AI版陌陌，太復(fù)雜最終沒能完成。

盡管仍有很多不完美的地方，但是只花了一下午就做出了成品，無論效率還是效果還是挺驚人的。當(dāng)然這款程序可能無法推向市場，因?yàn)榇a水平達(dá)不到商用的水平。

但我們要知道，大模型代碼的水平正快速提高，從幾方面正在接近人類：

Sonnet 3.5 可以輸出 200 行，而 Sonnet 3.7 已經(jīng)可以輸出 1000-1500 行代碼，是第一個(gè)可靠代碼長度上千行的模型。

以后大量繁雜枯燥的編程就不需要一行行打了，大量初級(jí)程序員的位置被取代。刷Leetcode也不再有意義，朋友以前寫代碼經(jīng)常借助sider，每年一千多元的費(fèi)用，現(xiàn)在也不用了，直接借助大模型。

還有Action scaling的關(guān)鍵能力，能夠連續(xù)做 function call 和 tool use ，并持續(xù)根據(jù)環(huán)境的反饋迭代，直到把一個(gè)開放式問題解決，這在未來的進(jìn)化能力不可小覷。

當(dāng)然有朋友說，AI能和客戶對(duì)需求嗎？AI會(huì)和PM吵架嗎？AI能背鍋嗎？

Claude3.7發(fā)布后，他驚呼自己工作都要不保了，他所在的外包公司近一年中，也因?yàn)锳I等復(fù)雜因素裁員了一些人；

不可否認(rèn)的是，現(xiàn)在還不行，但Devin等產(chǎn)品正在呈現(xiàn)一定的AI Agent能力，理解并執(zhí)行的能力快速提高，人人都是產(chǎn)品經(jīng)理的時(shí)代就會(huì)到來。

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表，版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn)，不代表創(chuàng)業(yè)邦立場，轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問，請(qǐng)聯(lián)系editor@cyzone.cn。