五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

Anthropic CEO最新預(yù)言:90%程序員的飯碗年內(nèi)不保

AI唯一取代不了就是編程背鍋。

本文來自微信公眾號“鯨選AI”,作者:點贊關(guān)注,36氪經(jīng)授權(quán)發(fā)布。

編者按:本文來自微信公眾號 “筆記俠”(ID:Notesman),作者:老賈,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

最新消息,Anthropic首席執(zhí)行官Dario Amodei更在近日直言:未來3到6個月,AI將編寫90%的代碼,而在12個月內(nèi),幾乎所有的代碼都可能由AI編寫。

之所以敢于如此預(yù)言,是隨著最近一系列重磅AI 產(chǎn)品的發(fā)布,程序員這個群體的危機感越來越強。AI進(jìn)化,導(dǎo)致代碼中很多工作都可以被代替了。

尤其編碼能力再次打破天花板的Claude3.7,以及Windsurf’s Wave 4。此前大火的OpenAI o3大模型,以及已經(jīng)成為獨立開發(fā)者口中經(jīng)典的Cursor,都是標(biāo)桿型產(chǎn)品,以至于有人驚呼:程序員飯碗要不保了。

重點提及下,最新的Agentic Coding Evalution榜單中,Sonnet 3.7 以67%的得分率,在初級人員開發(fā)評估達(dá)成度中位列所有模型第一。第二三名中GPT-4.5和Sonnet 3.5也相差相差無幾,都超過了60%。顯示了這幾款模型的編程能力強大。

實際上,兩大模型在編程方面略有側(cè)重, GPT-4.5 在涉及架構(gòu)和跨系統(tǒng)交互的任務(wù)上峰值更高,而 Claude 3.7 Sonnet 在原始編碼和代碼編輯上的峰值更高。

可能單純說分?jǐn)?shù),并不好直觀理解大模型的能力,換個方式用實際案例來講述。

此前,o3 模型在 Elo 得分(2727 分)所對應(yīng)的排名高居175 名。這是個人類編程測試比賽,類似高考前大家都不知道考試題內(nèi)容,所以不存在大模型已經(jīng)刷過題的可能。

這個競賽一共有全球 168076 名程序員參賽,175名是前0.1%選手(1-175/168076=99.9%),換句話說:o3 已經(jīng)在編程競技中擊敗了世界上 99.9% 的程序員,Claude 3.7 sonnet應(yīng)該還會更好一點。

不只在模型層AI Coding實現(xiàn)了巨大的跨越,在產(chǎn)品開發(fā)層面也有了重大的升級。

字節(jié)跳動的Trae海外版就接入了 Claude-3.7-Sonnet、GPT-4o 等國際大模型,也具備IDE的能力。小白也能編程的目的接近實現(xiàn),程序員的門檻被進(jìn)一步降低。

最最重要的是,Trae 海外版完全免費,用戶可以無成本地使用其所有功能。而 Cursor 需要付費訂閱,價格為每月 20 美元。

國外就有網(wǎng)友利用Trae和里面內(nèi)置的Claude3.7,只需一個設(shè)計草圖和一個超級簡單的提示,它就會自動生成 3D 動畫地球的代碼。 Prompt:

構(gòu)建一個 3D 地球,讓用戶可以改變視點、使用衛(wèi)星圖像地圖并突出顯示南極洲。

這個 3D 地球包含以下功能:使用 Three.js 構(gòu)建了一個交互式 3D 地球模型。

也有人靠此賺到了真金白銀的收益。海外一位叫 Pieter Levels 的大神只用了 3 個小時,完全依靠 AI 開發(fā)了一款游戲。上線 13 天已經(jīng)賺了 67,000 美元,折合人民幣接近 50 萬元,馬斯克都為此點贊!

是不是有這么神奇,鯨哥自己也做了個Case 。 鑒于我是完全的小白,我打算做一個不是特別難,但是蘋果和國內(nèi)軟件企業(yè)都沒做好的產(chǎn)品—“To do日歷”(個人認(rèn)為我做的最好,可能是我用的日歷產(chǎn)品比較少)。

Trae編寫程序頁面

我們使用字節(jié)剛剛推出的AI Coding產(chǎn)品Trae,具體是用Trae的Builder模式,這個模式支持一鍵從0到1生成應(yīng)用;Chat模式適合不斷修改的模式。我們輸入了如下Prompt:

生成一個To do list小程序,要求結(jié)合日歷。左側(cè)是日歷,日歷上每天可以添加簡單事項,右側(cè)是這天的詳細(xì)To do list。每件事后面可以打?qū)椿蛘卟?,表示每件事已?jīng)完成或者未完成,未完成事項自動進(jìn)下一天list,并且可以編輯。

幾分鐘就生成了應(yīng)用代碼,而在預(yù)覽的過程中,Trae最牛的地方還是幫你缺啥補啥,開發(fā)環(huán)境一步步幫你部署到電腦上,運行監(jiān)測一步步落實。

最終呈現(xiàn)的效果大家可以看看,我個人想要的幾個邏輯都復(fù)現(xiàn)了。

鯨哥用自然語言編寫出的程序

第一 是右側(cè)list完成的打?qū)矗马椌蜁划嫏M線,顯示已經(jīng)完成;未完成的事項打叉,會自動加入到第二天的To do list。

第二是每件事可以任務(wù)分類,寫的時候選擇是工作還是生活學(xué)習(xí)類的標(biāo)簽;然后單獨點擊工作等某個標(biāo)簽,會顯示這個月內(nèi)要做的工作list。

第三是長短期任務(wù)結(jié)合,都可以添加和顯示,尤其長期任務(wù)是每天顯示進(jìn)度,起到很好的督促作用。

而實現(xiàn)以上完整邏輯,鯨哥也是和Trae連續(xù)對話一下午,期間Trae調(diào)用Claude 3.7模型,動不動就要排隊200多名,以及復(fù)雜任務(wù)還經(jīng)常報錯,鯨哥最開始想做AI版陌陌,太復(fù)雜最終沒能完成。

盡管仍有很多不完美的地方,但是只花了一下午 就做出了成品,無論效率還是效果還是挺驚人的。當(dāng)然這款程序可能無法推向市場,因為代碼水平達(dá)不到商用的水平。

但我們要知道,大模型代碼的水平正快速提高, 從幾方面正在接近人類:

Sonnet 3.5 可以輸出 200 行,而 Sonnet 3.7 已經(jīng)可以輸出 1000-1500 行代碼,是第一個可靠代碼長度上千行的模型。

以后大量繁雜枯燥的編程就不需要一行行打了,大量初級程序員的位置被取代。刷Leetcode也不再有意義,朋友以前寫代碼經(jīng)常借助sider,每年一千多元的費用,現(xiàn)在也不用了,直接借助大模型。

還有Action scaling的關(guān)鍵能力,能夠連續(xù)做 function call 和 tool use ,并持續(xù)根據(jù)環(huán)境的反饋迭代,直到把一個開放式問題解決,這在未來的進(jìn)化能力不可小覷。

當(dāng)然有朋友說,AI能和客戶對需求嗎?AI會和PM吵架嗎?AI能背鍋嗎?

Claude3.7發(fā)布后,他驚呼自己工作都要不保了,他所在的外包公司近一年中,也因為AI等復(fù)雜因素裁員了一些人;

不可否認(rèn)的是,現(xiàn)在還不行,但Devin等產(chǎn)品正在呈現(xiàn)一定的AI Agent能力,理解并執(zhí)行的能力快速提高,人人都是產(chǎn)品經(jīng)理的時代就會到來。

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。

反饋
聯(lián)系我們
推薦訂閱