編者按:本文來自微信公眾號 阿爾法公社(ID:alphastartups),創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
AI編程是生成式AI崛起以來最熱門的賽道之一,不僅海內(nèi)外大廠均有布局,而且已經(jīng)誕生了數(shù)家融資額過億,估值過10億美元的頭部創(chuàng)業(yè)公司。
無論對于程序員還是企業(yè)客戶,AI編程的本質(zhì)價值是降本增效,而且它帶來的效果是直接的,目前已有44%的程序員使用過AI編程軟件。
對于大多數(shù)科技公司,技術(shù)團(tuán)隊是核心團(tuán)隊之一,他們構(gòu)建了公司的核心技術(shù)。同時,維持技術(shù)團(tuán)隊的規(guī)模也是公司開支的主要部分,根據(jù)Gartner的數(shù)據(jù),科技公司每年在軟件工程上的支出超過1萬億美元。
但是在公司層面,大多數(shù)公司對于目前的軟件并不滿意。一方面,現(xiàn)代軟件功能豐富,同時結(jié)構(gòu)也很復(fù)雜,維持軟硬件堆棧需要多個不同職能的技術(shù)團(tuán)隊配合,這會產(chǎn)生很高的人力成本。
另一方面,軟件脆弱而維護(hù)成本高昂,開發(fā)團(tuán)隊因功能請求、錯誤修復(fù)、安全補(bǔ)丁、集成請求、遷移和升級的長期積壓而面臨困難。同時還需要運(yùn)維和測試團(tuán)隊的配合,而運(yùn)維和測試團(tuán)隊的特點(diǎn)是,不需要太多創(chuàng)造性,但是需要“堆人”。
對于程序員,在他們的實(shí)際工作中,往往因為各種冗長的會議和復(fù)雜的需求溝通,導(dǎo)致實(shí)際用來編程的時間較少。而在實(shí)際的編程工作中,還有很多不需要怎么思考的“雜活”。這壓縮了他們能夠認(rèn)真思考和高質(zhì)量編程的時間精力,進(jìn)而導(dǎo)致他們效率偏低,產(chǎn)出偏少,成就感低。
AI編程軟件成為AI時代最熱門的應(yīng)用細(xì)分賽道之一并不是偶然,對于企業(yè)來說,他們希望AI幫助技術(shù)團(tuán)隊提高效率,并且做一些需要“智能”的重復(fù)性工作,縮減外圍團(tuán)隊成本。對于程序員來說,AI編程助手能夠幫助他們節(jié)省時間,提高效率,并且把更多時間放在“有效編程”上,讓更多技術(shù)人員成為“10倍程序員”。
最近的StackOverflow(程序設(shè)計領(lǐng)域的大型社區(qū)) 調(diào)查顯示,44%的程序員表示目前正在使用AI編程工具作為開發(fā)流程的一部分,26%的人計劃很快使用。Gartner估計,超過一半的組織目前正在試點(diǎn)或已經(jīng)部署了AI編程助手,到2028年,75%的程序員將以某種形式使用AI編程工具。
AI編程賽道獨(dú)角獸井噴
編程能力已經(jīng)是各個大模型廠商在打造基礎(chǔ)模型時的一個重要努力方向,因為這和數(shù)學(xué)能力一樣,能從側(cè)面顯示出模型的邏輯推理能力。自GPT-4發(fā)布以來,每一個模型在發(fā)布時,都要重點(diǎn)介紹自己的編程能力。而評判模型編程能力的Benchmark也在不斷迭代,從最初的HumanEval到現(xiàn)在更接近真實(shí),更能評估模型解決實(shí)際編程問題能力的SWE-bench。
在人工智能時代,人們打造AI編程軟件的思路是以模型能力為基底,從實(shí)際的需求和場景出發(fā),去打造產(chǎn)品能力。在這個過程中,模型和專有數(shù)據(jù)固然能在能力上保證產(chǎn)品的性能,對于場景和需求的理解,更決定了產(chǎn)品與用戶(客戶)的契合度。
大廠積極布局
AI編程軟件最早推出的形式是編程助手,這也是目前最主流的方式,它的代表產(chǎn)品是GitHub Copilot。
GitHub Copilot既針對個人開發(fā)者用戶,又針對企業(yè)客戶,它具有代碼補(bǔ)全,代碼注釋,函數(shù)生成,代碼審查等一系列對于程序員來說非常實(shí)用的功能。而且GitHub Copilot背靠微軟和OpenAI,在技術(shù)上較有保證。
GitHub Copilot也是在這個賽道上商業(yè)化突出的產(chǎn)品,截至2024年2月,它已經(jīng)有130萬的付費(fèi)用戶和50000個企業(yè)客戶。
微軟的競爭對手們也紛紛推出了對標(biāo)的產(chǎn)品,AWS有CodeWhisperer,Meta有Code Llama,谷歌則將產(chǎn)品更新成Gemini Code Assist,這些產(chǎn)品都基于先進(jìn)的AI模型搭建。
多家創(chuàng)業(yè)公司獲得大額融資
不過,大廠推出這些產(chǎn)品主要是為了搭建生態(tài),保證自己不落后,產(chǎn)品和技術(shù)創(chuàng)新的中心還是看創(chuàng)業(yè)公司。海外在這個賽道耕耘的代表性創(chuàng)業(yè)公司有Replit、Codium、cognition-labs、Augment等,它們都做了不同程度的產(chǎn)品創(chuàng)新。
例如Replit,Codium都有IDE插件產(chǎn)品,集成度更高,更貼近個人程序員的使用習(xí)慣。Codium還推出Coding-Agent,具有本地代碼索引和檢索增強(qiáng)生成功能,可以根據(jù)需求自動化生成代碼,進(jìn)一步提升編程的自動化水平。
而cognition-labs更是推出了AI程序員Devin,可以把它看成專門經(jīng)過編程優(yōu)化的自動Agent,它能夠獨(dú)立工作,而不僅是作為程序員的輔助工具。這種產(chǎn)品形式對于企業(yè)客戶更有吸引力。
在商業(yè)模式上,不少公司主要還是面向程序員群體,AI編程軟件既能降低編程的門檻,幫助初級程序員拓展邊界,又能讓資深程序員提高效率,少做“臟活”,更大程度發(fā)揮創(chuàng)造力,所以會有較強(qiáng)的付費(fèi)意愿。
而Augment則是面向企業(yè),它根據(jù)大企業(yè)的需求加強(qiáng)了AI編程軟件的推理運(yùn)行速度,以及安全性和可靠性。基于AI編程軟件商業(yè)化的本質(zhì)需求:降低成本,提高效率,釋放生產(chǎn)力,未來的公司在商業(yè)化時會越來越將企業(yè)客戶作為重點(diǎn)。
在融資情況上,AI編程賽道的公司們都獲得了AI應(yīng)用領(lǐng)域相對大額的融資,例如Replit獲得了a16z領(lǐng)投的9740萬美元融資,估值11.6億美元;Codium獲得6500萬美元融資,估值5億美元;cognition-labs此前獲得Founder's Fund領(lǐng)投的2100萬美元融資后,又將以20億美元估值獲得Founder's Fund投資的新一筆融資;Augment則獲得2.52億美元融資,估值9.77億美元。可以說,AI編程賽道是AI應(yīng)用領(lǐng)域獨(dú)角獸最集中的方向之一。
在創(chuàng)始人背景上,AI編程賽道的公司大多由具有雄厚編程技術(shù)背景的知名人才創(chuàng)立,無論他們是來自產(chǎn)業(yè)界還是學(xué)術(shù)界。例如Replit的創(chuàng)始人Amjad Masa曾在雅虎和Facebook有多年的編程經(jīng)驗,而Augment的創(chuàng)始人Igor Ostrovsky則來自微軟;cognition-labs的創(chuàng)始團(tuán)隊的成員獲得了10個IOI(國際信息學(xué)奧林匹克競賽)金牌,而且大多為華人。
中國有自主框架和技術(shù)的AI編程產(chǎn)品
在中國市場,AI編程也是AI應(yīng)用相當(dāng)火熱的領(lǐng)域,無論是大廠還是頭部創(chuàng)業(yè)公司都在這個領(lǐng)域推出了自己的產(chǎn)品?;ヂ?lián)網(wǎng)大廠中,百度有Comate,阿里有通義靈碼,商湯有代碼小浣熊Raccoon,華為有盤古Coder。他們都基于自有的大模型搭建,多是以AI編程助手為產(chǎn)品形式,在功能上與GitHub Copilot近似,并且在多程序語言支持,IDE兼容和中文編程上表現(xiàn)都較好。
與海外市場相比,國內(nèi)專注于AI編程的創(chuàng)業(yè)公司目前還相對較少,但也有頭部創(chuàng)業(yè)公司推出能力較強(qiáng)的AI助手產(chǎn)品,典型的例子是智譜AI的CodeGeeX和非十科技的Fitten Code,這兩家創(chuàng)業(yè)公司的創(chuàng)業(yè)團(tuán)隊都來自清華。
而且這兩個產(chǎn)品都基于國產(chǎn)的框架開發(fā),例如CodeGeeX由清華大學(xué)的知識工程實(shí)驗室團(tuán)隊與智譜AI合作開發(fā),采用了華為MindSpore框架,而Fitten Code則基于自有的Jittor深度學(xué)習(xí)框架打造。
在中國目前的AI創(chuàng)業(yè)環(huán)境下,使用國產(chǎn)框架開發(fā),在國產(chǎn)AI基礎(chǔ)設(shè)施上運(yùn)行,使這些AI編程產(chǎn)品具有較好的自主性和“安全性”。而無論是依托中國龐大的國內(nèi)市場發(fā)展,還是出海直面國際競爭,中國的創(chuàng)業(yè)公司和AI編程產(chǎn)品都具有不錯的潛力和發(fā)展空間。
AI編程賽道,何時開始賺錢?
盡管AI編程有不少大大小小的玩家,有獲得了大額融資的創(chuàng)業(yè)公司,但它仍然處于發(fā)展的早期階段,面臨一系列問題。
第一個問題是成本和效益的平衡,因為AI模型推理成本的高企,大多數(shù)AI編程企業(yè)都處于虧損狀態(tài),甚至背靠微軟的GitHub Copilot目前每個用戶每個月也要虧損約20至80美元,也就是它還沒有解決單位經(jīng)濟(jì)學(xué)問題。而要解決這個問題,將運(yùn)營成本降下來,需要AI算力和AI云服務(wù)公司的共同努力,在這個方向上同樣有不少公司,我們此前已經(jīng)介紹過的Foundry和d-Matrix就在這個方面深耕。
第二個問題是安全問題,也就是AI編程工具生成的代碼仍然有質(zhì)量低,錯誤偏多的問題,這會放大軟件項目中現(xiàn)有的錯誤和漏洞。這個問題,本質(zhì)上還是因為AI模型本身就會產(chǎn)生“幻覺”,并且生成內(nèi)容的精確性還不夠高。未來要解決這個問題,一方面需要升級AI編程模型的基礎(chǔ)能力,減少“幻覺”,另一方面也需要在工程方面針對性地打好補(bǔ)丁。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點(diǎn),不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。