作者丨王藝
編輯丨海腰
與大模型一同誕生的提示詞(Prompt)已成為AI領(lǐng)域繞不開的概念。
Sam Altman在與領(lǐng)英聯(lián)合創(chuàng)始人Reid Hoffman對談時表示,五年后我們將不再需要提示詞工程(Prompt Engineering),或者只需在這方面做少量工作;將來的AI系統(tǒng)不會因為增補(bǔ)了某個特定詞就產(chǎn)生截然不同的輸出,而是可以較好地理解自然語言。用戶只需以文本和語音形式輸入指令,就可以讓計算機(jī)完成圖像生成、資料研究、心理咨詢等復(fù)雜任務(wù)。
Sam Altman的表態(tài)讓外界普遍認(rèn)為其不看好提示詞的前景。
但Sam Altman的不看好,針對的是提示詞工程,而不是提示詞本身。
在大模型愈發(fā)完善,愈發(fā)成熟的未來,以提示詞工程的形式,讓大模型更好的理解自然語言大可不必,但提示詞本身卻有著無限可能。
紅杉一代目Don Valentine曾回憶,自己見過最會提問題的人是喬布斯和紅杉二代目Michael Moritz。
提示詞的本質(zhì)是好問題,而不是提示。
提示詞產(chǎn)品創(chuàng)新浪潮
提示詞的發(fā)展是與生成式AI和大模型的發(fā)展緊密相關(guān)。
在去年8月美國科羅拉多州藝術(shù)博覽會上的作品《太空歌劇院》大火之后,Midjourney、Stable Diffusion、DALLE等AI繪畫大模型迅速火爆全網(wǎng),相伴而生的是各類AI繪畫提示詞網(wǎng)站和課程,比如做提示詞交易市場的PromptBase、做提示詞生成器的AI畫廊等。
第二波浪潮是ChatGPT、尤其是GPT-4發(fā)布后,用戶看到了AI聊天機(jī)器人的強(qiáng)大實力,開始探索各種各樣提示詞的玩法,“Prompt Engineer”這一職業(yè)也應(yīng)運(yùn)而生,抖音上出現(xiàn)了很多打著“成為年薪百萬的提示詞工程師”的旗號售價199、299等的提示詞課程,門檻費(fèi)用在200-1000不等的提示詞社群、知識星球等也如雨后春筍般出現(xiàn)。
第三波浪潮則是今年11月GPTs發(fā)布之后,提示詞的創(chuàng)作過程和使用場景發(fā)生了極大的變化——GPTs通過對話的形式,將一些“原始提示詞”封裝在了一個小小的對話機(jī)器人里,用戶通過和GPT對話(對話的過程也是輸入原始提示詞的過程)創(chuàng)造出自己的GPTs之后,可以自用也可以分發(fā),GPTs能夠基于其原始的訓(xùn)練數(shù)據(jù),更加高效、專業(yè)地解決用戶問題。
GPTs發(fā)布之后,一批非官方的GPTs商店如Supertools、Suefel、GPTs Hunter等如雨后春筍般出現(xiàn),用戶對“手搓大模型——打造自己的GPTs”表現(xiàn)出了前所未有的熱情,搞出了數(shù)據(jù)分析、學(xué)術(shù)論文、英語學(xué)習(xí)、武林秘傳、塔羅測算、為你寫詩、模擬老爸……等形形色色的GPTs。截至12月16日,也就是GPTs開放給用戶之后大約一個月的事件里,GPTs Hunter上已匯聚了61818個GPT,而整個ChatGPT上的GPTs數(shù)量更是遠(yuǎn)遠(yuǎn)超過這個數(shù)字。
GPTs讓人們的想象力和創(chuàng)造力得到了極大的發(fā)揮,他們搞出了一些相當(dāng)“炸裂”的GPTs:
比如AI產(chǎn)品經(jīng)理陳財貓制作的“提示精靈小富貴(Prompt Pet)”,可以讓用戶通過輸入需求獲得自己想要的提示詞;
比如,有國外大神制作了一個名為“Grimoire (魔法書)”的GPTs,它可以被看做一個“無代碼編程系統(tǒng)”,用戶通過輸入一句話、或者不斷和Grimoire進(jìn)行對話,就可以創(chuàng)建網(wǎng)站和應(yīng)用程序。
再比如,品牌設(shè)計師兼作家Jackson Greathouse Fall在今年3月15日給了GPT-4 100美金,然后讓它命令自己做各種各樣的事情。ChatGPT先是讓他做了一個環(huán)保主題的網(wǎng)站,去賣各種各樣的周邊產(chǎn)品;然后 ChatGPT 教他怎么樣用 DALL·E 2 設(shè)計這個網(wǎng)站的 logo,甚至給了 DALL·E 2 的 prompt 讓他直接放入這個模型里面;接著,教他怎么樣去寫一個網(wǎng)站,給了他一部分的源代碼,他很快就把這個網(wǎng)站搭好了。到后來,GPT甚至還告訴了他應(yīng)該怎么樣去融資,幫他做了一個融資商業(yè)計劃書的 PPT 。
一周后,HustleGPT幫他賺了130美元,在Discord上獲得了2095個粉絲;Jacson也真的獲得了一個天使投資人的投資,他現(xiàn)在公司的估值是 25000 美金。
這三波AI浪潮在讓人們驚嘆技術(shù)發(fā)展速度的同時,也助推了“提示詞”這一概念的熱度。越來越多人關(guān)注到了這一領(lǐng)域,開始尋找“提示詞”更多的可能性,「INFOARK方舟」社區(qū)主理人劉芮麟就是其中一位。
劉芮麟此前是一家互聯(lián)網(wǎng)醫(yī)療公司的內(nèi)容負(fù)責(zé)人,也是最早一波接觸ChatGPT的用戶之一。ChatGPT發(fā)布之后,他發(fā)現(xiàn)原本一天需要10個小時才能完成的工作只需要四個小時就能完成,這讓他十分激動,開始探索各種AI工具的同時,也成為了一名AIGC領(lǐng)域的忠實信徒。今年6月,他離職創(chuàng)業(yè),和幾個朋友一起推出了「INFOARK方舟」社區(qū)。
INFOARK方舟社區(qū)原名“Info.Ark明日方舟”,是一個AIGC領(lǐng)域的開源知識庫,主要提供AIGC領(lǐng)域的基礎(chǔ)知識、相關(guān)課程、信息源推薦、學(xué)術(shù)論文、工具介紹等內(nèi)容。目前INFOARK主要聚焦的賽道是提示詞領(lǐng)域,在INFOARK方舟社區(qū)主文檔中,提供了關(guān)于Prompt非常詳細(xì)的原理介紹、相關(guān)教程和指令庫, 即使是小白也能輕松閱讀。
目前,INFOARK社區(qū)已經(jīng)積累了不少付費(fèi)用戶,劉芮麟的創(chuàng)業(yè)團(tuán)隊也通過知識星球訂閱、高端付費(fèi)課程和企業(yè)合作商單獲得了穩(wěn)定的現(xiàn)金流。
然而,這并不是他們最終想要達(dá)到的目的,在他們看來,INFOARK方舟社區(qū)只是聚攏流量的第一步,他們真正想要做的,是一個類似最近大火的動畫片《萬神殿》里“上載智能(Uploaded Intelligence)”的東西——一個數(shù)字化的“第二大腦”。
“我們認(rèn)為人類的智能還有很大一部分沒有被開發(fā),比如很多人數(shù)學(xué)不好是因為沒有數(shù)形結(jié)合的思維,可能需要開發(fā)一款產(chǎn)品,通過可視化、數(shù)形結(jié)合的方式讓人理解數(shù)學(xué);再比如人腦的信息過濾能力是有限的,無法處理海量的信息。那么我們就要找到一套過濾信息的手段。這都意味著,你需一套基于“第二大腦”的軟件來幫助你,更好的構(gòu)建你的心智算法、心智模型。這套心智算法和心智模型是‘軟件’,是需要依附在硬件之上的,它存在于人的肉身之上可能會消亡,但是存在于計算機(jī)硬件之上不會,因為硬盤是可以拷貝和轉(zhuǎn)移的,但是這要消耗巨大的能量。和機(jī)器相比,人類最后的尊嚴(yán)可能是,利用極少的能量,調(diào)用我們體內(nèi)的‘認(rèn)知模型’去消化知識、獲得洞見,這是人類相比于機(jī)器的優(yōu)勢,有點(diǎn)類似于‘直覺’。
我們應(yīng)該強(qiáng)化這種優(yōu)勢,因此我們想做一個‘知識生命周期管理’的產(chǎn)品,它能夠模擬人的心智,實現(xiàn)知識的創(chuàng)造-繼承-利用-分發(fā)-銷毀這一整套的流程,把人類在認(rèn)知和心智上的優(yōu)勢流傳下去,構(gòu)建一個類似Avatar的‘?dāng)?shù)字分身’,它聽起來可能和筆記軟件比較像,但是它的輸入方式和思考方式與筆記軟件完全不同,是通過對話的方式進(jìn)行的。我們會設(shè)計一種新的Prompt——「一套問題體系」去和你聊天,通過這套問題體系,它就能獲知你的內(nèi)在價值觀、認(rèn)知模型、決策模型等底層的心智算法,從而構(gòu)建出你的模擬‘第二大腦’”,劉芮麟說。
在劉芮麟看來,Prompt是一種數(shù)據(jù)清洗、把信息處理得更加“工程化”的手段,由于在大模型的訓(xùn)練過程中,不斷追求用更低成本實現(xiàn)更好的訓(xùn)練效果,所以才出現(xiàn)了Prompt。他認(rèn)為,Prompt最大的價值就在于怎么把隱性知識通過流程化、標(biāo)準(zhǔn)化、自動化變成顯性知識;好的Prompt包含對業(yè)務(wù)的理解和思考,好用的Prompt流程應(yīng)該是一個系統(tǒng)化的流程,而好用的Prompt,則應(yīng)該封裝成為解決實際問題的工作流,這也是他們在未來的“第二大腦”產(chǎn)品中所要做的嘗試。
除了劉芮麟,同樣在Prompt領(lǐng)域做知識付費(fèi)的還有袁六偉。
袁六偉是知識星球“AI指令俱樂部”的主理人,也是ChatGPT發(fā)布后民間最早一波自學(xué)成才的指令工程師。他為海爾、科大訊飛等三十多家公司定制過Prompt,一條Prompt的報價在5000-2萬元不等,通過指令定制實現(xiàn)了月入10萬,也通過對Prompt的深度鉆研創(chuàng)辦起了沒有技術(shù)背景的“2人公司”,依靠指令定制、訓(xùn)練營、付費(fèi)咨詢、付費(fèi)社群等方式,獲得了一年近百萬的營收。
袁六偉認(rèn)為,Prompt未來會有兩種發(fā)展路徑:在普通用戶側(cè),隨著AI對語義的理解越來越深,Prompt會變得越來越簡單易上手,越來越接近自然語言;在專業(yè)用戶側(cè),Prompt會發(fā)展成一門“語言”,類似編程語言一樣,會有專門的Prompt Engineer職位來使用AI,比如科研、數(shù)據(jù)分析、技術(shù)開發(fā)、內(nèi)容創(chuàng)作等垂直領(lǐng)域,需要專門的指令工程師來設(shè)計和優(yōu)化Prompt,以引導(dǎo)AI進(jìn)行復(fù)雜的任務(wù)。
“未來AI肯定會像電力一樣,成為人們生活中的基礎(chǔ)設(shè)施,但是AI真正的價值在于‘服務(wù)’。OpenAI官方肯定會打磨一些指令嵌入到大模型當(dāng)中去,讓用戶更好地使用,但是人的需求是多種多樣的,官方?jīng)]有這個精力也沒有這個能力去覆蓋各個領(lǐng)域的指令,所以在垂直領(lǐng)域,就需要我們這樣各行各業(yè)的專家們?nèi)ゴ蛟熘噶?。我認(rèn)為Prompt會像現(xiàn)在的編程語言一樣會成為一門語言、一門學(xué)科,它的市場會比編程語言大百倍、千倍,因為它是基于自然語言的,它的受眾范圍和使用場景比編程語言大得多”,袁六偉說。
技術(shù)派眼里的提示詞
如果說劉芮麟和袁六偉代表了非技術(shù)派的觀點(diǎn),那么在技術(shù)派眼里,提示詞還有非常多可改進(jìn)的地方和想象空間。
云中江樹是最近火熱的“結(jié)構(gòu)化提示詞”寫作范式的發(fā)起人,也是GitHub上有著8k+ star的「ChatGPT中文指南」項目和有著2k+star的「LangGPT」項目的作者、EmbraceAGI開源社區(qū)的聯(lián)合創(chuàng)始人。LangGPT項目給提示詞設(shè)定了一套“模板”和“框架”,通過設(shè)置層級結(jié)構(gòu)、標(biāo)識符、屬性詞等形式,讓很多小白用戶通過完形填空的方式就能輕松寫出效果還不錯的提示詞。
以調(diào)教GPT生產(chǎn)“詩人Prompt”為例,LangGPT寫出來的提示詞是這樣的:
而當(dāng)我們把這套提示詞輸入ChatGPT,它給出的結(jié)果是這樣的:
云中江樹向我們分享了一個他心目中用LangGPT結(jié)構(gòu)化提示詞方法撰寫的最酷的提示詞案例:一個超級酷的老師,擅長使用最簡單的詞匯和通俗的語言來教會0基礎(chǔ)的學(xué)生。
上述提示詞的作者李繼剛是一位互聯(lián)網(wǎng)產(chǎn)品經(jīng)理,他同樣也是有著技術(shù)背景的提示詞愛好者。他認(rèn)為,圖片生成領(lǐng)域,現(xiàn)在基本做到了去Prompt化,以前的很多咒語性的寫法,現(xiàn)在都不太需要了;但是在文字生成領(lǐng)域,提示詞還是需要的。
李繼剛提出了提示詞的“織夢理論”——寫提示詞的過程是在為大模型營造一個“夢境”,寫Prompt就是在織夢,Prompt Engineer就是織夢師?!癙rompt”就像一根根線索,引導(dǎo)ChatGPT走進(jìn)你所編織的夢境深處。織夢師的技巧越高超,通過Prompt織出的夢境就越真實,越能讓ChatGPT成為“夢中人”。
云中江樹和李繼剛都把Prompt看做AI時代的編程語言,而且都旗幟鮮明地反對“提示詞消亡論”。
“提示詞有一個非常明顯的特點(diǎn),它用的是自然語言,各個國家都能用自己的語言去使用它和機(jī)器進(jìn)行對話。如果你把它看做一門編程語言,那么會得出兩個結(jié)論——第一,編程人員會變多,只要有賬號、能訪問大模型的人都可以編程,那么各種千奇百怪的創(chuàng)意也會多一些;第二,編程人員會分化,一定是有一波人鉆研的比較深(提示詞工程師)、另一部分比較淺(普通用戶),提示詞工程師會嘗試著把織夢這個事情做得更重、更結(jié)構(gòu)化、邏輯更復(fù)雜,而普通用戶端則是更加輕量化、更容易的撰寫提示詞。一個往前端的方向走,一個往后端的方向走,一切都是為了夢中人對話的那個環(huán)節(jié)更加輕量化?!崩罾^剛說。
而基于上述結(jié)論,李繼剛認(rèn)為,微調(diào)模型的時代會到來,各家公司一定會把自己的數(shù)據(jù)結(jié)合大模型的能力去微調(diào),形成自己公司獨(dú)有的“小模型”,這種“小模型”更貼近應(yīng)用場景、理解能力更強(qiáng),也是GPT-4到GPT5所必然要經(jīng)歷的一種演化路徑。
云中江樹則認(rèn)為,未來的提示詞可能是多模態(tài)的?!疤崾驹~本身不但不是過渡產(chǎn)品,反而是產(chǎn)品演進(jìn)的長期趨勢。隨著多模態(tài)大模型技術(shù)發(fā)展,未來我們可以將表情包、動態(tài)視頻等都作為提示詞的一部分,我們得到的輸出,也可以是圖文音并茂的結(jié)果。Prompt的上限并沒有被拉低,反而因為這種東西的出現(xiàn),Prompt的上限還被提高了。”
《ChatGPT進(jìn)階 提示工程入門》的作者陳財貓同樣提到了未來提示詞會變得“多模態(tài)”的觀點(diǎn)。他認(rèn)為,隨著AI技術(shù)的進(jìn)步,Prompt(提示詞)可能會消失,但是“Prompt Engineering(提示詞工程)”會持續(xù)存在。
陳財貓將Prompt分為了兩類:
第一類是彌補(bǔ)AI缺點(diǎn)的Pompt。此類 Prompt 的作用主要是“彌補(bǔ)”模型能力的不足;
第二類是“幫助AI理解人類需求”的Prompt。我們實際上是通過 Prompt 來給AI定義一個目標(biāo),交代清楚業(yè)務(wù),幫助它理解清楚人類的需求。
針對第一類Prompt,一個很經(jīng)典的例子是“掃地機(jī)器人遇到狗屎沒有避開”。一個掃地機(jī)器人在遇到狗屎的時候沒有避開,反而繼續(xù)“清潔”。結(jié)果就是臟東西拖滿了整個屋子。這種情況下,提示詞工程師就不得不下類似于“掃地的時候要避開臟東西,不要把它拖得全屋都是”,“遇到臟的地方需要多掃幾遍”這種看似廢話的Prompt。
這其實是AI智能程度低,或理解人類需求(對齊)不足的表現(xiàn)。然而,隨著技術(shù)發(fā)展的日新月異,我們甚至都不用等模型本身改進(jìn),一些產(chǎn)品上的設(shè)計就可以解決掉一些這種case。因此,此類 Prompt 可能會很快退出歷史舞臺。
針對第二類Prompt,同樣以機(jī)器人掃地為例,假設(shè)現(xiàn)在 AI 很聰明了,不僅知道見到狗屎要避開,還知道拿一個小鏟子把它鏟起來丟掉。但是在你家掃地就要有你家的規(guī)矩,比如必須先掃客廳再掃廚房,打掃的時候不準(zhǔn)發(fā)出一點(diǎn)聲音;如果遇到你的女朋友,還必須“向尊敬的少奶奶請安”;為了增強(qiáng)娛樂效果,這個機(jī)器人還要一邊打掃一邊做后空翻。
在這種情況下,就算AI再聰明,它也很有可能搞不清情況和我們想要的效果,這就是“不懂業(yè)務(wù)”。這時候,我們需要用很清晰的語言把業(yè)務(wù)規(guī)則列出來,比如用特定的順序打掃”的“順序”是什么樣的。因此,第二類Prompt還可以存活很長一段時間。
此外,陳財貓還提到了提示詞發(fā)展的一個很重要的趨勢——去設(shè)施化,現(xiàn)在以軟件與功能為中心的人機(jī)交互會演變成以AI為中心的人機(jī)交互,用戶只要說一句自己的需求,不需要任何介質(zhì),AI就能立即實現(xiàn)用戶的需求。
“這段時間最讓我印象深刻的是一個叫「Open Interpreter」的開源項目,這個項目的官方宣傳標(biāo)語叫’A new way to use computer‘——’使用電腦的新方式’,也就是說,你可以隨時向它下命令,AI 就會去分析、計劃,然后寫代碼實現(xiàn)你的需求。舉個例子,在以前我們要做一個功能或者軟件,這背后需要寫需求文檔-過評審會-開發(fā)-測試等一整套復(fù)雜流程。但是現(xiàn)在, AI 越來越強(qiáng),就算這個需求在世界上只有你一個人有,它也有可能寫代碼當(dāng)場滿足你”,陳財貓說,“在這種情況下,想法就會變得比實現(xiàn)有價值的多。”
提示詞的下一個趨勢:GUI+CUI
如果上述設(shè)想太過遙遠(yuǎn),那么未來一到兩年,生成式AI和提示詞的下一個趨勢是什么?
知名提示詞工程文檔LearningPrompt.wiki的創(chuàng)作者、開源應(yīng)用PoleStar Chat創(chuàng)始人Jimmy Wong堅信,是GUI(Graphical User Interface,圖形化交互界面)+CUI(Conversational User Interface,對話式交互界面)結(jié)合的產(chǎn)品。
他認(rèn)為,一個通過 GUI 彌補(bǔ) CUI Prompt 不足的很好的例子是,以ComfyUI為代表的文生圖、文生視頻工作流。
ComfyUI 是一個基于節(jié)點(diǎn)流程式的Stable Diffusion AI 繪圖工具,它可以將 Stable Diffusion 的流程拆分成節(jié)點(diǎn),以實現(xiàn)更加精準(zhǔn)的工作流定制和完善的可復(fù)現(xiàn)性。
ComfyUI的界面直觀易用,AI繪畫的每個步驟都被拆成了一個節(jié)點(diǎn),比如加載模型(Load Checkpoint)、采樣器(KSampler)、提示詞(Prompt)等都是以節(jié)點(diǎn)的形式存在,用戶可以快速上手并輕松繪圖。
通過ComfyUI,用戶可以用微調(diào)節(jié)點(diǎn)、修改筆觸或者提示詞的方式,就可以實現(xiàn)實時的AI繪畫效果。它比傳統(tǒng)的文生圖大模型最大的優(yōu)勢就在于“指哪打哪”——之前我們總是吐槽AI繪圖全靠抽卡,但是ComfyUI的出現(xiàn)讓文生圖變得可控了。同時,ComfyUI還可以制作AI動圖、生成AI動畫,效果不輸Runway和最近大火的PIKA。
“現(xiàn)在是Stable Diffusion模型的戰(zhàn)國時代,而且相對LLM來說沒有像 OpenAI 那樣的巨頭存在。我認(rèn)為 AI-Native 產(chǎn)品可能會出現(xiàn)在這個領(lǐng)域,甚至明年都有可能出現(xiàn)AI生成的電影。對于小創(chuàng)業(yè)者來說,這可能是更有機(jī)會的方向”,Jimmy Wong說。