作者丨巴里
編輯丨信陵
題圖丨昆侖萬維CEO 方漢
8月30日,由創(chuàng)業(yè)邦主辦的2023AIGC技術(shù)應(yīng)用大會在深圳舉行。本屆大會以“元載萬物·智啟新界”為主題,旨在聚焦AIGC技術(shù)的創(chuàng)新應(yīng)用,打造深入探索AIGC產(chǎn)業(yè)落地的交流平臺。
在不久前的8月23日,昆侖萬維發(fā)布了國內(nèi)第一款融入大語言模型的搜索引擎——天工AI搜索。這也是繼今年4月17日發(fā)布“天工”大模型以來,昆侖萬維在該領(lǐng)域的又一重要探索。
大會期間,昆侖萬維CEO方漢圍繞公司在AI大模型商業(yè)化的探索以及AI搜索的更多細(xì)節(jié)進(jìn)行了深入分享,精彩觀點(diǎn)如下:
1.如果要把AI搜索作為一個可信的生產(chǎn)力工具,我們只要切中用戶需求、給用戶提供價值,用戶就一定會使用;
2.未來各家大模型在B端的競爭在于,哪家能夠率先在付費(fèi)能力強(qiáng)的行業(yè)中搶到更多的落地合同;
3.最終AI一定會重塑全新的商業(yè)模式,一定會出現(xiàn)巨大的紅利,并且憑借這個商業(yè)模式獲得極大成功的企業(yè)會長期存在。
作為一家出海互聯(lián)網(wǎng)企業(yè),昆侖萬維不斷地在尋找第二曲線。
“從Grindr到StarMaker,從Opera到GX Browser,盡管昆侖萬維已經(jīng)在海外孵化了大量的千萬DAU級別的產(chǎn)品,但仍然希望借助AIGC這一波浪潮,能夠做出一款以億為單位的DAU產(chǎn)品?!狈綕h說道。
因此,昆侖萬維從2022年就提出了“All in AIGC”的戰(zhàn)略規(guī)劃。相比此前的VR和元宇宙,公司當(dāng)時判斷AIGC作為第二曲線是一個更加靠譜的方向。
融合8年技術(shù)積累定位于生產(chǎn)力工具
方漢表示,對于拿搜索引擎當(dāng)生產(chǎn)工具的人,就是我們的目標(biāo)用戶。
首先,天工AI搜索能夠幫助用戶降低搜索成本,無需用戶再記住搜索引擎大量的規(guī)則就能更好地獲取到最真實的數(shù)據(jù)。
其次,在交互上,用戶能夠直接使用自然語言交互,天工AI搜索就能給出用戶正確的答案,而且所有的答案是有信源的。
那么,為什么昆侖萬維敢做AI搜索?
實際上,昆侖萬維旗下?lián)碛幸豢钋f級DAU、面向全球十余種語言市場的新聞推薦產(chǎn)品——Opera News,已經(jīng)成為了非洲用戶規(guī)模最大的新聞客戶端。
而要做新聞推薦,第一步就是要做搜索引擎,昆侖萬維已經(jīng)通過Opera News產(chǎn)品,在數(shù)據(jù)抓取、數(shù)據(jù)清理等搜索引擎技術(shù)上擁有了5年的技術(shù)積累。
在2020年,昆侖萬維開始建立團(tuán)隊投身于GPT3大模型研發(fā)。
“前段時間有人懷疑我們大模型是套殼,我們覺得冤枉透了。3年前,市面上并沒有任何開源模型,即便是想抄都沒得抄。”方漢說道。
去年12月,昆侖萬維在國內(nèi)第一家開源了140億參數(shù)的中文大模型,據(jù)介紹其大量數(shù)據(jù)都是通過自建引擎進(jìn)行抓取和清理的。
因此實際上,這5年的搜索引擎與3年的大模型技術(shù)相結(jié)合,也就是通過這8年的技術(shù)積累,才讓昆侖萬維有了敢于做AI搜索的底氣。
方漢也深刻地感覺到,如果要把搜索引擎作為一個可信的生產(chǎn)力工具,我們只要切中用戶需求、給用戶提供價值,用戶就一定會使用。
例如,網(wǎng)易的一款給英文論文潤色的工具就做到了800萬用戶,其原因就是因為定位極其精準(zhǔn),瞄準(zhǔn)了寫論文的用戶,而又沒有其他競品。
因此,他希望,天工AI搜索能夠成為一條鯰魚,刺激整個市場格局已經(jīng)很久不變的搜索引擎市場。也只有當(dāng)該領(lǐng)域所有的公司都跟進(jìn)AI搜索時,用戶才能夠享受到更好的搜索服務(wù)。
在盈利模式上,信息流廣告是任何一家搜索引擎公司都無法回避的。由于AI搜索給用戶返回出來的是精準(zhǔn)的知識,對用戶喜好的了解程度會達(dá)到前所未有的深刻。
方漢進(jìn)一步說到,特別是我們打造AI搜索的目標(biāo)是成為一款生產(chǎn)力工具,對于行業(yè)廣告來說可能會更有價值。因此,除了傳統(tǒng)的信息流廣告,AI搜索也可能會誕生出一些比信息流更高效的廣告形式,但具體形式在現(xiàn)階段還很難預(yù)測,只能不斷摸索。
加入產(chǎn)品經(jīng)理個人習(xí)慣卻意外爆火
實際上,AI搜索從產(chǎn)品立項到完成僅花費(fèi)了半年時間。
方漢指出,之所以能夠在半年時間研發(fā)出一款A(yù)I搜索產(chǎn)品,一方面得益于研發(fā)團(tuán)隊的高效執(zhí)行力,另一方面得益于創(chuàng)始人周亞輝對于行業(yè)趨勢的超前預(yù)見性。同時,從立項到現(xiàn)在的半年時間里,我們對于產(chǎn)品的思考邏輯一以貫之,堅持做C端,并且要做端到端的內(nèi)容生成工具。
在這個過程中,最重要的在于昆侖萬維在搜索引擎和大模型的技術(shù)積累。
據(jù)介紹,爬蟲集群、Rank模型等搜索引擎技術(shù)都是現(xiàn)成的,在大模型底座上,訓(xùn)練語料也是公司自己所積累的,因此在調(diào)教大模型往AI搜索上轉(zhuǎn)就會相對容易。
而產(chǎn)品化的難點(diǎn)就在于如何將其與大模型集成起來,讓大模型能夠賦能這些搜索結(jié)果,并將搜索結(jié)果再整理成用戶愿意閱讀的知識。
例如,信源功能就是天工AI搜索最為獨(dú)特的功能之一,而這個功能則來自于一位產(chǎn)品經(jīng)理的個人習(xí)慣。
研發(fā)團(tuán)隊中有一位產(chǎn)品經(jīng)理經(jīng)常會在網(wǎng)上與別人辯論,但卻很難有人能辯得過他。其原因就在于,這位博士學(xué)位的產(chǎn)品經(jīng)理,將他寫論文的習(xí)慣也用到了辯論過程當(dāng)中,會把所有引用的數(shù)據(jù)一一列出,并且都是引自官方權(quán)威的信源,這就讓別人無法跟他爭論。
因此,他就建議產(chǎn)品要加上信源功能。誰知在測試過程中,用戶非常喜歡這個功能。無一字無出處,這對于很多把搜索引擎當(dāng)生產(chǎn)力工具的重度用戶(例如科研、投資、媒體行業(yè)等)來說是尤其重要的。
截圖來自天工AI搜索官網(wǎng)
那么,對于AI搜索來說,加入信源功能的好處是什么?
系統(tǒng)可以將這些信源做排序,將一些優(yōu)先級高的信源放在前面,保證了結(jié)果的權(quán)威性和準(zhǔn)確性。因為光靠大模型并無法代表權(quán)威性,但如果內(nèi)容引自新華社、人民日報等官媒就完全不同了。
可以說,這是一個將科學(xué)家的使用習(xí)慣放到大眾產(chǎn)品里的典型例子。
此外,我們知道,大模型會編造不正確的答案,產(chǎn)生“幻覺”。
對于大模型最常見的幻覺問題,天工AI搜索在輸出的過程中,會針對一個問題進(jìn)行大量的網(wǎng)頁搜索。通常,排在前5頁的搜索內(nèi)容肯定是相對權(quán)重較高,也相對可信,因此系統(tǒng)會將這些網(wǎng)頁根據(jù)一定的規(guī)則,用多種方法反復(fù)問大模型2-3次,再輸出最終結(jié)果。
并且,系統(tǒng)會將搜到的網(wǎng)頁作為提示詞還給大模型,讓它根據(jù)這個來推斷,這樣就可以徹底杜絕幻覺的可能性。
方漢談到,搜索引擎和大模型結(jié)合是非常重要的,否則誰都無法徹底解決大模型的幻覺問題。
AI未來將會重塑商業(yè)模式“落地為王”最為關(guān)鍵
據(jù)悉,昆侖萬維的天工大模型在國內(nèi)會同時推動在B端、C端的落地。
方漢表示,作為一家互聯(lián)網(wǎng)公司,昆侖萬維將大模型落地C端是最容易的。在B端,昆侖萬維會優(yōu)先布局金融、能源、新材料、醫(yī)療等付費(fèi)意愿更強(qiáng)的行業(yè)。未來各家大模型在B端的競爭在于,哪家能夠率先在付費(fèi)能力強(qiáng)的行業(yè)中搶到更多的落地合同。
而昆侖萬維的優(yōu)勢就在于,旗下?lián)碛幸患耶a(chǎn)業(yè)資本(CVC)公司——昆侖資本。據(jù)悉,昆侖資本其投資組合涵蓋了創(chuàng)新藥、新材料、新能源、企業(yè)服務(wù)等賽道,投出了映宇宙、達(dá)達(dá)、追覓、竹云、小馬智行、科亞醫(yī)療等明星企業(yè)。
可以說,昆侖萬維既對這些垂直行業(yè)有著深度理解,也可以將其大模型優(yōu)先從被投企業(yè)中開始落地。
今年8月,昆侖萬維就官宣與映宇宙(前身為映客)集團(tuán)母公司北京蜜萊塢網(wǎng)絡(luò)科技有限公司在AI大模型業(yè)務(wù)方面達(dá)成合作,向其輸出AI文本生成能力、AI圖像生成能力。
方漢介紹說,作為一家視頻平臺,映宇宙非常關(guān)注內(nèi)容生成工具,它也非常擔(dān)憂AIGC會將自己的商業(yè)模式顛覆掉,但是從時間成本和資金成本上來說,自己做大模型又不現(xiàn)實。因此,映宇宙和昆侖萬維這樣有大模型能力的公司合作,共同探索基于AIGC全新商業(yè)模式的落地就顯得非常重要。
在B端,大模型還有著更加豐富的商業(yè)想象空間。
在方漢看來,所有強(qiáng)序列化文本數(shù)據(jù)需求的一定是會最快應(yīng)用的行業(yè)。例如,在投資機(jī)構(gòu)中日??簇攬?、寫報告的工作完全可以由大模型來替代。
又如,需要大量人工篩選的行業(yè)。以昆侖資本投資的一家鈣鈦礦太陽能電池公司為例,其核心就是要使用新材料替代現(xiàn)有的硅基太陽能,因此就需要在幾百萬種化合物中挑選出有效的化合物。
盡管他們有一套理論可以將幾百萬種的范圍縮小到幾十萬種,但仍然屬于“撞大運(yùn)”,這無疑會拉長整個研發(fā)周期,但如果能夠讓大模型把這個數(shù)據(jù)學(xué)懂,就能夠?qū)⑦@幾十萬種再縮小至幾千甚至幾百種的范圍,對于這家公司來說就是一種效率上的極大提升。
所以,只要這個行業(yè)有相應(yīng)的規(guī)?;?、序列化的好數(shù)據(jù),那么其落地會非??欤貏e是對于需要消耗大量生產(chǎn)時間和人力成本的行業(yè),引入大模型之后會迅速改變。并且,一旦行業(yè)中引入AI,就會造成降維打擊。方漢指出。
例如,在電商行業(yè),原來制作一張商品圖片成本大概為500元/張,而現(xiàn)在全部由AIGC生成也許連5分/張的成本都不到,未來所有的電商模特、攝影師幾乎都會面臨失業(yè)。未來可能只有奢侈品品牌才會請攝影師實拍,而普通商品無一例外會全部淪陷。在法律服務(wù)行業(yè),借助AI可以快速生成法律文書,而律所里的實習(xí)生可能還沒有AI寫得好。
方漢認(rèn)為,從互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的邏輯來看,最終AI一定會重塑全新的商業(yè)模式,一定會出現(xiàn)巨大的紅利,并且憑借這個商業(yè)模式獲得極大成功的企業(yè)會長期存在。
他相信,這兩年會成立最偉大的公司,對于所有公司來說機(jī)會是均等的,同時希望我們也能夠成為這樣的大公司,成為偉大公司的一員。
最后,對于所有創(chuàng)業(yè)者,方漢給出了4個字的建議:落地為王?!霸诋?dāng)前的經(jīng)濟(jì)環(huán)境下,想拿到投資并不容易,因此創(chuàng)業(yè)者就需要認(rèn)真思考自己的產(chǎn)品到底能不能幫助用戶賺錢或者省錢?!?/p>
方漢在大會上作了題為《昆侖萬維大模型商業(yè)化之AI搜索》的演講,以下為演講內(nèi)容整理:
前瞻布局天工智能六大AI業(yè)務(wù)矩陣
我自1994年開始從事互聯(lián)網(wǎng)工作,是上一波互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)大潮興起的見證者,目測也將是未來這一波AI大潮興起的見證者。
眾所周知,第一波最偉大的互聯(lián)網(wǎng)公司誕生于1997-2000年,第一波最偉大的移動互聯(lián)網(wǎng)公司成立于十年前,我堅信這一波AI大模型浪潮中的偉大公司肯定是在這兩年誕生。在座的創(chuàng)業(yè)者都有機(jī)會成就下一個十年最偉大的公司。
昆侖萬維作為一家A股上市公司,目前旗下包括AGI與AIGC、海外信息分發(fā)與元宇宙、投資等三大業(yè)務(wù)板塊。目前海外收入占比達(dá)83%,全球平均的月活用戶近4億,我們是一家典型的以C端為主的出海企業(yè)。
作為一家出海企業(yè),昆侖萬維為何會投身到大模型的賽道?
首先,我們一直在努力地尋找第二曲線,我們在海外孵化了大量的千萬DAU級別的產(chǎn)品,從Grindr到StarMaker,從Opera到GX Browser,我們在海外擁有極其豐富的孵化UGC平臺的經(jīng)驗。
其次,2020年GPT3發(fā)布時我們深刻地認(rèn)識到GPT3在文本生成領(lǐng)域絕對是當(dāng)時最突出的產(chǎn)品,所以就立刻組織團(tuán)隊投身于GPT3大模型研發(fā)。2021年我們已經(jīng)訓(xùn)出了140億參數(shù)的中文大模型。去年12月15日,我們正式發(fā)布“昆侖天工”AIGC全系列算法與模型;今年4月17號,我們就正式發(fā)布了國產(chǎn)大模型“天工”。8月23日,我們也正式發(fā)布了我們的第一個C端產(chǎn)品——天工AI搜索。目前我們天工智能有六大AI業(yè)務(wù)矩陣。
AI大模型是我們整個AI業(yè)務(wù)矩陣的基石,在 AI大模型基礎(chǔ)上我們面向B端和C端,布局了五大業(yè)務(wù)板塊。AI搜索,它將AI底座大模型與搜索引擎相結(jié)合,通過高頻應(yīng)用切入;AI音樂、AI動漫以及AI游戲,是我們給創(chuàng)作者提供端到端的內(nèi)容生成工具,讓用戶在沒有任何技術(shù)背景跟前序?qū)I(yè)知識的情況下,都可以使用端到端的生成工具來生成普通用戶最終可消費(fèi)的內(nèi)容。
AI游戲與AI社交,我們認(rèn)為它們本質(zhì)上需要一個智能的NPC作為技術(shù)底座。我們都知道游戲無外乎世界觀、人物、劇情,人物這一塊是重中之重,AI介入之后,我們可以創(chuàng)造出比以前所有策劃的NPC更加智能的NPC。這一點(diǎn)我認(rèn)為與3D引擎一樣,必然重塑整個AI游戲領(lǐng)域。
AI社交則是另外一個邏輯。當(dāng)前絕大多數(shù)免費(fèi)用戶是無法在社交產(chǎn)品里享受到應(yīng)有的服務(wù),因為1V1社交服務(wù)的成本相當(dāng)高。一旦AI介入,我們可以極大地降低社交上的情緒供給成本。我們認(rèn)為這也是一個極佳的發(fā)展方向。
我們“天工”大模型的技術(shù)底座非常堅實,目前支持萬字以上的文本對話,也能實現(xiàn)20輪以上的問答交互。我們采用雙千億參數(shù)的大規(guī)模結(jié)構(gòu),具有智能涌現(xiàn)能力。
我們在大模型的三要素(算力、算法、數(shù)據(jù))上有長期并且深厚的積累,以我們開展大模型的經(jīng)驗看,大模型落地最難的是什么?其實是數(shù)據(jù)。
我們需要把萬物以及所有問題轉(zhuǎn)化成大模型可以理解的數(shù)據(jù),才能讓其具備智能涌現(xiàn)能力。各行各業(yè)要落地大模型,本質(zhì)上是把各行各業(yè)的非標(biāo)數(shù)據(jù)轉(zhuǎn)成大模型可理解的數(shù)據(jù)。如果某個行業(yè)已經(jīng)具備了這種數(shù)據(jù)的話,那么大模型在這個行業(yè)的落地就會非???;如果沒有,我們必須花很大的精力去重新整理數(shù)據(jù),所以數(shù)據(jù)的清洗能力以及轉(zhuǎn)換能力非常重要。
用AI重塑傳統(tǒng)搜索體驗
國內(nèi)搜索引擎市場份額可能已經(jīng)有十幾年沒有發(fā)生任何變化,我們?yōu)楹芜€要研發(fā)AI搜索產(chǎn)品?
就如同AI支持的新聞分發(fā)平臺今日頭條顛覆傳統(tǒng)的新聞門戶新浪新聞的邏輯一樣,AI搜索實際上對于現(xiàn)有的搜索是另外一個維度的產(chǎn)品,我們認(rèn)為搜索的下半場一定是AI。
首先,傳統(tǒng)搜索提供的是海量信息,如果用戶沒有掌握大量的搜索技巧,比如使用搜索引擎的格式化語言,將無法使用搜索引擎達(dá)到個性化目的。
例如,我用傳統(tǒng)搜索時會使用到一些獨(dú)特的技巧,輸入的關(guān)鍵詞要比一般人多,會用file這個函數(shù)來指定文件類型,會用site這個關(guān)鍵詞去指定單獨(dú)的網(wǎng)站進(jìn)行搜索;我會想方設(shè)法把一個關(guān)鍵詞用英文翻譯成七八個同義詞去搜索。
用戶如果不會使用這些特殊的搜索技巧,其結(jié)果如何?大多數(shù)用戶用傳統(tǒng)搜索得到的信息質(zhì)量很差,并且廣告多、信源復(fù)雜、真假難辨。但在ChatGPT出現(xiàn)之后,我們認(rèn)為傳統(tǒng)搜索的技術(shù)奇點(diǎn)時刻已經(jīng)到來。程序員的最大的問答社區(qū)Stack Overflow,在ChatGPT出現(xiàn)之后整個流量急速下跌,背后的原因是用戶都改去使用ChatGPT了。目前美國90%以上的大中學(xué)生使用ChatGPT做作業(yè),而不去谷歌搜索上去搜作業(yè)的答案。這就是我們認(rèn)為傳統(tǒng)搜索在很大程度上一定會被 AI搜索所取代的原因。
微軟在接入ChatGPT的時候做了一件很重要的事情,就是把AI嵌入它的搜索引擎,給用戶提供服務(wù)。而我們天工AI搜索是國內(nèi)第一款融入大語言模型的搜索引擎。
我相信在座的諸位懂得用file、site這樣關(guān)鍵詞搜索的人非常少,但是當(dāng)你在使用ChatGPT時,完全可以用任何自然語言甚至語音直接去交互,它一定能夠很輕松地告訴用戶答案,不需要用戶再想方設(shè)法的去搜關(guān)鍵詞,或者是想方設(shè)法把它轉(zhuǎn)換成英文的提問。
天工AI搜索實際上是一種深層次搜索,用戶可以獲得有效的組織和提煉后的答案,不再為冗余信息浪費(fèi)個人時間,直接獲得有效信息。比如,“筆記本要不要一直插電用?”之類的問題,天工AI搜索會直接給用戶一個相對可靠和信服的答案;
針對“電車會比油車省錢嗎?”的問題,天工AI搜索也會把所有的答案都搜索出來,并且在總結(jié)我們認(rèn)為靠譜的答案之后會生成一個最終答案。
傳統(tǒng)搜索提供的是海量的信息,AI搜索為用戶提供的是精準(zhǔn)的知識,而且天工AI搜索具有“追問”的功能,讓用戶可以就一個問題不斷地追問20輪以上,例如,在提問“核污水會變核污雨嗎?”之后,天工AI搜索除了給出答案,還會提供3個追問,其中包括“核污水的處理跟處置方法有哪些?”,讓用戶繼續(xù)獲得答案。
如此用戶可能在一開始并不知道自己想要什么,但通過這種追問,能夠更輕松地獲得所需的知識。
此外,天工AI搜索能夠為用戶提供更個性化的答案。例如,用傳統(tǒng)搜索引擎搜“9月份去西雙版納玩4天,規(guī)劃路線”,一般如果是在網(wǎng)頁上去搜索,如果此前沒有相關(guān)信息沉淀的話,用戶無法獲得直接、有效的答案,但天工AI搜索可以總結(jié)出來個性化答案,假如把9月份換成8月份、7月份、6月份,AI搜索都能給出相應(yīng)的個性化答案。
我們還實現(xiàn)了追溯、可考證、可信賴,所有答案的信源都有復(fù)雜的算法和相對可靠的驗證,所有答案每一個重要條目之后都有相應(yīng)的引用,信源的權(quán)重還不一樣,這一點(diǎn)有助于用戶去索引信源,保證答案可追溯、可考證、可信賴,對于用戶而言這一點(diǎn)非常有價值。
天工AI搜索還實現(xiàn)了可查閱回溯以及可分享的功能。我們把用戶的每輪次的搜索結(jié)果都保存在天工的應(yīng)用內(nèi),便于隨時查閱回溯,還可以一鍵分享給他人。
這是我們天工大模型在國內(nèi)第一個面向C端的商業(yè)化產(chǎn)品,而我們的AI音樂和AI游戲、AI動漫的產(chǎn)品也在海外市場測試中,應(yīng)該在今年和明年初都會逐步推出。
大潮將起,落地為王。對于所有創(chuàng)業(yè)者而言,我個人認(rèn)為最難的不是構(gòu)想出一個新的產(chǎn)品模式,或者研發(fā)出一個獨(dú)一無二的技術(shù),而是尋找到一個合適的市場切入點(diǎn)讓公司更加健康的活下去,也就是所謂的“落地為王”。
最后,祝愿所有的創(chuàng)業(yè)者十年后都能做出一家偉大的公司。
更多活動大會一手信息,歡迎加入創(chuàng)業(yè)邦會員,現(xiàn)場聆聽一線投資人、頭部企業(yè)家精彩分享,掌握最新創(chuàng)投趨勢!