國內(nèi)首款A(yù)I搜索，為何出自昆侖萬維？

創(chuàng)業(yè)邦·2023-09-06

關(guān)注

ee

北京移動互聯(lián)網(wǎng)

面向女生的新一代場景社交

最近融資：|2016-01-06

我要聯(lián)系

AI重塑全新商業(yè)模式。

作者丨巴里

編輯丨信陵

題圖丨昆侖萬維CEO 方漢

8月30日，由創(chuàng)業(yè)邦主辦的2023AIGC技術(shù)應(yīng)用大會在深圳舉行。本屆大會以“元載萬物·智啟新界”為主題，旨在聚焦AIGC技術(shù)的創(chuàng)新應(yīng)用，打造深入探索AIGC產(chǎn)業(yè)落地的交流平臺。

在不久前的8月23日，昆侖萬維發(fā)布了國內(nèi)第一款融入大語言模型的搜索引擎——天工AI搜索。這也是繼今年4月17日發(fā)布“天工”大模型以來，昆侖萬維在該領(lǐng)域的又一重要探索。

大會期間，昆侖萬維CEO方漢圍繞公司在AI大模型商業(yè)化的探索以及AI搜索的更多細節(jié)進行了深入分享，精彩觀點如下：

1.如果要把AI搜索作為一個可信的生產(chǎn)力工具，我們只要切中用戶需求、給用戶提供價值，用戶就一定會使用；

2.未來各家大模型在B端的競爭在于，哪家能夠率先在付費能力強的行業(yè)中搶到更多的落地合同；

3.最終AI一定會重塑全新的商業(yè)模式，一定會出現(xiàn)巨大的紅利，并且憑借這個商業(yè)模式獲得極大成功的企業(yè)會長期存在。

作為一家出海互聯(lián)網(wǎng)企業(yè)，昆侖萬維不斷地在尋找第二曲線。

“從Grindr到StarMaker，從Opera到GX Browser，盡管昆侖萬維已經(jīng)在海外孵化了大量的千萬DAU級別的產(chǎn)品，但仍然希望借助AIGC這一波浪潮，能夠做出一款以億為單位的DAU產(chǎn)品?！狈綕h說道。

因此，昆侖萬維從2022年就提出了“All in AIGC”的戰(zhàn)略規(guī)劃。相比此前的VR和元宇宙，公司當時判斷AIGC作為第二曲線是一個更加靠譜的方向。

融合8年技術(shù)積累定位于生產(chǎn)力工具

方漢表示，對于拿搜索引擎當生產(chǎn)工具的人，就是我們的目標用戶。

首先，天工AI搜索能夠幫助用戶降低搜索成本，無需用戶再記住搜索引擎大量的規(guī)則就能更好地獲取到最真實的數(shù)據(jù)。

其次，在交互上，用戶能夠直接使用自然語言交互，天工AI搜索就能給出用戶正確的答案，而且所有的答案是有信源的。

那么，為什么昆侖萬維敢做AI搜索？

實際上，昆侖萬維旗下?lián)碛幸豢钋f級DAU、面向全球十余種語言市場的新聞推薦產(chǎn)品——Opera News，已經(jīng)成為了非洲用戶規(guī)模最大的新聞客戶端。

而要做新聞推薦，第一步就是要做搜索引擎，昆侖萬維已經(jīng)通過Opera News產(chǎn)品，在數(shù)據(jù)抓取、數(shù)據(jù)清理等搜索引擎技術(shù)上擁有了5年的技術(shù)積累。

在2020年，昆侖萬維開始建立團隊投身于GPT3大模型研發(fā)。

“前段時間有人懷疑我們大模型是套殼，我們覺得冤枉透了。3年前，市面上并沒有任何開源模型，即便是想抄都沒得抄。”方漢說道。

去年12月，昆侖萬維在國內(nèi)第一家開源了140億參數(shù)的中文大模型，據(jù)介紹其大量數(shù)據(jù)都是通過自建引擎進行抓取和清理的。

因此實際上，這5年的搜索引擎與3年的大模型技術(shù)相結(jié)合，也就是通過這8年的技術(shù)積累，才讓昆侖萬維有了敢于做AI搜索的底氣。

方漢也深刻地感覺到，如果要把搜索引擎作為一個可信的生產(chǎn)力工具，我們只要切中用戶需求、給用戶提供價值，用戶就一定會使用。

例如，網(wǎng)易的一款給英文論文潤色的工具就做到了800萬用戶，其原因就是因為定位極其精準，瞄準了寫論文的用戶，而又沒有其他競品。

因此，他希望，天工AI搜索能夠成為一條鯰魚，刺激整個市場格局已經(jīng)很久不變的搜索引擎市場。也只有當該領(lǐng)域所有的公司都跟進AI搜索時，用戶才能夠享受到更好的搜索服務(wù)。

在盈利模式上，信息流廣告是任何一家搜索引擎公司都無法回避的。由于AI搜索給用戶返回出來的是精準的知識，對用戶喜好的了解程度會達到前所未有的深刻。

方漢進一步說到，特別是我們打造AI搜索的目標是成為一款生產(chǎn)力工具，對于行業(yè)廣告來說可能會更有價值。因此，除了傳統(tǒng)的信息流廣告，AI搜索也可能會誕生出一些比信息流更高效的廣告形式，但具體形式在現(xiàn)階段還很難預(yù)測，只能不斷摸索。

加入產(chǎn)品經(jīng)理個人習慣卻意外爆火

實際上，AI搜索從產(chǎn)品立項到完成僅花費了半年時間。

方漢指出，之所以能夠在半年時間研發(fā)出一款A(yù)I搜索產(chǎn)品，一方面得益于研發(fā)團隊的高效執(zhí)行力，另一方面得益于創(chuàng)始人周亞輝對于行業(yè)趨勢的超前預(yù)見性。同時，從立項到現(xiàn)在的半年時間里，我們對于產(chǎn)品的思考邏輯一以貫之，堅持做C端，并且要做端到端的內(nèi)容生成工具。

在這個過程中，最重要的在于昆侖萬維在搜索引擎和大模型的技術(shù)積累。

據(jù)介紹，爬蟲集群、Rank模型等搜索引擎技術(shù)都是現(xiàn)成的，在大模型底座上，訓練語料也是公司自己所積累的，因此在調(diào)教大模型往AI搜索上轉(zhuǎn)就會相對容易。

而產(chǎn)品化的難點就在于如何將其與大模型集成起來，讓大模型能夠賦能這些搜索結(jié)果，并將搜索結(jié)果再整理成用戶愿意閱讀的知識。

例如，信源功能就是天工AI搜索最為獨特的功能之一，而這個功能則來自于一位產(chǎn)品經(jīng)理的個人習慣。

研發(fā)團隊中有一位產(chǎn)品經(jīng)理經(jīng)常會在網(wǎng)上與別人辯論，但卻很難有人能辯得過他。其原因就在于，這位博士學位的產(chǎn)品經(jīng)理，將他寫論文的習慣也用到了辯論過程當中，會把所有引用的數(shù)據(jù)一一列出，并且都是引自官方權(quán)威的信源，這就讓別人無法跟他爭論。

因此，他就建議產(chǎn)品要加上信源功能。誰知在測試過程中，用戶非常喜歡這個功能。無一字無出處，這對于很多把搜索引擎當生產(chǎn)力工具的重度用戶（例如科研、投資、媒體行業(yè)等）來說是尤其重要的。

截圖來自天工AI搜索官網(wǎng)

那么，對于AI搜索來說，加入信源功能的好處是什么？

系統(tǒng)可以將這些信源做排序，將一些優(yōu)先級高的信源放在前面，保證了結(jié)果的權(quán)威性和準確性。因為光靠大模型并無法代表權(quán)威性，但如果內(nèi)容引自新華社、人民日報等官媒就完全不同了。

可以說，這是一個將科學家的使用習慣放到大眾產(chǎn)品里的典型例子。

此外，我們知道，大模型會編造不正確的答案，產(chǎn)生“幻覺”。

對于大模型最常見的幻覺問題，天工AI搜索在輸出的過程中，會針對一個問題進行大量的網(wǎng)頁搜索。通常，排在前5頁的搜索內(nèi)容肯定是相對權(quán)重較高，也相對可信，因此系統(tǒng)會將這些網(wǎng)頁根據(jù)一定的規(guī)則，用多種方法反復問大模型2-3次，再輸出最終結(jié)果。

并且，系統(tǒng)會將搜到的網(wǎng)頁作為提示詞還給大模型，讓它根據(jù)這個來推斷，這樣就可以徹底杜絕幻覺的可能性。

方漢談到，搜索引擎和大模型結(jié)合是非常重要的，否則誰都無法徹底解決大模型的幻覺問題。

AI未來將會重塑商業(yè)模式“落地為王”最為關(guān)鍵

據(jù)悉，昆侖萬維的天工大模型在國內(nèi)會同時推動在B端、C端的落地。

方漢表示，作為一家互聯(lián)網(wǎng)公司，昆侖萬維將大模型落地C端是最容易的。在B端，昆侖萬維會優(yōu)先布局金融、能源、新材料、醫(yī)療等付費意愿更強的行業(yè)。未來各家大模型在B端的競爭在于，哪家能夠率先在付費能力強的行業(yè)中搶到更多的落地合同。

而昆侖萬維的優(yōu)勢就在于，旗下?lián)碛幸患耶a(chǎn)業(yè)資本（CVC）公司——昆侖資本。據(jù)悉，昆侖資本其投資組合涵蓋了創(chuàng)新藥、新材料、新能源、企業(yè)服務(wù)等賽道，投出了映宇宙、達達、追覓、竹云、小馬智行、科亞醫(yī)療等明星企業(yè)。

可以說，昆侖萬維既對這些垂直行業(yè)有著深度理解，也可以將其大模型優(yōu)先從被投企業(yè)中開始落地。

今年8月，昆侖萬維就官宣與映宇宙（前身為映客）集團母公司北京蜜萊塢網(wǎng)絡(luò)科技有限公司在AI大模型業(yè)務(wù)方面達成合作，向其輸出AI文本生成能力、AI圖像生成能力。

方漢介紹說，作為一家視頻平臺，映宇宙非常關(guān)注內(nèi)容生成工具，它也非常擔憂AIGC會將自己的商業(yè)模式顛覆掉，但是從時間成本和資金成本上來說，自己做大模型又不現(xiàn)實。因此，映宇宙和昆侖萬維這樣有大模型能力的公司合作，共同探索基于AIGC全新商業(yè)模式的落地就顯得非常重要。

在B端，大模型還有著更加豐富的商業(yè)想象空間。

在方漢看來，所有強序列化文本數(shù)據(jù)需求的一定是會最快應(yīng)用的行業(yè)。例如，在投資機構(gòu)中日常看財報、寫報告的工作完全可以由大模型來替代。

又如，需要大量人工篩選的行業(yè)。以昆侖資本投資的一家鈣鈦礦太陽能電池公司為例，其核心就是要使用新材料替代現(xiàn)有的硅基太陽能，因此就需要在幾百萬種化合物中挑選出有效的化合物。

盡管他們有一套理論可以將幾百萬種的范圍縮小到幾十萬種，但仍然屬于“撞大運”，這無疑會拉長整個研發(fā)周期，但如果能夠讓大模型把這個數(shù)據(jù)學懂，就能夠?qū)⑦@幾十萬種再縮小至幾千甚至幾百種的范圍，對于這家公司來說就是一種效率上的極大提升。

所以，只要這個行業(yè)有相應(yīng)的規(guī)?；⑿蛄谢暮脭?shù)據(jù)，那么其落地會非?？?，特別是對于需要消耗大量生產(chǎn)時間和人力成本的行業(yè)，引入大模型之后會迅速改變。并且，一旦行業(yè)中引入AI，就會造成降維打擊。方漢指出。

例如，在電商行業(yè)，原來制作一張商品圖片成本大概為500元/張，而現(xiàn)在全部由AIGC生成也許連5分/張的成本都不到，未來所有的電商模特、攝影師幾乎都會面臨失業(yè)。未來可能只有奢侈品品牌才會請攝影師實拍，而普通商品無一例外會全部淪陷。在法律服務(wù)行業(yè)，借助AI可以快速生成法律文書，而律所里的實習生可能還沒有AI寫得好。

方漢認為，從互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的邏輯來看，最終AI一定會重塑全新的商業(yè)模式，一定會出現(xiàn)巨大的紅利，并且憑借這個商業(yè)模式獲得極大成功的企業(yè)會長期存在。

他相信，這兩年會成立最偉大的公司，對于所有公司來說機會是均等的，同時希望我們也能夠成為這樣的大公司，成為偉大公司的一員。

最后，對于所有創(chuàng)業(yè)者，方漢給出了4個字的建議：落地為王?！霸诋斍暗慕?jīng)濟環(huán)境下，想拿到投資并不容易，因此創(chuàng)業(yè)者就需要認真思考自己的產(chǎn)品到底能不能幫助用戶賺錢或者省錢。”

方漢在大會上作了題為《昆侖萬維大模型商業(yè)化之AI搜索》的演講，以下為演講內(nèi)容整理：

前瞻布局天工智能六大AI業(yè)務(wù)矩陣

我自1994年開始從事互聯(lián)網(wǎng)工作，是上一波互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)大潮興起的見證者，目測也將是未來這一波AI大潮興起的見證者。

眾所周知，第一波最偉大的互聯(lián)網(wǎng)公司誕生于1997-2000年，第一波最偉大的移動互聯(lián)網(wǎng)公司成立于十年前，我堅信這一波AI大模型浪潮中的偉大公司肯定是在這兩年誕生。在座的創(chuàng)業(yè)者都有機會成就下一個十年最偉大的公司。

昆侖萬維作為一家A股上市公司，目前旗下包括AGI與AIGC、海外信息分發(fā)與元宇宙、投資等三大業(yè)務(wù)板塊。目前海外收入占比達83%，全球平均的月活用戶近4億，我們是一家典型的以C端為主的出海企業(yè)。

作為一家出海企業(yè)，昆侖萬維為何會投身到大模型的賽道？

首先，我們一直在努力地尋找第二曲線，我們在海外孵化了大量的千萬DAU級別的產(chǎn)品，從Grindr到StarMaker，從Opera到GX Browser，我們在海外擁有極其豐富的孵化UGC平臺的經(jīng)驗。

其次，2020年GPT3發(fā)布時我們深刻地認識到GPT3在文本生成領(lǐng)域絕對是當時最突出的產(chǎn)品，所以就立刻組織團隊投身于GPT3大模型研發(fā)。2021年我們已經(jīng)訓出了140億參數(shù)的中文大模型。去年12月15日，我們正式發(fā)布“昆侖天工”AIGC全系列算法與模型；今年4月17號，我們就正式發(fā)布了國產(chǎn)大模型“天工”。8月23日，我們也正式發(fā)布了我們的第一個C端產(chǎn)品——天工AI搜索。目前我們天工智能有六大AI業(yè)務(wù)矩陣。

AI大模型是我們整個AI業(yè)務(wù)矩陣的基石，在 AI大模型基礎(chǔ)上我們面向B端和C端，布局了五大業(yè)務(wù)板塊。AI搜索，它將AI底座大模型與搜索引擎相結(jié)合，通過高頻應(yīng)用切入；AI音樂、AI動漫以及AI游戲，是我們給創(chuàng)作者提供端到端的內(nèi)容生成工具，讓用戶在沒有任何技術(shù)背景跟前序?qū)I(yè)知識的情況下，都可以使用端到端的生成工具來生成普通用戶最終可消費的內(nèi)容。

AI游戲與AI社交，我們認為它們本質(zhì)上需要一個智能的NPC作為技術(shù)底座。我們都知道游戲無外乎世界觀、人物、劇情，人物這一塊是重中之重，AI介入之后，我們可以創(chuàng)造出比以前所有策劃的NPC更加智能的NPC。這一點我認為與3D引擎一樣，必然重塑整個AI游戲領(lǐng)域。

AI社交則是另外一個邏輯。當前絕大多數(shù)免費用戶是無法在社交產(chǎn)品里享受到應(yīng)有的服務(wù)，因為1V1社交服務(wù)的成本相當高。一旦AI介入，我們可以極大地降低社交上的情緒供給成本。我們認為這也是一個極佳的發(fā)展方向。

我們“天工”大模型的技術(shù)底座非常堅實，目前支持萬字以上的文本對話，也能實現(xiàn)20輪以上的問答交互。我們采用雙千億參數(shù)的大規(guī)模結(jié)構(gòu)，具有智能涌現(xiàn)能力。

我們在大模型的三要素（算力、算法、數(shù)據(jù)）上有長期并且深厚的積累，以我們開展大模型的經(jīng)驗看，大模型落地最難的是什么？其實是數(shù)據(jù)。

我們需要把萬物以及所有問題轉(zhuǎn)化成大模型可以理解的數(shù)據(jù)，才能讓其具備智能涌現(xiàn)能力。各行各業(yè)要落地大模型，本質(zhì)上是把各行各業(yè)的非標數(shù)據(jù)轉(zhuǎn)成大模型可理解的數(shù)據(jù)。如果某個行業(yè)已經(jīng)具備了這種數(shù)據(jù)的話，那么大模型在這個行業(yè)的落地就會非常快；如果沒有，我們必須花很大的精力去重新整理數(shù)據(jù)，所以數(shù)據(jù)的清洗能力以及轉(zhuǎn)換能力非常重要。

用AI重塑傳統(tǒng)搜索體驗

國內(nèi)搜索引擎市場份額可能已經(jīng)有十幾年沒有發(fā)生任何變化，我們?yōu)楹芜€要研發(fā)AI搜索產(chǎn)品？

就如同AI支持的新聞分發(fā)平臺今日頭條顛覆傳統(tǒng)的新聞門戶新浪新聞的邏輯一樣，AI搜索實際上對于現(xiàn)有的搜索是另外一個維度的產(chǎn)品，我們認為搜索的下半場一定是AI。

首先，傳統(tǒng)搜索提供的是海量信息，如果用戶沒有掌握大量的搜索技巧，比如使用搜索引擎的格式化語言，將無法使用搜索引擎達到個性化目的。

例如，我用傳統(tǒng)搜索時會使用到一些獨特的技巧，輸入的關(guān)鍵詞要比一般人多，會用file這個函數(shù)來指定文件類型，會用site這個關(guān)鍵詞去指定單獨的網(wǎng)站進行搜索；我會想方設(shè)法把一個關(guān)鍵詞用英文翻譯成七八個同義詞去搜索。

用戶如果不會使用這些特殊的搜索技巧，其結(jié)果如何？大多數(shù)用戶用傳統(tǒng)搜索得到的信息質(zhì)量很差，并且廣告多、信源復雜、真假難辨。但在ChatGPT出現(xiàn)之后，我們認為傳統(tǒng)搜索的技術(shù)奇點時刻已經(jīng)到來。程序員的最大的問答社區(qū)Stack Overflow，在ChatGPT出現(xiàn)之后整個流量急速下跌，背后的原因是用戶都改去使用ChatGPT了。目前美國90%以上的大中學生使用ChatGPT做作業(yè)，而不去谷歌搜索上去搜作業(yè)的答案。這就是我們認為傳統(tǒng)搜索在很大程度上一定會被 AI搜索所取代的原因。

微軟在接入ChatGPT的時候做了一件很重要的事情，就是把AI嵌入它的搜索引擎，給用戶提供服務(wù)。而我們天工AI搜索是國內(nèi)第一款融入大語言模型的搜索引擎。

我相信在座的諸位懂得用file、site這樣關(guān)鍵詞搜索的人非常少，但是當你在使用ChatGPT時，完全可以用任何自然語言甚至語音直接去交互，它一定能夠很輕松地告訴用戶答案，不需要用戶再想方設(shè)法的去搜關(guān)鍵詞，或者是想方設(shè)法把它轉(zhuǎn)換成英文的提問。

天工AI搜索實際上是一種深層次搜索，用戶可以獲得有效的組織和提煉后的答案，不再為冗余信息浪費個人時間，直接獲得有效信息。比如，“筆記本要不要一直插電用？”之類的問題，天工AI搜索會直接給用戶一個相對可靠和信服的答案；

針對“電車會比油車省錢嗎？”的問題，天工AI搜索也會把所有的答案都搜索出來，并且在總結(jié)我們認為靠譜的答案之后會生成一個最終答案。

傳統(tǒng)搜索提供的是海量的信息，AI搜索為用戶提供的是精準的知識，而且天工AI搜索具有“追問”的功能，讓用戶可以就一個問題不斷地追問20輪以上，例如，在提問“核污水會變核污雨嗎？”之后，天工AI搜索除了給出答案，還會提供3個追問，其中包括“核污水的處理跟處置方法有哪些？”，讓用戶繼續(xù)獲得答案。

如此用戶可能在一開始并不知道自己想要什么，但通過這種追問，能夠更輕松地獲得所需的知識。

此外，天工AI搜索能夠為用戶提供更個性化的答案。例如，用傳統(tǒng)搜索引擎搜“9月份去西雙版納玩4天，規(guī)劃路線”，一般如果是在網(wǎng)頁上去搜索，如果此前沒有相關(guān)信息沉淀的話，用戶無法獲得直接、有效的答案，但天工AI搜索可以總結(jié)出來個性化答案，假如把9月份換成8月份、7月份、6月份，AI搜索都能給出相應(yīng)的個性化答案。