五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

以圖搜圖、以視頻搜視頻,「神經(jīng)搜索」比關(guān)鍵詞搜索更高效?

極納科技
北京人工智能
開源神經(jīng)搜索初創(chuàng)公司
最近融資:A輪|3000萬美元|2020-02-17
我要聯(lián)系
一支“極客”范兒的團(tuán)隊(duì)。

一提到搜索引擎,相信絕大多數(shù)中國(guó)人腦內(nèi)的第一反應(yīng)便是百度,但實(shí)際上包括字節(jié)跳動(dòng)在內(nèi)的國(guó)內(nèi)很多一線互聯(lián)網(wǎng)企業(yè)都曾布局過搜索引擎業(yè)務(wù)。

2020年,字節(jié)跳動(dòng)推出了獨(dú)立搜索引擎“頭條搜索”發(fā)力搜索引擎市場(chǎng),且在2021年2月17日,抖音推出手指視頻搜索宣傳片,抖音的Boss直聘賬號(hào)也公開招聘抖音搜索產(chǎn)品經(jīng)理、搜索運(yùn)營(yíng)等職位。不過,由于市場(chǎng)中絕大多數(shù)人沒有聽說過頭條搜索,作為一款新鮮搜索引擎,頭條搜索仍有很長(zhǎng)的路要走。

財(cái)大氣粗的阿里巴巴在搜索引擎上走的則是一條更簡(jiǎn)單直白的路線,直接瞄準(zhǔn)了百度占有率仍偏低的移動(dòng)搜索引擎市場(chǎng),2014年,在阿里與UC聯(lián)手推出神馬搜索后,看中UC在移動(dòng)瀏覽器中的市場(chǎng)地位的阿里,便全資將UC收入囊中。2016年“夸克”作為UC與阿里的甜蜜結(jié)晶正式誕生,盡管以簡(jiǎn)潔的頁面在小范圍內(nèi)聚集了一批用戶,但夸克還是太小了,在搜索引擎市場(chǎng)中的影響如其名稱一般只有“夸克”大小。

騰訊也早在2006年就開始運(yùn)營(yíng)搜搜(SOSO),2017年推出基于微信生態(tài)的微信搜一搜,盡管基于微信生態(tài),搜一搜有著十分廣大的用戶生態(tài),但也因此,搜一搜并不能作為獨(dú)立的搜索引擎獨(dú)立出來。2020年,微信全資收購(gòu)搜狗在業(yè)內(nèi)引起一片嘩然,而市場(chǎng)占有率第二的搜狗業(yè)務(wù)量仍不足百度二分之一。

反觀以搜索引擎起家的百度,卻經(jīng)常因排名競(jìng)價(jià)與SEO等原因被大眾認(rèn)為“不好用”,很多時(shí)候某一關(guān)鍵詞下前四條后四條分別為競(jìng)價(jià)搜索,中間兩條再加上百度百科、百度圖片與百度知道,搜索首頁完全成了百度一家產(chǎn)品的大雜燴。而且在一些想要搜索音頻內(nèi)容、視頻內(nèi)容以及3D內(nèi)容時(shí),傳統(tǒng)搜索引擎都顯得十分力不從心。

做一款好用的搜索引擎究竟有多難?從各頭部互聯(lián)網(wǎng)品牌紛紛效仿百度布局搜索引擎市場(chǎng)可以簡(jiǎn)單看到兩點(diǎn):

1.搜索引擎市場(chǎng)龐大,字節(jié)、阿里、騰訊并未與初創(chuàng)公司拉開較大差距;

2.用戶習(xí)慣已經(jīng)形成,即便字節(jié)、阿里、騰訊級(jí)別企業(yè)投入大量資源也難以改變現(xiàn)有市場(chǎng)格局。

市場(chǎng)在搜索領(lǐng)域可以說既給了初創(chuàng)公司足夠的機(jī)會(huì),卻沒有留給初創(chuàng)企業(yè)足夠的空間。以極納科技(下簡(jiǎn)稱“極納”)為代表的一批初創(chuàng)企業(yè)卻在神經(jīng)搜索框架的開發(fā)中看到了新的商機(jī)。

傳統(tǒng)搜索模式為關(guān)鍵字搜索,無論用戶希望搜索到何種結(jié)果,都需要先在腦海中先將所需內(nèi)容以文字表現(xiàn)出來,再進(jìn)行搜索,因此搜索結(jié)果很難保證與所需內(nèi)容達(dá)成適配。為此百度也推出了“百度識(shí)圖”,各家音樂平臺(tái)也推出了聽歌識(shí)曲等產(chǎn)品。但其推廣程度遠(yuǎn)不如核心文字搜索引擎,且隨著內(nèi)容維度的豐富,視頻材料、3D場(chǎng)景材料的搜索目前市場(chǎng)中仍缺少對(duì)應(yīng)產(chǎn)品。

極納則瞄準(zhǔn)這一市場(chǎng),推出了多模態(tài)開源神經(jīng)搜索框架。區(qū)別于傳統(tǒng)的關(guān)鍵字匹配搜索引擎,神經(jīng)搜索通過神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)去匹配輸入內(nèi)容與數(shù)據(jù)庫中內(nèi)容的相關(guān)性,從而提供并排序搜索結(jié)果。

本文圖片來源與極納科技,經(jīng)授權(quán)使用

神經(jīng)搜索最直接的優(yōu)勢(shì)在于語義差的消除,以文字內(nèi)容為例,如搜索“三年時(shí)間北京房?jī)r(jià)浮動(dòng)變化”傳統(tǒng)搜索引擎會(huì)將語句拆分,“三年時(shí)間”可能搜索到一大批結(jié)果,“北京房?jī)r(jià)”又是一大堆結(jié)果,最后結(jié)果累計(jì)查詢到的內(nèi)容可能多達(dá)上百萬,甚至包含大量的房屋樓盤廣告。而搜索者想看到的可能僅僅是北京房?jī)r(jià)在過去三年時(shí)間內(nèi)的變化趨勢(shì)。而神經(jīng)網(wǎng)絡(luò)下,可將我們想搜索的內(nèi)容與查詢到的結(jié)果映射到同一語義空間中,以消除語義差。

除此之外,神經(jīng)搜索甚至可以普及到更多方面,包括以圖搜圖、以視頻搜視頻乃至跨模態(tài)的搜索。在神經(jīng)搜索框架下,僅需一張劇照便可搜索到你想要的視頻,而不是搜索到更多其他劇照,這便是神經(jīng)網(wǎng)絡(luò)的神奇之處。

從背后技術(shù)來講,神經(jīng)搜索不僅僅能夠更有效地服務(wù)使用者,對(duì)于開發(fā)者而言,神經(jīng)搜索也有獨(dú)特的技術(shù)優(yōu)勢(shì)。目前市場(chǎng)上的以圖搜圖、以音搜音仍是將這些多媒體信息進(jìn)行標(biāo)簽化處理后通過匹配標(biāo)簽找到搜索結(jié)果,而神經(jīng)搜索的優(yōu)勢(shì)就在于不打標(biāo)簽,不去進(jìn)行符號(hào)化的標(biāo)簽匹配,而是通過神經(jīng)網(wǎng)絡(luò)將所有特征映射到同一空間,在同一空間中進(jìn)行相似意義的搜索。

極納聯(lián)合創(chuàng)始人&COO何烜彬向創(chuàng)業(yè)邦表示:“隨著媒體表現(xiàn)形式的不斷延伸拓展,標(biāo)簽化的搜索模式在很多場(chǎng)景下已經(jīng)無法滿足用戶的搜索需求?!币杂螒蜷_發(fā)工作者為例,許多需要進(jìn)行3D渲染的場(chǎng)景,其素材是動(dòng)態(tài)的、3D的,傳統(tǒng)搜索引擎難以描述,進(jìn)行2D截圖也很難搜索到3D材料,而神經(jīng)網(wǎng)絡(luò)的跨模態(tài)搜索則可以順利幫助開發(fā)者搜索到對(duì)應(yīng)素材。

極納科技COO:何烜彬

本文圖片來源與極納科技,經(jīng)授權(quán)使用

商業(yè)模式方面,目前極納仍采用開源項(xiàng)目制的方式來運(yùn)營(yíng)。何烜彬表示:“項(xiàng)目開源讓我們看到了神經(jīng)搜索在各個(gè)領(lǐng)域新的可能性,也是市場(chǎng)發(fā)展的一個(gè)最佳路徑?!遍_源項(xiàng)目意味著更多開發(fā)者可根據(jù)現(xiàn)有框架,在此基礎(chǔ)上進(jìn)行二次開發(fā),以得到更成熟、更偏向應(yīng)用的落地產(chǎn)品。

法國(guó)的一位軟件工程師就以極納神經(jīng)搜索框架為基礎(chǔ)開發(fā)了法院判例搜索引擎,輸入當(dāng)前案件描述便可快速匹配到性質(zhì)相似案件,而非關(guān)鍵字相似案件,因此該款搜索引擎可幫助判例法司法體系快速匹配相似案例,以輔助律師完成辯護(hù)工作。

本文圖片來源與極納科技,經(jīng)授權(quán)使用

極納科技是一個(gè)具有國(guó)際化視野的創(chuàng)業(yè)公司,公司團(tuán)隊(duì)近30人,分布在中國(guó)、美國(guó)、德國(guó)、西班牙、印度等十余個(gè)國(guó)家。目前社區(qū)成員約為600余人,也同樣遍布于世界各地。與前瞻的國(guó)際化視野相呼應(yīng)的是,極納的競(jìng)爭(zhēng)對(duì)手實(shí)力雄厚,包括從 Google、微軟、 Facebook內(nèi)部孵化出的項(xiàng)目,以及從這些企業(yè)中跳出而自己選擇創(chuàng)業(yè)的創(chuàng)業(yè)者,在面對(duì)如此強(qiáng)大的競(jìng)爭(zhēng)對(duì)手時(shí),極納作為一個(gè)創(chuàng)業(yè)公司選擇了走開源的道路以取得產(chǎn)品市場(chǎng)發(fā)展的速度優(yōu)勢(shì)。

在另一方面,傳統(tǒng)搜索引擎之所以能夠經(jīng)久不衰很大程度上依賴于用戶使用習(xí)慣,但教育市場(chǎng),改變?nèi)藗兊乃季S模式需要投入的成本是巨大的。極納通過開源的方式從開發(fā)者角度切入,可以更快更有效地、以成熟產(chǎn)品的形態(tài)滲透到人們的日常生活中,為產(chǎn)品的最終商業(yè)化落地提供市場(chǎng)土壤。

目前,極納在多媒體的搜索返回場(chǎng)景中,通過通用框架搭建的搜索系統(tǒng)可滿足85%以上的用戶需求,并且這一數(shù)字仍在隨著開發(fā)工作的不斷推進(jìn)逐步提高;后端數(shù)據(jù)承載量已達(dá)千萬級(jí)。

何烜彬表示:“極納的商業(yè)化未來會(huì)從歐美市場(chǎng)著手,這主要與北美市場(chǎng)對(duì)于開源項(xiàng)目的接受程度有關(guān)。目前從下載數(shù)據(jù)來看,極納的主要下載市場(chǎng)仍以北美為主?!倍F(xiàn)階段,極納則將更多的精力傾注于社區(qū)的搭建,以形成開源項(xiàng)目的社區(qū)壁壘。此外,關(guān)于融資進(jìn)展,極納曾于2020年相繼完成由云啟資本獨(dú)投的天使輪融資以及GGV資本領(lǐng)投,SAP.io和種子輪投資方云啟資本參與跟投的Pre-A輪融資。對(duì)于下一步融資計(jì)劃,何烜彬表示:“新一輪的融資進(jìn)度將與人才規(guī)模擴(kuò)充相關(guān),短期內(nèi)暫無計(jì)劃?!?/p>

本文圖片來源與極納科技,經(jīng)授權(quán)使用。本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。


來源:原創(chuàng)
反饋
聯(lián)系我們
推薦訂閱