北京時(shí)間2017年8月14日,創(chuàng)新工場、搜狗和今日頭條聯(lián)合宣布三方共同發(fā)起 “AI Challenger全球AI挑戰(zhàn)賽”。 本次競賽三方聯(lián)合旨在打造中國最大的科研數(shù)據(jù)集與世界級AI競賽平臺,推動中國人工智能領(lǐng)域科研創(chuàng)新。
據(jù)悉,大賽第一年啟動將開放超過1000萬條中英文翻譯數(shù)據(jù)、70萬個(gè)人體動作分析標(biāo)注數(shù)據(jù)、30萬張圖片場景標(biāo)注和語義描述數(shù)據(jù)。基于此次開放的數(shù)據(jù)集,AI Challenger全球挑戰(zhàn)賽面向全球AI科研人才廣發(fā)英雄帖,致力于促進(jìn)人工智能行業(yè)向更為開放、融合以及國際化的方向發(fā)展。
在人工智能領(lǐng)域,數(shù)據(jù)的質(zhì)和量是科學(xué)研究與產(chǎn)品技術(shù)研發(fā)的核心。高質(zhì)量訓(xùn)練數(shù)據(jù)對機(jī)器學(xué)習(xí)模型的建立和優(yōu)化有關(guān)鍵性的作用。建立大規(guī)模、高水準(zhǔn)的標(biāo)注數(shù)據(jù)集,是推動AI科研和技術(shù)前進(jìn)的驅(qū)動力。
數(shù)據(jù)、算法、計(jì)算能力是人工智能的三大基石,其中,數(shù)據(jù)更是人工智能科研的最寶貴資產(chǎn)。沒有足夠好的數(shù)據(jù),就無法取得世界頂級的科研成果。在此方面,學(xué)術(shù)界和創(chuàng)業(yè)團(tuán)隊(duì)所能獲得的數(shù)據(jù)資源通常遠(yuǎn)少于產(chǎn)業(yè)界中的頂級企業(yè)。因此,將高質(zhì)量的數(shù)據(jù)集建設(shè)與科學(xué)研究、技術(shù)產(chǎn)品研發(fā)、人才培養(yǎng)有效結(jié)合,對人工智能發(fā)展具有重大意義。
對于發(fā)起本次合作,創(chuàng)新工場董事長暨CEO、創(chuàng)新工場人工智能工程院院長李開復(fù)表示:“在30多年前自己作為AI科研人員的時(shí)代,能接觸到真實(shí)世界的海量數(shù)據(jù)是個(gè)遙不可及的夢想。如今,伴隨互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)而來的大數(shù)據(jù)、高效的計(jì)算機(jī)運(yùn)算能力等條件都齊備的環(huán)境下,有了AI Challenger這樣的開放數(shù)據(jù)集和競賽平臺對于AI科研與開發(fā)人員是個(gè)難得的契機(jī)。AI Challenger致力于解決數(shù)據(jù)集缺失的問題,為人工智能科研免費(fèi)提供海量數(shù)據(jù),輔以強(qiáng)大的學(xué)術(shù)界和產(chǎn)業(yè)界專家指導(dǎo),全力支持國內(nèi)外的高校、研究機(jī)構(gòu)、產(chǎn)業(yè)界科研人才一起來挑戰(zhàn)人工智能的未來可能性。”
搜狗CEO王小川表示:“人工智能本質(zhì)是建立在大數(shù)據(jù)和機(jī)器學(xué)習(xí)的基礎(chǔ)之上。目前,搜狗以語言為核心的人工智能技術(shù),已經(jīng)通過問答、語音和翻譯等形態(tài)應(yīng)用于搜狗搜索和輸入法等諸多產(chǎn)品中,并積累大量的用戶與數(shù)據(jù)規(guī)模。其中搜狗的語音輸入日頻次已達(dá)2.6億次;搜狗的實(shí)時(shí)機(jī)器翻譯技術(shù)也在包括烏鎮(zhèn)世界互聯(lián)網(wǎng)大會等數(shù)百場會議上進(jìn)行了落地應(yīng)用。我們希望能夠利用搜狗的優(yōu)質(zhì)數(shù)據(jù)和應(yīng)用場景助力AI Challenger全球AI挑戰(zhàn)賽,讓全球科研工作者取得更大的成就與突破,一起推動人工智能行業(yè)更快、更好地發(fā)展。”
今日頭條顧問、技術(shù)戰(zhàn)略研究院院長張宏江表示:“依托大數(shù)據(jù)和人工智能技術(shù),今日頭條希望實(shí)現(xiàn)更高效的信息流動。身處人工智能行業(yè),我們深知,人才和數(shù)據(jù)是整個(gè)行業(yè)的未來。這次頭條與搜狗、創(chuàng)新工場聯(lián)合舉辦AI Challenger挑戰(zhàn)賽的初衷,就是希望通過開放數(shù)據(jù),吸引更多優(yōu)秀人才參與到算法模型的開發(fā)、設(shè)計(jì)中來。比賽結(jié)束后,所有數(shù)據(jù)集會向社會全面開放,我們希望盡一些微薄的力量,為學(xué)術(shù)界、學(xué)術(shù)人才提供幫助,加強(qiáng)產(chǎn)學(xué)研結(jié)合,共同推動中國人工智能行業(yè)的發(fā)展。”
此次三方聯(lián)合開放的AI Challenger數(shù)據(jù)集涵蓋多個(gè)領(lǐng)域,包括人體骨骼關(guān)鍵點(diǎn)數(shù)據(jù)集(用于無人駕駛、安防、體感游戲等場景)、圖像中文描述數(shù)據(jù)集(用于圖像和視頻內(nèi)容理解、圖像標(biāo)題自動生成等各類應(yīng)用)、口語領(lǐng)域英中翻譯數(shù)據(jù)集(用于同聲傳譯等自然語言處理的各類應(yīng)用)等。
2017年競賽將區(qū)分為五個(gè)競賽任務(wù)供參賽者組隊(duì)報(bào)名,設(shè)有共計(jì)200萬元人民幣的獎金池。自9月4日起開放參賽隊(duì)伍線上進(jìn)行數(shù)據(jù)集下載,三個(gè)月競賽持續(xù)直到12月。參賽的優(yōu)秀選手還可獲得進(jìn)入三家主辦方工作、實(shí)習(xí)或獲得投資的機(jī)會,并有機(jī)會在國際頂級學(xué)術(shù)會議上分享獲獎心得,得到如上??萍即髮W(xué)教授馬毅、曠視科技首席科學(xué)家孫劍、前Google研究院高級管理科學(xué)家林德康等十余位人工智能領(lǐng)域頂級專家評委的指導(dǎo)和評價(jià)。未來,“AI Challenger·全球AI挑戰(zhàn)賽”將持續(xù)投入,建設(shè)和發(fā)布更大規(guī)模的AI前沿領(lǐng)域高質(zhì)量數(shù)據(jù)集,擴(kuò)大涵蓋自動駕駛、智慧醫(yī)療、智慧金融、機(jī)器人等行業(yè)應(yīng)用中的核心AI需求。
上月,舉辦了八屆的ImageNet挑戰(zhàn)賽由創(chuàng)始人之一李飛飛博士正式宣布退出歷史舞臺。國際上,ImageNet挑戰(zhàn)賽曾是每年企業(yè)和研究者都極為看重的活動。另一機(jī)器學(xué)習(xí)競賽平臺Kaggle著眼于真實(shí)數(shù)據(jù)和真實(shí)問題的解決方案,同樣吸引了全球?qū)⒔偃f數(shù)據(jù)科學(xué)家和研究者進(jìn)行挑戰(zhàn)和探索其多元化的公開數(shù)據(jù)集。創(chuàng)新工場、搜狗、今日頭條三方計(jì)劃在未來三年間投入數(shù)千萬規(guī)模的資金,完善平臺的建設(shè)、擴(kuò)大數(shù)據(jù)集的規(guī)模,期許AI Challenger在三年內(nèi)打造來自中國的世界級AI開放數(shù)據(jù)和競賽平臺。