▲ Momenta公司創(chuàng)始人曹旭東
“我相信未來(lái)世界的生產(chǎn)力和自由,將來(lái)自大數(shù)據(jù)和智能。而深度學(xué)習(xí)的無(wú)人駕駛技術(shù)本身是一個(gè)較為年輕的領(lǐng)域,更新?lián)Q代的速度非???,對(duì)自己技術(shù)的實(shí)踐應(yīng)用是一個(gè)機(jī)會(huì),這也是我選擇無(wú)人駕駛方向的原因,”Momenta創(chuàng)始人曹旭東說(shuō)道。
Momenta是一家剛成立不久的專注做無(wú)人車大腦的公司,核心技術(shù)是基于深度學(xué)習(xí)的環(huán)境感知,高精地圖,駕駛決策算法。產(chǎn)品包括不同級(jí)別的自動(dòng)駕駛方案,以及衍生出的大數(shù)據(jù)服務(wù)。
放棄學(xué)業(yè)、放棄高薪,一心只為AI
Momenta公司的CEO曹旭東2008年畢業(yè)于清華大學(xué),本科專業(yè)是工程力學(xué),但對(duì)統(tǒng)計(jì)學(xué)有著濃厚的興趣。本科畢業(yè)后,他順利成為清華大學(xué)的直博生。在博一期間,他對(duì)人工智能尤為感興趣,“當(dāng)時(shí)我一心扎入人工智能計(jì)算機(jī)相關(guān)的課程,哪怕自己上課、看書、查文獻(xiàn)都樂(lè)在其中,”曹旭東回憶說(shuō)。對(duì)于AI,曹旭東可以用癡迷來(lái)形容,博一過(guò)后為AI出國(guó)深造申請(qǐng)了退學(xué),即使在導(dǎo)師三次挽留的情況下也沒(méi)能改變他的主意。
離開清華后,曹旭東來(lái)到微軟亞洲研究院,因微軟的技術(shù)和學(xué)術(shù)氛圍留在了這里,如愿做了AI相關(guān)的研究,他所研發(fā)的視覺(jué)識(shí)別技術(shù)被用在了Xbox,Bing,How-old等知名產(chǎn)品。
2014年底,深度學(xué)習(xí)還似煉丹術(shù),其中的原理無(wú)法講清楚,而在理論研究上,曹旭東已經(jīng)有了自己的一套研究方法并發(fā)表了很多學(xué)術(shù)文章,但終不能令他滿意,他認(rèn)為理論需要解決實(shí)際問(wèn)題 。
所以,為讓自己的研究成果能在實(shí)踐中得到驗(yàn)證,曹旭東曾參加了National Data Science Bowl比賽,與1000多支來(lái)自世界各地團(tuán)隊(duì)的選手角逐,并拿到全球第二的好成績(jī)。
2015年,曹旭東將創(chuàng)業(yè)目標(biāo)鎖定在了無(wú)人駕駛領(lǐng)域,之后基于對(duì)“個(gè)人和環(huán)境的交互能激發(fā)智能”的執(zhí)著追求,曹旭東開始了無(wú)人駕駛的技術(shù)路徑和商業(yè)路徑的探索,并創(chuàng)辦Momenta,專注做無(wú)人車的大腦。
如何解決無(wú)人駕駛最重要的安全問(wèn)題?
據(jù)統(tǒng)計(jì),從全球人類司機(jī)在一億公里發(fā)生致命事故一至三起,而無(wú)人駕駛需要做到更安全,安全意味著低事故率。一個(gè)系統(tǒng)要做到低事故率,通常要做到:一是發(fā)現(xiàn)問(wèn)題,二是解決問(wèn)題。
而解決這些問(wèn)題則需要無(wú)人車進(jìn)行大規(guī)模數(shù)據(jù)收集和測(cè)試,一方面需要海量的測(cè)試車輛,另一方面是高昂的單車成本。
Momenta的做法是用無(wú)人駕駛模擬、眾包數(shù)據(jù)收集和測(cè)試兩種互補(bǔ)的解決方案降低無(wú)人駕駛的低事故率。
具體來(lái)講,無(wú)人駕駛模擬可以通過(guò)算法生成感知和決策數(shù)據(jù),減少數(shù)據(jù)收集和測(cè)試車輛數(shù)量,降低研發(fā)成本。
但曹旭東坦言,無(wú)人駕駛模擬也存在不足。
第一,模擬生成的感知數(shù)據(jù)和真實(shí)的數(shù)據(jù)存在差異,實(shí)際中,還是以真實(shí)數(shù)據(jù)為主,生成數(shù)據(jù)為輔。
第二,模擬的規(guī)則是人制定的。很多失敗的場(chǎng)景恰恰是人思考的盲點(diǎn),單純通過(guò)模擬并不能發(fā)現(xiàn)。
另外,曹旭東告訴創(chuàng)業(yè)邦(微信搜索關(guān)注:ichuangyebang),“雖然模擬可以降低數(shù)據(jù)收集和測(cè)試車輛的數(shù)量,但是我們?nèi)匀恍枰占鎸?shí)數(shù)據(jù),用大量的車做真實(shí)測(cè)試。”
而在單車成本方面,其主要由三部分構(gòu)成:設(shè)備成本,造車成本,運(yùn)營(yíng)成本。后兩者已經(jīng)優(yōu)化了上百年,很難降低。設(shè)備成本方面,Momenta發(fā)揮算法優(yōu)勢(shì),通過(guò)多攝像頭等廉價(jià)設(shè)備實(shí)現(xiàn)無(wú)人駕駛。
“攝像頭是所有感知設(shè)備中信息量最大的,需要人腦水平的強(qiáng)人工智能,才能從間接視頻數(shù)據(jù)中提取出無(wú)人駕駛所需要的直接數(shù)據(jù),”曹旭東稱。
降低造車成本和運(yùn)營(yíng)成本目前最好的辦法是通過(guò)眾包模式讓其他人承擔(dān)這部分成本,這種模式其實(shí)代表性的公司已經(jīng)有特斯拉這些大佬在嘗試,但遺憾的是他們需要造車、讀取和控制車輛行為,這需要很大的時(shí)間成本,顯著慢于算法的研究節(jié)奏。
“我們的想法是直接利用已有的運(yùn)營(yíng)車輛,避開造車、改車、控制車等過(guò)程,通過(guò)眾包,就可以獲得海量環(huán)境和行為數(shù)據(jù),并構(gòu)建高精度地圖,再通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)無(wú)人駕駛決策,”曹旭東這樣告訴創(chuàng)業(yè)邦(微信搜索關(guān)注:ichuangyebang)。
高精度地圖方面,Momenta通過(guò)多張圖像存在的視差,利用點(diǎn)的對(duì)應(yīng)關(guān)系,將圖像中的2D點(diǎn)恢復(fù)到真實(shí)世界中的3D點(diǎn)。從基本原理出發(fā),建立高精地圖,Momenta用不一樣的方式嘗試解決三個(gè)難題。
?圖像部分:檢測(cè)識(shí)別語(yǔ)義點(diǎn)。
不同于傳統(tǒng)的SLAM或者SFM算法所用的SIFT、ORB等人工設(shè)計(jì)的特征點(diǎn),Momenta的方法是定義道路標(biāo)線、標(biāo)牌等地標(biāo)上的點(diǎn)作為語(yǔ)義點(diǎn),通過(guò)深度學(xué)習(xí)和數(shù)據(jù)驅(qū)動(dòng)的監(jiān)督訓(xùn)練得到模型,可以準(zhǔn)確檢測(cè)和識(shí)別語(yǔ)義點(diǎn),解決檢測(cè)不到、匹配錯(cuò)誤的問(wèn)題。
?幾何部分:通過(guò)眾包間接實(shí)現(xiàn)海量攝像頭測(cè)量效果。
不同車輛,不同時(shí)間,經(jīng)過(guò)同一地標(biāo),即使光照視角不同,通過(guò)語(yǔ)義點(diǎn)模型把所有車輛拍攝到的同一語(yǔ)義點(diǎn)關(guān)聯(lián)起來(lái),這相當(dāng)于間接實(shí)現(xiàn)了多攝像頭測(cè)量的效果。
眾所周知,視覺(jué)測(cè)量中,攝像頭越多、視差覆蓋越全,測(cè)量精度就越高。Momenta的實(shí)驗(yàn)驗(yàn)證,隨著眾包車次的增加,真實(shí)3D點(diǎn)位置估計(jì)的準(zhǔn)確性有量級(jí)上的提升。
?GPS部分:給每個(gè)語(yǔ)義點(diǎn)精確的GPS坐標(biāo)。
Momenta的考量是:
(1)讓高精地圖通用。GPS坐標(biāo)是地圖的通用語(yǔ)言,給每個(gè)語(yǔ)義點(diǎn)賦予GPS坐標(biāo),便于他人使用。
(2)消除累積誤差。單純使用幾何方法構(gòu)建局部地圖,會(huì)有累積誤差,結(jié)合GPS,可以解決這個(gè)問(wèn)題。
(3)消除局部地圖歧義性。當(dāng)局部地圖有重合或者語(yǔ)義點(diǎn)缺失的時(shí)候,確定局部地圖坐標(biāo)系很麻煩,但全局GPS坐標(biāo)系沒(méi)有這個(gè)問(wèn)題。
任重而道遠(yuǎn)
無(wú)人駕駛技術(shù)是一個(gè)非常龐大的知識(shí)體系,定位、感知、決策、控制是其亟待解決的四大問(wèn)題,在這四個(gè)方向上都有很多子問(wèn)題。對(duì)于初期的Momenta而言,團(tuán)隊(duì)來(lái)源于清華大學(xué)、麻省理工學(xué)院、微軟亞洲研究院等,有深厚的技術(shù)積累和很強(qiáng)的技術(shù)原創(chuàng)力,這將是其布局駕駛的技術(shù)和團(tuán)隊(duì)優(yōu)勢(shì)。
但創(chuàng)業(yè)邦(微信搜索關(guān)注:ichuangyebang)認(rèn)為,目前Momenta如何緊跟時(shí)代潮流,盡快將不同級(jí)別的無(wú)人駕駛技術(shù)落地,以及對(duì)行業(yè)大數(shù)據(jù)的快速積累將是當(dāng)務(wù)之急。而在瞬息萬(wàn)變的AI領(lǐng)域,面對(duì)競(jìng)爭(zhēng)對(duì)手和行業(yè)巨頭們,Momenta接下來(lái)的路任重而道遠(yuǎn)。
目前,剛成立不久的Momenta獲得A輪500萬(wàn)美元投資,本輪由藍(lán)湖資本領(lǐng)投,創(chuàng)新工場(chǎng)和真格基金跟投。
團(tuán)隊(duì)成員:
▲Momenta團(tuán)隊(duì)成員
曹旭東,Momenta(http://momenta.ai)公司CEO,畢業(yè)于清華大學(xué)。創(chuàng)立Momenta之前,先后任職于微軟亞洲研究院和商湯科技,有近百人研發(fā)團(tuán)隊(duì)管理經(jīng)驗(yàn)以及豐富的產(chǎn)品落地經(jīng)驗(yàn)。研發(fā)技術(shù)用于Xbox,Bing,How-old等知名產(chǎn)品。對(duì)無(wú)人駕駛環(huán)境感知,高精地圖,駕駛決策有深入研究。
任少卿,Momenta公司研發(fā)總監(jiān),畢業(yè)于中國(guó)科技大學(xué)與微軟亞洲研究院聯(lián)合培養(yǎng)博士班,提出適用于物體檢測(cè)的高效框架Faster RCNN和圖像識(shí)別算法ResNet,后者相關(guān)論文于2016年獲得計(jì)算機(jī)視覺(jué)領(lǐng)域頂級(jí)會(huì)議CVPR 的Best Paper Award。這兩項(xiàng)成果幫助微軟在2015 ImageNet, 2015 MS COCO Challenge等比賽中獲得多項(xiàng)冠軍,比賽的參與者包括來(lái)自Google Brain,Facebook AI Research等著名AI實(shí)驗(yàn)室的若干隊(duì)伍。