五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

硬件戰(zhàn)火重燃,誰能定義AI耳機(jī)?

AI硬件江湖風(fēng)云再起,AI耳機(jī)只是前菜。

攝圖網(wǎng)_500538286_banner_桌上的耳機(jī)和手機(jī)(企業(yè)商用).jpg

編者按:本文轉(zhuǎn)自雷峰網(wǎng),作者吳憂,編輯劉偉,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

AGI時代,擁有大模型基座的字節(jié)重新做硬件,故事的走向會有何不同?

01

Ola Friend,豆包的硬件入口

2024年10月初,字節(jié)發(fā)布的豆包AI耳機(jī)Ola Friend曾掀起一陣熱議。

Ola Friend售價1199元,無需打開手機(jī)就能通過語音喚起豆包進(jìn)行對話,無論是信息查詢和旅游出行,還是口語練習(xí)和情感交流,都能給出及時的反饋,很像一位賽博好友。

4個月過去了,Ola Friend在京東、淘寶平臺上的銷量分別為1w+和6K+,累計銷量不到Airpods季度銷量的千分之一。目前字節(jié)AI耳機(jī)的話題熱度顯然被AI百鏡大戰(zhàn)蓋過,比起耳機(jī),大家似乎更關(guān)注AI眼鏡。

確實與AI眼鏡相比,AI耳機(jī)是更加小眾的AI硬件,小眾到不足以各大電商平臺為其單獨設(shè)置品類,業(yè)界對AI耳機(jī)也沒有十分明確的定義。

聲智科技產(chǎn)品副總裁黃赟賀在雷峰網(wǎng)連線直播時解釋了AI耳機(jī)與傳統(tǒng)TWS、OWS耳機(jī)的不同之處,這可能是感知AI耳機(jī)比較直觀的方式。

“AI耳機(jī)進(jìn)一步提升了用戶體驗的智能化及豐富性。從技術(shù)層面看,AI耳機(jī)需要人工智能與聲學(xué)算法的交叉技術(shù)作為底座,即要能夠提供復(fù)雜場景內(nèi)高質(zhì)量的聲音傳輸,還要具備低延時的語音交互的能力,實現(xiàn)從圖形界面交互到語音交互的人機(jī)交互形態(tài)升級。從功能體驗看,搭載AI智能體的AI耳機(jī)服務(wù)場景更多元,包含教育、工作、娛樂、生活等領(lǐng)域的‘管家式’服務(wù),提供更便捷的信息獲取方式。對于追求科技感和體驗升級的消費者而言,AI耳機(jī)無疑提供了更前沿的選擇?!?/p>

Ola Friend除了在功能上更偏向生活助理的角色,其他方面符合黃赟賀對AI耳機(jī)的定義。

但在IKKO聯(lián)合創(chuàng)始人Echo Chan看來,真正的AI硬件應(yīng)該有獨立的載體和算力,即可以脫離手機(jī)APP獨立運行,而Ola Friend本質(zhì)上是通過手機(jī)APP完成所有功能,嚴(yán)格來講不屬于AI耳機(jī)。

作為獨立智能體的擁護(hù)派,往往會給耳機(jī)倉配備智能屏且開發(fā)了一套自有操作系統(tǒng),即不連接手機(jī)APP耳機(jī)也能正常運行。既存在旨在幫助用戶提高學(xué)習(xí)以及生產(chǎn)效率,實現(xiàn)會議錄音和轉(zhuǎn)寫等AI輔助功能的產(chǎn)品,例如IKKO;也存在想要實現(xiàn)AI生活助理的愿景,包括存儲用戶即時輸入的語音信息并發(fā)出提醒,幫助用戶構(gòu)建外部大腦,與豆包耳機(jī)的功能更加接近的生活助理類AI的產(chǎn)品,例如WISHEE。

信奉“最先愿意為新技術(shù)服務(wù)的人群一定愿意為生產(chǎn)力工具付費”的Echo Chan不認(rèn)同AI耳機(jī)作為生活助理暫時能夠為用戶提供多大幫助,但他肯定字節(jié)發(fā)布AI耳機(jī)的價值:

“字節(jié)推出的這款產(chǎn)品擴(kuò)大了大家對AI耳機(jī)的認(rèn)知,且將價格定位在千元以上,已經(jīng)產(chǎn)生品牌溢價,這對行業(yè)來說是積極的信號”,Echo Chan說到。

在接受雷峰網(wǎng)采訪的幾周前,IKKO剛剛結(jié)束一場與小紅書的直播合作,在直播15分鐘完成100萬gmv目標(biāo)。談及比豆包耳機(jī)更高的定價,Echo Chan表示前期打好用戶基礎(chǔ)非常重要,高價能夠為產(chǎn)品打下很好的用戶基礎(chǔ),與用戶之間的互動能推動更加高效的產(chǎn)品迭代。

Echo Chan向雷峰網(wǎng)透露,2024年IKKO的出貨量大概達(dá)到6000萬營業(yè)額,主要銷往美國和歐洲,目前每個月的復(fù)合增長率達(dá)到30%以上,按照目前的增長趨勢不下滑且產(chǎn)能充足的情況下,2025年的營業(yè)額能夠達(dá)到1億至2億。庫存不足是IKKO目前所面臨的最大難題,生產(chǎn)效率有待進(jìn)一步提升。

IKKO可以是獨立設(shè)備,豆包耳機(jī)離不開豆包APP,“只是作為鏈接豆包大模型的入口”也是Ola Friend被業(yè)界詬病最多的地方,認(rèn)為這只是一次TWS耳機(jī)與語言大模型的粗糙結(jié)合,字節(jié)拿著錘子找釘子,在為豆包大模型找應(yīng)用場景,Ola Friend沒有很強(qiáng)的不可替代性。

雷峰網(wǎng)了解到,字節(jié)曾與不止兩家耳機(jī)公司洽談合作事宜,條件是只接入豆包一家語言大模型,不少潛在合作對象認(rèn)為豆包大模型和ChatGPT還有一定差距,且不愿意與豆包大模型深度綁定,因此拒絕了與字節(jié)的合作。

但Oladance創(chuàng)始人李浩乾把耳機(jī)這一可穿戴設(shè)備當(dāng)做入口的思路卻意外與字節(jié)契合。李浩乾曾在2021年接受雷峰網(wǎng)采訪時提出,元宇宙主要有兩個入口場景,在家和辦公室依托于重設(shè)備,在外通勤依托輕設(shè)備,耳機(jī)瞄準(zhǔn)的是通勤場景,Oladance希望在TWS上做突破,建立鏈接元宇宙的入口。

當(dāng)時ChatGPT3.5尚未發(fā)布,元宇宙和Web3.0還是當(dāng)紅概念,TWS耳機(jī)的競爭已十分激烈,除了骨傳導(dǎo)和助聽器,業(yè)界對TWS耳機(jī)想象乏力。李浩乾的觀點卻讓業(yè)界耳目一新,在新消費資本市場最低迷的時候,李浩乾的電話被投資人打爆。

沒能等到元宇宙,先等來了字節(jié)的豆包大模型。2024年4月,字節(jié)跳動以3-5億元的價格收購Oladance,6個月的時間,Oladance作為人機(jī)語音交互的入口,完成了向AI耳機(jī)的華麗轉(zhuǎn)身。

02

是AI重要還是耳機(jī)重要?

追問字節(jié)能否做好一款A(yù)I耳機(jī),本質(zhì)上是在追問AI硬件到底是AI本身的能力更重要還是硬件能力更重要。

許多AI耳機(jī)賽道的玩家在同雷峰網(wǎng)的交流中表達(dá)了同樣的觀點:不認(rèn)為自己是一家耳機(jī)公司,只是在開發(fā)AI硬件道路上恰好選中耳機(jī)這一形態(tài)

在第一波AI浪潮中創(chuàng)辦時空壺的田力對此具有發(fā)言權(quán),其W系列翻譯耳機(jī)保留了TWS耳機(jī)的產(chǎn)品形態(tài),但卻舍棄了最核心的聽音樂功能,更早期的產(chǎn)品甚至不能接電話。

當(dāng)時田力剛剛離開一家機(jī)器人硬件公司,想用AI技術(shù)本身做點有價值的事情。田力認(rèn)為,彼時AI技術(shù)雖然很發(fā)達(dá),但還缺少與普通人的需求鏈接。恰逢父母海外旅游時遇到交流障礙,在田力看來,盡管語音識別與機(jī)器翻譯的技術(shù)已經(jīng)較為成熟,但人們出國時依舊沒有意識到可以利用該技術(shù)隨時自由溝通,這表明AI技術(shù)與現(xiàn)實需求仍存在距離。

在感知到AI領(lǐng)域的市場機(jī)遇及行業(yè)中潛存的問題后,2016年田力迅速組建團(tuán)隊,試圖以“AI+翻譯”構(gòu)建跨語言溝通的多樣場景。身為科幻迷的田力從《銀河系漫游指南》中巴別魚的設(shè)想中獲得靈感,他認(rèn)為在跨語言交流中,翻譯不是要解決的核心問題,而是交流的沉浸感。

從技術(shù)實現(xiàn)的角度,翻譯耳機(jī)要求對話中的雙方都擁有相同的耳機(jī)設(shè)備,只有在共享一副支持雙通道耳機(jī)的情況下才能實現(xiàn)這一場景。早期的TWS耳機(jī)采用單通道互聯(lián)技術(shù),手機(jī)發(fā)射藍(lán)牙信號時主耳先收到信號,再將信號發(fā)送給副耳,會出現(xiàn)信號不同步的情況。另外,如果增加聽音樂的功能就要犧牲翻譯所需要的算力,與田力所期望的沉浸感相悖。

他認(rèn)為既然時空壺要解決的核心問題是跨語言交流,就不應(yīng)該給消費者“購買一副附帶翻譯功能耳機(jī)”的預(yù)期,田力團(tuán)隊重新撰寫部分藍(lán)牙協(xié)議,摒棄音樂播放功能,一副形似耳機(jī)實則是AI翻譯設(shè)備由此而來。

另一AI耳機(jī)品牌WISHEE聯(lián)合創(chuàng)始人兼董事長張博在與雷峰網(wǎng)的交流過程中也多次提及WISHEE想要做的是獨立的AI智能體而不是TWS耳機(jī)。

這源于張博和團(tuán)隊其他同事此前的工作經(jīng)歷。張博在參與WISHEE創(chuàng)辦之前是OPPO語言助手項目中的一員,見證過OPPO語音助手從0到1的搭建。在參與手機(jī)語音助手的項目過程中,張博發(fā)現(xiàn),手機(jī)語音助手的本質(zhì)是在和用戶的對話框模式使用習(xí)慣打架,打贏的概率微乎其微。

2011年,喬布斯推出Siri不久后離世,給蘋果留下了Siri到底是做搜索引擎還是做智能助手的世紀(jì)難題,后來Siri團(tuán)隊核心成員離開,Siri的發(fā)展更是撲朔迷離。張博堅信喬布斯對Siri有更宏大的設(shè)想,重建可以直接進(jìn)行語音交互調(diào)用的獨立系統(tǒng)或許是未來方向之一。

建立在這一構(gòu)想之上,WISHEE推出了一款A(yù)I智能體產(chǎn)品AiEar并于2024年618正式售賣,售價1999元。從用戶體驗來看,AiEar比傳統(tǒng)TWS多了一款植入耳機(jī)艙表面的智能屏幕,擁有獨立的OS系統(tǒng),可以插入esim卡實現(xiàn)語音通話,也可以作為移動wifi供其他移動設(shè)備連網(wǎng)使用。

圖片

電影《Her》中的AI智能體設(shè)備

WISHEE的市場負(fù)責(zé)人向雷峰網(wǎng)展示了AiEar的其他功能,包括敲木魚小游戲、電子寵物、番茄時鐘、GPS導(dǎo)航、語音記憶等功能,談及對AiEar未來的想象,這位負(fù)責(zé)人情緒飽滿,表示還有更多的功能正在開發(fā)中。在加入WISHEE團(tuán)隊之前,WISHEE的市場負(fù)責(zé)人是一家公關(guān)公司的老板,服務(wù)過眾多手機(jī)、耳機(jī)品牌,如今他幾乎關(guān)掉了自己公關(guān)公司的業(yè)務(wù),全盤押注WISHEE。

據(jù)他透露,目前有一些考研黨在使用AiEar,還有一部分不希望小朋友玩游戲的家長會買來送給孩子,WISHEE目前主要面向國內(nèi)市場,正在與海外眾籌平臺洽談計劃出海。

基于過往在AI聲學(xué)領(lǐng)域的經(jīng)驗積累,科大訊飛旗下的未來智能是少有承認(rèn)自己在做AI耳機(jī)的公司,且在產(chǎn)品研發(fā)的過程中愈發(fā)感受到硬件能力的重要性。

未來智能CPO柳達(dá)本身也是一名耳機(jī)重度使用者。未來智能還沒成立之前,柳達(dá)在科大訊飛消費者BG做云助手項目,每天的工作被大量的會議與信息充斥,耳機(jī)成為柳達(dá)最親密的工作伙伴。在使用TWS耳機(jī)的過程中,柳達(dá)愈發(fā)覺得傳統(tǒng)TWS耳機(jī)只滿足了消費者最基本的需求,對于信息輸入大于輸出的用戶來講,完全沒有發(fā)揮其作為工具的潛力,完全可以基于TWS耳機(jī)針對會議錄音和紀(jì)要等功能進(jìn)一步改善。

柳達(dá)向雷峰網(wǎng)表示,早期組建團(tuán)隊時低估了硬件的重要性,團(tuán)隊軟件成員數(shù)量遠(yuǎn)大于硬件人員,直到第一代產(chǎn)品發(fā)布,收到來自消費者的反饋認(rèn)為與同等價位的TWS耳機(jī)相比,訊飛AI會議耳機(jī)作為硬件產(chǎn)品不達(dá)預(yù)期,后來及時調(diào)整提高硬件人員的占比,耳機(jī)品質(zhì)才得以改善。

一副兼具TWS基本能力的AI耳機(jī)在硬件層面需要解決來自續(xù)航能力、聲學(xué)設(shè)計、硬件堆疊與散熱等方面的技術(shù)難題。TWS耳機(jī)要求體積小,能夠容納的電池體積有限,對續(xù)航能力構(gòu)成挑戰(zhàn),尤其是主動降噪式耳機(jī)需要多顆麥克風(fēng),如果要實現(xiàn)本地存儲功能還需要額外增加閃存芯片,進(jìn)一步壓縮電池空間。AI功能的增加和運行會消耗更多電量并產(chǎn)生熱量,例如語音識別、語義理解、語音增強(qiáng)等功能的實現(xiàn)都需要持續(xù)供電。

少數(shù)高端TWS耳機(jī)有能力采用SiP封裝節(jié)省空間,但這一封裝方式技術(shù)難度大且價格昂貴,也會增加產(chǎn)品成本。

可以想象成是把聰明的大腦裝進(jìn)小盒子里,需要非常流暢、精準(zhǔn)和省電”,柳達(dá)如此形容。

通過不斷增強(qiáng)硬件隊伍和幾代耳機(jī)的研發(fā)升級,未來智能推出的訊飛AI會議耳機(jī)iFLYBUDS PRO2在續(xù)航方面已經(jīng)做到單次使用長達(dá)9小時,搭配充電盒可延長至36小時。在去年雙十一上,訊飛AI會議耳機(jī)的銷售額在天貓、抖音兩大平臺的入耳式藍(lán)牙耳機(jī)大類目中銷售額排名第一,在京東AI耳機(jī)品類占據(jù)榜首。

回到豆包AI耳機(jī)本身,字節(jié)坐擁AI基礎(chǔ)設(shè)施,至少與需要調(diào)用非自家大模型API的創(chuàng)業(yè)公司相比,豆包AI耳機(jī)將最核心的數(shù)據(jù)資產(chǎn)始終握在自己手中,但另一方面與某一模型深度綁定也意味著前期需要經(jīng)歷漫長的磨合期和迭代期,與可以同時接入多家大模型的中小廠商相比,前期語音交互的準(zhǔn)確率不占優(yōu)勢。

與此同時,大廠做AI硬件也有決策慢、流程長的問題。一位業(yè)內(nèi)人士告訴雷峰網(wǎng),目前還沒有聽聞大廠All in AI硬件的消息,基本都是中小廠All in,大廠內(nèi)部審批及決策流程非常漫長,需要結(jié)合公司主營業(yè)務(wù)拓展賽道,預(yù)計25年下半年才會有大廠正式入局AI硬件,留給中小廠的窗口期還有半年至一年。有關(guān)大廠AI硬件的最新動態(tài),歡迎添加本文作者微信Yolanda_Zuu爆料。

Echo Chan也表示,預(yù)計25年下半年IKKO才會遇到真正的競爭對手,且更有可能來自手機(jī)大廠而非互聯(lián)網(wǎng)大廠,因為手機(jī)廠商在硬件供應(yīng)鏈方面比互聯(lián)網(wǎng)大廠更強(qiáng)勢。

FoloToy創(chuàng)始人王樂認(rèn)為只有高集成度才能提升系統(tǒng)級的體驗,手機(jī)廠商這方面占據(jù)優(yōu)勢。

以字節(jié)為首的互聯(lián)網(wǎng)大廠做AI硬件具備人才與資金優(yōu)勢。關(guān)注AI硬件創(chuàng)業(yè)的真格基金投資經(jīng)理李鈺看好互聯(lián)網(wǎng)大廠的軟件產(chǎn)品經(jīng)理創(chuàng)業(yè)做AI硬件,如果再找到懂供應(yīng)鏈和硬件生產(chǎn)的專家一起組建團(tuán)隊,會是一個好標(biāo)的?!耙驗橛布臉I(yè)者只擅長做標(biāo)準(zhǔn)化,售后受限,不適合主導(dǎo)這件事,而軟件是需要持續(xù)迭代?!?/p>

王樂也表示,深圳做硬件和方案的公司轉(zhuǎn)型做AI的難點在于之前做方案的毛利很低,利潤不足以支撐公司招軟件和AI方面的人才,成本挑戰(zhàn)大。

03

下一代爆款移動設(shè)備誕生前夜,AI耳機(jī)只是過渡產(chǎn)品?

“AI是技術(shù)基座,耳機(jī)本身是交互載體,各占一半,但最終服務(wù)的是人,用戶體驗才是最重要的”,田力認(rèn)為找到能夠為用戶提供服務(wù)的切入點比討論AI重要還是耳機(jī)重要更有意義。

無論是否承認(rèn)自己是一家AI耳機(jī)公司,還是將自己單純定義為AI硬件公司,這些選擇將AI與耳機(jī)產(chǎn)品形態(tài)結(jié)合的公司無一例外都認(rèn)同從供應(yīng)鏈成熟度以及AI語音交互形式來看,現(xiàn)階段耳機(jī)是比眼鏡更能承載AI能力的硬件載體。

目前市面上的AI硬件產(chǎn)品大致可以分為兩大類,一類是在傳統(tǒng)智能硬件的基礎(chǔ)上做生成式AI的加持,例如在眼鏡、耳機(jī)上增加AI功能,不改變原有的產(chǎn)品形態(tài);另一類是AI重塑產(chǎn)品形態(tài),創(chuàng)造新的用戶需求和應(yīng)用場景,例如一年前爆火的AI Pin和Rabbit。

第一類的支持者認(rèn)為從人類技術(shù)發(fā)展史來看,產(chǎn)品形態(tài)基本沒有太多變化,手表、手機(jī)、耳機(jī)等幾十年前就已經(jīng)存在,這證明用戶很難被教育,AI硬件需要在原本不夠智能化的地方發(fā)力,而不是創(chuàng)造全新且無用的東西再思考如何智能化。

第二類的支持者一部分認(rèn)為AI的能力強(qiáng)大到需要全新的產(chǎn)品形態(tài)來承載,另一部分集中在研發(fā)為人類提供陪伴和情緒價值的AI玩具,因娛樂性和高容錯性也已經(jīng)有一定的市場。歡迎添加本文作者Yolanda_Zuu交流討論中國AI硬件江湖。

AI耳機(jī)更像是介于第一類和第二類之間的產(chǎn)品。耳機(jī)本身發(fā)展已久,TWS耳機(jī)掀起的浪潮已經(jīng)培養(yǎng)起用戶對耳機(jī)的依賴和長期佩戴的可能性。根據(jù)Canalys的最新研究,TWS在2024年第二季度仍然是全球智能個人音頻市場的領(lǐng)導(dǎo)者,以12.6%的年增長率鞏固了72.6%的市場份額。

TWS耳機(jī)的爆火已經(jīng)證明了耳機(jī)本身不與手機(jī)直接競爭,甚至填充了無法使用手機(jī)的時間,在交互形式上具備優(yōu)勢。建立在大家對耳機(jī)高接受度的基礎(chǔ)之上,一方面可以基于生成式大模型在AI語音助手再升級,另一方面耳機(jī)艙也有很多可探索的空間。

進(jìn)入低價競爭時代的TWS耳機(jī)也已經(jīng)建立起成熟的產(chǎn)業(yè)供應(yīng)鏈,即便是AI耳機(jī)需要根據(jù)新增的功能植入存儲器、射頻等器件,與TWS耳機(jī)供應(yīng)鏈有所不同,但也能被成熟的手機(jī)供應(yīng)鏈所覆蓋。

從交互習(xí)慣的角度來看,也有觀點認(rèn)為AI耳機(jī)沒有想象中那么容易被用戶接受。

RWKV聯(lián)合創(chuàng)始人羅璇表示:與手指操作相比,純語音交互是一件更加困難、更加耗能且泄漏隱私的事情。而且在人類歷史上,手指操作工具比語言更早出現(xiàn)。因此更看好AI眼鏡,手指+語音的模式。

柳達(dá)在十年前就思考過,何時我們使用語音交互的頻率能夠同對話框交互一樣高:一是需要在技術(shù)和體驗層面有重大突破,不僅是技術(shù)改進(jìn)還包括用戶習(xí)慣的改變;二是語音識別需要更加精準(zhǔn),對話的自然度和流暢度進(jìn)一步提高,語義理解能力進(jìn)一步增強(qiáng);三是多模態(tài)融合會是未來大趨勢,語言交互和指尖交互無縫切換。

這也是AI耳機(jī)玩家們曾經(jīng)思考過或正在思考的問題。李浩乾曾在2021年與雷峰網(wǎng)對話時表示,Oladance在做TWS耳機(jī)之前就是嘗試過做眼鏡,但發(fā)現(xiàn)市場不成熟最后選擇放棄。WISHEE曾經(jīng)也嘗試探索AI眼鏡,發(fā)現(xiàn)AI眼鏡不僅需要考慮如何存儲視頻數(shù)據(jù),還需要高維度提取特征,而AI耳機(jī)在技術(shù)上已經(jīng)準(zhǔn)備好。IKKO也表示,在做AI耳機(jī)的同時也有對AI眼鏡的積極探索。

或許從多模態(tài)融合的趨勢來看,有視覺交互可能性的AI眼鏡確實會是AI耳機(jī)的終極形態(tài),但從AI耳機(jī)到AI眼鏡還有很長的一段路要走。AI硬件大戰(zhàn),好戲才剛剛開始。

來源:雷峰網(wǎng)
反饋
聯(lián)系我們
推薦訂閱