編者按:本文來自微信公眾號 極客公園(ID:geekpark),作者:蘇子華,編輯:靖宇,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
剛剛,AI玩具公司躍然創(chuàng)新(Haivivi)宣布完成 2 億元 A 輪系列融資,中金資本旗下基金、紅杉中國、華山資本、愉悅資本、招銀國際、Brizan Ventures 等一線投資機構(gòu)共同參投。
Haivivi 在過去一年時間里,出貨量超過 20 萬臺(去除了退貨量),成為全球出貨最多的AI玩具公司。同時,他們也成為了這個賽道里,被一線投資機構(gòu)押注最多的公司。
然而,Haivivi 創(chuàng)始人李勇對極客公園坦言,實際過程并不如聽起來這么順利,Haivivi 的資金曾一度緊張到差點關(guān)門清算。
在他們的第一代產(chǎn)品 BubblePal 上市前,公司已經(jīng)在清算邊緣。最終,在產(chǎn)品設(shè)計的極限取舍當(dāng)中,銷量「意外」爆發(fā),公司起死回生。
回到 2024 年 6 月,他們將大模型引入玩具領(lǐng)域,率先推出了全球首款 AI 玩具 BubblePal。該產(chǎn)品支持角色扮演、多語言對話、AI 故事共創(chuàng)、長期記憶等一系列功能,還原了數(shù)十個經(jīng)典 IP 角色。
Haivivi第一代產(chǎn)品 BubblePal,以掛墜的形式掛在毛絨玩具上,按壓進(jìn)行對話|圖片來源:Haivivi
后來,市面上開始出現(xiàn)大量的相似產(chǎn)品。
產(chǎn)品發(fā)布后,一些科技互聯(lián)網(wǎng)從業(yè)者、投資機構(gòu)不免會質(zhì)疑 AI 玩具「硬件沒壁壘」、「為什么需要 IP」、陪伴是否為偽命題。
李勇曾是天貓精靈合伙人,主導(dǎo)了天貓精靈從 0 到 3000 萬銷量的增長。李勇覺得,很多注重「情緒價值」的AI產(chǎn)品,無法用「硬件壁壘」「技術(shù)壁壘」等傳統(tǒng)標(biāo)準(zhǔn)衡量。經(jīng)過過去一段時間的摸索,Haivivi 已經(jīng)逐漸形成了自己的 AI 玩具方法論,并即將推出旗下第二代 AI 玩具產(chǎn)品——CocoMate 系列,全球首款搭載端到端語音模型的 AI 玩具。
新產(chǎn)品采用可嵌入玩偶本體且支持拆卸的形態(tài),同時,也是支持遠(yuǎn)程喚醒,以及主題卡游戲、聊天室等多種模式。
借此契機,8 月初,極客公園在 Haivivi 北京辦公室與李勇做了一次訪談,他坦誠分享了團(tuán)隊在提供情緒價值、打造有生命感的 AI 伙伴、與頂級 IP 共創(chuàng),以及面對商業(yè)的殘酷現(xiàn)實,如何做取舍的實踐和思考。問題涵蓋了:
AI 玩具公司存活下來的關(guān)鍵是什么?
兒童與成人對 AI 陪伴的需求差異,產(chǎn)品如何在不同人群中找到切入口?
AI 玩具是否有必要會說話?
為成年人提供情緒價值的關(guān)鍵是什么?
如何賦予 AI 玩具「生命感」?
如何衡量 AI 玩具所提供的「陪伴感」和「情緒價值」?
大廠會如何入局「AI 陪伴」賽道?
AI 玩具賽道下一個增長點在哪?
訪談中提到的部分精彩觀點:
如果相信 AGI 時代會到來,就會相信未來每個人都需要一個 AI 朋友。
過去的 AI 玩具,所有輸入都來自用戶,這不符合朋友的定義;「AI 朋友」需要能夠在沒有和人類交互式時,自主學(xué)習(xí)和成長。
現(xiàn)實中的朋友不會記住你所有事情,人類大腦有遺忘機制,AI 朋友也需要學(xué)會選擇性遺忘;AI 玩具產(chǎn)品,所有功能、算法的取舍,都必須服務(wù)于「生命感」這一核心。
很多人說 AI 玩具「沒有技術(shù)壁壘」,但情緒價值本身就是壁壘。
AI 陪伴產(chǎn)品為成年人提供情緒價值的關(guān)鍵是控制預(yù)期。
有用戶表示,孩子因為佩奇的勸說而乖乖喝水,這樣的反饋比銷量更重要。
如果端側(cè) AI 玩具能實現(xiàn)無需聯(lián)網(wǎng),且零售價控制在 1000 元以內(nèi),將成為全球市場的巨大機會。
以下為對話內(nèi)容,經(jīng)極客公園編輯整理:
Haivivi 的第二代 AI 玩具產(chǎn)品——CocoMate 系列,奧特曼聯(lián)名產(chǎn)品|圖片來源:Haivivi
在差點清算的邊緣,最后一搏
極客公園:新的融資進(jìn)來,對你們意味著什么?
李勇:我們公司在產(chǎn)品上市并取得兩個月銷量之前,資金一直非常緊張——不管是我個人給公司墊錢,還是后來從銀行貸款。去年融資環(huán)境差,投資人對AI玩具賽道很謹(jǐn)慎。
對我們而言,有了這筆資金,就能推進(jìn) 2023 年就規(guī)劃的事了。Haivivi 品牌從 2023 年成立,當(dāng)時我們對 AI 玩具的規(guī)劃有很多,但受限于資金和資源,很多想法沒能落地。
今年就能從容地推進(jìn)布局了,尤其是到今年 Q4,我們的產(chǎn)品矩陣、全渠道布局以及 IP 合作布局都會比較完整。
極客公園:你之前是天貓精靈合伙人,團(tuán)隊背景也不錯,按理說融資應(yīng)該更順利?
李勇:并不是,我們公司注冊至今已經(jīng) 4 年,前兩年創(chuàng)業(yè)的時候還沒有大模型,當(dāng)時也想做 AI 玩具,只能用上一代 AI 技術(shù)和玩具做融合,所以產(chǎn)品的用戶體驗不夠好,走了些彎路。
直到 2023 年初大模型出現(xiàn),我們才確定做 BubblePal 這款產(chǎn)品。但當(dāng)時融資環(huán)境緊張,很多機構(gòu)都很謹(jǐn)慎,大家都要求有實際產(chǎn)品、驗證 PMF(Product-Market Fit)。
之所以能拿到高秉強(「中國芯片之父」香港科技大學(xué)高秉強教授)老師的投資,是因為他以個人名義給了我們第一筆錢,大概 100 萬美金,我們才有資金投入研發(fā)。
到 2024 年 8 月產(chǎn)品真正上市時,高老師的這輪天使輪的錢已經(jīng)基本花完了,研發(fā)太燒錢了。就像我剛才說的,后來我們還從銀行貸款、我個人墊錢,那段時間資金一直很緊張,發(fā)工資都困難。
極客公園:你們是第一批做AI玩具的團(tuán)隊,過去一年來,最常聽到的評價是什么?
李勇:最痛苦的是產(chǎn)品發(fā)售前后,聽到的更多是質(zhì)疑。沒人看好這個賽道:硬件從業(yè)者覺得「已做爛」,他們經(jīng)歷過故事機、兒童手表、耳機、手機的紅海時代,認(rèn)為 AI 玩具硬件方案成熟(第一代產(chǎn)品方案與當(dāng)年天貓精靈無本質(zhì)區(qū)別),無創(chuàng)新空間;AI 從業(yè)者也不看好,認(rèn)為「只是搭載大模型,不如 ChatGPT 智能,情商、智商有限」。
但我們更看重長遠(yuǎn)——如果相信 AGI 時代會到來,就會相信,未來無論孩子還是成年人,都需要有AI能力的陪伴載體。AI 能力持續(xù)提升后,人們會需要現(xiàn)實中的「AI 朋友」,形態(tài)可能是毛絨玩具、機器人等各種樣子。
因為AI的發(fā)展不僅體現(xiàn)在「智商」層面,還涉及「情商」領(lǐng)域。所以我們堅定看好這個賽道。不過當(dāng)時我們也不確定自身能否脫穎而出,公司能否堅持到行業(yè)爆發(fā)的那一天。短期來看,很多人對該領(lǐng)域持悲觀態(tài)度。
正如我剛才提到的,2023 年初公司險些清算,當(dāng)時錢已經(jīng)不夠了。我個人還有一些積蓄,當(dāng)時我們團(tuán)隊有十幾個人,我就和大家說,我可以用個人資金為大家發(fā)放 N+1 補償金——那時公司剛成立約一年。
但如果大家認(rèn)為,ChatGPT 的出現(xiàn)會給我們計劃研發(fā)的AI玩具帶來新機遇,那我們就再堅持 6 個月,看看能否成功融資。若能融到資,我們就繼續(xù)推進(jìn)項目;若融不到,屆時我可能連 N+1 補償金都無法承擔(dān)了,因為我個人的現(xiàn)金儲備也十分有限。
讓我欣慰的是,這十幾人的核心團(tuán)隊最終都選擇了堅持。團(tuán)隊成員對我們所做的事是堅信不疑的。但當(dāng)時融資確實異常艱難,和合作伙伴的合作也多是「刷臉」——因為我們沒錢讓他們幫忙制作 Demo,好在我之前在硬件領(lǐng)域深耕多年,有一些合作伙伴愿意幫忙提供 Demo 樣品。
極客公園:你們現(xiàn)在融資和之前有什么變化?
李勇:到了去年第四季度,我們的產(chǎn)品量產(chǎn),在市場上有了數(shù)據(jù)表現(xiàn)后,融資就相對容易了。投資人能看到用戶在小紅書、抖音的評論和視頻,通過訪談、盡調(diào)也能了解真實反饋,銷量也一直在漲。
而且,春節(jié)后 DeepSeek 火了,給用戶做了一波市場教育,很多寶媽由此了解 AI 玩具,甚至認(rèn)為「帶 DeepSeek 的玩具就是 AI 玩具」,我們也算趕上了這波趨勢。
不過也有一些投資人始終持懷疑態(tài)度,他們認(rèn)為我們的產(chǎn)品缺乏核心技術(shù)壁壘——畢竟當(dāng)時泡泡瑪特還沒有現(xiàn)在這么火爆。那時我們就一直在提 Jellycat 和泡泡瑪特的模式,只是大家對「情緒價值+AI」的組合仍有疑慮。
極客公園:DeepSeek 那波熱度給你們帶來了多少新增銷量?
李勇:從營銷層面看,它主要起到了用戶教育的作用??萍夹袠I(yè)內(nèi)可能沒這種感受,但普通用戶對 AI 的認(rèn)知仍有限——2017 年天貓精靈量產(chǎn)時,那波智能硬件的用戶體驗還比較勉強,包括天貓精靈、小度、小愛等智能音箱的活躍與留存率都低。
因此,我們推廣 AI 玩具時,本來需大量市場教育。而 DeepSeek 的熱度,一方面讓部分用戶建立了對 AI 的信心;另一方面,也消除了部分用戶對生成式 AI 的恐懼,比如擔(dān)心它教壞孩子,畢竟內(nèi)容可控性存疑。但 DeepSeek 已上升到國家戰(zhàn)略層面,用戶對 AI 的恐懼會因此減輕。如果僅靠我們這樣的創(chuàng)業(yè)公司去宣傳,說「用了開源技術(shù)、做了內(nèi)容審核」,力度遠(yuǎn)不如國家層面的重視。具體到銷量,今年 3 月銷量較之前增長了 2-3 倍,這也讓我們很開心。
極客公園:第一代產(chǎn)品賣了 20 多萬臺,這在預(yù)期之內(nèi)嗎?
李勇:不在。我們最初認(rèn)為能賣幾千臺,最多 1-2 萬臺。第一代產(chǎn)品做了很多取舍,并非我們最初設(shè)想的樣子,核心是為了測試 PMF、收集用戶反饋,最初備貨也只備了 2000 臺。
但實際反饋很好,我們后來反思,這可能是「知識陷阱」——我們從 2022 年底接觸大模型,到 2024 年 8 月產(chǎn)品上市,已習(xí)慣大模型的連續(xù)對話、角色扮演功能;但用戶此前從未接觸過能角色扮演、連續(xù)對話、有長期記憶的AI玩具,他們對比的仍是傳統(tǒng)故事機、小天才兒童手表、小度/小愛智能音箱。有大模型的 AI 玩具與幾年前的智能硬件相比,體驗上確實有革命性提升。
極客公園:打磨AI玩具產(chǎn)品,資金主要花在哪些方面?
李勇:最多的是研發(fā),團(tuán)隊研發(fā)成本開銷占比最大;其次是 IP 合作費用,我們已簽約不少知名 IP;此外還有渠道建設(shè)、日常運營管理的費用。
極客公園:網(wǎng)上說AI玩具退貨率高的問題,你怎么看?
李勇:前段時間我們實際銷量已超 25 萬臺,但我們對外宣傳改為 20 萬臺,我們?nèi)サ袅送素浟浚拐\地公布實際銷量。第一代產(chǎn)品早期退貨率超 30%,目前綜合退貨率仍有 20% 多。
這其實是創(chuàng)新品類的普遍現(xiàn)象。玩具品類本身存在「吃灰」問題,活躍與留存率低,且購買者(家長)與使用者(孩子)分離,這些都會導(dǎo)致退貨;此外,AI 玩具零售價普遍高于普通玩具——泡泡瑪特等品牌的盲盒、積木等產(chǎn)品,原價多在 100 元左右,而我們第一代產(chǎn)品定價 399 元,在玩具品類中偏高,這也是退貨原因之一。
當(dāng)然也有用戶體驗因素。新品牌前兩三個月退貨率會更高,呈現(xiàn)兩極分化:喜歡的用戶認(rèn)可度很高,不喜歡的用戶覺得遠(yuǎn)超預(yù)期落差,認(rèn)為宣傳夸大。
我之前做過 VR 眼鏡,AR/VR 行業(yè)(包括蘋果、Meta 的產(chǎn)品)退貨率也很高,這是新品類的兩難困境——為了營銷和市場教育,需要展示功能賣點,但用戶期望隨之升高,購買后容易因為落差退貨。
因此,我們在產(chǎn)品定義上相對克制,營銷時刻意將目標(biāo)人群限定在 3-6 歲兒童,從未宣傳任何教育功能?,F(xiàn)在有些 AI 玩具從業(yè)者宣傳「教育內(nèi)容豐富」,不用猜也知道他們的退貨率一定高。
如果宣傳「教拼音、練口語」,雖能促進(jìn)購買決策,卻容易因大模型幻覺等體驗落差退貨。
我們的 slogan 是「回應(yīng)每一個奇思妙想」,但其實很難用一句話總結(jié)第一代產(chǎn)品賣點——「陪伴」、「情緒價值」需用戶實際使用才能感知到,我們選了一條更慢的路徑。
「哪些決定忍住沒做,現(xiàn)在看來是正確的?」
極客公園:如今回過頭看,是否存在一個當(dāng)時你忍住沒做的決定,現(xiàn)在看來是正確的?
李勇:之前負(fù)責(zé)天貓精靈營銷工作時,我的老板需要向逍遙子匯報工作,做天貓精靈一年來的年終總結(jié)匯報。我看到給逍遙子的匯報模板,除了闡述年內(nèi)完成的工作復(fù)盤,還有一頁要求列出沒做的事項以及為什么沒做??吹竭@一頁時,我很震驚,它其實和你的問題本質(zhì)相同,就是取舍。
無論是創(chuàng)業(yè)者,還是團(tuán)隊管理者,我們常會復(fù)盤這段時間做了哪些決定、哪些正確、哪些錯誤,但很少思考「哪些決定沒做」——這些未做的決定中,是否存在本應(yīng)做的正確選擇,或是慶幸沒做的錯誤選擇?
去年年底團(tuán)隊復(fù)盤時,我也向團(tuán)隊提出了這個問題。我認(rèn)為這個問題極具價值,當(dāng)時我們發(fā)現(xiàn),很多未做的選擇,如今看來是正確的。
比如,最初我們本想開發(fā)一款完整的毛絨玩具,還計劃采用遠(yuǎn)廠語音交互技術(shù),這些在當(dāng)時都是成熟的技術(shù),但現(xiàn)在看來,幸虧沒做。
一方面,與 IP 方合作的監(jiān)修審核時間遠(yuǎn)超預(yù)期。以頭部 IP 奧特曼為例,最初我們預(yù)計產(chǎn)品能在 618 前上市,但與 IP 方溝通后發(fā)現(xiàn),他們對 IP 的理解更深,在共創(chuàng)產(chǎn)品過程中,IP 方提出了許多優(yōu)質(zhì)想法,這延長了合作周期。
另一方面,頂級 IP 對產(chǎn)品細(xì)節(jié)的把控細(xì)致程度遠(yuǎn)超想象——每一份營銷物料、每一張宣傳海報的發(fā)布,甚至產(chǎn)品材質(zhì)的每一處細(xì)節(jié),都需要與 IP 方深入溝通確認(rèn)。
如果創(chuàng)業(yè)初期我沒有認(rèn)清這一現(xiàn)實,即便有足夠資金推進(jìn)合作,產(chǎn)品上市周期也會被大幅拉長。對創(chuàng)業(yè)公司而言,第一代產(chǎn)品需要做大量取舍,我們在硬件功能、IP 合作等方面都做了調(diào)整。
現(xiàn)在想來,很慶幸當(dāng)時「做減法」做得足夠徹底。在產(chǎn)品定義上,我沒有過多執(zhí)念,但這種取舍思維至關(guān)重要,尤其是硬件領(lǐng)域,要避免資源浪費。比如硬件設(shè)計中的某個功能,無論會增加成本還是制造難度,核心都要判斷它能否切實提升用戶體驗,不能盲目投入。硬件領(lǐng)域的取舍比軟件領(lǐng)域更關(guān)鍵。
極客公園:除了這個例子,還有其他「沒做反而是正確選擇」的情況嗎?
李勇:除了 IP 選擇和硬件功能取舍,產(chǎn)品定義的細(xì)節(jié)上也有很多案例。比如最初我們想在產(chǎn)品中加入大量功能,當(dāng)時我對 AI 技術(shù)過于樂觀,計劃搭載端到端語音模型,還考慮過給產(chǎn)品加攝像頭、屏幕,甚至端側(cè) AI 功能。
但過度樂觀往往會忽略實際問題——當(dāng)時加屏幕、攝像頭的 Demo 已經(jīng)完成,但最終沒推進(jìn)量產(chǎn),核心是成本與用戶體驗的平衡還未達(dá)標(biāo)。所以我們調(diào)整了產(chǎn)品優(yōu)先級,目前推出的仍是純語音交互產(chǎn)品,功能也未追求復(fù)雜。
AI 玩具是否有必要會說話?
極客公園:對于AI陪伴類產(chǎn)品來說,語音對話的交互方式本身是不是就有比較高的使用門檻呢?
李勇:市面上有些 AI 玩具不具備語音功能,也有其價值,適合特定人群和特定 IP,這一點我完全認(rèn)同。
我們在創(chuàng)業(yè)初期選擇方向時,就對 AI 玩具進(jìn)行了大致分類:
第一類是「無語音交互的AI寵物」——這類產(chǎn)品模擬貓狗等寵物,本身不具備語音能力,僅通過情緒反饋與用戶互動。
第二類就是我們當(dāng)前專注的方向——將動畫片中鮮活的角色還原到現(xiàn)實生活中,陪伴孩子成長。
第三類是偏具身智能的 AI 陪伴機器人——這類產(chǎn)品具備移動能力,能實現(xiàn)更靈活的交互。
我們選擇第二類,主要是基于公司的核心稟賦:第一類產(chǎn)品與 AI 技術(shù)的關(guān)聯(lián)性較弱,而我們此前有研發(fā)天貓精靈等語音交互產(chǎn)品的經(jīng)驗,更擅長第二類產(chǎn)品的研發(fā)。而語音交互是否是「好形態(tài)」,關(guān)鍵取決于具體應(yīng)用場景和目標(biāo)人群。
未來,我們也會推出無語音功能的 AI 玩具,也是在探索不同方向。
如果玩具配備攝像頭和屏幕,無疑能提供更豐富的情緒價值——比如通過攝像頭捕捉用戶的表情,無需用戶說話就能感知其喜悅、疲憊或焦慮;通過屏幕更直觀地呈現(xiàn)內(nèi)容。
但目前我們尚未推出這類產(chǎn)品,因為我們對帶屏幕、帶攝像頭的產(chǎn)品有較高要求:如果滿分 100 分,只有當(dāng)模型能力和用戶價值能達(dá)到 80 分以上時,我們才會推進(jìn)量產(chǎn)。其實我們已有相關(guān) Demo,但尚未進(jìn)入量產(chǎn)階段,因為目前的產(chǎn)品表現(xiàn)還未達(dá)到我們的標(biāo)準(zhǔn)。
極客公園:你們在等待大模型能力達(dá)到預(yù)期后,再推出相應(yīng)的產(chǎn)品。
李勇:是的,不僅是大模型能力,我們還在開展端側(cè) AI、多模態(tài)以及運動控制的相關(guān)預(yù)研。一方面等待基座模型公司提升技術(shù)能力,另一方面也在與大模型公司、芯片公司等合作伙伴共同開展預(yù)研。
只有當(dāng)產(chǎn)品的用戶體驗、成本控制和零售價能達(dá)到平衡時,我們才會推出。
極客公園:哪些 IP 適合接入語音交互功能,哪些不適合?
李勇:判斷標(biāo)準(zhǔn)其實比較明確,如果 IP 在原有作品(如動畫片)中已具備完整世界觀和鮮明的聲音形象,那么從用戶視角(尤其是兒童)出發(fā),現(xiàn)實中的對應(yīng)玩具若無法說話,反而不符合認(rèn)知邏輯。
過去受技術(shù)限制或成本較高,玩具難以實現(xiàn)自然語音交互,如今借助大模型技術(shù),這一問題得以解決,本質(zhì)上是回歸用戶對 IP 的自然認(rèn)知。
讓 AI 成為成年人的朋友、更有「生命感」的三個關(guān)鍵
極客公園:你之前提過,大模型為成年人提供的情緒價值還不夠,所以你們當(dāng)時選擇先做兒童產(chǎn)品。那么,怎么衡量一項技術(shù)或產(chǎn)品能提供的情緒價值有多少?
李勇:相較于為成年人研發(fā) AI 玩具,為兒童研發(fā)玩具恰好是我們團(tuán)隊的優(yōu)勢領(lǐng)域。我們有服務(wù)兒童群體的經(jīng)驗,且關(guān)于兒童成長的理論研究和學(xué)術(shù)論文非常豐富,因此,我們先從兒童產(chǎn)品入手。
兒童沒有手機作為對比參照物,而成年人在使用 AI 硬件時,會不自覺地與手機功能對比——這是很多 AI 硬件產(chǎn)品都會面臨的問題。
而且,給成年人提供情緒價值要復(fù)雜得多,需要考慮他們的工作、感情等多方面生活狀態(tài)。在 2023 年我們啟動項目時,以當(dāng)時的 AI 能力,很難滿足成年人的情緒需求——因為成年人有太多其他渠道可以獲取情緒價值,AI 硬件的競爭力不足。
我們?yōu)槭裁凑J(rèn)為現(xiàn)在情況有所好轉(zhuǎn)了呢?
一個關(guān)鍵節(jié)點是「深度思考模型」的出現(xiàn)。我第一次接觸到深度思考模型時,非常震驚——我們完全沒預(yù)料到大模型會向這個方向發(fā)展。
最初行業(yè)普遍認(rèn)為大模型的發(fā)展方向是「智商」不斷提升、響應(yīng)速度不斷加快。但深度思考模型的出現(xiàn),我很快反應(yīng)過來,人既需要快思考,也需要慢思考。對個體而言,大腦本就是兩套系統(tǒng)交織運作。我們因研發(fā)語音交互類產(chǎn)品,過度關(guān)注延遲表現(xiàn)——比如用戶與產(chǎn)品對話時,希望快速獲得反饋,所以這類指標(biāo)一度成了我們公司最核心的考核項。
天貓精靈此前也是如此,優(yōu)先關(guān)注延遲,其次才是基座模型的能力、與情商表現(xiàn)。我們忽略了慢思考這一維度,而當(dāng)意識到深度思考模型的價值時,我們格外興奮——終于有可能為成年人打造一款具備新價值的 AI 玩具。
過去的 AI 玩具,所有輸入都來自用戶,這不符合朋友的定義,也導(dǎo)致用戶留存率與活躍度偏低。
即便是孩子,使用久了也能發(fā)現(xiàn)「玩具只會對我輸入的內(nèi)容做即時反應(yīng),而不會自己反思」這一問題。所以 2023 年我們就思考:如果這個「朋友」能自主學(xué)習(xí)、成長就好了,但與用戶交互時又必須即時反饋,這就產(chǎn)生了矛盾。
而有了深度思考能力后,我們可以為 AI 玩具搭載 Agent(智能體):比如在夜間閑置時,Agent 自動啟動學(xué)習(xí)。若用戶當(dāng)天聊到滑雪,它就自主學(xué)習(xí)滑雪相關(guān)知識;第二天用戶提及想去日本游玩,它就收集日本旅游信息;到了第三天,當(dāng)用戶說「想去日本滑雪」,它能立刻回應(yīng):「我聽說這周日本可能有臺風(fēng),你要小心,是不是下周去更合適?」
如果沒有具備深度學(xué)習(xí)與思考能力的模型,Agent 根本無法實現(xiàn)靜默的自我反思、成長,用戶永遠(yuǎn)不會將其視為朋友。
當(dāng)然,這只是第一步——朋友在非交互時段自主學(xué)習(xí)成長,是「朋友」屬性的基礎(chǔ)門檻。
除了模型能力的提升,為成年人提供情緒價值還需「做減法」。
在我們看來,若想讓成年人情緒價值體驗達(dá)到優(yōu)秀甚至超預(yù)期,必須降低用戶預(yù)期——交互時先鎖定、框定用戶的期望,期望越低,模型越容易超出預(yù)期。
用戶看到這個 IP 形象,就應(yīng)該知道它的核心功能是哪些,不會將其視為全能助手,而是「有限領(lǐng)域的朋友」。
現(xiàn)實中也是如此:如果有一個無所不能的朋友,你不會將其視為平等的朋友,更像「上帝」或「神」;真正的朋友必然有突出的長板,能讓你產(chǎn)生情感投射,這樣感情才會穩(wěn)固,絕非全能。
因此,我們在角色設(shè)定、產(chǎn)品外形、IP 選擇及模型能力上都在「做減法」,通過這些洞察與研究,至少能在成年人某一特定情緒需求領(lǐng)域,輸出有效的情緒價值。
極客公園:讓 AI 更有生命感的關(guān)鍵還有什么?
李勇:首先,它需要在非交互時段自主學(xué)習(xí)、成長,通過分析與用戶的聊天內(nèi)容,推測興趣愛好,積累共同話題——這是基礎(chǔ)步驟。
其次,還有價值觀對齊。現(xiàn)實中,相處 10 年的朋友,價值觀會逐漸靠攏,否則會漸行漸遠(yuǎn)。
我們希望 AI 朋友也能如此,比如同一型號的賽羅 IP 玩具,出廠時 Prompt 一致,但使用一兩年后,Prompt 會隨用戶興趣差異發(fā)生變化、自主學(xué)習(xí),實現(xiàn)價值觀對齊。
此外,更復(fù)雜的是「遺忘機制」。第一代產(chǎn)品的核心難題是「長期記憶」——如何存儲聊天記錄,當(dāng)時向量數(shù)據(jù)庫技術(shù)不成熟,我們投入大量精力研發(fā)向量數(shù)據(jù)庫、RAG(檢索增強生成)等技術(shù)。
而如今為成年人提供情緒價值,「遺忘」同樣關(guān)鍵:現(xiàn)實中的朋友不會記住你所有事情,人類記憶有主動遺忘與被動遺忘——被動遺忘是因時間流逝自然淡忘,主動遺忘是刻意忽略某些內(nèi)容。
比如,若 AI 能記住用戶每句話,當(dāng)用戶否認(rèn)「說過某件事」時,AI 若反駁「你在幾點幾分說過,我有記錄」,會讓用戶極度反感。
參考心理學(xué)理論,比如「彼得斯原則(Peter's Principle)」,認(rèn)為主動遺忘與三個因素相關(guān):時間長短、提及頻率、記憶當(dāng)時的情感濃度——情感濃度如同「染色劑」,決定記憶是否深刻。我們當(dāng)前用模型識別對話的情感濃度,作為遺忘權(quán)重,但這仍不夠。
若僅按「情感濃度+提及頻率」設(shè)計遺忘算法,若用戶頻繁吐槽負(fù)面內(nèi)容,AI 會持續(xù)提取負(fù)面記憶并回復(fù),導(dǎo)致用戶陷入負(fù)面循環(huán)。
因此,研究傳統(tǒng)遺忘理論(我們查閱了大量相關(guān)論文)仍然不夠,還需研發(fā)「跳出機制」:讓 AI 主動喚起用戶的積極記憶,幫助用戶脫離負(fù)面情緒。這就是我們近一年在算法層面,為成年人 AI 玩具打造「生命感」的探索方向。
先共情,站在用戶角度表達(dá)理解——才是情緒價值產(chǎn)品的核心
極客公園:在近期產(chǎn)品開發(fā)中,有沒有某個時刻或某組數(shù)據(jù)(哪怕很?。屇銈冇X得「方向走對了」?
李勇:很多是來自用戶反饋的瞬間。
比如,有用戶分享短視頻:孩子生病后不愛喝水,家長勸說無效,于是在我們的玩具中輸入「鼓勵多喝水」的 Prompt。當(dāng)孩子與佩奇玩具互動時,佩奇說「我們一起玩,但你要先喝完水」,孩子立刻就把水喝了。
還有一次,在我們抖音直播間,有用戶讓主播演示:「問 AI『媽媽不要我了,怎么辦』」,AI 玩具回答:「媽媽不是不要你,她可能是上班忙,回來后你多和她聊聊,多安慰她」,接著用戶又讓我們主播問 AI 玩具:「媽媽不是上班忙,是跟別的男人走了,不要我了」,AI 回復(fù):「首先你沒做錯任何事,大人們有自己的考量,即使爸爸媽媽不在一起,他們依然愛你」。
沒想到這位用戶說,她是一個繼母,因為孩子常問她「為什么親媽不要她了」,她不知道怎么回答,AI 玩具的回復(fù)正好解決了她的困擾。類似的用戶反饋,讓我們確信「方向走對了」。
極客公園:同樣的問題,如果直接問 DeepSeek 等通用大模型,可能會得到不同答案。
李勇:通用大模型的回答往往更「標(biāo)準(zhǔn)化」。
比如用戶問「在學(xué)校被欺負(fù)了怎么辦」,通用大模型可能會說「找學(xué)校管理層溝通」,這類回答追求「最大公約數(shù)」——因其用戶群體廣泛,需兼顧普遍性。
如果用「回答內(nèi)容(主觀/客觀)」與「表達(dá)方式(冷靜/情緒化)」構(gòu)建坐標(biāo)系,多數(shù)通用大模型的回復(fù)處于「客觀+冷靜」的第一象限。
而情緒價值類產(chǎn)品的回復(fù),需在「內(nèi)容上更主觀、表達(dá)上更情緒化」。比如,用戶說「玩具在學(xué)校被搶了」,朋友不會先羅列「1234 條解決方案」,而是先共情,站在用戶角度表達(dá)理解——這才是情緒價值產(chǎn)品的核心。
極客公園:如何讓模型回答更具共情力?
李勇:我們在語料選擇和模型微調(diào)上有差異。比如與 IP 方合作時,需依據(jù) IP 世界觀對模型進(jìn)行微調(diào)。我們的模型微調(diào)采用大量對話式語料,表現(xiàn)更具主觀性和情緒化,能基于角色世界觀作答。
比如,向小豬佩奇與愛莎公主提問「量子糾纏」的問題,得到的答案不同——AI 玩具不會照搬百科內(nèi)容,而是結(jié)合自身角色設(shè)定回應(yīng)。
佩奇會舉例:「就像我和弟弟喬治玩捉迷藏,雖然看不見對方,但我們彼此心有靈犀?!?/p>
愛莎公主則會以自身角色視角解釋:「這很神奇,如同我在魔法世界里有兩個冰雪魔法球,轉(zhuǎn)動其中一個,另一個的狀態(tài)就會受到影響?!?/p>
所有角色均會依據(jù)自身世界觀回答,讓用戶感覺是與自己喜歡的朋友共同面對問題。
關(guān)于新一代 AI 玩具和大廠競爭
極客公園:你們剛發(fā)布了新一代 AI 玩具,為什么選擇與奧特曼 IP 合作呢?
李勇:我們已經(jīng)簽約了多家 IP 方,綜合考慮了其全球影響力、在中國市場的受歡迎程度,以及雙方合作的意愿和配合程度——這些因素讓奧特曼成為了推進(jìn)速度最快的合作項目,所以我們首款產(chǎn)品選擇與奧特曼 IP 合作發(fā)售。
極客公園:這款產(chǎn)品的目標(biāo)人群還是 3-6 歲的兒童嗎?
李勇:目標(biāo)人群稍有擴(kuò)充,因為很多小學(xué)生也非常喜歡奧特曼,所以年齡范圍可能擴(kuò)展到 10 歲,甚至 12 歲。
極客公園:軟件功能層面,新產(chǎn)品會增加哪些能力?
李勇:新增功能很多,最顯著的是采用了端到端語音模型。
第一代產(chǎn)品采用的仍是傳統(tǒng)的「語音識別(ASR)到語音合成(TTS)」技術(shù)鏈路,而新產(chǎn)品采用的是「語音到語音」模型,實現(xiàn)了語音輸入直接對應(yīng)語音輸出。首款合作的是字節(jié)跳動的模型,目前其表現(xiàn)最佳、響應(yīng)速度最快。
當(dāng)然,與其他公司的合作也在推進(jìn)中。簡單來說,新產(chǎn)品的語音輸入能保留情緒——傳統(tǒng)的「語音轉(zhuǎn)文字」過程中,情緒信息會丟失,而新模型解決了這一問題。情緒信息的保留能讓我們實現(xiàn)更多功能,比如當(dāng)我說「今天心情不好」時,產(chǎn)品能更準(zhǔn)確識別用戶的情緒,因此回應(yīng)語氣能傳遞出更準(zhǔn)確、更充沛的情感。其次,新產(chǎn)品的交互延遲也大幅降低。
極客公園:你們第一代產(chǎn)品仍需要按下按鍵才能進(jìn)行語音交互,而第二代新產(chǎn)品已經(jīng)支持遠(yuǎn)程喚醒了,主要是克服了哪些技術(shù)問題?
李勇:這并不是技術(shù)問題,更多是產(chǎn)品設(shè)計上的取舍。
在研發(fā)第一代產(chǎn)品時,我們就已預(yù)判到兩個可能成為核心問題的點,后來的市場反饋也證明,這兩點確實是用戶對第一代產(chǎn)品的主要差評——一個問題是「按鍵說話」:有些孩子手比較小,按壓說話時會感到不便;第二個問題是聯(lián)網(wǎng)限制,第一代產(chǎn)品僅支持 2.4GHz 單頻 WiFi 聯(lián)網(wǎng),這導(dǎo)致產(chǎn)品在戶外很難使用。
這兩個差評其實是我們在定義第一代產(chǎn)品時就已經(jīng)預(yù)料到的「不得已的取舍」。
2017 年,我參與研發(fā)的首款量產(chǎn)天貓精靈就已實現(xiàn)遠(yuǎn)程交互,所以遠(yuǎn)程喚醒本身并非技術(shù)難題。但要實現(xiàn)遠(yuǎn)程喚醒,對硬件配置有更高要求——比如麥克風(fēng)數(shù)量,尤其對功耗控制的要求更為嚴(yán)格。天貓精靈是插電使用的設(shè)備,無需考慮功耗問題;但我們的產(chǎn)品體積較小,如果為了容納更大電池而增大體積,會帶來新的問題:一是無法適配多數(shù)玩偶的尺寸,二是孩子也難以握持。
同時,我們對產(chǎn)品續(xù)航有明確要求——不希望用戶每天充電,不希望給用戶增加額外使用負(fù)擔(dān),因此在第一代產(chǎn)品中沒有加入遠(yuǎn)程喚醒功能。
而 WiFi 問題同理:若要支持雙頻 WiFi 或內(nèi)置 4G SIM 卡,會大幅增加成本和研發(fā)周期。當(dāng)時公司賬戶已經(jīng)沒錢了,我們甚至需要借錢維持運營,根本無法承擔(dān)這些額外投入。
不過第二代產(chǎn)品已解決這些問題:我們內(nèi)置了一張 4G SIM 卡,用戶開機即可使用,無需下載 APP 配置網(wǎng)絡(luò),開機直接就能與奧特曼聊天。
極客公園:有什么新功能是只依賴大模型沒有辦法解決的?
李勇:目前市面上幾乎所有 AI 玩具的連續(xù)對話功能都存在一個共性問題:當(dāng)孩子正在聽故事或聽歌時,外界稍有聲音干擾,播放就會被打斷。比如,孩子正聽到故事關(guān)鍵處,媽媽突然說「過來吃飯了」,或者出現(xiàn)走路聲等,都會導(dǎo)致播放中斷。
如果只是簡單對接一個通用大模型,就只能接受這種中斷問題。
所以,我們在新版本的技術(shù)架構(gòu)上做了「多音軌混音處理」,這在工程實現(xiàn)上較為復(fù)雜。簡單來說,希望實現(xiàn)的效果是:當(dāng)孩子正在聽「孫悟空三打白骨精」的故事,過程中突然提問「唐僧這時候在哪里?」——此時,我們產(chǎn)品會降低故事音軌的音量,開啟另一條音軌優(yōu)先回答孩子的問題,故事本身不會中斷;待問題回答完畢后,再將故事音軌的音量恢復(fù)。
想實現(xiàn)這一功能,必須支持多音軌傳輸,而單純使用云廠商提供的標(biāo)準(zhǔn)大模型方案是無法做到的,需要進(jìn)行大量工程優(yōu)化。
其實,「連續(xù)對話+抗干擾」的功能構(gòu)想,我們在 2023 年研發(fā)第一代產(chǎn)品時就已想到,只是當(dāng)時考慮綜合交互體驗、成本和研發(fā)周期,只能退而求其次采用「按鍵說話」模式。這就是產(chǎn)品功能迭代中常見的取舍。
極客公園:未來新品仍舊是毛絨玩具,還是會推出非毛絨玩具類產(chǎn)品?
李勇:我們會推出非毛絨玩具。公司定位是 AI 玩具公司,業(yè)務(wù)不局限于兒童領(lǐng)域,也不被毛絨材質(zhì)束縛。
比如,我們簽約的知名 IP 授權(quán)均屬于 AI 玩具類目,對玩具材質(zhì)和形態(tài)無限制,只要適合以 AI 形式呈現(xiàn)且能提供情緒陪伴價值,都在我們的考慮范圍內(nèi)。
IP 布局采取「兩條腿走路」:一方面通過與知名 IP 聯(lián)名彌補自身短板,并向泡泡瑪特等優(yōu)秀 IP 團(tuán)隊學(xué)習(xí);另一方面自主孵化 IP,我們新上市的三款產(chǎn)品中,兩款為奧特曼 IP,一款由我們簽約的全職設(shè)計師(原合作藝術(shù)家)設(shè)計開發(fā)。
CocoMate 系列 AI 玩具之一「泡泡」|圖片來源:Haivivi
極客公園:有觀點認(rèn)為大廠不會涉足 AI 陪伴賽道,因它屬于情緒價值生意,但近期 OpenAI 也在布局 AI 陪伴硬件,你如何看待大廠進(jìn)入該領(lǐng)域?
李勇:我認(rèn)為大廠可能會布局廣義上的 AI 陪伴硬件(如家庭機器人,可陪伴家庭成員),但不會涉足「AI+IP」玩具領(lǐng)域。
原因有二:一是大廠有更重要的戰(zhàn)略級、入口級業(yè)務(wù)布局,如 AI 眼鏡、自動駕駛等更大規(guī)模的市場,相比之下,「AI+IP」玩具的優(yōu)先級較低;二是情緒價值賽道不確定性高,難以規(guī)?;瘡?fù)制。
大廠擅長從 1 到 100,但情緒價值相關(guān)指標(biāo)(如玩具的「生命感」)難以量化,若調(diào)動集團(tuán)資源投入,KPI、成果考核等都很難設(shè)定,最多僅會安排小團(tuán)隊試錯。
而小團(tuán)隊試錯對我們構(gòu)不成威脅,我們更關(guān)注大廠是否會投入戰(zhàn)略資源。IP 本身的爆火具有隨機性,即使是泡泡瑪特、迪士尼,也無法精準(zhǔn)預(yù)測或流水線式復(fù)制爆款 IP,這種高不確定性使「AI+IP」玩具不適合大廠布局。
極客公園:接下來半年,你最期待發(fā)生的一件事是什么?
李勇:最期待端側(cè)模型的技術(shù)突破。
我們一直在探索:如果端側(cè) AI 玩具能實現(xiàn)無需聯(lián)網(wǎng),且零售價控制在 1000 元人民幣以內(nèi),將具有極大市場潛力,尤其在海外市場——無需聯(lián)網(wǎng)可解決隱私和延遲問題。
目前受成本限制(內(nèi)存、CPU、電池功耗較高),這一目標(biāo)尚未實現(xiàn)。如果未來半年至一年內(nèi),能有優(yōu)秀模型量化至 1.5B 參數(shù),同時保證足夠的智商、情商與推理能力,至少滿足兒童陪伴需求,我們將非常期待。
另外,對于有隱私需求的成年人而言,端側(cè) AI 玩具如同「樹洞」,可以讓用戶更安心地分享情緒。
我們也希望成為全球首個推出端側(cè) AI 玩具的團(tuán)隊。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。