五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

AI播客工具2年超百萬(wàn)用戶,吳恩達(dá)投了3輪

?能發(fā)出與你幾乎一模一樣的聲音,拿下千萬(wàn)美元融資

圖片

作者丨臨風(fēng)

編輯丨海腰

圖源丨圖蟲(chóng)創(chuàng)意

播客創(chuàng)作者逐年增多。

據(jù)Spotify,2023年僅其一個(gè)平臺(tái)上就有超500萬(wàn)個(gè)播客節(jié)目,活躍的播客總數(shù)在300萬(wàn)-400萬(wàn)之間,涵蓋各種類型。其中,有不少是由文轉(zhuǎn)語(yǔ)音的AI完成的播客,聲音沒(méi)有Siri或小愛(ài)同學(xué)的人工機(jī)械味兒,有時(shí)甚至能“以假亂真”。

如今,亞美尼亞公司Podcastle亮了亮招牌技能,它能讓用戶克隆自己的聲音做成語(yǔ)音“皮膚”。而且,該平臺(tái)內(nèi)還有30余款A(yù)I語(yǔ)音“皮膚”可供用戶選擇,包含多種語(yǔ)言(含方言)。

Podcastle成立于2020年,它為播客創(chuàng)作者搭建AI工具平臺(tái),集成了語(yǔ)音克隆工具Revoic,降噪工具M(jìn)agic Dust AI和團(tuán)隊(duì)協(xié)作功能,首先在美國(guó)打開(kāi)市場(chǎng)完成用戶積累。

圖片(圖源:Podcastle)

Podcastle在公告中稱,他們迎合了播客創(chuàng)作者、個(gè)體商戶、營(yíng)銷(xiāo)員和教育工作者的內(nèi)容創(chuàng)作需求,創(chuàng)作者社區(qū)用戶增長(zhǎng)迅速,從2021年的15萬(wàn)人增長(zhǎng)至超100萬(wàn)。

創(chuàng)始人Arto Yeritsyan是亞美尼亞企業(yè)家,畢業(yè)于埃里溫國(guó)立工程大學(xué),畢業(yè)于斯坦福商學(xué)院。他曾是PicsArt的工程副總裁和Be2的技術(shù)主管。當(dāng)前,其領(lǐng)導(dǎo)團(tuán)隊(duì)主要來(lái)自Canva、Prezi、Uber和Facebook。

今年2月,他們最新一輪A輪融資1350萬(wàn)美元,由Mosaic Ventures領(lǐng)投,RTP、P9、Sierra、吳恩達(dá)的 AI Fund以及 Squarespace和Moonbug Media的首席執(zhí)行官參投,其中Sierra、AI Fund連投3輪。

圖片

創(chuàng)建自己的語(yǔ)音“皮膚”

Podcast Host調(diào)研了2500名播客創(chuàng)作者,有32%的人表示播客的編輯和制作是最大的擔(dān)憂。

Podcastle公司CEO Arto Yeritsyan在SpeechTech發(fā)表觀點(diǎn),播客有兩項(xiàng)重大技術(shù)的飛躍,一是文轉(zhuǎn)語(yǔ)音技術(shù)讓創(chuàng)作者無(wú)需說(shuō)話即可制作音頻,二是創(chuàng)建自己的克隆聲音免去重復(fù)錄制。而這兩點(diǎn),都可以靠人工智能工具實(shí)現(xiàn),達(dá)成更高效率的創(chuàng)作。

借此技術(shù)趨勢(shì),Podcastle從一個(gè)擴(kuò)展程序,在2022年進(jìn)軍視頻播客領(lǐng)域,目前發(fā)展為AI套件工具的平臺(tái)。用戶在平臺(tái)內(nèi)可完成錄制、音頻編輯的全流程。該平臺(tái)專注于長(zhǎng)篇內(nèi)容創(chuàng)作,并通過(guò)提供實(shí)時(shí)協(xié)作和人工智能功能來(lái)區(qū)別于競(jìng)爭(zhēng)對(duì)手。

圖片

(圖源:Podcastle)

它集成了語(yǔ)音克隆、降噪、文轉(zhuǎn)語(yǔ)音TTS等工具,都需付費(fèi)。其中降噪增強(qiáng)功能Magic Dust AI被測(cè)評(píng)博主推薦多次,該功能稱可“一鍵”消除背景噪音、均衡音頻電流,將低質(zhì)錄音轉(zhuǎn)換到錄音室級(jí)別。

從示例音頻效果來(lái)看,其將原設(shè)備錄制中存在的風(fēng)聲、電流聲清除,留下人聲后增加了音質(zhì)。

另一項(xiàng)功能Revoic,人工智能生成聲音。用戶可以克隆自己聲音的數(shù)字副本。用戶需要錄制70個(gè)自己閱讀的句子提交語(yǔ)音樣本,啟動(dòng)Revoice后24小時(shí)內(nèi)可獲得模仿真實(shí)聲音的語(yǔ)音模板。

人工智能分析已錄制的語(yǔ)音樣本,學(xué)習(xí)人類的語(yǔ)調(diào)、口音和細(xì)節(jié)創(chuàng)建數(shù)字副本。它就像一個(gè)語(yǔ)音“皮膚”一樣,克隆后便能應(yīng)用在各種場(chǎng)景之中。

Arto認(rèn)為,Revoic意味著播客創(chuàng)作者們可以更少地依賴棚內(nèi)環(huán)境和專業(yè)錄音設(shè)備獲得高質(zhì)量效果。

The Verge作者David Pierce使用了The Office的《Dwight's Perfect Crime》的片段文本,并將用他自己的聲音在Podcastle克隆了AI語(yǔ)音,比較了幾個(gè)語(yǔ)音平臺(tái)的生成效果。

從效果來(lái)看,ElevenLabs的生成效果最真實(shí),帶有語(yǔ)音主人的個(gè)人情緒,其次是Podcastle,接近人類真實(shí)聲音,感情表達(dá)稍弱。

博主Feisworld測(cè)試了Revoic,人類原聲和AI語(yǔ)音模板能聽(tīng)出明顯區(qū)別,AI版的聲音音色接近原音、吐詞清楚,但稍顯機(jī)械化,更像在逐字逐句閱讀原文,人類原聲則有語(yǔ)調(diào)起伏、鏗鏘有力。

Fei表示,“我不會(huì)將AI語(yǔ)音視為要替代我的工具,但我認(rèn)為這在其他任務(wù)上是有益的,如閱讀較難的科學(xué)或哲學(xué)文章,以及廣告語(yǔ)。”她也指出問(wèn)題,“如果是AI生成的語(yǔ)音,能改變語(yǔ)調(diào)將會(huì)是很棒的,但目前(2023年)我沒(méi)在Podcastle看到改變語(yǔ)氣的選項(xiàng)/方法?!?/p>

Podcastle語(yǔ)音克隆Revoic的確有適應(yīng)的場(chǎng)景,當(dāng)播客創(chuàng)作者制作長(zhǎng)視頻/音頻需要錄制大量旁白、畫(huà)外音及特殊語(yǔ)言/方言,就可以適當(dāng)使用這項(xiàng)功能。

除這兩項(xiàng)功能外,Podcastle與多數(shù)AI平臺(tái)一樣,有處理音頻的基礎(chǔ)功能,包括語(yǔ)音轉(zhuǎn)錄文本、TTS文本轉(zhuǎn)語(yǔ)音、AI靜音消除(自動(dòng)刪除較長(zhǎng)停頓)、廢話檢測(cè)(自動(dòng)刪除“嗯”、“你知道”等詞匯)。

平臺(tái)內(nèi)有30種TTS模板音色(語(yǔ)音皮膚)可選擇,也包含7000首免版權(quán)音樂(lè)供創(chuàng)作者使用。用戶可以輸入文字制作單人播客,也可以按段落選擇適配的皮膚,來(lái)模擬多人場(chǎng)景。

圖片

(來(lái)源:Podcastle)

平臺(tái)啟用云錄制,如果是遠(yuǎn)程播客內(nèi)容遇到斷網(wǎng)情況,也可即時(shí)保存內(nèi)容。同時(shí),涉及多人播客時(shí),可使用Podcastle的團(tuán)隊(duì)協(xié)作實(shí)時(shí)編輯。

當(dāng)前,不止Podcastle一家在用AI賦能播客。Riverside主打快速音頻剪輯,Descript集成的SquadCast提質(zhì)提效,Listener.Fm用人工智能做節(jié)目注釋、標(biāo)題和說(shuō)明。Reddit用戶使用了系列AI播客工具后評(píng)價(jià),Podcastle界面最簡(jiǎn)單,平臺(tái)和錯(cuò)誤率相較低些,加之其訂閱價(jià)格較為親切,11.99美元/月(Descript12美元/月),吸引不少創(chuàng)作者試用。

圖片

(圖源:Podcastle)

到2023年底,Podcastle表示平臺(tái)內(nèi)已有超過(guò)1200萬(wàn)個(gè)播客劇集和內(nèi)容。

2年增長(zhǎng)至百萬(wàn)用戶

Podcastle良好的產(chǎn)品運(yùn)營(yíng)、用戶增長(zhǎng)與創(chuàng)始人兼CEO Arto Yeritsyan有關(guān)。前同事Tammy評(píng)價(jià):“他具備成為一位成功企業(yè)家必須的條件,技術(shù)、產(chǎn)品知識(shí)、人際交往和商業(yè)頭腦?!?/p>

他的確技能滿滿。Arto領(lǐng)英列出的技能有50項(xiàng),涵蓋軟件、編程、執(zhí)行管理等方方面面,在2020年被Hive Ventures評(píng)為30under30亞美尼亞科技人才。

圖片(圖源:Arto Yeritsyan領(lǐng)英)

Arto出生在亞美尼亞的首都、經(jīng)濟(jì)中心埃里溫,畢業(yè)于亞美尼亞國(guó)立工程大學(xué),又去斯坦福大學(xué)商學(xué)院進(jìn)修了1年。畢業(yè)后Arto在亞美尼亞排名靠前的科技公司Be2擔(dān)任工程師,2年時(shí)間就成了技術(shù)主管。

那時(shí)作為打工人,Arto堅(jiān)信,“如果我表現(xiàn)得最好,我就會(huì)得到認(rèn)可?!鼻巴略谕扑]信里給Arto貼好了標(biāo)簽:“頭腦清晰”、“認(rèn)知明確”。后來(lái),他抓住機(jī)會(huì)進(jìn)了亞美尼亞最大的獨(dú)角獸公司PicsArt干了七八年,從產(chǎn)品開(kāi)發(fā)總監(jiān)一路晉升到工程副總裁,成為管理300人工程團(tuán)隊(duì)的關(guān)鍵人物。Arto在離開(kāi)后還為PicsArt當(dāng)了2年顧問(wèn)。

到了2020年前后,很多創(chuàng)業(yè)者開(kāi)始對(duì)人工智能感興趣,Arto也一樣。他在上學(xué)的時(shí)候有閱讀障礙,許多知識(shí)需要靠聽(tīng)覺(jué)吸收。在他看來(lái),音頻是最簡(jiǎn)單、最直接的溝通方式。

而播客是音頻形式呈現(xiàn)的深度訪談,又不同于單向知識(shí)灌輸?shù)闹v課,它以聊天互動(dòng)輸出深度觀點(diǎn)和獨(dú)到拆解。

所以,在PicsArt工作期間,他萌生了做播客工具的想法。他是公司高管,每天忙得似陀螺,設(shè)想過(guò)用一個(gè)簡(jiǎn)單的插件用播客的形式給他消化文章、博客。同年6月,他和朋友們創(chuàng)立Podcastle摸索著創(chuàng)業(yè)。

在去PicsArt之前,他也作為Coding Records的聯(lián)合創(chuàng)始人開(kāi)過(guò)公司。從打工人到管理者,Arto在職業(yè)生涯里逐漸積累了識(shí)人、用人的經(jīng)驗(yàn)。因此,他為后來(lái)Podcastle招募了3位志同道合的創(chuàng)始成員。Polixis原首席軟件開(kāi)發(fā)工程師Aram,從博物館營(yíng)銷(xiāo)員成為WIC董事的Arsen,Webb Fontaine產(chǎn)品老將Vardan。

圖片

(圖源:Arto Yeritsyan領(lǐng)英,依次為Arsen、Arsen、Vardan、Aram)

不過(guò),他們四人之前都未深入了解過(guò)播客,所以他們一開(kāi)始就踩了個(gè)坑。起初,Podcastle主打文本轉(zhuǎn)音頻的功能,如Arto當(dāng)初設(shè)想的推出Chrome擴(kuò)展程序,幾秒鐘將任何文章轉(zhuǎn)為播客,獲得了第一批用戶,但卻很難再邁出下一步吸引專業(yè)播客人士。

“我們只考慮到了語(yǔ)音內(nèi)容的消費(fèi),沒(méi)有考慮到播客創(chuàng)作者的需求?!?022年,Arto決定關(guān)停插件,惡補(bǔ)了播客內(nèi)容創(chuàng)建和編輯的帖子后,投入全部資源發(fā)展數(shù)字創(chuàng)作和音頻增強(qiáng),研發(fā)創(chuàng)作者的編輯和轉(zhuǎn)錄套件工具。這時(shí)他們的目標(biāo)才真正定下來(lái),要打造一體化平臺(tái),讓初學(xué)者和專業(yè)人士在AI的幫助下簡(jiǎn)單獲得高品質(zhì)音頻。

圖片(圖源:Podcastle)

他們調(diào)整了產(chǎn)品設(shè)計(jì),開(kāi)發(fā)音頻編輯功能,例如多軌錄音、自動(dòng)均衡、聲音動(dòng)態(tài)淡入/淡出。用戶可在平臺(tái)內(nèi)錄制至多10人參與的個(gè)人或群組播客,并在2023年9月推出了實(shí)時(shí)播客協(xié)作功能。

除了滿足專業(yè)人群對(duì)音質(zhì)的剛需,Arto的目標(biāo)受眾也包括無(wú)經(jīng)驗(yàn)的業(yè)余播客人?!懊總€(gè)人心里都有故事,但他們沒(méi)有專業(yè)化設(shè)備,不知道怎么讀出來(lái),以及如何保留聽(tīng)眾。但任何人都應(yīng)該有自信、有能力發(fā)出自己的聲音。”

要解決這一問(wèn)題,Arto就讓播客從消費(fèi)到創(chuàng)作、全鏈條自動(dòng)化起來(lái),連發(fā)聲這一環(huán)節(jié)都給包攬了。他透露,給用戶提供豐富的“聲音皮膚”,是Podcastle實(shí)現(xiàn)盈利的策略之一。Podcastle的文轉(zhuǎn)語(yǔ)音除了系統(tǒng)提供30多種的固定聲線,后又開(kāi)發(fā)了Revoice與額外的聲線提供付費(fèi)訂閱。并且,Podcastle的官網(wǎng)博客中集合了大量播客經(jīng)驗(yàn)貼,推薦工具貼以及案例分享。

為真正做到“一條龍服務(wù)”,Podcastle的托管平臺(tái)為創(chuàng)作者用戶提供播客RSS源,確保用戶維持聽(tīng)眾粘性。對(duì)訂閱用戶而言,他們可以每月錄制20小時(shí)4k視頻播客,平臺(tái)可做簡(jiǎn)單的背景模糊處理。

Podcastle在2021年底積累下約20萬(wàn)用戶,經(jīng)過(guò)2022年產(chǎn)品調(diào)整后,迎來(lái)快速的用戶增長(zhǎng),到2023年底其社區(qū)中已有超100萬(wàn)用戶。

戰(zhàn)爭(zhēng)背景下融資起步

亞美尼亞的流媒體環(huán)境不佳,人們很少談?wù)撋鐣?huì)問(wèn)題,或是用英語(yǔ)做公開(kāi)評(píng)價(jià)。

Arto選擇在美國(guó)推出Podcastle。他發(fā)現(xiàn),美國(guó)的青年群體獲取資訊的方式不局限于傳統(tǒng)媒體,而是從他們信任的播客或其他來(lái)源獲取多方面信息,使得這里有更好的播客創(chuàng)作環(huán)境,“他們欣賞并理解有條理的討論,而且不局限于某一陣營(yíng)?!?/p>

為了吸引用戶,Arto在Podcastle開(kāi)始的2年為文轉(zhuǎn)語(yǔ)音、語(yǔ)言轉(zhuǎn)錄保持免費(fèi)方案。長(zhǎng)期的免費(fèi)方案需要資金支持,Arto必須籌款。

他和朋友們一切準(zhǔn)備就緒,Arto也通過(guò)工作積累了多國(guó)行業(yè)人脈。然而,彼時(shí)亞美尼亞處于戰(zhàn)爭(zhēng)和和平之間,加上疫情爆發(fā)導(dǎo)致經(jīng)濟(jì)的大面積蕭條。這讓亞美尼亞公司獲資艱難,Arto與50位投資者數(shù)次對(duì)話交談,其中僅有2-3個(gè)起作用。

Arto在Rearrange的訪談中透露,全球日益內(nèi)卷的創(chuàng)業(yè)潮中,他在亞美尼亞看到了相反的商業(yè)生態(tài)。“創(chuàng)業(yè)公司的高管或創(chuàng)始人都在盡可能最大化他們的影響力,試圖幫助其他人?!?/p>

PicsArt,這只在亞美尼亞發(fā)展強(qiáng)勁的獨(dú)角獸給了國(guó)內(nèi)其他科技初創(chuàng)公司很大的籌款底氣。一是亞美尼亞有很多優(yōu)秀的科技人才,PicsArt讓其躋身國(guó)際科技舞臺(tái)成為可能。二是PicsArt致力于做全世界用戶都喜愛(ài)的產(chǎn)品,并在努力獲得資金。

Arto表示:“在我們國(guó)家,多數(shù)公司都是互幫互助,對(duì)其他公司的成功感到興奮。這很難得,他們(PicsArt、Krisp等)會(huì)讓很多來(lái)自硅谷的投資者了解亞美尼亞?!彼锌瑏喢滥醽嗠m小,卻能通過(guò)合作共同去更大的世界發(fā)揮作用。

2020年底,在第一次實(shí)現(xiàn)用戶的有機(jī)增長(zhǎng)后,Podcastle獲得了美國(guó)VC Sierra Ventures領(lǐng)投的175萬(wàn)美元。

Podcastle是Sierra Ventures投的第二家播客公司,另一家是當(dāng)時(shí)估值超35億美元的喜馬拉雅FM。他們是在投資Krisp時(shí)在亞美尼亞意外注意到了Podcastle,“Krisp在1年之內(nèi)從0美元增長(zhǎng)成400萬(wàn)美元ARR的公司,鑒于Podcastle也是亞美尼亞的,相信他們也可以用人才和項(xiàng)目建立起有資本效率的企業(yè)?!?/p>

值得一提的是,早在這輪融資中,Podcastle就獲得了吳恩達(dá)的AI Fund投資。

Arto在跟投資者聊時(shí)從不避諱談?wù)撍麄儑?guó)家正處于戰(zhàn)爭(zhēng)之中,這讓多數(shù)原本對(duì)他項(xiàng)目感興趣的資方即刻收聲。但AI Fund沒(méi)被嚇跑,“他們很感興趣,并且相信我們可以獨(dú)立成長(zhǎng)。”

最新一輪領(lǐng)投方Mosaic的聯(lián)合創(chuàng)始人Simon Levene也很看好他們,“Arto他們打造的產(chǎn)品呈現(xiàn)有機(jī)增長(zhǎng)的趨勢(shì),這種增長(zhǎng)在未來(lái)幾年會(huì)加速?!?/p>

聽(tīng)播客的人也逐年增多。The Infinite Dial報(bào)告顯示,6成以上(12歲以上)美國(guó)人是播客聽(tīng)眾,這個(gè)數(shù)據(jù)在2022年初躥到了73%。Demand Sage也有數(shù)據(jù)表示,全球播客受眾將在2024年達(dá)到5.049億。

目前,在Arto看來(lái),播客行業(yè)最大的趨勢(shì)走向有兩個(gè),最大的方向是音質(zhì)提升,用AI工具將任何音頻生成“偽高質(zhì)量音頻”,另一個(gè)大方向是市場(chǎng)營(yíng)銷(xiāo),高仿真的AI語(yǔ)音能協(xié)助大量廣告切片的分發(fā),幫助企業(yè)分享和引流。

Podcastle的公告顯示,獲投后除了加速AI工具的開(kāi)發(fā),還需擴(kuò)大產(chǎn)品范圍。為此Arto又招攬了不少人才。前段時(shí)間,Canva前副總裁Allan上任首席商務(wù)官,加入領(lǐng)導(dǎo)團(tuán)隊(duì)的還有來(lái)自Prezi、Uber、Facebook的老員工。

本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。

反饋
聯(lián)系我們
推薦訂閱