騰訊發(fā)布：影響2024年的十大科技應(yīng)用趨勢｜2萬字全文

騰訊研究院·2024-01-24

關(guān)注

智能科技，跨界相變。

編者按：本文來自微信公眾號騰訊研究院（ ID：cyberlawrc），作者：何芙蓉，編輯：吳先之創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

過去一年，我們見證了數(shù)字科技的加速度。每個人都身處變革巨浪之中，既對大模型的突破進(jìn)展無比興奮，也對未來充滿了無限憧憬。

新年伊始，眺望未來2-3年的科技趨勢。我們正駛向一個由連接衍生交互、由計算催生智能的時代。

高性能計算、量子計算、云計算和邊緣計算這"四大計算“融匯貫通，正催生全新的計算范式。

通用人工智能漸行漸近，大模型走向多模態(tài)，AI智能體可能成為下一代平臺， "AI科學(xué)家"有望加速問世。全球已達(dá)共識，AI治理將引領(lǐng)我們踏上更智慧、更安全的未來。

機器人演進(jìn)加速，靈巧手讓人形機器人更敏捷、更像人。AI與生命科學(xué)的交融，將幫助我們洞察更多的生命奧秘。

我們會進(jìn)入一個3D、全真在場的新世界。腦機接口不僅在醫(yī)療實現(xiàn)突破，正拓展至更多的互動場景?；蛟S不久的將來，我們將親自見證意識上載從科幻成為現(xiàn)實。

手機衛(wèi)星電話、垂直起降飛機將改變我們的應(yīng)急方式和出行模式。交通網(wǎng)、信息網(wǎng)、能源網(wǎng)的融合，將推動智能、綠色的能源變革。

未來已來，一個充滿韌性和重塑的全新時代即將揭開序幕。讓我們擁抱變革，共同譜寫人類與科技和諧共生的新篇章！

（文末提供完整PPT版報告下載）

專家推薦：

在這個日新月異的變革時代，我們有幸見證并參與了數(shù)字科技的創(chuàng)新突破。特別是近年來，以大模型為代表的AI技術(shù)，讓我們看到了通用人工智能的曙光，有望大幅加速技術(shù)演進(jìn)的步伐。

騰訊的2024數(shù)字科技趨勢，從連接、交互、計算和智能四個維度，對100多項未來技術(shù)和重點方向給出了趨勢性判斷。從星地直連的衛(wèi)星互聯(lián)網(wǎng)，到垂直起降飛機的未來交通網(wǎng)，再到能源、信息和交通的多網(wǎng)協(xié)同，未來網(wǎng)絡(luò)連接的廣度和深度都迎來無限可能。交互方式正在發(fā)生變革，數(shù)字交互引擎不僅讓虛擬世界更真實，也讓真實世界更豐富，未來的全新3D視界呼之欲出，腦機接口的新進(jìn)展也帶來了更大的想象空間。計算無疑是各類智能的底層基礎(chǔ)支撐，也成為當(dāng)前競爭的焦點領(lǐng)域。而智能的升級，不僅會給機器人注入具身智能，還給微觀世界的基因計算帶來新突破。預(yù)測未來的最好方式，就是創(chuàng)造未來。相信在行業(yè)各界的共同努力下，這些前瞻洞見會更快到來，從趨勢變成現(xiàn)實。

——丁漢中國科學(xué)院院士

去年以來，以生成式AI為代表的人工智能技術(shù)發(fā)展激蕩人心，正在引發(fā)智能的元革命?？梢杂鲆姷奈磥?，智力將會成為一種基礎(chǔ)設(shè)施服務(wù)，新的IaaS呼之欲出。類比摩爾定律，未來可能會出現(xiàn)新的智能定律，對信息世界、物理世界和生命世界帶來全方位的影響。

未來十年，AI會無所不在。首先，現(xiàn)有的各類應(yīng)用可以用AI重新做一遍，新的交互變革、體驗創(chuàng)新將會帶來更新的智能硬件、更多的智能服務(wù)，孕育出比歷次工業(yè)革命都巨大的產(chǎn)業(yè)機會。其次，AI會成為各領(lǐng)域的底層操作系統(tǒng)，AI+機器人的具身智能，AI+生命科學(xué)的基因計算，AI+未來出行的自動駕駛汽車和垂直起降飛機，甚至AI+腦機接口的硅基和碳基結(jié)合的新生命體，都會一步步成為現(xiàn)實。最后，AI能力的提升也伴隨著風(fēng)險的擴大，我們要充分發(fā)揮技術(shù)發(fā)明的智慧和把握應(yīng)用方向的智慧，讓AI科技更善良、更有創(chuàng)意，朝著強化人、成就人的方向可持續(xù)發(fā)展。

——張亞勤中國工程院院士、清華大學(xué)智能產(chǎn)業(yè)研究院（AIR）院長

01重塑計算

趨勢一：高性能計算的“四算聚變”

算力，是數(shù)字時代的核心生產(chǎn)力。高性能計算，是先進(jìn)算力的代表，它既包含了以高性能計算集群為代表的傳統(tǒng)計算體系，也包含了像量子計算一樣的未來計算硬件和軟件。高性能計算在氣象預(yù)測、地質(zhì)勘探、新藥研發(fā)、新材料研發(fā)、人工智能等眾多應(yīng)用領(lǐng)域發(fā)揮至關(guān)重要的價值，高性能計算技術(shù)的演進(jìn)，引領(lǐng)著整個計算機科學(xué)技術(shù)的未來走向，甚至可能引發(fā)劃時代的科技飛躍，值得產(chǎn)業(yè)和社會持續(xù)關(guān)注。

今年，全球迎來高性能計算設(shè)施的大規(guī)模新建潮和升級潮，以 CPU 為計算核心的高性能計算1.0時代正在快速遠(yuǎn)去，以 CPU+GPU 為計算核心的高性能計算2.0已全面到來。

未來幾年，高性能計算技術(shù)將呈現(xiàn)四個方面的發(fā)展趨勢：系統(tǒng)架構(gòu)方面，高算集群、量子計算、云計算和邊緣計算的“四算融合”也將成為高性能計算 3.0 演進(jìn)的新方向；關(guān)鍵硬件方面，計算芯片將迎來多元化發(fā)展；軟件應(yīng)用方面，云原生技術(shù)將帶來高算服務(wù)的普及，同時科學(xué)計算模擬應(yīng)用將大量增加；可持續(xù)計算方面，業(yè)界將更多的關(guān)注計算的效能，并加速高能效計算技術(shù)的研發(fā)與探索。

一、高算集群、量子計算、云計算和邊緣計算“四算”融合，衍生新技術(shù)路徑

云超同化。一方面，Web 服務(wù)、容器化等云原生技術(shù)正在快速應(yīng)用于傳統(tǒng)高性能計算集群，使算力服務(wù)更易觸達(dá)：芬蘭 LUMI 集群已開始引入容器技術(shù)提高算力調(diào)度和應(yīng)用搭建效率，并對外提供算力服務(wù)；IBM 也于年初發(fā)布了其首臺云原生高算集群 Vela；另一方面，不僅更多云服務(wù)商推出了高性能計算云服務(wù)，以谷歌為代表的頭部企業(yè)更進(jìn)一步利用云計算天然的分布式計算優(yōu)勢，推出“算力多切片訓(xùn)練”方案，打造超出常規(guī)算力集群性能的超大規(guī)模AI 訓(xùn)練案例。

量超融合。高性能計算集群與量子計算機的融合已經(jīng)成為行業(yè)共識，量子計算單元（QPU）正在逐漸成為新的專用計算加速模塊。要全面實現(xiàn)以CPU+GPU+QPU為計算核心的高性能計算 3.0 ，大致要經(jīng)歷三個階段：第一階段，高算集群和量子計算的網(wǎng)絡(luò)互聯(lián)；第二階段，互聯(lián)的高算集群與量子計算機可以通過專用的操作系統(tǒng)實現(xiàn)算力協(xié)同調(diào)度；第三階段，高算集群和量子計算之間實現(xiàn)從底層硬件到上層應(yīng)用的深度系統(tǒng)集成，并能充分發(fā)揮各自的算力優(yōu)勢，共同完成復(fù)雜的計算任務(wù)。如IBM 、芬蘭 VTT 技術(shù)研究中心、本源量子等國內(nèi)外的相關(guān)機構(gòu)和企業(yè)已經(jīng)開始相關(guān)研發(fā)工作并陸續(xù)發(fā)布了進(jìn)展，并對外提供訪問服務(wù)。

量子集群出現(xiàn)、云服務(wù)普及。量子計算突出企業(yè)IBM于 2023 年 12 月公布全球首個可擴展量子計算系統(tǒng)Quantum System Two，引入模塊化架構(gòu)和計算機集群設(shè)計，可讓系統(tǒng)容納 10000 個量子比特。模塊化量子計算集群的出現(xiàn)，預(yù)示著可復(fù)制性更強、擴展性更好的量子計算機發(fā)展新路徑；同時，全球已有超過 20 家機構(gòu)推出量子計算云服務(wù)，從整機公司如 IBM，發(fā)展到云服務(wù)商如亞馬遜云，再到科研院所如北京量子院。

高性能計算走向云邊協(xié)同。目前高性能邊緣計算（HPEC）還在成長中，其單點算力已可達(dá)千萬億次每秒，自動駕駛和機器人是典型應(yīng)用場景。除傳統(tǒng)計算平臺外，神經(jīng)形態(tài)芯片、光電計算芯片等新技術(shù)的成熟也在不斷提升邊緣算力和能效。而為獲得實時決策以及更高的信息安全環(huán)境，將部分?jǐn)?shù)據(jù)處理、模型訓(xùn)練以及推理等工作，從數(shù)據(jù)中心/云平臺遷移至云邊協(xié)同架構(gòu)下，是必要的技術(shù)路徑。

二、高性能芯片多元發(fā)展，QPU 發(fā)展由數(shù)量轉(zhuǎn)向質(zhì)量

芯片技術(shù)多元化發(fā)展加劇。首先包括微軟、 Meta 在內(nèi)的科技企業(yè)紛紛推出自研高性能 CPU 和 AI 加速芯片，其次，除了傳統(tǒng)的 x86 架構(gòu)以外，其他芯片架構(gòu)的芯片也加入到高性能計算領(lǐng)域，并由落地應(yīng)用：位于葡萄牙的集群 Deucalion 將采用與日本富岳集群相同的 ARM 架構(gòu)高性能芯片 A64FX；算能科技日前向山東大學(xué)交付國內(nèi)首臺RISC-V服務(wù)器集群，該集群擁有48顆RISC-V高性能芯片SG042。

存算一體，突破“內(nèi)存墻”。傳統(tǒng)芯片均采用馮諾依曼計算架構(gòu)，改架構(gòu)的“內(nèi)存墻”問題隨著算力的不斷提升而越發(fā)明顯，逐漸成為芯片性能進(jìn)一步突破的瓶頸。業(yè)界紛紛采用存算一體技術(shù)思路，提升現(xiàn)有芯片性能的同時，研發(fā)神經(jīng)形態(tài)計算芯片，探索“破墻”之路。Intel 、 AMD 和英偉達(dá)紛紛在各自最新的芯片產(chǎn)品中引入 HBM 和 LPDDR 等近存計算（Near-Memory Computing）技術(shù)；而神經(jīng)形態(tài)計算（Neuromophic Computing）被認(rèn)為是“后馮諾依曼時代”突破“內(nèi)存墻”的重要計算技術(shù)路徑。受人類大腦原理的啟發(fā)，神經(jīng)形態(tài)計算芯片通過存內(nèi)計算（Compute in Memory）方式，實現(xiàn)高算力的同時實現(xiàn)超低功耗。

量子比特制備路徑之爭將更激烈。量子比特的制備，是量子計算機研制的起點。今年，超導(dǎo)量子、光量子、離子阱、冷原子等多條量子比特制備路徑均有不錯的進(jìn)展，“誰才是未來量子計算最終的技術(shù)路線”之爭將更加激烈。

QPU 發(fā)展數(shù)量與質(zhì)量兼顧。雖然 IBM 發(fā)布1000+量子比特QPU， Atom Computing 宣稱創(chuàng)造 1000 +原子陣列，但I(xiàn)BM 最新發(fā)布的芯片互聯(lián)技術(shù)，以及哈佛大學(xué)和QuEra等聯(lián)合發(fā)布的邏輯量子比特制備和糾錯研究成果等，說明了QPU的發(fā)展，仍然處在追求比特數(shù)量和，以及關(guān)注諸如糾錯能力、可擴展性等更符合實用需要的技術(shù)。

三、云原生技術(shù)將釋放高性能算力潛能，科學(xué)計算模擬應(yīng)用大量增加

云原生技術(shù)加快普及。從國內(nèi)外云服務(wù)商發(fā)布的進(jìn)展來看，云平臺容器服務(wù)將加快對高性能計算服務(wù)的支持，并進(jìn)一步兼容CUDA、 ROCm 、 oneAPI 等并行計算軟件平臺，為用戶提供高度自動化的高性能計算工作環(huán)境，大大提高研發(fā)和實驗效率。高性能計算算力潛能將被進(jìn)一步被釋放。

科學(xué)計算模擬應(yīng)用和成就將迎來大爆發(fā)。一方面，全球高性能計算集群的大規(guī)模新建和升級、以及云原生技術(shù)應(yīng)用，使算力服務(wù)更充足并更易觸達(dá)；另一方面，科學(xué)計算模擬的需求將更加強烈，未來幾年將會有更多的科學(xué)計算模擬基于高性能計算服務(wù)開展：從微觀粒子模擬、到血流和癌細(xì)胞模擬、再到核聚變模擬、以及氣象和地理空間模擬等等。進(jìn)一步，科學(xué)計算與人工智能技術(shù)的結(jié)合，將比預(yù)計的要快，許多傳統(tǒng)模擬數(shù)值算法經(jīng) AI 優(yōu)化后，性能獲得大幅提升，科學(xué)家和科研團(tuán)隊的生產(chǎn)力將迅速提高，科學(xué)研究將迎來快速進(jìn)步的新形勢。

更多高性能計算集群嘗試人工智能大模型研發(fā)。傳統(tǒng)高算集群通過加裝 GPU 集群、結(jié)合云平臺高性能計算服務(wù)得到升級后，將具備更強的 AI 加速計算能力，進(jìn)而可以支持人工智能大語言模型的訓(xùn)練。比如：智譜 AI 的 ChatGLM3支持在神威高算上運行；美國阿貢國家實驗室開始基于 Aurora集群創(chuàng)建ScienceGPT，預(yù)計參數(shù)數(shù)量達(dá)到 1 萬億，將為廣泛的科學(xué)研究提供幫助。

四、業(yè)界將加大可持續(xù)高性能計算的踐行力度

高性能計算的能耗是驚人的。以TOP500 排名第一的Frontier 高算集群為例，其算力可達(dá) 1.6EFlop/s，功率可達(dá) 20 兆瓦，相當(dāng)于近 1萬戶家庭用電水平。據(jù)統(tǒng)計，數(shù)據(jù)中心的耗電量約占全球耗電量的1%，我國 2020 年占比是2.7%。雖然當(dāng)前尚無準(zhǔn)確的數(shù)據(jù)中心能耗預(yù)測，但急劇增加的人工智能大模型訓(xùn)練等高耗能計算應(yīng)用，勢必會使這個數(shù)字繼續(xù)增加。

可持續(xù)計算，是數(shù)字經(jīng)濟(jì)和雙碳目標(biāo)背景下，高性能計算技術(shù)演進(jìn)歷程中的路標(biāo)和燈塔。擁有可持續(xù)高性能計算的技術(shù)，也將成為重要的競爭力。世界經(jīng)濟(jì)論壇與今年發(fā)布的《2023 十大新興技術(shù)》報告，“可持續(xù)計算”位列其中。Intel、IBM、英偉達(dá)等先進(jìn)計算企業(yè)也在不遺余力的踐行和推動可持續(xù)計算。

可持續(xù)計算通常指在設(shè)計、建造和使用計算機技術(shù)（包括硬件、系統(tǒng)、軟件）的過程中，力求實現(xiàn)最大的能源效率和對環(huán)境影響的最小化。未來，計算能效將成為評估高性能計算技術(shù)先進(jìn)性的重要指標(biāo)，而提高計算能效的途徑主要有三個：更高能效的計算軟硬件、更先進(jìn)的冷卻技術(shù)、以及更合理的計算供需匹配。

高能效的計算軟硬件方面，存算一體將是硬件層面主要的技術(shù)發(fā)展路徑，而機器學(xué)習(xí)等人工智能技術(shù)與傳統(tǒng)科學(xué)計算的結(jié)合，將大大提升計算效率和精度，并從軟件層面大幅度節(jié)省計算資源。

冷卻技術(shù)方面，液冷技術(shù)，特別是浸沒式液冷技術(shù)將加快普及，并帶來 30%以上的耗能節(jié)約。

合理的算力供需匹配方面，計算能效將成為高性能算力更重要的技術(shù)參數(shù)，而“量子效能”也將成為未來量子計算機研發(fā)和應(yīng)用的重要評估指標(biāo)。

02智能升維

趨勢二：多模態(tài)智能體加速AGI進(jìn)程

剛剛過去的一年，注定是人工智能發(fā)展史上具有里程碑意義的大年。生成式人工智能的驚人進(jìn)步，讓我們深切感受到未來AGI的巨大潛力和無限前景。

大模型從理解到生成，從感知到?jīng)Q策，能力不斷升。加上多模態(tài)、Agent、以及具身智能等方向的探索，AI有望完成“感知—決策—行動”的閉環(huán)。

一、多模態(tài)解析世界的本來面貌，并實現(xiàn)“三生萬物”

多模態(tài)是人類世界的本來樣貌，AGI的發(fā)展趨勢一定是朝向多模態(tài)。技術(shù)將從文本、圖像、視頻（2D和3D），再到聲、光、電，甚至分子、原子等各類模態(tài)，而且具備跨模態(tài)遷移的特性。未來理想的框架是“多模態(tài)的對齊和融合 + 統(tǒng)一的編碼器和解碼器”。12月6日微軟發(fā)布的Copilot中，將GPT-4V的視覺能力與Bing搜索相結(jié)合，為用戶提供更好的圖像理解和生成體驗。7日，谷歌發(fā)布Gemini，主打原生大模型，無縫跨文本、圖像、視頻、音頻和代碼。谷歌稱，Gemini是第一個在MMLU（大規(guī)模多任務(wù)語言理解）方面優(yōu)于人類專家的模型，準(zhǔn)確率達(dá)到90%（人類專家為89.8%）。

二、從大腦到Agent，大模型從CoPilot副駕，走向主駕駛

比爾蓋茨近日撰文：AI Agent將是下一個平臺，人工智能即將徹底改變?nèi)藗兪褂糜嬎銠C的方式并顛覆軟件行業(yè)。在不久的將來，任何上網(wǎng)的人都將能夠擁有由人工智能驅(qū)動的個人助手，遠(yuǎn)超今天的技術(shù)水平。智能體由四個主要部分組成，包括多模態(tài)大模型（LMM）、長期記憶（Memory）、規(guī)劃（Planning）和工具使用（Tool Use）。業(yè)界AI智能體愈來愈多，如微軟AutoGen，發(fā)布短短兩周內(nèi)，星標(biāo)量就從390增到10K，并在 Discord上吸引了5000多名成員。它允許多個智能體扮演各種角色，如程序員、設(shè)計師，或是各種角色的組合，僅通過對話就可以完成編程任務(wù)。

三、端側(cè)大模型加速部署，或?qū)⒊蔀槲磥斫换バ氯肟?/strong>

大模型正在向端側(cè)轉(zhuǎn)移，AI推理將在手機、PC、耳機、音箱、XR、汽車，以及其它可穿戴式新型終端上運行。端側(cè)大模型具有一些獨特優(yōu)勢，如，本地數(shù)據(jù)處理效率更高，節(jié)省云端服務(wù)器帶寬和算力成本，對用戶數(shù)據(jù)更好的隱私保護(hù)，開啟更多交互新方式、新體驗等。

目前，一些手機已經(jīng)在利用本地 AI支持如暗光拍攝、降噪和人臉解鎖等功能。未來借助端側(cè)大模型，并結(jié)合向量化后的各類個人數(shù)據(jù)，用戶可以跟手機進(jìn)行更流暢的交互，實現(xiàn)各種原生操作和功能。如，Humane 正式推出 AI Pin，搭載GPT4，可實現(xiàn)語音交互，也可以投影在手掌上交互。高通推出驍龍8 Gen3 ，支持終端側(cè)運行100億參數(shù)的模型。蘋果最新的M3芯片支持端側(cè)推理，且計劃推出更智能的Siri，為端側(cè)大模型生態(tài)做積極準(zhǔn)備。

端側(cè)大模型應(yīng)用具備三種可能性，首先是端側(cè)原生集成AI模型，類似siri，幫助用戶調(diào)用其他軟件，從而可能成為硬件新入口。其次，將大模型作為獨立app，例如MIT一位教授將開源模型集成在手機端做一個獨立app；第三，將大模型接入即時通訊軟件作為chatbot，例如What‘s App已經(jīng)集成了Meta AI。

四、AI助力科研探索，貫穿科研全過程

在AI技術(shù)的加持下，科學(xué)研究的效率大大增加。通過理論探索、設(shè)計實驗、分析數(shù)據(jù)等方向為科學(xué)發(fā)現(xiàn)提供動力。AI與各個科學(xué)領(lǐng)域結(jié)合后，正在發(fā)生一場充滿潛力和挑戰(zhàn)的科技革命。

在理論探索階段，以ChatPDF為代表的LLM應(yīng)用可以對既有文獻(xiàn)的梳理，加快科研信息檢索的效率，在此基礎(chǔ)上提出新的研究問題，對現(xiàn)象和數(shù)據(jù)觀察提出某種猜想，幫助科學(xué)家發(fā)現(xiàn)新問題。

在數(shù)據(jù)分析階段，AI可以通過大量數(shù)據(jù)和復(fù)雜的數(shù)據(jù)分析，幫助提取有用信息和填補數(shù)據(jù)缺失，從而提高數(shù)據(jù)質(zhì)量和利用效率。降低對數(shù)據(jù)的依賴。在處理高度復(fù)雜和多變量的科學(xué)問題時，大模型能提供高效的計算能力和深入的洞見。

在科研領(lǐng)域，生成式AI被用于預(yù)測基因序列、發(fā)現(xiàn)新的藥物靶點以及設(shè)計新型的生物材料。使用深度學(xué)習(xí)技術(shù)，研究人員能夠預(yù)測DNA和RNA結(jié)合蛋白的序列特異性。這是應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)（CNN）于基因組學(xué)的先驅(qū)性工作之一。如，麻省理工學(xué)院（MIT）的研究人員開發(fā)出一種擴散模型——FrameDiff，該模型能夠生成自然界中不存在的新型蛋白質(zhì)結(jié)構(gòu)。該模型可以生成多達(dá)500 個氨基酸序列的蛋白質(zhì)主鏈，且無需依賴于預(yù)訓(xùn)練蛋白質(zhì)結(jié)構(gòu)預(yù)測網(wǎng)絡(luò)。Nature雜志近日報道，一個由AI 指導(dǎo)機器人制造新材料的實驗室A-Lab，只用了 17 天就獨自創(chuàng)造了 41 種新材料，展現(xiàn)了AI科學(xué)家的未來潛能。

五、負(fù)責(zé)任AI走向深入，價值對齊助力大模型穩(wěn)健發(fā)展

隨著AI模型的能力日益更加強大，如何讓其行為和目的跟人類的價值、偏好、倫理原則、真實意圖之間實現(xiàn)協(xié)調(diào)一致，這個被稱為人機價值對齊的問題變得越來越重要。價值對齊對于確保人類與人工智能協(xié)作過程中的信任與安全至關(guān)重要，已經(jīng)成為AI治理領(lǐng)域的一項關(guān)鍵任務(wù)，是大模型實現(xiàn)穩(wěn)健發(fā)展和提升競爭力的必由之路。業(yè)界和研究界積極探索實現(xiàn)大模型價值對齊的多種措施，包括人類反饋強化學(xué)習(xí)、可擴展監(jiān)督方法、訓(xùn)練數(shù)據(jù)干預(yù)、可解釋AI方法、對抗測試、治理措施等等。

TIME雜志將美國AI公司anthropic開發(fā)的AI價值對齊技術(shù)“原則型AI”（constitutional AI）評選為2023年三大AI創(chuàng)新之一（另外兩個分別為多模態(tài)AI、文生視頻技術(shù)），這足以表明價值對齊已然成為AI領(lǐng)域的核心方向，其重要性正越來越被認(rèn)識到。實際上，在大模型加速發(fā)展引發(fā)關(guān)于有效加速（e/acc）還是有效對齊（e/a）的AI技術(shù)發(fā)展理念之爭的背景下，人們需要更加負(fù)責(zé)任地發(fā)展應(yīng)用人工智能技術(shù)，而關(guān)于價值對齊的技術(shù)和治理探索將推動負(fù)責(zé)任AI走向深入，確保人類與人工智能和諧共生、有效協(xié)作的美好未來。

趨勢三：AI加速人形機器人“手、腦”進(jìn)化

2023年10月20日，工信部印發(fā)《人形機器人創(chuàng)新發(fā)展指導(dǎo)意見》，提出人形機器人集成人工智能、高端制造、新材料等先進(jìn)技術(shù)，有望成為繼計算機、智能手機、新能源汽車后的顛覆性產(chǎn)品，將變革人類生產(chǎn)生活方式，重塑全球產(chǎn)業(yè)發(fā)展格局。特別是在關(guān)鍵技術(shù)突破方面，打造人形機器人“大腦”和“小腦”、突破“肢體”關(guān)鍵技術(shù)、健全技術(shù)創(chuàng)新體系。

《意見》還提出，到2025年，人形機器人創(chuàng)新體系初步建立，“大腦、小腦、肢體”等一批關(guān)鍵技術(shù)取得突破，確保核心部組件安全有效供給。整機產(chǎn)品達(dá)到國際先進(jìn)水平，并實現(xiàn)批量生產(chǎn)，在特種、制造、民生服務(wù)等場景得到示范應(yīng)用，探索形成有效的治理機制和手段。

當(dāng)前，人形機器人技術(shù)加速演進(jìn)，已成為科技競爭的新高地、未來產(chǎn)業(yè)的新賽道、經(jīng)濟(jì)發(fā)展的新引擎，發(fā)展?jié)摿Υ?、?yīng)用前景廣。特別是在2023年以來，基于視覺-語言的大模型嵌入機器人本體，又為加速思考（“感知腦”）和執(zhí)行（“靈巧手”）突破，推動機器人邁向智能化帶來新的可能。

2023年是人形機器人的“高光之年”，這一領(lǐng)域發(fā)生了一系列大事。7月，李飛飛團(tuán)隊發(fā)布最新成果VoxPoser具身智能技術(shù)，可以使機器人直接聽懂人類的自然語言指令并完成復(fù)雜任務(wù)，無需額外的數(shù)據(jù)和訓(xùn)練。人形機器人Optimus快速迭代，商業(yè)化進(jìn)程持續(xù)推進(jìn)。特斯拉擎天柱的力控能力、抓取復(fù)雜物體的能力、利用FSD技術(shù)的視覺感知和處理能力。OpenAI投資了人形機器人公司1X，英偉達(dá)CEO黃仁勛也公開唱多“具身智能”。微軟基于ChatGPT 自然語言理解和推理能力，生成控制機器人的相關(guān)代碼。

根據(jù)Markets and Markets的預(yù)測，人形機器人市場規(guī)模有望從2023年的18億美元增長到2028年的138億美元，其復(fù)合年增長率可達(dá)50.2%。而高盛預(yù)測在最理想的情景下（產(chǎn)品設(shè)計、用例、技術(shù)、可負(fù)擔(dān)性和公共接受度等障礙被克服），2035年人形機器人市場或?qū)⑦_(dá)到1540億美元。

在人形機器人領(lǐng)域，有三個值得關(guān)注的趨勢：1.在思考能力層面，大模型的嵌入極大提升機器人感知環(huán)境、分解任務(wù)、規(guī)劃流程以及與環(huán)境交互的能力；2.在訓(xùn)練平臺方面，云邊結(jié)合的分布式計算平臺發(fā)展，強化了機器人的訓(xùn)練和分析決策速率；3.在執(zhí)行層面，以“靈巧手”為代表的關(guān)鍵技術(shù)，進(jìn)一步強化了人形機器人末端執(zhí)行應(yīng)用能力，尤其是微操作、近操作等能力。

一、大模型在文本、自然語言和視覺領(lǐng)域取得重要突破，提升機器人的理解能力。

在ITF World 2023大會上，英偉達(dá)創(chuàng)始人黃仁勛公開表示，人工智能的下一次浪潮將是具身智能，即能理解、推理以及與真實物理世界互動的智能系統(tǒng)。

在Chatgpt出現(xiàn)之前，大模型與具身智能領(lǐng)域的結(jié)合更多出現(xiàn)在感知層面，在海量數(shù)據(jù)集上預(yù)訓(xùn)練的視覺模型，只是作為一種更好的表征提取器來提升機器人在場景中的感知能力，而具體的規(guī)劃與動作執(zhí)行，依然需要大量的具身場景數(shù)據(jù)進(jìn)行訓(xùn)練。AI大模型，以及后續(xù)的多模態(tài)，可以從語音、視覺感知、決策、控制等多方面為機器人更好進(jìn)行學(xué)習(xí)訓(xùn)練和進(jìn)化。

過往機器人的控制模式是預(yù)設(shè)軌跡，導(dǎo)致機器人的控制與行動比較受局限。李飛飛團(tuán)隊在2023年發(fā)布的VoxPoser系統(tǒng)，實現(xiàn)將LLM（大語言模型）和VLM（視覺語言模型）接入機器人，前者用來理解人類指令并生成交互代碼，實現(xiàn)與后者的交互，而VLM進(jìn)行規(guī)劃路徑，生成操作指示地圖3D Value Map。兩者能力結(jié)合從而實現(xiàn)通過自然語言指令與機器人交互，可將復(fù)雜指令轉(zhuǎn)化為具體行動規(guī)劃，而無需預(yù)設(shè)數(shù)據(jù)和提前訓(xùn)練，同時，系統(tǒng)也具備很強的抗干擾能力，可以在遇到干擾因素時快速重新規(guī)劃。除此之外，VoxPoser還產(chǎn)生了四方面的涌現(xiàn)能力，即評估物理特性、行為常識推理、精度矯正、基于視覺的多步操作。

PaLM-E和RT-2有兩個有代表性的模型。前者是年初谷歌公司與柏林工業(yè)大學(xué)人工智能研究小組合作推出的多模態(tài)具像化視覺語言模型（VLM）。模型參數(shù)規(guī)模達(dá)到5620億，集成用于控制機器人的視覺與語言，特征是無需重新訓(xùn)練即可執(zhí)行各種任務(wù)。收到指令后，PaLM-E可以自動給機器人生成行動計劃，然后自行執(zhí)行。這是通過分析來自機器人攝像頭的數(shù)據(jù)來實現(xiàn)整個過程，不需要對場景進(jìn)行預(yù)處理，也不許提前對數(shù)據(jù)進(jìn)行人工注釋，機器人的控制更加自主。

Robotics Transformer 2（RT-2）是由Google DeepMind突出的一個用于控制機器人的視覺-語言-動作（VLA）的AI模型。RT-2使用經(jīng)過精調(diào)的LLM來輸出運動控制命令，可移植性訓(xùn)練數(shù)據(jù)中未明確包含的任務(wù)，并在新出現(xiàn)技能評估中將基線模型的表現(xiàn)提升了3倍。

二、云邊結(jié)合的分布式算力平臺發(fā)展強化了機器人的訓(xùn)練速率，降低產(chǎn)業(yè)化門檻。

機器人是 AI、算力、IoT、底層硬件等各種技術(shù)的集大成者。從關(guān)鍵場景垂直應(yīng)用，向規(guī)?；瘧?yīng)用發(fā)展。通過云-邊-端融合的機器人系統(tǒng)和架構(gòu)，例如云端運行超大模型Nvidia A100 GPU，邊緣運行小模型。讓機器人達(dá)到數(shù)百萬千萬級水平，從而降低價格成本，實現(xiàn)大規(guī)模商用。

云服務(wù)機器人是指將機器人的核心計算和智能部分部署在云端服務(wù)器，借助云計算技術(shù)提供更大的計算能力和資源，以實現(xiàn)更強大、更高效的數(shù)據(jù)處理和應(yīng)用。“云端大腦+本地機體”或“云端服務(wù)”機器人將成為規(guī)?；茝V與應(yīng)用的重要模式之一。

Google 專門開發(fā)協(xié)議，將模型部署在多TPU 云服務(wù)實現(xiàn)實時推理。實驗結(jié)果表明，基于現(xiàn)成的VLM 模型PaLM-E 和PaLI-X，RT-2 取得了良好的泛化和涌現(xiàn)性能。相比于獨立的機器人本體，連接云端大腦后的機器人擁有以下四個核心優(yōu)勢：信息和知識共享,平衡計算負(fù)載,協(xié)同合作,獨立于本體持續(xù)升級。邊緣計算的引入將解決終端能力受限和云計算的實時響應(yīng)的問題，增強機器人云端大腦的實時響應(yīng)能力。在共享計算、存儲、通信資源基礎(chǔ)上，智能算法持續(xù)從（云端）大數(shù)據(jù)和（本地端）個性化數(shù)據(jù)中抽取知識，逐步從特定場景適應(yīng)到通用場景，最終實現(xiàn)機器人即服務(wù)（Robot As A Service）的長期愿景。

特斯拉計劃利用Dojo對海量的視頻數(shù)據(jù)進(jìn)行無監(jiān)督學(xué)習(xí)，以加速特斯拉的Autopilot和完全自動駕駛（FSD）系統(tǒng)的迭代，同時為特斯拉的人形機器人Optimus提供算力支持。Dojo將加速人形機器人的開發(fā)，其能夠為機器人的神經(jīng)網(wǎng)絡(luò)訓(xùn)練提供算力支持，更快速地處理海量數(shù)據(jù)，有望推動機器人加速落地。

騰訊Robotics X機器人實驗室通過引入預(yù)訓(xùn)練模型和強化學(xué)習(xí)技術(shù)，可以讓機器狗分階段進(jìn)行學(xué)習(xí)，有效的將不同階段的技能、知識積累并存儲下來，讓機器人在解決新的復(fù)雜任務(wù)時，不必重新學(xué)習(xí)，而是可以復(fù)用已經(jīng)學(xué)會的姿態(tài)、環(huán)境感知、策略規(guī)劃多個層面的知識，并“舉一反三”。

三、多感知、多自由度功能融合的靈巧手強化了人形機器人的微操作、近操作能力。

靈巧手是人形機器人執(zhí)行動作的最終零件，十分重要且復(fù)雜，對電機性能要求較高。靈巧手作為機器人實現(xiàn)操作的終端工具十分重要?？招谋姍C、觸覺感知傳感器的發(fā)展，提升了人形機器人末端執(zhí)行器的靈敏度和魯棒性。

特斯拉人形機器人擎天柱靈巧手有6個執(zhí)行器，可實現(xiàn)11個自由度，其中空心杯電機為核心部件。人形機器人的手指空間狹小，因而人形機器人手指關(guān)節(jié)需配備更多小型化且能夠輸出較大力的電機。屬于直流永磁伺服電動機的空心杯電機完美契合人形機器人對應(yīng)手指關(guān)節(jié)輕量化、高精度等需求?？招谋姍C具有功率密度高、能量轉(zhuǎn)化效率高、響應(yīng)快，運行平穩(wěn)等特點，與靈巧手的需求高度適配。

騰訊Robotics X實驗室公布最新機器人研究進(jìn)展，首次展示在靈巧操作領(lǐng)域的成果，推出自研機器人靈巧手 TRX-Hand和機械臂 TRX-Arm。其中，靈巧手TRX-Hand擁有像人手一樣靈活的操作能力，可適應(yīng)不同場景，靈活規(guī)劃動作，自主完成“操作”。而機械臂TRX-Arm針對人居環(huán)境自主研發(fā)，擁有七自由度和擬人的特性，具有運動靈巧、爆發(fā)力強、觸控一體以及柔順安全等特點。

趨勢四：AI+基因計算解讀生命密碼

基因是生命的最基本元素?；蛴嬎闶侵甘褂糜嬎惴椒▉矸治龊屠斫饣蛐畔⒌倪^程。近年來，人工智能（AI）在基因計算中的應(yīng)用日益深入，市場研究公司Global Market Insights Inc.發(fā)布報告預(yù)測，到2032年，基因組學(xué)行業(yè)中的人工智能市場規(guī)模將達(dá)到125億美元，復(fù)合年增長率為39.2%。AI與基因計算融合開始進(jìn)入加速階段，有望在生物育種、醫(yī)療健康、生物醫(yī)藥等領(lǐng)域開辟廣闊的技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用前景。

AI已成為基因組學(xué)創(chuàng)新的關(guān)鍵驅(qū)動力。前基因組時代（1958-1980s），生物信息學(xué)作為生物學(xué)、計算機科學(xué)、數(shù)學(xué)和統(tǒng)計學(xué)交叉學(xué)科出現(xiàn)，人類專家初步探索將AI技術(shù)應(yīng)用于基因數(shù)據(jù)分析，例如使用模式識別來預(yù)測蛋白質(zhì)結(jié)構(gòu)和功能、使用統(tǒng)計學(xué)習(xí)方法來理解基因表達(dá)數(shù)據(jù)?；蚪M時代（1990s-2010s），人類專家能夠系統(tǒng)分析和比較整個物種的遺傳信息，并利用AI進(jìn)行基因組數(shù)據(jù)解析，輔助基因序列比對、變異檢測、功能注釋和復(fù)雜疾病的遺傳關(guān)聯(lián)分析，顯著提高了數(shù)據(jù)分析的效率和準(zhǔn)確性；后基因組時代（2010s-），研究重點轉(zhuǎn)向基因功能的綜合分析、基因表達(dá)調(diào)控、個體遺傳差異分析等，深度學(xué)習(xí)、AI大模型成為關(guān)鍵驅(qū)動技術(shù)，用于處理復(fù)雜海量多模態(tài)數(shù)據(jù)，實現(xiàn)單細(xì)胞測序，優(yōu)化基因編輯策略，促進(jìn)智能化生物育種、藥物發(fā)現(xiàn)以及個性化健康預(yù)測、基因療法發(fā)展。

利用大模型破解復(fù)雜生物問題成為布局熱點。2023年8月，清華大學(xué)智能產(chǎn)業(yè)研究院與水木分子發(fā)布多模態(tài)生物醫(yī)藥百億參數(shù)大模型BioMedGPT，在數(shù)據(jù)層面整合了基因、分子、細(xì)胞、蛋白、文獻(xiàn)、專利、知識庫等多源異構(gòu)的數(shù)據(jù)。9月，《上海市加快合成生物創(chuàng)新策源打造高端生物制造產(chǎn)業(yè)集群行動方案（2023—2025年）》中提出支持建設(shè)AI蛋白質(zhì)多模態(tài)生成大模型等干濕結(jié)合AI生物大模型。谷歌旗下深度思維公司（Google DeepMind）也于9月宣布開發(fā)出新的AI大模型AlphaMissense，在人類蛋白質(zhì)中成功預(yù)測了7100萬個可能的錯義突變（基因突變的一類），并將89%的突變分類為可能致病或可能良性；11月，深度思維再次宣布，AlphaFold預(yù)測范圍從蛋白質(zhì)結(jié)構(gòu)擴展至DNA、RNA等生物分子。

AI+生物技術(shù)正在加速育種4.0時代到來。2023年中央一號文件要求“全面實施生物育種重大項目，加快玉米大豆生物育種產(chǎn)業(yè)化步伐”。中國科學(xué)院錢前院士指出，全球種業(yè)發(fā)展正迎來生物技術(shù)與信息技術(shù)融合的“生物技術(shù)+人工智能+大數(shù)據(jù)”智能化時代（即育種4.0時代， 1.0為農(nóng)家育種時代、2.0為雜交育種時代、3.0為分子育種時代）。基因編輯方面，通過AI對于大量基因組數(shù)據(jù)的預(yù)測和分析，可以幫助提升特定基因位置添加、刪除或替換DNA序列的操作精準(zhǔn)度，增強作物抗病性、耐逆性、營養(yǎng)價值或產(chǎn)量，并減少傳統(tǒng)轉(zhuǎn)基因技術(shù)（將一個物種的基因轉(zhuǎn)移到另一個物種中）帶來的基因表達(dá)不穩(wěn)定或不可預(yù)測風(fēng)險。2023年4月，農(nóng)業(yè)農(nóng)村部發(fā)布《2023年農(nóng)業(yè)用基因編輯生物安全證書(生產(chǎn)應(yīng)用)批準(zhǔn)清單》，舜豐生物獲得首個植物基因編輯安全證書；此外，中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所將AI與基因編輯結(jié)合，開發(fā)的PrimeRoot系統(tǒng)在水稻和玉米中實現(xiàn)了長達(dá)11.1Kb的大片段DNA高效精準(zhǔn)定點插入。表觀合成方面，中國農(nóng)業(yè)科學(xué)院生物技術(shù)研究所通過整合多組學(xué)數(shù)據(jù)，構(gòu)建智能模型，預(yù)測并優(yōu)化人工設(shè)計的合成表觀回路，大幅度提升表觀合成的精準(zhǔn)度，并提出設(shè)計和創(chuàng)制智能作物（SMART Crop）的途徑和路線圖，為通過基因編輯之外的技術(shù)來培育聚合多種理想性狀的作物新種質(zhì)提供了新思路。

AI+基因計算將助力實現(xiàn)個性化健康預(yù)測。人類專家結(jié)合基因組信息和AI算法，構(gòu)建高度精準(zhǔn)的疾病預(yù)測模型，可以預(yù)測個體在未來發(fā)生特定健康問題的風(fēng)險，從而實現(xiàn)早期干預(yù)?；驕y序是理解遺傳信息、研究基因功能、診斷遺傳疾病、發(fā)展新治療方法的基礎(chǔ)，其目標(biāo)是確定DNA分子中四種核苷酸（腺嘌呤A、胸腺嘧啶T、胞嘧啶C、鳥嘌呤G）確切順序的過程。過去基因測序技術(shù)主要是對整個組織進(jìn)行測序，包含成千上萬個細(xì)胞。近年來，基因測序技術(shù)有了突破性進(jìn)展，從多細(xì)胞/組織層級開始向單細(xì)胞層級進(jìn)化。騰訊AI Lab研究提出單細(xì)胞注釋模型scBERT，在單細(xì)胞測序領(lǐng)域首次引入大型語言模型BERT范式，將細(xì)胞中基因的表達(dá)信息轉(zhuǎn)化成可被計算機理解、學(xué)習(xí)的“語言”，并對細(xì)胞進(jìn)行精準(zhǔn)標(biāo)注，實現(xiàn)了高解釋性、高泛化性、高穩(wěn)定性的單細(xì)胞類型注釋技術(shù)，能給細(xì)胞中的每個基因都印上專屬“身份證”，可用于臨床單細(xì)胞測序數(shù)據(jù)，并輔助醫(yī)生描述準(zhǔn)確的腫瘤微環(huán)境、檢測出微量癌細(xì)胞，從而實現(xiàn)個性化治療方案或者癌癥早篩。同時，對疾病致病機制分析、耐藥性、藥物靶點發(fā)現(xiàn)、預(yù)后分析、免疫療法設(shè)計等領(lǐng)域都具有極其重要的作用。

AI+基因工程促進(jìn)分子藥物設(shè)計和研發(fā)規(guī)則創(chuàng)新。AI技術(shù)在藥物研發(fā)中，正在逐漸用于海量文獻(xiàn)信息分析整合、發(fā)掘藥物靶點、化合物高通量虛擬篩選、全新分子設(shè)計/優(yōu)化、分子ADMET成藥性預(yù)測、分子逆合成分析、耐藥性預(yù)測等多個場景。在發(fā)掘藥物靶點方面，AI算法能夠分析大量基因數(shù)據(jù)，快速識別疾病相關(guān)的生物標(biāo)記和潛在藥物靶點，提高藥物研發(fā)的針對性和成功率。2023年7月，美國丹娜-法伯癌癥研究所基于人體基因表達(dá)數(shù)據(jù)集，預(yù)訓(xùn)練了一個基于遷移學(xué)習(xí)的AI模型——Geneformer，通過AI繪制基因互作網(wǎng)絡(luò)，有助于加快疾病治療靶點發(fā)現(xiàn)，對于罕見病，有望在未來僅需少量的數(shù)據(jù)就能推測出這些罕見疾病的病理機制。在生物合成基因簇挖掘方面，通過深度學(xué)習(xí)和模式識別技術(shù)，AI能夠分析復(fù)雜的微生物基因組數(shù)據(jù)，高效地識別和預(yù)測可能編碼天然產(chǎn)物的基因簇。騰訊量子實驗室開發(fā)了一套從微生物基因組中分析和預(yù)測生物合成基因簇的深度學(xué)習(xí)方法，可對基因組數(shù)據(jù)進(jìn)行分析，發(fā)現(xiàn)、篩選并鑒定出潛在的、具有新穎結(jié)構(gòu)的活性化合物相關(guān)生物合成基因簇，大幅提升新型生物活性分子的挖掘效率，助力新藥研發(fā)創(chuàng)新。

AI+基因計算為促進(jìn)生命科學(xué)和生物經(jīng)濟(jì)發(fā)展提供了新方法、新途徑、新機遇，但與此同時，在監(jiān)管機制、隱私保護(hù)、數(shù)據(jù)安全、技術(shù)控制、基因編輯等方面可能會出現(xiàn)更多的治理和倫理挑戰(zhàn)，我們也需要重視和審慎應(yīng)對，從而通過國際和國內(nèi)產(chǎn)學(xué)研用各界共同努力，讓科技的發(fā)展向造福人類、促進(jìn)公共利益的方向邁進(jìn)。

03數(shù)實交互

趨勢五：數(shù)字交互引擎激發(fā)超級數(shù)字場景

數(shù)字交互引擎是在文化創(chuàng)意場景下產(chǎn)生、伴隨數(shù)字文化產(chǎn)業(yè)升級而不斷實現(xiàn)技術(shù)迭代的一類工具集，集成了物理模擬、3D建模、實時渲染等多種前沿技術(shù)，是文化科技融合的典型產(chǎn)物。數(shù)字交互引擎主要由圖形模塊、仿真模塊、實時渲染等模塊構(gòu)成，它以軟件代碼包形式創(chuàng)造虛擬場景，動態(tài)呈現(xiàn)其外觀變化，支持其與物理世界進(jìn)行實時交互。

在發(fā)展前期，數(shù)字交互引擎主要應(yīng)用于游戲場景，在行業(yè)場景下被稱為“游戲引擎”；在服務(wù)游戲產(chǎn)業(yè)高效構(gòu)建虛擬世界、與現(xiàn)實世界高質(zhì)量交互的過程中，不斷實現(xiàn)技術(shù)迭代、提升跨平臺通用能力，逐步成為跨行業(yè)、跨場景應(yīng)用的數(shù)字交互引擎。當(dāng)前，數(shù)字交互引擎已經(jīng)應(yīng)用于文旅、汽車、工業(yè)等多元領(lǐng)域，成為構(gòu)建實時虛擬世界、實現(xiàn)虛實交互的關(guān)鍵工具集。

一、數(shù)字交互引擎與AIGC互相驅(qū)動，打造構(gòu)建超級數(shù)字場景的高效工具集

隨著以數(shù)字交互引擎為代表的游戲科技進(jìn)入游戲之外的更多領(lǐng)域，游戲?qū)⒂瓉硇碌漠a(chǎn)業(yè)擴容，成為不斷創(chuàng)造新價值與新可能的“超級數(shù)字場景”。游戲作為前沿科技的“試煉場”，在深度跨界、產(chǎn)業(yè)擴容的過程中，必然將推動數(shù)字交互引擎進(jìn)一步與多種前沿技術(shù)形成廣泛連接，其中，數(shù)字交互引擎與AIGC的加速融合、互相驅(qū)動將成為重要趨勢。

首先，數(shù)字交互引擎為AIGC爆發(fā)提供了重要推動力，并有望助力AIGC邁過“深水區(qū)”。游戲為AI提供了測試與訓(xùn)練的重要環(huán)境，促進(jìn)AI決策更加智能；同時，AIGC當(dāng)前在3D內(nèi)容側(cè)的能力仍存障礙，游戲行業(yè)的PCG（程序化內(nèi)容生成）技術(shù)已大量應(yīng)用于3D內(nèi)容制作，兩者的結(jié)合可助力AIGC提升3D側(cè)能力。未來，數(shù)字交互引擎及其創(chuàng)建的大量3D數(shù)字資產(chǎn)也將為AI大模型訓(xùn)練提供重要支持。

其次，AIGC技術(shù)融入數(shù)字交互引擎，將加速數(shù)字文化產(chǎn)業(yè)的工業(yè)化進(jìn)程。當(dāng)前，AIGC已滲透進(jìn)數(shù)字文化制作的多個環(huán)節(jié)，包括動畫、語音、美術(shù)、3D資產(chǎn)及場景等領(lǐng)域，簡化內(nèi)容開發(fā)流程。未來數(shù)字交互引擎將進(jìn)一步集成多種AIGC能力，提升影視、游戲、廣告等行業(yè)的智能化、工業(yè)化水平。

此外，數(shù)字交互引擎與AIGC的結(jié)合，將輻射多元社會場景，打造構(gòu)建超級數(shù)字場景的高效工具集。例如，英偉達(dá)的Omniverse平臺集成了數(shù)字交互引擎、AI等多種技術(shù)能力，不僅能夠支持高效開發(fā)場景逼真、物理精確的游戲，也能廣泛助力工業(yè)制造、自動駕駛等領(lǐng)域的虛擬仿真與協(xié)作。未來，數(shù)字交互引擎與AIGC相結(jié)合，將加速打造更多的超級數(shù)字場景，在感知與認(rèn)知的雙重維度上，實現(xiàn)人類生產(chǎn)與生活模式的全面升級。

二、大眾應(yīng)用方面，數(shù)字交互引擎或走向UGC形態(tài)內(nèi)容工具

隨著數(shù)字交互引擎與AIGC的融合加深、工具門檻進(jìn)一步降低，數(shù)字交互引擎有望走向UGC工具形態(tài)，以更低的使用門檻為大眾提供3D內(nèi)容的生產(chǎn)力。正如短視頻變革了今天的社會信息傳播方式，未來，數(shù)字交互引擎也有望作為大眾化的3D內(nèi)容生產(chǎn)與交互工具，支持人們創(chuàng)造自身在虛擬空間中的形象及資產(chǎn)等，在數(shù)實相生世界里實現(xiàn)生產(chǎn)與生活。

當(dāng)前，面向大眾的游戲創(chuàng)作工具已經(jīng)初現(xiàn)雛形，但數(shù)字交互引擎要真正走向大眾化，還需要從技術(shù)、生態(tài)、商業(yè)模式等維度積累資源、構(gòu)建能力，實現(xiàn)高質(zhì)量的畫面效果及實時算力支撐，培育豐富的開發(fā)者與多元內(nèi)容體系，構(gòu)建可持續(xù)的商業(yè)模式以推動創(chuàng)作者變現(xiàn)，進(jìn)一步聚集內(nèi)容開發(fā)者，真正推動“交互式內(nèi)容”的大眾化時代到來。

三、行業(yè)應(yīng)用方面，數(shù)字交互引擎推動各行業(yè)數(shù)字孿生走向?qū)崟r性

當(dāng)前，數(shù)字交互引擎的應(yīng)用正在從社會消費端向生產(chǎn)端延伸：不僅作為文化數(shù)字化的重要技術(shù)支撐，助力文化業(yè)態(tài)打破時空局限、實現(xiàn)多維升級；也走向制造業(yè)領(lǐng)域的“新型工業(yè)軟件”，支持實時、智能、高度可視化的數(shù)字場景，幫助企業(yè)生產(chǎn)提質(zhì)增效。

數(shù)字交互引擎憑借其在數(shù)據(jù)可視化、實時渲染、友好交互等方面的能力，已成為工業(yè)數(shù)字孿生重要的構(gòu)建及運行平臺，并支撐各行各業(yè)的數(shù)字孿生在應(yīng)用層面提升實時性，使數(shù)字孿生技術(shù)在實時交互、靈活部署方面更進(jìn)一步。數(shù)字交互引擎與數(shù)字孿生技術(shù)的結(jié)合，不僅可在數(shù)字空間中將物理實體構(gòu)建為可視化、智能化的“副本”，還能支持?jǐn)?shù)據(jù)的實時感知接入、可視化展現(xiàn)，實現(xiàn)3D模型的實時渲染和展示，支持用戶對孿生體的快速查看、調(diào)用和修改，為汽車、民航等工業(yè)制造領(lǐng)域提供實時監(jiān)控管理、演練測試的數(shù)字場景。

未來，隨著數(shù)字交互引擎集成更加成熟的AI能力，也將進(jìn)一步提升數(shù)字孿生構(gòu)建的效率與智能化水平。例如，自動駕駛的仿真測試，可通過采集真實數(shù)據(jù)，在數(shù)字交互引擎中重建數(shù)字場景，然后進(jìn)行編輯、生成更多場景。采用 AIGC 技術(shù)可以讓這項工作效率大幅增長，并且可以創(chuàng)造出更多的合成數(shù)據(jù)，填補真實數(shù)據(jù)中的缺口，提升訓(xùn)練和測試樣本的多樣性、完備性和均衡性。AI與數(shù)字交互引擎的結(jié)合，將助力數(shù)字孿生技術(shù)以更智能化的形式服務(wù)于各行各業(yè)，促進(jìn)各領(lǐng)域提高研發(fā)生產(chǎn)效率、降低產(chǎn)業(yè)創(chuàng)新風(fēng)險。

趨勢六：沉浸式媒體催生3D在場

在信息爆炸的時代，新媒體已經(jīng)成為我們生活中不可或缺的一部分。視頻作為當(dāng)今互聯(lián)網(wǎng)時代重要的信息載體之一，在互聯(lián)網(wǎng)數(shù)據(jù)中具有非常高的占比。根據(jù)Sandvine的報告，2022年視頻服務(wù)占互聯(lián)網(wǎng)流量的65.93%。同時，截至2022年12月，我國網(wǎng)絡(luò)視頻（含短視頻）用戶規(guī)模達(dá)10.31億，較2021年12月增長5586萬，占網(wǎng)民整體的96.5%。在這個背景下，如何更有效地傳遞信息，提供更好的用戶體驗，成為了新媒體領(lǐng)域亟待解決的問題。

多媒體技術(shù)經(jīng)歷了電視、PC流媒體、移動互聯(lián)等階段，其中標(biāo)準(zhǔn)、設(shè)備、交互方式均發(fā)生了對應(yīng)的變化。技術(shù)也不斷發(fā)展。未來，多媒體技術(shù)將聚焦四大方面，一是如何提高qoe和qos，進(jìn)一步降低時延、提高壓縮比。二是更高效的內(nèi)容生成和呈現(xiàn)，如AIGC、HDR技術(shù)。三是更多樣的內(nèi)容、互動內(nèi)容、新媒體，以及沉浸式交互和體驗。四是更深入產(chǎn)業(yè)，助力產(chǎn)業(yè)互聯(lián)網(wǎng)。

一、沉浸式體驗與交互：從平面到沉浸式體驗的升級

隨著虛擬現(xiàn)實（VR）、增強現(xiàn)實（AR）以及混合現(xiàn)實（MR）等技術(shù)的發(fā)展，沉浸式體驗和交互逐漸成為新媒體的發(fā)展方向。3DoF（自由度）視頻已經(jīng)在視頻號、快手等平臺實現(xiàn)商用，裸眼3D產(chǎn)品也逐漸走進(jìn)大眾視野。這些技術(shù)的應(yīng)用為用戶提供了更加真實、身臨其境的感官體驗，使用戶在享受內(nèi)容的同時，更加沉浸其中。未來，隨著硬件的進(jìn)一步成熟和6DoF技術(shù)的演進(jìn)，更多的UGC（用戶生成內(nèi)容）3D沉浸式內(nèi)容將會出現(xiàn)。此外，模型文件將成為多媒體的重要載體。例如，3D模型可以用于游戲、電影、廣告等多個領(lǐng)域，為用戶帶來更加豐富的視覺體驗。同時，隨著5G等新一代通信技術(shù)的普及，沉浸式體驗的傳輸速度和質(zhì)量也將得到顯著提升。

二、高效內(nèi)容生成與呈現(xiàn)：AI技術(shù)的加持

伴隨著人工智能技術(shù)的不斷進(jìn)步，AIGC技術(shù)在多媒體的文字、圖片生成等方面已經(jīng)實現(xiàn)商用。未來，AIGC技術(shù)將繼續(xù)聚焦生成更加穩(wěn)定的視頻和3D內(nèi)容。同時，在垂直領(lǐng)域如數(shù)字人、超分、老片修復(fù)等方向，AI技術(shù)將不斷強化多媒體的能力，為用戶提供更高質(zhì)量的內(nèi)容。此外，深度學(xué)習(xí)技術(shù)將進(jìn)一步提升視頻編解碼的壓縮效率。隨著更多樣化的塊劃分方法和編碼模式的不斷涌現(xiàn)，以及更復(fù)雜的預(yù)測和變換技術(shù)的引入，傳統(tǒng)視頻編碼算法的復(fù)雜度不斷提高。深度學(xué)習(xí)技術(shù)為圖像/視頻編碼框架定義了全新的結(jié)構(gòu)范式，實現(xiàn)了圖像和視頻編碼器性能的顯著提升，這為圖像/視頻編碼領(lǐng)域帶來了新的研究思路和方向。

三、從消費互聯(lián)網(wǎng)到產(chǎn)業(yè)互聯(lián)網(wǎng)：根據(jù)場景進(jìn)行優(yōu)化

隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展，產(chǎn)業(yè)互聯(lián)網(wǎng)逐漸崛起，為各行各業(yè)帶來了新的機遇。在這個過程中，多媒體技術(shù)在產(chǎn)業(yè)互聯(lián)網(wǎng)中的應(yīng)用將根據(jù)不同場景進(jìn)行優(yōu)化，從而更好地滿足產(chǎn)業(yè)互聯(lián)網(wǎng)的需求。在產(chǎn)業(yè)互聯(lián)網(wǎng)中，網(wǎng)絡(luò)協(xié)議需要根據(jù)場景需求進(jìn)行優(yōu)化以提高傳輸效率。傳統(tǒng)的直播傳輸-播放模型存在諸多問題，如緩存固定、傳輸可靠性過高、無法區(qū)分視頻幀優(yōu)先級等。

針對這些問題，在消費互聯(lián)網(wǎng)中的WebRTC通信模型基礎(chǔ)上，進(jìn)行優(yōu)化，在網(wǎng)絡(luò)時延、QoE和可靠性等進(jìn)行優(yōu)化，對場景需求進(jìn)行最優(yōu)匹配。比如在2B2C的場景中，通過（1）信令改造，利用miniSDP和0-RTT的結(jié)合，大幅減少信令耗時、提升信令交互成功，進(jìn)而降低首幀耗時和提升開播成功率。（2）音視頻改造，讓W(xué)ebRTC支持AAC，H.265，附加前向糾錯，抗50%以上丟包。還引入了B幀，增強了畫質(zhì)，同時大幅減少了碼率。（3）傳輸改造，采樣柔性分級丟幀的傳輸策略來漸進(jìn)式降低碼率，以適應(yīng)弱網(wǎng)情況。支持P2P分發(fā)網(wǎng)絡(luò)，能夠?qū)⒖赐灰曨l流的用戶群就近地組織成網(wǎng)絡(luò)，相互分享傳輸。實現(xiàn)延時可降低到800ms以內(nèi)，并同時兼顧延時、卡頓和首幀耗時，綜合QoS遠(yuǎn)超傳統(tǒng)直播。可以廣泛應(yīng)用在電商直播、體育賽事直播等領(lǐng)域另外一些場景，比如遠(yuǎn)程作業(yè)等2B場景，通過（1）信令改造：提升信令鏈路對網(wǎng)絡(luò)異常抵抗能力，減少網(wǎng)絡(luò)異?；謴?fù)時間，提升視頻應(yīng)用穩(wěn)定性。（2）音視頻改造，優(yōu)化相機采集、視頻渲染和視頻編解碼耗時，從音視頻處理層面減少端到端畫面延遲。（3）傳輸改造，以減少視頻傳輸延遲為目標(biāo)，適當(dāng)平衡抗丟包和抗網(wǎng)絡(luò)波動能力，減少視頻延遲；并引入多網(wǎng)傳輸策略，減少單一網(wǎng)絡(luò)依賴，提升傳輸穩(wěn)定性。實現(xiàn)了畫面延時可降低到100ms以內(nèi)，兼顧抗弱網(wǎng)能力，在工業(yè)遠(yuǎn)程作業(yè)、醫(yī)療等領(lǐng)域應(yīng)用前景廣泛。

趨勢七：腦機接口從醫(yī)療突破邁向交互革命

腦機接口（BCI，brain-computer interface），是在人或動物腦與外部設(shè)備間建立的直接連接通路，實現(xiàn)大腦與外部設(shè)備的直接交互。根據(jù)傳感器或電極植入部位不同，主要分為非侵入式（Non-invasive）和侵入式（Invasive）兩大類。

如果從1924年德國醫(yī)生漢斯·伯格開發(fā)腦電圖（EEG）算起，腦機接口經(jīng)過百年的近現(xiàn)代技術(shù)發(fā)展，已形成一系列基本的技術(shù)研究和應(yīng)用范式。然而，由于對人腦原理研究認(rèn)識進(jìn)展的緩慢和局限性，目前腦機接口整體仍處于發(fā)展早期。

近年來在數(shù)字技術(shù)尤其AI不斷突破的加持下，加上生物相容性電極、小型化設(shè)計與集成、微創(chuàng)植入、多模式傳感器等關(guān)鍵技術(shù)進(jìn)展，腦機接口呈現(xiàn)出加速發(fā)展的趨勢。預(yù)計醫(yī)療、軍事、教育、混合現(xiàn)實交互、類腦智能等領(lǐng)域?qū)l(fā)揮重點帶動作用，全球商用市場將以17%的年平均增長率到2030年突破60億美元。從長遠(yuǎn)看，腦機接口的意義更為重大，是人類應(yīng)對人工智能威脅、減弱老齡化社會沖擊、探索人類本質(zhì)等重大問題，構(gòu)建人機和諧社會的重要路徑之一。

一、腦機接口加速腦科學(xué)研究，助力醫(yī)療領(lǐng)域神經(jīng)系統(tǒng)疾病監(jiān)測及診療突破

醫(yī)療領(lǐng)域是腦機接口未來發(fā)展的首要牽引，占據(jù)約60%市場份額，預(yù)計未來十年保持突出。腦機接口與醫(yī)療的結(jié)合應(yīng)用展現(xiàn)出廣闊的前景，能幫助開發(fā)更好的診療和康復(fù)手段，并加速神經(jīng)科學(xué)和臨床神經(jīng)醫(yī)學(xué)研究。重點應(yīng)用方向包括：

神經(jīng)調(diào)節(jié)：神經(jīng)發(fā)育障礙和退行性導(dǎo)致的疑難疾病，腦機接口可實現(xiàn)精準(zhǔn)監(jiān)測、分析和干預(yù)。如腦深部刺激技術(shù)，正加速應(yīng)用于癲癇和帕金森病治療。對于學(xué)習(xí)障礙和自閉癥等，基于腦電反饋的及時干預(yù)有顯著應(yīng)用潛能，如集中注意力、提升閱讀效率。

運動恢復(fù)：通過捕捉大腦的運動意圖并轉(zhuǎn)換為控制信號，腦機接口可以幫助肢體受損或癱瘓人員恢復(fù)部分自主運動能力。如瑞士洛桑聯(lián)邦理工大學(xué)成功讓脊髓受損患者恢復(fù)行走能力，Neuralink以頸脊髓損傷等患者為臨床試驗重點對象。

感官補償：腦機接口還能針對感官缺陷或損傷患者，解碼大腦信息并實現(xiàn)感官補償。目前助聽方面已發(fā)揮重要作用，并向語音、視覺等拓展。如鎖定綜合征和漸凍癥會導(dǎo)致失語，患者借助腦機接口能控制光標(biāo)、文字生成、語音合成等，與外界重建交流。如加州大學(xué)成功將大腦信號轉(zhuǎn)換成合成語音，幫助中風(fēng)失語女性以高達(dá)80字/分鐘的速度再“說話”。

未來，腦機接口可望向神經(jīng)系統(tǒng)相關(guān)的疾病治療、人體增強等多樣化的場景深化應(yīng)用。研發(fā)重點和難點之一涉及大腦記憶和意識的疾病，如阿爾茨海默癥，利用腦機接口實時監(jiān)測和干預(yù)可能加速病理研究和診療手段開發(fā)，并支持對人類大腦原理的研究。

二、腦機接口與混合現(xiàn)實深化融合，將推動新一代人機交互模式變革

新一代XR設(shè)備的興起，激發(fā)人機交互模式的演進(jìn)需求，驅(qū)動腦機接口的融合發(fā)展。腦機接口可以實現(xiàn)更直接的腦電交互，結(jié)合XR等的視覺、手勢、語音等交互，能夠提供更為豐富、自然的交互方式。近期突出的市場創(chuàng)新進(jìn)展有：

肌電交互：Meta正在研發(fā)一款具有革命性的交互腕帶，基于EMG（肌電圖）讀取用戶手臂神經(jīng)信號，可以在手指運動發(fā)生前就定位跟蹤，甚至能感知極微小的手勢，能用于隔空操控鼠標(biāo)、打字、玩游戲等。

眼動交互：蘋果正式發(fā)布頭顯Vision Pro，提出空間計算并展現(xiàn)出驚艷的虛實交互體驗。其中暗藏了眼動交互功能，如通過監(jiān)測瞳孔變化預(yù)測用戶行為從而實時重建UI，使得個性化交互更便捷、流暢。

腦電+XR多重交互：OpenBCI與Varjo合作開發(fā)出Galea BCI設(shè)備，成功把包含多種傳感器的非侵入式腦機接口系統(tǒng)和混合現(xiàn)實系統(tǒng)整合一體，創(chuàng)造出能進(jìn)行多重體驗交互的新型軟硬件平臺，如讓殘疾人能更精準(zhǔn)腦控?zé)o人機。

未來在商業(yè)及生活服務(wù)方面，腦機接口與XR等結(jié)合適用領(lǐng)域會十分廣泛，如娛樂、社交、身份識別、疲勞干預(yù)、個性化學(xué)習(xí)等。這類腦機技術(shù)多采用非植入式，更加安全便捷、更易被大眾接受，更有可能形成消費級應(yīng)用從而加速腦機接口普及。

三、腦機接口與人工智能相輔相成，成為促進(jìn)人機和諧共生的重要路徑之一

生成式AI爆發(fā)帶來潛在威脅，提高了腦機接口發(fā)展的必要性。腦機接口有望架設(shè)人腦與數(shù)字體、機器等的高速連接，增強人腦能力避免被直接替代，同時促進(jìn)更安全、高效的AI發(fā)展。類腦智能成為重點發(fā)展方向之一，主要有兩方面：

提高大腦解讀能力：AI大模型等技術(shù)的加速突破，能支持更高效處理腦機接口采集的大量腦信號，提升對大腦文字、影像等信息解碼與重建效率，促進(jìn)大腦信息處理機制等的基礎(chǔ)研究。如大阪大學(xué)研究團(tuán)隊基于擴散模型，成功重建通過功能近紅外光譜（fMRI）獲得的人腦活動圖像。

促進(jìn)類腦計算發(fā)展：腦機接口促進(jìn)腦數(shù)據(jù)采集和腦科學(xué)研究，能反過來支持類腦計算的框架、算法、芯片等技術(shù)創(chuàng)新，跳出馮-諾伊曼計算結(jié)構(gòu)局限，推動更低功耗、高效率、可信可控的AI發(fā)展。如IBM推出類腦芯片原型NorthPole，相比傳統(tǒng)CPU大幅提升能效25倍。

未來隨著腦機接口和AI結(jié)合的進(jìn)一步深入，長期有望促成新的類腦計算結(jié)構(gòu)體系、賽博格（人機融合體）、腦聯(lián)網(wǎng)等的發(fā)展突破，降低AI風(fēng)險、促進(jìn)人機和諧共生。

04未來連接

趨勢八：星地直連通信推動泛在網(wǎng)絡(luò)覆蓋

1月3日，美國太空探索技術(shù)公司使用獵鷹9號火箭，成功發(fā)射21顆“星鏈”衛(wèi)星，其中6顆衛(wèi)星具備“直連手機”功能。衛(wèi)星上新增一個面積為 25m2的中頻 PCS 頻譜天線，補充衛(wèi)星 Ku 和 Ka 頻段天線，同時配備先進(jìn)的 eNodeB 調(diào)制解調(diào)器，提供天基手機漫游接入服務(wù)，由于具有星間激光鏈路功能，Starlink 具備提供全球任何地區(qū)任何時段普通手機接入的能力。1月11日，榮耀Magic6 系列旗艦新品，號稱實現(xiàn)了體積最小、信號最穩(wěn)、且最省電的手機衛(wèi)星通信體驗。開年發(fā)生的星側(cè)和端側(cè)兩個標(biāo)志性事件，標(biāo)志著2024年也許成為星地直連泛在網(wǎng)絡(luò)全面普及的元年。

信息通信技術(shù)作為第三次科技革命的核心力量，自誕生起就以“Anytime，Anywhere，Anyone，Anything”為終極目標(biāo)。如今的地球上，地面蜂窩網(wǎng)絡(luò)已經(jīng)覆蓋了70%的人口，但覆蓋的地表面積實際只有20%。當(dāng)發(fā)生摧毀通信設(shè)施的自然災(zāi)害或身處無網(wǎng)絡(luò)地區(qū)的人為事故時，“失聯(lián)”的悲劇仍然難以避免，這也為攻克“緊急狀態(tài)通信”這一難關(guān)提出了迫切需求。星地直連通信技術(shù)就是在這樣的背景下發(fā)展而來，迄今已取得很大進(jìn)步。2022年底，蘋果公司、華為公司相繼發(fā)布了支持短報文（類似手機短信功能）應(yīng)急通信服務(wù)的新款手機。2023年，華為又推出了Mate 60Pro手機，依托天通衛(wèi)星實現(xiàn)了星地直連語音通信。這一系列技術(shù)突破和產(chǎn)品創(chuàng)新，預(yù)示著星地直連通信已步入實用化的快車道。據(jù)美國市場分析公司ABI Research預(yù)測，隨著NTN（非地面網(wǎng)絡(luò)）技術(shù)不斷發(fā)展，預(yù)計到2030年，全球?qū)⒂?.7億臺NTN移動終端設(shè)備，產(chǎn)生的收入將達(dá)163億美元，從2022年至2030年的復(fù)合年均增長率將達(dá)76%（過去10年為22%），基于手機直連衛(wèi)星的泛在網(wǎng)絡(luò)覆蓋的時代即將到來。

星地直連通信的突破主要得益于兩個因素。一方面，衛(wèi)星和火箭技術(shù)加速創(chuàng)新。可回收火箭技術(shù)日臻成熟，衛(wèi)星發(fā)射成本顯著降低。美國SpaceX公司的Starlink（星鏈系統(tǒng)）正在以每年上千顆的速度積極部署近地軌道。目前，Starlink 2.0 Mini衛(wèi)星已經(jīng)發(fā)射，相較于1.0版本，其體積擴大了4倍，重量增加了3倍，通信能力提高了4倍。未來，完整的Starlink 2.0衛(wèi)星將重達(dá)1.5噸。同時，美國衛(wèi)星通信公司AST Mobile已開始部署基于低軌道的64平米超大陣列天線。衛(wèi)星重量的增加、天線面積的擴大、部署密度的增長，都降低了對地面設(shè)備天線大小和功率強度的需求。盡管Starlink目前仍然需要較大的地面設(shè)備，但正在向手機直接與衛(wèi)星進(jìn)行寬帶通信的目標(biāo)挺近。衛(wèi)星與火箭技術(shù)突破，促使天地網(wǎng)絡(luò)的體驗越來越接近，并可實現(xiàn)二者之間順滑切換，這成為普及衛(wèi)星通信技術(shù)的核心動力。

另一方面，民用手機逐步實現(xiàn)星地網(wǎng)絡(luò)兼容。近年來，華為公司與北斗系統(tǒng)開展的合作、蘋果公司與美國衛(wèi)星通信系統(tǒng)“全球星”開展的合作，都是通過在手機中集成專用衛(wèi)星通信芯片，以實現(xiàn)寬窄帶結(jié)合的直連衛(wèi)星功能。眼下，星地通信仍會以窄帶為主，主要通過短信和語音通信，這種方式在應(yīng)急、野外、高空、遠(yuǎn)洋等場景，有著廣泛應(yīng)用前景。同時，我國芯片廠商已推出星地一體化通信模組。未來隨著設(shè)備加速普及，該模組的價格會快速下降，趨向與傳統(tǒng)手機通信模組持平，這將為星地網(wǎng)絡(luò)兼容的民用手機的大規(guī)模普及，打下堅實基礎(chǔ)。

歷次通信技術(shù)變革都會帶來信息通信與互聯(lián)網(wǎng)領(lǐng)域的產(chǎn)業(yè)新機遇。星地直連、6G網(wǎng)絡(luò)的時代，將是一個低成本泛在（含地面、海洋、空中、太空等）接入的時代，必然催生大量的軟硬件需求。其中一個重點趨勢是對于寬窄帶結(jié)合的即時通信和應(yīng)急通信產(chǎn)品的新需求，由此帶來對語音和視頻壓縮技術(shù)的新需求。這些技術(shù)在即時通訊工具、在線會議等互聯(lián)網(wǎng)產(chǎn)品的普及中，曾發(fā)揮了決定性作用，在衛(wèi)星通信時代也會成為爆款應(yīng)用的關(guān)鍵。另外一個重點趨勢是泛在物聯(lián)網(wǎng)的爆發(fā)。在各種野外生態(tài)或工程監(jiān)測領(lǐng)域，如抗擊自然災(zāi)害、動植物保護(hù)、工程建設(shè)等，窄帶衛(wèi)星通信與邊緣計算、可再生能源等相結(jié)合，將帶來應(yīng)用場景上的全新可能性。比如，我國的國家電網(wǎng)公司已經(jīng)在野外電力設(shè)備監(jiān)測場景下使用窄帶衛(wèi)星通信技術(shù)。

必須看到，商業(yè)航天、衛(wèi)星制造、通信設(shè)備等領(lǐng)域，均處于大國競爭前沿。比如，太空軌道、通信頻譜都是有限資源，全球遵循“先到先得、先占永得”原則。這方面，盡管我國星網(wǎng)集團(tuán)已公布上萬顆衛(wèi)星的發(fā)射計劃，但仍然遠(yuǎn)低于Starlink等美國同行的進(jìn)度?？梢姡l(fā)揮國家統(tǒng)籌力量、依托巨大市場容量、系統(tǒng)化扶持龍頭企業(yè)、建立產(chǎn)業(yè)生態(tài)和技術(shù)壁壘等，都是一個國家能否在新的通信革命中取得突出的要素。

趨勢九：eVTOL加速空中出行奔赴新時代

隨著城市化進(jìn)程加速，交通擁堵和環(huán)境污染問題日益突出，人類社會對綠色高效的交通方式的需求日益迫切。因此，開發(fā)低空空域、實現(xiàn)低空出行、發(fā)展低空經(jīng)濟(jì)已成為解決這些問題的重要選擇之一。由電動垂直起降飛行器（electric vertical take-off and landing，eVTOL）驅(qū)動的空中交通被視為推動低空經(jīng)濟(jì)發(fā)展的核心引擎。eVTOL采用以新能源電池作為動力的分布式電推進(jìn)系統(tǒng)，能有效降低飛行噪音和提升操作系統(tǒng)的安全性，同時實現(xiàn)垂直起降、無需跑道，是一種理想的綠色智能交通工具。

從未來產(chǎn)業(yè)發(fā)展來看，eVTOL應(yīng)用場景廣闊。現(xiàn)階段最主要的是替代直升機，在測繪、消防救援、電力巡線、警用巡查、醫(yī)療救護(hù)、搜救、海上石油鉆井、農(nóng)業(yè)植保、農(nóng)業(yè)飛防等領(lǐng)域廣泛應(yīng)用。而行業(yè)內(nèi)普遍期望，eVTOL能廣泛應(yīng)用于以城市和區(qū)域出行為主的空中載人客運。在不同應(yīng)用場景中，載人客運是必然的核心發(fā)展方向，因為人的時間價值遠(yuǎn)遠(yuǎn)高于貨物。預(yù)計eVTOL率先在載貨物流、城市服務(wù)、消防救災(zāi)等場景開始商業(yè)化運營，隨著技術(shù)發(fā)展和市場成熟，載客eVTOL將邁入大規(guī)模商業(yè)化時代。電池續(xù)航里程提升，使得eVTOL主機廠在機型研發(fā)方面更傾向于城際和區(qū)域出行類型的機型，主要是由以下因素驅(qū)動：城際和區(qū)域出行的單位經(jīng)濟(jì)效益高、為客戶節(jié)省的時間多、所需的飛行頻率和機隊密度較低和公眾接受度高。當(dāng)前載人客運的展示和試點推廣日趨火熱，2024年奧運會和2025年世博會的試運營計劃或開啟“eVTOL元年”。未來十年，在政府、產(chǎn)業(yè)巨頭和民間資本的助推下的eVTOL低空交通領(lǐng)域，產(chǎn)業(yè)發(fā)展與投資局面很可能發(fā)生劇變。

面對多元化應(yīng)用場景需求，eVTOL在關(guān)鍵核心技術(shù)，特別是飛行器構(gòu)型設(shè)計方面，仍處于驗證比較、市場選擇到大規(guī)模應(yīng)用的“前夜”，但數(shù)字技術(shù)加速和賦能已成共識，并在實踐中落地。綜合國內(nèi)外情況來看，eVTOL在科技創(chuàng)新方面呈現(xiàn)“電動化、長續(xù)航、智能化”三大技術(shù)趨勢：

第一，純電推進(jìn)的eVTOL成為主流，細(xì)分技術(shù)路線的優(yōu)勢需在場景中體現(xiàn)。

eVTOL普遍采用電推進(jìn)系統(tǒng)作為動力裝置，是一種航空領(lǐng)域的顛覆性技術(shù)。電推進(jìn)系統(tǒng)利用電力驅(qū)動多個推進(jìn)器作為動力裝置，能有效提升飛行器氣動效率、載運能力、環(huán)保性和魯棒性等。傳統(tǒng)直升機使用內(nèi)燃機或渦輪發(fā)動機作為動力裝置，噪音大、污染嚴(yán)重、能效低。

eVTOL在商業(yè)化的過程中形成了不同構(gòu)型或技術(shù)路線，其中多旋翼構(gòu)型實現(xiàn)技術(shù)路線簡單，但有效載荷和航程相對有限；矢量推進(jìn)構(gòu)型（傾轉(zhuǎn)旋翼、涵道）和復(fù)合翼構(gòu)型eVTOL在航程、巡航速度和載重比方面優(yōu)勢明顯，具有較好的有效載荷、最大起飛重量和運營經(jīng)濟(jì)性，更適合在城際運輸?shù)瓤罩薪煌ㄉ虡I(yè)場景中應(yīng)用推廣。隨著電池技術(shù)發(fā)展，復(fù)合翼及矢量推進(jìn)構(gòu)型相對于多旋翼的優(yōu)勢會越來越明顯。全球900多個eVTOL設(shè)計研發(fā)項目的統(tǒng)計數(shù)據(jù)顯示，約320個項目選擇矢量推進(jìn)構(gòu)型，約260個選擇多旋翼構(gòu)型，約150個選擇復(fù)合翼構(gòu)型，其他項目選擇懸停自行車和個人飛行器、電動旋翼機設(shè)計。

第二，高能量密度鋰電池的技術(shù)突破，進(jìn)一步提升eVTOL續(xù)航里程。

電池技術(shù)突破助力eVTOL實現(xiàn)中長距離城際飛行。鋰電池因其高能量密度和安全性成為大多數(shù)eVTOL主機廠的首選動力來源，尤其在目標(biāo)航程約200-300公里的范圍內(nèi)，其能源效率和成本優(yōu)勢明顯。頭部企業(yè)認(rèn)為電池能量密度在300Wh/kg以上，eVTOL性能已經(jīng)展現(xiàn)出比較好的商業(yè)化能力。目前，業(yè)界最突出的航空級別電池的能量密度有望達(dá)到500Wh/kg，將會極大提升eVTOL續(xù)航里程，有潛力支持現(xiàn)有廠商的機型飛行400-500公里。總體而言，eVTOL電池的下一步研發(fā)目標(biāo)是在保證航空安全的前提下，提高電池能量密度并以業(yè)界可接受的成本實現(xiàn)量產(chǎn)。

氫能應(yīng)用潛力大但受限于總成本高和技術(shù)成熟度低，導(dǎo)致氫能源飛機的商業(yè)化進(jìn)程緩慢。長期來看，氫燃料電池的能量密度最高可達(dá)鋰電池的數(shù)百倍，具有廣闊的應(yīng)用前景。短期內(nèi)，由于成本、重量、儲運和潛在安全風(fēng)險等因素的限制，氫能電池的應(yīng)用空間仍然有限。德國創(chuàng)業(yè)公司H2FLY近年推出了一款液態(tài)氫飛機HY4，該飛機為雙體式、四座位、單發(fā)設(shè)計，主要用于技術(shù)驗證和演示；空中客車等公司則計劃在2035年前推出氫能飛機。

第三，“軟件定義飛行器”和空中交通管理智能化共同加速無人駕駛愿景。

得益于智能駕駛技術(shù)發(fā)展與政策支持等有利因素，eVTOL飛行器正逐步從傳統(tǒng)的有人駕駛模式過渡到更高效的無人駕駛模式，呈現(xiàn)出“軟件定義飛行器”的趨勢。未來eVTOL在空中交通競爭中的關(guān)鍵既包括飛行器設(shè)計和性能，也包括以AI為核心的軟件技術(shù)，同時還需要配備高效的數(shù)字化空中交通管理系統(tǒng)來支持大量無人駕駛eVTOL運行。

在早期推廣階段，為了使eVTOL符合適航安全要求以及更容易被乘客接受，主機廠可能會為早期機型配備飛行員或安全員、延后無人駕駛eVTOL研發(fā)計劃，或同時研發(fā)無人駕駛和有人駕駛eVTOL。然而，從長遠(yuǎn)來看，實現(xiàn)自主飛行、取消飛行員是降低運營成本、提高經(jīng)濟(jì)效益的必然選擇。億航、峰飛和波音公司旗下的Wisk專注研發(fā)無人駕駛飛行器，億航已獲得我國頒發(fā)的適航證，峰飛計劃在配備安全員的前提下進(jìn)行商業(yè)試運營，而Wisk計劃在2028年洛杉磯奧運會期間才會開始試運行無飛行員、全自主飛行的飛行器。

此外，低空基礎(chǔ)設(shè)施建設(shè)將助力高效安全空中交通管理，加速低空空域開放和利用進(jìn)程。eVTOL在低空運行、服務(wù)公眾，流量大于現(xiàn)有通航直升機。盡管eVTOL航空器數(shù)量遠(yuǎn)低于城市內(nèi)網(wǎng)約車，但其運行環(huán)境為三維，受天氣等因素影響，復(fù)雜性和不確定性較高。數(shù)字技術(shù)可通過以下途徑助力空中交通管理智能化：（1）低成本、高精度、高可靠性的通信、導(dǎo)航、監(jiān)視系統(tǒng)，實時獲取航空器信息，降低航空器間隔，提高空域流量和安全性；（2）基于傳統(tǒng)氣象雷達(dá)以及激光雷達(dá)等新一代傳感器收集的氣象數(shù)據(jù)，結(jié)合AI大模型等技術(shù)，為低空飛行帶來更精準(zhǔn)、網(wǎng)格化的氣象服務(wù)；（3）基于云計算、邊緣計算、深度學(xué)習(xí)和人工智能的管控和調(diào)度系統(tǒng)，為eVTOL飛行提供決策支持，如實時航路規(guī)劃、起降場選擇；（4）集成多種技術(shù)的空域數(shù)字化平臺為空域管理部門進(jìn)行空域設(shè)計、航道規(guī)劃、模擬測試提供數(shù)字化工具。

展望未來，我們期待在eVTOL技術(shù)、新能源技術(shù)和數(shù)字技術(shù)的發(fā)展和共同引領(lǐng)下，以eVTOL為代表的空中出行方式能夠加快實現(xiàn)，改變以地面交通為主導(dǎo)的出行模式，推動全球加速奔赴空中出行新時代。

趨勢十：多能流實時協(xié)同重塑虛擬電廠

隨著新能源技術(shù)和信息技術(shù)的不斷發(fā)展與成熟，在雙碳目標(biāo)背景下，虛擬電廠逐漸顯現(xiàn)出其在能源結(jié)構(gòu)轉(zhuǎn)型中的關(guān)鍵作用，成為實現(xiàn)能源優(yōu)化配置的重要解決策略。在未來電網(wǎng)的構(gòu)成中，源端、負(fù)荷端和儲能端三個關(guān)鍵部分正在經(jīng)歷顯著變革。具體而言，源端將見證波動性清潔能源以大規(guī)模、高比例的方式接入電網(wǎng)；在負(fù)荷端，越來越多的用戶正逐漸轉(zhuǎn)變?yōu)榘l(fā)電、儲能及電網(wǎng)響應(yīng)的參與者；而在儲能端，電化學(xué)儲能技術(shù)的發(fā)展及氫儲能技術(shù)的研究，正大幅降低能量存儲與運輸?shù)某杀尽?/p>

過去，虛擬電廠的應(yīng)用范圍相對有限，但現(xiàn)在我們需要擴展其應(yīng)用至城市乃至城市間的更廣闊層面。城市運行中的三大核心調(diào)節(jié)性負(fù)荷—工業(yè)、算力和交通—隨著工業(yè)創(chuàng)新、大規(guī)模模型算力以及新能源汽車等領(lǐng)域的發(fā)展，其電力需求持續(xù)增長。這既是挑戰(zhàn)，也是機遇。數(shù)字化集成的虛擬電廠能夠通過承擔(dān)多網(wǎng)耦合和協(xié)同工作，將上述幾類主要用電部門轉(zhuǎn)變?yōu)榭烧{(diào)節(jié)資源。這一轉(zhuǎn)變將有效應(yīng)對能源結(jié)構(gòu)轉(zhuǎn)型帶來的電網(wǎng)壓力，確保在新能源背景下，新型電力系統(tǒng)的平穩(wěn)轉(zhuǎn)型。

可再生能源消納以及電力電子化是實現(xiàn)碳中和的關(guān)鍵，穩(wěn)定電力供應(yīng)是實打?qū)嵉膭傂孕枨蟆ｋS著近年來新能源行業(yè)發(fā)展，電力電子資源的不斷增加，國家需要有更高效的數(shù)字化控制手段。近期在新能源及電力電子化領(lǐng)域發(fā)生的幾項重要事件：

1、蔚來參與全國規(guī)模最大的V2G需求響應(yīng)項目：2023年8月23日，車網(wǎng)互動驗證中心（e-Park）的V2G充放電系統(tǒng)需求響應(yīng)試驗在無錫正式啟動。這個系統(tǒng)是目前國內(nèi)規(guī)模最大的V2G充放電系統(tǒng)，為新型電力系統(tǒng)建設(shè)提供了堅實的支撐。

2、山東電力交易出現(xiàn)“負(fù)電價”現(xiàn)象：“五一”期間，山東電力現(xiàn)貨市場的實時交易電價經(jīng)歷劇烈波動，區(qū)間從1047.51元/兆瓦時降至-80元/兆瓦時（約1.05元/度至-0.085元/度），期間多次出現(xiàn)負(fù)電價，這一現(xiàn)象在電力市場中尤為罕見。

3、中廣核新能源深圳虛擬電廠的重大成就：到2023年中，中廣核新能源深圳虛擬電廠成為首批滿足并網(wǎng)接入要求的標(biāo)準(zhǔn)化虛擬電廠，并成功參與首輪精準(zhǔn)響應(yīng)。在虛擬電廠運營商中，其響應(yīng)容量和響應(yīng)精度均位居前列。

這些事件不僅標(biāo)志著行業(yè)的重大進(jìn)步，也展示了數(shù)字化控制在能源變革中的重要作用。工業(yè)、算力、交通等將是近幾年的重點應(yīng)用趨勢：

一、規(guī)模巨大、可調(diào)性強的工業(yè)可調(diào)節(jié)負(fù)荷可提供規(guī)模靈活性：

騰訊以鋼鐵工藝流程中可調(diào)節(jié)負(fù)荷為初步虛擬電廠試點，并逐步囊括多種可調(diào)節(jié)資源；初步盤查，可通過調(diào)整電爐的生產(chǎn)節(jié)奏和功率以獲得負(fù)荷靈活性；可根據(jù)不同優(yōu)化目標(biāo)對當(dāng)日生產(chǎn)計劃進(jìn)行調(diào)整：

1、容量調(diào)節(jié)：典型的短流程電爐煉鋼生產(chǎn)線能夠提供5-20MW的靈活性。這涉及到在保證生產(chǎn)不受影響的情況下對設(shè)備產(chǎn)出的調(diào)節(jié)，同時也需要平衡設(shè)備運行和人力資源的排產(chǎn)。在電網(wǎng)交互控制方面，電網(wǎng)需按不同時間尺度向負(fù)荷方發(fā)出通知并進(jìn)行控制。

2、方法優(yōu)化：為了獲得負(fù)荷靈活性，可以調(diào)整電爐的生產(chǎn)節(jié)奏和功率。這可能包括在響應(yīng)時段降低電爐功率，延長電爐運行時間，或?qū)嵭性O(shè)備錯峰使用。這樣做的目標(biāo)是在不損失總產(chǎn)量的前提下降低整體用電費用，并通過降低負(fù)荷獲得補助。

3、策略制定：可以根據(jù)不同的優(yōu)化目標(biāo)對當(dāng)日的生產(chǎn)計劃進(jìn)行調(diào)整。這包括設(shè)定不同的生產(chǎn)目標(biāo)，例如最快生產(chǎn)時間、最快生產(chǎn)時間加上模鑄、最低電價、最大化峰谷錯開、以及在最低電價下的需求側(cè)響應(yīng)等。這些目標(biāo)策略將指導(dǎo)未來的響應(yīng)方式。

二、數(shù)字基礎(chǔ)設(shè)施的能耗優(yōu)化，數(shù)據(jù)中心任務(wù)移動可改變負(fù)荷：

根據(jù)與其他數(shù)據(jù)中心是否互聯(lián)，數(shù)據(jù)中心有兩類：獨立的數(shù)據(jù)中心（如傳統(tǒng)的機房）；互聯(lián)網(wǎng)數(shù)據(jù)中心（IDC）：多個IDCs通過光纖可以進(jìn)行數(shù)據(jù)負(fù)荷傳輸，并與其之間傳輸數(shù)據(jù)的光纖網(wǎng)共同構(gòu)成算力網(wǎng)絡(luò)。

1、負(fù)荷轉(zhuǎn)移：在云計算場景下，尤其是在AI海量計算的時代，IDC負(fù)荷通過算力網(wǎng)絡(luò)轉(zhuǎn)移數(shù)據(jù)負(fù)荷，從而實現(xiàn)電力的轉(zhuǎn)移?？紤]到東西電力資源的巨大差異，這種負(fù)荷轉(zhuǎn)移在電力管理中尤為重要。

2、策略實施：數(shù)據(jù)中心騰訊自身做了應(yīng)用場景需求響應(yīng)特性測試。這包括在不影響任務(wù)性能的情況下，調(diào)節(jié)服務(wù)器功率，并關(guān)注響應(yīng)速度、響應(yīng)深度、響應(yīng)時長和響應(yīng)精度。

3、時效性考慮：探索數(shù)據(jù)中心服務(wù)器的負(fù)荷靈活性策略，并進(jìn)行靈活調(diào)節(jié)。這涉及到對實時性不敏感的計算任務(wù)進(jìn)行擴縮容和“斷點續(xù)算”，以快速改變負(fù)荷分布。這類任務(wù)包括科學(xué)計算、視頻渲染以及其他獨立或耦合并行任務(wù)。

三、與C端互動平移伸縮電動車充電狀態(tài)，聚合為“大電池”：

電動汽車（EV）將電力網(wǎng)絡(luò)與交通網(wǎng)絡(luò)這兩個復(fù)雜的人造系統(tǒng)緊密耦合；EV的充放電與出行由駕乘用戶決定，形成以EV為核心的信息-物理-社群系統(tǒng)（Cyber-Physical-Social System），帶來新的問題與調(diào)控潛力。

1、時空協(xié)同：在電力-交通網(wǎng)絡(luò)耦合的定義中，通過交通網(wǎng)絡(luò)轉(zhuǎn)移充電負(fù)荷，從而改變電網(wǎng)的潮流分布，這在新能源車時代尤其關(guān)鍵。

2、實施方案：通過電力控制中心，結(jié)合交通擁堵信息發(fā)布以及各充電站的可用容量，制定即時策略，引導(dǎo)電動汽車到達(dá)對交通系統(tǒng)和電力系統(tǒng)都最佳的位置進(jìn)行充電，以實現(xiàn)EV充電服務(wù)的效益最大化。

3、試點實驗：基于價格調(diào)控的電動營運車輛調(diào)度是接下來的一個重要嘗試方向。這包括利用出行價格調(diào)控車流密度和供需關(guān)系，以及利用充電價格調(diào)控充電需求的時空分布。目標(biāo)是解決出行需求與充電負(fù)荷的供需不平衡，通過各類價格對營運車輛進(jìn)行適當(dāng)引導(dǎo)。

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表，版權(quán)歸原作者所有。文章系作者個人觀點，不代表創(chuàng)業(yè)邦立場，轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問，請聯(lián)系editor@cyzone.cn。