編者按:本文來自微信公眾號 騰訊研究院( ID:cyberlawrc),作者: 何芙蓉,編輯:吳先之創(chuàng)業(yè)邦經授權轉載。
過去一年,我們見證了數(shù)字科技的加速度。每個人都身處變革巨浪之中,既對大模型的突破進展無比興奮,也對未來充滿了無限憧憬。
新年伊始,眺望未來2-3年的科技趨勢。我們正駛向一個由連接衍生交互、由計算催生智能的時代。
高性能計算、量子計算、云計算和邊緣計算這"四大計算“融匯貫通,正催生全新的計算范式。
通用人工智能漸行漸近,大模型走向多模態(tài),AI智能體可能成為下一代平臺, "AI科學家"有望加速問世。全球已達共識,AI治理將引領我們踏上更智慧、更安全的未來。
機器人演進加速,靈巧手讓人形機器人更敏捷、更像人。AI與生命科學的交融,將幫助我們洞察更多的生命奧秘。
我們會進入一個3D、全真在場的新世界。腦機接口不僅在醫(yī)療實現(xiàn)突破,正拓展至更多的互動場景?;蛟S不久的將來,我們將親自見證意識上載從科幻成為現(xiàn)實。
手機衛(wèi)星電話、垂直起降飛機將改變我們的應急方式和出行模式。交通網、信息網、能源網的融合,將推動智能、綠色的能源變革。
未來已來,一個充滿韌性和重塑的全新時代即將揭開序幕。讓我們擁抱變革,共同譜寫人類與科技和諧共生的新篇章!
(文末提供完整PPT版報告下載)
專家推薦:
在這個日新月異的變革時代,我們有幸見證并參與了數(shù)字科技的創(chuàng)新突破。特別是近年來,以大模型為代表的AI技術,讓我們看到了通用人工智能的曙光,有望大幅加速技術演進的步伐。
騰訊的2024數(shù)字科技趨勢,從連接、交互、計算和智能四個維度,對100多項未來技術和重點方向給出了趨勢性判斷。從星地直連的衛(wèi)星互聯(lián)網,到垂直起降飛機的未來交通網,再到能源、信息和交通的多網協(xié)同,未來網絡連接的廣度和深度都迎來無限可能。交互方式正在發(fā)生變革,數(shù)字交互引擎不僅讓虛擬世界更真實,也讓真實世界更豐富,未來的全新3D視界呼之欲出,腦機接口的新進展也帶來了更大的想象空間。計算無疑是各類智能的底層基礎支撐,也成為當前競爭的焦點領域。而智能的升級,不僅會給機器人注入具身智能,還給微觀世界的基因計算帶來新突破。預測未來的最好方式,就是創(chuàng)造未來。相信在行業(yè)各界的共同努力下,這些前瞻洞見會更快到來,從趨勢變成現(xiàn)實。
——丁漢中國科學院院士
去年以來,以生成式AI為代表的人工智能技術發(fā)展激蕩人心,正在引發(fā)智能的元革命??梢杂鲆姷奈磥?,智力將會成為一種基礎設施服務,新的IaaS呼之欲出。類比摩爾定律,未來可能會出現(xiàn)新的智能定律,對信息世界、物理世界和生命世界帶來全方位的影響。
未來十年,AI會無所不在。首先,現(xiàn)有的各類應用可以用AI重新做一遍,新的交互變革、體驗創(chuàng)新將會帶來更新的智能硬件、更多的智能服務,孕育出比歷次工業(yè)革命都巨大的產業(yè)機會。其次,AI會成為各領域的底層操作系統(tǒng),AI+機器人的具身智能,AI+生命科學的基因計算,AI+未來出行的自動駕駛汽車和垂直起降飛機,甚至AI+腦機接口的硅基和碳基結合的新生命體,都會一步步成為現(xiàn)實。最后,AI能力的提升也伴隨著風險的擴大,我們要充分發(fā)揮技術發(fā)明的智慧和把握應用方向的智慧,讓AI科技更善良、更有創(chuàng)意,朝著強化人、成就人的方向可持續(xù)發(fā)展。
——張亞勤中國工程院院士、清華大學智能產業(yè)研究院(AIR)院長
01重塑計算
趨勢一:高性能計算的“四算聚變”
算力,是數(shù)字時代的核心生產力。高性能計算,是先進算力的代表,它既包含了以高性能計算集群為代表的傳統(tǒng)計算體系,也包含了像量子計算一樣的未來計算硬件和軟件。高性能計算在氣象預測、地質勘探、新藥研發(fā)、新材料研發(fā)、人工智能等眾多應用領域發(fā)揮至關重要的價值,高性能計算技術的演進,引領著整個計算機科學技術的未來走向,甚至可能引發(fā)劃時代的科技飛躍,值得產業(yè)和社會持續(xù)關注。
今年,全球迎來高性能計算設施的大規(guī)模新建潮和升級潮,以 CPU 為計算核心的高性能計算1.0時代正在快速遠去,以 CPU+GPU 為計算核心的高性能計算2.0已全面到來。
未來幾年,高性能計算技術將呈現(xiàn)四個方面的發(fā)展趨勢:系統(tǒng)架構方面,高算集群、量子計算、云計算和邊緣計算的“四算融合”也將成為高性能計算 3.0 演進的新方向;關鍵硬件方面,計算芯片將迎來多元化發(fā)展;軟件應用方面,云原生技術將帶來高算服務的普及,同時科學計算模擬應用將大量增加;可持續(xù)計算方面,業(yè)界將更多的關注計算的效能,并加速高能效計算技術的研發(fā)與探索。
一、高算集群、量子計算、云計算和邊緣計算“四算”融合,衍生新技術路徑
云超同化。一方面,Web 服務、容器化等云原生技術正在快速應用于傳統(tǒng)高性能計算集群,使算力服務更易觸達:芬蘭 LUMI 集群已開始引入容器技術提高算力調度和應用搭建效率,并對外提供算力服務;IBM 也于年初發(fā)布了其首臺云原生高算集群 Vela;另一方面,不僅更多云服務商推出了高性能計算云服務,以谷歌為代表的頭部企業(yè)更進一步利用云計算天然的分布式計算優(yōu)勢,推出“算力多切片訓練”方案,打造超出常規(guī)算力集群性能的超大規(guī)模AI 訓練案例。
量超融合。高性能計算集群與量子計算機的融合已經成為行業(yè)共識,量子計算單元(QPU)正在逐漸成為新的專用計算加速模塊。要全面實現(xiàn)以CPU+GPU+QPU為計算核心的高性能計算 3.0 ,大致要經歷三個階段:第一階段,高算集群和量子計算的網絡互聯(lián);第二階段,互聯(lián)的高算集群與量子計算機可以通過專用的操作系統(tǒng)實現(xiàn)算力協(xié)同調度;第三階段,高算集群和量子計算之間實現(xiàn)從底層硬件到上層應用的深度系統(tǒng)集成,并能充分發(fā)揮各自的算力優(yōu)勢,共同完成復雜的計算任務。如IBM 、芬蘭 VTT 技術研究中心、本源量子等國內外的相關機構和企業(yè)已經開始相關研發(fā)工作并陸續(xù)發(fā)布了進展,并對外提供訪問服務。
量子集群出現(xiàn)、云服務普及。量子計算突出企業(yè)IBM于 2023 年 12 月公布全球首個可擴展量子計算系統(tǒng)Quantum System Two,引入模塊化架構和計算機集群設計,可讓系統(tǒng)容納 10000 個量子比特。模塊化量子計算集群的出現(xiàn),預示著可復制性更強、擴展性更好的量子計算機發(fā)展新路徑;同時,全球已有超過 20 家機構推出量子計算云服務,從整機公司如 IBM,發(fā)展到云服務商如亞馬遜云,再到科研院所如北京量子院。
高性能計算走向云邊協(xié)同。目前高性能邊緣計算(HPEC)還在成長中,其單點算力已可達千萬億次每秒,自動駕駛和機器人是典型應用場景。除傳統(tǒng)計算平臺外,神經形態(tài)芯片、光電計算芯片等新技術的成熟也在不斷提升邊緣算力和能效。而為獲得實時決策以及更高的信息安全環(huán)境,將部分數(shù)據(jù)處理、模型訓練以及推理等工作,從數(shù)據(jù)中心/云平臺遷移至云邊協(xié)同架構下,是必要的技術路徑。
二、高性能芯片多元發(fā)展,QPU 發(fā)展由數(shù)量轉向質量
芯片技術多元化發(fā)展加劇。首先包括微軟、 Meta 在內的科技企業(yè)紛紛推出自研高性能 CPU 和 AI 加速芯片,其次,除了傳統(tǒng)的 x86 架構以外,其他芯片架構的芯片也加入到高性能計算領域,并由落地應用:位于葡萄牙的集群 Deucalion 將采用與日本富岳集群相同的 ARM 架構高性能芯片 A64FX;算能科技日前向山東大學交付國內首臺RISC-V服務器集群,該集群擁有48顆RISC-V高性能芯片SG042。
存算一體,突破“內存墻”。傳統(tǒng)芯片均采用馮諾依曼計算架構,改架構的“內存墻”問題隨著算力的不斷提升而越發(fā)明顯,逐漸成為芯片性能進一步突破的瓶頸。業(yè)界紛紛采用存算一體技術思路,提升現(xiàn)有芯片性能的同時,研發(fā)神經形態(tài)計算芯片,探索“破墻”之路。Intel 、 AMD 和英偉達紛紛在各自最新的芯片產品中引入 HBM 和 LPDDR 等近存計算(Near-Memory Computing)技術;而神經形態(tài)計算(Neuromophic Computing)被認為是“后馮諾依曼時代”突破“內存墻”的重要計算技術路徑。受人類大腦原理的啟發(fā),神經形態(tài)計算芯片通過存內計算(Compute in Memory)方式,實現(xiàn)高算力的同時實現(xiàn)超低功耗。
量子比特制備路徑之爭將更激烈。量子比特的制備,是量子計算機研制的起點。今年,超導量子、光量子、離子阱、冷原子等多條量子比特制備路徑均有不錯的進展,“誰才是未來量子計算最終的技術路線”之爭將更加激烈。
QPU 發(fā)展數(shù)量與質量兼顧。雖然 IBM 發(fā)布1000+量子比特QPU, Atom Computing 宣稱創(chuàng)造 1000 +原子陣列,但IBM 最新發(fā)布的芯片互聯(lián)技術,以及哈佛大學和QuEra等聯(lián)合發(fā)布的邏輯量子比特制備和糾錯研究成果等,說明了QPU的發(fā)展,仍然處在追求比特數(shù)量和,以及關注諸如糾錯能力、可擴展性等更符合實用需要的技術。
三、云原生技術將釋放高性能算力潛能,科學計算模擬應用大量增加
云原生技術加快普及。從國內外云服務商發(fā)布的進展來看,云平臺容器服務將加快對高性能計算服務的支持,并進一步兼容CUDA、 ROCm 、 oneAPI 等并行計算軟件平臺,為用戶提供高度自動化的高性能計算工作環(huán)境,大大提高研發(fā)和實驗效率。高性能計算算力潛能將被進一步被釋放。
科學計算模擬應用和成就將迎來大爆發(fā)。一方面,全球高性能計算集群的大規(guī)模新建和升級、以及云原生技術應用,使算力服務更充足并更易觸達;另一方面,科學計算模擬的需求將更加強烈,未來幾年將會有更多的科學計算模擬基于高性能計算服務開展:從微觀粒子模擬、到血流和癌細胞模擬、再到核聚變模擬、以及氣象和地理空間模擬等等。進一步,科學計算與人工智能技術的結合,將比預計的要快,許多傳統(tǒng)模擬數(shù)值算法經 AI 優(yōu)化后,性能獲得大幅提升,科學家和科研團隊的生產力將迅速提高,科學研究將迎來快速進步的新形勢。
更多高性能計算集群嘗試人工智能大模型研發(fā)。傳統(tǒng)高算集群通過加裝 GPU 集群、結合云平臺高性能計算服務得到升級后,將具備更強的 AI 加速計算能力,進而可以支持人工智能大語言模型的訓練。比如:智譜 AI 的 ChatGLM3支持在神威高算上運行;美國阿貢國家實驗室開始基于 Aurora集群創(chuàng)建ScienceGPT,預計參數(shù)數(shù)量達到 1 萬億,將為廣泛的科學研究提供幫助。
四、業(yè)界將加大可持續(xù)高性能計算的踐行力度
高性能計算的能耗是驚人的。以TOP500 排名第一的Frontier 高算集群為例,其算力可達 1.6EFlop/s,功率可達 20 兆瓦,相當于近 1萬戶家庭用電水平。據(jù)統(tǒng)計,數(shù)據(jù)中心的耗電量約占全球耗電量的1%,我國 2020 年占比是2.7%。雖然當前尚無準確的數(shù)據(jù)中心能耗預測,但急劇增加的人工智能大模型訓練等高耗能計算應用,勢必會使這個數(shù)字繼續(xù)增加。
可持續(xù)計算,是數(shù)字經濟和雙碳目標背景下,高性能計算技術演進歷程中的路標和燈塔。擁有可持續(xù)高性能計算的技術,也將成為重要的競爭力。世界經濟論壇與今年發(fā)布的《2023 十大新興技術》報告,“可持續(xù)計算”位列其中。Intel、IBM、英偉達等先進計算企業(yè)也在不遺余力的踐行和推動可持續(xù)計算。
可持續(xù)計算通常指在設計、建造和使用計算機技術(包括硬件、系統(tǒng)、軟件)的過程中,力求實現(xiàn)最大的能源效率和對環(huán)境影響的最小化。未來,計算能效將成為評估高性能計算技術先進性的重要指標,而提高計算能效的途徑主要有三個:更高能效的計算軟硬件、更先進的冷卻技術、以及更合理的計算供需匹配。
高能效的計算軟硬件方面,存算一體將是硬件層面主要的技術發(fā)展路徑,而機器學習等人工智能技術與傳統(tǒng)科學計算的結合,將大大提升計算效率和精度,并從軟件層面大幅度節(jié)省計算資源。
冷卻技術方面,液冷技術,特別是浸沒式液冷技術將加快普及,并帶來 30%以上的耗能節(jié)約。
合理的算力供需匹配方面,計算能效將成為高性能算力更重要的技術參數(shù),而“量子效能”也將成為未來量子計算機研發(fā)和應用的重要評估指標。
02智能升維
趨勢二:多模態(tài)智能體加速AGI進程
剛剛過去的一年,注定是人工智能發(fā)展史上具有里程碑意義的大年。生成式人工智能的驚人進步,讓我們深切感受到未來AGI的巨大潛力和無限前景。
大模型從理解到生成,從感知到決策,能力不斷升。加上多模態(tài)、Agent、以及具身智能等方向的探索,AI有望完成“感知—決策—行動”的閉環(huán)。
一、多模態(tài)解析世界的本來面貌,并實現(xiàn)“三生萬物”
多模態(tài)是人類世界的本來樣貌,AGI的發(fā)展趨勢一定是朝向多模態(tài)。技術將從文本、圖像、視頻(2D和3D),再到聲、光、電,甚至分子、原子等各類模態(tài),而且具備跨模態(tài)遷移的特性。未來理想的框架是“多模態(tài)的對齊和融合 + 統(tǒng)一的編碼器和解碼器”。12月6日微軟發(fā)布的Copilot中,將GPT-4V的視覺能力與Bing搜索相結合,為用戶提供更好的圖像理解和生成體驗。7日,谷歌發(fā)布Gemini,主打原生大模型,無縫跨文本、圖像、視頻、音頻和代碼。谷歌稱,Gemini是第一個在MMLU(大規(guī)模多任務語言理解)方面優(yōu)于人類專家的模型,準確率達到90%(人類專家為89.8%)。
二、從大腦到Agent,大模型從CoPilot副駕,走向主駕駛
比爾蓋茨近日撰文:AI Agent將是下一個平臺,人工智能即將徹底改變人們使用計算機的方式并顛覆軟件行業(yè)。在不久的將來,任何上網的人都將能夠擁有由人工智能驅動的個人助手,遠超今天的技術水平。智能體由四個主要部分組成,包括多模態(tài)大模型(LMM)、長期記憶(Memory)、規(guī)劃(Planning)和工具使用(Tool Use)。業(yè)界AI智能體愈來愈多,如微軟AutoGen,發(fā)布短短兩周內,星標量就從390增到10K,并在 Discord上吸引了5000多名成員。它允許多個智能體扮演各種角色,如程序員、設計師,或是各種角色的組合,僅通過對話就可以完成編程任務。
三、端側大模型加速部署,或將成為未來交互新入口
大模型正在向端側轉移,AI推理將在手機、PC、耳機、音箱、XR、汽車,以及其它可穿戴式新型終端上運行。端側大模型具有一些獨特優(yōu)勢,如,本地數(shù)據(jù)處理效率更高,節(jié)省云端服務器帶寬和算力成本,對用戶數(shù)據(jù)更好的隱私保護,開啟更多交互新方式、新體驗等。
目前,一些手機已經在利用本地 AI支持如暗光拍攝、降噪和人臉解鎖等功能。未來借助端側大模型,并結合向量化后的各類個人數(shù)據(jù),用戶可以跟手機進行更流暢的交互,實現(xiàn)各種原生操作和功能。如,Humane 正式推出 AI Pin,搭載GPT4,可實現(xiàn)語音交互,也可以投影在手掌上交互。高通推出驍龍8 Gen3 ,支持終端側運行100億參數(shù)的模型。蘋果最新的M3芯片支持端側推理,且計劃推出更智能的Siri,為端側大模型生態(tài)做積極準備。
端側大模型應用具備三種可能性,首先是端側原生集成AI模型,類似siri,幫助用戶調用其他軟件,從而可能成為硬件新入口。其次,將大模型作為獨立app,例如MIT一位教授將開源模型集成在手機端做一個獨立app;第三,將大模型接入即時通訊軟件作為chatbot,例如What‘s App已經集成了Meta AI。
四、AI助力科研探索,貫穿科研全過程
在AI技術的加持下,科學研究的效率大大增加。通過理論探索、設計實驗、分析數(shù)據(jù)等方向為科學發(fā)現(xiàn)提供動力。AI與各個科學領域結合后,正在發(fā)生一場充滿潛力和挑戰(zhàn)的科技革命。
在理論探索階段,以ChatPDF為代表的LLM應用可以對既有文獻的梳理,加快科研信息檢索的效率,在此基礎上提出新的研究問題,對現(xiàn)象和數(shù)據(jù)觀察提出某種猜想,幫助科學家發(fā)現(xiàn)新問題。
在數(shù)據(jù)分析階段,AI可以通過大量數(shù)據(jù)和復雜的數(shù)據(jù)分析,幫助提取有用信息和填補數(shù)據(jù)缺失,從而提高數(shù)據(jù)質量和利用效率。降低對數(shù)據(jù)的依賴。在處理高度復雜和多變量的科學問題時,大模型能提供高效的計算能力和深入的洞見。
在科研領域,生成式AI被用于預測基因序列、發(fā)現(xiàn)新的藥物靶點以及設計新型的生物材料。使用深度學習技術,研究人員能夠預測DNA和RNA結合蛋白的序列特異性。這是應用卷積神經網絡(CNN)于基因組學的先驅性工作之一。如,麻省理工學院(MIT)的研究人員開發(fā)出一種擴散模型——FrameDiff,該模型能夠生成自然界中不存在的新型蛋白質結構。該模型可以生成多達500 個氨基酸序列的蛋白質主鏈,且無需依賴于預訓練蛋白質結構預測網絡。Nature雜志近日報道,一個由AI 指導機器人制造新材料的實驗室A-Lab,只用了 17 天就獨自創(chuàng)造了 41 種新材料,展現(xiàn)了AI科學家的未來潛能。
五、負責任AI走向深入,價值對齊助力大模型穩(wěn)健發(fā)展
隨著AI模型的能力日益更加強大,如何讓其行為和目的跟人類的價值、偏好、倫理原則、真實意圖之間實現(xiàn)協(xié)調一致,這個被稱為人機價值對齊的問題變得越來越重要。價值對齊對于確保人類與人工智能協(xié)作過程中的信任與安全至關重要,已經成為AI治理領域的一項關鍵任務,是大模型實現(xiàn)穩(wěn)健發(fā)展和提升競爭力的必由之路。業(yè)界和研究界積極探索實現(xiàn)大模型價值對齊的多種措施,包括人類反饋強化學習、可擴展監(jiān)督方法、訓練數(shù)據(jù)干預、可解釋AI方法、對抗測試、治理措施等等。
TIME雜志將美國AI公司anthropic開發(fā)的AI價值對齊技術“原則型AI”(constitutional AI)評選為2023年三大AI創(chuàng)新之一(另外兩個分別為多模態(tài)AI、文生視頻技術),這足以表明價值對齊已然成為AI領域的核心方向,其重要性正越來越被認識到。實際上,在大模型加速發(fā)展引發(fā)關于有效加速(e/acc)還是有效對齊(e/a)的AI技術發(fā)展理念之爭的背景下,人們需要更加負責任地發(fā)展應用人工智能技術,而關于價值對齊的技術和治理探索將推動負責任AI走向深入,確保人類與人工智能和諧共生、有效協(xié)作的美好未來。
趨勢三:AI加速人形機器人“手、腦”進化
2023年10月20日,工信部印發(fā)《人形機器人創(chuàng)新發(fā)展指導意見》,提出人形機器人集成人工智能、高端制造、新材料等先進技術,有望成為繼計算機、智能手機、新能源汽車后的顛覆性產品,將變革人類生產生活方式,重塑全球產業(yè)發(fā)展格局。特別是在關鍵技術突破方面,打造人形機器人“大腦”和“小腦”、突破“肢體”關鍵技術、健全技術創(chuàng)新體系。
《意見》還提出,到2025年,人形機器人創(chuàng)新體系初步建立,“大腦、小腦、肢體”等一批關鍵技術取得突破,確保核心部組件安全有效供給。整機產品達到國際先進水平,并實現(xiàn)批量生產,在特種、制造、民生服務等場景得到示范應用,探索形成有效的治理機制和手段。
當前,人形機器人技術加速演進,已成為科技競爭的新高地、未來產業(yè)的新賽道、經濟發(fā)展的新引擎,發(fā)展?jié)摿Υ?、應用前景廣。特別是在2023年以來,基于視覺-語言的大模型嵌入機器人本體,又為加速思考(“感知腦”)和執(zhí)行(“靈巧手”)突破,推動機器人邁向智能化帶來新的可能。
2023年是人形機器人的“高光之年”,這一領域發(fā)生了一系列大事。7月,李飛飛團隊發(fā)布最新成果VoxPoser具身智能技術,可以使機器人直接聽懂人類的自然語言指令并完成復雜任務,無需額外的數(shù)據(jù)和訓練。人形機器人Optimus快速迭代,商業(yè)化進程持續(xù)推進。特斯拉擎天柱的力控能力、抓取復雜物體的能力、利用FSD技術的視覺感知和處理能力。OpenAI投資了人形機器人公司1X,英偉達CEO黃仁勛也公開唱多“具身智能”。微軟基于ChatGPT 自然語言理解和推理能力,生成控制機器人的相關代碼。
根據(jù)Markets and Markets的預測,人形機器人市場規(guī)模有望從2023年的18億美元增長到2028年的138億美元,其復合年增長率可達50.2%。而高盛預測在最理想的情景下(產品設計、用例、技術、可負擔性和公共接受度等障礙被克服),2035年人形機器人市場或將達到1540億美元。
在人形機器人領域,有三個值得關注的趨勢:1.在思考能力層面,大模型的嵌入極大提升機器人感知環(huán)境、分解任務、規(guī)劃流程以及與環(huán)境交互的能力;2.在訓練平臺方面,云邊結合的分布式計算平臺發(fā)展,強化了機器人的訓練和分析決策速率;3.在執(zhí)行層面,以“靈巧手”為代表的關鍵技術,進一步強化了人形機器人末端執(zhí)行應用能力,尤其是微操作、近操作等能力。
一、大模型在文本、自然語言和視覺領域取得重要突破,提升機器人的理解能力。
在ITF World 2023大會上,英偉達創(chuàng)始人黃仁勛公開表示,人工智能的下一次浪潮將是具身智能,即能理解、推理以及與真實物理世界互動的智能系統(tǒng)。
在Chatgpt出現(xiàn)之前,大模型與具身智能領域的結合更多出現(xiàn)在感知層面,在海量數(shù)據(jù)集上預訓練的視覺模型,只是作為一種更好的表征提取器來提升機器人在場景中的感知能力,而具體的規(guī)劃與動作執(zhí)行,依然需要大量的具身場景數(shù)據(jù)進行訓練。AI大模型,以及后續(xù)的多模態(tài),可以從語音、視覺感知、決策、控制等多方面為機器人更好進行學習訓練和進化。
過往機器人的控制模式是預設軌跡,導致機器人的控制與行動比較受局限。李飛飛團隊在2023年發(fā)布的VoxPoser系統(tǒng),實現(xiàn)將LLM(大語言模型)和VLM(視覺語言模型)接入機器人,前者用來理解人類指令并生成交互代碼,實現(xiàn)與后者的交互,而VLM進行規(guī)劃路徑,生成操作指示地圖3D Value Map。兩者能力結合從而實現(xiàn)通過自然語言指令與機器人交互,可將復雜指令轉化為具體行動規(guī)劃,而無需預設數(shù)據(jù)和提前訓練,同時,系統(tǒng)也具備很強的抗干擾能力,可以在遇到干擾因素時快速重新規(guī)劃。除此之外,VoxPoser還產生了四方面的涌現(xiàn)能力,即評估物理特性、行為常識推理、精度矯正、基于視覺的多步操作。
PaLM-E和RT-2有兩個有代表性的模型。前者是年初谷歌公司與柏林工業(yè)大學人工智能研究小組合作推出的多模態(tài)具像化視覺語言模型(VLM)。模型參數(shù)規(guī)模達到5620億,集成用于控制機器人的視覺與語言,特征是無需重新訓練即可執(zhí)行各種任務。收到指令后,PaLM-E可以自動給機器人生成行動計劃,然后自行執(zhí)行。這是通過分析來自機器人攝像頭的數(shù)據(jù)來實現(xiàn)整個過程,不需要對場景進行預處理,也不許提前對數(shù)據(jù)進行人工注釋,機器人的控制更加自主。
Robotics Transformer 2(RT-2)是由Google DeepMind突出的一個用于控制機器人的視覺-語言-動作(VLA)的AI模型。RT-2使用經過精調的LLM來輸出運動控制命令,可移植性訓練數(shù)據(jù)中未明確包含的任務,并在新出現(xiàn)技能評估中將基線模型的表現(xiàn)提升了3倍。
二、云邊結合的分布式算力平臺發(fā)展強化了機器人的訓練速率,降低產業(yè)化門檻。
機器人是 AI、算力、IoT、底層硬件等各種技術的集大成者。從關鍵場景垂直應用,向規(guī)?;瘧冒l(fā)展。通過云-邊-端融合的機器人系統(tǒng)和架構,例如云端運行超大模型Nvidia A100 GPU,邊緣運行小模型。讓機器人達到數(shù)百萬千萬級水平,從而降低價格成本,實現(xiàn)大規(guī)模商用。
云服務機器人是指將機器人的核心計算和智能部分部署在云端服務器,借助云計算技術提供更大的計算能力和資源,以實現(xiàn)更強大、更高效的數(shù)據(jù)處理和應用。“云端大腦+本地機體”或“云端服務”機器人將成為規(guī)?;茝V與應用的重要模式之一。
Google 專門開發(fā)協(xié)議,將模型部署在多TPU 云服務實現(xiàn)實時推理。實驗結果表明,基于現(xiàn)成的VLM 模型PaLM-E 和PaLI-X,RT-2 取得了良好的泛化和涌現(xiàn)性能。相比于獨立的機器人本體,連接云端大腦后的機器人擁有以下四個核心優(yōu)勢:信息和知識共享,平衡計算負載,協(xié)同合作,獨立于本體持續(xù)升級。邊緣計算的引入將解決終端能力受限和云計算的實時響應的問題,增強機器人云端大腦的實時響應能力。在共享計算、存儲、通信資源基礎上,智能算法持續(xù)從(云端)大數(shù)據(jù)和(本地端)個性化數(shù)據(jù)中抽取知識,逐步從特定場景適應到通用場景,最終實現(xiàn)機器人即服務(Robot As A Service)的長期愿景。
特斯拉計劃利用Dojo對海量的視頻數(shù)據(jù)進行無監(jiān)督學習,以加速特斯拉的Autopilot和完全自動駕駛(FSD)系統(tǒng)的迭代,同時為特斯拉的人形機器人Optimus提供算力支持。Dojo將加速人形機器人的開發(fā),其能夠為機器人的神經網絡訓練提供算力支持,更快速地處理海量數(shù)據(jù),有望推動機器人加速落地。
騰訊Robotics X機器人實驗室通過引入預訓練模型和強化學習技術,可以讓機器狗分階段進行學習,有效的將不同階段的技能、知識積累并存儲下來,讓機器人在解決新的復雜任務時,不必重新學習,而是可以復用已經學會的姿態(tài)、環(huán)境感知、策略規(guī)劃多個層面的知識,并“舉一反三”。
三、多感知、多自由度功能融合的靈巧手強化了人形機器人的微操作、近操作能力。
靈巧手是人形機器人執(zhí)行動作的最終零件,十分重要且復雜,對電機性能要求較高。靈巧手作為機器人實現(xiàn)操作的終端工具十分重要??招谋姍C、觸覺感知傳感器的發(fā)展,提升了人形機器人末端執(zhí)行器的靈敏度和魯棒性。
特斯拉人形機器人擎天柱靈巧手有6個執(zhí)行器,可實現(xiàn)11個自由度,其中空心杯電機為核心部件。人形機器人的手指空間狹小,因而人形機器人手指關節(jié)需配備更多小型化且能夠輸出較大力的電機。屬于直流永磁伺服電動機的空心杯電機完美契合人形機器人對應手指關節(jié)輕量化、高精度等需求??招谋姍C具有功率密度高、能量轉化效率高、響應快,運行平穩(wěn)等特點,與靈巧手的需求高度適配。
騰訊Robotics X實驗室公布最新機器人研究進展,首次展示在靈巧操作領域的成果,推出自研機器人靈巧手 TRX-Hand和機械臂 TRX-Arm。其中,靈巧手TRX-Hand擁有像人手一樣靈活的操作能力,可適應不同場景,靈活規(guī)劃動作,自主完成“操作”。而機械臂TRX-Arm針對人居環(huán)境自主研發(fā),擁有七自由度和擬人的特性,具有運動靈巧、爆發(fā)力強、觸控一體以及柔順安全等特點。
趨勢四:AI+基因計算解讀生命密碼
基因是生命的最基本元素?;蛴嬎闶侵甘褂糜嬎惴椒▉矸治龊屠斫饣蛐畔⒌倪^程。近年來,人工智能(AI)在基因計算中的應用日益深入,市場研究公司Global Market Insights Inc.發(fā)布報告預測,到2032年,基因組學行業(yè)中的人工智能市場規(guī)模將達到125億美元,復合年增長率為39.2%。AI與基因計算融合開始進入加速階段,有望在生物育種、醫(yī)療健康、生物醫(yī)藥等領域開辟廣闊的技術創(chuàng)新和產業(yè)應用前景。
AI已成為基因組學創(chuàng)新的關鍵驅動力。前基因組時代(1958-1980s),生物信息學作為生物學、計算機科學、數(shù)學和統(tǒng)計學交叉學科出現(xiàn),人類專家初步探索將AI技術應用于基因數(shù)據(jù)分析,例如使用模式識別來預測蛋白質結構和功能、使用統(tǒng)計學習方法來理解基因表達數(shù)據(jù)?;蚪M時代(1990s-2010s),人類專家能夠系統(tǒng)分析和比較整個物種的遺傳信息,并利用AI進行基因組數(shù)據(jù)解析,輔助基因序列比對、變異檢測、功能注釋和復雜疾病的遺傳關聯(lián)分析,顯著提高了數(shù)據(jù)分析的效率和準確性;后基因組時代(2010s-),研究重點轉向基因功能的綜合分析、基因表達調控、個體遺傳差異分析等,深度學習、AI大模型成為關鍵驅動技術,用于處理復雜海量多模態(tài)數(shù)據(jù),實現(xiàn)單細胞測序,優(yōu)化基因編輯策略,促進智能化生物育種、藥物發(fā)現(xiàn)以及個性化健康預測、基因療法發(fā)展。
利用大模型破解復雜生物問題成為布局熱點。2023年8月,清華大學智能產業(yè)研究院與水木分子發(fā)布多模態(tài)生物醫(yī)藥百億參數(shù)大模型BioMedGPT,在數(shù)據(jù)層面整合了基因、分子、細胞、蛋白、文獻、專利、知識庫等多源異構的數(shù)據(jù)。9月,《上海市加快合成生物創(chuàng)新策源打造高端生物制造產業(yè)集群行動方案(2023—2025年)》中提出支持建設AI蛋白質多模態(tài)生成大模型等干濕結合AI生物大模型。谷歌旗下深度思維公司(Google DeepMind)也于9月宣布開發(fā)出新的AI大模型AlphaMissense,在人類蛋白質中成功預測了7100萬個可能的錯義突變(基因突變的一類),并將89%的突變分類為可能致病或可能良性;11月,深度思維再次宣布,AlphaFold預測范圍從蛋白質結構擴展至DNA、RNA等生物分子。
AI+生物技術正在加速育種4.0時代到來。2023年中央一號文件要求“全面實施生物育種重大項目,加快玉米大豆生物育種產業(yè)化步伐”。中國科學院錢前院士指出,全球種業(yè)發(fā)展正迎來生物技術與信息技術融合的“生物技術+人工智能+大數(shù)據(jù)”智能化時代(即育種4.0時代, 1.0為農家育種時代、2.0為雜交育種時代、3.0為分子育種時代)。基因編輯方面,通過AI對于大量基因組數(shù)據(jù)的預測和分析,可以幫助提升特定基因位置添加、刪除或替換DNA序列的操作精準度,增強作物抗病性、耐逆性、營養(yǎng)價值或產量,并減少傳統(tǒng)轉基因技術(將一個物種的基因轉移到另一個物種中)帶來的基因表達不穩(wěn)定或不可預測風險。2023年4月,農業(yè)農村部發(fā)布《2023年農業(yè)用基因編輯生物安全證書(生產應用)批準清單》,舜豐生物獲得首個植物基因編輯安全證書;此外,中國科學院遺傳與發(fā)育生物學研究所將AI與基因編輯結合,開發(fā)的PrimeRoot系統(tǒng)在水稻和玉米中實現(xiàn)了長達11.1Kb的大片段DNA高效精準定點插入。表觀合成方面,中國農業(yè)科學院生物技術研究所通過整合多組學數(shù)據(jù),構建智能模型,預測并優(yōu)化人工設計的合成表觀回路,大幅度提升表觀合成的精準度,并提出設計和創(chuàng)制智能作物(SMART Crop)的途徑和路線圖,為通過基因編輯之外的技術來培育聚合多種理想性狀的作物新種質提供了新思路。
AI+基因計算將助力實現(xiàn)個性化健康預測。人類專家結合基因組信息和AI算法,構建高度精準的疾病預測模型,可以預測個體在未來發(fā)生特定健康問題的風險,從而實現(xiàn)早期干預。基因測序是理解遺傳信息、研究基因功能、診斷遺傳疾病、發(fā)展新治療方法的基礎,其目標是確定DNA分子中四種核苷酸(腺嘌呤A、胸腺嘧啶T、胞嘧啶C、鳥嘌呤G)確切順序的過程。過去基因測序技術主要是對整個組織進行測序,包含成千上萬個細胞。近年來,基因測序技術有了突破性進展,從多細胞/組織層級開始向單細胞層級進化。騰訊AI Lab研究提出單細胞注釋模型scBERT,在單細胞測序領域首次引入大型語言模型BERT范式,將細胞中基因的表達信息轉化成可被計算機理解、學習的“語言”,并對細胞進行精準標注,實現(xiàn)了高解釋性、高泛化性、高穩(wěn)定性的單細胞類型注釋技術,能給細胞中的每個基因都印上專屬“身份證”,可用于臨床單細胞測序數(shù)據(jù),并輔助醫(yī)生描述準確的腫瘤微環(huán)境、檢測出微量癌細胞,從而實現(xiàn)個性化治療方案或者癌癥早篩。同時,對疾病致病機制分析、耐藥性、藥物靶點發(fā)現(xiàn)、預后分析、免疫療法設計等領域都具有極其重要的作用。
AI+基因工程促進分子藥物設計和研發(fā)規(guī)則創(chuàng)新。AI技術在藥物研發(fā)中,正在逐漸用于海量文獻信息分析整合、發(fā)掘藥物靶點、化合物高通量虛擬篩選、全新分子設計/優(yōu)化、分子ADMET成藥性預測、分子逆合成分析、耐藥性預測等多個場景。在發(fā)掘藥物靶點方面,AI算法能夠分析大量基因數(shù)據(jù),快速識別疾病相關的生物標記和潛在藥物靶點,提高藥物研發(fā)的針對性和成功率。2023年7月,美國丹娜-法伯癌癥研究所基于人體基因表達數(shù)據(jù)集,預訓練了一個基于遷移學習的AI模型——Geneformer,通過AI繪制基因互作網絡,有助于加快疾病治療靶點發(fā)現(xiàn),對于罕見病,有望在未來僅需少量的數(shù)據(jù)就能推測出這些罕見疾病的病理機制。在生物合成基因簇挖掘方面,通過深度學習和模式識別技術,AI能夠分析復雜的微生物基因組數(shù)據(jù),高效地識別和預測可能編碼天然產物的基因簇。騰訊量子實驗室開發(fā)了一套從微生物基因組中分析和預測生物合成基因簇的深度學習方法,可對基因組數(shù)據(jù)進行分析,發(fā)現(xiàn)、篩選并鑒定出潛在的、具有新穎結構的活性化合物相關生物合成基因簇,大幅提升新型生物活性分子的挖掘效率,助力新藥研發(fā)創(chuàng)新。
AI+基因計算為促進生命科學和生物經濟發(fā)展提供了新方法、新途徑、新機遇,但與此同時,在監(jiān)管機制、隱私保護、數(shù)據(jù)安全、技術控制、基因編輯等方面可能會出現(xiàn)更多的治理和倫理挑戰(zhàn),我們也需要重視和審慎應對,從而通過國際和國內產學研用各界共同努力,讓科技的發(fā)展向造福人類、促進公共利益的方向邁進。
03數(shù)實交互
趨勢五:數(shù)字交互引擎激發(fā)超級數(shù)字場景
數(shù)字交互引擎是在文化創(chuàng)意場景下產生、伴隨數(shù)字文化產業(yè)升級而不斷實現(xiàn)技術迭代的一類工具集,集成了物理模擬、3D建模、實時渲染等多種前沿技術,是文化科技融合的典型產物。數(shù)字交互引擎主要由圖形模塊、仿真模塊、實時渲染等模塊構成,它以軟件代碼包形式創(chuàng)造虛擬場景,動態(tài)呈現(xiàn)其外觀變化,支持其與物理世界進行實時交互。
在發(fā)展前期,數(shù)字交互引擎主要應用于游戲場景,在行業(yè)場景下被稱為“游戲引擎”;在服務游戲產業(yè)高效構建虛擬世界、與現(xiàn)實世界高質量交互的過程中,不斷實現(xiàn)技術迭代、提升跨平臺通用能力,逐步成為跨行業(yè)、跨場景應用的數(shù)字交互引擎。當前,數(shù)字交互引擎已經應用于文旅、汽車、工業(yè)等多元領域,成為構建實時虛擬世界、實現(xiàn)虛實交互的關鍵工具集。
一、數(shù)字交互引擎與AIGC互相驅動,打造構建超級數(shù)字場景的高效工具集
隨著以數(shù)字交互引擎為代表的游戲科技進入游戲之外的更多領域,游戲將迎來新的產業(yè)擴容,成為不斷創(chuàng)造新價值與新可能的“超級數(shù)字場景”。游戲作為前沿科技的“試煉場”,在深度跨界、產業(yè)擴容的過程中,必然將推動數(shù)字交互引擎進一步與多種前沿技術形成廣泛連接,其中,數(shù)字交互引擎與AIGC的加速融合、互相驅動將成為重要趨勢。
首先,數(shù)字交互引擎為AIGC爆發(fā)提供了重要推動力,并有望助力AIGC邁過“深水區(qū)”。游戲為AI提供了測試與訓練的重要環(huán)境,促進AI決策更加智能;同時,AIGC當前在3D內容側的能力仍存障礙,游戲行業(yè)的PCG(程序化內容生成)技術已大量應用于3D內容制作,兩者的結合可助力AIGC提升3D側能力。未來,數(shù)字交互引擎及其創(chuàng)建的大量3D數(shù)字資產也將為AI大模型訓練提供重要支持。
其次,AIGC技術融入數(shù)字交互引擎,將加速數(shù)字文化產業(yè)的工業(yè)化進程。當前,AIGC已滲透進數(shù)字文化制作的多個環(huán)節(jié),包括動畫、語音、美術、3D資產及場景等領域,簡化內容開發(fā)流程。未來數(shù)字交互引擎將進一步集成多種AIGC能力,提升影視、游戲、廣告等行業(yè)的智能化、工業(yè)化水平。
此外,數(shù)字交互引擎與AIGC的結合,將輻射多元社會場景,打造構建超級數(shù)字場景的高效工具集。例如,英偉達的Omniverse平臺集成了數(shù)字交互引擎、AI等多種技術能力,不僅能夠支持高效開發(fā)場景逼真、物理精確的游戲,也能廣泛助力工業(yè)制造、自動駕駛等領域的虛擬仿真與協(xié)作。未來,數(shù)字交互引擎與AIGC相結合,將加速打造更多的超級數(shù)字場景,在感知與認知的雙重維度上,實現(xiàn)人類生產與生活模式的全面升級。
二、大眾應用方面,數(shù)字交互引擎或走向UGC形態(tài)內容工具
隨著數(shù)字交互引擎與AIGC的融合加深、工具門檻進一步降低,數(shù)字交互引擎有望走向UGC工具形態(tài),以更低的使用門檻為大眾提供3D內容的生產力。正如短視頻變革了今天的社會信息傳播方式,未來,數(shù)字交互引擎也有望作為大眾化的3D內容生產與交互工具,支持人們創(chuàng)造自身在虛擬空間中的形象及資產等,在數(shù)實相生世界里實現(xiàn)生產與生活。
當前,面向大眾的游戲創(chuàng)作工具已經初現(xiàn)雛形,但數(shù)字交互引擎要真正走向大眾化,還需要從技術、生態(tài)、商業(yè)模式等維度積累資源、構建能力,實現(xiàn)高質量的畫面效果及實時算力支撐,培育豐富的開發(fā)者與多元內容體系,構建可持續(xù)的商業(yè)模式以推動創(chuàng)作者變現(xiàn),進一步聚集內容開發(fā)者,真正推動“交互式內容”的大眾化時代到來。
三、行業(yè)應用方面,數(shù)字交互引擎推動各行業(yè)數(shù)字孿生走向實時性
當前,數(shù)字交互引擎的應用正在從社會消費端向生產端延伸:不僅作為文化數(shù)字化的重要技術支撐,助力文化業(yè)態(tài)打破時空局限、實現(xiàn)多維升級;也走向制造業(yè)領域的“新型工業(yè)軟件”,支持實時、智能、高度可視化的數(shù)字場景,幫助企業(yè)生產提質增效。
數(shù)字交互引擎憑借其在數(shù)據(jù)可視化、實時渲染、友好交互等方面的能力,已成為工業(yè)數(shù)字孿生重要的構建及運行平臺,并支撐各行各業(yè)的數(shù)字孿生在應用層面提升實時性,使數(shù)字孿生技術在實時交互、靈活部署方面更進一步。數(shù)字交互引擎與數(shù)字孿生技術的結合,不僅可在數(shù)字空間中將物理實體構建為可視化、智能化的“副本”,還能支持數(shù)據(jù)的實時感知接入、可視化展現(xiàn),實現(xiàn)3D模型的實時渲染和展示,支持用戶對孿生體的快速查看、調用和修改,為汽車、民航等工業(yè)制造領域提供實時監(jiān)控管理、演練測試的數(shù)字場景。
未來,隨著數(shù)字交互引擎集成更加成熟的AI能力,也將進一步提升數(shù)字孿生構建的效率與智能化水平。例如,自動駕駛的仿真測試,可通過采集真實數(shù)據(jù),在數(shù)字交互引擎中重建數(shù)字場景,然后進行編輯、生成更多場景。采用 AIGC 技術可以讓這項工作效率大幅增長,并且可以創(chuàng)造出更多的合成數(shù)據(jù),填補真實數(shù)據(jù)中的缺口,提升訓練和測試樣本的多樣性、完備性和均衡性。AI與數(shù)字交互引擎的結合,將助力數(shù)字孿生技術以更智能化的形式服務于各行各業(yè),促進各領域提高研發(fā)生產效率、降低產業(yè)創(chuàng)新風險。
趨勢六:沉浸式媒體催生3D在場
在信息爆炸的時代,新媒體已經成為我們生活中不可或缺的一部分。視頻作為當今互聯(lián)網時代重要的信息載體之一,在互聯(lián)網數(shù)據(jù)中具有非常高的占比。根據(jù)Sandvine的報告,2022年視頻服務占互聯(lián)網流量的65.93%。同時,截至2022年12月,我國網絡視頻(含短視頻)用戶規(guī)模達10.31億,較2021年12月增長5586萬,占網民整體的96.5%。在這個背景下,如何更有效地傳遞信息,提供更好的用戶體驗,成為了新媒體領域亟待解決的問題。
多媒體技術經歷了電視、PC流媒體、移動互聯(lián)等階段,其中標準、設備、交互方式均發(fā)生了對應的變化。技術也不斷發(fā)展。未來,多媒體技術將聚焦四大方面,一是如何提高qoe和qos,進一步降低時延、提高壓縮比。二是更高效的內容生成和呈現(xiàn),如AIGC、HDR技術。三是更多樣的內容、互動內容、新媒體,以及沉浸式交互和體驗。四是更深入產業(yè),助力產業(yè)互聯(lián)網。
一、沉浸式體驗與交互:從平面到沉浸式體驗的升級
隨著虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)以及混合現(xiàn)實(MR)等技術的發(fā)展,沉浸式體驗和交互逐漸成為新媒體的發(fā)展方向。3DoF(自由度)視頻已經在視頻號、快手等平臺實現(xiàn)商用,裸眼3D產品也逐漸走進大眾視野。這些技術的應用為用戶提供了更加真實、身臨其境的感官體驗,使用戶在享受內容的同時,更加沉浸其中。未來,隨著硬件的進一步成熟和6DoF技術的演進,更多的UGC(用戶生成內容)3D沉浸式內容將會出現(xiàn)。此外,模型文件將成為多媒體的重要載體。例如,3D模型可以用于游戲、電影、廣告等多個領域,為用戶帶來更加豐富的視覺體驗。同時,隨著5G等新一代通信技術的普及,沉浸式體驗的傳輸速度和質量也將得到顯著提升。
二、高效內容生成與呈現(xiàn):AI技術的加持
伴隨著人工智能技術的不斷進步,AIGC技術在多媒體的文字、圖片生成等方面已經實現(xiàn)商用。未來,AIGC技術將繼續(xù)聚焦生成更加穩(wěn)定的視頻和3D內容。同時,在垂直領域如數(shù)字人、超分、老片修復等方向,AI技術將不斷強化多媒體的能力,為用戶提供更高質量的內容。此外,深度學習技術將進一步提升視頻編解碼的壓縮效率。隨著更多樣化的塊劃分方法和編碼模式的不斷涌現(xiàn),以及更復雜的預測和變換技術的引入,傳統(tǒng)視頻編碼算法的復雜度不斷提高。深度學習技術為圖像/視頻編碼框架定義了全新的結構范式,實現(xiàn)了圖像和視頻編碼器性能的顯著提升,這為圖像/視頻編碼領域帶來了新的研究思路和方向。
三、從消費互聯(lián)網到產業(yè)互聯(lián)網:根據(jù)場景進行優(yōu)化
隨著互聯(lián)網技術的不斷發(fā)展,產業(yè)互聯(lián)網逐漸崛起,為各行各業(yè)帶來了新的機遇。在這個過程中,多媒體技術在產業(yè)互聯(lián)網中的應用將根據(jù)不同場景進行優(yōu)化,從而更好地滿足產業(yè)互聯(lián)網的需求。在產業(yè)互聯(lián)網中,網絡協(xié)議需要根據(jù)場景需求進行優(yōu)化以提高傳輸效率。傳統(tǒng)的直播傳輸-播放模型存在諸多問題,如緩存固定、傳輸可靠性過高、無法區(qū)分視頻幀優(yōu)先級等。
針對這些問題,在消費互聯(lián)網中的WebRTC通信模型基礎上,進行優(yōu)化,在網絡時延、QoE和可靠性等進行優(yōu)化,對場景需求進行最優(yōu)匹配。比如在2B2C的場景中,通過(1)信令改造,利用miniSDP和0-RTT的結合,大幅減少信令耗時、提升信令交互成功,進而降低首幀耗時和提升開播成功率。(2)音視頻改造,讓WebRTC支持AAC,H.265,附加前向糾錯,抗50%以上丟包。還引入了B幀,增強了畫質,同時大幅減少了碼率。(3)傳輸改造,采樣柔性分級丟幀的傳輸策略來漸進式降低碼率,以適應弱網情況。支持P2P分發(fā)網絡,能夠將看同一視頻流的用戶群就近地組織成網絡,相互分享傳輸。實現(xiàn)延時可降低到800ms以內,并同時兼顧延時、卡頓和首幀耗時,綜合QoS遠超傳統(tǒng)直播??梢詮V泛應用在電商直播、體育賽事直播等領域另外一些場景,比如遠程作業(yè)等2B場景,通過(1)信令改造:提升信令鏈路對網絡異常抵抗能力,減少網絡異常恢復時間,提升視頻應用穩(wěn)定性。(2)音視頻改造,優(yōu)化相機采集、視頻渲染和視頻編解碼耗時,從音視頻處理層面減少端到端畫面延遲。(3)傳輸改造,以減少視頻傳輸延遲為目標,適當平衡抗丟包和抗網絡波動能力,減少視頻延遲;并引入多網傳輸策略,減少單一網絡依賴,提升傳輸穩(wěn)定性。實現(xiàn)了畫面延時可降低到100ms以內,兼顧抗弱網能力,在工業(yè)遠程作業(yè)、醫(yī)療等領域應用前景廣泛。
趨勢七:腦機接口從醫(yī)療突破邁向交互革命
腦機接口(BCI,brain-computer interface),是在人或動物腦與外部設備間建立的直接連接通路,實現(xiàn)大腦與外部設備的直接交互。根據(jù)傳感器或電極植入部位不同,主要分為非侵入式(Non-invasive)和侵入式(Invasive)兩大類。
如果從1924年德國醫(yī)生漢斯·伯格開發(fā)腦電圖(EEG)算起,腦機接口經過百年的近現(xiàn)代技術發(fā)展,已形成一系列基本的技術研究和應用范式。然而,由于對人腦原理研究認識進展的緩慢和局限性,目前腦機接口整體仍處于發(fā)展早期。
近年來在數(shù)字技術尤其AI不斷突破的加持下,加上生物相容性電極、小型化設計與集成、微創(chuàng)植入、多模式傳感器等關鍵技術進展,腦機接口呈現(xiàn)出加速發(fā)展的趨勢。預計醫(yī)療、軍事、教育、混合現(xiàn)實交互、類腦智能等領域將發(fā)揮重點帶動作用,全球商用市場將以17%的年平均增長率到2030年突破60億美元。從長遠看,腦機接口的意義更為重大,是人類應對人工智能威脅、減弱老齡化社會沖擊、探索人類本質等重大問題,構建人機和諧社會的重要路徑之一。
一、腦機接口加速腦科學研究,助力醫(yī)療領域神經系統(tǒng)疾病監(jiān)測及診療突破
醫(yī)療領域是腦機接口未來發(fā)展的首要牽引,占據(jù)約60%市場份額,預計未來十年保持突出。腦機接口與醫(yī)療的結合應用展現(xiàn)出廣闊的前景,能幫助開發(fā)更好的診療和康復手段,并加速神經科學和臨床神經醫(yī)學研究。重點應用方向包括:
神經調節(jié):神經發(fā)育障礙和退行性導致的疑難疾病,腦機接口可實現(xiàn)精準監(jiān)測、分析和干預。如腦深部刺激技術,正加速應用于癲癇和帕金森病治療。對于學習障礙和自閉癥等,基于腦電反饋的及時干預有顯著應用潛能,如集中注意力、提升閱讀效率。
運動恢復:通過捕捉大腦的運動意圖并轉換為控制信號,腦機接口可以幫助肢體受損或癱瘓人員恢復部分自主運動能力。如瑞士洛桑聯(lián)邦理工大學成功讓脊髓受損患者恢復行走能力,Neuralink以頸脊髓損傷等患者為臨床試驗重點對象。
感官補償:腦機接口還能針對感官缺陷或損傷患者,解碼大腦信息并實現(xiàn)感官補償。目前助聽方面已發(fā)揮重要作用,并向語音、視覺等拓展。如鎖定綜合征和漸凍癥會導致失語,患者借助腦機接口能控制光標、文字生成、語音合成等,與外界重建交流。如加州大學成功將大腦信號轉換成合成語音,幫助中風失語女性以高達80字/分鐘的速度再“說話”。
未來,腦機接口可望向神經系統(tǒng)相關的疾病治療、人體增強等多樣化的場景深化應用。研發(fā)重點和難點之一涉及大腦記憶和意識的疾病,如阿爾茨海默癥,利用腦機接口實時監(jiān)測和干預可能加速病理研究和診療手段開發(fā),并支持對人類大腦原理的研究。
二、腦機接口與混合現(xiàn)實深化融合,將推動新一代人機交互模式變革
新一代XR設備的興起,激發(fā)人機交互模式的演進需求,驅動腦機接口的融合發(fā)展。腦機接口可以實現(xiàn)更直接的腦電交互,結合XR等的視覺、手勢、語音等交互,能夠提供更為豐富、自然的交互方式。近期突出的市場創(chuàng)新進展有:
肌電交互:Meta正在研發(fā)一款具有革命性的交互腕帶,基于EMG(肌電圖)讀取用戶手臂神經信號,可以在手指運動發(fā)生前就定位跟蹤,甚至能感知極微小的手勢,能用于隔空操控鼠標、打字、玩游戲等。
眼動交互:蘋果正式發(fā)布頭顯Vision Pro,提出空間計算并展現(xiàn)出驚艷的虛實交互體驗。其中暗藏了眼動交互功能,如通過監(jiān)測瞳孔變化預測用戶行為從而實時重建UI,使得個性化交互更便捷、流暢。
腦電+XR多重交互:OpenBCI與Varjo合作開發(fā)出Galea BCI設備,成功把包含多種傳感器的非侵入式腦機接口系統(tǒng)和混合現(xiàn)實系統(tǒng)整合一體,創(chuàng)造出能進行多重體驗交互的新型軟硬件平臺,如讓殘疾人能更精準腦控無人機。
未來在商業(yè)及生活服務方面,腦機接口與XR等結合適用領域會十分廣泛,如娛樂、社交、身份識別、疲勞干預、個性化學習等。這類腦機技術多采用非植入式,更加安全便捷、更易被大眾接受,更有可能形成消費級應用從而加速腦機接口普及。
三、腦機接口與人工智能相輔相成,成為促進人機和諧共生的重要路徑之一
生成式AI爆發(fā)帶來潛在威脅,提高了腦機接口發(fā)展的必要性。腦機接口有望架設人腦與數(shù)字體、機器等的高速連接,增強人腦能力避免被直接替代,同時促進更安全、高效的AI發(fā)展。類腦智能成為重點發(fā)展方向之一,主要有兩方面:
提高大腦解讀能力:AI大模型等技術的加速突破,能支持更高效處理腦機接口采集的大量腦信號,提升對大腦文字、影像等信息解碼與重建效率,促進大腦信息處理機制等的基礎研究。如大阪大學研究團隊基于擴散模型,成功重建通過功能近紅外光譜(fMRI)獲得的人腦活動圖像。
促進類腦計算發(fā)展:腦機接口促進腦數(shù)據(jù)采集和腦科學研究,能反過來支持類腦計算的框架、算法、芯片等技術創(chuàng)新,跳出馮-諾伊曼計算結構局限,推動更低功耗、高效率、可信可控的AI發(fā)展。如IBM推出類腦芯片原型NorthPole,相比傳統(tǒng)CPU大幅提升能效25倍。
未來隨著腦機接口和AI結合的進一步深入,長期有望促成新的類腦計算結構體系、賽博格(人機融合體)、腦聯(lián)網等的發(fā)展突破,降低AI風險、促進人機和諧共生。
04未來連接
趨勢八:星地直連通信推動泛在網絡覆蓋
1月3日,美國太空探索技術公司使用獵鷹9號火箭,成功發(fā)射21顆“星鏈”衛(wèi)星,其中6顆衛(wèi)星具備“直連手機”功能。衛(wèi)星上新增一個面積為 25m2的中頻 PCS 頻譜天線,補充衛(wèi)星 Ku 和 Ka 頻段天線,同時 配備先進的 eNodeB 調制解調器,提供天基手機漫游接入服務,由于具有星間激光鏈路功能,Starlink 具備提供全球任何地區(qū)任何時段普通手機接入的能力。1月11日,榮耀Magic6 系列旗艦新品,號稱實現(xiàn)了體積最小、信號最穩(wěn)、且最省電的手機衛(wèi)星通信體驗。開年發(fā)生的星側和端側兩個標志性事件,標志著2024年也許成為星地直連泛在網絡全面普及的元年。
信息通信技術作為第三次科技革命的核心力量,自誕生起就以“Anytime,Anywhere,Anyone,Anything”為終極目標。如今的地球上,地面蜂窩網絡已經覆蓋了70%的人口,但覆蓋的地表面積實際只有20%。當發(fā)生摧毀通信設施的自然災害或身處無網絡地區(qū)的人為事故時,“失聯(lián)”的悲劇仍然難以避免,這也為攻克“緊急狀態(tài)通信”這一難關提出了迫切需求。星地直連通信技術就是在這樣的背景下發(fā)展而來,迄今已取得很大進步。2022年底,蘋果公司、華為公司相繼發(fā)布了支持短報文(類似手機短信功能)應急通信服務的新款手機。2023年,華為又推出了Mate 60Pro手機,依托天通衛(wèi)星實現(xiàn)了星地直連語音通信。這一系列技術突破和產品創(chuàng)新,預示著星地直連通信已步入實用化的快車道。據(jù)美國市場分析公司ABI Research預測,隨著NTN(非地面網絡)技術不斷發(fā)展,預計到2030年,全球將有1.7億臺NTN移動終端設備,產生的收入將達163億美元,從2022年至2030年的復合年均增長率將達76%(過去10年為22%),基于手機直連衛(wèi)星的泛在網絡覆蓋的時代即將到來。
星地直連通信的突破主要得益于兩個因素。一方面,衛(wèi)星和火箭技術加速創(chuàng)新。可回收火箭技術日臻成熟,衛(wèi)星發(fā)射成本顯著降低。美國SpaceX公司的Starlink(星鏈系統(tǒng))正在以每年上千顆的速度積極部署近地軌道。目前,Starlink 2.0 Mini衛(wèi)星已經發(fā)射,相較于1.0版本,其體積擴大了4倍,重量增加了3倍,通信能力提高了4倍。未來,完整的Starlink 2.0衛(wèi)星將重達1.5噸。同時,美國衛(wèi)星通信公司AST Mobile已開始部署基于低軌道的64平米超大陣列天線。衛(wèi)星重量的增加、天線面積的擴大、部署密度的增長,都降低了對地面設備天線大小和功率強度的需求。盡管Starlink目前仍然需要較大的地面設備,但正在向手機直接與衛(wèi)星進行寬帶通信的目標挺近。衛(wèi)星與火箭技術突破,促使天地網絡的體驗越來越接近,并可實現(xiàn)二者之間順滑切換,這成為普及衛(wèi)星通信技術的核心動力。
另一方面,民用手機逐步實現(xiàn)星地網絡兼容。近年來,華為公司與北斗系統(tǒng)開展的合作、蘋果公司與美國衛(wèi)星通信系統(tǒng)“全球星”開展的合作,都是通過在手機中集成專用衛(wèi)星通信芯片,以實現(xiàn)寬窄帶結合的直連衛(wèi)星功能。眼下,星地通信仍會以窄帶為主,主要通過短信和語音通信,這種方式在應急、野外、高空、遠洋等場景,有著廣泛應用前景。同時,我國芯片廠商已推出星地一體化通信模組。未來隨著設備加速普及,該模組的價格會快速下降,趨向與傳統(tǒng)手機通信模組持平,這將為星地網絡兼容的民用手機的大規(guī)模普及,打下堅實基礎。
歷次通信技術變革都會帶來信息通信與互聯(lián)網領域的產業(yè)新機遇。星地直連、6G網絡的時代,將是一個低成本泛在(含地面、海洋、空中、太空等)接入的時代,必然催生大量的軟硬件需求。其中一個重點趨勢是對于寬窄帶結合的即時通信和應急通信產品的新需求,由此帶來對語音和視頻壓縮技術的新需求。這些技術在即時通訊工具、在線會議等互聯(lián)網產品的普及中,曾發(fā)揮了決定性作用,在衛(wèi)星通信時代也會成為爆款應用的關鍵。另外一個重點趨勢是泛在物聯(lián)網的爆發(fā)。在各種野外生態(tài)或工程監(jiān)測領域,如抗擊自然災害、動植物保護、工程建設等,窄帶衛(wèi)星通信與邊緣計算、可再生能源等相結合,將帶來應用場景上的全新可能性。比如,我國的國家電網公司已經在野外電力設備監(jiān)測場景下使用窄帶衛(wèi)星通信技術。
必須看到,商業(yè)航天、衛(wèi)星制造、通信設備等領域,均處于大國競爭前沿。比如,太空軌道、通信頻譜都是有限資源,全球遵循“先到先得、先占永得”原則。這方面,盡管我國星網集團已公布上萬顆衛(wèi)星的發(fā)射計劃,但仍然遠低于Starlink等美國同行的進度??梢姡l(fā)揮國家統(tǒng)籌力量、依托巨大市場容量、系統(tǒng)化扶持龍頭企業(yè)、建立產業(yè)生態(tài)和技術壁壘等,都是一個國家能否在新的通信革命中取得突出的要素。
趨勢九:eVTOL加速空中出行奔赴新時代
隨著城市化進程加速,交通擁堵和環(huán)境污染問題日益突出,人類社會對綠色高效的交通方式的需求日益迫切。因此,開發(fā)低空空域、實現(xiàn)低空出行、發(fā)展低空經濟已成為解決這些問題的重要選擇之一。由電動垂直起降飛行器(electric vertical take-off and landing,eVTOL)驅動的空中交通被視為推動低空經濟發(fā)展的核心引擎。eVTOL采用以新能源電池作為動力的分布式電推進系統(tǒng),能有效降低飛行噪音和提升操作系統(tǒng)的安全性,同時實現(xiàn)垂直起降、無需跑道,是一種理想的綠色智能交通工具。
從未來產業(yè)發(fā)展來看,eVTOL應用場景廣闊。現(xiàn)階段最主要的是替代直升機,在測繪、消防救援、電力巡線、警用巡查、醫(yī)療救護、搜救、海上石油鉆井、農業(yè)植保、農業(yè)飛防等領域廣泛應用。而行業(yè)內普遍期望,eVTOL能廣泛應用于以城市和區(qū)域出行為主的空中載人客運。在不同應用場景中,載人客運是必然的核心發(fā)展方向,因為人的時間價值遠遠高于貨物。預計eVTOL率先在載貨物流、城市服務、消防救災等場景開始商業(yè)化運營,隨著技術發(fā)展和市場成熟,載客eVTOL將邁入大規(guī)模商業(yè)化時代。電池續(xù)航里程提升,使得eVTOL主機廠在機型研發(fā)方面更傾向于城際和區(qū)域出行類型的機型,主要是由以下因素驅動:城際和區(qū)域出行的單位經濟效益高、為客戶節(jié)省的時間多、所需的飛行頻率和機隊密度較低和公眾接受度高。當前載人客運的展示和試點推廣日趨火熱,2024年奧運會和2025年世博會的試運營計劃或開啟“eVTOL元年”。未來十年,在政府、產業(yè)巨頭和民間資本的助推下的eVTOL低空交通領域,產業(yè)發(fā)展與投資局面很可能發(fā)生劇變。
面對多元化應用場景需求,eVTOL在關鍵核心技術,特別是飛行器構型設計方面,仍處于驗證比較、市場選擇到大規(guī)模應用的“前夜”,但數(shù)字技術加速和賦能已成共識,并在實踐中落地。綜合國內外情況來看,eVTOL在科技創(chuàng)新方面呈現(xiàn)“電動化、長續(xù)航、智能化”三大技術趨勢:
第一,純電推進的eVTOL成為主流,細分技術路線的優(yōu)勢需在場景中體現(xiàn)。
eVTOL普遍采用電推進系統(tǒng)作為動力裝置,是一種航空領域的顛覆性技術。電推進系統(tǒng)利用電力驅動多個推進器作為動力裝置,能有效提升飛行器氣動效率、載運能力、環(huán)保性和魯棒性等。傳統(tǒng)直升機使用內燃機或渦輪發(fā)動機作為動力裝置,噪音大、污染嚴重、能效低。
eVTOL在商業(yè)化的過程中形成了不同構型或技術路線,其中多旋翼構型實現(xiàn)技術路線簡單,但有效載荷和航程相對有限;矢量推進構型(傾轉旋翼、涵道)和復合翼構型eVTOL在航程、巡航速度和載重比方面優(yōu)勢明顯,具有較好的有效載荷、最大起飛重量和運營經濟性,更適合在城際運輸?shù)瓤罩薪煌ㄉ虡I(yè)場景中應用推廣。隨著電池技術發(fā)展,復合翼及矢量推進構型相對于多旋翼的優(yōu)勢會越來越明顯。全球900多個eVTOL設計研發(fā)項目的統(tǒng)計數(shù)據(jù)顯示,約320個項目選擇矢量推進構型,約260個選擇多旋翼構型,約150個選擇復合翼構型,其他項目選擇懸停自行車和個人飛行器、電動旋翼機設計。
第二,高能量密度鋰電池的技術突破,進一步提升eVTOL續(xù)航里程。
電池技術突破助力eVTOL實現(xiàn)中長距離城際飛行。鋰電池因其高能量密度和安全性成為大多數(shù)eVTOL主機廠的首選動力來源,尤其在目標航程約200-300公里的范圍內,其能源效率和成本優(yōu)勢明顯。頭部企業(yè)認為電池能量密度在300Wh/kg以上,eVTOL性能已經展現(xiàn)出比較好的商業(yè)化能力。目前,業(yè)界最突出的航空級別電池的能量密度有望達到500Wh/kg,將會極大提升eVTOL續(xù)航里程,有潛力支持現(xiàn)有廠商的機型飛行400-500公里。總體而言,eVTOL電池的下一步研發(fā)目標是在保證航空安全的前提下,提高電池能量密度并以業(yè)界可接受的成本實現(xiàn)量產。
氫能應用潛力大但受限于總成本高和技術成熟度低,導致氫能源飛機的商業(yè)化進程緩慢。長期來看,氫燃料電池的能量密度最高可達鋰電池的數(shù)百倍,具有廣闊的應用前景。短期內,由于成本、重量、儲運和潛在安全風險等因素的限制,氫能電池的應用空間仍然有限。德國創(chuàng)業(yè)公司H2FLY近年推出了一款液態(tài)氫飛機HY4,該飛機為雙體式、四座位、單發(fā)設計,主要用于技術驗證和演示;空中客車等公司則計劃在2035年前推出氫能飛機。
第三,“軟件定義飛行器”和空中交通管理智能化共同加速無人駕駛愿景。
得益于智能駕駛技術發(fā)展與政策支持等有利因素,eVTOL飛行器正逐步從傳統(tǒng)的有人駕駛模式過渡到更高效的無人駕駛模式,呈現(xiàn)出“軟件定義飛行器”的趨勢。未來eVTOL在空中交通競爭中的關鍵既包括飛行器設計和性能,也包括以AI為核心的軟件技術,同時還需要配備高效的數(shù)字化空中交通管理系統(tǒng)來支持大量無人駕駛eVTOL運行。
在早期推廣階段,為了使eVTOL符合適航安全要求以及更容易被乘客接受,主機廠可能會為早期機型配備飛行員或安全員、延后無人駕駛eVTOL研發(fā)計劃,或同時研發(fā)無人駕駛和有人駕駛eVTOL。然而,從長遠來看,實現(xiàn)自主飛行、取消飛行員是降低運營成本、提高經濟效益的必然選擇。億航、峰飛和波音公司旗下的Wisk專注研發(fā)無人駕駛飛行器,億航已獲得我國頒發(fā)的適航證,峰飛計劃在配備安全員的前提下進行商業(yè)試運營,而Wisk計劃在2028年洛杉磯奧運會期間才會開始試運行無飛行員、全自主飛行的飛行器。
此外,低空基礎設施建設將助力高效安全空中交通管理,加速低空空域開放和利用進程。eVTOL在低空運行、服務公眾,流量大于現(xiàn)有通航直升機。盡管eVTOL航空器數(shù)量遠低于城市內網約車,但其運行環(huán)境為三維,受天氣等因素影響,復雜性和不確定性較高。數(shù)字技術可通過以下途徑助力空中交通管理智能化:(1)低成本、高精度、高可靠性的通信、導航、監(jiān)視系統(tǒng),實時獲取航空器信息,降低航空器間隔,提高空域流量和安全性;(2)基于傳統(tǒng)氣象雷達以及激光雷達等新一代傳感器收集的氣象數(shù)據(jù),結合AI大模型等技術,為低空飛行帶來更精準、網格化的氣象服務;(3)基于云計算、邊緣計算、深度學習和人工智能的管控和調度系統(tǒng),為eVTOL飛行提供決策支持,如實時航路規(guī)劃、起降場選擇;(4)集成多種技術的空域數(shù)字化平臺為空域管理部門進行空域設計、航道規(guī)劃、模擬測試提供數(shù)字化工具。
展望未來,我們期待在eVTOL技術、新能源技術和數(shù)字技術的發(fā)展和共同引領下,以eVTOL為代表的空中出行方式能夠加快實現(xiàn),改變以地面交通為主導的出行模式,推動全球加速奔赴空中出行新時代。
趨勢十:多能流實時協(xié)同重塑虛擬電廠
隨著新能源技術和信息技術的不斷發(fā)展與成熟,在雙碳目標背景下,虛擬電廠逐漸顯現(xiàn)出其在能源結構轉型中的關鍵作用,成為實現(xiàn)能源優(yōu)化配置的重要解決策略。在未來電網的構成中,源端、負荷端和儲能端三個關鍵部分正在經歷顯著變革。具體而言,源端將見證波動性清潔能源以大規(guī)模、高比例的方式接入電網;在負荷端,越來越多的用戶正逐漸轉變?yōu)榘l(fā)電、儲能及電網響應的參與者;而在儲能端,電化學儲能技術的發(fā)展及氫儲能技術的研究,正大幅降低能量存儲與運輸?shù)某杀尽?/p>
過去,虛擬電廠的應用范圍相對有限,但現(xiàn)在我們需要擴展其應用至城市乃至城市間的更廣闊層面。城市運行中的三大核心調節(jié)性負荷—工業(yè)、算力和交通—隨著工業(yè)創(chuàng)新、大規(guī)模模型算力以及新能源汽車等領域的發(fā)展,其電力需求持續(xù)增長。這既是挑戰(zhàn),也是機遇。數(shù)字化集成的虛擬電廠能夠通過承擔多網耦合和協(xié)同工作,將上述幾類主要用電部門轉變?yōu)榭烧{節(jié)資源。這一轉變將有效應對能源結構轉型帶來的電網壓力,確保在新能源背景下,新型電力系統(tǒng)的平穩(wěn)轉型。
可再生能源消納以及電力電子化是實現(xiàn)碳中和的關鍵,穩(wěn)定電力供應是實打實的剛性需求。隨著近年來新能源行業(yè)發(fā)展,電力電子資源的不斷增加,國家需要有更高效的數(shù)字化控制手段。近期在新能源及電力電子化領域發(fā)生的幾項重要事件:
1、蔚來參與全國規(guī)模最大的V2G需求響應項目:2023年8月23日,車網互動驗證中心(e-Park)的V2G充放電系統(tǒng)需求響應試驗在無錫正式啟動。這個系統(tǒng)是目前國內規(guī)模最大的V2G充放電系統(tǒng),為新型電力系統(tǒng)建設提供了堅實的支撐。
2、山東電力交易出現(xiàn)“負電價”現(xiàn)象:“五一”期間,山東電力現(xiàn)貨市場的實時交易電價經歷劇烈波動,區(qū)間從1047.51元/兆瓦時降至-80元/兆瓦時(約1.05元/度至-0.085元/度),期間多次出現(xiàn)負電價,這一現(xiàn)象在電力市場中尤為罕見。
3、中廣核新能源深圳虛擬電廠的重大成就:到2023年中,中廣核新能源深圳虛擬電廠成為首批滿足并網接入要求的標準化虛擬電廠,并成功參與首輪精準響應。在虛擬電廠運營商中,其響應容量和響應精度均位居前列。
這些事件不僅標志著行業(yè)的重大進步,也展示了數(shù)字化控制在能源變革中的重要作用。工業(yè)、算力、交通等將是近幾年的重點應用趨勢:
一、規(guī)模巨大、可調性強的工業(yè)可調節(jié)負荷可提供規(guī)模靈活性:
騰訊以鋼鐵工藝流程中可調節(jié)負荷為初步虛擬電廠試點,并逐步囊括多種可調節(jié)資源;初步盤查,可通過調整電爐的生產節(jié)奏和功率以獲得負荷靈活性;可根據(jù)不同優(yōu)化目標對當日生產計劃進行調整:
1、容量調節(jié):典型的短流程電爐煉鋼生產線能夠提供5-20MW的靈活性。這涉及到在保證生產不受影響的情況下對設備產出的調節(jié),同時也需要平衡設備運行和人力資源的排產。在電網交互控制方面,電網需按不同時間尺度向負荷方發(fā)出通知并進行控制。
2、方法優(yōu)化:為了獲得負荷靈活性,可以調整電爐的生產節(jié)奏和功率。這可能包括在響應時段降低電爐功率,延長電爐運行時間,或實行設備錯峰使用。這樣做的目標是在不損失總產量的前提下降低整體用電費用,并通過降低負荷獲得補助。
3、策略制定:可以根據(jù)不同的優(yōu)化目標對當日的生產計劃進行調整。這包括設定不同的生產目標,例如最快生產時間、最快生產時間加上模鑄、最低電價、最大化峰谷錯開、以及在最低電價下的需求側響應等。這些目標策略將指導未來的響應方式。
二、數(shù)字基礎設施的能耗優(yōu)化,數(shù)據(jù)中心任務移動可改變負荷:
根據(jù)與其他數(shù)據(jù)中心是否互聯(lián),數(shù)據(jù)中心有兩類:獨立的數(shù)據(jù)中心(如傳統(tǒng)的機房);互聯(lián)網數(shù)據(jù)中心(IDC):多個IDCs通過光纖可以進行數(shù)據(jù)負荷傳輸,并與其之間傳輸數(shù)據(jù)的光纖網共同構成算力網絡。
1、負荷轉移:在云計算場景下,尤其是在AI海量計算的時代,IDC負荷通過算力網絡轉移數(shù)據(jù)負荷,從而實現(xiàn)電力的轉移??紤]到東西電力資源的巨大差異,這種負荷轉移在電力管理中尤為重要。
2、策略實施:數(shù)據(jù)中心騰訊自身做了應用場景需求響應特性測試。這包括在不影響任務性能的情況下,調節(jié)服務器功率,并關注響應速度、響應深度、響應時長和響應精度。
3、時效性考慮:探索數(shù)據(jù)中心服務器的負荷靈活性策略,并進行靈活調節(jié)。這涉及到對實時性不敏感的計算任務進行擴縮容和“斷點續(xù)算”,以快速改變負荷分布。這類任務包括科學計算、視頻渲染以及其他獨立或耦合并行任務。
三、與C端互動平移伸縮電動車充電狀態(tài),聚合為“大電池”:
電動汽車(EV)將電力網絡與交通網絡這兩個復雜的人造系統(tǒng)緊密耦合;EV的充放電與出行由駕乘用戶決定, 形成以EV為核心的信息-物理-社群系統(tǒng)(Cyber-Physical-Social System),帶來新的問題與調控潛力。
1、時空協(xié)同:在電力-交通網絡耦合的定義中,通過交通網絡轉移充電負荷,從而改變電網的潮流分布,這在新能源車時代尤其關鍵。
2、實施方案:通過電力控制中心,結合交通擁堵信息發(fā)布以及各充電站的可用容量,制定即時策略,引導電動汽車到達對交通系統(tǒng)和電力系統(tǒng)都最佳的位置進行充電,以實現(xiàn)EV充電服務的效益最大化。
3、試點實驗:基于價格調控的電動營運車輛調度是接下來的一個重要嘗試方向。這包括利用出行價格調控車流密度和供需關系,以及利用充電價格調控充電需求的時空分布。目標是解決出行需求與充電負荷的供需不平衡,通過各類價格對營運車輛進行適當引導。
本文為專欄作者授權創(chuàng)業(yè)邦發(fā)表,版權歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。