所有語言
分享
文章來源:騰訊研究院
圖片來源:由無界 AI生成
過去一年,我們見證了数字科技的加速度。每個人都身處變革巨浪之中,既對大模型的突破進展無比興奮,也對未來充滿了無限憧憬。
新年伊始,眺望未來2-3年的科技趨勢。我們正駛向一個由連接衍生交互、由計算催生智能的時代。
高性能計算、量子計算、雲計算和邊緣計算這"四大計算“融匯貫通,正催生全新的計算範式。
通用人工智能漸行漸近,大模型走向多模態,AI智能體可能成為下一代平台, "AI科學家"有望加速問世。全球已達共識,AI治理將引領我們踏上更智慧、更安全的未來。
機器人演進加速,靈巧手讓人形機器人更敏捷、更像人。AI與生命科學的交融,將幫助我們洞察更多的生命奧秘。
我們會進入一個3D、全真在場的新世界。腦機接口不僅在醫療實現突破,正拓展至更多的互動場景。或許不久的將來,我們將親自見證意識上載從科幻成為現實。
手機衛星電話、垂直起降飛機將改變我們的應急方式和出行模式。交通網、信息網、能源網的融合,將推動智能、綠色的能源變革。
未來已來,一個充滿韌性和重塑的全新時代即將揭開序幕。讓我們擁抱變革,共同譜寫人類與科技和諧共生的新篇章!(文末提供完整PPT版報告下載)
專家推薦:在這個日新月異的變革時代,我們有幸見證並參与了数字科技的創新突破。特別是近年來,以大模型為代表的AI技術,讓我們看到了通用人工智能的曙光,有望大幅加速技術演進的步伐。
騰訊的2024数字科技趨勢,從連接、交互、計算和智能四個維度,對100多項未來技術和重點方向給出了趨勢性判斷。從星地直連的衛星互聯網,到垂直起降飛機的未來交通網,再到能源、信息和交通的多網協同,未來網絡連接的廣度和深度都迎來無限可能。交互方式正在發生變革,数字交互引擎不僅讓虛擬世界更真實,也讓真實世界更豐富,未來的全新3D視界呼之欲出,腦機接口的新進展也帶來了更大的想象空間。計算無疑是各類智能的底層基礎支撐,也成為當前競爭的焦點領域。而智能的升級,不僅會給機器人注入具身智能,還給微觀世界的基因計算帶來新突破。預測未來的最好方式,就是創造未來。相信在行業各界的共同努力下,這些前瞻洞見會更快到來,從趨勢變成現實。
——丁漢
中國科學院院士
去年以來,以生成式AI為代表的人工智能技術發展激蕩人心,正在引發智能的元革命。可以遇見的未來,智力將會成為一種基礎設施服務,新的IaaS呼之欲出。類比摩爾定律,未來可能會出現新的智能定律,對信息世界、物理世界和生命世界帶來全方位的影響。未來十年,AI會無所不在。首先,現有的各類應用可以用AI重新做一遍,新的交互變革、體驗創新將會帶來更新的智能硬件、更多的智能服務,孕育出比歷次工業革命都巨大的產業機會。其次,AI會成為各領域的底層操作系統,AI+機器人的具身智能,AI+生命科學的基因計算,AI+未來出行的自動駕駛汽車和垂直起降飛機,甚至AI+腦機接口的硅基和碳基結合的新生命體,都會一步步成為現實。最後,AI能力的提升也伴隨着風險的擴大,我們要充分發揮技術發明的智慧和把握應用方向的智慧,讓AI科技更善良、更有創意,朝着強化人、成就人的方向可持續發展。
——張亞勤
中國工程院院士、清華大學智能產業研究院(AIR)院長
算力,是数字時代的核心生產力。高性能計算,是先進算力的代表,它既包含了以高性能計算集群為代表的傳統計算體系,也包含了像量子計算一樣的未來計算硬件和軟件。高性能計算在氣象預測、地質勘探、新葯研發、新材料研發、人工智能等眾多應用領域發揮至關重要的價值,高性能計算技術的演進,引領着整個計算機科學技術的未來走向,甚至可能引發划時代的科技飛躍,值得產業和社會持續關注。
今年,全球迎來高性能計算設施的大規模新建潮和升級潮,以 CPU 為計算核心的高性能計算1.0時代正在快速遠去,以 CPU+GPU 為計算核心的高性能計算2.0已全面到來。
未來幾年,高性能計算技術將呈現四個方面的發展趨勢:系統架構方面,高算集群、量子計算、雲計算和邊緣計算的“四算融合”也將成為高性能計算 3.0 演進的新方向;關鍵硬件方面,計算芯片將迎來多元化發展;軟件應用方面,雲原生技術將帶來高算服務的普及,同時科學計算模擬應用將大量增加;可持續計算方面,業界將更多的關注計算的效能,並加速高能效計算技術的研發與探索。
雲超同化。一方面,Web 服務、容器化等雲原生技術正在快速應用於傳統高性能計算集群,使算力服務更易觸達:芬蘭 LUMI 集群已開始引入容器技術提高算力調度和應用搭建效率,並對外提供算力服務;IBM 也於年初發布了其首台雲原生高算集群 Vela;另一方面,不僅更多雲服務商推出了高性能計算雲服務,以谷歌為代表的頭部企業更進一步利用雲計算天然的分佈式計算優勢,推出“算力多切片訓練”方案,打造超出常規算力集群性能的超大規模AI 訓練案例。
量超融合。高性能計算集群與量子計算機的融合已經成為行業共識,量子計算單元(QPU)正在逐漸成為新的專用計算加速模塊。要全面實現以CPU+GPU+QPU為計算核心的高性能計算 3.0 ,大致要經歷三個階段:第一階段,高算集群和量子計算的網絡互聯;第二階段,互聯的高算集群與量子計算機可以通過專用的操作系統實現算力協同調度;第三階段,高算集群和量子計算之間實現從底層硬件到上層應用的深度系統集成,並能充分發揮各自的算力優勢,共同完成複雜的計算任務。如IBM 、芬蘭 VTT 技術研究中心、本源量子等國內外的相關機構和企業已經開始相關研發工作並陸續發布了進展,並對外提供訪問服務。
量子集群出現、雲服務普及。量子計算領先企業IBM於 2023 年 12 月公布全球首個可擴展量子計算系統Quantum System Two,引入模塊化架構和計算機集群設計,可讓系統容納 10000 個量子比特。模塊化量子計算集群的出現,預示着可複製性更強、擴展性更好的量子計算機發展新路徑;同時,全球已有超過 20 家機構推出量子計算雲服務,從整機公司如 IBM,發展到雲服務商如亞馬遜雲,再到科研院所如北京量子院。
高性能計算走向雲邊協同。目前高性能邊緣計算(HPEC)還在成長中,其單點算力已可達千萬億次每秒,自動駕駛和機器人是典型應用場景。除傳統計算平台外,神經形態芯片、光電計算芯片等新技術的成熟也在不斷提升邊緣算力和能效。而為獲得實時決策以及更高的信息安全環境,將部分數據處理、模型訓練以及推理等工作,從數據中心/雲平台遷移至雲邊協同架構下,是必要的技術路徑。
芯片技術多元化發展加劇。首先包括微軟、 Meta 在內的科技企業紛紛推出自研高性能 CPU 和 AI 加速芯片,其次,除了傳統的 x86 架構以外,其他芯片架構的芯片也加入到高性能計算領域,並由落地應用:位於葡萄牙的集群 Deucalion 將採用與日本富岳集群相同的 ARM 架構高性能芯片 A64FX;算能科技日前向山東大學交付國內首台RISC-V服務器集群,該集群擁有48顆RISC-V高性能芯片SG042。
存算一體,突破“內存牆”。傳統芯片均採用馮諾依曼計算架構,改架構的“內存牆”問題隨着算力的不斷提升而越發明顯,逐漸成為芯片性能進一步突破的瓶頸。業界紛紛採用存算一體技術思路,提升現有芯片性能的同時,研發神經形態計算芯片,探索“破牆”之路。Intel 、 AMD 和英偉達紛紛在各自最新的芯片產品中引入 HBM 和 LPDDR 等近存計算(Near-Memory Computing)技術;而神經形態計算(Neuromophic Computing)被認為是“后馮諾依曼時代”突破“內存牆”的重要計算技術路徑。受人類大腦原理的啟發,神經形態計算芯片通過存內計算(Compute in Memory)方式,實現高算力的同時實現超低功耗。
量子比特製備路徑之爭將更激烈。量子比特的製備,是量子計算機研製的起點。今年,超導量子、光量子、離子阱、冷原子等多條量子比特製備路徑均有不錯的進展,“誰才是未來量子計算最終的技術路線”之爭將更加激烈。
QPU 發展數量與質量兼顧。雖然 IBM 發布1000+量子比特QPU, Atom Computing 宣稱創造 1000 +原子陣列,但IBM 最新發布的芯片互聯技術,以及哈佛大學和QuEra等聯合發布的邏輯量子比特製備和糾錯研究成果等,說明了QPU的發展,仍然處在追求比特數量和,以及關注諸如糾錯能力、可擴展性等更符合實用需要的技術。
雲原生技術加快普及。從國內外雲服務商發布的進展來看,雲平台容器服務將加快對高性能計算服務的支持,並進一步兼容CUDA、 ROCm 、 oneAPI 等并行計算軟件平台,為用戶提供高度自動化的高性能計算工作環境,大大提高研發和實驗效率。高性能計算算力潛能將被進一步被釋放。
科學計算模擬應用和成就將迎來大爆發。一方面,全球高性能計算集群的大規模新建和升級、以及雲原生技術應用,使算力服務更充足並更易觸達;另一方面,科學計算模擬的需求將更加強烈,未來幾年將會有更多的科學計算模擬基於高性能計算服務開展:從微觀粒子模擬、到血流和癌細胞模擬、再到核聚變模擬、以及氣象和地理空間模擬等等。進一步,科學計算與人工智能技術的結合,將比預計的要快,許多傳統模擬數值算法經 AI 優化后,性能獲得大幅提升,科學家和科研團隊的生產力將迅速提高,科學研究將迎來快速進步的新形勢。
更多高性能計算集群嘗試人工智能大模型研發。傳統高算集群通過加裝 GPU 集群、結合雲平台高性能計算服務得到升級后,將具備更強的 AI 加速計算能力,進而可以支持人工智能大語言模型的訓練。比如:智譜 AI 的 ChatGLM3支持在神威高算上運行;美國阿貢國家實驗室開始基於 Aurora集群創建ScienceGPT,預計參數數量達到 1 萬億,將為廣泛的科學研究提供幫助。
高性能計算的能耗是驚人的。以TOP500 排名第一的Frontier 高算集群為例,其算力可達 1.6EFlop/s,功率可達 20 兆瓦,相當於近 1萬戶家庭用電水平。據統計,數據中心的耗電量約佔全球耗電量的1%,我國 2020 年佔比是2.7%。雖然當前尚無準確的數據中心能耗預測,但急劇增加的人工智能大模型訓練等高耗能計算應用,勢必會使這個数字繼續增加。
可持續計算,是数字經濟和雙碳目標背景下,高性能計算技術演進歷程中的路標和燈塔。擁有可持續高性能計算的技術,也將成為重要的競爭力。世界經濟論壇與今年發布的《2023 十大新興技術》報告,“可持續計算”位列其中。Intel、IBM、英偉達等先進計算企業也在不遺餘力的踐行和推動可持續計算。
可持續計算通常指在設計、建造和使用計算機技術(包括硬件、系統、軟件)的過程中,力求實現最大的能源效率和對環境影響的最小化。未來,計算能效將成為評估高性能計算技術先進性的重要指標,而提高計算能效的途徑主要有三個:更高能效的計算軟硬件、更先進的冷卻技術、以及更合理的計算供需匹配。
高能效的計算軟硬件方面,存算一體將是硬件層面主要的技術發展路徑,而機器學習等人工智能技術與傳統科學計算的結合,將大大提升計算效率和精度,並從軟件層面大幅度節省計算資源。
冷卻技術方面,液冷技術,特別是浸沒式液冷技術將加快普及,並帶來 30%以上的耗能節約。
合理的算力供需匹配方面,計算能效將成為高性能算力更重要的技術參數,而“量子效能”也將成為未來量子計算機研發和應用的重要評估指標。
剛剛過去的一年,註定是人工智能發展史上具有里程碑意義的大年。生成式人工智能的驚人進步,讓我們深切感受到未來AGI的巨大潛力和無限前景。
大模型從理解到生成,從感知到決策,能力不斷升。加上多模態、Agent、以及具身智能等方向的探索,AI有望完成“感知—決策—行動”的閉環。
多模態是人類世界的本來樣貌,AGI的發展趨勢一定是朝向多模態。技術將從文本、圖像、視頻(2D和3D),再到聲、光、電,甚至分子、原子等各類模態,而且具備跨模態遷移的特性。未來理想的框架是“多模態的對齊和融合 + 統一的編碼器和解碼器”。12月6日微軟發布的Copilot中,將GPT-4V的視覺能力與Bing搜索相結合,為用戶提供更好的圖像理解和生成體驗。7日,谷歌發布Gemini,主打原生大模型,無縫跨文本、圖像、視頻、音頻和代碼。谷歌稱,Gemini是第一個在MMLU(大規模多任務語言理解)方面優於人類專家的模型,準確率達到90%(人類專家為89.8%)。
比爾蓋茨近日撰文:AI Agent將是下一個平台,人工智能即將徹底改變人們使用計算機的方式並顛覆軟件行業。在不久的將來,任何上網的人都將能夠擁有由人工智能驅動的個人助手,遠超今天的技術水平。智能體由四個主要部分組成,包括多模態大模型(LMM)、長期記憶(Memory)、規劃(Planning)和工具使用(Tool Use)。業界AI智能體愈來愈多,如微軟AutoGen,發布短短兩周內,星標量就從390增到10K,並在 Discord上吸引了5000多名成員。它允許多個智能體扮演各種角色,如程序員、設計師,或是各種角色的組合,僅通過對話就可以完成編程任務。
大模型正在向端側轉移,AI推理將在手機、PC、耳機、音箱、XR、汽車,以及其它可穿戴式新型終端上運行。端側大模型具有一些獨特優勢,如,本地數據處理效率更高,節省雲端服務器帶寬和算力成本,對用戶數據更好的隱私保護,開啟更多交互新方式、新體驗等。
目前,一些手機已經在利用本地 AI支持如暗光拍攝、降噪和人臉解鎖等功能。未來藉助端側大模型,並結合向量化后的各類個人數據,用戶可以跟手機進行更流暢的交互,實現各種原生操作和功能。如,Humane 正式推出 AI Pin,搭載GPT4,可實現語音交互,也可以投影在手掌上交互。高通推出驍龍8 Gen3 ,支持終端側運行100億參數的模型。蘋果最新的M3芯片支持端側推理,且計劃推出更智能的Siri,為端側大模型生態做积極準備。
端側大模型應用具備三種可能性,首先是端側原生集成AI模型,類似siri,幫助用戶調用其他軟件,從而可能成為硬件新入口。其次,將大模型作為獨立app,例如MIT一位教授將開源模型集成在手機端做一個獨立app;第三,將大模型接入即時通訊軟件作為chatbot,例如What‘s App已經集成了Meta AI。
在AI技術的加持下,科學研究的效率大大增加。通過理論探索、設計實驗、分析數據等方向為科學發現提供動力。AI與各個科學領域結合后,正在發生一場充滿潛力和挑戰的科技革命。
在理論探索階段,以ChatPDF為代表的LLM應用可以對既有文獻的梳理,加快科研信息檢索的效率,在此基礎上提出新的研究問題,對現象和數據觀察提出某種猜想,幫助科學家發現新問題。
在數據分析階段,AI可以通過大量數據和複雜的數據分析,幫助提取有用信息和填補數據缺失,從而提高數據質量和利用效率。降低對數據的依賴。在處理高度複雜和多變量的科學問題時,大模型能提供高效的計算能力和深入的洞見。
在科研領域,生成式AI被用於預測基因序列、發現新的藥物靶點以及設計新型的生物材料。使用深度學習技術,研究人員能夠預測DNA和RNA結合蛋白的序列特異性。這是應用卷積神經網絡(CNN)於基因組學的先驅性工作之一。如,麻省理工學院(MIT)的研究人員開發出一種擴散模型——FrameDiff,該模型能夠生成自然界中不存在的新型蛋白質結構。該模型可以生成多達500 個氨基酸序列的蛋白質主鏈,且無需依賴於預訓練蛋白質結構預測網絡。Nature雜誌近日報道,一個由AI 指導機器人製造新材料的實驗室A-Lab,只用了 17 天就獨自創造了 41 種新材料,展現了AI科學家的未來潛能。
隨着AI模型的能力日益更加強大,如何讓其行為和目的跟人類的價值、偏好、倫理原則、真實意圖之間實現協調一致,這個被稱為人機價值對齊的問題變得越來越重要。價值對齊對於確保人類與人工智能協作過程中的信任與安全至關重要,已經成為AI治理領域的一項關鍵任務,是大模型實現穩健發展和提升競爭力的必由之路。業界和研究界积極探索實現大模型價值對齊的多種措施,包括人類反饋強化學習、可擴展監督方法、訓練數據干預、可解釋AI方法、對抗測試、治理措施等等。
TIME雜誌將美國AI公司anthropic開發的AI價值對齊技術“原則型AI”(constitutional AI)評選為2023年三大AI創新之一(另外兩個分別為多模態AI、文生視頻技術),這足以表明價值對齊已然成為AI領域的核心方向,其重要性正越來越被認識到。實際上,在大模型加速發展引發關於有效加速(e/acc)還是有效對齊(e/a)的AI技術發展理念之爭的背景下,人們需要更加負責任地發展應用人工智能技術,而關於價值對齊的技術和治理探索將推動負責任AI走向深入,確保人類與人工智能和諧共生、有效協作的美好未來。
20203年10月20日,工信部印發《人形機器人創新發展指導意見》,提出人形機器人集成人工智能、高端製造、新材料等先進技術,有望成為繼計算機、智能手機、新能源汽車后的顛覆性產品,將變革人類生產生活方式,重塑全球產業發展格局。特別是在關鍵技術突破方面,打造人形機器人“大腦”和“小腦”、突破“肢體”關鍵技術、健全技術創新體系。
《意見》還提出,到2025年,人形機器人創新體系初步建立,“大腦、小腦、肢體”等一批關鍵技術取得突破,確保核心部組件安全有效供給。整機產品達到國際先進水平,並實現批量生產,在特種、製造、民生服務等場景得到示範應用,探索形成有效的治理機制和手段。
當前,人形機器人技術加速演進,已成為科技競爭的新高地、未來產業的新賽道、經濟發展的新引擎,發展潛力大、應用前景廣。特別是在2023年以來,基於視覺-語言的大模型嵌入機器人本體,又為加速思考(“感知腦”)和執行(“靈巧手”)突破,推動機器人邁向智能化帶來新的可能。
2023年是人形機器人的“高光之年”,這一領域發生了一系列大事。7月,李飛飛團隊發布最新成果VoxPoser具身智能技術,可以使機器人直接聽懂人類的自然語言指令並完成複雜任務,無需額外的數據和訓練。人形機器人Optimus快速迭代,商業化進程持續推進。特斯拉擎天柱的力控能力、抓取複雜物體的能力、利用FSD技術的視覺感知和處理能力。OpenAI投資了人形機器人公司1X,英偉達CEO黃仁勛也公開唱多“具身智能”。微軟基於ChatGPT 自然語言理解和推理能力,生成控制機器人的相關代碼。
根據Markets and Markets的預測,人形機器人市場規模有望從2023年的18億美元增長到2028年的138億美元,其複合年增長率可達50.2%。而高盛預測在最理想的情景下(產品設計、用例、技術、可負擔性和公共接受度等障礙被克服),2035年人形機器人市場或將達到1540億美元。
在人形機器人領域,有三個值得關注的趨勢:1.在思考能力層面,大模型的嵌入極大提升機器人感知環境、分解任務、規劃流程以及與環境交互的能力;2.在訓練平台方面,雲邊結合的分佈式計算平台發展,強化了機器人的訓練和分析決策速率;3.在執行層面,以“靈巧手”為代表的關鍵技術,進一步強化了人形機器人末端執行應用能力,尤其是微操作、近操作等能力。
一、大模型在文本、自然語言和視覺領域取得重要突破,提升機器人的理解能力。
在ITF World 2023大會上,英偉達創始人黃仁勛公開表示,人工智能的下一次浪潮將是具身智能,即能理解、推理以及與真實物理世界互動的智能系統。
在Chatgpt出現之前,大模型與具身智能領域的結合更多出現在感知層面,在海量數據集上預訓練的視覺模型,只是作為一種更好的表徵提取器來提升機器人在場景中的感知能力,而具體的規劃與動作執行,依然需要大量的具身場景數據進行訓練。AI大模型,以及後續的多模態,可以從語音、視覺感知、決策、控制等多方面為機器人更好進行學習訓練和進化。
過往機器人的控制模式是預設軌跡,導致機器人的控制與行動比較受局限。李飛飛團隊在2023年發布的VoxPoser系統,實現將LLM(大語言模型)和VLM(視覺語言模型)接入機器人,前者用來理解人類指令並生成交互代碼,實現與後者的交互,而VLM進行規劃路徑,生成操作指示地圖3D Value Map。兩者能力結合從而實現通過自然語言指令與機器人交互,可將複雜指令轉化為具體行動規劃,而無需預設數據和提前訓練,同時,系統也具備很強的抗干擾能力,可以在遇到干擾因素時快速重新規劃。除此之外,VoxPoser還產生了四方面的湧現能力,即評估物理特性、行為常識推理、精度矯正、基於視覺的多步操作。
PaLM-E和RT-2有兩個有代表性的模型。前者是年初谷歌公司與柏林工業大學人工智能研究小組合作推出的多模態具像化視覺語言模型(VLM)。模型參數規模達到5620億,集成用於控制機器人的視覺與語言,特徵是無需重新訓練即可執行各種任務。收到指令后,PaLM-E可以自動給機器人生成行動計劃,然後自行執行。這是通過分析來自機器人攝像頭的數據來實現整個過程,不需要對場景進行預處理,也不許提前對數據進行人工註釋,機器人的控制更加自主。
Robotics Transformer 2(RT-2)是由Google DeepMind突出的一個用於控制機器人的視覺-語言-動作(VLA)的AI模型。RT-2使用經過精調的LLM來輸出運動控制命令,可移植性訓練數據中未明確包含的任務,並在新出現技能評估中將基線模型的表現提升了3倍。
二、雲邊結合的分佈式算力平台發展強化了機器人的訓練速率,降低產業化門檻。
機器人是 AI、算力、IoT、底層硬件等各種技術的集大成者。從關鍵場景垂直應用,向規模化應用發展。通過雲-邊-端融合的機器人系統和架構,例如雲端運行超大模型Nvidia A100 GPU,邊緣運行小模型。讓機器人達到數百萬千萬級水平,從而降低價格成本,實現大規模商用。
雲服務機器人是指將機器人的核心計算和智能部分部署在雲端服務器,藉助雲計算技術提供更大的計算能力和資源,以實現更強大、更高效的數據處理和應用。“雲端大腦+本地機體”或“雲端服務”機器人將成為規模化推廣與應用的重要模式之一。
Google 專門開發協議,將模型部署在多TPU 雲服務實現實時推理。實驗結果表明,基於現成的VLM 模型PaLM-E 和PaLI-X,RT-2 取得了良好的泛化和湧現性能。相比於獨立的機器人本體,連接雲端大腦後的機器人擁有以下四個核心優勢:信息和知識共享,平衡計算負載,協同合作,獨立於本體持續升級。邊緣計算的引入將解決終端能力受限和雲計算的實時響應的問題,增強機器人云端大腦的實時響應能力。在共享計算、存儲、通信資源基礎上,智能算法持續從(雲端)大數據和(本地端)個性化數據中抽取知識,逐步從特定場景適應到通用場景,最終實現機器人即服務(Robot As A Service)的長期願景。
特斯拉計劃利用Dojo對海量的視頻數據進行無監督學習,以加速特斯拉的Autopilot和完全自動駕駛(FSD)系統的迭代,同時為特斯拉的人形機器人Optimus提供算力支持。Dojo將加速人形機器人的開發,其能夠為機器人的神經網絡訓練提供算力支持,更快速地處理海量數據,有望推動機器人加速落地。
騰訊Robotics X機器人實驗室通過引入預訓練模型和強化學習技術,可以讓機器狗分階段進行學習,有效的將不同階段的技能、知識積累並存儲下來,讓機器人在解決新的複雜任務時,不必重新學習,而是可以復用已經學會的姿態、環境感知、策略規劃多個層面的知識,並“舉一反三”。
三、多感知、多自由度功能融合的靈巧手強化了人形機器人的微操作能力。
靈巧手是人形機器人執行動作的最終零件,十分重要且複雜,對電機性能要求較高。靈巧手作為機器人實現操作的終端工具十分重要。空心杯電機、觸覺感知傳感器的發展,提升了人形機器人末端執行器的靈敏度和魯棒性。
特斯拉人形機器人擎天柱靈巧手有6個執行器,可實現11個自由度,其中空心杯電機為核心部件。人形機器人的手指空間狹小,因而人形機器人手指關節需配備更多小型化且能夠輸出較大力的電機。屬於直流永磁伺服電動機的空心杯電機完美契合人形機器人對應手指關節輕量化、高精度等需求。空心杯電機具有功率密度高、能量轉化效率高、響應快,運行平穩等特點,與靈巧手的需求高度適配。
騰訊Robotics X實驗室公布最新機器人研究進展,首次展示在靈巧操作領域的成果,推出自研機器人靈巧手 TRX-Hand和机械臂 TRX-Arm。其中,靈巧手TRX-Hand擁有像人手一樣靈活的操作能力,可適應不同場景,靈活規劃動作,自主完成“操作”。而机械臂TRX-Arm針對人居環境自主研發,擁有七自由度和擬人的特性,具有運動靈巧、爆發力強、觸控一體以及柔順安全等特點。
基因是生命的最基本元素。基因計算是指使用計算方法來分析和理解基因信息的過程。近年來,人工智能(AI)在基因計算中的應用日益深入,市場研究公司Global Market Insights Inc.發布報告預測,到2032年,基因組學行業中的人工智能市場規模將達到125億美元,複合年增長率為39.2%。AI與基因計算融合開始進入加速階段,有望在生物育種、醫療健康、生物醫藥等領域開闢廣闊的技術創新和產業應用前景。
AI已成為基因組學創新的關鍵驅動力。前基因組時代(1958-1980s),生物信息學作為生物學、計算機科學、數學和統計學交叉學科出現,人類專家初步探索將AI技術應用於基因數據分析,例如使用模式識別來預測蛋白質結構和功能、使用統計學習方法來理解基因表達數據。基因組時代(1990s-2010s),人類專家能夠系統分析和比較整個物種的遺傳信息,並利用AI進行基因組數據解析,輔助基因序列比對、變異檢測、功能註釋和複雜疾病的遺傳關聯分析,顯著提高了數據分析的效率和準確性;后基因組時代(2010s-),研究重點轉向基因功能的綜合分析、基因表達調控、個體遺傳差異分析等,深度學習、AI大模型成為關鍵驅動技術,用於處理複雜海量多模態數據,實現單細胞測序,優化基因編輯策略,促進智能化生物育種、藥物發現以及個性化健康預測、基因療法發展。
利用大模型破解複雜生物問題成為布局熱點。2023年8月,清華大學智能產業研究院與水木分子發布多模態生物醫藥百億參數大模型BioMedGPT,在數據層面整合了基因、分子、細胞、蛋白、文獻、專利、知識庫等多源異構的數據。9月,《上海市加快合成生物創新策源打造高端生物製造產業集群行動方案(2023—2025年)》中提出支持建設AI蛋白質多模態生成大模型等乾濕結合AI生物大模型。谷歌旗下深度思維公司(Google DeepMind)也於9月宣布開發出新的AI大模型AlphaMissense,在人類蛋白質中成功預測了7100萬個可能的錯義突變(基因突變的一類),並將89%的突變分類為可能致病或可能良性;11月,深度思維再次宣布,AlphaFold預測範圍從蛋白質結構擴展至DNA、RNA等生物分子。
AI+生物技術正在加速育種4.0時代到來。2023年中央一號文件要求“全面實施生物育種重大項目,加快玉米大豆生物育種產業化步伐”。中國科學院錢前院士指出,全球種業發展正迎來生物技術與信息技術融合的“生物技術+人工智能+大數據”智能化時代(即育種4.0時代, 1.0為農家育種時代、2.0為雜交育種時代、3.0為分子育種時代)。基因編輯方面,通過AI對於大量基因組數據的預測和分析,可以幫助提升特定基因位置添加、刪除或替換DNA序列的操作精準度,增強作物抗病性、耐逆性、營養價值或產量,並減少傳統轉基因技術(將一個物種的基因轉移到另一個物種中)帶來的基因表達不穩定或不可預測風險。2023年4月,農業農村部發布《2023年農業用基因編輯生物安全證書(生產應用)批准清單》,舜豐生物獲得首個植物基因編輯安全證書;此外,中國科學院遺傳與發育生物學研究所將AI與基因編輯結合,開發的PrimeRoot系統在水稻和玉米中實現了長達11.1Kb的大片段DNA高效精準定點插入。表觀合成方面,中國農業科學院生物技術研究所通過整合多組學數據,構建智能模型,預測並優化人工設計的合成表觀迴路,大幅度提升表觀合成的精準度,並提出設計和創製智能作物(SMART Crop)的途徑和路線圖,為通過基因編輯之外的技術來培育聚合多種理想性狀的作物新種質提供了新思路。
AI+基因計算將助力實現個性化健康預測。人類專家結合基因組信息和AI算法,構建高度精準的疾病預測模型,可以預測個體在未來發生特定健康問題的風險,從而實現早期干預。基因測序是理解遺傳信息、研究基因功能、診斷遺傳疾病、發展新治療方法的基礎,其目標是確定DNA分子中四種核苷酸(腺嘌呤A、胸腺嘧啶T、胞嘧啶C、鳥嘌呤G)確切順序的過程。過去基因測序技術主要是對整個組織進行測序,包含成千上萬個細胞。近年來,基因測序技術有了突破性進展,從多細胞/組織層級開始向單細胞層級進化。騰訊AI Lab研究提出單細胞註釋模型scBERT,在單細胞測序領域首次引入大型語言模型BERT範式,將細胞中基因的表達信息轉化成可被計算機理解、學習的“語言”,並對細胞進行精準標註,實現了高解釋性、高泛化性、高穩定性的單細胞類型註釋技術,能給細胞中的每個基因都印上專屬“身份證”,可用於臨床單細胞測序數據,並輔助醫生描述準確的腫瘤微環境、檢測出微量癌細胞,從而實現個性化治療方案或者癌症早篩。同時,對疾病致病機制分析、耐藥性、藥物靶點發現、預後分析、免疫療法設計等領域都具有極其重要的作用。
AI+基因工程促進分子藥物設計和研發規則創新。AI技術在藥物研發中,正在逐漸用於海量文獻信息分析整合、發掘藥物靶點、化合物高通量虛擬篩選、全新分子設計/優化、分子ADMET成藥性預測、分子逆合成分析、耐藥性預測等多個場景。在發掘藥物靶點方面,AI算法能夠分析大量基因數據,快速識別疾病相關的生物標記和潛在藥物靶點,提高藥物研發的針對性和成功率。2023年7月,美國丹娜-法伯癌症研究所基於人體基因表達數據集,預訓練了一個基於遷移學習的AI模型——Geneformer,通過AI繪製基因互作網絡,有助於加快疾病治療靶點發現,對於罕見病,有望在未來僅需少量的數據就能推測出這些罕見疾病的病理機制。在生物合成基因簇挖掘方面,通過深度學習和模式識別技術,AI能夠分析複雜的微生物基因組數據,高效地識別和預測可能編碼天然產物的基因簇。騰訊量子實驗室開發了一套從微生物基因組中分析和預測生物合成基因簇的深度學習方法,可對基因組數據進行分析,發現、篩選並鑒定出潛在的、具有新穎結構的活性化合物相關生物合成基因簇,大幅提升新型生物活性分子的挖掘效率,助力新葯研發創新。
AI+基因計算為促進生命科學和生物經濟發展提供了新方法、新途徑、新機遇,但與此同時,在監管機制、隱私保護、數據安全、技術控制、基因編輯等方面可能會出現更多的治理和倫理挑戰,我們也需要重視和審慎應對,從而通過國際和國內產學研用各界共同努力,讓科技的發展向造福人類、促進公共利益的方向邁進。
数字交互引擎是在文化創意場景下產生、伴隨数字文化產業升級而不斷實現技術迭代的一類工具集,集成了物理模擬、3D建模、實時渲染等多種前沿技術,是文化科技融合的典型產物。数字交互引擎主要由圖形模塊、仿真模塊、實時渲染等模塊構成,它以軟件代碼包形式創造虛擬場景,動態呈現其外觀變化,支持其與物理世界進行實時交互。
在發展前期,数字交互引擎主要應用於遊戲場景,在行業場景下被稱為“遊戲引擎”;在服務遊戲產業高效構建虛擬世界、與現實世界高質量交互的過程中,不斷實現技術迭代、提升跨平台通用能力,逐步成為跨行業、跨場景應用的数字交互引擎。當前,数字交互引擎已經應用於文旅、汽車、工業等多元領域,成為構建實時虛擬世界、實現虛實交互的關鍵工具集。
隨着以数字交互引擎為代表的遊戲科技進入遊戲之外的更多領域,遊戲將迎來新的產業擴容,成為不斷創造新價值與新可能的“超級数字場景”。遊戲作為前沿科技的“試煉場”,在深度跨界、產業擴容的過程中,必然將推動数字交互引擎進一步與多種前沿技術形成廣泛連接,其中,数字交互引擎與AIGC的加速融合、互相驅動將成為重要趨勢。
首先,数字交互引擎為AIGC爆發提供了重要推動力,並有望助力AIGC邁過“深水區”。遊戲為AI提供了測試與訓練的重要環境,促進AI決策更加智能;同時,AIGC當前在3D內容側的能力仍存障礙,遊戲行業的PCG(程序化內容生成)技術已大量應用於3D內容製作,兩者的結合可助力AIGC提升3D側能力。未來,数字交互引擎及其創建的大量3D数字資產也將為AI大模型訓練提供重要支持。
其次,AIGC技術融入数字交互引擎,將加速数字文化產業的工業化進程。當前,AIGC已滲透進数字文化製作的多個環節,包括動畫、語音、美術、3D資產及場景等領域,簡化內容開發流程。未來数字交互引擎將進一步集成多種AIGC能力,提升影視、遊戲、廣告等行業的智能化、工業化水平。
此外,数字交互引擎與AIGC的結合,將輻射多元社會場景,打造構建超級数字場景的高效工具集。例如,英偉達的Omniverse平台集成了数字交互引擎、AI等多種技術能力,不僅能夠支持高效開發場景逼真、物理精確的遊戲,也能廣泛助力工業製造、自動駕駛等領域的虛擬仿真與協作。未來,数字交互引擎與AIGC相結合,將加速打造更多的超級数字場景,在感知與認知的雙重維度上,實現人類生產與生活模式的全面升級。
二、大眾應用方面,数字交互引擎或走向UGC形態內容工具
隨着数字交互引擎與AIGC的融合加深、工具門檻進一步降低,数字交互引擎有望走向UGC工具形態,以更低的使用門檻為大眾提供3D內容的生產力。正如短視頻變革了今天的社會信息傳播方式,未來,数字交互引擎也有望作為大眾化的3D內容生產與交互工具,支持人們創造自身在虛擬空間中的形象及資產等,在數實相生世界里實現生產與生活。
當前,面向大眾的遊戲創作工具已經初現雛形,但数字交互引擎要真正走向大眾化,還需要從技術、生態、商業模式等維度積累資源、構建能力,實現高質量的畫面效果及實時算力支撐,培育豐富的開發者與多元內容體系,構建可持續的商業模式以推動創作者變現,進一步聚集內容開發者,真正推動“交互式內容”的大眾化時代到來。
當前,数字交互引擎的應用正在從社會消費端向生產端延伸:不僅作為文化数字化的重要技術支撐,助力文化業態打破時空局限、實現多維升級;也走向製造業領域的“新型工業軟件”,支持實時、智能、高度可視化的数字場景,幫助企業生產提質增效。
数字交互引擎憑藉其在數據可視化、實時渲染、友好交互等方面的能力,已成為工業数字孿生重要的構建及運行平台,並支撐各行各業的数字孿生在應用層面提升實時性,使数字孿生技術在實時交互、靈活部署方面更進一步。数字交互引擎與数字孿生技術的結合,不僅可在数字空間中將物理實體構建為可視化、智能化的“副本”,還能支持數據的實時感知接入、可視化展現,實現3D模型的實時渲染和展示,支持用戶對孿生體的快速查看、調用和修改,為汽車、民航等工業製造領域提供實時監控管理、演練測試的数字場景。
未來,隨着数字交互引擎集成更加成熟的AI能力,也將進一步提升数字孿生構建的效率與智能化水平。例如,自動駕駛的仿真測試,可通過採集真實數據,在数字交互引擎中重建数字場景,然後進行編輯、生成更多場景。採用 AIGC 技術可以讓這項工作效率大幅增長,並且可以創造出更多的合成數據,填補真實數據中的缺口,提升訓練和測試樣本的多樣性、完備性和均衡性。AI與数字交互引擎的結合,將助力数字孿生技術以更智能化的形式服務於各行各業,促進各領域提高研發生產效率、降低產業創新風險。
在信息爆炸的時代,新媒體已經成為我們生活中不可或缺的一部分。視頻作為當今互聯網時代重要的信息載體之一,在互聯網數據中具有非常高的佔比。根據Sandvine的報告,2022年視頻服務占互聯網流量的65.93%。同時,截至2022年12月,我國網絡視頻(含短視頻)用戶規模達10.31億,較2021年12月增長5586萬,佔網民整體的96.5%。在這個背景下,如何更有效地傳遞信息,提供更好的用戶體驗,成為了新媒體領域亟待解決的問題。
多媒體技術經歷了電視、PC流媒體、移動互聯等階段,其中標準、設備、交互方式均發生了對應的變化。技術也不斷髮展。未來,多媒體技術將聚焦四大方面,一是如何提高qoe和qos,進一步降低時延、提高壓縮比。二是更高效的內容生成和呈現,如AIGC、HDR技術。三是更多樣的內容、互動內容、新媒體,以及沉浸式交互和體驗。四是更深入產業,助力產業互聯網。
隨着虛擬現實(VR)、增強現實(AR)以及混合現實(MR)等技術的發展,沉浸式體驗和交互逐漸成為新媒體的發展方向。3DoF(自由度)視頻已經在視頻號、快手等平台實現商用,裸眼3D產品也逐漸走進大眾視野。這些技術的應用為用戶提供了更加真實、身臨其境的感官體驗,使用戶在享受內容的同時,更加沉浸其中。未來,隨着硬件的進一步成熟和6DoF技術的演進,更多的UGC(用戶生成內容)3D沉浸式內容將會出現。此外,模型文件將成為多媒體的重要載體。例如,3D模型可以用於遊戲、電影、廣告等多個領域,為用戶帶來更加豐富的視覺體驗。同時,隨着5G等新一代通信技術的普及,沉浸式體驗的傳輸速度和質量也將得到顯著提升。
伴隨着人工智能技術的不斷進步,AIGC技術在多媒體的文字、圖片生成等方面已經實現商用。未來,AIGC技術將繼續聚焦生成更加穩定的視頻和3D內容。同時,在垂直領域如数字人、超分、老片修復等方向,AI技術將不斷強化多媒體的能力,為用戶提供更高質量的內容。此外,深度學習技術將進一步提升視頻編解碼的壓縮效率。隨着更多樣化的塊劃分方法和編碼模式的不斷湧現,以及更複雜的預測和變換技術的引入,傳統視頻編碼算法的複雜度不斷提高。深度學習技術為圖像/視頻編碼框架定義了全新的結構範式,實現了圖像和視頻編碼器性能的顯著提升,這為圖像/視頻編碼領域帶來了新的研究思路和方向。
隨着互聯網技術的不斷髮展,產業互聯網逐漸崛起,為各行各業帶來了新的機遇。在這個過程中,多媒體技術在產業互聯網中的應用將根據不同場景進行優化,從而更好地滿足產業互聯網的需求。在產業互聯網中,網絡協議需要根據場景需求進行優化以提高傳輸效率。傳統的直播傳輸-播放模型存在諸多問題,如緩存固定、傳輸可靠性過高、無法區分視頻幀優先級等。
針對這些問題,在消費互聯網中的WebRTC通信模型基礎上,進行優化,在網絡時延、QoE和可靠性等進行優化,對場景需求進行最優匹配。比如在2B2C的場景中,通過(1)信令改造,利用miniSDP和0-RTT的結合,大幅減少信令耗時、提升信令交互成功,進而降低首幀耗時和提升開播成功率。(2)音視頻改造,讓WebRTC支持AAC,H.265,附加前向糾錯,抗50%以上丟包。還引入了B幀,增強了畫質,同時大幅減少了碼率。(3)傳輸改造,採樣柔性分級丟幀的傳輸策略來漸進式降低碼率,以適應弱網情況。支持P2P分髮網絡,能夠將看同一視頻流的用戶群就近地組織成網絡,相互分享傳輸。實現延時可降低到800ms以內,並同時兼顧延時、卡頓和首幀耗時,綜合QoS遠超傳統直播。可以廣泛應用在電商直播、體育賽事直播等領域另外一些場景,比如遠程作業等2B場景,通過(1)信令改造:提升信令鏈路對網絡異常抵抗能力,減少網絡異常恢復時間,提升視頻應用穩定性。(2)音視頻改造,優化相機採集、視頻渲染和視頻編解碼耗時,從音視頻處理層面減少端到端畫面延遲。(3)傳輸改造,以減少視頻傳輸延遲為目標,適當平衡抗丟包和抗網絡波動能力,減少視頻延遲;並引入多網傳輸策略,減少單一網絡依賴,提升傳輸穩定性。實現了畫面延時可降低到100ms以內,兼顧抗弱網能力,在工業遠程作業、醫療等領域應用前景廣泛。
腦機接口(BCI,brain-computer interface),是在人或動物腦與外部設備間建立的直接連接通路,實現大腦與外部設備的直接交互。根據傳感器或電極植入部位不同,主要分為非侵入式(Non-invasive)和侵入式(Invasive)兩大類。
如果從1924年德國醫生漢斯·伯格開發腦電圖(EEG)算起,腦機接口經過百年的近現代技術發展,已形成一系列基本的技術研究和應用範式。然而,由於對人腦原理研究認識進展的緩慢和局限性,目前腦機接口整體仍處於發展早期。
近年來在数字技術尤其AI不斷突破的加持下,加上生物相容性電極、小型化設計與集成、微創植入、多模式傳感器等關鍵技術進展,腦機接口呈現出加速發展的趨勢。預計醫療、軍事、教育、混合現實交互、類腦智能等領域將發揮重點帶動作用,全球商用市場將以17%的年平均增長率到2030年突破60億美元。從長遠看,腦機接口的意義更為重大,是人類應對人工智能威脅、減弱老齡化社會衝擊、探索人類本質等重大問題,構建人機和諧社會的重要路徑之一。
一、腦機接口加速腦科學研究,助力醫療領域神經系統疾病監測及診療突破
醫療領域是腦機接口未來發展的首要牽引,佔據約60%市場份額,預計未來十年保持領先。腦機接口與醫療的結合應用展現出廣闊的前景,能幫助開發更好的診療和康復手段,並加速神經科學和臨床神經醫學研究。重點應用方向包括:
神經調節:神經發育障礙和退行性導致的疑難疾病,腦機接口可實現精準監測、分析和干預。如腦深部刺激技術,正加速應用於癲癇和帕金森病治療。對於學習障礙和自閉症等,基於腦電反饋的及時干預有顯著應用潛能,如集中注意力、提升閱讀效率。
運動恢復:通過捕捉大腦的運動意圖並轉換為控制信號,腦機接口可以幫助肢體受損或癱瘓人員恢復部分自主運動能力。如瑞士洛桑聯邦理工大學成功讓脊髓受損患者恢復行走能力,Neuralink以頸脊髓損傷等患者為臨床試驗重點對象。
感官補償:腦機接口還能針對感官缺陷或損傷患者,解碼大腦信息並實現感官補償。目前助聽方面已發揮重要作用,並向語音、視覺等拓展。如鎖定綜合征和漸凍症會導致失語,患者藉助腦機接口能控制光標、文字生成、語音合成等,與外界重建交流。如加州大學成功將大腦信號轉換成合成語音,幫助中風失語女性以高達80字/分鐘的速度再“說話”。
未來,腦機接口可望向神經系統相關的疾病治療、人體增強等多樣化的場景深化應用。研發重點和難點之一涉及大腦記憶和意識的疾病,如阿爾茨海默症,利用腦機接口實時監測和干預可能加速病理研究和診療手段開發,並支持對人類大腦原理的研究。
二、腦機接口與混合現實深化融合,將推動新一代人機交互模式變革
新一代XR設備的興起,激發人機交互模式的演進需求,驅動腦機接口的融合發展。腦機接口可以實現更直接的腦電交互,結合XR等的視覺、手勢、語音等交互,能夠提供更為豐富、自然的交互方式。近期突出的市場創新進展有:
肌電交互:Meta正在研發一款具有革命性的交互腕帶,基於EMG(肌電圖)讀取用戶手臂神經信號,可以在手指運動發生前就定位跟蹤,甚至能感知極微小的手勢,能用於隔空操控鼠標、打字、玩遊戲等。
眼動交互:蘋果正式發布頭顯Vision Pro,提出空間計算並展現出驚艷的虛實交互體驗。其中暗藏了眼動交互功能,如通過監測瞳孔變化預測用戶行為從而實時重建UI,使得個性化交互更便捷、流暢。
腦電+XR多重交互:OpenBCI與Varjo合作開發出Galea BCI設備,成功把包含多種傳感器的非侵入式腦機接口系統和混合現實系統整合一體,創造出能進行多重體驗交互的新型軟硬件平台,如讓殘疾人能更精準腦控無人機。
未來在商業及生活服務方面,腦機接口與XR等結合適用領域會十分廣泛,如娛樂、社交、身份識別、疲勞干預、個性化學習等。這類腦機技術多採用非植入式,更加安全便捷、更易被大眾接受,更有可能形成消費級應用從而加速腦機接口普及。
三、腦機接口與人工智能相輔相成,成為促進人機和諧共生的重要路徑之一
生成式AI爆髮帶來潛在威脅,提高了腦機接口發展的必要性。腦機接口有望架設人腦與数字體、機器等的高速連接,增強人腦能力避免被直接替代,同時促進更安全、高效的AI發展。類腦智能成為重點發展方向之一,主要有兩方面:
提高大腦解讀能力:AI大模型等技術的加速突破,能支持更高效處理腦機接口採集的大量腦信號,提升對大腦文字、影像等信息解碼與重建效率,促進大腦信息處理機制等的基礎研究。如大阪大學研究團隊基於擴散模型,成功重建通過功能近紅外光譜(fMRI)獲得的人腦活動圖像。
促進類腦計算髮展:腦機接口促進腦數據採集和腦科學研究,能反過來支持類腦計算的框架、算法、芯片等技術創新,跳出馮-諾伊曼計算結構局限,推動更低功耗、高效率、可信可控的AI發展。如IBM推出類腦芯片原型NorthPole,相比傳統CPU大幅提升能效25倍。
未來隨着腦機接口和AI結合的進一步深入,長期有望促成新的類腦計算結構體系、賽博格(人機融合體)、腦聯網等的發展突破,降低AI風險、促進人機和諧共生。
1月3日,美國太空探索技術公司使用獵鷹9號火箭,成功發射21顆“星鏈”衛星,其中6顆衛星具備“直連手機”功能。衛星上新增一個面積為 25m²的中頻 PCS 頻譜天線,補充衛星 Ku 和 Ka 頻段天線,同時 配備先進的 eNodeB 調製解調器,提供天基手機漫遊接入服務,由於具有星間激光鏈路功能,Starlink 具備提供全球任何地區任何時段普通手機接入的能力。1月11日,榮耀Magic6 系列旗艦新品,號稱實現了體積最小、信號最穩、且最省電的手機衛星通信體驗。開年發生的星側和端側兩個標誌性事件,標志著2024年也許成為星地直連泛在網絡全面普及的元年。
信息通信技術作為第三次科技革命的核心力量,自誕生起就以“Anytime,Anywhere,Anyone,Anything”為終極目標。如今的地球上,地面蜂窩網絡已經覆蓋了70%的人口,但覆蓋的地表面積實際只有20%。當發生摧毀通信設施的自然災害或身處無網絡地區的人為事故時,“失聯”的悲劇仍然難以避免,這也為攻克“緊急狀態通信”這一難關提出了迫切需求。星地直連通信技術就是在這樣的背景下發展而來,迄今已取得很大進步。2022年底,蘋果公司、華為公司相繼發布了支持短報文(類似手機短信功能)應急通信服務的新款手機。2023年,華為又推出了Mate 60Pro手機,依託天通衛星實現了星地直連語音通信。這一系列技術突破和產品創新,預示着星地直連通信已步入實用化的快車道。據美國市場分析公司ABI Research預測,隨着NTN(非地面網絡)技術不斷髮展,預計到2030年,全球將有1.7億台NTN移動終端設備,產生的收入將達163億美元,從2022年至2030年的複合年均增長率將達76%(過去10年為22%),基於手機直連衛星的泛在網絡覆蓋的時代即將到來。
星地直連通信的突破主要得益於兩個因素。一方面,衛星和火箭技術加速創新。可回收火箭技術日臻成熟,衛星發射成本顯著降低。美國SpaceX公司的Starlink(星鏈系統)正在以每年上千顆的速度积極部署近地軌道。目前,Starlink 2.0 Mini衛星已經發射,相較於1.0版本,其體積擴大了4倍,重量增加了3倍,通信能力提高了4倍。未來,完整的Starlink 2.0衛星將重達1.5噸。同時,美國衛星通信公司AST Mobile已開始部署基於低軌道的64平米超大陣列天線。衛星重量的增加、天線面積的擴大、部署密度的增長,都降低了對地面設備天線大小和功率強度的需求。儘管Starlink目前仍然需要較大的地面設備,但正在向手機直接與衛星進行寬帶通信的目標挺近。衛星與火箭技術突破,促使天地網絡的體驗越來越接近,並可實現二者之間順滑切換,這成為普及衛星通信技術的核心動力。
另一方面,民用手機逐步實現星地網絡兼容。近年來,華為公司與北斗系統開展的合作、蘋果公司與美國衛星通信系統“全球星”開展的合作,都是通過在手機中集成專用衛星通信芯片,以實現寬窄帶結合的直連衛星功能。眼下,星地通信仍會以窄帶為主,主要通過短信和語音通信,這種方式在應急、野外、高空、遠洋等場景,有着廣泛應用前景。同時,我國芯片廠商已推出星地一體化通信模組。未來隨着設備加速普及,該模組的價格會快速下降,趨向與傳統手機通信模組持平,這將為星地網絡兼容的民用手機的大規模普及,打下堅實基礎。
歷次通信技術變革都會帶來信息通信與互聯網領域的產業新機遇。星地直連、6G網絡的時代,將是一個低成本泛在(含地面、海洋、空中、太空等)接入的時代,必然催生大量的軟硬件需求。其中一個重點趨勢是對於寬窄帶結合的即時通信和應急通信產品的新需求,由此帶來對語音和視頻壓縮技術的新需求。這些技術在即時通訊工具、在線會議等互聯網產品的普及中,曾發揮了決定性作用,在衛星通信時代也會成為爆款應用的關鍵。另外一個重點趨勢是泛在物聯網的爆發。在各種野外生態或工程監測領域,如抗擊自然災害、動植物保護、工程建設等,窄帶衛星通信與邊緣計算、可再生能源等相結合,將帶來應用場景上的全新可能性。比如,我國的國家電網公司已經在野外電力設備監測場景下使用窄帶衛星通信技術。
必須看到,商業航天、衛星製造、通信設備等領域,均處於大國競爭前沿。比如,太空軌道、通信頻譜都是有限資源,全球遵循“先到先得、先佔永得”原則。這方面,儘管我國星網集團已公布上萬顆衛星的發射計劃,但仍然遠低於Starlink等美國同行的進度。可見,發揮國家統籌力量、依託巨大市場容量、系統化扶持龍頭企業、建立產業生態和技術壁壘等,都是一個國家能否在新的通信革命中取得領先的要素。
隨着城市化進程加速,交通擁堵和環境污染問題日益突出,人類社會對綠色高效的交通方式的需求日益迫切。因此,開發低空空域、實現低空出行、發展低空經濟已成為解決這些問題的重要選擇之一。由電動垂直起降飛行器(electric vertical take-off and landing,eVTOL)驅動的空中交通被視為推動低空經濟發展的核心引擎。eVTOL採用以新能源電池作為動力的分佈式電推進系統,能有效降低飛行噪音和提升操作系統的安全性,同時實現垂直起降、無需跑道,是一種理想的綠色智能交通工具。
從未來產業發展來看,eVTOL應用場景廣闊。現階段最主要的是替代直升機,在測繪、消防救援、電力巡線、警用巡查、醫療救護、搜救、海上石油鑽井、農業植保、農業飛防等領域廣泛應用。而行業內普遍期望,eVTOL能廣泛應用於以城市和區域出行為主的空中載人客運。在不同應用場景中,載人客運是必然的核心發展方向,因為人的時間價值遠遠高於貨物。預計eVTOL率先在載貨物流、城市服務、消防救災等場景開始商業化運營,隨着技術發展和市場成熟,載客eVTOL將邁入大規模商業化時代。電池續航里程提升,使得eVTOL主機廠在機型研發方面更傾向於城際和區域出行類型的機型,主要是由以下因素驅動:城際和區域出行的單位經濟效益高、為客戶節省的時間多、所需的飛行頻率和機隊密度較低和公眾接受度高。當前載人客運的展示和試點推廣日趨火熱,2024年奧運會和2025年世博會的試運營計劃或開啟“eVTOL元年”。未來十年,在政府、產業巨頭和民間資本的助推下的eVTOL低空交通領域,產業發展與投資局面很可能發生劇變。
面對多元化應用場景需求,eVTOL在關鍵核心技術,特別是飛行器構型設計方面,仍處於驗證比較、市場選擇到大規模應用的“前夜”,但数字技術加速和賦能已成共識,並在實踐中落地。綜合國內外情況來看,eVTOL在科技創新方面呈現“電動化、長續航、智能化”三大技術趨勢:
第一,純電推進的eVTOL成為主流,細分技術路線的優勢需在場景中體現。
eVTOL普遍採用電推進系統作為動力裝置,是一種航空領域的顛覆性技術。電推進系統利用電力驅動多個推進器作為動力裝置,能有效提升飛行器氣動效率、載運能力、環保性和魯棒性等。傳統直升機使用內燃機或渦輪發動機作為動力裝置,噪音大、污染嚴重、能效低。
eVTOL在商業化的過程中形成了不同構型或技術路線,其中多旋翼構型實現技術路線簡單,但有效載荷和航程相對有限;矢量推進構型(傾轉旋翼、涵道)和複合翼構型eVTOL在航程、巡航速度和載重比方面優勢明顯,具有較好的有效載荷、最大起飛重量和運營經濟性,更適合在城際運輸等空中交通商業場景中應用推廣。隨着電池技術發展,複合翼及矢量推進構型相對於多旋翼的優勢會越來越明顯。全球900多個eVTOL設計研發項目的統計數據显示,約320個項目選擇矢量推進構型,約260個選擇多旋翼構型,約150個選擇複合翼構型,其他項目選擇懸停自行車和個人飛行器、電動旋翼機設計。
第二,高能量密度鋰電池的技術突破,進一步提升eVTOL續航里程。
電池技術突破助力eVTOL實現中長距離城際飛行。鋰電池因其高能量密度和安全性成為大多數eVTOL主機廠的首選動力來源,尤其在目標航程約200-300公里的範圍內,其能源效率和成本優勢明顯。頭部企業認為電池能量密度在300Wh/kg以上,eVTOL性能已經展現出比較好的商業化能力。目前,業界最領先的航空級別電池的能量密度有望達到500Wh/kg,將會極大提升eVTOL續航里程,有潛力支持現有廠商的機型飛行400-500公里。總體而言,eVTOL電池的下一步研發目標是在保證航空安全的前提下,提高電池能量密度並以業界可接受的成本實現量產。
氫能應用潛力大但受限於總成本高和技術成熟度低,導致氫能源飛機的商業化進程緩慢。長期來看,氫燃料電池的能量密度最高可達鋰電池的數百倍,具有廣闊的應用前景。短期內,由於成本、重量、儲運和潛在安全風險等因素的限制,氫能電池的應用空間仍然有限。德國創業公司H2FLY近年推出了一款液態氫飛機HY4,該飛機為雙體式、四座位、單發設計,主要用於技術驗證和演示;空中客車等公司則計劃在2035年前推出氫能飛機。
第三,“軟件定義飛行器”和空中交通管理智能化共同加速無人駕駛願景。
得益於智能駕駛技術發展與政策支持等有利因素,eVTOL飛行器正逐步從傳統的有人駕駛模式過渡到更高效的無人駕駛模式,呈現出“軟件定義飛行器”的趨勢。未來eVTOL在空中交通競爭中的關鍵既包括飛行器設計和性能,也包括以AI為核心的軟件技術,同時還需要配備高效的数字化空中交通管理系統來支持大量無人駕駛eVTOL運行。
在早期推廣階段,為了使eVTOL符合適航安全要求以及更容易被乘客接受,主機廠可能會為早期機型配備飛行員或安全員、延後無人駕駛eVTOL研發計劃,或同時研發無人駕駛和有人駕駛eVTOL。然而,從長遠來看,實現自主飛行、取消飛行員是降低運營成本、提高經濟效益的必然選擇。億航、峰飛和波音公司旗下的Wisk專註研發無人駕駛飛行器,億航已獲得我國頒發的適航證,峰飛計劃在配備安全員的前提下進行商業試運營,而Wisk計劃在2028年洛杉磯奧運會期間才會開始試運行無飛行員、全自主飛行的飛行器。
此外,低空基礎設施建設將助力高效安全空中交通管理,加速低空空域開放和利用進程。eVTOL在低空運行、服務公眾,流量大於現有通航直升機。儘管eVTOL航空器數量遠低於城市內網約車,但其運行環境為三維,受天氣等因素影響,複雜性和不確定性較高。数字技術可通過以下途徑助力空中交通管理智能化:(1)低成本、高精度、高可靠性的通信、導航、監視系統,實時獲取航空器信息,降低航空器間隔,提高空域流量和安全性;(2)基於傳統氣象雷達以及激光雷達等新一代傳感器收集的氣象數據,結合AI大模型等技術,為低空飛行帶來更精準、網格化的氣象服務;(3)基於雲計算、邊緣計算、深度學習和人工智能的管控和調度系統,為eVTOL飛行提供決策支持,如實時航路規劃、起降場選擇;(4)集成多種技術的空域数字化平台為空域管理部門進行空域設計、航道規劃、模擬測試提供数字化工具。
展望未來,我們期待在eVTOL技術、新能源技術和数字技術的發展和共同引領下,以eVTOL為代表的空中出行方式能夠加快實現,改變以地面交通為主導的出行模式,推動全球加速奔赴空中出行新時代。
隨着新能源技術和信息技術的不斷髮展與成熟,在雙碳目標背景下,虛擬電廠逐漸顯現出其在能源結構轉型中的關鍵作用,成為實現能源優化配置的重要解決策略。在未來電網的構成中,源端、負荷端和儲能端三個關鍵部分正在經歷顯著變革。具體而言,源端將見證波動性清潔能源以大規模、高比例的方式接入電網;在負荷端,越來越多的用戶正逐漸轉變為發電、儲能及電網響應的參与者;而在儲能端,電化學儲能技術的發展及氫儲能技術的研究,正大幅降低能量存儲與運輸的成本。
過去,虛擬電廠的應用範圍相對有限,但現在我們需要擴展其應用至城市乃至城市間的更廣闊層面。城市運行中的三大核心調節性負荷—工業、算力和交通—隨着工業創新、大規模模型算力以及新能源汽車等領域的發展,其電力需求持續增長。這既是挑戰,也是機遇。数字化集成的虛擬電廠能夠通過承擔多網耦合和協同工作,將上述幾類主要用電部門轉變為可調節資源。這一轉變將有效應對能源結構轉型帶來的電網壓力,確保在新能源背景下,新型電力系統的平穩轉型。
可再生能源消納以及電力电子化是實現碳中和的關鍵,穩定電力供應是實打實的剛性需求。隨着近年來新能源行業發展,電力电子資源的不斷增加,國家需要有更高效的数字化控制手段。近期在新能源及電力电子化領域發生的幾項重要事件:
1、蔚來參与全國規模最大的V2G需求響應項目:2023年8月23日,車網互動驗證中心(e-Park)的V2G充放電系統需求響應試驗在無錫正式啟動。這個系統是目前國內規模最大的V2G充放電系統,為新型電力系統建設提供了堅實的支撐。
2、山東電力交易出現“負電價”現象:“五一”期間,山東電力現貨市場的實時交易電價經歷劇烈波動,區間從1047.51元/兆瓦時降至-80元/兆瓦時(約1.05元/度至-0.085元/度),期間多次出現負電價,這一現象在電力市場中尤為罕見。
3、中廣核新能源深圳虛擬電廠的重大成就:到2023年中,中廣核新能源深圳虛擬電廠成為首批滿足併網接入要求的標準化虛擬電廠,並成功參与首輪精準響應。在虛擬電廠運營商中,其響應容量和響應精度均位居前列。
這些事件不僅標志著行業的重大進步,也展示了数字化控制在能源變革中的重要作用。工業、算力、交通等將是近幾年的重點應用趨勢:
一、規模巨大、可調性強的工業可調節負荷可提供規模靈活性:
騰訊以鋼鐵工藝流程中可調節負荷為初步虛擬電廠試點,並逐步囊括多種可調節資源;初步盤查,可通過調整電爐的生產節奏和功率以獲得負荷靈活性;可根據不同優化目標對當日生產計劃進行調整:
1、容量調節:典型的短流程電爐鍊鋼生產線能夠提供5-20MW的靈活性。這涉及到在保證生產不受影響的情況下對設備產出的調節,同時也需要平衡設備運行和人力資源的排產。在電網交互控制方面,電網需按不同時間尺度向負荷方發出通知並進行控制。
2、方法優化:為了獲得負荷靈活性,可以調整電爐的生產節奏和功率。這可能包括在響應時段降低電爐功率,延長電爐運行時間,或實行設備錯峰使用。這樣做的目標是在不損失總產量的前提下降低整體用電費用,並通過降低負荷獲得補助。
3、策略制定:可以根據不同的優化目標對當日的生產計劃進行調整。這包括設定不同的生產目標,例如最快生產時間、最快生產時間加上模鑄、最低電價、最大化峰谷錯開、以及在最低電價下的需求側響應等。這些目標策略將指導未來的響應方式。
二、数字基礎設施的能耗優化,數據中心任務移動可改變負荷:
根據與其他數據中心是否互聯,數據中心有兩類:獨立的數據中心(如傳統的機房);互聯網數據中心(IDC):多個IDCs通過光纖可以進行數據負荷傳輸,並與其之間傳輸數據的光纖網共同構成算力網絡。
1、負荷轉移:在雲計算場景下,尤其是在AI海量計算的時代,IDC負荷通過算力網絡轉移數據負荷,從而實現電力的轉移。考慮到東西電力資源的巨大差異,這種負荷轉移在電力管理中尤為重要。
2、策略實施:數據中心騰訊自身做了應用場景需求響應特性測試。這包括在不影響任務性能的情況下,調節服務器功率,並關注響應速度、響應深度、響應時長和響應精度。
3、時效性考慮:探索數據中心服務器的負荷靈活性策略,並進行靈活調節。這涉及到對實時性不敏感的計算任務進行擴縮容和“斷點續算”,以快速改變負荷分佈。這類任務包括科學計算、視頻渲染以及其他獨立或耦合併行任務。
三、與C端互動平移伸縮電動車充電狀態,聚合為“大電池”:
電動汽車(EV)將電力網絡與交通網絡這兩個複雜的人造系統緊密耦合;EV的充放電與出行由駕乘用戶決定, 形成以EV為核心的信息-物理-社群系統(Cyber-Physical-Social System),帶來新的問題與調控潛力
1、時空協同:在電力-交通網絡耦合的定義中,通過交通網絡轉移充電負荷,從而改變電網的潮流分佈,這在新能源車時代尤其關鍵。
2、實施方案:通過電力控制中心,結合交通擁堵信息發布以及各充電站的可用容量,制定即時策略,引導電動汽車到達對交通系統和電力系統都最佳的位置進行充電,以實現EV充電服務的效益最大化。
3、試點實驗:基於價格調控的電動營運車輛調度是接下來的一個重要嘗試方向。這包括利用出行價格調控車流密度和供需關係,以及利用充電價格調控充電需求的時空分佈。目標是解決出行需求與充電負荷的供需不平衡,通過各類價格對營運車輛進行適當引導。