引用格式

欧阳小叶,李 彬,潘小山.2022年元宇宙技术主要发展动向分析[J].无人系统技术,2023,6(2):103-111.

2022年元宇宙技术主要发展动向分析

欧阳小叶 1李彬 2潘小山 3

(1. 中国电子科技集团公司电子科学研究院社会安全风险感知与防控大数据应用国家工程研究 中心,北京 100041;2. 嘉远未来数字科技(北京)有限公司,北京 100083;3. 中国科学院微电子研究所智能制造电子研发中心,北京 100029 )

摘 要 元宇宙被认为将成为移动互联网的“继任者”,是一种全新的、以虚拟现实为主的新兴计算技术与系统。首先对元宇宙技术领域2022年的最新研究、应用动向与进展进行综合评述,介绍了虚拟现实与增强现实、人工智能生成内容、“拟人态”虚拟人等元宇宙智能核心技术的最新科研与应用进展;随后盘点了美国陆军、空军和DARPA近年来在元宇宙领域的加速布局情况;最后讨论元宇宙技术未来发展趋势及其在军事作战中的作用。综述表明,率先发展元宇宙被认为是掌握未来互联网高地和话语权的必由之路,元宇宙正在与虚拟现实与增强现实、云计算、人工智能、Web 3.0、脑机接口等新兴技术形成同频共振和协同发展,特制的专用军事元宇宙技术已经被论证可以应用于广泛的实际军事作战用途,并将贯穿智能化战争“战前-战时-战后”全过程。

关键词 元宇宙;人工智能;虚拟现实;人工智能生成内容;数字虚拟人;军事应用

1 引 言

2022年2月,美太空军技术与创新主管丽莎·科斯塔在美国军用通信与电子协会(AFCEA)太空军信息技术会议上表示:由于太空军成员无法真正进入太空,通常依靠以数字形式展现的太空域完成任务,太空军应充分利用在虚拟现实等数字技术领域的大量投资,创建专用元宇宙;可先在太空军进行试点,继而观察军事元宇宙的适用范围是否可以扩展至美国全军。元宇宙(Metaverse)是利用科技手段进行链接与创造的、与现实世界映射与交互的虚拟世界,具备新型社会体系的数字生活空间[ 1-2]。元宇宙不仅可以加速各行各业(包括军事领域)的数字化进程、带动相关信息产业的大力发展、促进数字经济产值的持续提升[3],更关键的是,率先发展元宇宙被认为是掌握未来互联网高地和话语权的必由之路,成为世界主要强国和主要科技巨头当前争相布局的战场。2021年被誉为“元宇宙元年”,在经历2021年的井喷式发展之后,元宇宙技术在2022年依然保持超高的研发与应用热度。

2 元宇宙科技巨头迎来技术升级

美国科技巨头企业拥有强大的算力和成熟的基础性工具和技术,例如虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)、人工智能内容生成、数字虚拟人等,其全球化的元宇宙生态意识、突破创新和平台产品推进,均领先世界。2022年,世界范围内致力于开拓元宇宙的科技巨头,在相关技术与产品研发方面均取得突破性进展。

2.1 虚拟现实与增强现实技术

在VR与AR技术领域,2022年的主要突破集中于面向大规模便捷应用的元宇宙头显的不断硬件升级。2021年近80%的VR头显销量来自美国Meta公司的Meta Quest 2(质量为503克,为目前市面上最轻的VR头显),其优势地位明显,但是依然存在体积庞大的问题。因此,虚拟现实与增强现实设备“轻便化”是2022年技术发展的重要趋势。2022年8月,美国斯坦福大学和美国英伟达公司联合研发出仅有60克、2.5毫米的轻薄VR全息眼镜,由瞳孔复制波导、空间光调制器以及一个几何相位透镜组成,通过光学堆栈提供全彩的3D图像,并实现了一个用于全息眼镜的3D全息图像合成的全新算法框架[4]。如图1所示,左图展示了该全息眼镜台式原型机捕捉到的结果(右下角数字表示峰值信噪比)。图中放大后的细节表明,该算法的成果呈现出更高的画质和对比度。右图展示该VR全息眼镜的可穿戴原型机,该成果成功缓解了当前VR技术面临的显示器体积庞大和佩戴不适的应用问题,被认为是VR技术“向实用化阶段迈出的巨大一步”。元宇宙世界需要强大的硬件作为支撑,但目前的VR/AR硬件还不足以建立一个宏大的虚拟世界。计算力不足是其中一个突出原因,众多元宇宙厂商都在试图解决这个问题,例如美国Meta公司于2022年10月发布了新一代头显“Meta Quest Pro”,新一代头显拥有强大的计算力,可以用摄像头捕捉真实世界图像并以彩色形式实时显示在头盔内部,有效改进上述问题。

图1 VR全息眼镜Fig.1 Holographic Glasses for Virtual Reality

VR产品体积大、质量大,佩戴体验感不佳一直是困扰元宇宙技术大规模推广的难题,最新的Pancake方案有望解决这一问题。为解决当前菲涅尔透镜VR设备进一步轻薄化的关键问题,美国Meta公司、美国苹果公司、华为公司等巨头已经计划推出搭载Pancake方案[5]的头显(VR光学方案技术主要经历了非球面透镜、菲涅尔透镜和Pancake方案等三个阶段),该方案有望成为未来3~5年内VR升级的首选光学方案。

2.2 人工智能生成内容技术

人工智能生成内容(Artificial Intelligence Generated Content,AIGC)被称为“元宇宙时代的生产力工具”,2022年被称为“AIGC元年”。Web 3.0时代的内容消费需求飞速增长,传统的“用户生成内容(UGC)”和“专业生成内容(PGC)”等内容生成方式将难以匹配扩张的需求,AIGC将是新的元宇宙内容生成解决方案[6]

随着自然语言处理技术的不断成熟以及扩散模型(Diffusion Model)技术在2022年的井喷式发展[7],人工智能已经不再仅作为内容创造的辅助工具,其创造生成内容已成为可能。2022年的里程碑式发展是Stability AI公司于2022年8月发布的基于计算机视觉顶级会议CVPR 2022上发表的潜扩散模型(Latent Diffusion Model)成果[8],被认为是“最强文本生成图片”的Stable Diffusion框架,首次实现使用消费级的显卡便能够迅速实现文生图,并且完全免费开源,因此长期占据GitHub热榜第一的位置,掀起了文本生成图像内容领域的新革命。Stable Diffusion模型的第二个版本于2022年11月发布,在稳健性和高效性上均有所提升。其他代表性成果还包括DALL·E2(美国OpenAI公司于2022年5月发布)、Disco Diffusion 和Imagen(美国谷歌公司于2022年4月和11月发布)等。虽然上述模型表现惊艳,但基本都是专一于某一类任务(例如由给定文本生成图像),而对于不同类型的任务,则往往需要单独训练或重新构建新模型。为了解决该问题,2022年11月,美国伊利诺伊大学厄巴纳-香槟分校和得克萨斯大学奥斯汀分校联合团队发布多功能扩散(Versatile Diffusion,VD)模型,这是世界首个多流多模态多任务的“大一统”扩散模型框架[9](如图2所示),被认为是“迈向通用生成式人工智能”的关键一步。

图2 多功能扩散模型同时支持多流多模态多任务Fig.2 Versatile Diffusion (VD) model supports multi-stream, Multimodal and multi-task simultaneously

2.3 “拟人态”数字虚拟人技术

在虚拟空间数字虚拟人像生成与互动技术方面,美国英伟达公司在2022年的成果最为丰硕,主要集中在对其于2021年推出的旨在帮助元宇宙创作者建立虚拟人物形象的Omniverse Avatar元宇宙产品进行了全面升级和配套支撑。2022年3月英伟达推出全方位云服务Omniverse Cloud,支持远程访问Omniverse Avatar以进行3D设计协作和模拟;2022年8月英伟达发布一套基于云服务的元宇宙人工智能模型——NVIDIA Omniverse Avatar Cloud Engine,其建立在英伟达的统一计算框架之上并提供了对丰富的软件工具和API的访问,从而利用高度逼真且可以进行互动的化身所需的各种技能;2022年8月英伟达提出一种具有多分辨率哈希编码的即时神经图形原语,并基于此发布了从2D图像创建3D图像的工具InstantNeRF,成为目前最先进的神经图形学软件开发工具包,能帮助用户创造出创造元宇宙虚拟人所需的大量3D内容。如图3所示,该成果能以更高效率实现更高的重建质量和精度,例如在相似的可训练参数规模情况下训练速度比以频率编码基线模型[如图3(b)所示]高8倍。该成果获得了图形学顶级国际会议SIGGRAPH 2022的最佳论文奖[10]

图3 具有多分辨率哈希编码的即时神经图形原语Fig.3 Instant neural graphics primitives with a multiresolution Hash Encoding

3 美军方元宇宙相关技术研究与产品应用

当前,美军各军兵种、各部门均在加紧发力打造初阶段“军事元宇宙”。近年来,元宇宙的虚拟现实和增强现实技术已被纳入美军的常规军事训练,其中陆军和空军是此类应用较为密集的军种。

3.1 美国陆军方面

全球军事领域,美军陆军最早用VR/AR开展军事训练。自20世纪80年代以来,美国陆军一直在为训练目的而拼接虚拟世界,首次创建了“SIMNET”项目并使用,这是用于集体训练和任务演练的广泛模拟器网络的首次展示,模拟器网络是一个带有车辆模拟器和显示器的广域网,用于实时分布式作战模拟[11]。随后,2021年美军在演习中演示了“联合终端攻击控制员虚拟训练器(JVT)”及“3D作战人员增强现实(3D WAR)”两个新型虚拟现实训练系统,该系统专门用于开展美海军陆战队火力支援队员及联合终端攻击控制员作战训练,可使部队随时随地在各种虚拟场景中开展多种作战科目的训练活动,目前已覆盖实弹演习中的训练科目。

2022年1月,美军发布了美国陆军未来司令部 31 项标志性现代化计划之一的“集成视觉增强系统(IVAS)”成果,能够为士兵提供更清晰、数据更丰富的战场态势影像。为了满足在实况训练演习中更准确地模拟关键武器系统效果的需求,2022年6月,美国陆军开发了依托于“合成训练环境实兵训练系统(STE-LTS)”项目和“模拟、培训和仪器仪表敏捷采集响应(STAAR)”项目的“合成训练环境实况训练系统”,既继承了此前虚拟现实环境下军事训练模式所惯用的实时模拟使能器(例如激光武器等),也利用地形成像和虚拟现实生态系统的最新技术提供了更精确的人机交互。STE-LTS 计划旨在加速尖端设备和软件的发展,以增强作战训练环境的真实性。

3.2 美国空军方面

美国空军在数字靶场建设方面持续发力。早在2020年,美国空军宣布内利斯空军基地新的“虚拟测试与训练中心(VTTC)”正式落成,未来联合空中作战训练将在此进行。战斗机飞行员可在此通过虚拟现实等技术模拟和复现对实力相当国家战机的作战情形,并演练先进的空战战术战法。2022年3月,美国空军宣布已在佛罗里达州廷德尔空军基地启用“数字孪生全息实验室”,以数字模型形式展示空军基地,使工程师能够在虚拟环境中模拟维修装配、使飞行员能够在虚拟环境中测试飞机性能和演练飞行战术战法,相关技术将最先应用于航天航空装备的研发,未来将应用于陆、海、空、天、电、网各领域装备的研发、生产与维护。

2022年5月,AR空战培训系统开发商Red 6宣布已在美国加州圣莫尼卡机场成功测试AR空战飞行训练模块,测试内容是利用Red 6的AR方案来训练飞行员使用Berkut 540战斗机以及在空中加油。Red 6早在2021年8月就获得了美国空军7000万美元的合同,为空军防御部门开发AR战斗培训方案,项目为期5年。

3.3 DARPA方面

2008年,DARPA牵头主导建设“美国国家网络空间靶场(National Cyber Range,NCR)”项目(核心组成部分如图4所示),这是开展网络攻击与防御有效性评估、网络武器有效性评估、网络部队训练、网络任务演习、网络战术/技术/过程开发的基础设施,被行业人士明确称为“元宇宙”的军事应用初探。自2021年以来,DARPA启动了多个元宇宙相关项目。2021年,DARPA启动“感知性任务指导(Perceptually-enabled Task Guidance,PTG)”项目,在虚拟环境下提供及时的视觉和音频反馈以帮助军事人员执行复杂任务,例如机械师被要求修理更多类型的日益复杂的机器和平台、医务人员被要求在更长的时间内执行更多的程序等,该项目的实施路径如图5所示;2021年8月,DARPA启动一项针对小企业创新研究计划(SBIR)和小企业技术转移计划(STTR)的项目—— “数字孪生在自主水下作战中的定义和利用(DELTA)”项目,旨在确定将元宇宙与数字孪生技术扩展到无人潜航器的可行性以及海底间歇性通信对水下数字孪生的影响。

图4 DARPA“美国国家网络空间靶场(NCR)”项目Fig.4 DARPA’s National Cyber Range (NCR)

图5 DARPA“感知赋能任务指导(PTG)”项目Fig.5 DARPA’s Perceptually-enabled Task Guidance (PTG)

作为DARPA“感知赋能任务指导(PTG)”项目的重要组成部分,美国诺斯罗普·格鲁曼公司于2022年2月宣布将开发嵌入到增强现实头盔的人工智能助理样机——“作战人员与背景自适应推理直觉助理(OCARINA)”,利用先进的信息处理和增强现实接口,人工智能助手将通过语音和图形在正确的地点和时间提供反馈和指导,以协助旋翼飞行员执行预期和意外任务。同期,该项目授予Paolo Alto研究中心一份580万美元的合同,用于开发面向任务支援的自动多模式学习系统。该系统是一种增强现实系统,以帮助未来战场的医务兵和工程兵执行任务,包括计算机视觉与机器学习的数据库系统、由人工智能驱动的头戴式装置等主要模块。此外,在将虚拟现实与人机合作作为主题之一的DARPA“进攻性蜂群使能战术(OFFSET)”项目中[12],最后现场测试中平行使用了“虚拟”蜂群智能体和现实智能体,协助完成现实世界的任务,并利用沉浸式蜂群界面(例如虚拟现实和增强现实等)来指挥和控制蜂群。

4 元宇宙技术发展趋势分析

元宇宙汇集和融合了一系列下一代技术,从云计算到人工智能、区块链、脑机接口等[13]。对相关技术发展趋势分析如下:

一是元宇宙框架下虚拟现实/增强现实发展趋势。元宇宙是数字媒体的下一个大主题,VR和AR是推动其发展的关键技术、也是目前元宇宙最成熟的技术[14]。这两项技术将极大增强虚拟世界真实感,并允许用户与虚拟对象、人和环境进行交互。尽管目前VR和AR都处于发展的初期阶段,并且元宇宙在当前很大程度上仍是概念性的,但AR在短期内将比VR更具优势。这是因为与笨重的VR头显相比,AR可以通过网络浏览器和智能手机访问。

二是元宇宙框架下云计算发展趋势。虚拟世界的沉浸式体验将越来越需要云计算工具来处理、存储和分析平台上生成的高并发、巨体量数据。如果元宇宙技术与平台想取得成功,就必须提供无缝的用户体验。亚马逊、谷歌、微软、IBM和阿里巴巴等世界范围内的云服务提供商将受益于不断增长的元宇宙主题,因为访问按需计算、分布式存储、高并发分析服务等元宇宙平台服务的需求在不断增加。

三是元宇宙框架下人工智能技术发展趋势。人工智能是元宇宙的重要工具,影响其价值链和产业链的各个方面。人工智能技术将支持半导体中的计算功能,处理设备上生成的用户数据,在软件平台中创建虚拟世界和化身,并允许在体验中创建内容和交互,使虚拟世界具有沉浸感和吸引力。元宇宙还致力于开发可以理解多种模式的统一人工智能模型(例如美国DeepMind公司在2022年5月发布的具备多模态、多任务、多具身特点的“通才”智能体Gato[15],如图6所示),这意味着它们可以在聆听的同时阅读嘴唇以获得更好的语音识别,或者通过同时分析文本、图像和视频来识别社交媒体内容。

图6 DeepMind公司的“通才”智能体GatoFig.6 DeepMind’s generalist agent Gato

四是元宇宙框架下Web 3.0发展趋势。Web 3.0是一种与元宇宙底层基础设施相关的、具有颠覆式意义的意识形态。Web 3.0将依托区块链技术,并由社区进行设计和管理。Web 3.0将为Web 2.0的一些限制提供解决方案,特别是与内容和数据的所有权和控制权相关的问题[ 16-17]。这是对传统互联网科技巨头企业所拥有的封闭式生态系统的一次突破,因为原有生态不允许用户拥有内容所有权或了解其数据的使用方式。

五是元宇宙框架下脑机接口发展趋势。作为全新的革命性技术,元宇宙框架下的脑机接口旨在建立大脑或神经系统与外部设备间的信息交换桥梁。其重要意义在于,让人们能在身体的退隐中实现更高阶的人机交互[18]。脑机接口支持下的元宇宙,产生了全新的交互逻辑,真正实现“心想事成”的人机交互,虚实之界也将更加难以辨别。脑机接口成为研究与投资的热门领域,但作为交叉性极强的学科领域,脑机接口涉及诸多领域的关键性问题,受制于技术、伦理、政策等方面因素,商业化情景处于逐步探索阶段。

5 元宇宙技术在未来军事作战中的应用分析

当前,特制的专用军事元宇宙技术已经被论证可以应用于广泛的实际军事作战用途,被称为“未来战争的新高地”,并将贯穿智能化战争“战前-战时-战后”全过程。一是战前,应用于智能化作战力量的研发与生产,加速奠定智能化战争的稳固地基,还能通过整合当下实时作战力量和作战环境数据,预测评估其未来的状态、模拟不同作战方案的作战效果,帮助指挥官实现作战规划的最优解;二是战时,利用传感器输入的数据实时呈现战场态势,高效部署作战力量,此外技术人员可以在数字化空间及时了解装备情况,确定故障源、远程组织抢救抢修,从而快速恢复作战能力;三是战后,可快速掌握打击目标与己方作战力量状态,高效进行目标打击效果评估和作战能力恢复[19]

下面以军事合成训练、战场态势推演、心理健康建设为例,概述元宇宙技术对重塑军事思维、深刻改变未来战争的设计与进程的影响。

军事合成训练:传统训练方式往往要考虑训练地点、成本和后勤资源,存在客观衡量训练进展能力不足、精确反馈能力不足等问题。而采用沉浸式训练来增强(或取代)现场训练,充分利用虚拟现实/增强现实技术,能够让作战人员身临其境,为作战人员提供互动体验、可行指标、持续学习,让作战人员的大脑在体验、认知、行为和情感等多个层面上参与训练。在虚拟战斗中进行“随战训练”,降低了训练成本,提高了安全性且更易实现。

战场态势推演:真实的战场充满了种种不确定性,因此需要通过不断的战争演习来做好充分准备。战争演习的具体实施方式既可以是传统的实战演习,也可以是现代的虚拟战争游戏、合成虚拟战场、演习元宇宙等——在虚拟战场上,士兵和战斗的决策人物可以超越现有条件,将想象中的概念、战斗操作、队形等模拟出来,进行训练。

心理健康建设:元宇宙本质上也是一种虚拟社交空间,它为士兵之间提供新的沉浸式体验交互方式、充分满足他们的社交需求,丰富士兵的业余生活,有助于提振士气和提供心理健康咨询等服务[20]。此外,士兵们会在一定时间内进行整体换防或者变化服役地点、军官会有职位晋升与职务调动,导致其与家人、家乡的长时间分离,而元宇宙技术将物理隔离的士兵和家人纳入统一的虚拟空间并进行真人互动,强化了家庭对士兵的呵护,进而缓解士兵的压力与对家人的思念,同时降低焦虑。

6 结束语

元宇宙将是下一代互联网的终极形态,是与现实世界平行同构的一个虚拟世界,具备多维度、全感官、虚实融合、无缝交互等主要特征,然而受限于硬件设备体积质量、网络基础设施支撑能力、应用场景规范化与合理性等因素,元宇宙距离大规模应用(特别是军事应用)还存在一定距离。同时,元宇宙技术对于人工智能技术赋能军事有着很大启发意义,不仅在于其应用于军事训练和态势推演的效能已经被论证和验证,更在于由于其本身就是一个复杂的认知体,因此具有不可估量的未来战争(特别是认知域作战)应用价值与潜力。在元宇宙中开展的模拟战备训练、推演战争博弈等,将开启作战研究新思路,是探索未来战争理论和作战方式的有效途径。

来源 《无人系统技术》

编辑 罗倩

监制 李志

声明:本文来自无人系统技术,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。