美陆军公布其机器学习框架：更强的持续学习能力

美国陆军认为，陆军部队需要做好在世界上任何地点进行战斗的准备，因此其智能化系统也需要具备应对各种环境的能力。在这一需求的推动下，美国陆军作战能力发展司令部（CCDC）下辖的陆军研究实验室（ARL）正牵头开展一系列研究与开发项目。近日，陆军研究实验室的智能系统研究办公室公布了其新研制的机器学习框架，使人工智能系统能够具备更强的持续学习能力。这项工作也得到了国家科学基金会的支持。

美国陆军全新的深度神经网络框架使人工智能系统能够更好地学习新任务，同时不会遗忘在之前的任务中学到的东西。由陆军资助的北卡罗来纳州立大学的研究人员也证明，使用该框架学习新任务可使人工智能更好地执行以前的任务，这种现象称为后向传递。

背景

传统的深度神经网络人工智能系统专为学习小范围任务而设计，因此，在学习新任务时可能会发生以下几种情况：系统在学习新任务时会忘记旧任务，这被称为灾难性遗忘；系统可能会忘记在之前的任务中学到的一些东西，同时也没有学到新的技能；或者系统可能在添加新任务的同时对已经习得的知识进行修改，这会限制改进并导致人工智能系统过于庞大而无法有效运行。

因此，美陆军研究小组提出了名为“学习成长”的全新框架，试图通过称为终身学习或学会学习的持续学习方法，解决上述问题。该框架将网络结构学习和模型参数学习分离开来。在实验测试中，它优于以前的持续学习方法。因此，陆军的智能化系统在世界各地的战场上执行各类任务而习得新技能的同时，不会忘记已经训练过的技能，从而使这些系统的能力不断增强。例如，在执行城市作战行动时，轮式机器人可以学习密集城市的新导航参数，但它仍然需要在以前遇到的森林等环境中有效运作。

“学习成长”框架的原理

要了解“学习成长”框架，请将深度神经网络视为一个有许多层的管道。原始数据进入管道的顶部，而任务输出出现在底部。管道中的每个“层”都是一种数据操作的计算，以帮助网络完成其任务，例如识别数字图像中的对象。在管道中布置这些层的方式有多种，这些方式对应于网络的不同“架构”。

当要求深度神经网络学习新任务时，“学习成长”框架首先通过搜索进行显式神经架构优化。这意味着当网络进入其系统中的每一层时，它可以决定做以下四件事之一：跳过层；以与先前任务相同的方式使用层；将轻型适配器连接到层，并对适配器进行轻微的修改；或创建一个全新的层。

这种体系结构优化有效地实现了完成新任务所需的最佳拓扑结构或各层的布局。一旦完成体系结构优化，网络就会使用新拓扑来训练自己如何完成任务——就像任何其他深度学习人工智能系统一样。

“学习成长”框架的特点

美国陆军使用多个数据集进行了多项试验。试验表明，在执行新任务而保留的现有层中，新任务与以前的任务越相似，重叠就越多。更有趣的是，通过优化或“学到”的拓扑结构，经过训练以执行新任务的网络几乎不会忘记执行旧任务所需的技能，即使与旧任务不相似也是如此。

研究人员还将“学习成长”框架学习新任务的能力与其他几种持续学习方法相比较，发现“学习成长”框架在完成新任务时具有更高的准确性。为了测试每个网络在学习新任务时可能的遗忘程度，研究人员随后测试了每个系统在执行旧任务时的准确性。测试表明，“学习成长”框架再次优于其他网络。

在某些情况下，“学习成长”框架甚至在执行旧任务时做得更好。这种情况被称为后向转移，即学习一项新任务会让系统更好地处理一项旧任务。这种现象一直能在人们身上看到，但出现在人工智能系统中尚不多见。

结语

美陆军正大力投资最先进的机器学习技术，这些技术将指导陆军研究实验室的研究人员开发机器人应用，例如智能机动和学习识别新物体。目前的研究将使人工智能系统更接近于可在战场上与美陆军作战人员并肩作战的有效无人系统。“学习成长”框架的研究成果将于6月9日至15日在加利福尼亚州长滩举行的第36届机器学习国际会议上正式发布。

李皓昱译自互联网，戴钰超审定

2019年5月20日

声明：本文来自防务快讯，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

美陆军公布其机器学习框架：更强的持续学习能力

强化印太态势感知：美国网络司令部持续推进“数据和传感器”项目建设

提升战备状态：美国网络司令部持续推进“持续网络训练环境”建设

应对量子计算“生存威胁”：美国国防部发布后量子密码战略