编者按:美国陆军网络司令部和特种作战部队前任和现任官员联合撰文,强调“以数据为中心”的工作对现代信息战的重要性,介绍陆军网络作战和特种作战部队围绕俄乌冲突开展的数据合作工作,并就如何在现代战争中成功利用信息维度提出对策建议。

文章称,自俄乌战争爆发以来,乌克兰将赢得信息战视为重要战略推动因素,并系统性地在西方新闻和社交媒体上开展真假交织的宣传,成功地激发了西方向乌克兰支持和援助;俄乌战争凸显出信息在现代冲突中的重要作用,军事和平民领导人必须了解信息维度在战斗中的战术、作战和战略影响;当前,信息维度评估存在诸多难解问题,包括叙事影响力根源、叙事影响受众的机制、发布机密信息的衍生效应等,此外信息操作作用的研究和分析还需要以获取商业数据为基础;社交媒体和其他数据平台已成为民族国家及其代理人争夺控制叙事的平台,而信息活动的分析和评估需要访问上述平台所拥有和运营的商业数据,方式包括基于浏览器的访问、第三方工具访问和政府获得的数据访问等三种,而后者是数据科学专家能够快速、大规模地处理和评估数据的唯一选择。

文章称,俄乌战争爆发后,美国陆军网络任务部队和特种作战部队迅速开展合作,汇集人才和资源就该冲突的信息维度进行了评估;此次合作是“天作之合”,不仅汇集了陆军网络司令部的信息作战部队和第一特种部队司令部的心理战部队,还将前者的技术系统和人才与后者的非常规战争任务和思维方式相结合;此次合作的重点是数据工作,涉及数据科学、数据工程和云基础设施等部分;陆军通过梳理重合业务提高了整个组织的效率并同步了数据采集和分析工作,为所有政府获取的数据创建了一个存储库,从而可以一次性获取数据并根据需要将其提供给各美军各需求方;需要定期评估和重新评估数据采样方法以确保拥有正确的数据,陆军确定网络任务部队和特种作战部队数据采集方法的采样都需要进行调整,以支持欧洲的应急行动;此次协调工作的重要内容是同步以及在某些情况下统一在信息维度上聚合、存储和分析数据的方法。

文章称,俄乌冲突为美国陆军网络司令部2021年底在其大数据平台生态系统内开发的网络数据科学环境提供了首次大规模使用机会,以支持作战环境中的信息优势评估;该环境为数据科学家提供了一个可扩展的计算平台,可以加载相关工具并访问不同的数据存储;该环境为分析人员提供了一个敏捷的平台,可以快速利用正确的数据并回答美国陆军和国防部高层领导人提出的有关乌克兰冲突的诸多问题,对于为决策者提供更好地了解乌克兰冲突所需的信息发挥了至关重要的作用; 在俄乌战争爆发3周内,陆军特种作战部队与网络任务部队联合团队开发了7种新的模型,包括2种新的深度学习模型和3种新的网络科学模型,以支持东欧信息维度的独特需求;联合团队将上述7个模型以及已经开发和部署的现有模型,包括机器学习、网络科学、自然语言处理以及图像分析模型和可视化,部署到定制机器学习管道中和统一的特种作战网络数据上的生产中,以提供自动生产的日常产品并分发给欧洲的相关陆军、联合部队和特种部队司令部。

文章提出,现代战争要求采用数据驱动的方法来对信息维度进行评估,并借助网络、系统工程、社会科学、营销、心理学和其他学科的理论和应用的支持;为更好地了解如何在现代战争中成功利用信息维度,美国防部应投资于“以数据为中心”的工作,利用机器学习、人工智能和计算社会科学的进步来影响常规和非正规战场及其他领域;美国防部需要继续增强其数据科学能力,以确保做好在未来冲突中有效且高效地战斗的准备;陆军特种作战与网络任务数据伙伴关系应继续发展并涵盖新的研究和数据获取领域,以提高新的作战效率并在现有成功的基础上进行扩展。

奇安网情局编译有关情况,供读者参考。

如何用数据取胜:美国特种部队与网络任务部队合作伙伴关系支持乌克兰

自 2022 年 2 月俄乌战争爆发以来,赢得信息战一直是乌克兰的战略推动因素。战争爆发后不久,乌克兰的各个实体开始系统性地在西方新闻和社交媒体上大量报道乌克兰国家抵抗和战术成功的亮点。这些故事有时是虚假的,而且经常被揭穿,比如关于“基辅幽灵”的故事,他是一位统治首都上空的神秘乌克兰战斗机飞行员。不管真假,这些故事将抵抗、领导力和早期军事胜利交织在一起,激发了西方的支持和援助。今天,包括美国在内的许多西方国家正在利用国家力量的所有要素(外交、信息、军事和经济)帮助乌克兰击退俄罗斯的攻击。然而,如果乌克兰未能在西方赢得信息战,那么大量的外援和支持可能就不会实现。

乌克兰战争凸显出信息在现代冲突中的重要作用;军事和平民领导人必须了解信息维度在战斗中的战术、作战和战略影响。由于多种原因,信息维度提出了一些难以回答的复杂问题。例如,哪些叙事会流传或传播?叙事如何影响不同的受众?对手如何相应地调整他们的叙事?发布机密信息的二阶和三阶效应是什么?雪上加霜的是,大多数信息操作都是通过多个社交和传统媒体渠道进行的,并且在很大程度上依赖于这些平台背后的数据——即商业数据,或由公司专有和商业化的数据。如果无法获得商业数据,对信息在战争中的作用进行研究和分析就很困难,而且在很大程度上是不完整的。为了更好地了解如何在现代战争中成功利用信息维度,美国防部应投资于“以数据为中心”的工作,利用机器学习、人工智能和计算社会科学的进步来影响常规和非正规战场及其他领域。

一、为什么数据至关重要

许多专家将数据称为“新石油”。最近,《美国国防战略》和高级领导人的官方评论都强调了数据对国防部的重要性。美国陆军部长克里斯汀·沃穆斯确认“以数据为中心”的作战是美国陆军的首要目标,因为信息维度巨大,而且战争正变得越来越数据驱动。因此,现代战争要求对信息维度的任何评估都从数据驱动的方法开始理解它,并得到网络、系统工程、社会科学、营销、心理学和其他学科的理论和应用的支持。近年来,社交媒体和其他数据平台已成为民族国家及其代理人争夺控制叙事的平台。无论行为体是发起叙事(利用信息“开火”)还是操纵网络(进行信息“操纵”),第三方信息技术和网络平台都会精确记录每一个动作。

无论是社交媒体帖子(文本、图像或视频)还是传统网站或博客中的数据,都是在美国防部信息网络(DODIN)外部的信息技术系统中创建和存储的,并且通常是商业拥有和运营的。信息活动的分析和评估需要访问商业数据,这种访问可以通过以下任何方法进行:

1. 基于浏览器的访问,数据保留在原始社交媒体公司的服务器上。

2. 第三方工具访问,数据由第三方公司获取并保留在其服务器上。

3. 政府获得的数据访问,即在政府服务器上进行数据保留和分析。

为评估信息维度的全面广度和范围,第三种选择对政府分析人员最有吸引力。在政府服务器上进行分析时,分析人员不会向第三方透露其优先信息需求,政府可以将开源数据与其他数据源合并。此外,政府获得的数据访问是使政府数据科学专家能够快速、大规模地处理和评估数据的唯一选择。重要的是,美国防部数据科学人才,包括陆军人工智能学者计划的毕业生,如果无法访问政府系统上的相关数据集,就无法利用他们的技能来获得信息优势。数据科学就其本质而言,需要数据。

二、数据为“特种作战部队与网络任务部队”

合作伙伴关系提供动力

当俄罗斯对乌克兰发动军事行动时,美国陆军网络任务部队和特种作战部队(SOF)汇集人才和资源来评估围绕冲突的信息维度。事实证明,特种作战部队与网络任务部队(SOF-cyber)的合作伙伴关系是有价值的,因为它汇集了陆军在信息领域作战的两个最大的部队:主要存在于陆军网络司令部的信息作战(IO)部队结构;属于第一特种部队司令部的心理战(PSYOP)部队结构。此外,此次合作还将陆军网络司令部(ARCYBER)的技术系统和人才与第一特种部队司令部的非常规战争任务和思维方式相结合。这是“天作之合”。虽然信息战和心理战(IO-PSYOP) 伙伴关系的特征在乌克兰冲突过程中不断演变,美国在跨组织和社区的更好数据集成和使用方面不断取得进展。最终,特种作战部队与网络任务部队(SOF-cyber)的合作伙伴关系展示了更大的“太空、网络和特种作战部队三位一体”的价值,该三位一体目前正在开发中,旨在增强竞争期间对对手恶意活动的综合威慑。

本文三名作者共同领导了2022年2月的特种作战部队与网络任务部队(SOF-Cyber)数据工作,包括该项目的数据科学、数据工程和云基础设施部分,以下分析传达了我们作为该项目实践者的经验。作为特种作战部队与网络任务部队(SOF-cyber)数据工作的一部分,我们确定了从信息维度获取同类商业数据的类似但互不相关的工作。甚至在某些情况下,特种作战部队和网络部队与同一供应商就相同数据签订了单独的合同。此次合作有助于提高整个组织的效率并同步数据采集和分析工作。重要的是,同步工作为所有政府获取的数据创建了一个存储库,从而可以一次性获取数据,然后根据需要将其提供给各种司令部。例如,在一个实例中,我们协助将数据合并到美国陆军网络司令部的大数据平台中,然后向具有信息优势任务和权限的其他美国防部部门提供访问权限。

然而,访问数据只是数据科学工作的第一步。随着数据开始积累,另一个关键任务是确定我们是否拥有正确的数据。如果数据是错误的,获取大数据集是没有用的,虽然网络和特种作战部队单位都在获取大量数据,但双方都没有资源(有时也没有权限)来获取与乌克兰冲突信息维度相关的所有数据。本质上,各司令部都是从非常大的“数据消防水管”中采样相对少量的数据。对于美国防部的任何研究人员来说,了解正在进行的数据采集工作是否支持当前和预计的作战需求非常重要。为了确保做到这一点,需要定期评估和重新评估数据采样方法。就特种作战部队与网络任务部队(SOF-Cyber)的合作伙伴关系而言,我们确定网络任务部队和特种作战部队数据采集方法的采样都需要进行调整,以支持欧洲的应急行动。最终,特种作战部队与网络任务部队(SOF-Cyber)协调工作的很大一部分集中于同步,以及在某些情况下统一我们在信息维度上聚合、存储和分析数据的方法。

三、创建敏捷的数据科学环境

2021年底,美国陆军网络司令部在其大数据平台生态系统内开发了敏捷的网络数据科学环境。新环境是一个容器化的JupyterHub环境,它为数据科学家提供了一个可扩展的计算平台,加载了他们最喜欢的工具,并允许访问大数据平台环境中支持的所有不同的数据存储。起初,新的网络数据科学环境用于支持防御性网络行动(包括支持陆军对Solarwinds和Log4J渗透的响应)。尽管如此,俄乌冲突为该环境提供了首次大规模使用,以支持作战环境中的信息优势评估。

美国陆军和国防部高级领导人提出的有关乌克兰冲突的许多问题在大数据平台现有的第三方工具和仪表板中并不能完全得到回答。新的网络数据科学环境为分析人员提供了一个敏捷的平台,可以快速转向正确的数据并回答高层领导的问题。令人难以置信的是,我们的团队评估认为,特种作战部队与网络任务部队(SOF-Cyber)信息优势团队90%的分析和分析产品都来自使用新的网络数据科学环境。因此,在短时间内,新环境对于为决策者提供更好地了解乌克兰冲突所需的信息至关重要,而这些信息只能从数据科学环境而不仅仅是数据仪表板中获得。

四、数据科学人才

网络数据科学环境(及其背后敏捷的 DevSecOps 流程)使作者们能够充分利用网络和特种作战部队中的数据科学人才。该环境被各种各样的人员使用,包括具有民政、军事情报、心理战、特种部队和网络背景的人员。但是,在幕后,两个职业领域被证明至关重要。数据科学主要由美国陆军网络能力开发军官或来自17D 职业领域的初级军官进行,并由运筹学和系统分析军官或来自职能领域49 职业领域的校级军官进行一些监督和投入。虽然大多数 17D 支持其他网络工作流程,但也有一些在云基础设施和数据科学方面表现出色,并已在体系级别得到整合。这些军官主要在本科教育期间获得了机器学习和人工智能专业知识,而其他军官则拥有研究生学习经历(硕士和博士经历均通过奖学金和陆军平民学校项目获得支持)。相关数据的访问权限和数据科学环境的可用性使美军能够快速迭代高级领导人的问题,并快速、大规模地提供相关信息。

五、为什么数据很重要

在俄乌战争爆发3周内,特种作战部队与网络任务部队(SOF-cyber)联合团队开发了7种新的分析方法(包括2种新的深度学习模型和3种新的网络科学模型),以支持东欧信息维度的独特需求。除了7个模型外,该团队还依赖于团队已经开发和部署的现有模型,包括机器学习、网络科学、自然语言处理以及图像分析模型和可视化。这些模型被部署到定制机器学习管道中和统一的特种作战网络数据上的生产中,以提供自动生产的日常产品并分发给欧洲的相关陆军、联合部队和特种部队司令部。

在正确的环境中拥有正确的数据可以每天向高级领导人提供相关信息,并有助于大数据平台概念取得巨大胜利。由于信息维度仍然是俄罗斯对乌克兰行动的一个关键方面,美国防部需要继续增强其数据科学能力,以确保我们做好在未来冲突中有效且高效地战斗的准备。了解冲突的信息维度比以往任何时候都更加重要,培养高层领导者的理解应该“从以数据为中心”的方法开始。当我们拥有正确的数据、在正确的环境中并掌握在正确的人才手中时,就可以回答有意义的作战问题,并收集作战见解。如果缺少其中任何一种成分,价值主张往往会崩溃。始于乌克兰的特种作战部队与网络任务部队(SOF-Cyber)的数据伙伴关系应继续发展并涵盖新的研究和数据获取领域,以提高新的作战效率并在现有成功的基础上进行扩展。

作者简介:

大卫·贝斯科中校,博士,西点军校系统工程系的学院教授。2020 年至 2022 年,担任陆军网络司令部技术战中心首席数据科学家。

丹尼尔·霍桑少校,博士,陆军网络司令部敏捷数据科学环境的负责人,自2021年2月以来一直领导陆军网络司令部技术作战中心基础设施团队。

汤米·丹尼尔上尉,第1特种部队司令部(空降)第 40-25 特遣队的数据小组负责人。他最近的任务是在第一特种部队司令部的数据办公室工作,并担任跨职能团队领导。

声明:本文来自网络空间安全军民融合创新中心,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。