本文发表于《指挥信息系统与技术》2023年第4期

作者:刘伟,翟崎,李子,李东敏,李彭伟

引用格式:刘伟,翟崎,李子,等. 基于动态本体的战场目标数据关联技术[J]. 指挥信息系统与技术,2023,14(4):51-56.

摘要

针对战场目标相关数据呈现的海量、异构、网络化分布、内涵丰富以及关联应用前景广阔等特征,利用动态本体的灵活组织特性,提出了基于动态本体的战场目标数据关联方法,支撑了不同场景下以战场目标为中心的信息挖掘分析。结合具体工程实践,描述了典型动态本体技术,并与超大本体(LO)与顶层本体(TO)2种生成方法进行了对比试验。试验结果表明,该方法可有效构建战场动态本体,具有可行性。

引言

对各类战场目标进行数据关联分析的过程是以目标为中心,逐步挖掘和组织与目标相关的历史、实时和预期等要素,包括目标的历史活动规律与活动分析统计情况、当前状态与能力以及战场动向与意图趋势等,通过对这些信息进行融合,形成更高层级的态势估计与威胁估计,支撑威胁量化分析、侦察任务筹划和作战辅助决策等业务。

目前,已有专家在战场目标数据关联方面开展了研究工作。研究工作分析可见,战场目标数据关联仍存在以下问题:1)相关数据来源复杂,既有格式化的和易于理解的标准化数据,又有来源于历史积累、实时动态、开源信息和传感器探测等准格式化的数据,还有来自专业人员或专业部门长期围绕相关目标开展的非格式化行业分析数据,这些数据具有实时与非实时相结合以及标准规范不统一等特点,缺乏统一的组织与描述,导致基于目标的战场信息关联组织困难,制约了目标处理效率和效益的提升;2)随着联合作战背景下战场目标跨域关联分析处理的需求日益增长,目标关联涉及的对象、属性、关系和事件等要素维度不断扩展,对网络化环境下的跨域数据应用与信息组织的要求越来越高。

战场数据有效关联的本质是促进数据到信息的转换,从而形成相对完善的战场知识管理体系。知识表达是战场知识管理的前提,而作为知识组织模型之一,本体定义了领域术语及其之间的关系,不但能有效表达知识,同时还可解决知识管理中的语义问题。近年来,本体技术研究取得了进展,如本体构建技术、本体推理技术、本体映射技术和本体集成技术等,这些技术为本体的应用提供了良好的技术基础。

随着科学技术的进步,本体的发展和应用逐渐成熟,但仍有一些问题有待解决,尤其是在复杂情报产品生产领域。复杂情报产品生成涵盖多个要素,因此构建一个包括所有战场情报要素的复杂情报产品领域本体难度极大,原因如下:1) 领域名词数量繁多且描述各异,以机场为例,与机场相关的专业术语有100个以上;2) 涵盖要素类型多,如描述民用机场和军用机场涉及的要素截然不同,需关联的内容差异极大。

为适应基于知识表征的目标信息关联处理的要求,本文提出了一种基于动态本体的战场目标数据关联方法(本文方法),在对各类战场目标进行本体描述的基础上,对各类本体进行归纳总结,形成以类为中心的对象,并通过动态适配与按需扩展方式实现本体的实例化与具象化。

战场目标数据关联系统架构

面对庞大、复杂且丰富的海量数据资源,基于这些数据开展的信息挖掘与组织会直接影响用户的认知和判断,因此需对数据进行建模处理。先将数据抽象成具有上下文背景意义的对象,再为对象赋予相应的操作,最终给用户呈现出战场目标本体。由于本体是根据行业背景、数据特征进行的相对固定并单一的描述,故无法满足数据动态变化和自适应生长的需求。为此,可实现灵活动态适配、派生和衍化的动态本体技术应运而生。

本文方法在传统的静态或概念描述基础上,以描述战场目标运动特征和变化趋势为出发点,广泛组织各类关联数据,通过信息增强技术动态更新生成战场目标的组成对象、补齐各类属性、挖掘推理相互间关联关系与行为特征等;挖掘目标的时空要素属性,建立基于梯度依次衰减的编码索引机制,实现网络化条件下的数据关联组织,实现数据的所见即所知、所见即所得,提升数据的使用效率。

战场目标数据关联的系统架构如图1所示。战场目标数据关联的系统架构涵盖数据的概念定义、多维组合以及本体映射3个部分,其中,概念定义是根据数据特征进行的抽象总结,包括数据的元信息提取及概念组织,同时面向应用场景匹配模板完成实体定义;多维组合是对属性进行的细分与刻画,关联相应行为,并提供各类关系的访问接口;本体映射在概念定义和多维组合的基础上进行本体化组织,核心是将各类格式化、非格式化和准格式化等数据进行本体映射,本质是对各类数据进行概念识别和关系组合,形成一个有背景意义的个体。本体生成后,可根据需要构建具体的访问对象,也就是促进数据向信息生成。上述过程中,可根据信息组成进行属性补齐,包括时空、状态和活动等,并根据这些信息开展直接或间接关系的抽取,形成行为活动描述图。

图1 战场目标数据关联的系统架构

动态本体构建技术

2.1 动态本体技术

基于动态本体的数据访问是一种语义范式,旨在促进并提升各类异构数据源的访问效率。动态本体技术提供了对数据存储的便捷支持和面向用户的友好接口,支持从海量分布式异构战场数据中实现目标关联信息的高效抽取,有效突破了战场数据应用瓶颈。

基于动态本体的战场目标关联信息组合中,一个动态本体包括对象、属性和关系3个部分。其中,对象指任何可被建模的战场目标实体,如机场、港口、基地、机舰目标、卫星、车辆和人员等;属性主要是在静态描述的基础上增加了各类动态内容,如机场的历史变化过程、适停机型和保障特征等;关系是挖掘或推演实体与实体间的直接或间接关系,如机场与其他实体间的保障关系、备份关系和调度关系等。

2.2 动态本体构建步骤

与战场目标分析相关的动态本体建模过程可分为概念定义、关联组合和本体映射3个阶段,基于动态本体的数据表示模型如图2所示。

图2 基于动态本体的数据表示模型

动态本体构建包括以下5个步骤:

1)任务需求解析:若接收的任务需求是通过文本格式输入的,则利用文本分析对其内容进行语料提取和关键词划分,其重点是按该领域的重要术语集或词典确定符合上下文语义条件的关键词列表;若接收的任务需求是通过格式化方式导入的,则按任务分解条件与规则解析任务的相关特征,确定符合实际任务条件的关键词列表。

2)任务与领域本体匹配:以需求解析阶段获取的关键词列表为检索条件,先采用Lucene文本分析与检索引擎,对领域内相关本体的依据和概念建立文本型索引,再分解领域本体内概念间的语义定义距离,并调节产生适当的概念权重,同时根据概念权重建立匹配数值型索引,最后使用Lucene里的权重指标打分机制,计算可检索领域相关本体的分值,并按分值大小和阈值过滤条件确定直接关联的领域本体资源。

3)领域内本体子集过滤:将关键词生成的基本集合列表作为基准,按语义扩展对检索到的直接相关领域本体进行处理;使用层次遍历法处理语义扩展,主要以关键词元为遍历的首点,分别执行向上扩展和向下扩展,将语义距离小于阈值的节点作为保留节点,且为其恢复或重建领域本体内原有关系,最后形成以关键词元为中心的领域本体子集集合。

4)领域内本体关系映射:利用本体映射方法对领域本体子集集合中的基本概念、关联关系和规范公理分别计算组织结构、字符/词元以及语义规范的相似度,并对这些相似度进行加权融合,从而建立领域本体节点之间的映射关系,实现领域本体子集集合中的本体关系映射。

5)关联本体的迭代组织:采用基于任务领域范畴论的方法和基于形式化概念表征分析的方法对上述步骤确定的本体映射进行处理,从而实现领域本体子集的融合,并通过反复迭代来实现完全动态本体的构建。

2.3 动态本体构建示例

本节以机场为例,对动态本体及其作用进行描述。传统上对机场类目标主要以静态本体方式描述机场的位置、跑道方向、材质结构和作用等级等,而基于动态本体的机场目标在关联飞行计划、能力构成、开源动向和专家经验等数据基础上,可进一步描述适停机型、起降次数、通信保障方式、保养供给模式、经济地位、人员变化和历史发展脉络等信息,甚至可以直接关联飞行计划以计算出相关航班的起降机场、通联方式和可能的飞行员等信息。此外,战场体系分析时,动态本体构建技术可辅助生成关键节点和抗毁顽存样式等信息,从而更好地实现基于动态能力计算的筹划推演、临机方案调整与作战效果评估等。针对机场目标,本文给出了传统的和基于动态本体的2种目标信息组织方式。其中,传统的目标信息组织方式可阶段性地对目标进行描述;基于动态本体的目标信息组织方式可全周期、全维度和全领域关联地对目标进行体系描述。图3给出了针对机场目标的2种信息组织方式,图4给出了传统的战场目标数据关联过程,图5给出了基于动态本体的数据关联过程。

图3 针对机场目标的2种信息组织方式

图4 传统的战场目标数据关联过程

图5 基于动态本体的数据关联过程

本文以某军事行动为例,产生以下任务:筹划打击某军事机场, 确定目标情报分析方案,满足体系破击要求。解析用户需求,使用领域词典和中文分词算法进行分词,从而获得符合检索意图的关键词元集合为{某,军事机场,目标情报,体系破击}。通过任务-领域本体匹配,使用检索算法的打分机制对检索结果进行打分,获得分值较高的领域本体,分别为机场领域本体、态势领域本体和目标领域本体。通过领域本体子集界定,使用数据挖掘里的聚类算法,分别以关键词集合为初始类别对领域本体中的概念进行评分,获得领域本体子集。某机场相关的领域本体示例如图6所示。

图6 某机场相关的领域本体示例

通过领域本体子集映射和领域本体子集合并,采用本体映射技术和本体集成技术对领域本体子集进行合并,获得动态本体。基于任务的动态本体构建示例如图7所示。

图7 基于任务的动态本体构建示例

2.4 动态本体评价

由于动态本体在构建过程中能去除部分不相关的要素及其对应关系,因此动态本体更能满足用户需求。本文对动态本体构建模型中要素的数量和质量进行计算分析,并基于计算结果评价动态本体。

试验验证

为了直观描述动态本体的建模过程并验证本文方法的优势,本文选择超大本体(LO)与顶层本体(TO)2种本体生成方法开展比对性试验。LO指覆盖多领域、细粒度和大规模的本体, LO生成法利用本体集成技术直接集成领域本体资源以获得1个LO并加以应用。TO指由领域本体资源中普遍适用的共同对象构成的本体模型,收录的核心词表可用于描述一套领域对象,在应用过程中可与领域本体资源配套使用。

本文以机场目标为例,分别选取了结构、厚度、位置、跑道和状态5个领域本体的部分示例,设定2类用户需求来展示动态本体即时构建特性,并对构建的动态本体进行评价。2类用户需求如下:

表1 3种方法下2类任务需求结果

结束语

本文的基于动态本体的战场目标数据关联方法可处理PB级的海量异构情报数据,网络化数据处理节点不少于5个,动态本体数量涵盖战场目标的所有类型,在任务背景明确的情况下关联率可提高至98%以上。利用本文方法,可促进战场目标从点状的静态性、片段化和单样式的概念描述转化为多目标之间的线性串联、网状互联和泛在关联,实现战场目标信息组织从点到线再到面和体的模式跃升,同时可支撑战场目标认知的知识涌现,辅助指挥员、情报人员和作战人员更充分理解与认知战场目标的历史发展过程、当前能力状态和未来发展变化。为进一步处理海量复杂的异构情报数据,后续需对基于动态本体的数据关联技术进行延伸性研究。

声明:本文来自防务快讯,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。