文/余莉亚 董梁

摘要:随着人工智能、人脸识别等技术在安防领域不断取得突破性进展,近年来公安视频信息应用的外延和内涵已产生质的飞跃。公安视频监控前端的数量爆炸式增长,依赖人力进行事中处置已很困难,遑论事前的预测和防范。公安视频监控建设应用从技防属性向应用服务属性转变,从人力依赖型向技术驱动型转变已成为不可逆转的大趋势,而这离不开大数据技术与公安业务的深度融合。当前公安视频大数据潜能还未被充分挖掘,急需对数据治理、质量核查、安全管控方法开展针对性的研究。基于此,本文对公安视频大数据的数据治理进行初步研究探讨,并针对视频物体识别问题,提出一种视频信息的数据组织方法。

关键字:视频大数据 数据治理 物体识别 模型

1、视频大数据的特点

视频图像信息是指视频流媒体、图片以及与视频流媒体和图片相关的描述信息。公安机关应用的视频图像信息主要包括视频流媒体(包括案事件)信息,人像图片及其结构化属性信息,车辆图片及其结构化属性信息。

视频流本身具有时空属性,映射的是一种时空关系,刻画的是一个微缩的现实世界。与文本、图像等单一数据类型相比,视频数据的处理、存储、分析、应用模式都更接近于大数据本质。同时视频数据又是最难以处理的大数据类型之一,传统大数据的处理框架并不完全适用,需要在数据治理、质量核查、安全管控等方向开展针对性研究。为什么这么说呢?这是因为视频大数据具有以下三个显著特点。

第一个特点是数据量大,而且数据量增长速度非常快。随着我国城镇化的快速发展,每年有近千万的农村人口涌入城市,为解决城市发展问题,实现城市可持续发展,目前,我国有超过600个城市在进行各类智慧城市试点或正在推进智慧城市发展计划,其中大量投资将用于公共区域视频监控建设。即便不考虑蓬勃发展的自媒体,单纯从狭义的公共安全视频监控视频来讲,全国每天积累的视频图像数据也是极其惊人的。目前,全国监控重点公共区域、重点行业、领域及涉及的公共安全区域的公安一类监控摄像头已达数百万之巨,每个摄像头24小时不间断产生的视频源源不断地存储在基层公安机关,不少地方公安机关近年花费大量资金进行机房扩容,仍然不能满足激增的视频数据存储需求,只能通过设置一定保存期限的方式保留近期的监控视频数据。人像卡口、车辆卡口、微卡口等新一代动态抓拍设备的日益普及使得视频数据加速产生与公安视频图像数据存储能力捉襟见肘的矛盾更加凸显。而且,随着安防技术的高速发展,网络摄像机发展的主流趋势是高清、智能、融合。未来的视频监控前端设备有可能会集成音频采集、对讲设备、大气数据采集设备、无线传输模块等,成为一个个微型数据处理中心。公安采集的监控视频不仅图像分辨率会越来越高,而且很可能将不再是静默数据。叠加了音频的公安视频数据,其量级将更加巨大,会给公安视频传输网络带来更大的数据传输压力。传什么、怎么传和存什么、怎么存的问题在今后会越来越突出。而与此同时,海量的视频数据只是数据量巨大,和真正的“大数据”还不是一个概念,需要深入地挖掘才有实战价值。

第二个特点是结构复杂。视频数据相对于文本、图像、声音这些单一的数据类型而言,是结构最为复杂的一种数据。视频大数据是一种集图像、声音、文字于一体的大数据,也是一种集时间维、空间维于一体的大数据。由于视频结构复杂,需要以不同的方式来组织视频数据,所以形成了多样的视频编码格式和封装格式。视频的编码格式和封装格式之多远远超过了文本、图像、声音这些类型的文件数据,这也从一个侧面反映了视频结构的复杂性。不但视频本身的结构复杂,而且由于视频不是结构化数据,并不适合机器解读,要想利用机器去“读懂”视频,必须首先对视频流进行解析,将其转化成结构化数据,所以视频数据的处理也比文本、图像等数据要复杂。更不容忽视的是,由于视频尤其是监控视频的价值密度很低,离散性极大,而受制于技术现状,当前视频解析的成本又相对高昂,挖掘视频大数据蕴含的价值无异于开采钻石矿,是个成本极高、难度很大的工程。

第三个特点是与现实的强相关性。一方面,通过视频数据可以比其他任何方式都更直观快速地了解客观世界。视频所见即所得,是对现实世界的真实记录和复制,这一点与文本数据有本质差异。因为文本数据是人类或人类程序对客观世界的记录,其中有人类对客观世界的抽象、取舍。而全数据在数据维度上没有任何损失,只是在数据精度上达不到完全复制现实的程度,所以视频大数据比文本等单一维度数据挖掘价值更大。而随着视频技术、存储技术的发展、高清智能摄像前端的不断换代升级和推广普及,我们获取的视频分辨率将越来越高,而且会朝着三维、全息的方向发展。目前,星光级摄像机在低照度环境能比人眼捕捉到更多信息。从这种意义上来说,视频大数据里面何尝不是包含着一个小的现实世界。另一方面,通过视频监控,我们又在对现实世界进行管理,从而对现实世界施加着影响。从正面意义来说,公安机关通过视频监控掌握、固定案事件现场的证据,破获了大量案件,视频监控已对犯罪分子产生强大的震慑作用。但同时,视频监控中也不可避免地会出现普通民众,视频监控不差别复制的微缩现实世界也是一个尚未被规范管理的领域。视频大数据领域的安全问题、隐私问题将随着技术的进步、社会的发展更加尖锐地暴露出来。公安机关拥有海量的公共视频资源,相应地承担着保护个人隐私、视频数据安全的艰巨使命,如何保证公共安全监控视频资源被合法、合规、合理使用是一个必须解决的课题,而目前相关法律、制度还有待完善,相关领域还有很多空白和漏洞需要填补。

2、公安视频大数据的治理策略

视频大数据海量性、复杂性、与现实的强相关性等内在特性是客观存在的,并导致了目前公安领域视频图像数据难存、难用、难管的现状。在项目实践中,我们对大数据实施环节进行了划分,指出业务设计、数据获取、数据治理、存储计算应用、大数据安全、业务迭代是大数据项目共性的六大关键环节。其中数据治理环节一般只占项目总投资的5%左右,而工作量却占到整个项目总工作量的45%之高。而且,根据相关研究,以往的公安大数据项目中,甲方在数据治理这项关键工作中参与度很低。这一方面是由于公安机关对于数据治理的重要性与关键地位还没有清晰深刻的认识,另一方面也因数据治理涉及到ETL(数据抽取、转换和加载)、各类工具总线、数据标准化、数据标注等专业性门槛较高的工作,同时也是非常耗费人工人力的“体力活动”。未来,公安机关要在大数据项目数据治理环节中更好地发挥主导作用、进而在整个项目中发挥导向作用,可以考虑从设计数据内部组织形式、制定数据质量监测、数据安全核查管控相关标准规范等全局性工作入手,以达到对数据治理工作的整体把控。同时,在组织研究相关工作的过程中,也能强化公安机关数据治理理念、提高公安机关数据治理能力,可谓一石二鸟。由于数据治理问题涉及的点多面广,难以在一篇文章内详述,本文对数据治理进行初步探讨,并以设计视频数据内部组织形式为例,提出一种提升机器识别效率的公安视频图像数据组织方法。

3、一种提升机器识别效率的公安视频数据组织方法

物体识别在公安视频大数据应用体系中具有重要地位,物体识别结果是其他复杂应用模型的输入,是开展众多公安视频图像技战法的基础,视频图像中物体识别的速度、准确度,直接影响到公安视频图像数据的应用效果。本文通过精心设计数据库组织方式,建立识别知识库,实现对人脸、车辆、物品等若干类别目标的快速识别。

识别知识库包含一个预期目标样本库、一个预期目标样本特征库、一个特征提取规则库、一个特征提取程序库、一个特征比较规则库和一个关联索引表。预期目标库中存放被布控的人脸、车辆、想要查找的物品、声音、轨迹等视音频、图片等,可以根据实际识别对象的需要分别建立相应的子库。例如,如果要以重点人为预期识别目标,则预期目标库可包括一个面部图像目标样本子库、一个语音目标样本子库、一个轨迹目标样本子库等。预期目标特征库、特征提取规则库、特征提取程序库和特征比较库,按照所对应目标的预期目标样本库的多级结构,同样具有多级结构,每一级的子库对应于预期样本库相应一级的预期样本子库。识别知识库包含一个关联索引表,其包括一个预期目标样本索引、一个目标特征提取规则索引、一个预期目标样本特征索引、一个预期目标知识索引和一个目标特征比较规则索引。对于一次识别任务,根据关联索引表中的索引从预期目标样本库、目标特征提取规则库、预期目标样本特征库、预期目标知识库和目标特征比较规则库中分别调取关联的预期目标样本、目标特征提取规则、预期目标样本特征、预期目标知识和目标特征比较规则。图1给出了一个重点人员识别知识库的构建例子。

一次完整的识别流程如下:第一步,对于一个待识别目标,从关联索引表中寻找与之最接近的预期目标样本,根据关联索引表调用相应的预期目标特征提取规则,并根据该特征提取规则确定匹配比对范围(即“匹配窗口”);第二步,根据关联索引表调用相应的特征提取规则,由所述匹配窗口对待识别对象进行特征提取;第三步,调用对应的特征比较规则及关联的特征比较程序,由特征比较程序将预期目标样本的特征与匹配窗口中的对象的特征进行比较,特征比较结果记为相似度;第四步,根据得到的相似度判别是否匹配。

与现有技术相比,通过预先存储若干指定类型目标的样本特征、特征提取规则、特征提取程序和特征比较程序等,可实现对多个类型的目标进行识别,识别的结构情况又可反馈给知识库,实现对识别知识库的更新完善,最终达到节省处理时间、提高识别精度的效果。

4、结语

当今世界是改革的时代,也是创新的时代。公安改革的稳步推进,大数据技术的飞速发展,不断刷新着公安机关对业务的认识、对数据的认识、对系统的认识、对技术的认识。在促变革中再认识,在再认识中促变革,是时代向广大公安民警提出的新要求。赵克志部长在全国公安厅局长座谈会暨全面深化公安改革推进会上强调,“要大力推进公安大数据智能化建设,坚决打破部门警钟壁垒,推进数据融合共享,加强高端集成应用,助推警务流程再造,从源头上解决制约警务整体效能的体制性障碍和瓶颈性问题,切实提升公安机关核心战斗力和公安工作智能化水平。”公安视频大数据是公安大数据的有机组成部分,也是难啃的硬骨头,更需要全国各级公安机关以敢涉险滩的勇气、攻坚拔寨的毅力,推动公安视频信息数据互通、系统互联、应用复用、战果复制,而实现这些目标离不开高水平的视频数据治理。本文以视频信息的基础性应用——视频中物体的识别问题为切入口,对公安视频大数据数据治理进行初步探讨,希望能为公安机关视频图像信息系统建设应用人员开拓一些思路,并起到抛砖引玉的作用,引发各级公安机关对于视频大数据领域数据治理的重视和思考。

参考文献

[1]朱定局.视频大数据智慧计算方法[M].北京:科学出版社,2015.

[2]邓美容.浅析智慧城市建设带给安防企业的机遇与挑战[J].中国安防,2017(z1):61-66.

[3]黄铭海.视频监控在智慧城市建设中的应用[J].中国安防,2017(z1):67-69.

[4]胡善勇.顶层设计方法论与实践[R].厦门,2018全国公安项目规划培训班.

声明:本文来自公安部检测中心,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。