早在 1947 年,时任美国战略情报局柏林分站站长阿 · 杜勒(A.Dulles)就曾提出“最终情报产品 80% 的内容应来自开源信息资源的开发和利用” 。前互联网时代,开源情报主要来源于政府公报、上市公司公开的运营数据,以及书籍、报刊、广播电视等大众媒体。

互联网时代到来为开源情报工作掀开了新篇章,如今已彻底改变了其价值、地位和影响。随着网络在社会生活中的深度嵌入,“网络空间”已成为继海、陆、空、太空之后的人类第五大生存空间。人类活动无时无刻不在网络空间中留下数字痕迹。据美国思科(Cisco)公司统计显示,2014 年全球互联网新增了 4.1ZB 数据。IDC 公司预计到 2020年全球数据总量将超过 40ZB。源源不断增长的数据和信息无疑为开源情报工作提供了取之不竭,用之不尽的资源。

一、社交网络在开源情报工作中的地位与价值

社交网络即社交网络服务,源自英文 Social Network Service,故常简称为 SNS。社交网络起源于网络社交,起点是电子邮件,论坛(BBS)更进一步把邮件“群发”和“转发”功能常态化和公开化,而即时通信(IM)和博客(Blog)则是前面两种社交工具的升级版本。

随着技术的交叉融合演进,社交网络种类仍在继续增长中,几乎涵盖了人们日常生活的各个领域。对开源情报工作影响最大的主要是 UGC(User Generated Content)类社交网站,常见的应用类型有好友社交网站(如Facebook、人人网)、微博客网站(如 Twitter、新浪微博)、视频分享网站(YouTube、优酷土豆)、照片分享网站(如Instagram、又拍网)、知识分享网站(WIKI 百科、百度百科)和社区论坛(天涯社区、豆瓣网)等。

1.社交网络汇集了丰富的情报素材

根据《美国陆军战场手册 2-22.9 公开源情报》手册中列举的开源情报五大类渠道:学术机构、政府组织 / 政府间组织/ 非政府组织、商业和公共信息服务机构、图书馆和研究中心、个人和团体。

现今,这五大类渠道无一例外都成为了社交网络的用户,而且数量巨大。根据总部位于伦敦的全球最大的社会化媒体专业传播公司 WeAreSocial 发布的《2015 年数字、社交网络及移动报告》数据显示,至 2014 年 8 月,全球有将近 1/3的人拥有社交网络账号,活跃社交网络用户达 20.78 亿,占活跃网民(30.1亿 )的69%。

以全球最大的社交网站Facebook为例,截止 2015 年 6 月其活跃用户已达 14.9 亿,接近全球网民一半。语言多达 75 种。政府、媒体、企业和学术机构等专业内容生产者大量入驻极大提高了社交网络开源情报的质量。

2. 社交网络使开源情报的获取更加便捷高效

首先,社交网络将各种信息生产主体汇聚在相对集中的平台上形成了开源情报数据库,使情报获取更便捷。

其次,社交网络中的信息存储是通过数字形式实现的,因而借助搜索引擎等计算机技术使得情报提取更加高效。

第三,大部分主流社交网站都是开放平台,即它们的软件系统通过公开其应用程序编程接口 (API) 或函数 (function) 来使外部的程序可以增加该软件系统的功能或使用该软件系统的资源,而不需要更改该软件系统的源代码。这意味着情报工作者通过第三方软件或编写专用程序就可以对社交网站的信息和数据进行搜集和分析。

3. 社交网络提升了开源情报的实效性

相对于即时更新的社交网络,网页和数据库更新周期略显滞后。截至 2015 年,通过智能手机和平板电脑等移动设备接入互联网的人数已达 36.5 亿。随着社交网络移动化应用趋势的快速发展,拥有大量用户的主流社交网站 Facebook(14.9 亿)、YouTube(10 亿 )、微信(6 亿)、Instagram(4 亿 )、Twitter(3.16 亿)、新浪微博(2.49 亿)等已成为即时信息的聚集地。

尤其在突发事件中,社交网络通常成为信息首发源。情报工作者可以通过社交网络获得鲜活的资料,甚至是危机线索。譬如,美国中央情报局(CIA)开源情报中心(Open Source Center)通过监测Facebook 和 Twitter 消息掌握全球脉搏,准确预言了 2014 年埃及和突尼斯动乱。

综上所述,社交网络作为开源情报来源具有:资源丰富、高效便捷、低成本、低风险等优势。

当前,我国学者进行的社交网络开源情报研究主要聚焦于企业竞争情报领域,对面向国家的社交网络开源情报获取与应用鲜有关注。

与此同时,探讨“社交网络与国家安全”问题时往往侧重于社交网络的动员力或意识形态和文化层面的安全性;而在分析“社交网络信息安全”问题时又明显偏重个人隐私层面的安全问题。

因而,对大数据时代带来的社交网络作为国家开源情报来源的价值,以及由此所引发的国家信息安全潜在威胁的认识尚显严重不足。

二、社交网络中所包含的国家安全信息构成

1.内容信息社交网络已经成为继官网之后,政府部门进行社会管理的重要手段和信息发布渠道。

3 年前,仅美国国务院注册的社交网络账号就有 600 多个。截止 2014 年底,在新浪微博平台上认证过的政务微博总数达到了 130103 个,其中,政务机构官方微博 94164 个,公务人员微博 35939 个。

因而,其中往往蕴含着丰富的政务信息,如战略规划、最新政策、经济数据,以及民意取向等。

一些身处涉及国家机密工作岗位的人,在使用社交媒体时无意中可能泄漏敏感信息。例如,2010 年 3 月,一名以色列国防军士兵在 Facebook 上无意中提到了一次作战行动的时间、地点和部队,致使以军不得不取消行动,并将其送交军事法庭。为此,以色列军方当年就发布命令,要求包括高级将领在内的所有以色列军人一律禁止使用互联网的社交网站,以防止敌对势力渗透进以色列的安全系统和泄露军事机密。

2. 行为信息除了内容信息,社交网络中还蕴含着大量用户行为信息,如登录时间、地点、频次、信息偏好、信息需求、与他人互动信息、接入网络方式等,有位置记录功能的社交网站还会自动记录人的行踪,如社交网站的信息发布地标识、导航软件、健身软件、签到软件等。当个体行为汇集超过一定阈值,同样具有情报价值。

以色列网络安全专家谢 · 希勒称,他曾使用Deep Analytics 系统检索在 Facebook、Twitter 等社交平台上与“占中”相关的活跃用户及其消息记录。通过 Deep Analytics 系统分析,他不仅可以获得用户的资料、相互关系、地理位置等信息,还可以查出活动的“重要成员的主要信息、参加活动的地方和具体情况”等,并表示还可以在某个地区区域“建立一个围墙”,监管区域内所有人的 Twitter 数据,进行分析、选择、标注等。

此外,将卫星图像与社交网络信息及其他开源数据结合,还可预测某个具体地区正要或将要发生的事件。美国地理眼(GeoEye)公司研发的“信号分析”技术,利用特殊软件对图像与地理空间数据加以综合,即可得到人类活动“足迹” 。那么,可以推断,如果锁定的目标人群是涉密人员、特定事件关键人物、敏感人物等则会对国家安全造成一定威胁。

3. 空间信息具有定位功能的社会网络不仅会泄露行踪信息,还会暴露一些涉密地点的位置。不知情者无意中拍的照片上传到社交网络上,极有可能泄露保密单位、保密企业或涉密基地位置。据《纽约时报》报道,美国空军就曾发布警告,提醒美军小心使用诸如 Facebook 之类的社交网站,原因就是网站上的定位功能会向敌军暴露军方的位置。

4. 人力资源信息当前的主流社交网站,一般都要求用户填写较为完整的个人资料,即便其中一些信息是不真实的,但是通过用户长期而大量的网上活动,运用大数据推算较容易获得包括性别、年龄、教育程度、工作情况、婚姻状况、手机号码、相貌等真实信息。而大量个体信息汇集在一起就可以分析出该国人口结构的基本特征,思想状况、消费结构、以及人际关系等战略信息。

例如,Msltrgo 软件,它是一款针对开源信息采集和分析的软件,不仅能对由人组成的社会网络进行分析,还可以理解多种抽象概念并找出它们之间的联系。

三、面向国家安全的社交网络开源情报获取方法与应用

1.关注目标对象关注(跟随 / 订阅)是在社交网上获得目标对象(个人或机构用户)动态信息的基本方法。在 Facebook、Twitter 和新浪微博等社交网络关注目标对象还能获取其和他人交流的相关信息。通过观察目标对象与他人互动情况,可绘制出其社会关系网络。

英美两国情报部门就利用社交网络的模式建立起一种“社交式”的国际恐怖分子数据库。情报人员在这个数据库中输入数千名嫌疑人的信息,通过社交网络分析程序梳理其微博关注和网络聊天的对象,分析他们相互之间的关系,然后找出关键人物。由此确定恐怖组织的领导者和骨干分子,再进一步预测其可能发动的恐怖袭击活动。这种方法已经成功用于美英在伊拉克和阿富汗的反恐作战。

但该方法也存在两个显而易见的弊端:

一是获取信息的方式比较被动,需要等待目标对象更新。

二是当关注目标对象数量多时,人工甄别耗时、耗力。

2 . 主题搜索当有较为明确的情报主题需求时,可以通过关键词在社交网站自带搜索引擎进行人工检索。

在没有搜索功能的社交网络平台如微信,可以借助第三方搜索引擎。搜狗推出了专门针对微信公众平台的搜索引擎,可以帮助情报搜集工作者快速获取公众号中的信息。

该方法的弊端是无法长期自动跟踪主题信息,获取不及时,容易错过情报。面对社交媒体海量信息,诸如谷歌、百度等普通搜索引擎一般无法搜索到“暗网”(又称“不可见网”,指互联网上不能被标准搜索引擎索引的内容)。

因而,排名全球前十名的军工巨头美国的诺斯罗普 · 格鲁曼公司多年来一直致力于研发“开源引擎”对社交网络信息进行搜集、分类、排序、细化、提取。诺 · 格公司应用该引擎分析与墨西哥头号武装贩毒组织——泽塔斯集团有关的网络消息,成功掌握了该组织的人员、装备、活动地区等情报。

3. 构筑关系网络利用社交网络交互性功能可以通过直接结交目标用户或加入社交网络中相应群组,通过人际交流方式获取情报。

美国的网络安全人员曾在 2010 年做过一个实验,他们开设一个社交媒体账户,假冒一名曾在海军网络战司令部工作过的女性,先后与来自海军陆战队的情报军官、参联会和国家安全局的官员,以及一些驻扎在海外战区的官兵建立了联系,并在与他们的网上交往中获取了一些敏感信息。

在利用社交网络平台构筑人际情报网络时,可以将不同类型社交网络平台功能结合运用。如 Linkedin 是一个面向全球职场人士、基于真实职业身份的沟通平台。因此,Linkedin 可以帮助情报工作人员准确筛选合适的关注对象,然后再到 Fackbook 或 Twitter 上跟踪其信息动态,甚至通过互动获取情报。

4. 相应技术支持方法都是以信息为对象进行定向或定题情报获取,当关注目标较多、或需要长期跟踪某一主题时,均面临人工甄别效率较低问题。

时至大数据时代,从浩如烟海的社交网络中搜集情报并非易事,其信息的分散、无序、多样、异构、重复、不确定等特征给情报甄别带来极大困难。面对这一难题,可以利用社交网络开放平台的性质,借助第三方软件或根据需要自行编程,对信息进行先抓取入库,然后再提炼情报的方略。借助于计算机强大的计算能力,运用统计学、数据挖掘、图像处理和自然语言处理等技术提高情报工作的效率。

美国作为信息技术强国,在开源情报的开发利用方面同样处于领先地位。政府、军方、研究机构和企业在开源情报分析系统开发方面均已推出较为成熟的研究成果。如国土安全部的 ADVISE 系 统(Analysis, Dissemination, Visualization, Insight, Semantic, Enhancement)、国防部的整体情报感知系统 (Total Information Awareness,TIA)、以及康奈狄格大学开发的自适应安全分析与监视系统(Adaptive Safety Analysis and Monitoring System, ASAM) 。

四、面向社交网络的国家信息安全保障策略

社交媒体作为开源情报来源具有“双刃剑”效应,一方面它可以为国家提供丰富的竞争性情报资源,另一方面它也成为国家安全的重大隐患。在我方积极开展开源情报挖掘的过程中,别国也必定会以相似的方法、策略和手段不遗余力地利用社交网络搜集情报。因而,尽快完善面向社交网络的国家信息安全保障体系是建设网络强国不可或缺的组成部分。主要有以下几条路经:

一是制定与社交网络开源情报工作相关的发展规划。

一方面,提升开源情报发掘能力;一方面也要提高反情报能力。

二是设立专职机构负责开展开源情报工作。

9·11 事件后,美国非常重视开源情报工作。陆续成立了多个专职部门。如中央情报局的开源情报中心、国家情报局(National Intelligence)也成立了负责开源情报工作的专职机构——国家开源事业部(National Open Source Enterprise, NOSE)、国土安全部的“社交网络监控中心”等。

三是提升国家信息安全技术保障能力,要防止社交网站信息直接大规模泄漏。

四是完善国家信息安全法律保障体系。通过法律手段对社交网络信息存储、使用和开发进行约束和保护。

五是提高全民国家信息安全意识。规范和指导公职人员合理使用社交网络。

(作者:戴丽娜 上海社会科学院新闻研究所)

文章转载自微信公众号:丁爸 情报分析师的工具箱(公众号ID:dingba2016)

声明:本文来自丁爸 情报分析师的工具箱,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。