据技术探索(Tech Xplore)网站2019年5月14日报道,来自麻省理工学院(MIT)林肯实验室人工智能技术与系统小组的研究员查理·达格力(Charlie Dagli)指出,暗网市场的特性使得追踪其参与者及其活动非常困难,且暗网市场的出现和关闭速度都非常快,这些市场的短寿命(从几个月到几年)阻碍了对其用户的识别。为了克服这一困难,MIT林肯实验室正在开发新的软件工具来分析普通和暗网数据。这些工具利用了卖家和买家从普通网站到暗网的多个网络层面上的联系,来进行数据分析。

用户不断创建新的个人资料,通过相互发信号来保持他们的联系。这些信号可通过暗网论坛链接到属于同一用户的角色,甚至可将暗网上的角色链接到普通网络,从而揭示用户的真实身份。为了实现角色链接过程的自动化,林肯实验室正在训练机器学习算法,以计算不同论坛上用户之间的相似性。该计算基于用户在线交流的三个方面:他们如何识别他人、他们写的是什么、以及他们写给谁。

首先,该算法的数据由给定的论坛A上的用户提供,并为每个用户创建作者模型,然后,论坛B的用户数据再在这些模型上运行,为了找到档案信息的匹配,该算法只寻找简单的线索,例如在论坛A上对“sergey gorkin”的用户名在论坛B上更改为“sergeygork”,或更多微妙的相似之处,如从“joe knight”到“joe nightmare”。

系统检测的另一项特征是内容相似性。不同论坛中有很多内容的复制和粘贴,因此可能会出现类似的措辞,这可能来自同一个用户,系统便在用户的网络中查找相似性,这些网络是交际圈或主题讨论网络。然后将档案、内容和网络特征融合后提供单个输出:来自两个论坛的两个人物代表相同的现实生活者的概率分数。

研究人员一直在测试这些角色链接算法,包括开源Twitter和Instagram数据以及来自暗网论坛的手工标记的地面实况数据,测试显示其匹配的准确率达到95%,是已有文献成果中可以找到的最好链接系统之一。研究人员将继续学习新兴技术来根据机构需要及暗网的运作方式进行定制。数据驱动的机器学习已经成为执法部门在暗网上打击非法在线市场的重要工具,但也存在着一些持续的挑战,且研究人员需要扩大研究领域包括加深对需求经济、扰乱供应经济的理解,以及获得更好的整体态势感知能力等。

供稿人:田倩飞

声明:本文来自新一代信息科技战略研究中心,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。