美国陆军研究实验室的科学家开发了一种新的算法,可以改善对在战争中收集的图像和音频进行识别的能力。该算法是一种被称为快捷自动编码器(shortcut autoencoder)的深度学习算法,可恢复被各类随机噪声破坏的单个音频或图像。

新的算法改进了对人类对话等一维信号的适用性,并正在针对更强的噪音源(噪声/信号比超过1.0)进行测试。深度学习算法能够准确识别图像中的物体,也能够合成逼真的数据。在这项研究中,科学家使用深度学习技术,利用有限的输入信息对图像进行重建。

研究人员利用了众多真实图片数据对模型进行了训练,该图像模型的变体可用于从嘈杂的音频信号中重现人类对话,即使噪音音量远远大于信号音量。

该算法在军队中的应用十分广泛,解决了网络指挥、控制、通信和情报跨职能团队所面临的挑战。

该技术可以用于窃听、在强干扰的情况下解调通信,以及在图像/视频中有遮挡物、照明微弱或雨雾天气等情况下对物体进行感知。从短期看,这项技术可以为情报分析师提供图片与视频的缩放/增强功能;从长远看,这项技术可以无缝集成到相机硬件之中,以便在各种场景下提高图像质量。除军事应用外,该技术也可用于商业推广,例如在远离信号塔的低宽带环境下提供更高质量的通话,以及在极端天气中支持自动驾驶技术。

研究人员希望该项技术未来可以适用于语音和图像之外的数据类型,例如物理环境传感器数据无线通信

供稿人:徐婧

声明:本文来自新一代信息科技战略研究中心,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。