PKI证书透明化机制的Monitor可靠性研究

中科院DCS中心主导完成的学术论文《Certificate Transparency in the Wild: Exploring the Reliability of Monitors》被ACM CCS 2019录用接收。该工作第一次从CT Monitor可靠性角度对PKI证书透明化(Certificate Transparency, CT)应用现状进行系统深入的研究。

Google提出CT机制，联手Let"s Encrypt (免费CA机构)已经彻底颠覆了原有PKI数字证书服务领域。我们历时近2年的数据收集和实验研究分析表明，在Internet上提供证书查询/虚假证书监视服务的CT Monitor (CT的核心部件)，其服务质量都有明显缺陷、存在受攻击隐患；其中，Google和Facebook提供的Monitor平台尤其需要改进。CT的推广与大规模部署，还有很多技术问题需要解决。

传统PKI面临的挑战——虚假证书

PKI是互联网中最重要的基础性安全服务之一，成功部署在HTTPS服务、安全电子邮件、代码签名等解决方案中。截止到2019年7月，Censys统计结果显示，网络空间中出现过的数字证书数量已经超过18亿张，其中11.5亿由Let"s Encrypt签发；16.75亿已记录在CT日志中。

传统PKI系统假设CA机构完全可靠，将CA作为信任锚、负责证书签发。然而近年来一系列安全事件表明，CA由于各种原因(网络入侵/误操作/技术更新不及时)可能签发虚假证书。例如，荷兰CA机构Diginotar在2011年遭受入侵，签发了500余个虚假证书，包括*.google.com等。

虚假证书：证书可以被客户端(例如浏览器)严格验证通过，但是证书绑定的密钥对并不被证书主体(即域名所有者)拥有，被用于发起中间人攻击(Man-in-the-Middle, MitM)或身份冒用攻击。

传统PKI信任体系缺乏发现虚假证书的能力，使得虚假证书往往需要经过数周甚至数月才能被发现。此外，客户端对CA机构的信任是绝对的、无差别的，任何一个公共信任的CA机构签发虚假证书，都可能影响整个互联网的安全。因此，虚假证书严重削弱了PKI信任体系。

什么是证书透明化CT？

针对虚假证书产生的安全威胁，为了及时发现虚假证书，提高对CA机构的问责能力，Google于2013年提出了CT方案。近年来，在PKI系统引入透明化机制，已成为业界共识。CT已成为PKI增强机制中最重要且最活跃的研究方向之一。

CT基本思想：将所有CA签发的证书记录在公开可访问的日志中，客户端只接受公开发布的证书。目的是使CA签发的所有TLS服务器证书公开可见，能够被公开查询、审计。因此，虚假证书一旦公开发布，就可以被利益相关方(域名所有者)发现。

证书透明化(CT)框架

CT方案在PKI体系中引入以下新组件：

Log Server：公开日志服务器，接收CA、网站等提交的数字证书，签发相应的SCT，并在规定时间内将证书添加到以Merkle树结构构建的公开日志中。
Auditor：定期检查日志服务器是否按照策略运行，行为是否正确。
Monitor：持续/定期获取并缓存日志记录的每个证书信息，为域名所有者提供证书查询及监视服务，帮助发现可疑证书。

相比于传统PKI系统，CT框架不依赖于单一可信的一方；而是作为一个分布式系统，将信任分布到众多CAs、Log Servers、Auditors和Monitors。CT日志只负责记录CA等提交的有效证书，并签发SCT，不检查该证书是否由域名所有者授权签发。一个证书基于浏览器CT策略被提交并记录到多个日志中，获得多个SCT。浏览器在与网站建立HTTPS链接时，将对SCT进行检查；只有同时满足CT策略、且被可信CA签发的有效证书才会被接受。

可信CA签发的虚假证书在提交给CT日志获得SCT后，同样可以被浏览器验证通过。因此，CT本身不能防止CA签发虚假证书，而是依赖Monitor检查日志记录的证书，帮助发现虚假证书。任何利益相关方(域名所有者、可信第三方)都可以充当Monitor。

CT应用及部署现状

CT已经实现大规模部署与应用。目前网络中，Google和各大CA机构共部署/运行了80多个日志服务器，记录了28亿多条证书记录。此外，互联网中已部署多个第三方Monitor和Auditor服务。所有主流CA机构都已应用CT。多个主流浏览器和TLS软件已支持CT，包括Chrome，Apple，Firefox，OpenSSL，Nginx，AD Certificate Service以及Azure Key Vault等。截止到2018年2月，至少60%的HTTPS通信支持CT策略。

此外，Chrome浏览器以及Apple平台自2018年6月起，开始陆续强制执行CT检查，服务器端使用的不满足CT策略的证书，将不再被浏览器/平台接受。这将进一步推动CT快速部署与应用。

CT应用及部署现状

Acting as a Monitor: 要求与挑战

CT依赖Monitor发现虚假证书。如果Monitor在实现中存在漏洞/缺陷，则攻击者会利用漏洞规避Monitor对虚假证书的监测。如果存在一个虚假证书，由公共可信CA签发、满足CT策略，浏览器验证通过、却不能在Monitor上及时发现，则攻击者就能用于发起MitM或身份冒用攻击。不可靠的Monitor将影响到CT框架的安全效果：在TLS/HTTPS生态系统中，符合CT策略的证书本应更值得信任。

Monitor对发现虚假证书至关重要，我们期望它们是可靠的：对提供证书查询/监视服务的域名，可靠Monitor应能够及时从公共日志中检索/返回CA为该域名签发的、完整的有效证书集。一些第三方Monitor也声称可以为用户提供可靠的证书监视服务。

以上可靠性要求，带来了两个技术挑战：

a. Monitor应获取公共日志中记录的所有证书。公共日志之间大量重复记录证书，随着时间推移，记录数量急剧增加，导致Monitor可能难以从所有公共日志中获取记录，而是选择部分合适的日志集监视。被监视的日志集合，应该在满足Monitor对记录及时处理的同时，保证查询结果的完整性。

b. 域名可能以各种形式绑定在证书中(例如，通配符子域名)，Monitor应能够正确处理已获取的记录，并将查询域名相关的所有证书返回给服务请求方。

普通用户是否能独立充当Monitor？

我们从完整性、客户端CT策略、CA覆盖率等多个角度研究了各种类型的日志集，发现每种类型的Monitor可以在保证可靠性的同时，监视最小的日志集，从而减少额外监视开销。为此，我们首先分析了网络中部署的公共日志服务器、日志所记录的证书，以及日志所接受的CA等三个因素对运行Monitor产生的影响。在此基础上，提出了5种合理的日志集(例如，最大/最小集)，分别从Log来源/范围，证书/CA覆盖范围，所满足的客户端CT策略等角度，阐述了这些日志集的有效性；提供给Monitor监视使用。

我们以日志集为单位，从存储、网络带宽、计算等角度测量对充当Monitor的实体的要求。在对2018年近一年的CT数据分析表明，作为Monitor所需具备的能力(存储、计算、网络带宽)远远超出了大多数普通域名所有者拥有的：

截止到2018年10月，Internet上一共部署有80多个公共日志服务器，所认可的CA约700多个，记录的证书数量已超过28.7亿个。无论Monitor监视哪种日志集，开销都是巨大的。例如，Regular Log集合作为Monitor可以监视的最大日志集，包含了所有正在运行，且记录公共信任证书的日志，包含50个Log，27.7亿个证书，存储开销约15.31TB(平均一条记录5.93KB)，证书增长700万+每天，43.99GB每天，带宽5Mbps。Google-operated & Google-approved Log集合是Monitor可以监视的最小日志集，所有满足Chrome CT策略的证书都会被记录在该集合中：9个Log，18.7亿个证书，证书增长500万每天，28.29GB每天。

第三方Monitor服务是否可靠？

上述研究表明，普通域名所有者独立充当Monitor其代价是昂贵，且不切实际的。更合理的方式是依赖专业第三方Monitor提供可靠的证书监视服务。目前互联网中已公开部署且提供证书查询服务的主流第三方Monitor一共有5个：crt.sh、SSLMate、Censys、Google和Facebook Monitor。我们以2个测试域名以及Alexa排名前一百万网站域名为测试对象，对5个Monitor进行了研究，评估它们提供的证书查询服务的完整性。实验数据集共包含300多万个证书。

处理Monitor不同的查询策略。为公平测试5个Monitor的可靠性。我们首先完成以下工作：(a)定义对于给定域名，期望获得的证书范围；(b)探索5个Monitor查询策略及API接口，分别设计了自动化查询程序及数据处理工具，屏蔽差异，保证每个Monitor都能返回各自所能查询到的所有相关证书；(c)定义“参考集”近似于域名证书“完整集”。我们将5个Monitor对域名的证书查询结果的并集作为每个域名的“参考集”，分别对比每个Monitor得到证书集与“参考集”差异。(d)异常数据处理：过期/代码签名/测试证书、大小写敏感、证书去重。

第三方Monitor服务接口和查询策略

1．探索性实验。通过向Let"s Encrypt为2个测试域名申请102个证书(并提交给CT Log)，评估5个Monitor是否可以及时监视到这些证书。该测试是在已知每个域名的证书完整集的情况下实现，可以很好地评估Monitor表现。结果显示，除了Facebook，其它Monitor都可以在证书提交给日志的8个小时内查询到。Facebook存在较大延迟，最严重的情况，有21个证书是在5周后才被监视到。这一时间窗口足够敌手利用发起攻击。

2．热门域名实验。Alexa Top-1K网站，通常每个域名拥有数百个证书。这类测试是在未知每个域名的证书完整集的情况下进行。

实验结果表明，没有任何一个第三方Monitor可以保证返回公共日志中记录的所查询域名完整的有效证书集合。我们从两个角度评估Monitor的表现：(a)相比“参考集”，缺失的证书量，(b)证书查询不完整的证书数量。

证书查询量方面(a)，Censys表现最好，只有12.6%的证书缺失；而从域名证书查询完整性角度看(b)，crt.sh最佳，只有104个域名证书查询不完整。Google和Facebook Monitor表现最差：分别有52.3%、34.0%的证书缺失，域名证书查询不完整的数量分别是546，289。基于域名证书数量分布分析发现：更热门的域名(具有更多的证书)，Monitor查询不完全的概率更大。

3．普通域名实验。同实验2类似，但测试对象是Alexa Top-1M网站，更普通的域名，通常每个域名拥有的证书数量在1-100之间。相比热门域名，Monitor表现要好一些，但是依然没有Monitor可以保证返回所有查询域名的完整证书集。Censys在最好情况下，在Top-(100K-500K]区间抽样选取的1千个域名中，有0.1%的证书缺失，7个域名证书查询不全。Google和Facebook Monitor在表现最好的情况下，仍各自分别有6.7%，5.0%的证书缺失；其中Facebook Monitor总会有至少15%的域名的证书查询不全。

证书查询不完整的域名数量分布(Alexa Top-1M分组，每组随机抽样1千个域名)

需要注意的是，真实结果可能要比我们发现的更为严重，因为我们使用的“参考集”来自5个Monitor查询结果的并集、不是真正的证书完整集合。以上问题不仅会降低Monitor服务的可靠性，也会严重降低CT可靠性。

Monitor证书查询结果不完整原因分析

我们将上述发现分别报告给了每个Monitor。只有Censys给出了可能的合理解释：数据中心迁移导致部分查询结果缺失；其他Monitor没有给出答复、或有意义的答复。为此，我们尝试从外部分析得出可能的原因：

处理延迟：crt.sh，SSLMate(数据积压)，Censys(延迟一两天)
预证书处理存在问题：Google(Alex Top-1K域名中缺失的76.9%为预证书)
未及时恢复的事故：Censys(特定时间窗口，数据中心转移)，Google(特定时间窗口，原因未知)
不支持的域名：SSLMate(特定顶级域名)，Google(未知)，Facebook(无效或未查询到)
API查询返回上限：Censys (25000)，Facebook (5000)，SSLMate (超时未返回)

ACM CCS全称ACM Conference on Computer and Communications Security，是信息安全领域的国际四大安全顶级会议之一，也是中国计算机学会CCF推荐的A类国际会议。ACM CCS 2019将于2019年11月11-15日在英国伦敦举行。

本文第一次完成了对CT Monitor实现和部署的深入了解，揭示了CT Monitor在实践中存在的技术挑战，并讨论了改进建议措施。本文工作由中科院DCS中心联合美国堪萨斯大学李丰君和清华大学李琦等共同完成。

声明：本文来自中科院DCS中心，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

PKI证书透明化机制的Monitor可靠性研究

未履行网络安全保护义务，快手被罚1.191亿元

微信屏蔽元宝红包链接，元宝回应：正在紧急优化调整机制

一代人有一代人的“肉鸡”？全球17.5万台Ollama主机曾暴露，中国占比约三成