SRE 关键词是「高扩展性」「高可用性」

高扩展性是指当服务用户数量暴增时, 应用系统以及支撑其服务(服务器资源、网络系统、数据库资源)可以在不调整系统结构,不强化机器本身性能 ,仅仅增加实例数量方式进行扩容。

高可用性是指,应用架构中任何环节出现不可用时,比如应用服务、网关、数据库 等系统挂掉,整个系统可以在可预见时间内恢复并重新提供服务。当然,既然是「高」可用,那么这个时间一般期望在分钟级别。SRE 职能可以概括为以下:

  • 为应用、中间件、基础设施等提供 选型、设计、开发、容量规划、调优、故障处理

  • 为业务系统提供基于可用性、可扩展性考虑决策,参与业务系统设计和实施

  • 定位、处理、管理故障,优化导致故障发生相关部件

  • 提高各部件资源利用率

SRE 由于工作的性质,在横向方面会服务大量的业务,以实践积累对稳定性保障问题域的深入理解和稳定性保障重要性的深刻认知,在纵向方面会通过技术手段将稳定性保障最佳实践进行沉淀和应用;同时眼光又是与研发、业务一齐向前看,综合技术和管理创造价值。

声明:本文来自CIO之家,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。