内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

阿里云_重生嫡女祸妃txt百度云_年度促销

2021-06-10 20:13 出处:欧普曼云计算 人气: 评论(0

CRE生命课程的前几集详细讨论了量化服务可用性和使用SLO管理以功能为中心的开发团队("DEV")与以可靠性为中心的SRE团队的竞争优先级的重要性。好的slo可以帮助减少组织间的摩擦,并在不牺牲可靠性的情况下保持开发速度。但是当slo被违反时应该怎么办呢?

在这篇博文中,我们讨论了为什么您应该创建一个关于SRE和DEV如何应对SLO违规的策略,并为该策略的结构和组件提供一些想法。未来的帖子将回顾一个来自谷歌SRE团队的例子,并讨论一些将该策略付诸实施的场景。

功能或可靠性?

在政策文件中描述该领域的关键转折点是SRE团队和与其合作的开发团队之间关系的重要组成部分。这确保了组织的所有部分在响应(即将)违反的SLO时对他们的期望有大致相同的理解,而且最重要的是,没有响应的后果清楚地传达给所有各方。拐点和后果的准确选择将取决于组织及其业务优先级。

拐点

出于升级策略的目的,我们建议根据违规行为随时间的累积影响(即。,在什么时间范围内消耗了多少错误预算),移动大数据,并明确定义了从一个桶移动到另一个桶的界限。为违规行为按原样分组提供一些业务理由是很有用的,但这应该放在主策略的附录中,以保持策略本身的清晰。

最好将至少一些桶边界与任何基于SLO的警报联系起来。例如,哪个云服务器好,您可以选择页面SREs来调查过去一小时内每周错误预算的10%何时被消耗;这是一个与结果相关的拐点示例。它形成了我们可以非正式地称之为"没有足够的错误预算立即通知任何人"和"在服务脱离其长期SLO之前,有人需要立即对此进行调查"的bucket之间的界限。我们将在下一篇文章中研究更具体的示例,我们看一下谷歌内部SRE团队的政策。

后果

通知某人潜在或实际的SLO违规

任何潜在或实际的SLO违规最常见的后果是,您的监控系统告诉一个人他们需要调查并采取补救措施。对于一个成熟的、支持SRE的服务,当大量错误预算在短时间内被烧掉时,这通常是一个指向oncall的页面,或者当烧掉率在较长时间范围内升高时,这是一个通知单。该页面还可以创建一个记录单,记录调试细节,在升级严重违规时用作集中通信点和参考。

还应通知相关开发团队。这可以是一个手动过程;SRE团队可以通过过滤和聚合违规行为以及提供有意义的上下文来增加价值。但理想的情况是,云服务器设备,开发团队中的一小部分高级人员应该以自动化的方式(例如,通过在任何罚单上记录他们)了解实际的违规行为,因此,他们不会对升级感到惊讶,如果他们有相关信息,可以插话。

将违规行为升级到相关开发团队

通知和升级的关键区别在于开发团队的行动预期。许多严重的SLO违规行为需要sre和开发人员密切合作,云教云,以找到根本原因并防止再次发生。升级不是承认失败。一旦SRE合理地确定开发团队的输入将有意义地减少解决问题的时间,他们应该尽快升级。该政策应设定SLO违规(或未遂事件)可以持续而不升级的时间上限。

升级并不意味着SRE与SLO违规的关系结束。该政策应描述每个团队的责任,以及他们应将工程时间的下限用于调查违规行为和修复根本原因。描述多个级别的升级可能会很有用,包括获得执行级别的支持,以占用整个开发团队的工程时间,大数据软件,直到服务可靠为止。

降低服务更改对SLO造成进一步影响的风险

因为违反其SLO的服务定义为使用户不愉快的,可能会增加错误预算消耗率的日常操作应该放慢或完全停止。通常,这意味着限制二进制释放和实验的速率,或者完全停止它们,直到服务再次进入SLO。这是政策需要确保所有各方(SRE、开发、QA/测试、产品和执行人员)在同一页的地方。对于一些工程组织来说,违反SLO将影响其开发和发布速度的想法可能难以接受。就如何以及何时阻止发布达成书面协议,以及在发生这种情况时,有多少工程师将致力于可靠性工作,这是一个关键目标。

撤销对服务的支持

如果服务在较长时间内无法满足其商定的SLO,开发团队负责该服务不愿意对其可靠性进行工程改进,那么Google的SRE团队就可以选择将在生产中运行该服务的责任交还。这不太可能是单个SLO违规的结果,而是在一段较长时间内多次严重停机的组合,其中死后AI已分配给开发团队,但未确定优先级或完成。

这在谷歌非常有效,因为它改变了围绕可靠性工程的任何谈话背后的动机。任何忽视服务可靠性的开发团队都知道,他们将承担这种忽视的后果。根据定义,撤销对服务的SRE支持是最后的手段,但是声明必须满足的条件使其成为一个政策问题,而不是一个无谓的威胁。如果开发团队不关心服务可靠性,那么SRE为什么要关心服务可靠性呢?

分享给小伙伴们:
本文标签: 阿里重生嫡女祸妃百度年度促销

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表