内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

分布式存储_cdn公司排名_高性价比

2021-06-10 13:18 出处:欧普曼云计算 人气: 评论(0

分布式存储_cdn公司排名_高性价比

在上一期CRE生活课程中,我们讨论了服务级别目标(SLO)是如何定义和衡量服务可靠性的重要工具。SRE的书中也有一整章是关于这个话题的。在本集中,我们将讨论如何为具有依赖关系的服务定义和管理slo,每个slo都可能(也可能不是!)有自己的slo.

任何非平凡的服务都有依赖关系。有些依赖关系是直接的:服务A对服务B进行远程过程调用,怎么选购云服务器,因此A依赖于B。有些依赖关系是间接的:如果B反过来依赖于C和D,那么A除了依赖于B之外,还依赖于C和D。还有一些依赖关系在结构上是隐式的:服务可以在特定的Google云平台(GCP)区域或区域中运行,或者依赖于DNS或其他服务其他形式的服务发现。

为了使事情更复杂,并非所有依赖项都有相同的影响。"硬"依赖的中断意味着您的服务也已中断。如果"软"依赖项的中断设计适当,则它们不会对您的服务产生影响。一个常见的例子是尽最大努力记录/跟踪外部监控系统。其他依赖关系介于两者之间;例如,企业应用管理,缓存层中的故障可能会导致延迟性能下降,这可能与SLO无关。

请花点时间考虑您的一项服务。你有它的依赖性列表吗?它们有什么影响?依赖项是否有满足您特定需求的SLO?

考虑到所有这些,作为服务所有者,您如何定义SLO并对满足这些SLO充满信心?考虑以下复杂性:

风险业务

您的SLO的一些主要风险源当然来自您的依赖关系。当对依赖项的风险进行建模时,可以使用其已发布的SLO,或者选择使用观察到的/历史性能:SLO往往是保守的,因此使用它们可能会高估实际风险。在某些情况下,如果依赖项没有已发布的SLO,并且您没有历史数据,则必须使用最佳猜测。在建模风险时,还要记住上面描述的将依赖关系的SLO映射到您的SLO的困难。如果您使用电子表格,您可以尝试不同的值(例如,发布的依赖性SLO与观察到的性能),并查看它们对您的预计SLO性能的影响。1

请记住,您将这些估计作为优先级排序的工具;它们不必非常准确,您的估计不会有任何保证。然而,这个过程应该让你更好地了解你是否有可能一直满足你的SLO,如果没有,你的错误预算最大的风险来源是什么。它还鼓励你记录你的假设,在那里可以讨论和批评它们。从那里,你可以做一个实用的成本/收益分析来决定要减轻哪些风险。

对于依赖性,减轻可能意味着:

一系列早期的CRE生活课程帖子(1,2,个人网站建站,3)讨论了违反SLO的后果和升级,作为一种平衡速度和风险的方法;一个后果的例子可能是暂时阻止花费错误预算时的新版本。如果中断是由服务的某个依赖项引起的,那么后果是否仍然适用?毕竟,这不是你的错,对吧?!?答案是"是的"——SLO是你用户幸福感的代表,用户不在乎这是谁的"错"。如果某个特定的依赖关系导致频繁违反SLO,大数据与人工智能,那么您需要减轻它带来的风险,或者减轻其他风险以释放更多的错误预算。一如既往,企业内部软件,您可以务实地对待如何以及何时强制执行违反SLO的后果,但如果您经常提出例外,尤其是出于相同的原因,这表明您应该考虑降低SLO,或增加您在提高可靠性方面投入的时间/精力。

总之,每一个非平凡的服务都有依赖关系,可能有很多依赖关系。在为您的服务选择SLO时,不要考虑您的依赖性和您可以实现什么SLO,而是要考虑您的用户,以及他们需要满足的服务级别。一旦你有了一个SLO,你的依赖性代表了风险的来源,但它们不是唯一的来源。一起分析所有风险源,以预测您是否能够始终如一地满足您的SLO,并确定要减轻哪些风险的优先级。

1如果您感兴趣,服务可用性演算将更深入地讨论依赖性风险建模以及减轻风险的策略。

分享给小伙伴们:
本文标签: 分布式存储公司排名性价比

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表