返回全部

企业如何完成云计算最佳成本优化?

云的可扩展性对企业的运营和发展而言具有两面性,可谓福祸相依。

过度配置和云蔓延是真实存在的。其造成的成本浪费甚至会使科技巨头财务管理者都感到惊讶。

以 Pinterest 为例,在一个假期期间,由于使用量增加,该公司的云账单远远超出了最初的估计,Pinterest 不得不在价值 1.7 亿美元的预留资源之外向 AWS 支付 2000 万美元。

处理云的长期成本影响的唯一方法是实施云成本优化。而且,如果企业不希望成本优化成为工程团队的拖累,那么实现自动化是唯一能让企业实现目标的举措。

1、了解优化云成本的优势

优化云成本值得企业花时间吗?通信、娱乐、SaaS和电子商务领域的公司报告的优化收益就是最好的例证:

1)在 2021 年第一季度,Zoom报告称其毛利率从上一季度的 69.4% 扩大至 73.9%,这主要是由于优化公共云资源的工作产生了良好效果。

2)Spotify构建了一个名为 Cost Insights 的定制工具来跟踪云费用并鼓励工程师掌握云支出的所有权,从而将其每年的云支出减少数百万美元。

3)通过对基础设施决策进行一些明智的增量优化,尽管流量增加了 25%,但在三个月内 , Segment 的毛利率增加了 20% ,基础设施成本降低了 30%。

4)电子商务初创公司La Fourche了解到其云计算费用急剧上升,便运行了 CAST AI 节省报告以寻找优化机会。通过启用自动优化,该公司在不增加工程师工作量的情况下将每月的云账单减少了 69.9%。

通过以上例证可知云优化工作是值得的,那么企业团队选择了哪些方法来防止其云成本失控?

2、详细了解自己的云账单

大部分企业对于自己的云账单并不十分了解。

账单冗长、复杂且难以分解,因为每项服务都有一个已定义的计费指标。因此企业难以详细了解自身的使用情况并做出决断。

成本分配可以揭示谁在使用哪些资源,但是在 Kubernetes 上运行的动态基础架构中,成本分配尤其具有挑战性。

根据自己的云账单检查和分配成本而得到的数据,可以帮助企业更好地预测自身的需求并确保适当数量的资源(并避免过度配置)。

但估计企业未来的资源需求并非易事。

这是可以遵循的示例序列:

1)获得可见性并分析自己的使用报告,以确定所有的支出模式。

2)借助定期分析和处理历史使用数据来检测峰值资源使用场景。

3)将季节性客户需求模式考虑在内,并检查它们是否与自身的资源使用高峰相关。如果能了解到这一点,提前识别它们可能会更容易。

4)确保定期监控资源使用报告,并设置警报以控制云成本。

5)通过衡量特定于应用程序或工作负载的成本来创建应用程序级成本计划。这也将为计算云基础设施的总拥有成本提供有力支持。

6)接下来,查看企业的云提供商的定价模型,并随着时间的推移规划容量需求。将所有数据放在一个地方可以更轻松地了解成本。

上面列出的任务并非一次性完成的工作。企业需要定期执行此操作以获得良好效果。

3、为应用程序选择最佳计算资源

如果企业的应用程序依赖于计算,那么选择正确的虚拟机可能会改善成本问题。但 AWS 有近 400 个不同的实例。类似的实例类型在云提供商之间提供不同的性能——即使在同一个云中,更昂贵的实例并不等于更高的性能。

1)定义最低要求

确保在所有计算维度上执行此操作,包括 CPU(架构、数量、处理器选择)、内存、SSD 和网络连接。

2)选择正确的实例类型

企业可以从各种CPU、内存、存储和网络容量组合中进行选择,将其封装在实例类型中,并为这样的功能进行优化。

3)设置实例的大小

实例应该有足够的容量来满足企业自身的工作负载要求,并在必要时包括诸如突发之类的选项。

4)检查不同的定价模型

三大云提供商提供不同的费率:按需(按需付费)、预留容量、Spot实例和专用主机。这些选项中都有其优点和缺点。

4、使用 Spot 实例节省更多成本

从 AWS 和其他大型云提供商处购买闲置容量是明智之举,因为Spot实例比按需实例便宜 90%。但是,有一个问题:供应商保留随时收回这些资源的权利。企业需要确保其应用程序已为此做好准备。

以下是使用 Spot 实例的方法:

1)检查工作负载,了解其是否已准备好用于Spot 实例

能否承受中断?完成这项工作需要多长时间?这是任务关键型工作负载吗?这些问题有助于确定 Spot 实例的工作负载。

2)检查云提供商的服务

查看不太流行的实例是个不错的选择,因为它们不太可能被中断并且可以运行更长的时间。在确定实例之前检查实例的中断频率。

3)出价时机

设置准备为所选 Spot 实例支付的最高金额。请注意,它只会在市场价格满足您的报价(或更低)时运行。在按需定价水平上设置最高价格是我们的经验。

4)分组管理spot实例

这样,企业将能够一次请求多种实例类型,从而增加获得 Spot 实例的机会。

为了使上述所有工作顺利进行,需要准备好在配置、设置和维护任务上花费大量时间(除非决定将其自动化)。

5、不要被储蓄计划的承诺所吸引

以更便宜的价格提前一到三年预留容量似乎是一个合理的选择。当企业必然会使用该服务时,为什么不提前购买容量呢?

我们已经了解到预测云成本很困难。即使是拥有整个团队致力于云成本优化的公司也难以做到这一点。

当企业不了解其团队在一到三年内需要多少容量时,企业如何提前计划容量?这是预留实例和储蓄计划等产品的主要问题。

关于预留容量,企业应该了解以下几点:

  • 保留实例的工作方式是“使用它或失去它” ——它空闲的每一个小时对企业的团队而言都是一个小时的损失(包括可能获得的任何经济利益)。
  • 当您承诺特定资源或消费水平时,假设需求在整个合同期限内不会改变。但即使是一年的承诺在云中也是永恒的。一旦需求超过预期,企业将不得不付出代价。
  • 当遇到新问题时,企业团队将会被迫投入更多资源。或者,您会发现自己已经支付了未充分利用的容量。在这两种情况下,企业都是失败者。
  • 通过与云服务提供商签订此类合同,还可能会面临供应商锁定的风险——即在未来一到三年内依赖该提供商并介绍他们提出的任何变化。
  • 为预留选择最佳资源很复杂。
  • 6、为工作选择合适的工具

    为了控制云成本,企业采用了多种成本管理、优化策略和解决方案:

    1)成本可见性和分配——使用各种成本分配、监控和报告工具,企业可以找出费用的来源。实时成本监控用处很大,因为它会在超过设定的阈值时做出提醒。例如在 Azure 上运行的计算操作导致Adobe 的一个团队意外收取超过50万美元的云费用。然而一个警报就可以防止这种情况发生。

    2)成本预算和预测——如果企业处理了足够的历史数据并对未来的需求有一个清晰的认识,那么就可以估计其团队需要多少资源并计划预算。

    3)遗留成本优化解决方案——企业可以在此处结合前两点中获得的所有信息,以创建云支出的完整图景并发现潜在的改进对象。市场上的许多解决方案都可以提供帮助,例如 Cloudability 或 VMware 的 CloudHeath。但大多数时候,他们给出的只是工程师手动实施的静态建议。

    4)自动化的云原生成本优化——这是降低企业云成本的最强大的解决方案。这种类型的优化不需要团队进行任何额外的工作,并且可以全天候节省 50% 甚至更多,即使企业已经在手动优化方面做得很好。一个完全自主和自动化的解决方案,可以快速地对资源需求或定价的变化作出反应,这是最佳方法。

    7、云自动化为最大程度的节省提供帮助

    从以上几点可以看出,人工成本优化是一个复杂且耗时的过程。

    而且无论工程师的技能水平如何,许多成本优化任务都不适合人工完成。

    分配、理解、分析和预测云费用是十分困难的。企业需要进行基础架构调整、调查定价计划、启动更多实例并执行各种其他任务以创建具有成本效益的基础架构。

    自动化可以使企业免去以下许多工作:

    除了摆脱上述所有工作之外,自动化解决方案还增加了更多价值,因为它:

  • 选择最具成本效益的实例类型和大小以满足应用程序的需求。
  • 自动向上和向下扩展云资源,以应对需求的高峰和下降。
  • 删除未使用的资源以消除浪费。
  • 利用现场实例并优雅地管理中断。
  • 自动化存储和备份、安全性和合规性管理以及配置和设置更改,以帮助企业在其他领域节省资金。
  • 最重要的是,自动化平台实时实施所有这些修改,掌握云成本优化的时间点特性。

    我们结合使用 AWS On-Demand 和 Spot 实例来运行在 8 个 CPU 和 16 GB RAM 上运行的应用程序。

    然后我们决定通过 CAST AI 运行它来检查我们的配置是否优化。该平台建议移动到 Spot 实例 INF1。但是,这不是一个昂贵的、ML 专用的 GPU 实例吗?

    事实证明,当时那个实例实际上比我们使用的通用计算实例便宜。如果没有自动化,我们就会失去这个隐藏的宝藏。

    通过本文的Zoom、Spotify或La Fourche等示例可以了解到,降低云成本会对企业的利润产生重大影响。

    云成本优化是企业唾手可得的成果。但是诸如费用监控和报告之类的标准策略只会让企业以巨大的工程师时间成本实现一半的效果。

    其它

    技术支持

    技术支持

    扫码加入技术支持微信群

    扫码加入技术支持微信群


    公众号

    官方公众号

    扫码关注获取最新动态