专栏名称: 雨生云计算
雨生的专注于出海云科技领域,致力于推动整合营销变革,他提出了\x26quot;AI+BI+CI\x26quot;的智能营销理念,通过云智能重新定义出海营销的范式,突破地域和资源限制,实现数字化、智能化的全球化出海战略。同时雨生是FinOps布道师,服务出海企业数字化转型。
目录
相关文章推荐
51好读  ›  专栏  ›  雨生云计算

Netflix也难以掌控AWS云计算成本,云成本效率管理成为新挑战

雨生云计算  · 公众号  ·  · 2024-12-19 08:27

正文

请到「今天看啥」查看全文


点击蓝字 关注我们


对雨生的文章感兴趣吗?

可以入群

 

标题:Netflix也难以掌控AWS云计算成本,云效率管理成为新挑战


近日,流媒体巨头Netflix在其官方博客中披露了公司在云效率管理方面面临的挑战。作为亚马逊AWS的知名客户,Netflix竟然也难以准确追踪和理解其AWS资源使用情况及相关成本。



根据Netflix高级分析工程师Jennifer H和数据专家Pallavi Phadnis的博文,公司正在努力开发工具来帮助工程团队更好地了解他们使用的资源、使用效率以及相关成本。为此,Netflix专门成立了平台数据科学工程(Platform DSE)团队,并开发了两个关键工具:


1. 基础平台数据(FPD):为所有平台数据提供集中化的数据层。

2. 云效率分析(CEA):基于FPD构建,提供各种业务用例的时间序列效率指标。


然而,由于业务基础设施的广度和范围以及平台特定功能,Netflix生成的数据集非常复杂。服务可能有多个所有者,每个平台的成本计算方法都是独特的,而且基础设施数据规模庞大。


更令人惊讶的是,Netflix表示计划"通过预测分析和机器学习来优化使用并检测成本异常",这意味着即使是Netflix这样的云计算重度用户,也无法完全掌控其云支出,需要更好地检测异常。



雨生点评:


一. 云成本管理的普遍性挑战:Netflix的案例表明,

Netflix和AWS的合作关系是云计算领域一个著名的案例,这里雨生为您梳理一下它们之间的一些重要历史新闻和里程碑事件:


1. 2008年:Netflix开始使用AWS

Netflix开始将部分非客户facing的工作负载迁移到AWS,这标志着他们向云计算迈出了第一步。


2. 2010年:大规模迁移开始

Netflix宣布计划关闭自己的数据中心,全面迁移到AWS云平台。这一决定在当时被认为是相当大胆的举动。


3. 2012年:圣诞节宕机事件

AWS在圣诞前夕发生故障,导致Netflix服务中断。这一事件引发了人们对云依赖性的担忧,但也推动了Netflix改进其容错和灾难恢复策略。


4. 2015:完成向AWS的迁移 【2015年完成上云,整整7年】

Netflix宣布完成了向AWS的全面迁移,成为全球最大的公有云用户之一。


5. 2016:开源贡献

Netflix开源了多个在AWS上运行的工具,如Chaos Monkey,这些工具帮助提高了云服务的可靠性。


6. 2017:多区域故障转移测试

Netflix成功测试了在AWS多个区域之间进行故障转移的能力,展示了其高可用性架构。


7. 2018:Netflix成为AWS最大客户【AWS GCR 开支过一亿美金的客户才可能被称为 战略account】

报道显示Netflix每年在AWS上的支出超过10亿美元,成为AWS的最大客户。


8. 2020:疫情期间的合作【弹性仍旧是云的一大特色】

在COVID-19疫情期间,Netflix利用AWS的弹性快速扩展服务,以应对激增的流量。


9. 2021:边缘计算合作 【CDN?Edge computer 其实 有的云厂商更擅长,比如cloudflare】

Netflix和AWS宣布在边缘计算领域展开合作,以提高内容分发效率。


10. 2022-2023:成本优化挑战 【Why?】

随着增长放缓,Netflix开始更加关注AWS使用的成本效益,这反映在他们近期的技术博客和财报中。


这段历史展示了Netflix如何从传统IT架构转变为云原生公司,以及AWS如何支持了一个全球性流媒体服务的快速增长。同时,它也反映了云计算行业的发展,从早期的基础设施迁移,到后来的高可用性、弹性扩展,再到现在的成本优化和边缘计算等更高级的主题。


而早在2016年就成为AWS best Case  Study 的奈飞,即使是最成熟的云用户也面临着云成本管理的挑战。这反映了云计算生态系统的复杂性和动态性。





二. 数据驱动决策的重要性:Netflix开发FPD和CEA工具的举措凸显了数据驱动决策在云管理中的关键作用。企业需要投资于数据分析能力,以优化云资源使用。


三. 云供应商定价模型的复杂性:AWS等电商类云供应商的SKU复杂,定价模型多变,这增加了用户准确预测和控制成本的难度。云供应商可能需要简化其定价结构,提高透明度。


四. 自动化和AI在云管理中的应用:Netflix计划使用预测分析和机器学习来优化资源使用,反映了AI在云管理中的潜力。这可能成为未来云管理的主要趋势。


根据Gartner 报告,增强式人工智能的普及【2-5年】,会带动增强式FinOps【5年以上】,届时数据驱动决策的增强式FinOps 会成为趋势

【见图 Augmented FinOps】


五. 多云战略的重要性:Netflix过度依赖AWS的情况凸显了多云战略的必要性。企业应考虑分散风险,避免过度依赖单一云供应商。


雨生团队提供多云战略咨询,需要的童鞋可以入群了解


六. 云成本管理专业化:随着云使用的复杂性增加,专门的云成本管理团队和工具将变得越来越重要。这可能催生新的就业机会和技能需求。


七. 技术债务的隐患:复杂的云架构可能导致技术债务的积累。企业需要在快速创新和长期可维护性之间找到平衡。


总之,Netflix的案例为企业提供了宝贵的经验教训。随着云计算的不断发展,有效的云资源管理和成本控制将成为企业IT战略的核心组成部分。企业需要持续投资于相关技术和人才,以应对这一挑战。同时,云服务提供商也应该考虑如何简化其服务和定价模型,以帮助客户更好地管理和优化其云资源使用。


结语:

Netflix的案例不仅揭示了云计算管理的复杂性,也为整个行业敲响了警钟。在云计算已成为企业IT基础设施的核心的今天,有效的资源管理和成本控制将成为企业竞争力的关键因素之一。企业需要在技术创新、成本效益和业务价值之间找到平衡点,同时不断提升自身的云管理能力。云服务提供商也应该反思如何简化其服务模型,提供更透明、更易于管理的解决方案。未来,我们可能会看到更多专注于云资源优化和成本管理的创新解决方案和服务出现,为企业提供更好的支持。


原文链接:

【需要会员,无法打开的请联系‘雨生云计算’索取pdf版本】

https://netflixtechblog.com/cloud-efficiency-at-netflix-f2a142955f83

https://www.theregister.com/2024/12/18/netflix_aws_management_tools/

2016年的case 

https://aws.amazon.com/cn/solutions/case-studies/netflix-case-study/




衍生阅读
亚马逊回归办公室续-亚马逊全员返岗计划受挫,办公空间不足引发延期
亚马逊CEO回归办公室政策正确但理由错误
亚马逊回归办公室-美国天命、打工人的反馈
"内部人士揭秘:亚马逊文化之变,从'创新引擎'到'效率迷宫'?-“前亚马逊员工自述:被裁员后重新入职,最终选择辞职

“我讨厌官僚”-亚马逊CEO杰西的反官僚主义宣言 
亚马逊欲裁冗官,恐重蹈宋朝覆辙-客不加赋而云商饶,可否 可否 应是汝肥众瘦
亚马逊CEO安迪·贾西否认5天办公室工作制是"变相裁员"
亚马逊员工对AWS CEO回办公室言论"感到震惊",呼吁撤销政策

标题: 亚马逊坚持全面回归办公室政策 高管强调面对面互动的重要性
亚马逊重返办公室政策:保护文化和推动创新的大胆举措
三哥的大宝森节?《亚马逊大刀阔斧砍掉中层经理14000印度三哥,CEO俺弟 杰西:现在正是时候》

回归办公室?亚马逊向左走,谷歌向右走
前亚马逊工揭秘:打工人避免返岗办公的三大"奇招
亚马逊全面复工令凸显公司文化危机

 



 



雨生云计算

微信号: FinOpsCFM








请到「今天看啥」查看全文


推荐文章
教你看穿男人的心  ·  恋爱越久,男人越不想娶你的7个原因!
8 年前
狮子座网  ·  狮子座今日运势2017年2月17日
8 年前