专栏名称: 机器学习研究会

机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织，旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外，协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。

如何扛住1.8亿\/秒的双11数据洪峰？阿里流计算技术全揭秘

机器学习研究会 · 公众号 · AI · 2017-11-21 23:04

正文

阿里妹导读：今年的双11再次刷新了记录——支付成功峰值达25.6万笔／秒、实时数据处理峰值4.72亿条/秒。面对较去年增幅 100%的数据洪峰，流计算技术可谓功不可没。今天，我们将揭开阿里流计算技术的神秘面纱。

双11刚刚拉下帷幕，激动的心还停留在那一刻：

当秒针刚跨过11号零点的一瞬间，来自线上线下的千万剁手党在第一时间涌入了这场年度大趴——从进入会场到点击详情页，再到下单付款一气呵成。

前台在大家狂欢的同时，后台数据流量也正以突破历史新高的洪峰形式急剧涌入：

支付成功峰值达 25.6 万笔／秒
实时数据处理峰值 4.72亿条/秒

而作为实时数据处理任务中最为重要的集团数据公共层（保障着业务的实时数据、媒体大屏等核心任务），在当天的总数据处理峰值更是创历史新 高达1.8亿/秒 ！想象下，1秒钟时间内千万人涌入双11会场的同时，依然应对自如。

流计算的产生即来源于数据加工时效性的严苛需求：

由于数据的业务价值会随着时间的流失而迅速降低，因此在数据发生后必须尽快对其进行计算和处理，从而能够通过数据第一时间掌握业务情况。今年双11的流计算也面临着一场实时数据洪峰的考验。

首先来展示今年（2017年）较去年（2016年）数据洪峰峰值的比较：

2016 年：支付成功峰值12 万笔 / 秒，总数据处理峰值9300 万 / 秒
2017 年：支付成功峰值25.6 万笔／秒，实时数据处理峰值 4.72亿条/秒，阿里巴巴集团数据公共层总数据处理峰值 1.8 亿 / 秒

在今年双11流量峰值翻翻的情况下，依然稳固做到实时数据更新频率：从第1秒千万剁手党涌入到下单付款，到完成实时计算投放至媒体大屏全路径，秒级响应。

推荐文章

爱可可-爱生活 · 【[413星]llmchat：最直观的统一AI聊天界面，让AI交-20250205212359

昨天

黄建同学 · 学习-20250205192620

昨天

爱可可-爱生活 · 【[661星]Meridian：谷歌推出的营销组合模型（MMM）-20250202222737

4 天前

爱可可-爱生活 · 【[74星]RapidUDF：高性能C++表达式/脚本执行引擎，-20250202223327

4 天前

黄建同学 · //@宝玉xp:你可以说写代码sonnet强，但是debug 一-20250202152405

4 天前

法律读库 · 女检察官小丸子王文静：我的2016

8 年前

马蜂窝旅游 · 游鲸鲨，追海龟，它极可能是2017最火爆的度假胜地

8 年前

宇宙解码 · 宇宙其实只是一个“泡泡”?

7 年前

杭州交通918 · “嘭”！一声巨响！杭城这个满是人的美食城，天花板突然砸落！逃都来不及

7 年前

左右青春 · 你在爱情中期待什么？你想要的究竟是什么？

7 年前