专栏名称: 吴师兄学算法
和程序员小吴一起从初学者的角度学习算法,以动画的形式呈现解题的思路。每周四篇原创文章,期待你的鉴赏!
目录
相关文章推荐
巴比特资讯  ·  ​杨植麟翻身,还要靠OpenAI ·  昨天  
中国舞台美术学会  ·  艺谈丨胡娜:从演艺新空间看戏曲的守正创新 ·  2 天前  
中国舞台美术学会  ·  资讯丨五部门:《优化消费环境三年行动方案(2 ... ·  2 天前  
中国日报网  ·  夜赏|灵瑞迎新 白蛇迎春 ·  3 天前  
中国日报网  ·  夜赏|灵瑞迎新 白蛇迎春 ·  3 天前  
巴比特资讯  ·  全球首个混合推理模型Claude ... ·  3 天前  
51好读  ›  专栏  ›  吴师兄学算法

滴滴出行的数据架构和信息流处理思路解析

吴师兄学算法  · 公众号  ·  · 2019-10-15 20:15

正文

截止到今年7月,滴滴注册用户已超过 5.5亿 ,年运送乘客达 100亿人次 ,每日处理数据 4875+TB ,日定位数超过 150亿 ,每日路径规划请求超过 400亿 次。

面对庞大的数据量,滴滴的实时计算、数据存储和数据清洗都基本做到了行业典范。下面我们来了解一下滴滴的 数据库框架设计

此外,滴滴的 信息流处理 流程 也是值得我们借鉴的。


接下来我们来了解一下智慧出行的

底层数据项目架构 解决方案 概述

1、通过binlog方式实时梳理业务库高QPS压力2、内置源码模块,细粒度监控Spark作业,失败及时邮件报警

3、覆盖源码自定义数据源加载,从源头进行列剪枝

4、自定义维护Kafka的偏移量管理,实现exactlyonce

5、实现前后端rest接口的开发规范


关于项目模块搭建的部分,前后端模块是分离的:后台使用一套环境,前端按照系统分开两个WEB项目(一个是订单数据监控系统,一个是出行数据运营系统)进行数据展示。

关于项目平台搭建(Cloudera),分为以下三部分:

1、Cloudera的服务搭建

2、Cloudera的Hadoop生态搭建

3、Cloudera的分布式消息系统搭建

关于业务库高并发解决方案介绍和架构实现,以及项目common模块的开发实现, 这里有一份 滴滴出行人才培养计划 的课程大纲。课程里结合了很多滴滴智能出行场景,也结合了 滴滴用来培养大数据方向人才 的逻辑。

建议大家仔细阅读一下 ,同时也可以学习一下 滴滴处理一些数据业务时应用的技术

课程大纲(向下滑动查看)


向下滑动阅览

课程将严格遵守滴滴出行的数据安全标准, 本培养计划中 订单、车辆分布 和收入 总数等数据均 采用 模拟数据集实现 ,此类功能点在大纲中 用*标注

因为 滴滴大数据人才培养计划 今年只招收199人,所以要对学员进行筛选, 满足以下条件 的学员可以扫描二维码报名 参与选拔

  • 有两年以上 Java 编程经验;

  • 有一定的 大数据技术 分布式系统 的理论基础;

  • 有较强的思维逻辑能力,能应对复杂业务场景处理。

扫描下方二维码预报名

参与“大厂人才培养计划”考核

参加过培养计划的学员将收获

大厂就业绿色通道

滴滴出行人才培养计划是与后厂理工学院合作的,也旨在筛选和培养出更具有 实战能力 的数据工程师。 而Boss直聘







请到「今天看啥」查看全文