主题简介:作为领先的大数据 OLAP 分析引擎,Apache Kylin 即将步入 2.0 时代:从星型模型到雪花模型的转变、更加全面的 SQL 语法、TPC-H Benchmark 的支持、更加先进的构建框架Spark Cubing、更好地支持实时流式数据接入等等。
Apache Kylin 正逐渐从一个 Hadoop 上的传统 OLAP 平台,演变为一个 Hadoop 上的实时数据仓库。本演讲将侧重介绍 Apache Kylin 2.0 中新引入的旨在大幅度提升构建性能的 Spark Cubing 框架,并结合实际案例,娓娓道来其背后的演变历史和设计考量。
分享嘉宾:马洪宾,Kyligence技术合伙人&高级软件架构师,Apache Kylin 核心开发者和项目管理委员会成员(PMC),专注于大数据相关的基础架构和平台。毕业于上海交通大学计算机系。
在工作于 Apache Kylin 之前曾经是微软亚洲研究院的图数据库 Trinity 的核心贡献者。加入eBay 后成为 Apache Kylin 首席 committer (根据 github 统计)。在 Apache Kylin 主要负责存储引擎,查询优化,测试覆盖等领域。