专栏名称: DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
目录
相关文章推荐
畅赏黑龙江  ·  别遗憾!黑龙江的冬天还没落幕!文末领好礼 ·  10 小时前  
畅赏黑龙江  ·  别遗憾!黑龙江的冬天还没落幕!文末领好礼 ·  10 小时前  
宁德广播电视台  ·  哪吒的粉丝们:福利来了,免票/半票! ·  2 天前  
宁德广播电视台  ·  哪吒的粉丝们:福利来了,免票/半票! ·  2 天前  
今日五莲  ·  免票!半价!哪吒粉丝福利来啦! ·  2 天前  
今日五莲  ·  免票!半价!哪吒粉丝福利来啦! ·  2 天前  
新播报  ·  刚刚通报:老板宋某,行拘10天! ·  2 天前  
新播报  ·  刚刚通报:老板宋某,行拘10天! ·  2 天前  
旅行雷达助手  ·  【历时5年重磅回归】珠海C位一线海景!山海地 ... ·  3 天前  
51好读  ›  专栏  ›  DataFunSummit

大咖公益讲堂|《深入浅出Apache Spark》系列盛大来袭!

DataFunSummit  · 公众号  ·  · 2024-05-22 18:00

正文

想要快速掌握Spark?

从Spark入门到精通吗?

7场系列直播

Apache Spark Committer-耿嘉安 精心打造

数新网络 X DataFun 联合出品

《深入浅出Apache Spark》系列盛大来袭!

扫码入群,参与直播

什么是Apache Spark?

Apache Spark是一个开源的大数据处理框架,提供高速的大规模数据处理能力。能够利用内存计算和并行处理技术,加快数据处理速度,具有易于使用的API和内置库,支持批处理和流处理等多种数据处理模式。拥有强大的生态系统,包括Spark SQL、Spark Streaming、MLlib和GraphX等组件。Spark可以在分布式集群上运行,利用集群资源进行并行处理,使用分布式数据集(RDD)来提供容错性和弹性的计算模型。Spark被广泛应用于数据清洗、ETL处理、数据分析、机器学习等任务,因其高速和易用性而受关注。

Apache Spark Committer是什么概念?

众所周知,Apache Spark作为一款强大的开源分布式数据处理引擎,自立项之后就一直是大数据领域的热点,目前Apache Spark已经成为大数据领域最主要的计算框架和事实标准,大量的互联网公司都使用Spark作为大数据计算引擎。Spark社区已经成为大数据方面最大的开源社区之一,拥有遍布全球570多个地区的超过30万个SparkMeetup社区成员。
在如此庞大的社区中,仅仅有90位Committer(核心贡献者),普通社区成员与之的比率大概是4000:1。他们是社区的技术核心和主要贡献者,也是保障社区代码质量的“检察官”。
从Spark官网Committer页面可以看到,国内的Saprk Committer并不多,耿嘉安是其中之一。

《深入浅出Apache Spark》系列有哪些?

✅首讲 6月5日——Apache Spark内核原理
✅续篇 6月19日——Apache Spark SQL原理
✅进阶之旅 7月——Spark SQL解析层优化
✅深度剖析 8月——Spark SQL分析层优化
✅核心揭秘 9月——Spark SQL表达式优化
✅思维跃迁 10月——Spark SQL优化器
✅巅峰论剑 11月——Spark SQL执行层优化
每一期都是知识与智慧的碰撞,诚邀您共赴这场技术与艺术交织的盛宴。

嘉宾简介

耿嘉安 新网络高级架构专家、Spark Committer
16年软件开发&大数据开发经验,出版《深入理解Spark》、《Spark内核设计的艺术》Spark系列畅销书籍。
2014年,阿里巴巴御膳房主力开发
2016年,艺龙网大数据架构师,主导开发大数据平台
2018年,360高级大数据专家,主导开发XSQL查询平台
2020年,麒麟高级性能专家,主导Kylin执行引擎加速

2024年,数新网络(DataCyber)高级大数据引擎专家,主导CyberSQL统一SQL查询引擎及Spark性能优化







请到「今天看啥」查看全文