专栏名称: 经管之家
经管之家官微,每个经济、管理、金融、统计的学习和从业者,都应该有的帐号。经管之家(论坛),是国内成立十年的大型经济、金融、管理、计量统计社区,十年磨一剑,我们共同的家园!我们提供“经管爱问”答疑微服务,以及相关数据分析及金融培训课程。
目录
相关文章推荐
神嘛事儿  ·  换个灯泡节约一千多 -20241014221316 ·  昨天  
第一财经  ·  刚刚!北交所出手! ·  5 天前  
有限次重复博弈  ·  转发微博-20241011121017 ·  5 天前  
券商中国  ·  深夜!美国,重大发布! ·  5 天前  
首席商业评论  ·  冰火两重天:开盘就下班,然而有人却亏麻了 ·  1 周前  
51好读  ›  专栏  ›  经管之家

【CDA直播预告2则】——大数据引领未来 让企业的数据价值最大化

经管之家  · 公众号  · 财经  · 2016-12-05 10:07

正文

直播简介


大数据时代,企业面临着数据爆炸式增长且多样性裂变的新常态,数据在企业和整个商业世界中发挥的作用和产生的能量都发生了质的变化。与此同时,互联网数据化运营中的用户行为路径分析与网站的海量Web日志分析成了大多数公司遇到的难题!本次经管之家旗下CDA数据分析研究院邀请到了李亮、辛立伟两位嘉宾就以上问题,以“大数据引领未来、让企业的数据价值最大化”为主题进行交流,诚邀广大大数据分析爱好者、企业从事大数据相关岗位的朋友、以及想要学习大数据的朋友们参与本次的交流分享与探讨。


直播时间


2016.12.7(周三)晚19:30-21:30

主题:基于Spark机器学习用户行为大数据分析

2016.12.10(周六)晚19:30-21:30

主题:Hadoop进阶之网站海量日志KPI指标分析


嘉宾简介


李亮,系统架构师&诸葛io创新产品部

前Intel 移动事业部算法成员,在Intel期间,获得4项专利授权。5年机器学习和数据挖掘经验。现关注点为大规模机器学习算法,流式机器学习算法,场景化数据分析。


辛立伟,Java高级软件工程师&CDA大数据工程师

Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精 通Java企业级中间件技术设计、构建以及应用部署。


分享主题


主题1:基于Spark机器学习用户行为大数据分析——用户行为路径–技术&详解

在互联网数据化运营实践中,有一类数据分析应用是互联网行业所独有的,那就是用户行为路径分析的应用。路径分析是指:对用户的每一次网络行为进行精细跟踪和记录,及在此基础上通过分析、挖掘得到用户的详细网络行为路径特点。这种分析,可以让企业有的放矢地进行产品的优化升级,并针对典型场景的用户转化数据来进一步制定和实施有针对性的策略,以期提升转化效率。这次的分享,我将结合在诸葛io的实际工作,分享这方面的实践经验。


内容提纲


•程序员眼中的用户行为路径数据

1.用户行为路径算法

2.基于Spark的用户行为路径

3.用户行为路径产品化实践


•分析师眼中的用户行为路径数据

1.什么是用户行为路径

2.用户行为路径应用场景和商业价值

3.诸葛用户行为路径自动化报告实践


主题2:Hadoop进阶之网站海量日志KPI指标分析


Web服务器产生的日志包含着网站最重要的信息,通过对日志进行分析可以了解网站的访问量、网页访问人数、以及哪个网页最有价值等信息。一般大型或超大型的网站,可能每小时就会产生10G的数据量。对于大规模的日志数据,结合Hadoop进行日志分析,是最适合不过的了。本次分享将着重分析pv、独立ip数和跳出率等指标,从数据收集、MapReduce的清洗与转换、利用Hive进行统计分析,使用sqoop将hive统计结果导入到关系型数据库中,最后以可视化效果展现,全方位为大家阐述如何用进行海量Web日志分析提取KPI数据。


内容提纲


• 分析Web服务器产生的日志,分析pv、独立ip数和跳出率等指标。

1. 使用flume这个分布式日志收集系统收集web服务器产生的日志,并上传到HDFS

2. 使用MapReduce大数据运算框架进行数据清洗和转换

3. 使用Hive对清洗后的数据进行统计分析

4. 使用sqoop将hive统计结果导入到关系型数据库中

5. 使用数据可视化技术展现分析结果


时机难得,不容错过!快来报名吧!直播期间参与提问还有机会获得精美礼品哦!点击阅读原文快速报名!