免费试听时间:
美西时间 7月23日周一 18:30-20:30
美东时间 7月23日周一 21:30-23:30北京时间 7月24日周二 09:30-11:30(a.m)
课程安排:网络直播课,每节2小时,第一节免费试听
报名网址:http://t.cn/RAC7Era, 或猛戳“阅读原文”。
首先给大家介绍的一下《Big Data 项目实战班》的课程项目,包括项目难度、代码量、处理数据量、及课后需要花费的时间。截图部分是该课程的项目成果展示。
Google搜索引擎自动补全
通过Wiki 数据集中构建 N-Gram Library
实现搜索引擎的自动补全功能
![](http://mmbiz.qpic.cn/mmbiz_png/hK6krTdpF7touKw9DVW8gSkZwhUuGSv6pm9ibrqbPq6wkkdCX6lzflhsBIRL6gPff3X4S3PEghvCyV3u0Wg83OQ/640?wx_fmt=png)
项目难易程度:⭐️⭐️⭐️☆☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M
2. Article Sentiment Analysis
![](http://mmbiz.qpic.cn/mmbiz_png/hK6krTdpF7touKw9DVW8gSkZwhUuGSv6oWdgQibv3RzdxiaRIL2noJX0ShNexsCkGEV6t2vPSDyGSIbksxHghibkw/640?wx_fmt=png)
项目难易程度:⭐️⭐️☆☆☆
预计课后花费时间:3-5 hour
代码量:300-500 code lines
数据规模:50M
Google 搜索引擎排名
将通过wiki数据进行页面权重的计算
实现Page Rank这一重要算法
![](http://mmbiz.qpic.cn/mmbiz_png/hK6krTdpF7touKw9DVW8gSkZwhUuGSv6c1YRrib9K1FzgJwyMDs8WsKCA5g4Xbe9M4kW20sl48OtvNHaccTv1Ag/640?wx_fmt=png)
项目难易程度:⭐️⭐️⭐️⭐️☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M
4. Movie Recommender System
将应用 Netflix 的数据
给用户推荐他们之前喜欢的电影的相似电影
![](http://mmbiz.qpic.cn/mmbiz_png/hK6krTdpF7touKw9DVW8gSkZwhUuGSv6icst8A3uQxbd4YsSR7ZSOxZv3TxmPAmIdAoeyezzxafYSOhdAibhKdhA/640?wx_fmt=png)
项目难易程度:⭐️⭐️⭐️⭐️⭐️
预计课后花费时间:6-10 hour
代码量:700-1000 code lines
数据规模:1G
Big Data 求职攻略 & Hadoop 入门
Find Job in Big Data Field & Hadoop Introduction
MapReduce项目实战- Google Auto Complete I
MapReduce Project - Google Auto Complete I
MapReduce项目实战- Google Auto Complete II
MapReduce Project - Google Auto Complete II