今天给大家介绍的是《Big Data 项目实战班》的课程项目,包括项目难度、代码量、处理数据量、及课后需要花费的时间。截图部分是该课程的项目成果展示。
Google搜索引擎自动补全
通过Wiki 数据集中构建 N-Gram Library
实现搜索引擎的自动补全功能
项目难易程度:⭐️⭐️⭐️☆☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M
2. Article Sentiment Analysis
项目难易程度:⭐️⭐️☆☆☆
预计课后花费时间:3-5 hour
代码量:300-500 code lines
数据规模:50M
Google 搜索引擎排名
将通过wiki数据进行页面权重的计算
实现Page Rank这一重要算法
项目难易程度:⭐️⭐️⭐️⭐️☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M
4. Movie Recommender System
将应用 Netflix 的数据
给用户推荐他们之前喜欢的电影的相似电影
项目难易程度:⭐️⭐️⭐️⭐️⭐️
预计课后花费时间:6-10 hour
代码量:700-1000 code lines
数据规模:1G
《Big Data 项目实战班》本周末免费试听!
美西时间 5月7日周日 10:00-12:00
美东时间 5月7日周日 13:00-15:00
北京时间 5月8日周一 01:00-03:00
报名请登陆
www.jiuzhang.com
或点击文末阅读原文