专栏名称: 九章算法
专业的北美IT求职经验分享、技术交流社区,帮助你找到好的IT工作。由硅谷顶尖IT企业工程师维护。提供专业的算法培训/面试咨询,官网 www.jiuzhang.com
目录
相关文章推荐
算法爱好者  ·  3.76 万亿元背后,开发者真的能拿到 ... ·  昨天  
九章算法  ·  《大厂leetcode刷题宝典.pdf》已流 ... ·  3 天前  
九章算法  ·  Chrome,变天了! ·  2 天前  
格斗迷  ·  拳王泰森最强KO合集! ·  4 天前  
格斗迷  ·  拳王泰森最强KO合集! ·  4 天前  
算法与数据结构  ·  本科经典算法Dijkstra,被证明是普遍最 ... ·  6 天前  
51好读  ›  专栏  ›  九章算法

Big Data 可以做的项目有哪些?

九章算法  · 公众号  · 算法  · 2017-05-05 07:41

正文

今天给大家介绍的是《Big Data 项目实战班》的课程项目,包括项目难度、代码量、处理数据量、及课后需要花费的时间。截图部分是该课程的项目成果展示。

1. Google Auto Complete

Google搜索引擎自动补全

通过Wiki 数据集中构建 N-Gram Library

实现搜索引擎的自动补全功能



项目难易程度:⭐️⭐️⭐️☆☆

预计课后花费时间:5-7 hour

代码量:300-500 code lines

数据规模:50M

2. Article Sentiment Analysis

通过统计文章情感关键词

分析文章所表达的情绪



项目难易程度:⭐️⭐️☆☆
预计课后花费时间:3-5 hour
代码量:300-500 code lines
数据规模:50M

3. Page Rank

 Google 搜索引擎排名

将通过wiki数据进行页面权重的计算

实现Page Rank这一重要算法



项目难易程度:⭐️⭐️⭐️⭐️☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M

4. Movie Recommender System

电影推荐系统

将应用 Netflix 的数据

给用户推荐他们之前喜欢的电影的相似电影


项目难易程度:⭐️⭐️⭐️⭐️⭐️
预计课后花费时间:6-10 hour
代码量:700-1000 code lines
数据规模:1G



《Big Data 项目实战班》本周末免费试听!

美西时间 5月7日周日 10:00-12:00 

美东时间 5月7日周日 13:00-15:00

北京时间  5月8日周一 01:00-03:00


报名请登陆

www.jiuzhang.com

或点击文末阅读原文