专栏名称: 九章算法
专业的北美IT求职经验分享、技术交流社区,帮助你找到好的IT工作。由硅谷顶尖IT企业工程师维护。提供专业的算法培训/面试咨询,官网 www.jiuzhang.com
目录
相关文章推荐
九章算法  ·  最后一天!九章消费券免费抢! ·  3 天前  
九章算法  ·  谷歌/亚麻的BQ题库,附上标准答案! ·  昨天  
九章算法  ·  美国正在萎缩的行业!华人千万别碰! ·  6 天前  
51好读  ›  专栏  ›  九章算法

Big Data 项目实战班 | 从零开始学会 Hadoop!

九章算法  · 公众号  · 算法  · 2017-11-01 07:42

正文


本期免费试听:

美西时间11月5日周日 18:30-20:30
美东时间11月5日周日 21:30-23:30
北京时间11月6日周一 10:30-12:30

课程安排: 本课程为网络直播课,每节2小时,共9节,第一节免费试听。

报名网址: http://t.cn/RAC7Era , 或戳 “阅读原文”


首先给大家介绍的一下《Big Data 项目实战班》的课程项目, 包括项目难度、代码量、处理数据量、及课后需要花费的时间 。截图部分是该课程的项目成果展示。

1. Google Auto Complete

Google搜索引擎自动补全

通过Wiki 数据集中构建 N-Gram Library

实现搜索引擎的自动补全功能



项目难易程度:⭐️⭐️⭐️☆☆

预计课后花费时间:5-7 hour

代码量:300-500 code lines

数据规模:50M

2. Article Sentiment Analysis

通过统计文章情感关键词

分析文章所表达的情绪



项目难易程度:⭐️⭐️☆☆☆
预计课后花费时间:3-5 hour
代码量:300-500 code lines
数据规模:50M

3. Page Rank

Google 搜索引擎排名

将通过wiki数据进行页面权重的计算

实现Page Rank这一重要算法



项目难易程度:⭐️⭐️⭐️⭐️☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M

4. Movie Recommender System

电影推荐系统


将应用 Netflix 的数据

给用户推荐他们之前喜欢的电影的相似电影


项目难易程度:⭐️⭐️⭐️⭐️⭐️
预计课后花费时间:6-10 hour
代码量:700-1000 code lines
数据规模:1G


Big Data 课程大纲


1

Big Data 求职攻略 & Hadoop 入门

Find Job in Big Data Field & Hadoop Introduction

2

MapReduce项目实战- Google Auto Complete I

MapReduce Project - Google Auto Complete I

3

MapReduce项目实战- Google Auto Complete II

MapReduce Project - Google Auto Complete II

4

Hadoop分布式系统

Hadoop Distributed File System







请到「今天看啥」查看全文