专栏名称: 城市数据团
用数据认识世界 | 用数据改变未来
目录
相关文章推荐
CDA数据分析师  ·  Deepseek教我自学Python,貌似3 ... ·  15 小时前  
数据派THU  ·  【ICLR2025】扩散图网络:使用扩散图网 ... ·  4 天前  
大数据D1net  ·  2025年数据治理趋势与成功策略全解析 ·  2 天前  
51好读  ›  专栏  ›  城市数据团

采集数据的坑这么多,怎么填?

城市数据团  · 公众号  · 大数据  · 2017-07-11 21:27

正文

晚上8:30 ,你决定执行白天下定的数据学习计划,购买了观察已久的数据团课程。


—— 深夜11:25 ,你看完了大鹏老师的零基础爬数据教程,正惊叹世上竟有如火车头这般深得人心的爬数据神器,喜滋滋地建立了一个爬取赶集网宠物信息的任务,想研究下哪种铲屎官对主子最好,却怎么都绕不过不支持“导出数据到csv”的坑。


—— 凌晨12:07 ,你焦思苦虑,抓耳挠腮,想要百度出结果,却毫无所获。天真的你没有发现,你已经深陷数据采集的第一个大坑之中……


我是直播课程预告分界线


大家好,我是颖子。


自“数据达人培养计划”推出以来,“ 爬虫入门,零编程数据爬取攻略 ”这门课广受好评,同时也收到了很多学员提出的问题:


比如模板怎么都设置不对的问题


比如标签怎么都对不上原数据的问题


再比如遇到反爬一脸懵逼的问题

总结起来就是: 老师我这按照教程来的,怎么就没结果呢?我的心很痛。


直播讲什么?


数据的坑很多,即使拥有强大的采集软件,绕过了编程,我们仍然会遇到各种小问题,这是学习中必然会遇到的坑。鉴于很多问题在数据团的社群中重复出现, 我们决定开一期直播课,专门针对火车采集器进行课程答疑。


本次直播的内容包括:

1、总结火车采集器常见的坑,并作出解释;

2、以大众点评为例,讲解火车采集器反爬取店铺评论的一类方法;


3、以爬下来的点评数据为例,讲解如何追踪评论人出现的方法

以上直播内容基于城市数据源课程“数据达人培养计划”已有课程进行更新,要求学员拥有火车采集器软件基础。相关基础学习可以在网易课堂及腾讯课堂上报名 “数据达人培养计划” ,具体内容包括:

爬虫入门,零编程数据爬取攻略

从零到一,Python网页爬虫攻略

小白逆袭,数据分析实战进阶训练

美感培养,数据可视化专题强化


点击 阅读原文 即可进入课程,欢迎大家报名,如有问题,请加入数据团学社4群 (486175793) 和我们交流。








请到「今天看啥」查看全文