CSDN精彩内容每日推荐。我们关注IT产品研发背后的那些人、技术和故事。 |
点击上方“ CSDN ”,选择“置顶公众号”
关键时刻,第一时间送达!
每天我都要坐地铁上班,而地铁里完全没有手机信号。但我希望在坐地铁的时候读些新闻,于是就写了下面这个新闻爬虫。
我并没有打算做很漂亮的应用,所以只完成了原型,它可以满足我最基本的需求。其思路很简单:
找到新闻源;
用Python抓取新闻;
利用BeautifulSoup分析HTML并提取出内容;
转换成容易阅读的格式并通过邮件发送。
下面详细介绍每个部分的实现。
▌