专栏名称: python

隔天更新python文章，我希望用我的努力换来劳动的成果帮助更多的人掌握一门技术，因此我要更加努力。

我是如何用Python获取整个学校女生电话和QQ？技术撩妹

python · 公众号 · Python · 2018-01-25 00:00

正文

前言：

这个没什么技术难度，懂爬虫的人和程序员都可以用学的语言写出来

只是很多安全问题的存在，的确影响着我们的生活，

希望大家可以认识到一些网站的后台密码的规则与自己的安全性

简单的说，就是是程序员的懒，让用户的信息暴露在互联网上

还有一点：

就是希望正在接触python，和快要放弃学习的同学，可以试试换种思路，

来试试爬虫，这样有成就感的累积，可以慢慢提升你的自信

爬虫开始前的准备：

python2.7
库文件（xlwt，urllib2，BeautifulSoup4，xlrd）

安装库文件的方法：

最好在你的python2.7/script/下面打开power shell(可以shift+右击) 执行下面的：

安装库文件：

pip install *** ***是指上面的库文件，下面不一定都用，只要上面的，以后出什么错，你就继续pip install

观察网站结构（密码规则）：

首先这个规则是针对大二和已经毕业了的
密码规则没有添加验证码（其实添加验证码也没什么用，只是添加了爬取门槛）
规则是用户名==密码

符合条件

这里的用户信息
不要在意这些细节（马赛克）朦胧美一直是我的追求

具体思路：模拟登陆 ==》制作学号规则==》信息查询（爬取）==》存入xls模拟登陆：因为我们是用爬虫取信息，每次访问，

肯定是登陆了以后才可以访问我们的信息 ==》模拟登陆
当我们用脚本访问下一个页面，需要一个cookie信息，就好比，当你打开

qq空间，其实是想腾讯那里提交了自己的信息，而我们的信息就存在cookie中

python 中cookie维持会话访问：

模拟登陆

具体网址不分享，避免带来不必要的麻烦

学号的列表

用户信息的获取

这里用的的是beautifulsoup库

写入xls(这个是思路)测试用的函数

因为在写的时候因为编码问题，不能写入中文

开始行动：
添加上延迟访问： time.sleep(1)

因为爬虫访问的不和人一样，访问会很快，
这样可以避免被封ip 还有避免给站点带来不好的影响

请到「今天看啥」查看全文

推荐文章

Python爱好者社区 · “给我滚出贵大！”郑强出任贵州大学校长，打算把树全砍掉，学生愤怒抗议，4年后事情反转

3 天前

Python爱好者社区 · 节后第一个私活，赚了3w

2 天前

Python爱好者社区 · python接私活，yyds

22 小时前

Python爱好者社区 · DeepSeek 最新中国大学排名

22 小时前

Python开发者 · “李飞飞团队50 美元炼出 DeepSeek R1”被质疑，上海交大本科生新“低成本推理”或成新宠！

3 天前

育学园 · 宝宝冬天爱咳嗽怎么办？如何培养宝宝正确的金钱观？

8 年前

来自星星 · 如果你是狮子座，请你时刻铭记这些道理

8 年前

季顺潘 · 周二|情人节买个温暖的礼物

7 年前

车早茶 · 老婆差点和我闹离婚，竟是这家伙惹的祸！

7 年前

占豪 · 一带一路峰会后，“抢币”行动来了……

7 年前