专栏名称: Python学习交流
每天更新,更新python相关的知识。希望诸君有所收获!
目录
相关文章推荐
Python爱好者社区  ·  史上最强!PINN杀疯了 ·  昨天  
Python爱好者社区  ·  英伟达憾失DeepSeek关键人才?美国放走 ... ·  昨天  
Python爱好者社区  ·  离谱!下载DeepSeek最高判刑20年? ·  2 天前  
Python爱好者社区  ·  1885页的Python完全版电子书 ·  3 天前  
Python开发者  ·  o3-mini 碾压 DeepSeek ... ·  6 天前  
51好读  ›  专栏  ›  Python学习交流

淘宝的每个商品都有密码的!今天用Python来攻破它!马哥别找我!

Python学习交流  · 公众号  · Python  · 2018-09-17 19:04

正文


加VX:mmp9972   即可获取数十套PDF哦!源码单独私信!

所用模块:

re+requests+json

所用环境:

windows10 + pycharm

实战分析:

第一步:根据url来在google chrome中分析数据



分析的结果是:数据就是通过json来存储的

第二步:

得到网页的源码


第三步把得到的数据进行解析


第四步:对数据进行解密


第五步:就可以把json的数据拿到并分析得到相应的数据


以下是源码:

 1 import json
2 import re
3
4 import requests
5
6 # 在搜索框中输入美食得到的数据q=%E7%BE%8E%E9%A3%9F
7 url = 'https://s.taobao.com/search?q=%E7%BE%8E%E9%A3%9F'
8 response = requests.get(url)
9 # print(response.text)
10
11 # 用正则对html源码进行解析到一个json数据
12 pattern = re.compile('g_page_config =(.*?});', re.S)
13 result = re.search(pattern, response.text)
14 # print(result.group(1))
15 try:
16 # 发现并不是那么简单而是加密的数据并是有规律可寻的,以下是加密的几个数据段
17 json_data = re.sub('(\\=)|(\\&)|(\\)', '', result.group(1))
18 print('数据解密成功')
19 # print(json_data)
20 except Exception as e:
21 print('数据解密失败,原因是:',e)
22
23
24 # json_dumps = json.dumps(json_data)
25 # print(json_dumps)
26 data_count = 1
27 data = json.loads(json_data)
28 # 分析json的数据并把需要的数据给读取出来
29 for good in data['mods']['itemlist']['data']['auctions']:
30 print('商店名:{},商品标题:{}, 商品图片:{}, 商品产地:{},商品价格:{},付款人数:{}, '.format(good['nick'], good['title'], good['pic_url'], good['item_loc'], good['view_price'],good['view_sales']))
31 data_count += 1
32
33 print(data_count)

是不是超级简单啊!拿去玩吧!







请到「今天看啥」查看全文


推荐文章
Python爱好者社区  ·  史上最强!PINN杀疯了
昨天
Python爱好者社区  ·  离谱!下载DeepSeek最高判刑20年?
2 天前
Python爱好者社区  ·  1885页的Python完全版电子书
3 天前
午夜漫画站  ·  卡列漫画:玩具女友
7 年前
百万卖家俱乐部  ·  亚马逊早期评论人计划正式上线
7 年前