专栏名称: Python之禅
分享Python相关技术干货,偶尔扯扯其它的
目录
相关文章推荐
Python爱好者社区  ·  节后第一个私活,赚了3w ·  2 天前  
Python爱好者社区  ·  python接私活,yyds ·  昨天  
Python爱好者社区  ·  DeepSeek 最新中国大学排名 ·  昨天  
Python开发者  ·  “李飞飞团队50 美元炼出 ... ·  4 天前  
Python爱好者社区  ·  英伟达憾失DeepSeek关键人才?美国放走 ... ·  4 天前  
51好读  ›  专栏  ›  Python之禅

吹牛,是不可能的

Python之禅  · 公众号  · Python  · 2021-01-17 15:34

正文

昨天发了一篇用 pillow裁剪图片的文章 ,然后很多人后台留言说这个功能很鸡肋,明明有很多现成的工具,干嘛还要自己造个轮子,麻烦的一逼。



其实这个需求不是我YY出来的,而是确实有这样的场景。今天我就给你们讲个爬虫领域的使用场景。


可能有些人知道,我在爬虫这块比较专业,特别是公众号这块,然后有次一个客户找到我,他们希望有个能实时获取公众号内容更新的需求。


但是微信并没有提供这样的接口可以让你去实时获取更新,你只有不断去轮询询问服务器有没有更新内容,如果一两个号你轮询下还好,几百上千个号你去轮询就不可取了。


想要实时获取最新的推送内容有一种方法就是DDL注入技术,不过这种技术难度大,风险指数高,动不动就会被封号。


那么退而求其次的方法是什么呢?


就是将公众号的订阅列表先截图,然后通过图文识别技术将公众号名字提取出来。接着就可以根据公众号名字去查询最近的文章列表(至于怎么查是另外一个话题了)



那这跟图片裁剪有什么关系呢?因为我要裁剪的固定区域的图片,其它地方的内容都属于干扰信息,所以首先要进行裁剪。


整个流程可以做到完全自动化无需人工参与来实现这个需求。


今天推荐一下我的一个星球,价值365元的免费星球,为什么免费星球却要说价值365呢,因为我会将自己思考、认知的东西记录下来,顺便能给一部分人带来启发,这就是它的价值。所以现在加入相当于白嫖。








请到「今天看啥」查看全文