专栏名称: 小猿猴GISer
GIS遥感交流学习
目录
51好读  ›  专栏  ›  小猿猴GISer

越来越难获取的数据

小猿猴GISer  · 公众号  ·  · 2024-11-09 21:10

正文

之前也写过,POI获取是越来越难了: 平台额度缩水,POI获取何去何从?
让我没想到的是,POI获取还可以更难!
现在获取POI一旦被平台检测到,直接封禁,并且工单无法提交,也就是只要获取,就会被封号,并且无法解封!

经常性的需求与难获取的POI

做GIS相关工作,经常需要将一些非空间数据做空间化处理,现在平台一收紧,类似的匹配就难做了。有数据源还好,可以自己做匹配工具。没有数据源的话,类似的工作就非常难搞了(除非花钱买数据)。像本号之前分享过的行政区划数据:《 【数据分享】21年区县级行政区划数据 》,基本上也无法再通过电子地图官方途径来获取了。

解决方案

最近我做过类似的非空间数据到空间数据的匹配,现将一点经验分享给大家。
首先是自己做匹配,匹配分为两步:1、精确匹配,2、模糊匹配。精确匹配是使用待匹配数据的关键字,与手中的数据直接做匹配。受制于来源数据的质量,这一步匹配率不怎么高。精确匹配做不了的部分,就使用模糊匹配算法对数据做模糊匹配,这一步骤又可以提升一些匹配率。但受制于数据源的完整性、时效性等各方面原因,很难做到完全匹配。
事实上也是如此!
拿我这次的匹配来说,量不大,五千条左右的数据经过一通操作,只匹配上了差不多50%。还剩下两千多条数据未能匹配空间信息,地理编码的接口又用不了,怎么办呢?
我想到了两种方案,一种是申请新的开发者账号,虽然会被封掉,那也是检测到之后再封,就当个一次性账户,也不是不行。另一种方案,就是使用之前获取《 互联网数据解析及分析【商圈数据】 》的方式,把这些关键字逐一输入到检索窗口搜索一遍,然后解析数据,获取检索结果。
综合考虑后,我选了第二种方案。思路也很简单,使用按键精灵读取关键字配置信息,然后模拟输入、点击,再解析数据获取结果。
但执行的时候出现了一个问题,不知道为什么,按键精灵在往输入框输入地址的时候会丢失数字,如下视频所示:

怎么办呢?
当然是用Python!

视频中可以看到,用Python重写之后,就可以愉快地输入中文了。

两千来个,说多不多说少不少,还好有模拟点击,一会就检索完成了。后续经过解析,提取位置信息,完美地解决了这次的数据匹配工作。







请到「今天看啥」查看全文