本文介绍了一款浏览器自动化工具,通过简单的拖拽操作,能够实现网址自动登录、在线抢票、数据采集等功能。文章以百度热搜为例,详细演示了如何使用该工具进行自动化操作,包括下载安装插件、搭建工作流、数据采集、数据下载等步骤。
通过添加“导出数据”的模块,实现浏览器自动下载数据的功能。
今天我给大家介绍一款超级好用的浏览器自动化的神器。
可以通过简单的拖拉拽,就可以帮你
自动执行浏览器操作,如网址自动登录、在线抢票、数据采集、发送邮件、自动化测试等等
我先以百度热搜为例,我搭建了一个自动获取百度热搜的工作流,运行看下效果。
整体逻辑,分为3步
那接下来,我一步一步教大家怎么操作。
第一步,下载安装插件:
在谷歌浏览器中,搜索“automa”的插件,然后进行安装,这步比较简单,我就不展开了。
第二步,我们打开插件:
1,在谷歌浏览器中,点击插件图标,找到automa插件,然后点击进入插件的主页面。
2,新建一个工作流。
3,现在是重点,我们要准备搭建工作流了。
a,搭建工作流:
把“新建标签页”拖进来,然后输入百度热搜的url地址。
至此,我们就已经成功搭建了一个自动化工作流。
我们保存后,点击运行按钮,可以看到,我们的电脑已经可以自动打开浏览器,并且访问百度热搜的网页。
b,数据采集:
现在我们来试着采集“热搜标题”
拖进来一个“获取文本”的组件,然后在css选择器中输入网页元素。
它的整体逻辑:通过CSS选择器来定位网页上的特定元素,然后提取文本内容。
运行后,我们在日志中,可以看到,已经成功的拿到了第一个热搜标题。
c,我们试试拿到所有的热搜标题:
这里,稍微用到一些,前端有技巧,我们要进入浏览器中,
查看网页的HTML结构,并且找到热搜标题对应的CSS元素,并把它复制出来。
我们来对比一下几个热搜标题对应的CSS元素,来找到他们的共同点
我们来对比一下几个热搜标题对应的CSS元素,来找到他们的共同点。
现在我们再操作一下,先把“
div.content_1YWBm > a > div.c-single-text-ellipsis
”这段复制粘贴到automa中。
运行后可以看到,我们已经获取了全部热搜标题了。
此处,有一点需要注意一下,我们需要选中“多选”,否则是无法拿到所有的热搜标题的。
d,数据怎么下载:
可能有小伙伴就要问了,那我怎么把热搜标题下载到excel中呢?
那跟着我继续操作。
我们拆解一下流程,大致分为这么几步:打开表格,创建一个“热搜标题”的字段,然后在获取文本时,选择添加到表格。
运行后,我们在日志中,可以看到我们的表格,利用数据导出功能,就可以实现数据下载了。
e,一步到位:
那怎么才能一步到位呢,工作流运行后,直接下载数据呢?
方法也很简单,我们添加一个“导出数据”的模块即可。
我们运行一下,可以看到,浏览器自动帮我们下载了数据。
当然除了数据采集之外,它能做的事情还有很多,比如下载图片、视频、文件、在线抢票等等。
今天的分享就到这里,希望对你有用。
既然看到这里了,如果觉得不错,随手点个
赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标
⭐~谢谢你看我的文章
。
点这里