专栏名称: 玉树芝兰
思考教育、写作和互联网。 我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动。
目录
相关文章推荐
湖北经视  ·  叹息!她于凌晨去世,年仅28岁 ·  6 小时前  
湖北经视  ·  武汉幼儿园将免费入学?教育局回应 ·  12 小时前  
湖北经视  ·  大S去世18天,知名男演员终于露面回应 ·  昨天  
湖北经视  ·  有人开“急救车”在重庆旅游?车主发声 ·  2 天前  
湖北经视  ·  山姆超市突发!紧急送往医院 ·  2 天前  
51好读  ›  专栏  ›  玉树芝兰

如何用最简方法,爬取网站数据?

玉树芝兰  · 公众号  ·  · 2024-05-29 18:16

正文

(注:本文为小报童精选文章。已订阅小报童或加入知识星球「玉树芝兰」用户 请勿重复付费


小巧、简单、高效、实用。

许多学科的研究工作范式早已是 数据驱动 。在过去的几年时间里,我给你介绍过不少获取数据的方法。开放数据获取和 API 数据读取更为简单一些,相对而言爬虫就有些复杂。所以我 详细介绍使用编程从头做爬虫的教程并不多 ,而更希望给你介绍一些更为简便的方式,例如 这篇

自从有了大语言模型,我们都看到了一个更加智能时代的来临。 我也给你介绍过利用 Code Interpreter 等方式替你编程采集数据的方法 ,这样你就不用自己手动写代码来抓取数据了。

最近给你介绍的样例是一个定制化的 GPT,是有人专门做好放在 GPTS Store 里面供大家使用的。 在这篇文章里,我给你演示了用它来采集我们系的教师介绍网页

从这个样例中你不难看出,AI Agent 具有很大的潜力,可以为普通用户赋能,帮助你完成从前无法做到的数据采集任务。







请到「今天看啥」查看全文


推荐文章
湖北经视  ·  叹息!她于凌晨去世,年仅28岁
6 小时前
湖北经视  ·  武汉幼儿园将免费入学?教育局回应
12 小时前
湖北经视  ·  山姆超市突发!紧急送往医院
2 天前
考研英语时事阅读  ·  18考研党,寒假你要怎么过?
8 年前
桃桃淘电影  ·  红唇复古的索菲娅·科波拉丨赏色
7 年前
FM93交通之声  ·  培育一批“专精特新”中小企业
7 年前