专栏名称: Howie和小能熊
小能熊是终生学习的小能熊,是自我管理的小能熊。 小能熊专注于分享自我学习方法,分享时间管理、知识管理等自我管理方面的经验和思考。 一句话,小能熊,来自学习者,服务学习者。 热爱学习、希望提升自我的你,希望小能熊能成为你的好朋友。
目录
相关文章推荐
于小戈  ·  相恋多年,终究还是分了? ·  8 小时前  
掌中淄博  ·  孙颖莎,王楚钦传来喜讯! ·  昨天  
掌中淄博  ·  孙颖莎,王楚钦传来喜讯! ·  昨天  
于小戈  ·  她俩分手,一点也不意外 ·  昨天  
于小戈  ·  快逃!别被软饭男榨干! ·  2 天前  
于小戈  ·  殿堂级天后,紧急割韭圈钱? ·  3 天前  
51好读  ›  专栏  ›  Howie和小能熊

驾驭 deep research,你必须知道的 100 件事|一次性构建出你的 deep research 个人知识体系

Howie和小能熊  · 公众号  ·  · 2025-02-27 17:01

正文

  • deep research 很可能(probable,60%--80%概率)是自chatgpt之后第二个 革命性AI技术 。因为它真正改变了 脑力劳动者的生产力格局
  • 你对 deep research 的态度在本质上取决于你 对技术本质的判断 ,对技术的敏感度与洞察;
  • 我目前对“deep research是革命性技术”的置信度是80%,如果相反证据出现,我自然会 贝叶斯更新 我的推断;在相反证据出现之前,我建议你对这项技术予以足够重视。 能花 100 小时在这上面,就别只花 99 小时
  • 对改变了生产力格局的deep research,你的 个人知识体系 越全面,理解就越深,使用就越好。通过这篇文章,我把自己脑子里关于 deep research 的知识和经验全部敲出来,希望帮你更全面深入地理解 deep research 到底 是什么 为什么 重要, 如何 使用, 如何 改变生命;

why

  • 2025年是agent之年。根据 openai的agi分级框架 ,chatbot/知识模型是L1 agi,reasoning model/推理模型是L2 agi,而agent/任务模型是L3 agi;
  • 今年,openai 已经陆续推出chatgpt tasks、operator 和deep research 这 三个 agents 。tasks 是基础的任务提醒,operator 是直接操作浏览器,与真实世界互动,deep research是帮专业人士做研究;
  • 前两个几乎无人问津。但是,对于 deep research,如果你不是干 体力活 的,真的没理由不关注一下,除非你端的是 铁饭碗 ,而且是最稳的那种🤣;

what

  • deep research(深度研究)是一个功能,一个模型,一个以“研究”为专业的 AI agent(智能体/代理) 。openai的官方广告语是:你的个人研究助理;
  • 最先推出deep research功能的是 google gemini,发布于 2024 年 12 月 中旬;然后是openai(25 年 2 月),紧接着是 perplexity;
  • grok3 推出的是 deep search (ai 搜索,更接近推理模型版本的 chatgpt search),不是 deep research(本质是 ai agent);
  • google deep research 底层模型 是gemini 1.5 pro,全名叫“Gemini 1.5 Pro with Deep Research”。虽然 google在搜索上有近 30 年技术积累,但由于模型基础性能拉跨,导致输出结果和openai deep research 有数量级差距;
  • google deep research 会在用户提出问题后自动制定 多步骤研究计划 。系统先生成一个分步研究方案供用户审核,可根据需要修改,然后用户点击“Start research”开始执行。获得授权后,Gemini 会像人类研究者一样反复执行 “搜索-阅读-分析”循环 :利用 google 搜索查找相关内容,读取网页获取信息,再根据新发现调整搜索策略。这一过程会持续数分钟,期间 gemini 持续完善对主题的理解,发起多轮检索和推理,以确保覆盖话题的各个方面。整个浏览和思考过程在后台自动完成,无需用户干预。基本上各家的 deep research 都是这个流程。
  • google deep research的特点是 在搜索上大力 (结果没有奇迹):通常浏览上百个网站,阅读上千个网页,提供的研究报告带上百个参考文献。很唬人,不明觉厉。但是,openai deep research 出来后,这一套就不灵了,经不住内容质量上的鲜明对比;
  • perplexity 推出的 deep research 基本属于蹭热点、找存在感,相当于“挂羊头卖狗肉”,质量差到没人用, 不建议浪费时间
  • google ai 会员 20 美金/月,支持 6 人家庭共享,deep research 不限量;perplexity ai 会员 20 美金/月,也不限量;openai 20 美金的 plus会员,每月 10 次限额; 价格差异 一方面是成本差异巨大,一方面是质量差异带来底气;
  • deep research 本质上在做一件事: 主题研究 。这件事对本科生来说有涉及,对研究生来说是关键能力,但是,大多数人做不好。AI 在这件事上展现出的实力,让人类用户震惊、感慨,思考自己 智力活动的价值 (包括形而上的意义价值,更包括形而下的经济价值)(人的智力活动当然有价值,但必须重新调整自身智力活动的定位,只能做到 ai 能做到的程度,那就危险);
  • 决定deep research 效果的,不是“如何做研究”的步骤方法流程技巧(模型的系统指令很简单,o3的基础智能极强,不需要你教它如何做研究),而是 底层的 reasoning model 。这也是为什么 o3 驱动的 deep research 效果惊人;

openai deep research

  • openai deep research 是 2025 年 2 月 3 号推出的,开始时是 200 美金/月的 pro 用户独享。pro 用户独占使用 3 周后,openai 把这个功能普及到 plus 用户,后续会普及到 免费用户
  • deep research 发布后,由于是pro独占,我思考了 5 分钟,然后升级到 200美金 pro 会员。今天,使用了接近一个月后,我可以这么说: 除非 我娃没钱吃饭了,否则我会一直用pro(我自己没钱吃饭也会开pro);
  • 使用 chatgpt pro 的 难度不低 ,不是200 美金问题(舍不得在“软件”上花钱的人,在其他地方花钱可能很豪气),而是视角问题(到底是软件?是工具?还是待你整合到工作流、为你创造价值、甚至金钱价值的智能体?),以及网络技术问题(openai 无良降智);
  • 使用 pro,需要极高的 agency(能动性) :要有与openai斗智斗勇永不妥协的能力和意愿,要心态开放到至少开一个月试试智能时代全新工作学习体验;
  • pro用户 每月限额 120 次,plus 用户每月 10 次,免费用户每月 2 次(暂估);
  • pro、plus和免费用户使用的 deep research 功能是一样的,只有限额的次数区别, 没有性能区别
  • 每月限额 并非以自然月份划分,而是以你升级会员的具体日期划分;
  • openai deep research的 底层模型 是尚未发布的满血版 o3,是针对互联网浏览特别微调的一个特殊版本;
  • 我的 deep research 的总结是:o3 reasoning model + search = deep research magic。与常规的 ai 搜索不同,deep research 的重点是深度,而非时效。你提出研究需求,deep research 会帮你把互联网 翻个底朝天 ,而且吃透这些材料,为你私人定制研究报告。
  • 口诀: 快问快答 ,用ai搜索;系统调研,用 deep research;
  • 我把 ai 搜索分为三个层级。L1 是 gpt-4o+search ,搜索信息、综合多个信息源内容,给出一个整体回答;level 2 o3-mini+search ,加上了推理能力,如果问题是需要思考的,需要多步骤的推理过程,最终给出一个权衡、分析后的结果,就用o3-mini;level 3 o3+deep research ,难度提高到研究级别,输出结果为上万字的研究报告;
  • 换一个时间角度:如果一个问题是人工用 几分钟 可以解决的,用gpt-4o+search 就够了;如果一个问题是人工用 几十分钟 可以解决的,用o3-mini+search;如果一个问题是人工用 几个小时、甚至几天 才能解决的,用 deep research;
  • 信息来源 上,deep research 可访问所有公开网页,包括网上的图片、pdf、文档,也支持你上传自己本地的图片、文档;

how

  • 既然限额是20或120次/月,那么, 怎么就算“一次” ?只要有研究进度条开始走动,就正式启动了deep research阶段,算一次研究;






请到「今天看啥」查看全文