专栏名称: 玉树芝兰
思考教育、写作和互联网。 我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动。
目录
相关文章推荐
软件定义世界(SDX)  ·  DeepSeek创始人梁文锋5年前的演讲:一 ... ·  昨天  
数据派THU  ·  NeurIPS ... ·  昨天  
数据派THU  ·  【ICLR2025】流媒体视频理解与多轮交互 ... ·  昨天  
数据派THU  ·  白话版Scaling Laws for ... ·  4 天前  
51好读  ›  专栏  ›  玉树芝兰

对科研工作者来说,OpenAI Deep Research 功能意味着什么?

玉树芝兰  · 公众号  · 大数据  · 2025-02-04 09:59

正文

对抗「信息过载」,你需要得力的帮手。

痛点

实话实说,我不喜欢写文献综述。因为这注定是个无法「完美」完成的任务。

信息过载,这个词汇不是说着玩儿的。每时每刻,「卷到飞起」的学术界都会产生许许多多的新文献,涌入知识共同体的「信息池塘」。

你如果想把它们都逐字读完,那无异于痴人说梦。即便只是你自己所在专业领域的文章,恐怕也没有哪个专家敢说全部文献都已经逐字读过 —— 除非你所在的那个领域已经不再蓬勃发展,那可真算不得什么好消息。

所以写文献综述时,你就面临着难以承受的信息洪流。难免顾此失彼,而且还得花费大量的时间。

我给你介绍过许多提升该工作效率的工具与应用方法。包括但不限于 Research Rabbit, Scispace, Elicit, 讯飞星火、秘塔 AI 搜索、Perplexity, OpenAI GPTs , NotebookLM 和 Gemini Deep Research 等等。

这些工具,都可以从某些方面与环节,提升你的文献调研效率。但是,相对于学术界的「知识工厂」生产效率而言,它们还是不够强大。

有的智能程度不够高,需要你从事大量的人工阅读分析工作;有的虽说能洋洋洒洒给你提供结果,但是你会发现它们或许只是简单总结归纳一些摘要,而没有条分缕析进行系统化梳理;甚至其中有些结果可能存在严重的幻觉和不实的参考文献,需要你一一核对之后来甄别,这不但无助于提升效率,甚至有可能给你的科研工作拖后腿。

所以,当我看见 OpenAI 推出 Deep Research 的时候,不禁眼前一亮。

深度

根据官方介绍,它基于 o3 模型微调了适合检索分析的智能体,能够自动执行多步骤的互联网研究任务,帮助你从海量的在线文本、图像和 PDF 中搜寻、分析并整合信息,从而生成类似于专业研究报告的成果

从前如果你需要进行深入调研,往往需要花费数小时甚至数天来搜集、筛选和整理信息。相比之下,Deep Research 能在 5 到 30 分钟内完成相同的任务。对于高时效性需求的领域,例如金融、科学、政策或工程领域等,这种效率提升能够帮助你迅速获取关键信息。

Deep Research 并非普通的即时问答 AI。它采用的其实是「链式思考」(chain-of-thought) 推理模式 —— 遇到复杂问题时,系统会将问题拆解成多个小步骤,逐一求解。链式思考就像你在解决拼图时,先找到一些明显的边角碎片,再逐渐拼凑出更多部分,直到完整图案展现在眼前。每一步的思考过程都是有条不紊的,就好像沿着一串串思维的链条,从起点一点一点地延伸到终点。这样不仅能帮助你更清楚地理解问题,还能让你发现隐藏在问题背后的细节,从而更准确地找到答案。

这样的步骤不仅提升了答案的准确性,也让 AI 在需要逻辑推理和数据整合的场景下,表现得更接近于人类专家。

不过,光听 OpenAI 的介绍不算数,咱们还是得看看实际的例子。

实测

我昨天恰好看到 梅俊老师的一篇文章,讲 Deepseek 对知识型工作者的影响。

我觉得这是个很值得探讨的题目,于是我把梅老师这篇文章的背景介绍连同问题(「对于普通人来说,应该怎样应对 Al 浪潮?」),一起扔给了 Deep Research。

它旋即跟我商讨研究的方向。

它问我:

你希望我从哪些方面展开研究?例如:

・AI 对不同职业的具体影响?

・未来可能的新就业方向?

・个人如何提升竞争力?

・政策层面的应对?

另外,你希望研究的内容更侧重全球视角,还是特别关注中国?

我回答:

我觉得都很重要,兼顾

于是它继而给出了研究的具体问题,然后问我「希望重点关注某些特定行业或职业,还是整体层面的分析?」

我觉得这个思路逻辑清晰。毕竟一个大问题不可能通过一份报告解答,因此需要从不同维度来切片。

于是我回答说:

要有整体层面的分析,但重点关注以下几个行业:

  • 高等教育

  • 初等教育

  • 计算机科学

  • 数据科学

它搞清楚之后,继续提问:

请问你是否有特定的关注点,例如:

・具体国家 / 地区(例如中国、欧美、全球)

・短期影响 vS. 长期趋势

・特别想了解的应对策略(个人技能提升、教育改革、就业保障等)

没错,只有进一步细分,才能够合理实施调研。于是我回应:

国家上,主要关注美国和中国

兼顾短期与长期

就来这仨:个人技能提升、教育改革、就业保障

它觉得这个研究可以开展了,就问我是否有补充?

我回答:

开始吧

然后,它就开始漫长的资料采集和思考过程。

你可以在界面右侧详细观察它究竟执行了什么样的搜索。

以及引用的来源。

注意来源不是一蹴而就,而是根据中间分析结果和预先的计划,逐步扩展。

思考了 11 分钟后,Deep Research 给出了最终分析的结果。

我把完整的结果,放在了这个 Notion 页面,供你查看。

https://wise-pullover-00f.notion.site/AI-18fb21c52dac8077aa12f0a52055bdf0?pvs=4

这是其大纲。

分析逻辑清晰、条理规整、数据翔实,引用来源丰富。

我把 OpenAI Deep Research 的分析报告发在了知识星球「玉树芝兰」上,星友们查看和检视了其中的链接,至今没有反馈发现任何幻觉和错误引用的问题。

学术

紧接着,我又尝试了用 OpenAI Deep Research 做学术文献的分析汇总。

我直接选用了刚刚展示过星友让 Perplexity 回答的问题:

谷物清选损失传感骼的研究进展

OpenAI Deep Research 旋即跟我开始沟通。

问题是,我对这个学科并不懂啊,于是干脆笼统提出:

整体谷物清选传感技术;应用案例与最新研究论文

然后 OpenAI Deep Research 开始干活儿。

这是它分析的结果。

我还是把它放在了 这个 Notion 页面中,请你点击查看。

https://wise-pullover-00f.notion.site/18fb21c52dac800d8fc5cefd2e18e7e5?pvs=4

这是它给出的大纲。

我尤其喜欢最后这部分。

研究文献的分析,绝对不是只来自于摘要,例如这里:

这种深度全面的分析,真的很让人惊喜。

另外,OpenAI Deep Research 还能找到非常新的文献。

链接也查看过,没问题。

这个报告好不好,我说了不算,我发给星友。这是星友的专业评价。

当然,我们不能用一两个孤证来对比不同的工具。不过从结果长度、来源文献数量和研究深度来说,区别是非常明显的。

反思

那问题来了,对科研工作者来说,OpenAI Deep Research 功能意味着什么呢?

短期来看,绝对的利好啊。

因为如果你可以在 5-30 分钟,获得一份原本需要几天甚至几个星期才能调研好的报告,那么针对这篇报告中提到的来源链接,重新手动验证、分析,乃至于重新编写一遍,也会比原先的文献综述方法简便高效。至少,它有助于打破信息茧房,给你提供线索激发灵感和创意,并且可以快速验证原本的假设想法……

但是长期来讲呢?

反正我在把报告结果发布到星球的时候,便发了一番感慨。

你怎么看?欢迎把你的想法写在留言区,咱们一起交流讨论。


点赞 +「在看」,转发给你身边有需要的朋友。收不到推送?那是因为你只订阅,却没有加星标

欢迎订阅我的小报童付费专栏,每月更新不少于3篇文章。订阅一整年价格优惠。

如果有问题咨询,或者希望加入社群和热爱钻研的小伙伴们一起讨论,订阅知识星球吧。不仅包括小报童的推送内容,还可以自由发帖与提问。之前已经积累下的帖子和问答,就有数百篇。足够你好好翻一阵子。知识星球支持72小时内无条件退款,所以你可以放心尝试。

若文中部分链接可能无法正常显示与跳转,可能是因为微信公众平台的外链限制。如需访问,请点击文末「阅读原文」链接,查看链接齐备的版本。 

延伸阅读