专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
小众软件  ·  另外两件事[250208] ·  13 小时前  
APPSO  ·  不卡顿免费使用 DeepSeek ... ·  2 天前  
小众软件  ·  另外两件事[250206] ·  2 天前  
APPSO  ·  华为小艺助手接入DeepSeek/OpenA ... ·  3 天前  
小众软件  ·  缝合怪开发者一口气限免了自己的 4 款应用 ·  3 天前  
51好读  ›  专栏  ›  APPSO

200 美元的 AI 平替 15 万美元研究团队,ChatGPT 这个新功能被严重低估

APPSO  · 公众号  · app  · 2025-02-08 11:59

正文

OpenAI 在 2 月 3 日发布的 Deep Research 功能,有点低开高走的趋势。
刚推出时,Deep Research 因为重名被 Google 员工吐槽,被火遍全球的 DeepSeek 盖过风头,再加上 OpenAI 的舆论偏向负面,并没有掀起什么水花。
Google 员工吐槽 OpenAI,顺便安利 Gemini
但是,搞 AI 就要保持开放和实践出真知的心态。第一批 Pro 用户上手之后,发现这个功能还挺好用,甚至可以说是惊艳。
是的,和 ChatGPT 免费可用的「搜索」功能不一样,Deep Research 目前只有每月 200 美元的 Pro 用户能上手,每月最多 100 次。不意外,OpenAI 的常规操作罢了。
先看看一些实操的案例,了解 Deep Research 究竟好用在哪吧。
收费十几万的专业团队,被这位 AI 咨询师平替了
OpenAI 政府市场推广员工 Felipe MIllon(X@Felipe_Millon),在发布前就提前用上了 Deep Research,但他可能宁愿不用。
他的妻子在去年 10 月查出乳腺癌,接受了乳房切除、化疗等一系列治疗,接下来的一个难题是,是否让妻子接受放疗。
Felipe 已经和几位肿瘤专家聊过,但专家们各执己见,没有明确的答案,他和妻子进退两难。事已至此,他决定问问 Deep Research,上传了一份病理报告,并写了一段提示词:
阅读包含双侧乳腺癌信息的手术病理报告。然后研究在基于乳腺癌类型的情况下,该患者在 6 轮 TCHP 化疗治疗后是否需要进行放疗。我希望了解该患者放疗的利弊,它在降低复发几率方面的可能性,以及其益处是否超过潜在的长期风险。
结果出乎 Felipe 的意料,Deep Research 不仅证实了他咨询的专家提到过的内容,还能更进一步,引用他从没听过的研究,并在他添加年龄、遗传因素等细节之后灵活地调整答案。他核实了每项研究,自觉都非常准确。
Felipe 接下来还会继续咨询专家,但 Deep Research 的回答,让他更有信心做出决定。这一刻,技术真正地服务于个人,「在我们最需要的时候,它给了我们心灵的平静」。
身体是革命的本钱,企业家、投资人 Siqi Chen(X@blader)也将 Deep Research 用在医疗咨询,他的反应比 Felipe 更加夸张,表示每月的 200 美元花得太值。
体验一天 Deep Research 之后,Siqi Chen 就上头了。他的女儿患有颅咽管瘤,他花了 15 万美元请了私人的研究团队,但在他看来,搭载 o3 大脑的 Deep Research,提供的价值已经超过了这笔重金。
同时,他也给 OpenAI 提了建议,他几乎订阅了所有主要的医学期刊,但 Deep Research 越不过付费墙,如果 Deep Research 能连接他的付费账号,直接访问原始论文,那么就锦上添花了。
Sam Altman 转发了 Siqi Chen 的动态并写道:「很高兴听到这个消息,期待很快能在 Plus/免费层级推出!」
从这两个例子看来,Deep Research 承担的是「私人顾问」这个角色,但它的能力不局限在医疗,X 网友 Patrice(X@PatriceBTC),向 Deep Research 咨询了复杂的税务问题。
他对最终的答案很满意,报告极其详尽,根据个人情况量身定制,比较了各项税务优化策略,甚至主动涉及了遗产规划,比他花高昂咨询费请教过的两位注册会计师更有用。
电影《瞬息全宇宙》里的杨紫琼,被税务问题搞得焦头烂额,但有了 AI,她或许就不会总和工作人员扯皮了。
互联网的噪音太多,让 AI 帮你挑挑拣拣吧
实话实说,AI 领域的新闻有时候真的让人跟不上,编辑累,读者也累。控制好自己的信息源,已经成了一门很有技术含量的技艺。
其实,新闻不一定自己亲自看。X 网友 Mckay Wrigley(X@mckaywrigley)灵机一动,让 Deep Research 帮他定制一份个性化的每日新闻简报。
他的提示词写得非常长,却几乎没有废话,包含了几个和 AI 沟通的重点,思路很值得我们学习。
首先,规定 Deep Research 的身份,一名专业的新闻分析师,在保持严格客观性的同时,提供全面、准确和相关的新闻报道。
然后,规定对新闻的具体需求。Mckay 介绍了自己的职业、兴趣和首选信源,同时,AI 对新闻的选取,应该考虑到全球和社会影响、兴趣相关性、时效性、新兴趋势和模式等。
甚至,怎么呈现每则新闻,Mckay 也有规定——使用精确中性的语言,以核心事实为先(新闻的 5W,谁、什么、何时、何地、为什么),如有定量数据应体现,注意相关的历史文化背景,突出关键的影响,将可验证的事实与主张分开,为所有观点引用具体的来源......
一通操作下来,Deep Research 给出的答案还算令人满意,Mckay Wrigley 形容,这就是一位不用睡觉又特别能干的分析师。
他也在考虑,把文字回答放进 Google 的 NotebookLM,这样就可以做成更容易消化的 AI 播客,在通勤路上听了。
做学术研究,Deep Research 是有模有样的
众所周知,Deep Research 可以生成很长的报告,这妥妥就是一个论文机器啊。至于生成的质量如何,虽然样本量不大,但大家的意见不是很统一。
X 网友 adi(X@adonis_singh),给 Deep Research 派了一个可能踩在 OpenAI 雷区的主题:分析 DeepSeek 的研发历史。
他给 Deep Research 的评价是,「专家级别的商业和技术分析,并做出了极好的推断」。
不过,也有持续关注 DeepSeek 的博主(X@bycloudai)出来「拆台」。
他仔细看了内容,认为 Deep Research 确实可以节省很多时间,但仍然存在问题,比如,没有提到数学大模型 DeepSeekMath,对冷启动数据的解释不够清楚。
一句话,质量不错,但不能和专业人类研究比肩,我们还是要做信息核查。
X 网友不鍊金丹不坐禪(X@zzwz),给 Deep Research 的研究主题非常冷门——分析元朝的纸币制度。
粗略看下来,结构和论述确实像一篇研究生论文,文中还有数据和表格,并用到了宏观经济学的统计方法,附上的参考文献也有板有眼。但我们毕竟不是经济学专业的,很难逐字逐句地检查错误。
教授 Ethan Mollick(X@emollick),直接把 Google 的同名功能作为参照系。
他认为,都叫 Deep Research,但 Google 的只是汇总了很多来源,OpenAI 的更像是一位接近博士水平的研究员,有主见又能听从指令,可以做到在文献中搜寻一个概念,并能应对各种问题。
总之,等到 Deep Research 推广开来,我们都可以拿自己更了解的话题试试 AI 的深浅。
选择困难症,也能被 AI 拯救
谁说,只能让 Deep Research 干「正事」了?生活里,我们也有很多时刻,需要处理大量的信息。
在发布 Deep Research 的直播中,OpenAI 研究团队的 Josh,现场实践了一个非常有趣的例子——匆忙来日本,忘记带滑雪板了,该买哪款滑雪板?
Josh 的提示词写得很简单,「我想买滑雪板,用于去日本滑雪。将其格式化为报告,并在末尾添加一个漂亮的表格」。
然后,重点来了,Deep Research 追问了几个非常重要的问题:
技术水平(初学者、中级、高级、专家)?
偏好的地形(平整雪道、粉雪、野雪、全地形)?
身高和体重(用于推荐滑雪板长度)?
预算范围?
品牌偏好?
Josh 一一回复,「高级滑雪者,偏好全地形滑雪,但有时也会滑粉雪。我个子高,所以需要长的滑雪板。还希望滑雪板有好看的配色」。
最终 Deep Research 最推荐的,正是他落在家里的同款。
放在以前,这些信息 Josh 可能要花一个下午研究,但 Deep Research 只花了 5 分钟,引用了 28 个信源,看了他也会看的网站,并整理好了格式,比起他自己搜索,这些信息更容易消化。
遇事不决,又想货比三家,下次就让 AI 帮我们做决定吧。
AI 变得更强,人的提问能力也要变得更强
从这些实测来看,Deep Research 的水平,接近专业的人类分析师和产品经理,兼具广度和深度、多样性和专业性。
还有一些没有放进来的例子,填报志愿的参考,某个赛道的竞品分析,查找某个研究主题的同类型论文,甚至找出某个印象模糊的电视剧,Deep Research 都能做得不错。
有个小问题值得一提:Deep Research 和推理模型 DeepSeek R1 不是平行的概念。
Deep Research 本质是基于推理模型 o3 的一个产品,按 OpenAI 的说法,这是一个 agent(智能体)。它弥补了之前 o1 推理模型不能联网的缺憾,适合用来生成长篇的研究报告,用途还是挺明确的。






请到「今天看啥」查看全文