专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
格上财富  ·  广东成立新机构,信号强烈 ·  2 天前  
简七读财  ·  过去100年,这类资产更赚钱 ·  2 天前  
曾星智中线投资  ·  只赚不亏:长线投资成功的关键 ·  2 天前  
曾星智中线投资  ·  只赚不亏:长线投资成功的关键 ·  2 天前  
格上财富  ·  英特尔,偶像的黄昏 ·  4 天前  
格上财富  ·  一个人最大的不靠谱,是沟通没有形成闭环 ·  3 天前  
51好读  ›  专栏  ›  歸藏的AI工具箱

Perplexity 放大招了,发布自己的 Deep Resea-20250215094156

歸藏的AI工具箱  · 微博  ·  · 2025-02-15 09:41

正文

2025-02-15 09:41

Perplexity 放大招了,发布自己的 Deep Research 能力

把 Humanity’s Last Exam 测试刷到了 20.5% 的成绩

超过了现在发布的所有模型,仅次于 OpenAI 的 Deep Research

而且这玩意是免费提供的! #AI创造营# #ai#

工作原理:
研究推理——Perplexity 的深度研究模式配备了搜索和编码功能,能够迭代搜索、阅读文档,并推理下一步行动。
报告撰写 - 一旦源材料被全面评估,代理人将所有研究综合成一份清晰而全面的报告。
导出与分享 - 可以将最终报告导出为 PDF 或文档,或将其转换为 Perplexity Page 并与同事或朋友分享。

测试得分:
Humanity’s Last Exam 上达到了 20.5%的准确率,显著高于 Gemini Thinking、o3-mini、o1、DeepSeek-R1 等众多领先模型。
在 SimpleQA 基准测试中,Perplexity Deep Research 以 93.9%的准确率远超领先模型的性能,该测试包含数千个用于检验事实性的问题。
Perplexity Deep Research在完成大多数研究任务时仅需不到 3 分钟






请到「今天看啥」查看全文