Perplexity 放大招了,发布自己的 Deep Research 能力
把 Humanity’s Last Exam 测试刷到了 20.5% 的成绩
超过了现在发布的所有模型,仅次于 OpenAI 的 Deep Research
而且这玩意是免费提供的! #AI创造营# #ai#
工作原理:
研究推理——Perplexity 的深度研究模式配备了搜索和编码功能,能够迭代搜索、阅读文档,并推理下一步行动。
报告撰写 - 一旦源材料被全面评估,代理人将所有研究综合成一份清晰而全面的报告。
导出与分享 - 可以将最终报告导出为 PDF 或文档,或将其转换为 Perplexity Page 并与同事或朋友分享。
测试得分:
Humanity’s Last Exam 上达到了 20.5%的准确率,显著高于 Gemini Thinking、o3-mini、o1、DeepSeek-R1 等众多领先模型。
在 SimpleQA 基准测试中,Perplexity Deep Research 以 93.9%的准确率远超领先模型的性能,该测试包含数千个用于检验事实性的问题。
Perplexity Deep Research在完成大多数研究任务时仅需不到 3 分钟
把 Humanity’s Last Exam 测试刷到了 20.5% 的成绩
超过了现在发布的所有模型,仅次于 OpenAI 的 Deep Research
而且这玩意是免费提供的! #AI创造营# #ai#
工作原理:
研究推理——Perplexity 的深度研究模式配备了搜索和编码功能,能够迭代搜索、阅读文档,并推理下一步行动。
报告撰写 - 一旦源材料被全面评估,代理人将所有研究综合成一份清晰而全面的报告。
导出与分享 - 可以将最终报告导出为 PDF 或文档,或将其转换为 Perplexity Page 并与同事或朋友分享。
测试得分:
Humanity’s Last Exam 上达到了 20.5%的准确率,显著高于 Gemini Thinking、o3-mini、o1、DeepSeek-R1 等众多领先模型。
在 SimpleQA 基准测试中,Perplexity Deep Research 以 93.9%的准确率远超领先模型的性能,该测试包含数千个用于检验事实性的问题。
Perplexity Deep Research在完成大多数研究任务时仅需不到 3 分钟