专栏名称: 玉树芝兰
思考教育、写作和互联网。 我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动。
目录
相关文章推荐
大数据分析和人工智能  ·  一款更适合小白的AI工具,强的可怕 ·  昨天  
CDA数据分析师  ·  Deepseek来袭,数据分析师会失业吗? ·  2 天前  
安全学习那些事儿  ·  国家公共数据资源登记平台将于3月上线 ·  昨天  
安全学习那些事儿  ·  国家公共数据资源登记平台将于3月上线 ·  昨天  
数据派THU  ·  记忆层增强的 Transformer ... ·  6 天前  
数据派THU  ·  294篇文献!浸大TMLR课题组最新综述:深 ... ·  3 天前  
51好读  ›  专栏  ›  玉树芝兰

最强思考 o1 Pro + 最佳搜索Perplexity 双剑合璧,能帮你做什么?

玉树芝兰  · 公众号  · 大数据  · 2024-12-13 08:26

主要观点总结

本文讲述了作者对于Google最新的量子芯片的看法和探索过程。作者通过利用AI搜索引擎Perplexity和o1 Pro进行信息获取和推理,发现两者各有优缺点。Perplexity能够查询资料但推理不够深入,而o1 Pro能够推理但缺乏最新知识的掌握。作者探讨了如何结合两者的优点,同时解决其缺点,以便更好地理解和评估量子芯片对计算复杂性的影响。

关键观点总结

关键观点1: AI搜索引擎Perplexity的特点和用途

Perplexity能够查询资料,但回答可能来自非主流或二手新闻来源,需要谨慎评估信息的可靠性。

关键观点2: o1 Pro的特点和局限性

o1 Pro具有强大的推理能力,但缺乏对新知识的了解,无法提供最新的信息。

关键观点3: 结合Perplexity和o1 Pro的优势

可以尝试结合Perplexity查询最新资料与o1 Pro的推理整合,以同时兼具“学”与“思”的策略,但需要解决信息精炼度不足和资料干扰性问题。


正文

(注:本文为小报童精选文章。已订阅小报童或加入知识星球「玉树芝兰」用户 请勿重复付费


享受你自己的「军师联盟」。

缘起

探索这个问题,起因来自知识星球上星友 Jcak 的提问。



Jcak 问道:

王老师,请问 Google 最新的量子芯片是不是标志着计算复杂性已经没有可研究的了?


其实当我看到这个问题时,立刻就意识到自己在量子计算和计算理论方面都并不擅长。我上研究生时,确实曾经学习过计算理论,但多年不用,也早已忘得差不多了。如果在从前,我会直接坦率承认说自己不会。


毕竟每个人的知识面都有限,不懂并不丢人。但这次情况着实特殊。


因为上午组会,我才刚向学生强调有了 AI 就不存在 「不会」 的借口。如果遇到不懂的问题,有 AI 搜索引擎可以帮忙查。直接问 AI 啊。

上午刚言之凿凿训导完学生,结果下午就不查询 AI 直接说「不会」,这似乎不够「知行合一」,哈哈。

于是,我决定借助 AI 搜索引擎来补足知识空缺。

尝试

我首先打开了 AI 搜索引擎 Perplexity,并把问题完整地抛给它:

Google 最新的量子芯片是不是标志着计算复杂性已经没有可以研究的了?

一如既往,Perplexity 的回答是先给观点。



之后,给出了支撑原因和相关论据来源。


Perplexity 的回答,暂不谈是否正确,我先要为你指出一个关键问题。

如果你用中文提问 Perplexity,它倾向于从中文信源中找资料。

不过,这些它常用的中文信源,并非总是主流期刊或官方媒体,而可能是转手多次的「二手」新闻来源。



虽然「二手」未必不准确。但回答严肃研究问题时,我们更希望获取一手信息来源。

至少在我们这个问题背景下,由于 Google 是美国企业,一手资料通常在英文资料中,而非多重转译后的中文内容里。

因此,我还是使用自己总结出来的技巧,对 Perplexity 提出明确要求:请从最新英文资料中查询,但用简体中文回答。



这样做能解决两个问题:

第一,它能从更原始的一手英文新材料获取信息。

第二,它用中文回答,确保你能读懂,而不必直接面对英文答案。


再次询问后,Perplexity 的回答果然不同。


它提到了突破性的成就,并列出 BBC、NY Times、Fox Business 等更直接的英文信源。


这是不是比使用中文二手、三手来源更接近事实本源?

可惜,查看 Perplexity 的回答后,我发现一个新问题。

它列出了工程挑战、错误率、应用范围,却没有将量子芯片进展与计算复杂性理论的研究空间变化深度关联。看似靠谱,其实「所答非所问」。


看来 Perplexity 擅长事实性回答,对推理、逻辑严谨论证仍有局限。因为尽管 Perplexity Pro 拥有 “工作流反思” 方式,但背后应用的大模型在推理上仍然不够理想。

问题来了,有没有更擅长推理的模型呢?

推理

答案是有的,就是 o1 及其强化版 o1 Pro 。

上周 OpenAI 在万众期待中,「千呼万唤始出来」总算推出 o1 正式版与 o1 Pro 进阶版本。从下图中,你不难看出,o1 正式版在思考推理方面胜过此前的顶流推理思考模型 o1 Preview 版本。


而 o1 Pro 更加强大,比起 o1 更进一步提升了推理与逻辑能力。

当然了,价格也很感人。







请到「今天看啥」查看全文