专栏名称: 歸藏的AI工具箱
产品设计师🎨 AI画图工具操作员🔧 AI课程撰写与信息收集整理📰 致力于发掘借助AI工具改善设计与产品开发流程的各种可能性🤔
51好读  ›  专栏  ›  歸藏的AI工具箱

智谱再发大杀器-基于思维链的AI搜索体验

歸藏的AI工具箱  · 公众号  · 科技自媒体  · 2024-10-11 22:27

正文

试了一下智谱新发布的基于思维链的AI搜索,有点🐂🍺的。

前几周Open AI 发布O1和O1 mini之后,基本上大家都看到了思维链和模型推理能力的价值,思维链对于事实核查以及复杂问题的解决有非常大的作用。

而这类解决方案除了帮助科学家和开发者之外,离普通用户最近的需求就是搜索了,推理能力和长文本阅读可以大幅解决之前AI搜索的幻觉问题。

另外可以对搜索结果进行复杂总结给出更深入和准确的结果,节约整理和一定的逻辑推理成本。

智谱发布了他们新的 AI 搜索智能体,支持深度阅读网页内容,整理之后进行类似 COT 的深度推理。

深度推理可以根据用户的问题进行联网搜索,不仅可以一次性搜索和总结大量网页;更能够拆解用户的问题,进行多次搜索和推理,从而得出正确答案。

这一思维过程很像人类的思考模式,集合了搜索、判断、整理等复杂过程。

具体的能力有:

可以支持单次阅读超过100多个网页,针对用户的问题,清言可以在数秒内同时检索超过100个网页,阅读并总结,用时仅为人类用户的1‰。

支持多级推理的思维链;能够解决日常生活中绝大多数的困难问题。

可以联动智谱其他的AI工具,比如在联网搜索和多级推理中,清言还能够调用python等工具,综合解决问题。

来看看测试

相对负责的推理就是数学计算了,加上搜索更如虎添翼,可以直接查找数据之后对数据进行计算和预估,这个很强大,写研报和各种文档的利器。

比如下面这个问题“一个普通苹果的平均卡路里含量。如果一个人每天需要摄入2000卡路里,吃5个苹果大约占每日所需卡路里的百分之多少?

模型需要先检索苹果的卡路里含量,然后还需要进行一些相对复杂的计算。

智谱阅读了多个网页核实了常见的苹果卡路里含量确保没有幻觉,然后还自己写了详细的计算公式调用代码进行计算。

一个回答使用了多种能力。

推理的另一个好处是你可以询问多个复杂的嵌套问题,比如你不知道第一个问题的答案,但是除了第一个问题还需要对应后续其他问题的答案,就不需要一个一个搜索,只要给出相关全部问题它全部都可以回答。

比如下面这个问题“谁发明了在第二次世界大战中起关键作用的密码破译机,这个发明者后来对计算机科学做出了什么贡献,他的工作如何影响了现代人工智能的发展?

模型需要查找出图灵之后,继续检索他的主要成就和贡献,还得根据这些内容发散出对未来的影响,也考验了模型的创造性。

智谱 AI 搜索智能体还可以调用本省的代码模型实现相对复杂的功能,比如这里这个问题“a股历史上都有几次牛市,每次数据如何 有什么相关政策事件,列个表格说明,最后绘制一张柱状图来表达趋势

这个问题需要检索的页面数量非常多,而且需要很深入的把A 股近几十年的报道全部看一遍获取关键内容,这一步就很难了。而且需要以表格的形式展示,很符合日常工作需求了。

柱状图生成对模型的代码能力是个很大的考验,代码能力强的国产 LLM 其实不多的。

另外类似的案例比如“联网查询数据,对比分析中国电影股份有限公司和英皇电影集团近5年的市场占有率,并预估接下来5年的发展情况,最后调用工具制作折线图呈现

对于行业分析这玩意是真的厉害,24年的市场占有率即使没有公布智谱也给出了可以推断的的类似信息。

还给出了用于对比的折线图,非常直观的看到了两者在市场占有率上的变化,也是看到了英皇电影在内地发力后市占率提高的速度,一篇简短的调研报告润色一下就可以出炉了。

藏师傅自己的名字其实是一个误导性很强的名字,由于本身是连山、归藏、周易三易之一,所以只要一搜索大部分 AI 搜索都会拉跨,藏师傅又没那么知名所以不会有模型单独进行优化。

这里我问了一下他 “AI 领域的归藏是谁” 看一下他意图识别的能力怎么样,没想到它把我的几个主页都搜出来了,还对以往内容做了总结。

从智谱和其他海外相关产品的进度来看,AI 产品除了模型本身的推理能力之外,工程整合能力也越来越重要,搜索这个事情越来越跟人们认知中的传统搜索不太一样了。

原始的页面链接和内容存在感越来越低、实现的任务越来越复杂,连 Open AI 在内测的搜索功能都加入了 O1 的支持,明显也看到了推理能力在信息整合上的价值。

再结合前段时间 NotebookLM 音频模态的加入,信息检索在整合这个事情还会有更多的发展和发散路径,以后这东西是不是还能被叫搜索就不好说了。

智谱“AI搜索”智能体已经正式上线,感兴趣可以试试https://chatglm.cn/main/gdetail/659e54b1b8006379b4b2abd6?lang=zh[1]

References

[1]https://chatglm.cn/main/gdetail/659e54b1b8006379b4b2abd6?lang=zh