专栏名称: 数读城事
和城市有关的数据运用与分享
目录
相关文章推荐
51好读  ›  专栏  ›  数读城事

kimi探索版提前体验,用来查找资料,有点儿强~

数读城事  · 公众号  ·  · 2024-10-13 13:28

正文

请到「今天看啥」查看全文


点这里 👇 关注我,记得标星哦~

天,提前体验一下kimi新功能 Kimi 探索版 目前每人每天可以使用 5 次

官方介绍 :Kimi 探索版具备 AI 自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮助你更高效地完成分析调 研等复杂任务

大模型火了之后,比较成熟的一个应用方向是AI搜索,像国外的perplexity的,国内的秘塔搜索,确实有很多人把大模型当作搜索引擎来用,所以一切看起来是顺理成章。

Kimi 探索版=大模型+搜索+cot(思维链)

核心理论思想来自于认知心理学中的系统1与系统2概念,由诺贝尔经济学奖得主丹尼尔·卡尼曼在其著作《思考,快与慢》中提出。快慢系统理论提供了一种新的视角来观察和理解人类的决策过程,展示了直觉和分析思维的交互作用。它揭示了人们在复杂情境中是如何平衡直觉判断与逻辑分析的,有助于理解在特定环境下人类行为的预测性和非预测性。

系统 1 这种思维模式是自动的、快速的、无意识的,通常基于直觉和经验,它所对应的是行为智能。类似于人类的快速直觉反应”。而深度学习在过去十年中所取得的巨大成功也不外乎此类范畴,其对应的也就是人类最初步的智能形式,行为智能。比如开车行为绝大时候都是系统1,1+1=2这种简单问题也是。

系统 2 则关注于模拟人类或其他高级生物的思考过程。这种类型的智能不仅仅是关于行为,而是更深入地涉及理解、推理、学习和适应,所对应的是认知智能。认知智能尝试复制人类大脑的工作方式,如信息处理、决策制定、问题解决和语言理解等方面。认知智能通常建立在行为智能的基础之上,并对行为智能所处理的道的信息进行简化和抽象,并在此基础上进行更加复杂的分析,推理等高级思维过程。

举个例子,做数学题、写代码、给老板做PPT这种属于系统2,难怪牛马这么累呢,感情是大脑在疯狂运转,在做规划和推理。

2023 年起以GPT系列为代表的LLM大语言模型使人类在创建通用人工智能AGI得这一目标上终于有了初步的进展。虽然LLM更多的还是依赖于深度学习技术来对输入输出进行拟合,但是如思维链(Chain of Thought)等新的技术范式的出现,代表了AI模型不再单单仅能对输入和输出进行映射,而是可以对 任务进行分析,拆解,再各个击破 ,这就很接近于人类在处理复杂需要思考问题时候的行为方式了。在最近Andrew Karparthy的演讲《给忙碌者的 LLM 入门》里面也有提到, 目前系统2是AI领域的研究重点,通过 CoT(思维链)甚至是 ToT(思维树)可以更容易实现系统 2 的能力。在之前的提示词文章介绍过 CoT(思维链)提示词 提示词工程实战:简单易懂的入门指南

在o1模型出来之后,对思维链和强化学习的讨论更多了,其本质上是为了提高推理能力,增强模型解决复杂问题的能力,在实际落地过程中,大模型的推理能力是最重要的。

话不多说,打开kimi,显示有探索版,代表官方给你推送了。

Kimi 探索版会借助模型能力,识别用户的真实提问意图,把复杂提问转换为多个匹配的搜索关键词,基于前一步的搜索结果来实时生成下一步的搜索关键词。

问题:前100名的中国地理信息公司,分别在哪儿上市,市值分别是多少,近期的涨跌情况

kimi把问题拆分成了(1)搜索前100名的中国地理信息公司名单(2)搜索每个公司上市地点、市值和近期涨跌情况  任务分解得很正确,整个规划、思考、搜索、最后回答,总共花了几十秒,可以明显看出确实是在思考的。

不带cot的大模型回答,时间很短,马上就能出答案。

阅读了208个网页,强

使用传统搜索引擎查询难搜的资料,会不断变化关键词,但这个过程终究是串行,只能搜完一个关键词,再搜下一个。Kimi 探索版则可以一次 并行搜索 几十个不同的关键词,筛选和阅读几百个权威的信息源。

同样的问题,使用perplexity搜索对比看看

可以看到,搜索出来的内容基本不全,也可能是对中文的支持不够好的原因。

再换几个问题试试

出了一点小插曲,kimi以为今年是2023年,不知道是不是系统提示词设定的原因

问题改成2024年,回答结果相当满意,还有引用

最近几个月,我把kimi从我的收藏夹移出去了,现在因为探索版,我需要重新使用起来

总结:

整体体验下来,kimi探索版的可用性非常高,没有广告,相比之下某度的搜索内容基本不能看了。

现在大家可以把kimi探索版当作搜索引擎用了,什么提示词技巧先到一边去,对着输入框就是无脑梭哈。

与其马上得到一个事实错误的结果 ,我更宁愿大模型花点时间好好想想,给我一个高质量的结果,不过这样模型规划、思考的时 间会变长,需要新的AI产品设计理念来契合。

要想产品好用,大模型真正落地,模型的推理能力就是最重要的

我粗略的看了下,搜索的网页是公开的,基本没有搜到公众号、小红书、短视频等平台的内容,现在优质的内容基本在各个平台内,这是AI搜索的一个隐忧,各个平台之间越来越封闭,要是可以搜索到各个平台的内容就好了。不过 淘宝都接 微信支付了,说不定呢

所以不管是模型训练还是搜索,语料或者说内容才是最重要的,估计马上其他厂商也要推出类似的功能了,到时功能差异性可能就体现在可以检索到的内容质量上了。

参考资料:

https://weibo.com/1409486097/5047098543964363

https://mp.weixin.qq.com/s/cRXe0HFO5BX0AzziaqoiKg







请到「今天看啥」查看全文