今
天,提前体验一下kimi新功能
:
Kimi 探索版
。
目前每人每天可以使用 5 次
官方介绍
:Kimi 探索版具备 AI 自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮助你更高效地完成分析调
研等复杂任务
。
大模型火了之后,比较成熟的一个应用方向是AI搜索,像国外的perplexity的,国内的秘塔搜索,确实有很多人把大模型当作搜索引擎来用,所以一切看起来是顺理成章。
Kimi 探索版=大模型+搜索+cot(思维链)
核心理论思想来自于认知心理学中的系统1与系统2概念,由诺贝尔经济学奖得主丹尼尔·卡尼曼在其著作《思考,快与慢》中提出。快慢系统理论提供了一种新的视角来观察和理解人类的决策过程,展示了直觉和分析思维的交互作用。它揭示了人们在复杂情境中是如何平衡直觉判断与逻辑分析的,有助于理解在特定环境下人类行为的预测性和非预测性。
系统 1 这种思维模式是自动的、快速的、无意识的,通常基于直觉和经验,它所对应的是行为智能。类似于人类的快速直觉反应”。而深度学习在过去十年中所取得的巨大成功也不外乎此类范畴,其对应的也就是人类最初步的智能形式,行为智能。比如开车行为绝大时候都是系统1,1+1=2这种简单问题也是。
系统 2 则关注于模拟人类或其他高级生物的思考过程。这种类型的智能不仅仅是关于行为,而是更深入地涉及理解、推理、学习和适应,所对应的是认知智能。认知智能尝试复制人类大脑的工作方式,如信息处理、决策制定、问题解决和语言理解等方面。认知智能通常建立在行为智能的基础之上,并对行为智能所处理的道的信息进行简化和抽象,并在此基础上进行更加复杂的分析,推理等高级思维过程。
举个例子,做数学题、写代码、给老板做PPT这种属于系统2,难怪牛马这么累呢,感情是大脑在疯狂运转,在做规划和推理。
2023 年起以GPT系列为代表的LLM大语言模型使人类在创建通用人工智能AGI得这一目标上终于有了初步的进展。虽然LLM更多的还是依赖于深度学习技术来对输入输出进行拟合,但是如思维链(Chain of Thought)等新的技术范式的出现,代表了AI模型不再单单仅能对输入和输出进行映射,而是可以对
任务进行分析,拆解,再各个击破
,这就很接近于人类在处理复杂需要思考问题时候的行为方式了。在最近Andrew Karparthy的演讲《给忙碌者的 LLM 入门》里面也有提到,
目前系统2是AI领域的研究重点,通过 CoT(思维链)甚至是 ToT(思维树)可以更容易实现系统 2 的能力。在之前的提示词文章介绍过
CoT(思维链)提示词
提示词工程实战:简单易懂的入门指南
在o1模型出来之后,对思维链和强化学习的讨论更多了,其本质上是为了提高推理能力,增强模型解决复杂问题的能力,在实际落地过程中,大模型的推理能力是最重要的。
话不多说,打开kimi,显示有探索版,代表官方给你推送了。
Kimi 探索版会借助模型能力,识别用户的真实提问意图,把复杂提问转换为多个匹配的搜索关键词,基于前一步的搜索结果来实时生成下一步的搜索关键词。
问题:前100名的中国地理信息公司,分别在哪儿上市,市值分别是多少,近期的涨跌情况
kimi把问题拆分成了(1)搜索前100名的中国地理信息公司名单(2)搜索每个公司上市地点、市值和近期涨跌情况 任务分解得很正确,整个规划、思考、搜索、最后回答,总共花了几十秒,可以明显看出确实是在思考的。
不带cot的大模型回答,时间很短,马上就能出答案。
阅读了208个网页,强
使用传统搜索引擎查询难搜的资料,会不断变化关键词,但这个过程终究是串行,只能搜完一个关键词,再搜下一个。Kimi 探索版则可以一次
并行搜索
几十个不同的关键词,筛选和阅读几百个权威的信息源。
同样的问题,使用perplexity搜索对比看看
可以看到,搜索出来的内容基本不全,也可能是对中文的支持不够好的原因。
再换几个问题试试
出了一点小插曲,kimi以为今年是2023年,不知道是不是系统提示词设定的原因
问题改成2024年,回答结果相当满意,还有引用
最近几个月,我把kimi从我的收藏夹移出去了,现在因为探索版,我需要重新使用起来
总结:
整体体验下来,kimi探索版的可用性非常高,没有广告,相比之下某度的搜索内容基本不能看了。
现在大家可以把kimi探索版当作搜索引擎用了,什么提示词技巧先到一边去,对着输入框就是无脑梭哈。
与其马上得到一个事实错误的结果
,我更宁愿大模型花点时间好好想想,给我一个高质量的结果,不过这样模型规划、思考的时
间会变长,需要新的AI产品设计理念来契合。
要想产品好用,大模型真正落地,模型的推理能力就是最重要的
我粗略的看了下,搜索的网页是公开的,基本没有搜到公众号、小红书、短视频等平台的内容,现在优质的内容基本在各个平台内,这是AI搜索的一个隐忧,各个平台之间越来越封闭,要是可以搜索到各个平台的内容就好了。不过
淘宝都接
微信支付了,说不定呢
所以不管是模型训练还是搜索,语料或者说内容才是最重要的,估计马上其他厂商也要推出类似的功能了,到时功能差异性可能就体现在可以检索到的内容质量上了。
参考资料:
https://weibo.com/1409486097/5047098543964363
https://mp.weixin.qq.com/s/cRXe0HFO5BX0AzziaqoiKg