张鹏:从你创业以来,咱俩去年做过一次直播,到今天又过了大半年的时间,你自己怎么评价 Kimi 的发展,给自己的团队、公司、产品打多少分?
杨植麟:
对,确实时间过得很快。我估计有个 60 分。
从我们的视角来看,这个行业整体肯定还是一个马拉松。技术发展可能会相对快一些,但是如果看整体技术的普及,包括整个产品和商业化,我觉得肯定是需要从 10 年到 20 年的维度来看这个事情。
过去一年的时间,我们基本上做的一个事情是去探索早期的 PMF(Product Market Fit),然后在技术上迭代了一些模型的进展,使得这个模型能够更好地服务用户的需求。
但我觉得同时可能也还有很多挑战,这里面最关键的还是,比如 Scaling Law 今天还是非常早期,可能还要去看怎么能够 Scale 到下一代模型、下下代模型,通过这个东西在产品上能够形成更强的 PMF,真正能够在每个人的工作和生活中有更高的渗透。我觉得这个其实还是有非常多的挑战,可能是一个更长期的东西。
张鹏:相对来讲,你是入场比较晚的,但是我们从外界感知到的是你提速很快、现在声势很好。你觉得有什么做得比较成功的东西?能到今天这个客观的效果,你认为哪件事的选择是比较对的?
杨植麟:
特别好的问题。我觉得严格意义上来讲,肯定不能说是非常成功或者怎么样,可能有一些小的起步。
这里面我们持续关注的东西,同时现在也在持续优化的东西,还是希望真正从底层出发去解决问题,真正关注第一性原理。就像比如说 Personal Computer 行业的基础假设是摩尔定律,我觉得 AI 行业的基础假设还是规模化定律——Scaling Law。
如果我们从 10 年的视角去看这个问题,我觉得更多还是:怎么能够从技术和模型的效果上持续优化,然后在这个过程中形成更强的 PMF。所以很多动作会从这个出发点开始,去规划到底要做什么东西。我们希望最大的投入,还有时间、精力应该是放在,怎么能够迭代出更好的模型,从而解锁更多的场景,这可能是我们最关注的东西。
当然它可能也意味着聚焦,在技术和产品上可能我们都希望更加聚焦,比如我们现在更多会聚焦面向知识工作者,比如学术科研人群、互联网从业者、内容创作者、金融分析师、法律等人群的生产力场景上,已经成为几千万知识工作者搜索资料、分析文件和创作内容的助手,生产力之外的场景现在暂时不会做特别多,因为你如果什么东西都做了,可能最后也很难做好。
张鹏:这件事也是有 trade-off 的,要做一些取舍。
杨植麟:
对,我觉得创业公司还是要有比较明确的重点。比如我们可能就是针对生产力场景去做非常极致的优化,很多时候产品上看起来都是一个框,好像没有发生什么变化,但背后的很多体验其实已经优化了很多,当然现在肯定还有很多很多的空间。
在这个取舍的过程中,很多时候就意味着需要砍掉一些东西,不是所有东西都要做,因为我觉得组织的惯性还是想做越来越多的东西,我们可能就是要去对抗这个地心引力,希望做更少的东西,但是把它做到极致。
包括在技术上也是,AI 空间很大,因为智能本身是一个非常 heterogeneous(异质性),就是非常异构的东西。一个会计师的智能,跟一个画家的智能、跟一个数学家的智能,完全不一样。在这里面,我们也会根据核心用户群体去看,到底什么样的智能可能是现在的重点,它对应的基础能力可能是什么?然后可能更聚焦地去做这个事。
张鹏:如果把一件事儿能做到今天这个效果,可能比较重要的原因是因为你比较聚焦,选择了生产力这个维度。在 trade-off 的过程中,比如现在陪聊的产品方向你肯定也看过,甚至团队有讨论过,你最终选择不做它,背后的逻辑是什么?
杨植麟:
对,我们确实讨论过这个问题,最主要可能有几个点,一个是考虑到底我们最后想做的是什么?因为想做的是通用的智能。
最终闲聊的场景和生产力场景,我觉得大概率会结合在同一个产品里面,只是在路径选择上会不一样。我们先做生产力的原因是,生产力对于智商的提升更快,今天如果去做一个类似 Character.ai 这样的产品,绝大部分精力并不是在优化智商,因为优化智商对提升产品留存可能帮助不大。但如果做生产力的话,优化智商之后,你的留存能看到显著的提升。
公司的 mission 跟产品的 roadmap(路线图)之间,应该能够更紧密地结合起来,这是很重要的一个原因。
当然可能也有其他原因,比如说我们也观察了美国市场的不同选择、发展情况,美国市场整体来说比中国市场领先一两年,所以我们可以去看不同公司的发展情况。把生产力做特别好的公司,今天不管是从业务体量,还是从融资和人才吸引力来说,它其实都是更好。
还有一个很重要的原因,我觉得娱乐场景今天的(产品)基线非常高。过去十年移动互联网的发展,诞生了一堆非常好的娱乐体验的产品,但是在生产力这个维度的基础体验或者说价值,还有非常大可以挖掘的空间。即使说今天最好的生产力产品,我觉得它其实还没有非常深入地渗透到真正的工作流程里,而且这是 AI 能带来的巨大新变量,所以这可能是为什么我们会做这样选择的重要原因。
Kimi 的目标是
你的终极伙伴
张鹏:怎么定义 Kimi 这个产品?它在解决什么问题?长期来看,是一个 AI 工作台还是什么?
杨植麟:
这个我觉得可能是分短期和长期来看,短期希望在生产力场景能够提供越来越多的智能。大家今天一些最主要的任务,比如更好的信息获取、信息分析、创作等,我们希望它能发挥更大的价值。
最长期最理想的情况,本质上是在讨论 AGI 产品的终极形态或者终极定义是什么样的。其实大家有讨论,我觉得现在可能有两种不同的观点。
一种是,它是世界上另一个我,它拥有你所有的输入,想法基本跟你一样,等于是复刻了一个自己,「另外一个自己」可以在数字世界,甚至物理世界做很多事情。
另外一种定义是,它可能是你的一个伙伴,一个长期、甚至接近终生的伙伴,这个伙伴也能帮你做很多事情,但是它可能会跟你不一样,会给你提出来新的视角,并不是完全复刻你,而是可能有点像。
张鹏:它理解我,而不是复刻我。
杨植麟:
非常理解你。我现在觉得可能第二种的概率更大,所以这可能是我们想做的东西。
我觉得它会有几个比较重要的特征。
第一个我觉得它还是先得有用,就是你能做越来越复杂的事情。我觉得今天能做的事情还不够多,这也是为什么我们现在最聚焦的还是去进一步提升模型的能力。因为只有通过提升模型的能力,才能让它去做更多的事情。
把它类比为一个人的话,其实还缺少非常多的维度。它可能没有记忆,没有办法做长期的规划。在我的想象中,如果这个产品做得好的话,它不是只能完成这种 10 秒、20 秒就能完成的任务,而是说你能够让它定一个季度的 OKR,它可以自己去完成。
然后第二个重要特征,我觉得还是AI和人之间能够建立非常长期的信任和 connection。但这个的前提还是第一步,就是它得足够有用。如果 AI 每天给你 hallucination(幻觉)、给你很多错误的结论,信任也很难建立。我觉得只有在越来越复杂、长窗口的任务里提供真实性和准确性,才能够建立信任。
所以我们会从这些方面去考虑产品。
张鹏:从这个角度来说,我们今天看到的可能只是一个产品的初级形态。这也解释了我们为什么可以看到产品里有不同新的功能,本质上你在努力赢得在用户身边更有用的位置。这种位置未来会是从一部分能干的事逐渐扩展到越来越多,这可能是个路径。
杨植麟:
我觉得这里面有一个重要的标志,就是如果有一天你发现在你的工作里 AI 做的事情比你多了,也就是说 AI 占比超过 50% 了,可能会是一个非常重要的 milestone。
可能下一个 milestone 就是机器人的数量超过人类,但那是在物理世界,我觉得数字世界会更早实现。
张鹏 :所以我很好奇一个问题,从月之暗面 Kimi 的角度去看,今天有一个很成功的产品大家都在用,未来可能也会有新的功能解决用户更具象的问题。你会更倾向于都在 Kimi 这个平台解决,还是会有机会长出其他更专有的 APP?
杨植麟:
我们肯定还是会很聚焦地,只做 Kimi 这一个 app。因为有一个很重要的点是,未来的智能产品,它应该满足普世的需求。就像我刚刚说的,娱乐的需求,或者生产力的需求,甚至这两个东西可能也没有特别明确的边界。
我觉得他们应该是在同一个产品里的,只是路径选择上会有区别。这也是我认为通用智能最有意思的地方,它不是只能做一件事。但只是说在路径选择上肯定没有办法在一开始就做所有的事情,一开始还是会有重点的场景、核心的用户群体,然后逐渐去泛化开来。
所以我们还是希望聚焦做一个产品,然后把这个产品做到极致。
张鹏:听起来 Kimi 要能达到你刚才说的终极目标——一个理解用户的伙伴,首先的起点是从先帮用户做好一两件事情,然后逐渐能做越来越多的事情,然后这个伙伴的关系和信任就建立了。这是一个前进的世界观和路线图。
杨植麟:
是的。我觉得这中间很重要的一个标志,就是 AI 可以从单个的、具体的任务,发展成能完成一个人要花几周才能做好的任务,也就是全方位的 Super Intelligence。
现在的 AI 其实可以实现一部分的 Super Intelligence,比如阅读长文本。人没有办法一下读完几百万字的文章、直接找到问题的答案,因为很多问题没法通过「查找」得到答案。这是我们一开始踩过的坑,就是找了一堆人标注长文本的数据,认为标注完了人就学会了。但你发现其实人根本标注不了,或者效率非常非常低。
所以今天 AI 有一部分的能力比人更好,我们需要的就是让这个范围逐渐变大。
长文本本质是
「长推理」
张鹏:正好谈到了长文本,这也是 Kimi 一开始让大家印象深刻的一个点,甚至在那个时候月之暗面可能比较非共识的提出来这件事很重要。我们也看到很多的模型支持的文本长度在变长,这件事未来是不是已经逐渐形成共识?另外长文本对于解决你说的那个终极的问题,是不是最重要的路径?
杨植麟:
特别好的问题。今天确实有很多人在做长文本,但如果说是完全的共识,其实我也不是非常确定。也有不同的观点,比如说认为短文本的场景下也有很多可以挖掘的东西,可能不一定要非常着急去做长文本。
但我觉得这个也是正常的,因为每一个公司本身都有自己的判断。对我们来说,我们其实比较早认为长文本可能是一个非常关键的东西,这里面有几个方面:
第一方面就是说,如果我们想让 AI 从完成一两分钟的任务变成完成长周期的任务,那必然要在一个很长的 context 里,才有可能真正把 AI 进一步往下推进。
但这是一个必要不充分条件,具备了很长的 context 能力后,可能还需要很强的推理能力,之后你可以有更长的 context……我觉得它有点像螺旋迭代的过程。
可能更准确的说法叫长推理,就是你能够在一个很长的窗口下面去做很好的推理,我觉得这个是最终能产生很大价值的。
张鹏:就是它最终其实是跟用户在做数据的输入、指令的输入和最终交付服务的转换比的计算,转换比越高,带来的价值就越高。
杨植麟:
对,这个确实很有意思。比如,即使只看长文本这个技术,它的落地过程也是一个比例逐渐提升的过程。
因为在最早期的时候,就是用长上下文去做一些阅读类任务。阅读类任务肯定是最早落地的,因为它是一个从很多的信息变成很少的信息的过程,相对会容易一些。
比如让 AI 读 10 篇文章,然后形成总结。这个难度肯定小于我只给 AI 一个很简单的指令,但是要一口气做一个月,并且最好还要满足用户的需求。
这确实是个比例的问题,就是输入和输出的比例,它可能是更本质的东西。
张鹏:理解了,你觉得未来长文本的成本会快速下降吗?因为现在真的把 200 万 token 扔进去跑一圈,成本还是蛮高的,而且这又跟长文本应用在哪些场景、能否高价值地解决问题有关,这两个问题其实是绑定在一起的,你怎么看?
杨植麟:
我觉得成本的持续下降肯定是个必然趋势。最近我们有一些新技术,一方面是一些工程上的极致优化,比如 context caching(上下文缓存)技术。另一方面,我们在架构上也做了很多优化。这能够让成本在现在的基础上,下降甚至不止一个数量级。
所以如果是 200 万字的窗口、并且能够让大部分人普惠地用起来,我觉得这是一个大概率能在今年实现的目标。
张鹏:今年就可以做到吗?
杨植麟:
对,我觉得这是我们的目标。在接下来很长一段时间内,成本会持续降低、而且速度会比 short context(短文本)更快。
今天还有很多东西是没有被挖掘的。比如说,如果考虑一个人处理一个很长的记忆、或长周期的任务,他其实并不需要记住所有东西,对吧?它是一个动态计算的过程,你可以选择哪些东西要记下来、哪些要扔掉,这里面有非常大的优化空间。
而今天 AI 的效率远远高于人类,所以它的优化空间很大,整体成本降低的速度会比短文本更快。