嘉宾:英诺天使基金合伙人 王晟
英诺天使基金成立于 2013 年 4 月,已投创业项目达500+,投资管理团队平均有10年+经验,管理基金规模数十亿人民币,重点关注新一代信息技术(人工智能/半导体)新能源新材料、生命科技、先进制造(机器人/航空航天)等领域。王晟先生是中国最早的互联网从业者之一,曾就职于瀛海威、搜狐,发起创办多家互联网企业,成功融资及被收购,现任英诺天使基金合伙人。
话题:
1、如何评价DeepSeek R1这次在全球的出圈?
2、从产业角度,DeepSeek大模型的一些创新对于国内AI产业会带来哪些影响?
3、在2024年,大家都说模型的战争已经结束了,但DeepSeek超出了大家的预期,如何看待未来模型的格局?
4、一级市场当前比较关注的AI领域的投资方向?
5、Q&A
观点来自专家,不代表东吴证券研究所观点,转载请联系团队:张良卫/周良玖(18627087962)
正文
1、如何评价DeepSeek R1这次在全球的出圈?
DeepSeek在模型上做的是比较好,最重要的特点是以非常小的一个训练成本和代价取得了比较好的效果。我们不能认为V3和R1两个模型的上限超过了OpenAI和Anthropic,但重要的是,DeepSeek在工程上的创新使得他训练模型的成本得到了极大的优化,这次没有讲R1的训练花了多少钱,但V3前面论文的披露是接近600万美金一次,R1的成本估计也不高。所以最重要的DeepSeek的成绩是,用几十分之一的成本,取得了媲美海外巨头的模型的成绩。
我个人不认为,R1的模型的上限会超过O系列模型的上限,因为大家应用的技术的思想还是有些不一样的,这里面是有些取舍的。R1直接采用了强化的方法做了数据的冷启动,但是O系列模型采用了蒙特卡洛树搜索加过程奖励的这种方法,这种方案设计起来其实比较困难,整体的计算量也比较大,但是它的上限理论上也会非常高。
成本的极大优化对老外影响很大,DeepSeek展现出的模型能力和性价比,打动了美国社会。对于OpenAI、Anthropic这种巨大投入的公司都带来了巨大的冲击,因为他们就是巨大的资本密集型模型,需要资本不断下注,但是出现了DeepSeek以极高性价推出模型的方式,虽然他的模型没有做到最顶级,对于这些头部初创公司、资本、英伟达都带来了冲击。
2、从产业角度,DeepSeek大模型的一些创新对于国内AI产业会带来哪些影响?
DeepSeek在业内一直备受关注,我们此前接触了大量非基座模型的AI企业,他们大部分都是会把模型进行微调,进行使用或者做调用,来解决产业的问题的。基本上我经常会问他们对于大模型的看法,进入2024年后,他们很多都认为DeepSeek的模型已经会比其他初创模型要好,此外还有阿里的通义千问、字节的豆包也是一直被认为处于比较领先的位置,豆包最近的成长比较快。
对产业的影响:我们的模型智能水平离OpenAI、Anthropic还有差距,V3和R1使得这一差距在显著的缩小,给AI的使用者提供更好的智能的能力,以更好的解决客户的问题,当然最最重要的是便宜。去年最先降价的也是DeepSeek,后面豆包、通义就纷纷开始降价,DeepSeek起到了一定的
鲶鱼效应
,这些都非常有助于产业部署和实施以及AI创新,今年一级市场投资人也是很看重应用的,而不仅是基础设施和模型。
3、在2024年,大家都说模型的战争已经结束了,但DeepSeek超出了大家的预期,如何看待未来模型的格局?
23年5月份之后,这场战争就已经结束了,我刚才回答第一个问题的时候就讲过,这不仅是一个人才的竞争,也是一个高度依赖资本开支的竞争,所以不会投那么多的基座模型公司。所以当时一级市场的看法是,23年5月之前没有拿到大钱的公司,可能就没有机会了。现在的六小龙就是这么个情况,但这个里面的异类是DeepSeek,DeepSeek是市场上唯一一个没有融钱的初创公司。现在的市场,格局也没有什么变化,纯从多模态大语言基座模型这个角度来讲,整个模型的格局我也不认为会发生变化,DeepSeek肯定是在初创公司里面很领先的,但是DeepSeek往下能不能打得过字节豆包、通义不好说。
我们要讲一个新的很重要的模型的深刻变化,从OpenAI的4o到o1,以及DeepSeek v3到r1,这里面有一个极其重要的变化,就是从预训练转到后训练。过去预训练都是基于经验、知识再加上概率的模型。但是O3和R1不是,他是后训练的,是基于逻辑、推理、决策的。这是两个不同的智能范式,一个是经验知识的,一个是逻辑推理的,未来的模型会变成每一个垂直领域,或者产业领域,产业领域的思维和决策模型不再像知识模型那么容易泛化,针对特定领域训练一套决策逻辑,只能应用到这个产业里面,因此我们认为,模型里面还会出现很多的变数。
4、一级市场当前比较关注的AI领域的投资方向?
1)agent,agent就是应用的一种。过去创造出来的都是工具,未来我们和这个世界打交道主要都是通过agent,他自己会去使用工具。agent我们之所以这么关注他,主要是O1这个新范式出来,如果没有决策智能出来,永远不会出现好的agent,所以这个是今年的重点。
2)智能硬件,我觉得智能硬件最重要的就是智能眼镜。眼睛这个位置是人类能够接触到的最多信息的位置,通过眼镜,所以的输入输出他都掌握了,所以,对于一个智能设备和人有一个同场感。这个是手机做不到的。所以眼镜是未来最重要的新一代计算设备。
3)具身智能,但是具身智能还是处于相当早的阶段,这两年的进步速度比较快,看今年会不会取得一些突破。一个在于高质量的数据从哪儿来,另一个就是具身智能的整体的技术范式到底往哪个方向去,我们过去看到了很多的范式进化,所以具身智能能不能再今年找到更好更明确的技术范式,同时获取更高质量的海量的数据,是非常值得关注的方向。
Q:2023年5月以后,大模型创业已经结束,那么其他大模型的创业公司未来的出路在哪儿?他们去做应用是否具有优势?
我觉得优势还是很大的,从今天这个时点来看,哪怕最新的
开源模型
,其实对普通的创业者仍然是不友好的,我们可以联想互联网时代和移动互联网时代做一个网站和APP都没有什么难度,现在AI的技术友好型、成本友好型还远远不够。那么客观来看,如果真的要做出好的应用,除非你是想做2C偏娱乐的,通常讲的依靠产品或者一些还没有被挖掘出来的用户需求驱动的,而不是降本增效的效率工具,那也许是有可能在技术不很强的情况下仅通过调用去解决的。一旦是需要2B针对特定行业解决问题,我认为里面的技术团队要求,仅次于做基座模型的难度。agent真正要解决问题,是非常难的,要把行业做好,需要自建这个行业的垂类需要的逻辑推理和决策的后训练的模型,这个是非常难的,只有这些大模型的团队,有经验的才能做到。
Q:下一代基座模型的训练是否会导致预训练算力继续提升?
Ilya也说了,预训练的模式基本到顶了。一个非常重要的转折就是O1后训练,我一直强调的从经验知识的智能到逻辑决策的智能。后训练对算力的开销越来越大,而且不仅是在训练中,在推理中也需要开销大量的算力。决策智能的模式是未来更重要的智能模式,这个对算力的消耗越来越大,以至于会超过预训练的算力需求。
Q:Agent的方向?
agent是一个商业、技术、产品融合的东西,我们仅讨论技术可行性。从技术的可行性上来看,我还是强调,agent必须基于推理、逻辑和决策的模型来做,而后训练的模型就不能只通过预训练模型,需要后训练单独训练一个。后训练里面最最重要的其实就是把完整有效可靠且准确的思维链生成出来,就是所谓的
COT
,就是进行过程奖励。所以最最重要的就是如何优化过程奖励,以及如何优化蒙特卡洛树搜索是最大的技术挑战。这种技术挑战在比如数学、编程代码等等是最容易突破,除此之外,还有一个方向是容易奖励的是操作任何人机交互方式的界面,在O1系列模型发布了以后,OpenAI、谷歌、字节都发布了操作手机、电脑、浏览器的AI,可以通过后训练的方式,可以不断学习操作过程。比如购物比价、做ppt、cad、设计的人,也具有很好的场景。