专栏名称: 思诺财富
本号以金融知识学习、财经资讯分享、研究报告交流为核心,交流学习,共同进步。被市场认可的逻辑才有价值,而这种认可会在趋势上呈现出来,趋势分析为主,价值分析为辅,逻辑推理为核心。
目录
相关文章推荐
百姓关注  ·  凝冻!贵州2处路段临时交通管制 ·  22 小时前  
贵州日报  ·  贵阳这条路段违停现象,为何难治理? ·  昨天  
百姓关注  ·  重拳整治:驱离200余人,强制带离22人 ·  2 天前  
51好读  ›  专栏  ›  思诺财富

DeepSeek带来的故事情节仍在延续

思诺财富  · 公众号  ·  · 2025-02-05 23:55

正文

免责声明 :文章内容仅为研究参考资料,仅以学习交流,传播知识为目的, 文中所涉及的所有个股都不构成投资建议

【温馨提示】 股市有风险 投资需谨慎





🧭方向


从市场情绪来看,当前处于分歧阶段。假期热度最高的是deepseek,今日开盘便出现批量一字板,这是对市场情绪的直接回应。而此前被视为跨年潜力股的冀东装备,今日却跌停开盘,兴业、华脉等股票也让投资者承受较大损失,新炬网络的封单量有所减少,这些都是市场情绪分歧加剧的显著信号。
在题材表现上,deepseek无疑是当前市场的焦点,热度极高。不过,今日的表现更多是对假期利好消息的即时反应,其题材的延续性以及后续走势仍有待进一步观察。考虑到节前deepseek已释放部分分歧,今日投资者可适度参与。机器人板块早盘表现超预期,然而午后却后继乏力。该板块内部趋势股与情绪票分化明显,把握好操作节奏显得尤为关键。




🛤️连板


节前的高度板冀东装备直接一字跌停,人气股兴业科技、华联股份等二连跌停。
板块方面,春节假期期间,有关DeepSeek的消息持续发酵,该板块继续引领市场,美格智能、每日互动、航锦科技、南威软件均一字涨停晋级。此外,受益于DeepSeek降本与开源的AI应用、AIDC等细分全天强势,而光模块、PCB、铜连接等英伟达产业链环节则受到DeepSeek直接冲击,沃尔核材、华脉科技、新亚电子等二连跌停,太辰光、新易盛、天孚通信等跌超16%。




🏅️主线


嘉宾:英诺天使基金合伙人 王晟

英诺天使基金成立于 2013 年 4 月,已投创业项目达500+,投资管理团队平均有10年+经验,管理基金规模数十亿人民币,重点关注新一代信息技术(人工智能/半导体)新能源新材料、生命科技、先进制造(机器人/航空航天)等领域。王晟先生是中国最早的互联网从业者之一,曾就职于瀛海威、搜狐,发起创办多家互联网企业,成功融资及被收购,现任英诺天使基金合伙人。

话题:

1、如何评价DeepSeek R1这次在全球的出圈?

2、从产业角度,DeepSeek大模型的一些创新对于国内AI产业会带来哪些影响?

3、在2024年,大家都说模型的战争已经结束了,但DeepSeek超出了大家的预期,如何看待未来模型的格局?

4、一级市场当前比较关注的AI领域的投资方向?

5、Q&A

观点来自专家,不代表东吴证券研究所观点,转载请联系团队:张良卫/周良玖(18627087962)

正文

1、如何评价DeepSeek R1这次在全球的出圈?

DeepSeek在模型上做的是比较好,最重要的特点是以非常小的一个训练成本和代价取得了比较好的效果。我们不能认为V3和R1两个模型的上限超过了OpenAI和Anthropic,但重要的是,DeepSeek在工程上的创新使得他训练模型的成本得到了极大的优化,这次没有讲R1的训练花了多少钱,但V3前面论文的披露是接近600万美金一次,R1的成本估计也不高。所以最重要的DeepSeek的成绩是,用几十分之一的成本,取得了媲美海外巨头的模型的成绩。

我个人不认为,R1的模型的上限会超过O系列模型的上限,因为大家应用的技术的思想还是有些不一样的,这里面是有些取舍的。R1直接采用了强化的方法做了数据的冷启动,但是O系列模型采用了蒙特卡洛树搜索加过程奖励的这种方法,这种方案设计起来其实比较困难,整体的计算量也比较大,但是它的上限理论上也会非常高。

成本的极大优化对老外影响很大,DeepSeek展现出的模型能力和性价比,打动了美国社会。对于OpenAI、Anthropic这种巨大投入的公司都带来了巨大的冲击,因为他们就是巨大的资本密集型模型,需要资本不断下注,但是出现了DeepSeek以极高性价推出模型的方式,虽然他的模型没有做到最顶级,对于这些头部初创公司、资本、英伟达都带来了冲击。

2、从产业角度,DeepSeek大模型的一些创新对于国内AI产业会带来哪些影响?

DeepSeek在业内一直备受关注,我们此前接触了大量非基座模型的AI企业,他们大部分都是会把模型进行微调,进行使用或者做调用,来解决产业的问题的。基本上我经常会问他们对于大模型的看法,进入2024年后,他们很多都认为DeepSeek的模型已经会比其他初创模型要好,此外还有阿里的通义千问、字节的豆包也是一直被认为处于比较领先的位置,豆包最近的成长比较快。

对产业的影响:我们的模型智能水平离OpenAI、Anthropic还有差距,V3和R1使得这一差距在显著的缩小,给AI的使用者提供更好的智能的能力,以更好的解决客户的问题,当然最最重要的是便宜。去年最先降价的也是DeepSeek,后面豆包、通义就纷纷开始降价,DeepSeek起到了一定的 鲶鱼效应 ,这些都非常有助于产业部署和实施以及AI创新,今年一级市场投资人也是很看重应用的,而不仅是基础设施和模型。

3、在2024年,大家都说模型的战争已经结束了,但DeepSeek超出了大家的预期,如何看待未来模型的格局?

23年5月份之后,这场战争就已经结束了,我刚才回答第一个问题的时候就讲过,这不仅是一个人才的竞争,也是一个高度依赖资本开支的竞争,所以不会投那么多的基座模型公司。所以当时一级市场的看法是,23年5月之前没有拿到大钱的公司,可能就没有机会了。现在的六小龙就是这么个情况,但这个里面的异类是DeepSeek,DeepSeek是市场上唯一一个没有融钱的初创公司。现在的市场,格局也没有什么变化,纯从多模态大语言基座模型这个角度来讲,整个模型的格局我也不认为会发生变化,DeepSeek肯定是在初创公司里面很领先的,但是DeepSeek往下能不能打得过字节豆包、通义不好说。

我们要讲一个新的很重要的模型的深刻变化,从OpenAI的4o到o1,以及DeepSeek v3到r1,这里面有一个极其重要的变化,就是从预训练转到后训练。过去预训练都是基于经验、知识再加上概率的模型。但是O3和R1不是,他是后训练的,是基于逻辑、推理、决策的。这是两个不同的智能范式,一个是经验知识的,一个是逻辑推理的,未来的模型会变成每一个垂直领域,或者产业领域,产业领域的思维和决策模型不再像知识模型那么容易泛化,针对特定领域训练一套决策逻辑,只能应用到这个产业里面,因此我们认为,模型里面还会出现很多的变数。

4、一级市场当前比较关注的AI领域的投资方向?

1)agent,agent就是应用的一种。过去创造出来的都是工具,未来我们和这个世界打交道主要都是通过agent,他自己会去使用工具。agent我们之所以这么关注他,主要是O1这个新范式出来,如果没有决策智能出来,永远不会出现好的agent,所以这个是今年的重点。

2)智能硬件,我觉得智能硬件最重要的就是智能眼镜。眼睛这个位置是人类能够接触到的最多信息的位置,通过眼镜,所以的输入输出他都掌握了,所以,对于一个智能设备和人有一个同场感。这个是手机做不到的。所以眼镜是未来最重要的新一代计算设备。

3)具身智能,但是具身智能还是处于相当早的阶段,这两年的进步速度比较快,看今年会不会取得一些突破。一个在于高质量的数据从哪儿来,另一个就是具身智能的整体的技术范式到底往哪个方向去,我们过去看到了很多的范式进化,所以具身智能能不能再今年找到更好更明确的技术范式,同时获取更高质量的海量的数据,是非常值得关注的方向。

Q:2023年5月以后,大模型创业已经结束,那么其他大模型的创业公司未来的出路在哪儿?他们去做应用是否具有优势?

我觉得优势还是很大的,从今天这个时点来看,哪怕最新的 开源模型 ,其实对普通的创业者仍然是不友好的,我们可以联想互联网时代和移动互联网时代做一个网站和APP都没有什么难度,现在AI的技术友好型、成本友好型还远远不够。那么客观来看,如果真的要做出好的应用,除非你是想做2C偏娱乐的,通常讲的依靠产品或者一些还没有被挖掘出来的用户需求驱动的,而不是降本增效的效率工具,那也许是有可能在技术不很强的情况下仅通过调用去解决的。一旦是需要2B针对特定行业解决问题,我认为里面的技术团队要求,仅次于做基座模型的难度。agent真正要解决问题,是非常难的,要把行业做好,需要自建这个行业的垂类需要的逻辑推理和决策的后训练的模型,这个是非常难的,只有这些大模型的团队,有经验的才能做到。

Q:下一代基座模型的训练是否会导致预训练算力继续提升?

Ilya也说了,预训练的模式基本到顶了。一个非常重要的转折就是O1后训练,我一直强调的从经验知识的智能到逻辑决策的智能。后训练对算力的开销越来越大,而且不仅是在训练中,在推理中也需要开销大量的算力。决策智能的模式是未来更重要的智能模式,这个对算力的消耗越来越大,以至于会超过预训练的算力需求。

Q:Agent的方向?

agent是一个商业、技术、产品融合的东西,我们仅讨论技术可行性。从技术的可行性上来看,我还是强调,agent必须基于推理、逻辑和决策的模型来做,而后训练的模型就不能只通过预训练模型,需要后训练单独训练一个。后训练里面最最重要的其实就是把完整有效可靠且准确的思维链生成出来,就是所谓的 COT ,就是进行过程奖励。所以最最重要的就是如何优化过程奖励,以及如何优化蒙特卡洛树搜索是最大的技术挑战。这种技术挑战在比如数学、编程代码等等是最容易突破,除此之外,还有一个方向是容易奖励的是操作任何人机交互方式的界面,在O1系列模型发布了以后,OpenAI、谷歌、字节都发布了操作手机、电脑、浏览器的AI,可以通过后训练的方式,可以不断学习操作过程。比如购物比价、做ppt、cad、设计的人,也具有很好的场景。





🎬发酵


关于投资的影响,一些想法有待验证:

a)一是AI平权,是开源对闭源的挑战,可能会抹平OAI和英伟达链的霸权,这也是海外演绎最核心的逻辑,推荐【阿里】、小米

b)头部厂商的算力投入不会有太大的影响,未来中腰部比如苹果、亚马逊等公司算力投入可能会有所下降。

c)产业链价值未来会从算力到应用渡让,应用肯定是最重要的方向,但是在应用的选择上要优选有场景定价权的公司。另外就是一些在海外已经基于GPT跑通了的应用公司,关注端侧、 ai agent

d)算力层:降本是核心,产业链最核心的环节是云及配套,其次关注新的推理技术方案+配套供应链,关注asic+aec












请到「今天看啥」查看全文