专栏名称: 独角兽智库
独角兽智库是一个新兴产业投研平台,搭建新兴领域高端技术与投资机构、传统行业的桥梁,让专业的资本找到优质的企业,实现新兴产业的快速发展。平台提供新兴产业干货报告、专家咨询服务。
目录
相关文章推荐
独角兽智库  ·  胖东来概念 ·  2 天前  
独角兽智库  ·  详解光刻机结构及工作原理,86页PPT ·  3 天前  
产业互联网大视野  ·  星辰产业出海营来了!一个汇聚产业互联网出海最 ... ·  2 天前  
桂林广播电视台飞扬883  ·  春运期间,12306试点新功能 ·  3 天前  
桂林广播电视台飞扬883  ·  春运期间,12306试点新功能 ·  3 天前  
51好读  ›  专栏  ›  独角兽智库

AI不卷算力卷应用?哪些投资机会

独角兽智库  · 公众号  · 科技投资  · 2024-12-28 22:33

正文


独角兽智库 产业研究第一智库

独角兽投研情报群招募

独角兽智库发展至今,历时9年,积累了大量资源,也和顶尖投研资源形成了利益共同体,并经过今年近一年的产品测试,小范围会员服务近两年。

十一月精准把握住了固态电池、AI+等板块机会,个股桂发祥、华胜天成、供销大集

现开放体验名额,加微信:itouzi8888,文末有二维码


最近幻方悄悄上线了DeepSeek V3,作为量化巨头,幻方一向是中国大模型价格战的发动者,当时DeepSeek v2出圈也是因为做到好用又便宜,盛传幻方是中国持有高性能GPU最多的公司。

有人做了初步评测,结论就是:已经与GPT-4o、Claude-3.5-sonnet推理能力相当,甚至编程媲美最领先的3.5 Sonnet,超过GPT-4o。

今天出圈并对市场有所扰动的信息是是:这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练,总共也只有 278.8 H800 GPU Hours。相较之下,Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU Hours—— 如此计算量足可训练 DeepSeek-V3 至少 15 次。


几乎所有投资者圈层都在问:幻方Deepseek v3只用了2048卡的H800,训练两个月就完成了。你们公司买了10万张卡,单集群万卡,都搞出什么成果来了?有人质疑OpenAI干什么去了。


目前有这么几个解释:

-训练只有一次,推理是无数次。推理需求实质上远大于训练需求,尤其是用户基数大了。

- Deepseek是站在巨人的肩膀上,使用大量高质量合成数据。

- Deepseek这个统计口径只计算了训练,但数据的配比需要做大量的预实验,合成数据的生成和清洗也需要消耗算力。

- Deepseek的模型的MoE每个专家都可以单独拿出来训练,本身相比于dense架构就是省力一些的方案。

- Deepseek采用FP8训练,而FP8的训练本身就不怎么耗资源,相比FP16或BF16,FP8的Tensor Core可提供两倍的TFlops算力此外,FP8的数据类型占用的比特数更少,可以降低内存占用消耗在实际测试中,FP8训练吞吐对比BF16性能可提升30%至50%。

- 所谓节省90%算力还能和chatgpt匹敌的这个大模型不太行,噱头为主。

-人人都超越了GPT 4o,llama 3天天被踩在脚底下,消费者和企业界实际使用用的最多的还是这两个模型。这些宣传的成绩未必可靠。


另一个出圈的是小米ALL in AI:12月26日,界面新闻独家获悉,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。

而DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,有望加入小米AI实验室领导大模型团队。

- AI基础:金山云

- AI生态:人车家全生态

- AI应用场景:小米AI智能lOT+小米AI手机+WPS AI+小米AI智驾


为什么要做万卡集群?

本质上是加速强化自身大模型,对模型能力的补强。海外对标的大厂包括Google、Meta、微软都是软硬件结合,预期25年开始国内大厂都会对标海外、平推大模型各个环节。小米原先在硬件制造/供应链上通过手机、耳机等系列智能终端中完成了能力储备,但是对于“软”的部分(大模型)还有所欠缺。


为什么要对AI生态平推式的进入? 

究其根本是在于追求下一代互联网时代的入口,强化自身模型能力,且不能放过任何一个可能成为下一代终端的产品——包括手机/耳机/眼镜


对于小米当前宣布万卡集群的看法?

在当前国内各大厂平推的进入大模型领域,我们对于小米抱有比较乐观的态度,一来是我们觉得在跨终端互联的交互方式下,小米此前IOT方面的布局较广,是字节等大厂还需要一定时间才能追赶的,此外在供应链当中以当前小米的出货量来看,占比较高,有一个卡位优势。


- 金山云:小米AI核心云基础设施。充分利用小米与金山生态独特的机遇。从电动车(EV)、AIoT游戏、大型语言模型到WPS AI,24Q3来自该生态系统的收入同比增长了36%。

金山办公:小米大模型•核心应用载体。推出WPS灵犀,灵犀,是WPS推出的一个带有AI搜索的应用,可以实现搜索/总结/整理/创作等,从实现的功能上,类似于豆包/Kimi等Chatbot。25年收入65亿元左右,目前市值1300多亿元。

比亚迪电子:深度合作的ODM之一,公司目前正在跟小米谈服务器组装业务。

思特威:手机CIS和安卓其余品牌商有望达成合作,hw内部份额预期持续提升;比亚迪智驾下沉放量,车载CIS在环视有望取得份额。

恒玄:小米耳机和小米手环主控芯片核心供应商,BES2800芯片+外挂ISP方案后续有望在小米眼镜中搭载,25年与AI眼镜相关的项目总计超过10个

艾为电子:国内消费电子模拟IC龙头,手机营收占比超70%,其他泛消费电子终端AIOT占比20%,与小米深度战略合作,多款产品导入小米手机,IOT,汽车领域。


米AI产业链:爆发在即

小米AI产业链是继字节产业链后非常好的投资机会,因为小米是国内终端侧布局最领先公司,手机、汽车、小米智家是AI最好的三大天然载体。小米有望通过AI从一个薄利的硬件的公司升级成AI应用、订阅的生态巨头,产业链标的挖掘潜力大。

1)小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。小米大模型团队在成立时已有6500张GPU资源。此前12.20据报道,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,有望加入小米AI实验室领导大模型团队。这一战略举措标志着小米在AI领域的深入布局。据悉,该计划已经施行数月之久,雷军为重点领导角色,强调小米在AI硬件领域的核心关注点是手机。

2)11.12小米官方宣布大模型已经实现了从一代到二代(MiLM2)的升级迭代,包括:1)参数规模同时向下和向上扩充,实现了云边端结合,参数尺寸最小为 0.3B,最大为 30B;2)语言能力相比于第一代模型平均提升超过 45%;3)端侧部署上支持 3 种推理加速方案,包括大小模型投机、BiTA、Medusa,并且自研量化方案相比于业界标准高通方案,量化损失降低 78%;4)支持的最长窗口为 200k(第一代为 4k)。

3)2023年,小米成立了大模型团队,并将“轻量化、本地部署”定为小米大模型技术的主力突破方向,公司在AI产品上的布局非常广泛,涵盖了从智能手机、AIoT、自动驾驶、智能制造到机器人等多个业务领域。除了AI端侧硬件为最核心的战略方向,在自动驾驶方面,小米汽车智能驾驶系统在半年内经历了三次重大升级,从高精地图+模块化架构到无图+模块化架构,再到端到端大模型架构,快速追赶其他车企三代研发步伐。

4)通过手机、汽车、AIoT生态的全线布局,小米的除了技术突破外,更核心的是打造“人车家”融合的完整智能生活场景,在多样化场景中形成闭环生态,有望成为AI软件+硬件应用中最核心的玩家之一。


相关纪要:

现开放投研情报群体验名额,更多投研情报服务,请往下看


独角兽投研情报会员服务

服务概述

现在的A骨市场,风格切换极快,不论是做赛道成长、风口波段、价值投资、龙头打板、技术短线都处于短暂有效,大多数时间亏损的情况,只有一点持续有价值,那就是快人一步的信息,这种信息不会是财联社的新闻,不是知识星球的调研纪要、更不会是公社的吹票逻辑。

服务主旨

提供各种快人一步的投研信息,让你明明白白知道盘中异动。

情报来源

独角兽智库投研情报团队已经根植在大A各个生态阶层:

1:公募核心圈,提前获取公募看好的大方向和主攻领域。

2:券商分析师圈,深入各大券商核心客户群,提前获取券商主推逻辑。

3:游资核心圈,在游资大佬的小圈子有一席之地,提前获取大资金动向。

4:产业链圈,各个新兴产业技术核心圈子,提前挖掘技术变革推动的A股炒作逻辑。

服务内容

1、大资金抱团动向

2、集合竞价龙头早知道

3、先手小作文

4、券商主推方向及逻辑

5、市场的机会和风向提示

6、个骨和行业避雷

服务方式:

微信群--只有微信群的消息才可以做到第一时间的信息传递。


现开放体验名额(非免费,白嫖勿扰)


加入体验方式(如果您关注短线交易)

请加微信:itouzi8888,备注:体验+姓名+公司+职位

如果您关注基本面,做波段或者价投

请加微信:itouzi5,备注:体验+姓名+公司+职位

群内其他历史记录如下,可自行验证其情报的价值,有投研情报群历史聊天记录的截图,在盘后都会截图并且发在当天文章内,请查看历史文章验证(11月份精选情报)































防止失联,关注备用号