l“思维链”破局更智能的推理
ü 大模型时代来临,加速计算需求突破式增长。2023年至2028年加速计算CAGR约32%。我们认为,目前还处于 AGI 大基建的早期阶段。ü 经过强化学习(Reinforcement Learning),OpenAI o1在推理能力方面取得了重大进展。思维链是一种帮助AI模型进行推理的技术,属于强化学习的技术之一。
ü 我们认为,每一轮新技术的发展规律是相似的,其发展规律主要分为三阶段:
(1)靠垄断发展,先在技术垄断期榨取每一代产品的利润(2)有竞争对手出现,依然享受领先优势,但会加速换代,产品迭代立刻提速,为了享受更多的领先优势(3)技术更新迭代变缓,硬件迭代进入瓶颈,软件龙头公司崛起(1)从本轮技术进度看,这代架构下的AI能力已经接近瓶颈,潜力已几乎被挖尽,领先者的领先地位将越来越不明显。(2)从新一轮技术爆发看,未来竞争格局存在较大不确定性。
l 从技术原理看,2026年或达到这代AI架构上限
ü 我们认为,在这代架构之下,增加更多特定算法如“MOE”、“Q*”等,或是增加参数量与数据资源,可能只能将回溯记忆的过程做的越来越好,无法从根本上解决“聪明”问题,模型原来无法解决的“逻辑、因果问题”的理解,在这代架构之下或难以被解决。
ü 从大模型原理看,GPU能力、Transformer能力、与数据资源影响AI架构上限
(1)从GPU原理看,内存互连与架构设计决定能力上限 (2)从transformer原理看,算法不够“聪明” (3)从数据资源看,这代AI瓶颈在数据获取、全面标注、高质量数据 ü 我们认为,中期看来,当前AI架构的上限或带来以下中期风险: (1)实用性AI角度,网络、内存等已看到明显技术上限,再花一倍的力气去提升20%的性能性价比较低,中型厂商或更多转向推理,推理侧竞争格局存在不确定性。 (2)长期AGI明显是需要多轮次技术爆发才能到达的终极目标。
算力场景落地不及预期,政策变动,产品研发不及预期等。 |