01、计算机:DeepSeek R1开源模型重构大模型生态
02、计算机:Janus-Pro轻量化成本验证普惠技术路径
【计算机】DeepSeek R1开源模型重构大模型生态
投资建议:DeepSeek-V3的发布标志着国产大模型在规模、效率和成本方面实现重大突破。DeepSeek于2025年1月20日发布了R1模型,以开源、高性能及低成本API对标OpenAI o1。其蒸馏模型的优异表现将支持消费电子、智能驾驶等终端AI的部署,开源策略将重整通用模型竞争格局,大模型的商业化落地将在DeepSeek的低价API支持下加速,未来垂类应用也有望加速创新迭代。
性能数据对标国际标杆,技术能力实现关键突破。DeepSeek-R1在数学推理(MATH-500 pass@1达97.3%)、代码生成(Codeforces 96.3%)等任务上表现比肩OpenAI o1。R1在后训练阶段通过大规模强化学习技术,在极少标注数据下提升推理能力,验证了算法优化的高效性。这一技术突破,打破了海外企业在复杂任务上的技术垄断,为中国大模型技术参与全球竞争提供了实证支撑。低成本API与轻量化模型推动AI垂类场景落地。DeepSeek-R1的API定价(缓存命中输入1元/百万tokens,输出16元/百万tokens)较行业同类产品成本降低至5%以内,大幅降低企业调用门槛。同时,其蒸馏生成的轻量化模型性能接近o1-mini,此类模型适配边缘设备算力,例如在自动驾驶中支持实时决策,或在消费电子中实现手机端、PC端语音助手等本地化AI功能。低成本与轻量化结合,也将加速AI技术从云端向终端渗透。开源策略重构行业生态,大模型技术路线有望变革。DeepSeek-R1以MIT License完全开源模型权重,并允许商用模型蒸馏,为开发者提供了二次创新的自由空间。这一策略推动中国首次在通用大模型开源领域占据技术制高点,增强全球AI话语权。同时,开源生态可能加速行业技术路线趋同,通用大模型因同质化加剧竞争,只有拥有真正领先技术的企业才能在这种趋势中留存。因此,此次国产开源模型的突破有望重塑全球AIGC技术路线及产业格局。【计算机】Janus-Pro轻量化成本验证普惠技术路径
投资建议:DeepSeek开源多模态模型Janus-Pro通过解耦式架构设计,以128颗A100训练1周的轻量算力实现超越DALL-E 3的性能,验证了算法创新对硬件依赖的突破性替代。该路径验证下,模型能力与算力的强绑定将会放松,具备架构设计能力的团队将主导未来技术走向。同时开源生态加速技术普惠,低成本多模态模型将助力教育、电商等场景加速渗透。
Janus-Pro通过创新架构实现多模态能力突破。Janus-Pro通过将视觉编码解耦为单独的路径来解决以前方法的局限性,图像理解使用SigLIP-L提取特征、图像生成通过VQ令牌转换,由统一自回归Transformer进行处理。其7B版本在GenEval基准测试中以80%准确率超越众多主流生成方法,在DPG-Bench获得84.19分,且在MMBench多模态理解测试中达到79.2分,在多模态理解和生成两方面均表现卓越。
架构创新显著降低算力依赖,证明大模型发展可摆脱算力竞争陷阱。Janus-Pro在仅128块A100 GPU训练一周的条件下实现性能超越。这印证了算法创新对算力效率的指数级提升:主流多模态模型动辄百亿至万亿参数,而Janus-Pro通过HAI-LLM训练框架,将硬件投入极大压缩。该路径表明技术路线的创新在多模态领域同样能够实现,行业正从算力硬件的军备竞赛转向算法精耕阶段,具备原创架构设计能力的团队使得AI技术的护城河不再与算力规模绑定。
开源释放场景定制潜能,加速企业级应用落地。作为开源多模态模型,Janus-Pro1.5B/7B参数版本及相关代码已开放,大幅降低技术应用门槛,开发者无需从头构建。Janus-Pro7B版本在GenEval和DPG-Bench基准测试关键指标上已超越闭源竞品DALL-E 3和Stable Diffusion,这使中小企业在电商图片生成、教育创作等场景能够快速部署高性价比的多模态解决方案,推动技术向产业端加速渗透。
文章来源
本文摘自:2025年1月27日发布的DeepSeek R1开源模型重构大模型生态
李博伦,资格证书编号:S0880520020004
伍 巍,资格证书编号:S0880123070157
李博伦,资格证书编号:S0880520020004
伍 巍,资格证书编号:S0880123070157
重要提醒
本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证券期货投资者适当性管理办法》的要求,若您并非国泰君安证券研究服务签约客户,为保证服务质量、控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的不便表示诚挚歉意,非常感谢您的理解与配合!如有任何疑问,敬请按照文末联系方式与我们联系。
法律声明
本公众订阅号(微信号: GTJARESEARCH )为国泰君安证券股份有限公司(以下简称“国泰君安证券”) 研究所依法设立、独立运营的唯一官方订阅号。其他机构或个人在微信平台上以国泰君安研究所名义注册的,或含有“国泰君安研究",或含有与国泰君安证券研究所品牌名称相关信息的其他订阅号均不是国泰君安证券研究所官方订阅号。
本订阅号不是国泰君安证券研究报告发布平台,本订阅号所载内容均来自于国泰君安证券研究所已正式发布的研究报告,如需了解详细的证券研究信息,请具体参见国泰君安证券研究所发布的完整报告。
在任何情况下,本订阅号的内容不构成对任何人的投资建议,国泰君安证券也不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。
本订阅号所载内容版权仅为国泰君安证券所有,国泰君安证券对本订阅号保留一切法律权利。订阅人对本订阅号发布的所有内容(包括文字、影像等)进行复制、转载的,需注明出处为“国泰君安研究”, 且不得对本订阅号所载内容进行任何有悖原意的引用、删节和修改。