专栏名称: EDN电子技术设计
EDN China电子技术设计为电子设计工程师和设计经理人提供前沿深度的电子资讯、设计实例应用方案。
目录
相关文章推荐
潇湘晨报  ·  哪吒16字回应登顶 ·  21 小时前  
生物制品圈  ·  TL1A靶点:两全其美的自免炎症通路放大器能 ... ·  5 天前  
潇湘晨报  ·  恭喜!他要结婚了 ·  3 天前  
新闻株洲  ·  陈恢清调度政府系统值班值守工作 ·  4 天前  
51好读  ›  专栏  ›  EDN电子技术设计

传小米计划搭建GPU万卡集群,加速AI大模型布局

EDN电子技术设计  · 公众号  ·  · 2024-12-28 11:55

正文

近日,小米被曝正在积极布局AI领域,计划搭建GPU万卡集群,以加速AI大模型的研发和应用。

小米自2016年起全面布局AI技术,其智能语音助理“小爱同学”月活跃量已达1.2亿台,AI技术已广泛应用于手机、智能家居、汽车等多个业务板块。2023年4月,小米正式组建了AI实验室大模型团队,由栾剑担任负责人,团队规模已扩展至3000多人。小米的大模型团队在成立之初便拥有6500张GPU资源,这不仅显示了小米在硬件资源上的雄厚实力,也预示着其在AI技术研发上的深厚积累。

小米计划通过搭建GPU万卡集群,进一步加大对AI大模型的投入。目前,小米的AI大模型技术已经取得了一些突破,例如在手机端实现了端侧AI大模型应用,部分场景效果接近云端60亿参数级别的大模型。

此外,小米的大语言模型“MiLM”已经通过大模型备案,并计划应用于小米的汽车、手机、智能家居等产品中,实现设备间的协同,推动人车家全生态战略。

在小米计划加强其在AI大模型领域布局的背景下,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉正式加入小米,担任小米AI实验室的领导角色,负责大模型团队的建设与研发工作。

罗福莉拥有丰富的AI研发经验,曾在北京大学获得硕士学位,并在阿里巴巴达摩院机器智能实验室工作期间主导开发了多语言预训练模型VECO。2022年,她加入DeepSeek,深度参与了MoE大模型DeepSeek-V2的开发,为该模型的成功奠定了基础。DeepSeek-V2是一种高效的多模态模型,在处理复杂自然语言任务时表现出色,支持128K上下文长度,并在多个基准测试中表现优异。







请到「今天看啥」查看全文