专栏名称: NE时代新能源
聚焦新能源汽车三电及整车的技术、市场分析
目录
相关文章推荐
精益工业工程  ·  镇店之宝—DBS体系、国际版! ·  昨天  
精益工业工程  ·  镇店之宝—DBS体系、国际版! ·  昨天  
上海科创汇  ·  国家专利密集型产品备案认定讲解 ·  昨天  
艾锋降级  ·  紧急发布!iOS 18.1.1 和 ... ·  2 天前  
艾锋降级  ·  紧急发布!iOS 18.1.1 和 ... ·  2 天前  
sven_shi  ·  最后几小时优惠了-20241118204704 ·  3 天前  
Founder Park  ·  对话王诗沐:走出大厂创业,做 3D AI ... ·  3 天前  
Founder Park  ·  对话王诗沐:走出大厂创业,做 3D AI ... ·  3 天前  
51好读  ›  专栏  ›  NE时代新能源

摩尔线程能平替英伟达?

NE时代新能源  · 公众号  · 科技创业 科技自媒体  · 2024-11-20 07:00

正文

摩尔线程或成为上市速度最快的半导体企业之一。
2020年10月成立,2024年11月启动上市,这一过程摩尔线程仅用了4年的时间。
2024年11月12日,证监会网站显示,摩尔线程在北京证监局办理辅导备案登记,正式启动A股上市进程,辅导机构为中信证券。此外,还有消息表示,该公司将在科创板上市。


提到摩尔线程,业内都将其作为英伟达的平替看待,不仅是因为产品对标,更是因为其具备英伟达的深厚基因。
01.

中国的“英伟达”


创始人来自英伟达。
摩尔线程的创始人——张建中是英伟达原全球副总裁、中国区总经理,英伟达中国公司创始人。


张建中深耕GPU行业超过15年,覆盖产品研发、市场生态及营销领域;带领英伟达开拓中国GPU市场,建立生态系统;并推动中国市场成为英伟达全球最重要的市场。数据显示,2008年英伟达在中国的GPU市场占有率不到50%,2020年的市占率已经超过80%。
可见,张建中在为英伟达开拓中国市场方面,居功至伟。
2020年9月,张建中离开英伟达,同年10月创立摩尔线程。公司结构设计思路与英伟达也颇为相似,摩尔线程成立了AISG和MCSG两个战略部门,分别专注于AI芯片和消费级显卡的研发。
离开英伟达,短短19个月后,张建中便率队交付了一块国产全功能GPU—苏堤。它采用先进的公司架构集成、AI计算、加速、图形渲染、视频编解码、物理仿真和科学计算四大引擎。
2022年11月,摩尔线程推出了国产游戏显卡MTT S80,被誉为“国产游戏第一卡”,并且是国内唯一可以支持DX12的消费级显卡。至此,摩尔线程成为国产第一家消费级游戏显卡公司。
摩尔线程的这一成就在全世界范围内都不容小觑。要知道图形处理是GPU领域的珠峰,摩尔线程能以全功能GPU实现消费级图形处理,成为继英伟达、AMD、英特尔后第四家能创造出独立显卡的科技公司。
当然,摩尔线程全面对比哦啊英伟达。除了显卡之外,英伟达在数据中心、人工智能等领域都有布局。摩尔线程也有对应的产品布局,TO C端的桌面显卡,摩尔线程现有产品包括MTT S80、S70、S50、S30、S10。TO B端的AI大模型,摩尔线程产品包括训推一体机MCCX D800、AI超融合一体机KUAE FUSION,用于部署服务器推理、训练。且支持LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各类主流大模型的开源。摩尔线程的布局,已经形成从芯片到板卡到服务器到集群,再到软件的全栈式的人工智能的产品线。
摩尔线程能够取得这样的成绩,得益于技术能力强大的团队,他们多来自于英伟达、微软、英特尔、AMD、ARM等国际大企业,技术实力不容小觑。
根据国家知识产权局的数据,截至2024年10月,摩尔线程获得425项授权专利,稳居国内GPU企业中专利授权数量首位。这些专利主要覆盖了处理器架构设计、AI应用、驱动软件设计、GPU算力集群等关键技术领域。

02.

用MUSA兼容CUDA


英伟达耗费多年构建的完整CUDA生态系统可以说是其最重要的护城河之一,巩固了其作为领先GPU计算和人工智能(AI)制造商的地位。

正因此,GPU企业要生存就要先兼容CUDA。

什么是CUDA?

CUDA(Compute Unified Device Architecture),是NVIDIA推出的运算平台。CUD是一种NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以使用C语言来为CUDA"架构编写程序,所编写出的程序可以在支持CUDA的处理器上以超高性能运行。

用户一旦习惯了CUDA,就很难再迁移出去。因为迁移意味着代码完全重写,工作繁重耗时且不产生经济效益。

竞争对手们要挖英伟达的墙角就要采用尽量不改变用户习惯的方式,例如,在自己的GPU芯片上兼容CUDA。AMD和英特尔一直试图通过自己的开放API产品,包括ROCm和oneAPI进入计算领域。其想法是提供翻译层的开放访问,开发人员可以更容易地在非英伟达GPU上运行现有的CUDA代码,例如,开源的ZLUDA项目,可以使CUDA应用程序在AMD GPU上以接近原生性能运行,而且无需重新编码。

高通、英特尔和谷歌联手还建立UXL基金会,是以oneAPI构建的开源项目,为使用CUDA生态系统的用户提供新选择,最终目标就是要推翻英伟达的统治。

国内其他GPU企业也选择了兼容,例如壁仞科技的 BIRENSUPA 平台、沐曦科技的 MXMACA平台也都在通过兼容来化解英伟达CUDA带来的壁垒。

摩尔线程要生存也要采取类似手段,因此,摩尔线程自主研发了MUSA统一系统架构,包括统一的GPU编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。简单来说,只要通过一些代码自动转换的工具,用户就可以快捷的把原有的基于英伟达,生态的扩大代码牵引到MUSA平台,实现替代。

不过,今年3月份,市场上传出英伟达试图在CUDA软件中封杀第三方GPU公司的消息。

针对市场上的消息,摩尔线程迅速表态,其MUSA / MUSIFY不涉及英伟达EULA相关条款,开发者可以放心使用。

声明指出,摩尔线程研发的MUSA系统,与CUDA无任何依赖关系。MUSIFY则是其面向广大MUSA开发者提供的开发工具,方便用户在MUSA计算平台上进行应用移植与开发,可以让开发者将自己的C++源代码,转换成MUSA C++源代码,再通过MUSA编译器MCC编译生成基于MUSA指令集的二进制代码,最终运行在摩尔线程全功能GPU上。

当然也可以看出,兼容CUDA是其他GPU企业发展必须要走的路,因为只有兼容CUDA,企业发展的商业壁垒才能大幅降低。


03.

“集群化”应对算力瓶颈


除了以MUSA应对CUDA,摩尔线程试图用“集群化”的解决方案,来解决国产GPU突破算力瓶颈。例如,以摩尔线程、华为为代表的少数厂商,选择从千卡向万卡进发,着重训练场景,直接硬刚英伟达。


7月3日,在2024世界人工智能大会召开前夕,摩尔线程宣布其夸娥(KUAE)智算集群解决方案实现重大升级,从千卡级别大幅扩展至万卡规模,以此来完成对大模型的托举,为万亿参数级别的大模型训练提供持续高效、稳定、且广泛适用的通用算力支持。


张建中表示,夸娥万卡智算集群作为摩尔线程全栈AI战略的一块重要拼图,可为各行各业数智化转型提供澎湃算力。



具体来看,摩尔线程夸娥万卡集群以全功能GPU为底座,软硬一体化、完整的系统级算力解决方案,包括以夸娥计算集群为核心的基础设施、夸娥集群管理平台(KUAE Platform)以及夸娥大模型服务平台(KUAE ModelStudio),旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。该方案可实现开箱即用,大大降低传统算力建设、应用开发和运维运营平台搭建的时间成本,实现快速投放市场开展商业化运营。



要知道,万卡集群并不是一万张GPU卡的简单堆叠,而是一个超级复杂的系统工程。规模变大的同时,难度也呈指数级倍增——既要实现智算中心扩容,也要兼顾质量。


首先,需要解决超大规模组网互联和提升集群有效计算效率问题;


其次,要解决稳定性问题,超万卡集群是由数千台GPU服务器、数千台交换机、数万根光纤/数万颗光模块构成,训练任务涉及上千万器件的共同作业,任何一个部件的故障,可能都会导致训练中断。


此外,要应对大模型的迭代问题,要求万卡集群具备生态Day0级的快速迁移能力,以适应不断变化的技术需求。同时,算力也不能局限于当下的大模型计算加速场景,还需要考虑未来通用计算的需求。


这对厂商而言是一项极其复杂的系统工程。尤其算力利用率与稳定性是行业衡量智算中心质量的两项重要指标。


具体来看下,夸娥万卡智算方案性能:

单一集群规模突破万卡,总算力超万P;

集群有效计算效率,目标最高可超过60%;

稳定性卓越,周均训练有效率最高可达99%以上,平均无故障运行15天以上,最长稳定训练30天以上;

具备强大的计算通用性,专为通用计算而设计,可以加速一切大模型;

拥有良好的CUDA兼容能力,生态适配Instant On,加速新模型Day0级迁移。


至此,摩尔线程已经从一家GPU公司,转变为专注AI的加速计算平台企业。



04.

因进实体名单声名鹊起



摩尔线程,见诸媒体的次数屈指可数。


第一次声名鹊起是源自于美国的实体名单。


2023年10月17日,美国商务部将包括摩尔线程在内的13家中国GPU企业列入“实体清单”,以遏制中国AI产业的发展。


成立三年的摩尔线程才第一次进入大众视野。事实上,能够进入美国的“实体清单”也是对其技术实力的一次认可。


事实上,进入“实体清单”对摩尔线程的影响不小,最重要的就是限制其获取海外代工和先进技术的可能。


同时由于贸易限制和供应链中断,企业可能难以获得必要的原材料和零部件,导致生产受到影响,进而影响其财务状况和信用评级。这会使得企业在融资时面临更多困难,难以获得银行和其他金融机构的贷款和支持。

摩尔线程对此的应对措施是降价扩大销售,当月其将原价MTT S80显卡从2999元一次性降价至1199元,通过扩大销售来稳定现金流。

第二次被人们关注是因为《黑神话:悟空》发售。


《黑神话:悟空》正式发售之后,摩尔线程团队迅速推出了针对MTT S80显卡的优化驱动程序,后期发布的V270.80驱动程序解决了DirectX11模式下运行《黑神话:悟空》Benchmark时的闪退问题。


这也让摩尔线程小火了一把。8月下旬,摩尔线程的百度搜索指数达到了前后两个月内的峰值。

 


通过内部测试和市场反馈,玩家们普遍对MTT S80显卡在《黑神话:悟空》中性能提升表示满意。


这在一定程度上也反映出摩尔线程的技术实力。


第三次被关注,就是此次启动IPO。关注度创历史新高。

 


虽然在被列入实体清单之前,摩尔线程的知名度并不高,但是在创投圈却是名副其实的“当红炸子鸡”,一成立就获得红杉中国、字节跳动等国际顶级投资机构的投资。


天眼查显示,摩尔线程已完成5轮融资,累计融资金额或超过50亿元。2022年12月,摩尔线程完成15亿元的B轮融资时,估值已达到240亿元。


而根据胡润研究院发布的《2024全球独角兽榜》中,摩尔线程以255亿人民币的企业估值入选,排名第261位。


摩尔线程与英伟达相比,在算力、制程技术,以及生态架构设计上的性能和效率等方面的差距是显而易见的。例如,摩尔线程在集群训练规模上仍有一定差距,英伟达已能进行十万卡级别的集群训练;从芯片设计上来看,跟英伟达的差距为12—18个月;在芯片制造制程上,英伟达已采用3nm制程,而国内目前仍止步于5-7nm……


要翻越英伟达这座大山,摩尔线程需要做的还有很多,上市成为获取资金弹药的必然途径。


无论如何,作为一颗冉冉升起的新星,摩尔线程是值得期待的

-END-



关联文章推荐

1.独家对话|日本汽车半导体巨头,如何造出全球首颗3nm大算力SoC芯片?
2. 固态电池最新研发进展 谁将率先突围?
3. 快充电池热失控防护,听听专家们怎么说