图片来源视觉中国
出品丨深网·腾讯新闻小满工作室
AI光年/追踪中国AGI崛起之路
自ChatGPT 推出一年以来,随着模型压缩和微调技术的完善及训练成本的优化,大模型的部署正从云端向边缘和终端设备下沉扩散,用户经常用到的个人PC和手机就成为大模型小型化和个人化的主要载体。
“受算力等因素的影响,目前运行AI智能体最好的载体还是PC。现在所谓人工智能手机更多还是通过网络享受公有智能的好处。要基于个人知识库的智能体,实现个体人工智能双胞胎,电脑还是最好的载体。”联想集团CEO杨元庆对腾讯新闻《AI光年》等表示,PC是比手机更好的智能载体。
全球主流PC厂商、涉及PC业务的手机厂商都把AIPC看做不可错过的机会。从去年开始,头部PC和手机厂商都在紧锣密鼓的推动AI大模型在终端设备的落地。
除联想等主流PC厂商已经推出AIPC产品外,华为、荣耀等手机厂商也推出了自己的AIPC,苹果公司也被爆出自研M4芯片,准备对整个Mac产品线进行全面改革。
在AGI的加持下,PC不再是传统意义上的计算机,而定义成了智能化的个人助手。从芯片、系统到终端,整个PC产业链都在被AI重构,AIPC正在迎来“寒武纪”时刻。
真假AIPC之争
不同厂商对AIPC有不同的定义。
英特尔认为处理器中含有NPU就算AIPC;微软表示标配Copilot键才是PC端进入AI世界的入口;联想则认为具备五大核心特质的PC才算真正的AIPC。
对于这个争议,IDC中国高级研究经理陈舒歆对《AI光年》解释,“仅从硬件层面看,目前IDC定义AIPC是处理器中含有NPU就算做Hardware enabled AI PC,能够完成一些简单的计算。当NPU的算力在40-60TOPS,我们认为是Next Generation AI PC,它能够完成更多的运算。”
按照“标配NPU就算AIPC”这个标准,苹果自2020年推出的内置M1、M2、M3芯片的MacBook Air、MacBook Pro、荣耀最新发布的MagicBook Pro 16 及华为发布的MateBook X pro等都可以算作AIPC。
图片来源:未尽研究
但硬件层面算力仅是AIPC的基础。在硬件之上,中国需要等待各个厂商的智能体发展以及各个软件大模型的落地,以及智能体和软件相互配合的进一步优化。“软件层面和硬件层面是相辅相成的,也是在不断提升和发展的。未来这两个方面的优化可让AIPC给用户带来更好的体验感。”陈舒歆解释。
在联想中国区总裁刘军看来,靠硬件驱动的AIPC算AI Ready阶段的PC,真正的AIPC要让用户拥有AI个人助理。比如联想在2024联想创新科技大会上发布的多款内置个人智能体“联想小天”的AI PC系列产品。
在联想的规划里,“联想小天”不仅可以通过个人的旅行纪录、购物偏好这些存储于设备上的信息进行推理,做出行动,还可以根据用户的思维模式和行为频率去预测下一个任务,并主动提出建议,自主寻找解决方案。
内置大模型和智能体的AIPC仅是人工智能电脑的第一代。杨元庆表示,“这个智能体不一定对应一台电脑,也可以隐身于你的电脑或者家庭服务器。未来各种终端设备是协同互通,不管什么时候使用个人智能体,个人所有智能设备上的数据都可以用来学习和推理。未来每个人都会有人工智能双胞胎,数字永生成为可能,这是我们的理想。”
“把大象装进冰箱里”
虽然不同厂商对AIPC的定义不同,但总体而言,可以用一段话概括AIPC,即把千亿参数规模的大模型压缩,并内嵌至PC内,成为整个AIOS系统的内核。在这个过程中,联想等整机厂商要基于本地大模型构建智能体(Agent),把神经网络计算直接推向用户界面,成为个人AI体验的第一入口。
拆解来看,要把在云端部署的千亿级别大模型这头“大象”塞进“冰箱”(个人PC)里,至少需要三步,一是压缩大模型,二是打造基于本地大模型构建的智能体,三是建立开放、丰富的应用界面和生态。
“目前的AI PC是要把一个大模型压缩至70亿参数规模,并放到PC上来计算。”杨元庆对《AI光年》等表示。
在PC端侧运行大模型受算力、带宽、功耗等影响,对于为何选择在PC端侧运行70亿参数的模型,联想集团首席技术官芮勇对《AI光年》等透露,“70亿参数是现在能在PC端侧运行的比较平衡的模型,日后随着CPU、NPU、GPU的优化升级,PC端侧模型的参数也会扩大。”
而据《AI光年》获悉,当AIPC异构算力达到40 TOPS(处理器每秒钟可进行40万亿次操作)后,就可以支持至少70亿参数模型的本地推理。
虽然PC端侧的本地AI算力主要由CPU+NPU+GPU的AI整体算力构成,但由于NPU可专门优化神经网络工作负载,推出集成NPU算力的处理器已经成为英特尔、高通、AMD等芯片巨头的常规动作。
英特尔CEO帕特.基辛格宣布下一代超低功耗处理器Lunar LakeAI算力将超过100TOPS,仅NPU单元就可以提供大约45TOPS的算力;高通CEO安蒙表示,骁龙X Elite算力高达45 TOPS;AMD董事会主席兼CEO苏姿丰则透露,锐龙8040系列的NPU算力达到了39TOPS,今年晚些时候推出下一代Strix Point锐龙处理器算力将翻倍。