专栏名称: 人物

最好的中文人物报道

追 OpenAI 的人

人物 · 公众号 · 人物 · 2024-10-21 09:00

主要观点总结

智谱是一家中国的大模型创业公司，致力于在人工智能大模型领域追赶美国OpenAI。智谱的CEO张鹏保持冷静和专注，推动公司在技术上追赶OpenAI，同时也在探索商业化策略。张鹏相信大模型能改变人们的生活，改变世界，并期待将人工智能提升到一个新的层次，实现通用人工智能（AGI）。他期待机器能像人一样思考，让人类感受不到机器的存在。智谱的快速发展和技术创新，面临国内外众多大厂的竞争，但张鹏及其团队对未来充满信心和期待。

关键观点总结

关键观点1: 智谱的追赶和创新

智谱是一家中国的大模型创业公司，致力于在人工智能大模型领域追赶美国OpenAI。公司CEO张鹏保持冷静和专注，推动公司在技术上追赶OpenAI，同时也在探索商业化策略。

关键观点2: 大模型的商业潜力和影响

张鹏相信大模型能改变人们的生活，改变世界，并期待将人工智能提升到一个新的层次，实现通用人工智能（AGI）。他期待机器能像人一样思考，让人类感受不到机器的存在。

关键观点3: 面临竞争和挑战

智谱的快速发展和技术创新，面临国内外众多大厂的竞争，但张鹏及其团队对未来充满信心和期待。

正文

智谱对OpenAI的追赶，至少持续了4年。这是人工智能大模型爆发的4年。

智谱，是中国的大模型创业公司之一，也是截至目前，从技术、产品到生态全面对标美国OpenAI的公司。当人工智能大模型的热潮袭来，热钱卷入，这条赛道迅速变得拥挤，大家普遍都在焦虑，那款super App到底在哪里？商业化怎么做？能不能赚到快钱？像寻找武林秘籍一样，于是，江湖中出现了「百模大战」、降价之争……

智谱的CEO张鹏倒不太焦虑，有人形容他「情绪稳定得像一个AI机器人」。智谱现在做的，就是全力在技术上追赶世界顶级的OpenAI，至于商业化，那就「沿途下蛋」。

大模型相当于给这个世界在换引擎，这是一场巨大的、未知的变革。这个变革需要漫长的时间，不会是要么速胜，要么速亡。

很多时候，答案要靠时间一点一点揭晓。这同样也是张鹏冷静的原因。如果不是把大模型压在一两年的时间密度里，很多事情会看得更清楚。

文｜郑思芳

编辑｜李天宇

图｜（除特殊标注外）尹夕远

生死决策

一个决策会，能如此轻描淡写。

要不要做千亿参数的大模型？要在2021年12月的一天定下来。这是智谱自创业以来的第一件大事，事关生死的那种。

在公司CEO张鹏的印象里，「我们那天觉得必须讨论一下这件事」。来讨论的是这家创业公司的技术委员会成员。

决策会开了多长时间，具体多少人参加，张鹏都记不清了。他记得的场景是，沉默占据了决策会的大多数时间。「对于工程师来讲，不说话已经是最大的反抗了。」

反抗源自风险。投入至少是千万元人民币量级，想做成，至少八九个月。举全公司之力，把所有时间、资源都砸进去。

如果没干成呢？这家成立刚两年多的创业公司「就啥也剩不下了，可能就挂了」。

如果干成了呢？「那至少证明中国的大模型公司，技术能力也能达到世界级水平。」清华大学计算机系教授、智谱创立发起人唐杰说。

决策会最终全票通过：干。

为啥要干？「刺激」源于这家公司1岁生日那天。智谱创立于2019年6月11日，创立之初想法很明确，做下一代的人工智能，也就是清华大学人工智能研究院名誉院长、中国科学院院士张钹所说的，要发展第三代人工智能——认知智能。

2020年6月11日，智谱1周岁生日，美国人工智能公司OpenAI上个月刚刚发布了GPT-3大语言模型。这个大语言模型如同一个巨人般出现，轰动了全球人工智能的产学研各界。它的参数规模达到了惊人的1750亿个。此前两年流行一时的BERT模型，有3亿个参数；英伟达的Megatron-BERT，80 亿个参数；同年2月发布的微软Turing NLP，也只有170 亿个参数。

参数规模，决定了大模型的智能能力。通俗地说，这个自然语言处理模型中的「庞然大物」，不仅能做语言生成，而且阅读理解能力有了很大提升，能让人联想起学生时代《语文》课本里的一幕：「阅读全文，并总结段落大意。」这一点GPT-3能轻松自动完成。

GPT-3还能生成新闻报道的样本，人们很难区分这文章是机器写的，还是人类写的。

在智谱1岁生日这天，大家都在研究着这个庞然大物。当天，张钹院士也在智谱的庆生会上组织讨论：「GPT-3为代表的大模型，是不是我们所追寻的认知智能可能的解决方案？」

张钹院士出席2021年北京智源大会。

图源视觉中国

GPT-3的出世，把生成式AI带入了全新的时代。从学术界或者产业界的角度来看，2020年可以称之为大模型元年，标志着大模型的研究进入到全新的阶段。

可这个时候，中国人工智能大模型的技术水平，与GPT-3有相当大的差距。但如果大方向是对的，无论差距多大，都要追赶。

1岁的智谱迈开了追赶的步子，当时，张鹏还是这家创业公司的CTO（首席技术官）。在一年半的时间里，他带着智谱先后做出了十亿、百亿级参数的模型，这还不够。要不要把稠密的语言模型再扩大10倍，做一个对标GPT-3的千亿级参数模型？但是从百亿到千亿参数的研发，难度不是乘10倍那么简单，财力、资源的投入，对中国当时任何一家独立创业的AI公司都可以用倾家荡产来形容。所以才有了这次事关生死的决策会。

张鹏说，「不做，不追，你永远不知道你能跑多快，跑多远。」智谱董事长刘德兵也支持这个冒险，「如果明摆着资源来做，哪里还轮得到你来做？」智谱选择在最艰难的时间开始全身心投入到大模型的研发中。国外已经做出来了，但在国内，智谱即将踏入的是无人区，一旦踏进去，将会完全改变智谱的发展轨迹，甚至命运。

决策会后的第九个月，2022年8月，智谱联合清华大学打造了高精度双语千亿模型GLM-130B，参数规模1300亿。在GPT-3发布26个月之后。

说到研发的困难期2020年年底、2021年，张鹏说，算力就像粮草，是最大的资源。算力不够，我们就只能东一家西一家地去借，借到的算力，要一点一点抠出来，省吃俭用地分给工程和研究。

「穷人的孩子早当家。」张鹏说，要加快训练大型深度学习模型的速度，最快的办法就是用上高端的GPU芯片。GPU是专门用于高效处理图像和图形的处理器。2020年时，智谱终于等来了一批GPU芯片。这批芯片的参数和张鹏的需求相差了10%左右，但也能帮上大忙，原本是给视频游戏公司提供算力的芯片，被智谱以「捡漏」的方式得到。

为了更省，工程师们把模型压缩、量化、加速，让模型可以在更低的成本下运行。张鹏曾经算过一笔账，一项计算任务原本需要8张高端GPU卡，总价约100万元人民币，经过工程师们的努力，只要10到20万元的硬件就能同等效率地跑起来。正是这样的精打细算，让智谱挺过了创业早期的困难时刻。

理工男的记忆里，对重要时刻的印象，远不如技术指标的曲线来得深刻。张鹏说，他人生很多非常重要的决策都是这么过来的，平静，没有争吵，没有「激情澎湃」，甚至当时「没什么感受」，回头去看，哦，这件事情还是一个非常关键的点。

当然决策会上也有人在问，现在（在GPT-3发布一年半之后）才去做这么一件事情有没有意义？

千亿参数的大模型，放在2024年的今天，能跑出来的机构也非常少，在张鹏和智谱起跑追赶的时候，国内甚至还没有多少人知道OpenAI，更少有人知道大模型是什么。

人工智能大模型，是2023年的年度十大科技热词，指拥有超大规模参数、复杂计算结构的机器学习模型。它能够处理海量的数据，完成各种复杂任务，如自然语言处理、图像识别等。张鹏笃信大模型能改变人们的生活，改变世界。这是他和智谱当初选择追赶的意义。

大模型的出现，真的改变了普通人对人工智能的认知。以前是人想让机器学什么技能，就教它什么技能。教过的有可能会，没教过的就不会。现在，以前没教过的技能，它也开始「无师自通」了。有研究机构认为，在未来10年，知识工作者的效率可以提高4倍。你可能永远不知道，将有哪一篇文章、图片、报表、视频，是出自大模型之手。

创业初期近百人团队的智谱，人员构成也很「质朴」，以工程师居多，都是「技术特种兵」，其他部门的配置还不完备。GLM-130B发布会前，这个研发团队干了不少杂活儿：新闻传播稿是研发人员自己写的；产品需要一个logo，没这方面的专职人员，一位工程师就找了自己的女朋友代劳，临时设计出来一个。发布会当天，张鹏也没有和团队一起庆祝这重要时刻，他在深圳出差，因为疫情隔离没能回到北京，发布会也是在线上。

GLM-130B发布至今，收到了70余个国家、1000多个研究机构的使用需求，也成了全亚洲唯一入选斯坦福评测的主流大模型。更大的意义在于，它拥有与国际顶级机构不一样的技术路径——GLM（General Language Model通用语言模型），一个独属于中国的自研路径。自成一派，不会被「卡脖子」。

就在GLM-130B发布的三个多月后，2022年11月30日，又一枚「炸弹」来了，投放者还是OpenAI。

图源视觉中国

大模型的「核弹」

有必要介绍一下智谱追赶的对手，OpenAI。

它是当今人工智能领域的领头羊，历史上崛起速度最快的初创企业之一。这家美国公司于2015年12月成立，最初是一家非营利组织，创办者包括今天大家熟知的埃隆·马斯克。后来随着马斯克的退出以及大模型对资金超预期的需求，2019年3月，公司的性质从非营利性转变为「封顶」的营利性。

人工智能大模型太烧钱了。根据Tracxn（初创企业投资分析平台）的数据，截至2024年，OpenAI已经完成了7轮融资，累计筹集超过110亿美元。仅在人工智能训练方面，OpenAI的投入就达70亿美元，另外还有15亿美元用于人员配备。

公开资料显示，至2023年，智谱获得了累计25亿元人民币的投资，不及对手的1/30。一位中国的投资人透露，现在中国在人工智能投入的资源，可能都不如美国的一家公司多。

但它取得的成绩和这25亿，也足以让智谱成为当下中国的明星企业。投资者名单上，集合了一众互联网大厂，还有红杉资本、高瓴资本、启明创投、君联资本等。

在中国人工智能领域的新晋势力中，有着大模型「四小龙」的说法：智谱、月之暗面、百川智能、MiniMax。2024年2月，月之暗面获得了目前国内大模型公司单轮最大金额融资，超10亿美元，由阿里领投。市场估值上，智谱和月之暗面率先进入了「200亿人民币俱乐部」。同期，OpenAI的估值是800亿美元。

成为明星企业的智谱，却没有像其他「小龙」一样，CEO也有明星的光环加持。百川智能创始人兼CEO王小川，互联网江湖中的「大咖」，曾任搜狐CTO、搜狗CEO，后凭借技术实力和昔日积累的人脉，开始独自创业，百川智能的最大能量，来自王小川本人；月之暗面的杨植麟也是明星创始人，出生于1992年，是「四小龙」的CEO中最年轻的，他此前就在AI学术圈很有名气，清华90后学霸、AI天才这些标签，也让他成为大模型创业者里的新锐代表。

相比于这两位的名气和个性，张鹏显得很普通。清华本、硕、博出身，很多熟识的人对他的第一印象，是「没什么印象」。「从他的脸上，你看不到什么喜怒，情绪稳定得像AI机器人一样。」一位熟悉他的人说。

就连OpenAI投出那颗炸裂的「核弹」，张鹏的脸上也没见太大变化。2022年11月30日，OpenAI发布ChatGPT，这个全新聊天机器人模型，是一款革命性的产品，刚一上线便引爆全球，成为用户破亿速度最快的消费级应用。仅仅两个月，ChatGPT的月访问量就超过了6.7亿次。

ChatGPT的出现，标志着人工智能大模型在全球范围内真正「出圈了」，它从研发实验室或行业领域，跳跃到了普通大众的消费应用范畴。在行业里一直以来看不清前路的商业化，也在模糊中有了方向。

图源视觉中国

对于OpenAI投出的这枚「核弹」，人工智能领域一位专家的震惊在于，以前是猴子爬树，ChatGPT突然出现，让「猴子不知怎么就爬到月亮上去了」。

张鹏的反应倒出奇地平淡，「技术不是魔法。对于做技术的人来说，没有什么震惊的」。连「好神奇啊，怎么做到的」都不会有，技术都是有迹可循的，都是从以前积累下来的。

当然，ChatGPT刚出现时，张鹏和技术人员也会问它一些问题，常识性的、专项能力，甚至是很荒诞的问题，比如问它「太阳有几只眼睛？」主要观察它对人意图的理解，以及逻辑性。

智谱最初的研发重点是数据挖掘与科技情报分析。其实在ChatGPT出现之前，团队就做过预测，预计未来的3到6个月内，OpenAI会拿出一些东西来。「具体拿出来啥我们不知道，因为它那段时间动静就很少，信息保密已经很严格了。」张鹏说。

ChatGPT产生的爆炸力和之后产生的影响力，张鹏和团队也预测到了。于是，第二次追赶也开始了。

立刻集结队伍，调动所有的研发资源，把力量全部集中在这件事上。研发时团队的紧张程度，张鹏没有过多描述，只说「团队连年都没有过」。2个多月时间，智谱的对标版本就已经出现，可以对外去做测试了。在ChatGPT发布后的4个半月，智谱千亿基座的对话模型ChatGLM发布。

和「上一次GLM-130B发布会」一样，张鹏又没有和同事们一起，共同感受这重要时刻，他正在河北，从机场往高铁站的出租车上，赶着回北京。而此前的一天，他还在南京，去见自己的一位师弟——李智星。从CTO变成CEO，角色的转换意味着张鹏需要为团队挖掘更多独当一面的人才。

李智星，现任智谱政府客户事业部技术副总裁，为了延揽这位师弟，张鹏花了5年时间，可以说是三顾茅庐。

两人相识于2012年，李智星在清华攻读博士后，在东主楼的205实验室第一次见到张鹏。那时都是理工男，两人一起出国做项目，穿着都很随意，饿了就买三明治顶饥，吃腻了就买罐辣椒酱，自己煮饭拌着吃。张鹏是湖北人，爱吃辣，肠胃又总不太好。从实验室走出来之后，李智星先是在重庆的一所高校教人工智能，后又任职互联网大厂的部门负责人。

张鹏第一次找李智星，是在智谱刚创立的2019年，当时李智星回绝了。第二次是在2021年，李智星从阿里离开，原本是加入智谱的最好时机，当时张鹏和智谱的创立发起人唐杰还和他吃了一顿饭，连待遇都谈好了，但想到家人还在杭州，李智星又一次拒绝了。第三次是在2023年的3月13日，那天是周一，李智星在南京的一家咖啡厅里见到了从深圳赶来的张鹏。

「哟，你这穿的。」李智星和张鹏打招呼。南京的3月还有点凉，那天，张鹏穿着一件商务夹克，连头发都打理得很精致。第二天他计划要赶回北京参加ChatGLM的发布。

「其实不用他说，我也早就想来了。」李智星在等待一个时机，现在，时机到了。

这是李智星看到的第三波机会。第一波是21世纪初前后的互联网兴起，只要会写一个GSP（Generalized Sequential Pattern，一种常用的序列模式挖掘算法）或是ASP（Active Server Pages，动态服务器页面），门户网站就起来了，所有的草根都有机会。第二波是二零一几年，那时都在说「大众创业、万众创新」，移动互联网开始爆发，信息技术、计算机技术渗透到生活的方方面面。大模型对他来说就是第三波机会，而这次，机会正好被摆在了他的眼前，之前也有过很多人脸识别、智能客服的小创新，但都不像大模型这样渗透到生活的方方面面。

「对于我们做 AI 的人来说，这其实是一个非常积极的信号。以前我们觉得这个天花板非常矮，很快就触碰到了，也就变成了传统工程的东西了。但是ChatGPT出来之后，我们发现大模型的天花板一下子被提得很高。这中间有很多事可以做了，那这个时候肯定要上嘛。」李智星说。

和以前的待遇比，是降薪，原本近在身边的妻子和女儿，也变成每半个月从北京飞杭州才能见到一次，但李智星还是来了，重新回到了曾经求学时的北京五道口，随张鹏一起，在大模型这个时势下，寻找更大的空间。

像这样怀揣着技术理想主义的人，智谱还有很多。

受访者供图

「爆发后」的大模型江湖

彼时正处在ChatGPT发布后的震动期、中国的大模型热潮之前。

回顾人工智能的发展史，从20世纪50年代人工智能技术诞生至今，先后四次引发大规模的关注，分别是专家系统时代、机器学习时代、深度学习时代和大模型时代。前三个时代，由于数据、算力、场景落地和投资回报等方面的原因，没能形成AI产业的商业闭环。到了现在的大模型时代，基于通用性、涌现性、强算力的特征，大模型时代最有望形成商业闭环，有技术的可行性和未来巨大的想象空间，众多玩家涌入大模型赛道。

ChatGPT更是给这个赛道朝天空打响了信号弹。正是在2023年，大模型热潮席卷全国，也被媒体称为「百模大战」。

亿欧智库发布的《中国「百模大战」竞争格局分析报告》显示，截至2024年，国内公布的大模型数量已经超过300个，一个显著特征是：各互联网大厂纷纷挤上赛道。百度的文心一言、阿里的通义千问、腾讯的混元大模型、抖音的云雀大模型、美团大模型……不但自己的大模型产品落了地，而且在投资市场上，也对AI创业公司广撒网。

以大模型「四小龙」为例，智谱的投资方有阿里、腾讯、美团，百川智能背后站着阿里、腾讯、小米，月之暗面是阿里、美团，MiniMax是腾讯。

一个背景是，由于近两年的经济形势，投资市场相比于几年前更加谨慎，大模型突然间成了所谓的「风口」，也迅速卷进来热钱。如同其他行业的风口一样，各大公司想迅速彰显影响力，抢占市场。「百模大战」越来越热衷于「刷榜上位」。

「从数量上说，国内的基础大模型研发机构已超过全球其他国家的总和，但在『质』的飞跃上与世界级产品还有很大距离。」王延峰说。

王延峰是上海市人大代表、上海交通大学人工智能研究院副院长。2024年5月，他对媒体说出了当下中国大模型热潮中的「水分」。几个月前，中国人民大学与伊利诺伊大学厄巴纳-香槟分校的研究揭露了大模型评测中的漏洞，即一些模型在训练过程中直接使用「测试集的数据」进行训练，导致评测分数的虚高和直接「通关」。

「这种五花八门的测试方法可能会导致技术的过度包装，进而造成市场化的混乱。」王延峰接受媒体采访时说。

「竞争乱战之下，整个行业都非常焦虑。」在《人物》访谈中，多位大模型业内人士都表达了类似观点。

张鹏觉得，「其实没必要那么焦虑。让子弹再飞一会儿吧，刚刚出枪膛的，你说它能不能打中那个目标？」

张鹏对焦虑有着不一样的理解。他把焦虑分为外源性和内源性两种。「内源性的压力来自对自己更高的期待，我有没有找到正确的方向？有没有找到正确的路径和节奏？离目标是不是越来越近？」张鹏确信他和智谱走在自己的步调上，这样的压力不至于让他焦虑。外源性焦虑是来自大环境变化给的压力，情绪的波动也主要来自外界各种信息的干扰。这时候即便大模型一般的大脑，也会有人体生理上的局限。「人的大脑强就强在是一个物理整体，不能切割，弱也弱在这儿，很容易受到其他东西的干扰。」

技术的迅速演进，吸引了原本不在这条道路上的人涌入，同时影响着整个行业的风向、资源。事实上，在「百模大战」开始之前，融资就是智谱的一大挑战。后来关注的人多了，可以融到钱的机会也更多了，张鹏要找的是信念、认知一致的同行者，他们要携手一起长期奋斗。

最频繁的时候，张鹏一天要见三四位投资人。最开始，他和团队需要和对方解释大模型到底是什么。ChatGPT出现之后，所有人都看到了它比以前的任何人工智能都更接近一个「人」。他不是苹果Siri、微软小冰或者天猫精灵，而是可以实现多轮对话的聊天机器人，可以写代码、写营销文案甚至生成图片和视频，虽然并不完美，但看起来无所不能。这也减轻了张鹏的沟通成本，他不用再和所有人解释什么是大模型了，只需要说，「我们要做的事情就是和OpenAI对标。」

后来，投资人问得最多的问题则是「大模型怎么挣钱，商业化怎么做？」有的投资人问得更直接：「OpenAI一年要亏50个亿（美元），你亏得起吗？」张鹏回答：「那你先给我50个亿。」

对大模型这件事情，长期的确定性，大家是一致的，没有人质疑这是一件革命性的事。但对于短期的确定性，大家是不一致的。很多人都想通过它赚快钱。如果没有实现赚一票就走，他们自然会更焦虑。

于是出现了很「分裂」的场景：投资人开会，主题是长期主义，但是同时也在催企业去挣钱。这样矛盾的事情在这个领域里经常出现。张鹏理解这种分裂，「时间是容易被很多人忘记的尺度。过去可能需要花10年甚至20年来投入的事情，在大模型这件事情上被压缩到了两三年，大家很难不焦虑。」

比消除焦虑更要紧的是，怎么能够在有限的时间尺度里把认知的差距拉齐。2023年下半年，一些消极的声音开始出现，争论「到底需不需要通用大模型」。这样的声音越大，越是挤压了大模型领域的空间。在一次公开场合，张鹏也发表了大模型走向分层的看法。没多久，张鹏在机场的摆渡车上，接到了一通老熟人的电话，对方正是有段时间没联系的王小川。电话里，王小川赞同了他那次公开的言论，「他说这个挺好的，大家应该一起来推这样的事。因为他可能也碰到了这样的一些问题，市场的声音很杂乱，大家认知不一致，其实对于我们这种大模型创业公司来说，是不太友好的」。两人都希望，能够从创业者的角度统一一个专业的认知，把明显看起来有问题的概念驱逐出去，不要让劣币驱逐良币。

一边清除「杂音」，一边全力追赶，刚刚花4个半月标齐ChatGPT的智谱，在ChatGLM发布会的当天，就遭遇了「暴击」，这条跑道上，对手又一次「提速」了。

更重大的命题

也就相差几个小时。

2023年3月14日，智谱发布千亿基座的对话模型ChatGLM。深夜，张鹏还在出租车上，用手机刷着关于智谱ChatGLM的动态。15日凌晨一点，OpenAI发布了GPT-4。消息瞬间淹没了手机，按美国当地时间算，发布日期和ChatGLM（发布）都是在14日。

不只如此，就像事先约好了一样，Anthropic也发布了对标ChatGPT的Claude，谷歌推出对抗OpenAI和微软组合的PaLM API服务（Bard）。这一天堪称「大模型里程碑日」。

回到那天，出租车在高速公路上飞驰，暗夜里，手机屏幕的一点光亮把张鹏脸上的表情照得清晰可见，看着GPT-4的技术报告，张鹏苦笑着自言自语，「我们好不容易花了几个月，年也没过，把这事弄出来了，结果『砰』一下，人家又放这么一个东西出来。」

「我们甚至还没来得及庆祝，对手就又给你立了一个更大的目标。」

要继续往前看，智谱又开启了第三次追赶。

2024年1月，智谱迭代新一代基座大模型GLM-4。同样对标OpenAI的GPT-4。

今年1月，智谱发布基座大模型「GLM-4」。

3和4两代大模型，GLM对GPT的追赶，从26个月缩短到了10个月。至于那款ChatGPT核弹级应用的追赶，则是4个半月。

追赶的同时，张鹏也背负着一个更重大的命题——公司的商业化。2023年3月，智谱开始组建商业团队。

现在，张鹏的很大一部分精力，都花在公司的商业化上。这是一个CEO必须做的。但在最初，他的理想只是做一名工程师。参与创办智谱之前，张鹏已经在实验室里待了15年。

那是清华大学计算机系知识工程实验室（KEG实验室），成立于1996年，是张鹏的老师王克宏从国外回来后，力主建设的。清华本科毕业后，张鹏作为硕士研究生进入了KEG实验室，他也是后来才知道，自己研究的知识图谱，祖师爷是美国国家科学院院士、图灵奖得主、入选IEEE智能系统首届「人工智能名人堂」的爱德华·费根鲍姆。那时，他就感受到国内外人工智能领域的巨大差距。

导师王克宏很务实，比如，他在1996年就给实验室的所有学生提出了「P to P」的理念，「Paper to Project」（从论文到项目）。「单纯做理论研究不做工程，这件事情是没有未来的。」导师的话，他到现在都记得。

那时，张鹏性格有点内向，不善于跟大家打交道，他喜欢实验室清静的氛围和环境，天天跟聪明的人在一起，接触世界最顶级的研究成果和信息，对于工程师来讲，这是最好的地方。

爬山时的张鹏

受访者供图

李智星也记得实验室里的张鹏。话不多，对生活上的要求更不多，但他有自己的执着。实验室开发了XLORE和AMiner两套系统，前者是一个跨源的知识图谱，后者是一个科技知识挖掘平台。很多时候实验室的产品和工程可能由学生来开发，张鹏作为实验室老师，只需要设计架构和定期规范，但当学生开发得不尽如人意时，张鹏什么也不会说，直接下手亲自搞定。

实验室不是完全「闭关」，也会承接一些社会上的项目，比如政府侧的需求和企业客户的订单，到后来，实验室不但自给自足，而且有了盈利。可以说，智谱商业化的资源，最初是从实验室积累的。2019年公司成立，算是AI创业公司的先行者。

工程师和CEO的不同？2024年8月，在接受《人物》访谈时，张鹏笑了，比如，做技术的人和外人讲起本行来，可能很少考虑对方听不听得懂。最开始，解释这个工作让张鹏很不适应，「这都不是常识吗？」很快他就感知到，听完他探讨技术，对面的眼神中都充满了迷茫。「有九成以上的人听不懂，但又对此充满好奇」，他意识到，这就是AI真正走进人们生活中的认知差距。

一个工程师，一个搞技术出身的人，很多时候相当理想化。「你说让我拿个半成品跟客户去讲，嗯，根本做不到，我一定要基本上是 perfect 这个状态才可能拿出来去说。」可问题是，技术等不到（perfect）那一天，技术也在不断演进。当下的市场环境也等不到那一天。「只能一边追赶，一边沿途下蛋。」

沿途下蛋，也是智谱的商业化策略。因为毕竟不是纯研究机构，而是创业公司，从这个角度讲，与工程师相比，CEO做的事可能更复杂。「赚钱这件事情是很复杂的。」

一家创业公司会议室的样子，大概能体现这个公司的风格，比如传媒公司会把会议室叫「百万+」，新闻机构给会议室起名「光明顶」，智谱的会议室名称，是以AI历史上关键的产品命名，其中两间是以智谱最重要的两个产品GLM和ChatGLM命名。和公司里其他科技感、未来风的透明办公室相比，这两间会议室都有深褐色的木质长桌，同色系的木质椅子，椅座配有黑色皮质靠垫和坐垫，会议室的装修风格沉稳厚重。访谈当天，其中一间会议室被预留，客户是政府部门的。

全方位地认知市场和客户的需求，也要时刻判断哪些是有问题的，或者是伪需求，是张鹏作为CEO的必修课，有时他会引导客户用更好的方法解决问题。

有一次见客户，飞机落地时就已经是晚上八九点，张鹏拉着行李箱直接杀到了客户的办公室，客户也很热情地准备了咖啡、蛋糕、水果，看这架势张鹏知道，客户不会那么早就放他走。深夜，在办公室的白板上，张鹏画了一圈又一圈的演示图，解释为什么要有一个基础设施，再有一个平台，才能赋能所有的业务。又讲到大模型和传统智能模型之间的差异，它最大的特点是泛用能力比较强，如果不利用这种特性的话，ROI（投资回报率）是一定不好的。

客户却并不这么认为，对方并不想一开始就有太多投入，只想让张鹏先做一个东西来验证。张鹏知道客户的顾虑，但也提醒一点，验证是可以，但做出来的东西仅限于验证，验证出来ROI也是不通的。最后客户还是同意了张鹏的方案。

如果从客户合作案例观察，智谱明显是一个to G、to B的企业，在业内人士看来，它在to C端的产品，还没建立起明显的竞争优势。有人认为，「智谱从出生的那天起，好像就缺乏to C的基因」。在国际上追赶OpenAI，并不代表他们在国内就一骑绝尘。众多大厂挤进赛道，一边成为智谱的投资方，一边又成了他的竞争对手。这些大厂，拥有雄厚的资金实力和广泛的C端基础。这些巨头对任何一家创业公司来说，都是一个危险的存在。

面向C端，智谱也早就建立了智谱清言APP，截至目前，C端用户在智谱清言上的应用，大多是免费的。

智谱并没有公布C端的用户数量。但有另一个数据可以参考，Questmobile的AI智能体应用洞察半年报显示，今年7月，豆包占据AIGC APP月活跃用户规模榜首，而智谱清言以245万月活用户排名第八。

「to B和to C之间的界限已经被打破了。」张鹏说，企业无非两大部分组成：人和组织。服务好企业里的每个人其实就是在服务这个企业。组织跟个人不一样的地方是多了流程、协作和组织架构，其实也是人和人之间的关系。

每一次发布，智谱都会优先把产品放到清言这个平台来让用户体验，第一个目的就是能够快速让大家可用。发布即可用，这是张鹏一个很重要的理念。后来他在分享的内部文章中写了一句话：不完美但可用的东西，比完美但不可用的东西更有价值。这是张鹏在成为CEO之后的一个最明显的变化。

大模型技术的创新依旧突飞猛进，而飞速变化的不只是技术，还有价格。智谱也成了今年最早一批降价的大模型创业公司之一。

5月11日，智谱宣布入门级产品 GLM-3 Turbo 模型调用价格从5元／百万 Tokens 降至1元／百万Tokens，降至原本的1/5。3天之后，OpenAI发布最新模型GPT-4o，定价比GPT-4 Turbo减半，并且应用端向所有C端用户免费开放。实际上，每次推出新模型都比上一代模型价格减半，几乎是OpenAI的固定操作，不过这一次常规降价，却成了国内大模型价格战的一个引子。整个5月份，不下7家大模型企业加入到这场混战中，包括字节跳动、阿里云、百度、腾讯云等互联网大厂以及垂直赛道头部玩家科大讯飞，降价动作最接近也就相差几个小时。

「降价是智谱持续在做的，不是为了应对市场压力，或者跟竞争对手打价格战。」张鹏表示，「作为一家初创企业，我们烧的是投资人的钱，我们没有资本去打价格战。所谓的价格战不是我们发起的，我们只是正常地根据技术进步迭代把价格往下放，因为我们的成本已经降下来了，就不用坚持原来比较高的门槛。」

「把它秒了」

2024年9月初，智谱刚刚完成最新的一轮融资，金额数十亿元，领投方为中关村科学城公司。

在接受《中国企业家》的访谈时，张鹏介绍了这轮最新融资。他说，「我们有自己的融资节奏，在不同阶段为不同目标去融不同的钱，跟不同类型的投资人接触。这次融资由中关村牵头，也有一些其他的投资方，因为到了现在这个阶段，需要各方的支持，包括市场化的基金和官方（资金）。」

和世界顶级大模型公司的追赶和比拼，让张鹏意识到，「我们面临着可能是一个跨阶梯的阶段。我们可能要把自己的整个能力提升到另外一个level上去，这个时候可能就不是单纯靠技术，或靠自己自然增长的产品能力，去做（成）的一件事情。」

「沿途下蛋」，是商业化策略，但张鹏站在全局的战略思考是：需要更多撬动战略性力量来参与这件事，因为它已经上升到更高层面。

「百模大战」仍在持续，有风口就会有人跟风，有跟风就会有摇摆。哪怕是一个小小的震荡，也会引发蝴蝶效应，去年，ChatGPT的流量增速出现下滑，国内立刻出现悲观的论调，很多企业融资随即遇到困难。截至目前，全球范围内，对大模型还没摸索出一套成熟的、行之有效的商业模式。这个突破口，至今没有找到。中间会发生什么样的变数，不知道。

对于张鹏和智谱而言，外界也有一些疑问：和OpenAI的实力差距是多少？还需要追赶多久？

张鹏会想起小时候玩过的一个游戏，打砖块：屏幕上端是堵砖墙，下端是一个小球和挡板。

用挡板拦住小球，弹射砖块，目标是把砖墙全部击碎。随着关卡难度的上升，砖墙越来越厚，这时候需要找到突破口，一旦小球进入突破口，就会加速破壁。

在张鹏看来，创新这件事和打砖块一样，先易后难，关卡的障碍越来越多，突破口也越来越小，有时只是一条缝隙。难就难在很少有人去真正地找那个缝隙。或者像挖井一样，挖了几锹，走了，其实水就在下面。

对于差距的问题，张鹏说，「工程师就这么讨厌，需要特别讲逻辑，尽量保持严谨。就看你从哪个层面上说。单从技术上说，我觉得这种代差或者时间差上，我们已经追到非常接近了，半年到一年」。

智谱的科学家许斌，更愿意把两家公司做的事比喻成登山。就像南北两面攀登珠穆朗玛峰的两支登山队，不同的是，有人提前用自己坚信的技术路线登上了珠峰的山顶，而有的人还在山腰上，山腰上的人已经知道自己不是攀上珠峰的第一人了，虽然遗憾，但同时还有一种信号被释放出来，珠穆朗玛峰不是真的高不可攀，人类可以攀登上去。

至于是不是第一名，当然很重要，但更重要的是，在过去几十年里，期待和失望反复交替出现在人工智能历史中，现在反而让他们能百分百确定，现在是认知智能登顶的时刻了。

智谱有着自己的定力和底气，它和其他公司最大的不同就是：「含清率」。

当年高考，张鹏没有跟家人征求意见，只填报了一个志愿：清华大学。他和公司创立发起人的唐杰、科学家许斌、董事长刘德兵、投资人李家庆、师弟李智星，都是出自清华。

现在，智谱也有很多毕业于清华大学的员工。如果你来到智谱位于11楼的办公室，可能会看到这样一幕：一个男生穿着睡衣和拖鞋，从你身旁慢慢走过，晃晃悠悠像是在梦游。随便一问，这个年轻人可能就是一个研究员，再问履历，不是哪个省的高考状元，就是哪个地区的高考第三名。

着装对这些年轻人来说不重要，重要的是：把它秒了。

这是这家公司的专属语，通常语境是，哪个技术难关需要攻克，有人头都不抬应一句：「哦，那把它秒了吧。」年轻人晚上睡不着觉聊天，聊出好点子，「明天把它秒了」，第二天就能见成果。外面的人们看不到的是，但凡遇到重大的挑战，这些年轻人，大年三十也会在工位上「秒」。

在这些年轻人中间，你可能听不见有什么多余的话，但是张鹏说，这里的所有人心里都有技术理想，也相信总有实现的那一天。「理想」这两个字大家嘴上从来不说。任何行业都不缺理想，但这里的每个人都见过清华大礼堂前日晷上的四个字，「行胜于言」。现在出了校园，铭言也在智谱出现，只不过换成了「do it now」。

团队中极少有人见过张鹏发火，唯一的一次，是一件事情大家在犹豫做不做，放在时间维度上，还真的不是所有事都能「do it now」。那次，张鹏这个身材清瘦的CEO气得直接拍了桌子，在他的逻辑中，一件事要么做，要么不做，但是不能在团队里出现内耗。

其实公司离校园并不远。2024年1月，智谱搬了新家，在搜狐网络大厦，办公区占据大楼7—11层的空间，离清华大学不到3公里。这原本还是搜狗公司的总部。大厦正好站在一个「AI的十字路口」，原本王慧文的光年之外占据了大楼的三层，路的另一侧有「清华系」代表团队聆心智能和深言科技。

站在智谱7层的落地窗前，往西远眺能看见颐和园的万寿山，往北366米是清华大学FIT楼，也就是清华大学信息技术研究院院楼。张鹏在清华度过了将近20年的时间，FIT楼建成以后，他的时间基本是在这里度过。现在，智谱GLM大模型的图文介绍被张贴在FIT三楼的宣传栏中。

追 OpenAI 的人

主要观点总结

关键观点总结

关键观点1: 智谱的追赶和创新

关键观点2: 大模型的商业潜力和影响

关键观点3: 面临竞争和挑战

正文

请到「今天看啥」查看全文