专栏名称: 中国企业家杂志
多年来持续关注企业家阶层的生意与生活。打造最快捷高效的商业资讯交互平台,实现您的商业梦想与精神追求。
目录
相关文章推荐
人力资源管理  ·  烟草员工薪资曝光: ... ·  18 小时前  
清华经管学院职业发展中心  ·  招聘 | 喜马拉雅2025届春招正式启动! ·  昨天  
HR新逻辑  ·  AI+HR实战:用DeepSeek提升HR工 ... ·  昨天  
HR新逻辑  ·  薪酬管理10大新趋势,收藏! ·  昨天  
51好读  ›  专栏  ›  中国企业家杂志

对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示

中国企业家杂志  · 公众号  · 职场  · 2025-02-25 14:38

主要观点总结

本文是对中科闻歌董事长王磊的采访,他谈到了DeepSeek的出现对AI行业的影响以及中科闻歌在AI领域的发展。王磊认为AI是场马拉松,企业需要坚持。他还谈到了从科学家到创业者的转变,以及决定做雅意大模型时的关键决策。最后,他对2025年AI行业的变化进行了预测。

关键观点总结

关键观点1: DeepSeek的出现对AI行业的影响

DeepSeek给AI行业带来了震撼和启示,推动了全球AI市场的应用落地和产业化进程,激发了更多的创新。

关键观点2: 中科闻歌在AI领域的发展

中科闻歌专注于AI+媒体领域,随后将业务触角拓展至金融、医疗、能源等领域。推出雅意大模型等产品和解决方案,助力企业提升生产效率。

关键观点3: 王磊从科学家到创业者的转变

王磊从中国科学院的科学家转变为创业者,带领中科闻歌走在AI技术的前沿。他强调了技术创业中既要技术立得住,更要接地气的重要性。

关键观点4: 决定做雅意大模型时的关键决策

王磊在决定做雅意大模型时面临了巨大的压力和挑战,但他坚信技术是企业的核心竞争力,果断决策投入大模型研发。

关键观点5:




正文

未来,我们可能需要构建自己的统一计算框架,一旦能够打造好,那国内的 GPU芯片生态建设必将向前迈出一大步。

采访 何伊凡
|《中国企业家》记者 赵东山

编辑 姚赟

头图摄影 |邓攀
腊月二十八那天,中科闻歌董事长王磊跟团队开会到凌晨2点,技术嗅觉敏感的他们一直在讨论DeepSeek可能给自己及行业带来的影响。

2025年春节前夕,DeepSeek AI智能助手同时冲上中美iOS免费应用排行榜第一,因在技术优化、成本压缩以及开源模式上的优势,迅速在全球AI大模型圈引起冲击波,迄今热度不减。

“真正的变革是在此之后的AI技术快速普惠,以及行业、个人应用层的加快变革、创新,未来18个月,我们将看到各行业AI渗透率迅速突破零界点。”身处行业中心的王磊给出了自己的思考。

春节过后,中科闻歌旗下智川X-Agent平台也全面接入DeepSeek全系大模型,通过多种模型的支持,其客户可快速构建行业AI应用,如AI搜索、翻译、客服、报告生成等,降低技术门槛,缩短开发周期。

2017年,王磊离开中国科学院自动化研究所,创立中科闻歌。其核心创始团队除联合创始人罗引博士等青年科学家外,还有海外归国教授、IEEE Fellow、AAAS Fellow、中国科学院自动化研究所研究员曾大军。曾大军早年在美国卡内基梅隆大学攻读人工智能博士期间,导师便是智能体(Agent)理论的主要奠基者之一。

2018年,国家提出融媒体建设,中科闻歌很快专注于AI+媒体领域。王磊回忆,“那年飞了174次,平均两天一趟,甚至还在大雪纷飞的晚上困在内蒙古呼和浩特到山西右玉县高速路上。 随后的5年间,中科闻歌又将业务触角拓展至金融、医疗、能源等领域。

2022年ChatGPT问世,王磊果断决定自研雅意大模型。到2024年,中科闻歌收入已达数亿级,其中超一半营收跟雅意直接相关,80%以上收入源于雅意强大支撑,生态合作空间广阔,交付项目周期显著缩短,复杂项目从过去交付的6~9个月降低到现在的3个月左右。

过去两年间,资本对大模型创业公司态度快速经历从技术信仰到务实落地的翻转。DeepSeek引爆全球AI大模型圈之后,一切都变了。甚至金沙江创始合伙人朱啸虎也从认为“大模型六小虎的最佳命运是被大厂收购”,到如今的“今年最佳的投资主题是China AI”。

在王磊看来,机会来了。

过去7年间,中科闻歌既做了底层AI大模型和数据技术,推出国产全自主知识产权雅意大模型、优雅多模态视频模型、决策智能操作系统DIOS,专注决策智能和大规模机器学习模型的研发;同时,也更专注上层行业应用。

2024年12月,美国AI数据分析公司Databricks获得100亿美元天价融资,超过OpenAI上次60亿美元的融资纪录,成为当年规模最大的一笔风险投资。王磊分析:“数据+AI市场前景广阔,正是因为决策智能化时代的到来,使得Databricks这样以数据为驱动、以创新AI基础架构为支撑、做大数据应用落地的企业成为资本市场的宠儿。”

沉浸AI赛道多年的王磊对AI的判断更为深刻,他表示: “AI是场马拉松,企业级AI价值已来,这不是短期资本游戏,而是持续20年的智能革命,坚持最重要。”

摄影:邓攀
以下是《中国企业家》对中科闻歌董事长 王磊 的访谈实录(有删减):

DeepSeek的震撼和启发

《中国企业家》: 在使用和研究DeepSeek时,受到怎样的震撼?

王磊: 可以总结为中文理解效果、技术创新性、成本降低、AI生态贡献这4个方面。

DeepSeek不是横空出世,R1之前就有很多版本,我们一直在关注。刚开始主要是觉得效果好,尤其中文能力突出,如果以前的AI中文水平是信和达,现在有“雅”的感觉了。

后来看到他们的技术报告,发现技术有很大创新性,尤其DeepSeek-R1在后训练阶段大规模使用低数据样本的强化学习,采用MoE+RL (混合专家模型结合强化学习) ,在仅有极少标注数据的情况下极大提升模型推理能力。

来源:视觉中国
R1训练成本也是ChatGPT的1/10到1/20,成本大幅降低也让人很欣喜。以往大家都觉得训练模型需要高成本、多芯片,花很多钱,成本下降会让大家更想深入参与这件事。

此外,DeepSeek把技术论文等开源,还允许用R1做数据蒸馏训练自家模型,对生态方面的贡献也非常大。原来我们老觉得中美AI之间还是有很大的距离,但DeepSeek的出现让大家意识到只要敢于创新和突破,就能跟世界顶尖AI水平并肩。

我认为,DeepSeek的火爆更将极大推动全球AI市场的应用落地和产业化进程,中国市场庞大,AI行业应用企业迎来全面爆发,我们甚至会孕育出一批类似互联网时代的AI平台型和应用型企业。

《中国企业家》: 开源和闭源之争也是此次行业争论的关键问题,DeepSeek的火爆可以理解为是开源的胜利吗?

王磊: 开源和闭源的争论,早在软件时代就存在。虽然我看好开源,但仍然认为在闭源领域率先突破也非常必要。

开源开放生态有助于生态创新和技术发展,但我们应该充分理解闭源模型,他们在前面的探索中投入了大量资源、资本和努力,应该鼓励他们保护知识产权成果。当他们保持技术优势后,先部分开源,再逐步全面开源,这也是一个行业螺旋上升的过程。

《中国企业家》: DeepSeek的训练成本引起了很多关于工程优化创新的讨论,很多人认为他们绕过了英伟达的CUDA平台,提升了节点间的通信效率,你怎么看?

王磊: CUDA(英伟达公司设计研发一种并行计算平台和编程模型,包含了CUDA指令集架构以及GPU内部的并行计算引擎)是大模型训练中重要的算力工程管理平台,在优化使用与提升效率层面发挥关键作用。毕竟,当几千张甚至几万张卡并行运作时,如何充分利用每张卡运行性能,提高利用率、计算并行度,让算子执行效率更高效,一直是训练模型过程中需要考虑的问题。

这次媒体有一个误解是把PTX(Parallel Thread Execution,一种底层硬件指令集,用于直接与GPU驱动函数进行交互,实现更为精细的硬件操作)和CUDA分割开,其实PTX也是CUDA的组成部分,只是它更贴近硬件。 CUDA本质上是用于操作大规模GPU卡的操作系统,而PTX处于更底层,下面还有一层是机器执行语言,从DeepSeek论文中可以看到,靠近硬件层确实还可以做一些技术优化,节省时间与成本。

未来,我们可能需要构建自己的统一计算框架,一旦能够打造好,那国内的GPU芯片生态建设必将向前迈出一大步。当然离不开AI开发公司和研发公司共同努力,这次DeepSeek在这方面的工作就激励更多技术人员深入底层硬件开展相关工作。

《中国企业家》: 你觉得为什么是DeepSeek做到了?

王磊: 目前国内能够在大规模算力卡上进行训练的队伍并不多,除了有这样的环境,还需要有优秀的、合理的人才队伍,各个层次的人才都要具备。DeepSeek得益于有很好的硬件训练环境、人才齐备等相关条件,他们的创新也会激励更多有实力的企业投入AI研发。

《中国企业家》: 目前业内认为它的创新之处,除了降低成本,还在于不需要有监督的微调,你认同这一说法吗?

王磊: 既认同,也有不同观点。我认同它从V3到R1的训练过程中,主要创新亮点是通过少量冷启动数据提供样本,基于强化学习框架,通过评价机制提升模型能力,进而达成目标,而不是依赖于过去大量提交标注和提示词的模板。这在强化学习提升模型能力方面,确实另辟蹊径。

在实际产业落地层面,有两个关键边界, 其一,当涉及医疗诊断、复杂科学问题解决等场景时,高质量训练语料进行微调依然是非常经典、可靠的实现路径;其二,虽然R1在文本生成、中文方面表现出色,但在专业领域的深度推理能力仍有很大提升空间。像闻歌这样既具有高价值行业数据,又能够进一步从底层优化模型能力的团队,将越来越不可或缺。

《中国企业家》: 他们采用的MoE+RL的方式,是重要创新之处吗?

王磊: MoE(Mixture of Experts,混合专家模型)是一个经典路线,我们提出问题之后,它可以自动路由到局部专家模型,专家模型在训练时可以分而训之,回答时不需激活全局参数作答,这大大降低算力消耗。

DeepSeek也存在一些其他大模型共性的不足,比如推理过程不够简洁,幻觉和安全性问题依然很大程度上存在,基础常识和复杂问题准确性不一致等,这都亟待解决。

《中国企业家》: 因为这一次DeepSeek没有公布预训练的语料,经过个人使用,你感觉它的预训练过程有什么特点?

王磊: DeepSeek预训练的Token规模相当大,达到14.8万亿,这也充分说明在预训练阶段,Scaling Law(规模化法则,也称尺度定律)还是非常有意义的,语料的收集整理以及高质量语料还是起着关键作用。当然也十分期待未来在预训练阶段,仅通过少量语料输入就能实现良好模型效果。

《中国企业家》: 最近朱啸虎态度180度大转弯,表示他都快相信AGI了。你觉得AGI到底还有多远?你理解的AGI是怎样的?

王磊: 诺贝尔奖获得者、AlphaFold创始人哈萨比斯认为,现在离AGI至少还需要2~3个Transformer量级的成果。当AI大模型既能理解高深复杂的问题,又在常识性问题上表现出色,对简单和复杂问题达到精准理解和高质量作答的一致性;同时,这些AI工具还必须能够极大推动行业研究、工业生产及日常生活的进步,这是AGI的基础。

我很认同他的观点,我不认为AI会取代人类,AGI状态应该是人机共融,就像我们公司的名字“闻歌”,闻弦歌知雅意,高山流水、人机共融,技术与人类社会发展和谐共生时才是我期待看到的AGI时代。

《中国企业家》: 所以观念对齐很重要。

王磊: 是的,全球都很重视这块。我作为实验室副主任,与中国科学院自动化所的研究员曾毅,在北京市科委的支持下成立了人工智能安全与超级对齐北京市重点实验室。目前我们太多关注AI的超级智能边界和能力,而安全对齐是发展人工智能的必经之路。我们实验室就是致力于在人类价值观和人机和谐共处方面实现进一步的安全有序对齐。

DeepSeek给行业带来哪些机会

《中国企业家》: 我们看到智川全面接入DeepSeek,全面接入的含义是什么?

王磊: “智川”X-Agent是闻歌推出的面向全行业的一站式智能体开发平台,内置我们具有自主知识产权的雅意大模型,也支持按需接入国内外先进大模型,包括DeepSeek。

人们与DeepSeek的对话仅使用了它很少一部分功能,其实作为AI基座,可以发挥更大作用,例如定制服务、数据处理、报表分析等。一边是人工智能基础模型,一边是现实的企业和个人需求,中间的Gap由谁弥补,就是我们智川平台。这些技术模型,在智川平台,可按照自身业务定制数据和工具调用,最终实现企业级应用。

我们认为2025年是AI+Agent的元年,智川要做的就是如何基于这些基础模型,解决企业接入到企业生产力提升的最后一公里,让大模型普惠到更多人。

《中国企业家》: DeepSeek和OpenAI o3mini出现之后,你们在做哪些调整?

王磊: AI技术生态和产品生态很庞大,DeepSeek和OpenAI o3是基础平台,但如何支持领域开放问题或解决复杂任务,仍有很多难点需要去攻克。举个例子,如何基于大模型做数字人或者数字员工Agent应用,尚有距离。

我们基础模型已经进入全球主流榜单前十,而我们更关注用户端和行业端的AI应用需求,去年成功落地40多个行业级产品模型,帮助客户提升生产效率。如何用新技术服务好客户、解决真需求,是我们始终坚守的方向。

AI是场马拉松,现在说不好谁是王者,坚持最重要。

《中国企业家》: AI公司分两种情况,一种是冰面上的天鹅,引人注目;另一种是水面下的大鱼,大鱼也很凶猛,但在没有跃出水面之前是关注不到的。作为中科闻歌的董事长,你如何看待这两种公司选择?

王磊: 被关注有多个维度,媒体和大众是一个维度,行业客户则是另一个维度。我们一直非常坚定做难的事情,迎接最困难的挑战。有了这个坚持,也让我们成为为数不多从AI 1.0阶段走到AI 2.0,再迈入AI 3.0的一家企业。

在AI 1.0的经典人工智能时期,我的老师曾大军早在1994年于美国卡内基梅隆大学,便开展非常前沿的人工智能研究,像是多智能体体系的提出及机器学习框架的探索等,他的学生们也取得诸多有影响力的成果。

AI 2.0阶段,就是在面向领域的数据驱动深度学习时代,我和罗引博士从创业开始,我们就注重专用人工智能算法研发。因为要实现对数据理解与认知,离不开如何训练专门算法来处理领域问题,事实证明,获得了良好市场反馈和收益,也在资本市场备受关注。

AI 3.0阶段是生成式人工智能和通用人工智能时代,算法很重要,数据同样不可或缺,最近有两家明星企业备受瞩目。一家是Databricks,不久前成功融资100亿美元;另一家是Palantir,市值已接近3000亿美元。我们坚信数据与AI密不可分,如果二者分离,就如同拿着AI这把锤子盲目地寻找钉子。数据是对场景的抽象,AI是工具,两个结合起来才是价值。这是中科闻歌商业模式的核心。

我创业至今已有7年,头部客户续约率近乎100%,连续签约5年的客户也占很大比例。因此,在行业从业者和客户群体中,积累了一定的声誉。不过在公众to C业务方面,还需等待时机推出普惠的C端产品。

从科学家到创业者

《中国企业家》: 你是2017年开始创业,在此之前是科学家,2017年人工智能浪潮尚未真正兴起,而且恰好处于两个波峰之间,为什么决定出来?

王磊: 当时我在中国科学院是副教授级的科研人员,是科研骨干。2016年,我们赶上了中国科技成果转化的春天,国家推出促进科技成果转化的相关举措,是中国科学院率先涉及技术加团队的创业。2017年以我和罗引博士为核心的5名青年科研人员开启创业征程,我们在实验室时就希望做技术不仅要写文章,更要在实际应用中产生价值。那时大家都30岁出头,怀揣着用科技成果干一番事业的热忱,干劲十足。

前期积累非常重要,我们队伍成长很大程度上得益于海外归国教授带回的先进学术思想,一位是卡内基梅隆机器人学实验室的博士,另一位是南加州大学人工智能的博士,帮助夯实了技术底蕴。我2007年加入这个团队,10年中积累了前沿的产业实践经验、全球前沿的学术思想和国家科研殿堂的积淀,及丰富的国家项目锤炼经验,让我们收获了一批种子客户。

《中国企业家》: 刚刚你说的是宏观的背景,但创业对于个人也是重要决策。

王磊: 我认为在做决定时,如果想太多,就无法作出决定。中国科学院科研条件好,能与优秀的同事共事让人舒心,但决定了就比较坚决。第二天就把办公室交回去,走出实验室,也很快拿到第一笔天使投资。

《中国企业家》: 当时你的第一款产品是什么?

王磊: 我们赶上了特别好的机遇,即国家的融媒体建设,中国日报、新华社等国家级媒体都将它视为科研任务,融媒体业务有图、文、音、视频,还有大量AI工具和数据分析需求,现实需求加上国家政策助力,很快找到了业务落地场景。

后续涉足金融、医疗、能源等领域都沿用了这一思路,找到技术与行业的契合点,催生出产品。道理虽然大家都明白,但实际操作中,客户一年年买单、形成持续可增长的收入,还是非常有挑战。

《中国企业家》: 从科学家转型做销售,说服客户的过程艰难吗?虽然你是帮他们赚钱,但其实你也是要赚他们的钱。

王磊: 我们现在营收已跨入几亿级别,当时也不相信能做到这一步。还记得我询问朋友是否适合创业,他们说不适合,因为长期在科研机构工作会有点清高。

所以出来后我时刻提醒自己,要放下身段聆听市场需求。记得一位基层员工跟我说过,“你们这么高层次的技术人才来研究我们这样一个小众行业,还是转型期的行业,让我们很兴奋。”有时候客户需要的不是非常高深和顶尖的技术,更需要站在他的角度解决真正的工作或业务问题。

后来做县级融媒体,我去了中国很多县市、基层,新疆、西藏、黑龙江等地方都去过,作为创始人有吃苦精神,对员工开疆拓土是很好的鼓励。这也让我明白,创业不能只盯着大行业,而要在一个小的细分行业找到真实的客户需求,锻造技术能力,再泛化到其他行业,找到生存之道。

《中国企业家》: 既要上天,又要入地。

王磊: 技术创业首先技术要立得住,更要接地气。有些企业立得太深,当天上有任何变化未跟进时,就被抛弃了。登天已经很难,入地真是要俯下身去,一步一个脚印去走,会发现更难更痛苦。

创业中的关键时刻

《中国企业家》: 你决定做雅意大模型,是不是一个关键节点?

王磊: 我们决定做雅意大模型时,已经是成长型、规模化企业,投资人期望尽快走向资本市场,实现规模化商业效益,拿出亮眼财报。当时公司也正朝着这一目标前进。

来源:视觉中国
2022年ChatGPT一经问世,我们敏锐察觉这是不一样的技术变革,迅速行动,记得当时买A100还不到70万元一台,后来飙升至185万 一台,果断决策构建了算力平台,拥有了非常稳定可控的算力支撑。

2023年3月,我们下决心投入大模型研发,当时从数据集构建到基础训练,可借鉴文献案例非常少。训练历时6~9个月,算力成本高达几千万,加上人力成本,财报压力很大,与资本市场的期望更背道而驰。

这算是关键时刻,不做就意味着技术落后,之后可能都上不了牌桌,做意味着财务承压。我记得2023年股东会上也给予了很大压力,但到了2024年年底,我们在客户侧竞争力及客户对我们的信任等方面都大大提升。都说数 据—模型—决策 ,大模型对于理解客户需求、解决问题、利用先进技术进行相关工作有很大帮助,收入增长也印证了这一点。

《中国企业家》: 这需要很大勇气。

王磊: 在AI产业变革的十字路口,组织惯性的利弊凸显。我们深耕AI行业多年,从实验室起步,蜕变为如今的AI创新企业,这是60 、70 、80 、90后四代人的努力。组织形成惯性后有优势,但也需不断求变。回顾过去20年,很多信息化企业虽表现出色,但在AI技术投入方面没有迈出勇敢一步,他们过于注重财务表现,关注能否持续盈利、亏损是否减少,所以投入大模型就需要更大勇气。

《中国企业家》: 当时你很难确定一定会在大模型上打出来,带来的内心纠结如何化解?

王磊: 想好了就要胆子大,决定做之后还是很高效的,没有浪费太多资源,节奏有计划且紧凑。后来我们还开源了,对社区做了很大的贡献,6月份发布了1.0版本,12月就发布了2.0版本,最近还超越GPT-4o进入了权威榜单全球前十。

《中国企业家》: 早期预训练的过程中,对于一家创业公司而言,试错成本很高,每天还得不断花钱,你有过压力很大的时候吗?

王磊: 当时技术路线有很大不确定性,数据的工程配比决定了AI大模型的训练结果,任何一个小差错都会影响训练进程。训练雅意2.0时,确实有段时间,同事发现LOSS(回归误差)天天跑飞,睡不着觉,一天租卡的费用就是一辆宝马的费用,损失几十万,最终才跟算力平台一起攻关解决了问题。

也因为这次,我非常佩服DeepSeek和OpenAI这些公司,他们承担了相当大的投入压力,毕竟不确定性非常大。

《中国企业家》: 在决策智能方面,你们的差异化竞争优势是什么?

王磊: 过去人工智能行业的共识是,从感知到认知再到决策,再到具身执行。过去AI主要集中在产业领域,当年四小龙在感知层已经做出出色的成果,认知这一层随着GPT的发展也发生了很大的变化,但我们要明白,世界是动态的、变化的、复杂的,开放场景需要实现决策的智能,因为对于人类或社会生产活动而言,错误决策可能会带来巨大灾难性后果和损失。

我认为在基础认知和推理能力之后,对于复杂问题需要动态实时的感知、长程规划、决策支持能力,这是需要突破的地方。我们的决策绝不是简单的数据统计,而是从复杂的异构数据中用AI发现规律,基于规律结合动态实时数据用AI进行推理、推演,支持最终决策选择。

《中国企业家》: 你预测2025AI行业可能会发生哪些变化?

王磊: 第一,从技术角度看,会有更好的降维 S caling Law等强化学习的技术创新,尤其在少量语料生成方面有望找到更创新的方法。有了更优质的基础模型之后,类似AlphaFold这样有影响力的行业级创新,会加快出现。

第二,我认为2025年全球人工智能应用市场已到达爆发节点,DeepSeek为市场带来很大的激励和推动。拥抱AI不是“要不要干”,而是“怎么干”,各个行业的产品就会像移动应用一样爆发,Agent也会对端侧设备带来新的机会。

第三,算力这一侧,超强算力可能还会进一步发展,市场需求也将进一步释放,端侧的算力芯片或许会孵化出下一个英伟达。

此外,就个人而言,我们应加速拥抱AI,我相信未来懂AI和不懂AI的人才价值会很不一样。
新闻热线&投稿邮箱:[email protected]






请到「今天看啥」查看全文