专栏名称: 走天涯徐小洋地理数据科学
一个爱生活的地理土博,分享GIS、遥感、空间分析、R语言、景观生态等地理数据科学实操教程、经典文献、数据资源
目录
相关文章推荐
51好读  ›  专栏  ›  走天涯徐小洋地理数据科学

中国传统科研院所要突破,必须走人民路线

走天涯徐小洋地理数据科学  · 公众号  ·  · 2025-02-27 14:22

正文

年前,DeepSeek用超低成本震撼了世界,今天咱们聊聊另一家。
中国AI公司稀宇科技(MiniMax),很多人可能不知道,我们先列一下他们的成绩:
  • MiniMax-01综合能力媲美GPT-4o

  • 视频生成技术反超OpenAI Sora,海螺AI全球访问量突破2700万


一句话,这是DeepSeek之外,中国另一家世界顶尖水平的AI公司,而且也是走开源路线。
他们的技术有什么特点呢?和DeepSeek一样,这家公司也是走“ 底层创新 ”路线,两家不同点在于:
DeepSeek是深挖GPU运行效率,以速度取胜。
MiniMax是修改了大模型底层架构,实现超长文本处理。
咱们用通俗的语言介绍一下MiniMax做的事,为了避免专业术语,咱们打个比方,如果大模型类比一个公交车公司,那么:
DeepSeek是优化了公交调度算法,提高了车辆利用率,降低了票价。
MiniMax则是干脆把公交车升级成地铁,极大提升了运力。
有人可能想问,MiniMax到底是突破性创新,还是改良性创新?答案是两者都有。
其中,突破性创新的代表是:首次在千亿级参数模型中大规模部署线性注意力机制,这个创新令 长文本处理 的性能有了质的飞跃。
改良性创新有,通过对英伟达CUDA内核优化,推理成本降低到GPT-4o的1/10。
还有许多其他的创新点,因为术语太多,我就不列了。
但MiniMax的创新最大特点还不是单点创新,而是系统性重构,新的架构突破了传统扩展性的边界,同时训练成本相比DeepSeek继续大幅度下降。
它的改动有多大呢?和传统架构相比,堪称把马车改成汽车,动力结构到传动系统全从底层改了。
若是把这东西强行说成是优化,那就相当于声称现代科学是对“格物致知”的发展。
大家可能要问了:
专家说好的比国外差2到3代的,到底咋回事?
其实,不同认知,就在于我国传统科研院所和企业的创新机制有根本性区别。
不管是DeepSeek还是MiniMax,以及许许多多的其他国产大模型,他们多数出自中国的企业,而非学校或者研究机构。
有人说,是不是因为做大模型很费钱?其实不是这个原因,顶级科研机构的经费,不比创业公司少。
根本原因在于: 敢不敢背离“国际主流”,走自己的路
企业的研发目的,归根结底俩字:搞钱。故而没有什么传统负担。
老板不关心你的思路是否符合“ 西方主流思潮 ”,他只关心事情能不能成。
互联网公司是用户驱动,故而他们能创造出豆包这种擅长陪人聊天,能增加用户量的产品。
而DeepSeek、MiniMax这种公司则更加纯粹,他们就是靠底层技术创新,“放卫星”,体现自身价值。
大家不必厚此薄彼,他们在各自的方向上实现了价值,各有不同的成功逻辑。
他们的共同特点都是: 植根本土文化,不拘泥西方科研思维
企业是结果导向,无论你的创新灵感从何而来,好用就行。
你的设计思想来自古希腊还是道德经,没人关心,搞得定,哪怕宣称是天神托梦都行,搞不定,有哈佛教授推荐也不好使。
社会实践是检验真理的唯一标准 ,这在中国企业就体现为“ 以市场反馈为准
但科研院所的思维还停留在“赶英超美”的旧范式,改开时代,他们的目标是快速学习美西方先进思路,教给学生,培养出能够和国际接轨的优秀工程师。
但今天创新已经走到无人区,美西方对未来也懵逼中,你问他们,他们问谁?
而我国的科研院所的思维尚未跟上新时代,所以他们的思路落伍了。
自己不行,就觉得整个国家都不行
那么,中国科研院所是不是没希望了呢?不是的,关键是要改变思路,与时俱进。
第一点:社会是最好的老师,要向人民学习。
科研立项的时候,不要问“美国人在做什么方向”,要问“中国人民需要我做什么方向”。
我国有很多卡脖子难题,企业也有很多需要突破的底层学术问题,这些都是最好的需求。
出国考察,不如做好社会调查。
走进田间地头,俯下身,问问老乡:你们希望国内的科研机构做什么?






请到「今天看啥」查看全文