专栏名称: 新皮层NewNewThing
关注人工智能与人类智能。
目录
相关文章推荐
中国药闻  ·  抓产业创新不能忽视传统产业 ·  2 天前  
中国药闻  ·  国家药监局批准伊那利塞片上市 ·  2 天前  
知食观  ·  过氧化值~2024年总局抽检不合格项目回顾 ·  2 天前  
51好读  ›  专栏  ›  新皮层NewNewThing

大模型进入瓶颈期如何突破?王小川、闫俊杰和沈向洋是这样想的

新皮层NewNewThing  · 公众号  ·  · 2024-09-11 23:50

正文

撰文: 徐弢

编辑:吴洋洋


Key Points


过去18个月实际上是一个小的技术周期;


下一代模型需要错误率低一个数量级,还需要有更清楚的数学原理;


空谈AGI,不如找个够难的抓手倒推AGI的实现。

大模型领域似乎陷入了沉寂——如果有什么动态,也是坏消息。迄今为止,包括Inflection AI、Character AI、Adept AI和Covariant等一系列独角兽主创团队,都已跳出自己的创业项目,分别加入微软、Google和亚马逊等美国大公司。

在国内,估值排名前列的大模型公司零一万物的算法副总裁黄文灏据传已经离开公司,加入字节跳动。而该初创公司的产品团队据传也已离职再创业。

一连串的坏消息面前,我们该如何认知行业所处的阶段?如果这是一种大技术周期中的小型子周期,那什么样的公司才能跑得更远?9月5日举办的「2024 Inclusion·外滩大会」上,蚂蚁集团总裁兼首席财务官韩歆毅、MiniMax创始人兼CEO闫俊杰、百川智能创始人兼CEO王小川在与极客公园创始人兼总裁张鹏的对谈中触及了这些议题。


以下内容由「新皮层」根据现场对谈整理:


过去18个月实际上是一个小的技术周期

MiniMax创始人兼CEO闫俊杰认为, 我们刚刚经历了大模型的一个小技术周期,这个周期从GPT 3.5开始,到GPT-4o的出现为止,大概18个月的时间。 这个周期里,模型智能水平相较于GPT 3.5及之前的模型有了一个量级的变化,使得助手类应用成为可能;GPT-4到GPT-4o,推理成本下降不止10倍,推动了用户渗透率的变化,使得全球使用AI的用户至少3亿至4亿人,达到接近10%的渗透率。

他认为,当模型产出的内容好于人类写出的内容时,可能带来更大的变革,但这需要足够长的耐心,这个过程可能是分阶段实现的。每当有1个量级的技术变化,就可能带来1到2个数量级的产品变化和用户规模。 接下来模型从GPT-4到下一代的GPT,就将带来新一轮的性能变化和随之而来的新型应用,以及渗透率的提升。

百川智能创始人兼CEO王小川认为,刚刚过去的18个月还不算是一个完整的周期,更完整的周期应该拉长到36个月,即让技术和场景发生更多融合。而且,OpenAI的最新模型「草莓」也即将发布,AI的强化学习还没有在真实物理环境中真正开展起来,如果把这些都走完,「我依然认为超级应用(在这个技术周期里)会出现。」王小川说。


下一代模型需要错误率低一个数量级,还需要有更清楚的数学原理







请到「今天看啥」查看全文