专栏名称: 蓝鲸新闻
上海报业集团主管主办,解析财经要闻,记录时代变局,影响有影响力的人。
目录
相关文章推荐
投资眼老A  ·  突发消息! ·  2 天前  
兵团零距离  ·  晚安·兵团 | ... ·  2 天前  
兵团零距离  ·  晚安·兵团 | ... ·  2 天前  
淘股吧  ·  出手!陈小群1.3个亿! ·  3 天前  
投资明见  ·  徐小明:周四操作策略(0206) ·  3 天前  
唐史主任司马迁  ·  晚上这个点,还有多少人在准备开盘的,点个赞看 ... ·  3 天前  
51好读  ›  专栏  ›  蓝鲸新闻

2024 AI 年终盘点|从技术到行业,留下三个悬而未决的问题

蓝鲸新闻  · 公众号  ·  · 2024-12-30 20:56

正文

蓝鲸新闻12月30日讯(记者 朱俊熹) ChatGPT发布两年以来,AI浪潮继续奔涌。这一年,“卖铲人”英伟达依然是最大受益者,一度成为全球市值最高的公司。凭借Apple Intelligence的叙事,苹果年底市值逼近4万亿美元的历史性关口。行业领军者OpenAI也以千亿估值跃升为全球第三大独角兽。

无论国内外,科技公司或喊出“AII in AI”的口号,或在战略版图中继续扩大AI的地位。在公开活动、公司财报中,AI已成为不可或缺的主题。科技行业之外,更多的公司着手将其与自身业务结合。对个体来说,人们开始习惯在生活中随时打开AI对话助手,和人工智能交流各种天马行空的想法。

2024年,AI技术继续向前迈进,行业加速洗牌,同时也留下了一些悬而未决的问题。

Scaling Law遭遇瓶颈如何突破?

当回顾ChatGPT何以成功掀起AI热潮时,一个共识是受到了数据、算法、算力三架马车的驱动。 2020年,OpenAI研究团队提出,随着模型规模、训练数据集和计算资源的增加,模型性能也将持续提升。这就是指导模型预训练的关键法则Scaling Law,在过去几年间推动了大模型的飞跃。

但今年下半年以来,对Scaling Law是否撞墙、边际效益递减的争论愈演愈烈。 先是OpenAI迟迟未亮相的下一代大模型GPT-5被传训练受阻,即使投入了巨大成本,模型的进步却在放缓,未能实现从GPT-3.5到GPT-4的跃升程度。随后,谷歌、Anthropic等多家公司也被曝面临类似的困境,不得不延后旗舰模型的发布,寻求新的技术路线。

代替GPT-5,OpenAI在9月释出了推理模型o1,并在三个月后发布继任者o3模型。该系列模型采取不同于GPT序列的命名规则,也被普遍视为新范式的开始。推理模型将更多的计算资源投入到推理阶段而非预训练阶段,通过增加强化学习和思考时间,实现模型性能的提升。

在AI行业看来,推理模型有望成为预训练scaling放缓的解法。国内大模型独角兽月之暗面创始人杨植麟曾公开表示,o1模型的意义在于提升了AI的上限。当原先的Scaling Law因互联网优质数据的耗尽而遭遇瓶颈,它至少证明了通过强化学习和大语言模型的结合,能够实现进一步的scaling,“完全有可能是一个很重要的开端”。

由此,国内外大模型玩家也开启了转向推理范式、继续追赶OpenAI之路。截至2024年底,谷歌已推出首个推理模型Gemini 2.0 Flash Thinking。其首席科学家Jeff Dean称,该模型经过训练能够利用思维过程来增强推理能力,“当增加推理时间计算时,取得了令人鼓舞的结果!”

国内现已具备可媲美o1的推理模型,包括幻方量化旗下DeepSeek的R1-Lite预览版、阿里通义的QwQ模型。近期,月之暗面先后发布数学模型k0-math、升级版视觉思考模型k1,在数理化等特定能力上表现优于o1。另有字节跳动等厂商透露正在布局推理模型方面,预计明年将会迎来更多此类模型的面世。

尽管各家公司对推理模型这一进化方向展现出一定的共识,但其现有使用场景仍极其有限。 在回答用户提问时,推理模型需要花费更多的思考时间。 OpenAI研究人员在o1模型发布时就曾坦言,o1模型并不总是比GPT-4o好,对于许多不需要推理的任务,有时等待o1的回复不如直接快速获得GPT-4o的响应。

与传统的大语言模型相比,推理模型的开发成本更低,但使用时的推理成本大幅增加。OpenAI将部分成本转嫁到用户侧,完整版o1模型的访问权限被纳入新推出的付费套餐ChatGPT Pro中,定价则由基本套餐的20美元/月升至200美元/月。而o3模型虽然在基准测试中的得分远超o1,高计算模式下完成单个任务就需要承担数千美元的昂贵成本。

目前看来,对普通用户而言,推理模型的可用之处尚不明显。硅谷科技媒体The Information曾援引知情人士说法称,只有一小部分ChatGPT用户会定期使用o1-preview。这类模型似乎更有助于科研人员群体,这也是OpenAI重点瞄准的目标人群。

承载商业愿景的AI超级应用会到来吗?

相较于一年前市场的如火如荼,今年AI热潮已开始经历周期性的冷却。当科技巨头们继续鼓吹要大幅投入AI、追求长期回报的策略时,AI泡沫论的质疑也在蔓延。 更现实的问题是,承受着高昂的研发成本,大模型厂商们为了生存也要找到可行的商业路径。

大模型转向落地的趋势,直接体现在各家公司推广话术的变化中。比起单纯地以大模型性能、参数、跑分论优劣,更注重展示模型的应用落地场景。

为抢占早期市场,一场“价格战”爆发了。 今年5月,DeepSeek、另一创企智谱AI率先降低旗下模型的调用价格。随后字节跳动在发布其豆包大模型时打出最响一炮,主力模型价格较行业便宜99.3%。在此之后,原先持谨慎态度的阿里云、百度、腾讯云也纷纷宣布跟进降价,大模型由以分定价进入以厘定价的阶段。

在此轮价格战中,攻势猛烈的大多是国内云厂商,AI创企鲜有参与。云厂商们希望能通过亮出模型降价的招牌,吸引更多客户使用其云服务。 降价带来的短期损失能够从云服务受益中再补贴回来,还能进一步扩大其公有云市场份额。

数据显示,这样的获客手段确是有效的。据各公司最新披露,字节豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍,百度文心大模型日均调用量达15亿次。百度创始人李彦宏曾表示,如果API调用量能在一年内上涨10倍至20亿,代表大模型算是“成了”。

受成本降低和模型进化的推动,AI应用也开始涌现。ChatGPT式的AI对话助手成为各家“标配”,包括字节豆包、月之暗面Kimi、腾讯元宝等。但据36氪此前报道,字节管理层认为即使是处于国内第一梯队的豆包,在对话轮次、时长等关键指标上的表现依然不够理想。因此判断AI对话类产品可能只是AI产品的“中间态”,并提升了AI创作平台即梦的优先级。

可自主感知环境、执行行动并完成设定目标的智能体,成为众多AI企业押注的下一个应用风口。 谷歌在推出最新的Gemini 2.0大模型时,就表明是为智能体时代构建的。今年李彦宏更是反复强调,百度将智能体视为最重要的战略方向,认为智能体这一AI应用的最主流形态即将迎来爆发点。智谱AI自10月起推出多款自主智能体,能够模拟人类操作手机与电脑,展示出智能体更大的应用潜力。

AI搜索赛道的竞争也日趋白热化。不仅谷歌、百度、阿里等巨头正在积极利用AI改造传统搜索引擎,OpenAI、月之暗面等新兴创企也开始在产品中集成AI搜索功能。近期,小红书低调上线AI搜索新产品“点点”,并在App内开启了小范围内测。 有AI搜索开发者曾对蓝鲸新闻表示,搜索是用户每天高频使用的场景,已然成为AI公司的兵家必争之地。

随着AI应用方向在垂直领域出现分化,同时应用层涌入了更多的新公司,明年或将看到形式更为多样的AI应用。编程、情感陪伴、智能硬件等领域呈现出蓬勃上升的态势。

市场仍在期待,AI时代何时能迎来像微信这样的超级应用。对此,行业领导者们态度不一。李彦宏称超级应用不如超级能干,智谱CEO张鹏则表示,超级应用的出现并不完全由技术驱动,还要考虑市场和用户是否准备好、需求发掘以及一点点运气。“不要过早地只看这个结论,保持一点耐心。”

大厂和创企,谁能继续留在牌桌?

临近年末,AI大模型领域的融资消息再次活跃起来。“六小龙”之一的创企阶跃星辰近期宣布完成数亿美元的B轮融资,上海国资、腾讯入股。本月中,智谱AI再获新一轮三十亿人民币融资。同为清华系、主攻端侧AI的面壁智能完成了数亿元新融资,AI视频创企爱诗科技获得近3亿元A+轮融资。

与今年上半年相比,下半年大模型公司的融资进度明显放缓。今年2月,阿里巴巴豪掷重金再投大模型创企,希望仿照微软与OpenAI的模式,以算力的形式支付部分投资。其中,阿里向月之暗面投资了约8亿美元,购入36%的股权,月之暗面完成的超10亿美元融资至今仍是国内AI领域的最大单笔融资记录。不到半月,阿里又领投另一创企MiniMax的6亿美元融资,推高其估值达25亿美元。

加上年初的投资,阿里已集齐中国最头部的五家大模型初创企业,包括零一万物、智谱AI、百川智能、月之暗面和MiniMax。阿里、腾讯等互联网的大手笔再次激起对大模型的FOMO(错失恐惧)情绪,高榕创投、高瓴资本等财务投资机构也跟投了部分独角兽。

蓝鲸新闻梳理创投数据服务商IT桔子的统计,截至12月30日,2024年国内人工智能行业共录得483条投资事件,总投资金额约为655亿元,较去年分别下滑了18.8%、6.1%。其中,今年下半年融资事件数较上半年更少,但融资金额更高。







请到「今天看啥」查看全文