专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
小众软件  ·  另外两件事[250220|被骗] ·  13 小时前  
小众软件  ·  群晖发布 Office Suite ... ·  13 小时前  
小众软件  ·  免费、底层开源,一款全新的工作流 IDE ·  13 小时前  
APPSO  ·  实测马斯克口中最聪明的 AI,就这? ·  2 天前  
APPSO  ·  刚刚,OpenAI ... ·  2 天前  
51好读  ›  专栏  ›  APPSO

DeepSeek 发布新论文,梁文峰署名/马斯克 20 万张卡砸出的 Grok 3,实测翻车/腾讯紧急调用元宝支持微信搜索

APPSO  · 公众号  · app  · 2025-02-19 08:25

正文

appso 头图
🎉
Grok 3 正式发布
🌟
OpenAI 宣布开源
💰
惠普将以 1.16 亿美元收购 Humane 核心 AI 技术
📃
DeepSeek 发布新论文,创始人亲自挂名
📱
OpenAI 前 CTO 官宣新公司
🔍
本田向日产提出恢复合并谈判条件
💹
腾讯紧急调用元宝支持微信搜索
📰
百度发布 2024 全年财报
💼
消息称罗福莉已到小米上班
📉
月之暗面暂缓「烧钱」,大砍投放预算
💡
上海交大讲席教授:人工智能曾走了 20 年弯路

Grok 3 正式发布

2 月 18 日,马斯克旗下 xAI 正式发布 Grok 3 模型。
据官方介绍,Grok 3 在 Chatbot 竞技场之称的 LMSYS 盲测中,代码、指令响应等各个方面排名第一,超过 Gemini-2 Pro、DeepSeek-V3、GPT-4o 等模型。同时,Grok-3 mini 也一同公布,其将牺牲部分性能,换取更快的响应能力。
而推理版本的 Grok 3 Reasoning Beta 支持深度思考,其在最新的 AIME 竞赛中表现断层领先。值得关注的是,对比模型中还出现了近期火爆的 DeepSeek R1 模型。但 Grok-3 Reasoning 目前仍处于测试阶段。
据悉, Grok 3 训练累积使用了 20 万张 H100 显卡。xAI 表示,最大的挑战是让整个模型在海量的 H100 上进行训练,并保持一致性。
xAI 还一同带来了由 Grok 3 加持的 DeepSearch,号称是下一代搜索引擎。模型将自主像 agent 一样运作,并且理解用户提问背后的意图,能够在互联网以及 X 中进行全面检索。
备受关注的语音模式也有了进一步的公布。马斯克在直播中透露,语音模式将是 Grok 最好的体验之一,同时在发布直播尾声,xAI 还放出了一段语音模式的预览视频,其效果十分接近人类声音。而语音模式预计在一周内发布早期版本。
费用方面,X 的 Premium+ 订阅用户(每月 40 美元)将率先体验 Grok 3,而其他高级功能则被纳入 xAI 推出的新计划「SuperGrok」中。SuperGrok 的月费为 30 美元,年费为 300 美元,仅提供额外的推理和 DeepSearch 查询功能,还包含了无限量的图像生成服务。
此外,Grok API 还将在未来几周内推出,包含推理模型和深度研究功能。并且 xAI 还宣布,当 Grok 3 成熟稳定之后,大概几个月将会开源 Grok 2。
另外,APPSO 也对 Grok 3 进行了实测,详细内容可点击查看: 实测马斯克口中最聪明的 AI,就这?

OpenAI 宣布开源

2 月 18 日,OpenAI CEO Sam Altman 发文询问,对于 OpenAI 下一个开源项目,公司应当选择体积虽小但仍需借助 GPU 运行的 o3 mini 层级模型,还是应当致力开发一个尺寸适合手机且表现最佳的模型。
对此,Altman 对发起投票。截止发稿前,o3 mini 层级模型的投票率领先。但在帖子评论区显示,相比于 o3 mini 的开源,显然高赞评论的网友更希望开源 GPT-4。值得关注的是,Altman 曾在本月初公开承认 OpenAI 的策略「站在了历史错误的一边」。
前日,Altman 还表示 OpenAI 将对 GPT 4o 进行更新,并夸赞 GPT - 4o 的表现非常出色。同时其在评论区还表示,GPT - 4o 是「网上最好的搜索产品之一」。

惠普将以 1.16 亿美元收购 Humane 核心 AI 技术

北京时间今天凌晨, Humane 宣布,惠普公司将以 1.16 亿美元收购「其关键人工智能能力」,其中包括 Humane 所拥有的人工智能平台 Cosmos、高技能技术人才以及拥有 300 多项专利和专利申请的知识产权。
此外,Humane 还发布 AI Pin 支持文件,表示自即日起,将停止销售新的 Ai Pin。
而已经购买 Ai Pin 的用户,其设备将正常工作至 2025 年 2 月 28 日 12点 (太平洋标准时间)。自此之后,Ai Pin 将不再连接到 Humane 的服务器,通话、消息、AI 查询/响应或云访问等功能都无法使用。

DeepSeek 发布新论文,创始人亲自挂名

2 月 18 日,DeepSeek 官方发文公布了一篇新的论文,值得关注的是,论文中提出了一种新的注意力机制「NSA」。
据 DeepSeek 介绍,「NSA」是一个用于超快长上下文训练和推断的本地可训练的稀疏注意力机制,并且还具有与硬件对齐的特点。
研究通过对现实世界语言语料库的综合实验来评估 NSA。其中作者评估了 NSA 在通用语言评估、长上下文评估和链式推理评估中的表现。实验结果表明,NSA 实现了与 Full Attention 基线相当或更优的性能,同时优于现有的稀疏注意力方法。
此外,与 Full Attention 相比,NSA 在解码、前向和后向阶段提供了明显的加速,且加速比随着序列长度的增加而增加。这些结果验证了分层稀疏注意力设计有效地平衡了模型能力和计算效率。

OpenAI 前 CTO 官宣新公司

北京时间今天凌晨,OpenAI 前 CTO Mira Murati 宣布,创立名为 thinkingmachines 的 AI 公司。
而根据 thinkingmachines 官方介绍,工作人员由来自「ChatGPT、 Character.AI  、PyTorch 和 Mistral」等公司的成员构成。
在官网上可以看到,目前团队成员中,有相当一部分的成员有过在 OpenAI 任职的经历,如前 OpenAI 研究(后培训)副总裁 Barret Zoph、前 OpenAI VP 翁荔等人。
Mira Murati 表示, thinkingmachines 正在构建一下三件事:

帮助人们调整人工智能系统以适应其的特定需求

打造强大的基础模型,用以构建更强大的 AI 系统

培养开放科学的氛围,帮助整个领域理解和改进这些系统

本田向日产提出恢复合并谈判条件

近日,据金融时报报道称,如果日产汽车公司社长内田诚卸任,本田愿意恢复收购谈判。
据知情人士透露,本田将准备在日产新社长上任后重新开启谈判,前者认为日产新社长或能够更好地控制公司内部的反对意见。知情人士还表示,目前日产董事会已经开始就内田诚离职的时间,进行非正式讨论。
内田诚现年 58 岁,曾是日产内部最强烈支持与本田达成交易的人之一。但因本田对日产重组的速度和财务问题的恶化而感到不乐观,所以内田诚与本田社长三部敏宏之间的关系恶化。
内田诚曾表示希望在日产任职至 2026 年,然而在本田与日产合作谈判失败后,其开始面临董事会和合作伙伴雷诺给到的离职压力。
报道指出,本田仍对日产以及三菱汽车的插电式混动技术感兴趣,因日产、三菱的插电混动在东南亚有较大的市场影响力。
据悉,本田、日产于 2 月 13 日正式宣布结束合并谈判。据联合发布终止合并谈判的谅解备忘录显示,因未能满足本田成为日产母公司的想法,所以双方未能达成一致。此前双方曾探讨将合并成为世界第四大汽车集团。
此外,本田社长三部敏宏透露,本田并未也不会考虑对日产发起恶意收购。

腾讯紧急调用元宝支持微信搜索

近期微信搜索灰度测试 AI 搜索,用户对 DeepSeek 模型的使用热情远远超出预期。
2 月 18 日,爱范儿获悉,为了让更多用户方便稳定地体验和使用 DeepSeek,腾讯内部紧急协调部署,调用元宝支持微信搜索,给用户提供更多入口和选择。
从即日开始,尚未被灰度到 AI 搜索的用户,点击微信对话框顶部的搜索栏,进入微信搜索,将有机会在页面中看到「下载元宝(体验 DeepSeek-R1)」。
用户通过腾讯元宝,可以免费使用 DeepSeek-R1 满血版、DeepSeek-V3、腾讯混元深度思考模型 T1 以及腾讯混元通用模型 Turbo。不仅支持深度思考,也支持快速输出答案。
值得一提的是,腾讯元宝支持联网搜索,覆盖公众号等腾讯生态内容及互联网权威信源。腾讯方面表示,未来将持续优化产品能力,提升模型性能,为用户提供更优质的 AI 使用体验。
此外,据博主三个老爸实验室发文称,元宝的 DeepSeek 回答疑似植入广告。随后腾讯公司公关总监张军在评论区回应表示,回答中所谓的广告,实际上是联网搜索参考了相关的链接内容,并非植入。张军还表示,已经跟技术团队同步,会尽快优化处理类似的呈现问题。

百度发布 2024 全年财报

昨日,百度公布了其 2024 年 Q4 及全年财报。其中显示,百度集团 Q4 营收 341 亿元,全年营收 1,331 亿元,均同比下滑 1%。
其他数据显示,全年营收中归属百度核心净利润达 234 亿元,同比增长 21%。此外受 AI 驱动,百度智能云呈高速增长,Q4 收入同比增长达 26%。百度还宣布,12 月,文心大模型日均调用量达 16.5 亿次,一年增长 33 倍;百度文库 AI MAU 达 9,400 万,同比增长 216%,环比增长 83%。
百度联合创始人兼 CEO 李彦宏表示,2024 年是百度从以互联网为中心转向以人工智能为先的关键一年。同时其还表示,随着百度的 AI 战略不断被验证,其相信 AI 相关投入将在 2025 年带来更大的成果。
此外,据新浪科技报道,在百度 2024 年 Q4 及全年财报电话会上,李彦宏透露,文心大模型 4.5 将开源,同时 4.5 将是百度有史以来最强大的大模型。百度近日曾发文宣布,将在未来几个月陆续推出文心大模型 4.5 系列,并在 6 月 30 日正式开源。

消息称罗福莉已到小米上班

今年春节前,雷军在直播时说,希望用千万年薪挖角「AI 天才少女」罗福莉,请她到小米带领团队从事 AI 大模型研究。此前,红星新闻曾通过其高中班主任向她求证是否入职小米,当时她表示还在考虑要不要加入小米。
近期,据红星新闻报道,罗福莉已到新岗位上班。此外,据罗福莉的一名亲戚透露,因罗福莉的爱人在春节期间忙着开发一个新产品,所以两人春节都没回老家。该亲戚还称,罗福莉老公的研究方向与她是同一个领域,只是细分项目不一样。
据悉,罗福莉硕士毕业于北京大学计算语言学研究所,并在自然语言处理领域有着杰出的研究经历和成果。此后,罗福莉在阿里巴巴的达摩院机器智能实验室工作,并主导开发了多语言预训练模型 VECO。2022 年,罗福莉参与 DeepSeek 的 MoE 大模型 DeepSeek-V2 的开发。
此前第一财经曾报道并指出,雷军认为小米在大模型领域发力太晚,于是亲自挖人。而罗福莉的加入可能加速小米在大模型领域的研发进度。

月之暗面暂缓「烧钱」,大砍投放预算

据界面新闻获悉,月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。报道称,月之暗面内部对此次调整解释称,公司近期受到「外部因素和内部战略调整影响」。
知情人士透露称,DeepSeek 的爆火对月之暗面内部而言是不小的刺激,团队复盘后认为还是要坚持基础模型 SOTA。未来月之暗面可能会重新训练基础模型,并且内部选中 DeepResearch 功能作为产品方向。据悉,上述功能为 OpenAI 在 2 月发布的面向深度研究领域的智能体产品。
同时,有大模型领域投资人分析称,月之暗面此举是终于意识到投放的无效性,接下来如果要继续留在 AGI 牌桌上竞争,它只能依靠模型创新。

上海交大讲席教授:人工智能曾走了 20 年弯路

近期,上海交通大学致远讲席教授徐雷接受《AI&Society 百人百问》采访,徐雷教授表示,人工智能初诞后逆着自然演化方向走了 20 年弯路。
采访中徐雷教授表示,在 1956 年人工智能诞生之初,因发展方向与自然相反,跳过了形象思维阶段,导致基础不牢而走进死胡同。20 年后,随着神经网络研究和深度学习的高度兴起,AI 才逐渐步入正轨,并且才有了近 20 年的大发展。
随后,徐雷教授也谈及了 Scaling Law。他提到,90 年代前后神经网络研究高潮期间,缺的就是大型的硬件规模,导致没办法像如今一样快速发展。但徐雷教授也表示,硬件规模只是个必要条件,并不等于规模大了模型就一定能做好,其认为要从探索本质特性、在训练数据下功夫、考虑合适框架来进行释放潜力。
徐雷教授还提到,人其实也会像大模型一样出现幻觉。并且 AI 的幻觉跟人类所产生的一样,这种如梦境的生成有对,也有不对的。徐雷教授认为,很难判断大模型输出的「幻觉」,或许也是一种好的创新。

阶跃星辰与吉利联合开源两款 Step 系列多模态大模型

2 月 18 日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款 Step 系列多模态大模型向全球开发者开源。
本次合作的大模型包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃 Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃 Step-Audio。
据悉,阶跃 Step-Video-T2V 模型的参数量达到 300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频。
阶跃星辰还发布并开源了针对文生视频质量评测的新基准数据集 Step-Video-T2V-Eval,其包含 128 条源于真实用户的中文评测问题。评测结果显示,阶跃 Step-Video-T2V 的模型性能在多方面,均显著超过市面上既有的效果最佳的开源视频模型。
而阶跃 Step-Audio 是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。
在 LlaMA Question、Web Questions 等 5 大主流公开测试集中,阶跃 Step-Audio 模型性能均超过了行业内同类型开源模型,位列第一。阶跃 Step-Audio 在 HSK-6(汉语水平考试六级)评测中的表现尤为突出,是最懂中国话的开源语音交互大模型。
此外,阶跃星辰自建并开源了多维度评估体系 StepEval-Audio-360 基准测试。通过人工横评后的结果显示,阶跃 Step-Audio 的模型能力十分均衡,且在各个维度上均超过了此前市面上效果最佳的开源语音模型。
即日起,可在跃问 App 内体验阶跃 Step-Video-T2V 和阶跃 Step-Audio。

昆仑万维开源首个面向 AI 短剧创作的视频生成模型

2 月 18 日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型 SkyReels-V1、中国首个 SOTA 级别基于视频基座模型的表情动作可控算法 SkyReels-A1。
据悉,昆仑万维本次开源的两款视频模型,是针对解决当前全球 AI 视频生成模型和产品不开源、用不到、费用高、不好用等痛点,并且将面向 AI 短剧创作的技术成果回馈开源社区和 AIGC 用户。
其中,SkyReels-V1 可实现影视级人物微表情表演生成,支持多种细腻人物表情与多种自然动作组合;同时加入人物空间位置感知、表演场景理解。
此外,SkyReels-V1 还能支持图生视频,是开源视频生成模型中参数最大的支持图生视频的模型,在同等分辨率下各项指标实现开源 SOTA;并且其还是围绕人物表演、开源视频生成模型中性能最强的,多项参数表现超过 HunyuanVideo。
而 SkyReels-A1 将对标 Runway 的 Act-One。其能够基于任意人体比例,生成高度逼真的人物动态视频,其真实感源自对人物表情变化和情绪的精准模拟、皮肤肌理、身体动作跟随等多维度细节的深度还原。
SkyReels-V1 和 SkyReels-A1 将同时进行开源。昆仑万维表示,这将是 AI 短剧行业首例,也是昆仑万维 SkyReels 回馈行业迈出的一小步,更是促进 AI 短剧创作和视频生成行业枝繁叶茂的一大步。

iPhone 17 Pro 模具遭曝光

近日,博主 MajinBu 发文分享了一组有关 iPhone 17 系列机型外观的图片信息。
MajinBu 分享的图片中,有一组其称是 iPhone 17 Pro 相机模组的原型物料。从图片中可以看出,iPhone 17 Pro 或将一改以往方形的相机模组设计,采用大面积圆角矩形相机模组,并且闪光灯和一个未知开孔被摆放在模组右侧,而镜头排列保持三角形阵列设计。
另外,MajinBu 还一同公布了两张 iPhone 17 系列手机壳的 CAD 图纸。据 MajinBu 描述,两张 CAD 图纸分别对应 iPhone 17 Pro 以及 iPhone 17 Air。图纸显示,两款机器的后置镜头模组均采用贯穿式,其中 iPhone 17 Air 因为单摄,而采用贯穿式长条模组;iPhone 17 Pro 则与上述描述一致。
此前,据分析师郭明錤和媒体 MacRumors 预测,iPhone 17 Air 机身厚度最薄处仅 5.5mm,接近 12.9 英寸 iPad Pro 的 5.1mm 厚度。郭明錤还指出,iPhone 17 Air 将配备一颗 48MP 的后置摄像头,且受限机身空间影响,该机型后置摄像头方案为单摄。

月之暗面推出新模型 Kimi Latest

2 月 18 日,月之暗面宣布退出新模型 Kimi Latest,将对标 Kimi 智能助手当前使用的模型。官方强调,Kimi Latest 将随智能助手产品更新而同步升级,模型名称始终为 kimi-latest。
官方介绍,Kimi Latest 上下文长度为 128k,并自动根据上下文长度选择计费模型;同时 Kimi Latest 也是视觉模型,支持图片理解;另外还支持自动上下文缓存,缓存命中的 Tokens 费用为人民币 1 元 / M Tokens;其余功能与 moonshot-v1 系列模型保持一致。
目前 kimi-latest 仅支持调用 kimi 普通版模型,Kimi k1.5 长思考模型暂不支持 API 调用。
官方表示,Kimi Latest 推出是为了令开放平台的用户既能体验到最新模型带来的卓越效果(包括尚未稳定的试验性特性),又能保持原有模型的稳定性。

GTA6 被曝将引入官方 Mod 平台

媒体 Digiday 近日报道,据知情人士透露,Rockstar(简称 R 星)私下联系了游戏《Roblox》和《堡垒之夜》的第三方游戏内容创作者,计划让他们在《GTA 6》中提供一些「定制化的游戏体验」。
报道称,R 星或允许上述所提及的创作者修改游戏中的环境和资产内容,并融入创作者的创作内容。报道指出,这将意味着 R 星将为《GTA 6》提供官方的 Mod 平台,或也有可能是 R 星会进一步开放游戏自定义性,类似于《GTA OL》中用户设计的各种自定义赛道内容。
据了解,R 星还在 2023 年收购了 CFX.RE。而该团队曾为《GTA 5》和《荒野大镖客:救赎 2》提供 MOD 工具。同时,《GTA 5》中的角色扮演服务器(RP 服务器)在海外平台流行,相对应的 Mod 允许玩家在 GTA 的框架下,引入类似《模拟人生》的游戏模式,并通过向用户收取订阅费来盈利。
此外,本月 R 星母公司 Take-Two 曾表示,《GTA 6》仍然按照计划在「今年秋季」发布。

Spotify 将上线「Music Pro」会员

近期,据彭博社报道,Spotify 即将上线一款全新的「Music Pro」订阅制会员服务。
据介绍,Music Pro 订阅计划将以现有套餐为基础,每月额外收取最高 5.99 美元,为订阅该服务的用户提供更高品质的流媒体资源、AI 混响功能以及独家演唱会门票等内容。






请到「今天看啥」查看全文