专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
目录
相关文章推荐
爱可可-爱生活  ·  【R1-Nature:在小模型上复现R1推理 ... ·  12 小时前  
爱可可-爱生活  ·  【[15星]OctoTools:一个无需训练 ... ·  12 小时前  
爱可可-爱生活  ·  【[59星]ThinkDiff:让扩散模型具 ... ·  昨天  
机器之心  ·  200多行代码,超低成本复现DeepSeek ... ·  2 天前  
51好读  ›  专栏  ›  AI前线

百度、字节高管隔空互怼;月之暗面或因DeepSeek调整重心;腾讯已对微信接入DeepSeek灰测 | AI周报

AI前线  · 公众号  · AI  · 2025-02-16 13:30

正文

整理 | 傅宇琪、褚杏娟

导语:腾讯回应微信接入 DeepSeek:正在灰度测试;DeepSeek 对豆包冲击最大?百度、字节高管隔空互怼;月之暗面或因 DeepSeek 调整工作重心,强化学习成关注焦点;亚马逊 Alexa 升级版因 AI 回答不准确推迟发布;Meta 部分高绩效员工突遭解雇,公司“裁减低绩效员工”说法遭质疑;涉嫌代码抄袭,字节跳动败诉判赔美摄公司 8000 多万元;被面试官连问三个小时,应届博士无缘 DeepSeek;马斯克方:若 OpenAI 维持非营利,将撤回 974 亿美元收购要约;摆脱英伟达依赖,OpenAI 首款自研芯片被曝上半年交由台积电流片;9.9 万元起!春晚爆火的宇树机器人线上首发后当天下架……


行业热点
腾讯回应微信接入 DeepSeek:正在灰度测试

近日,有消息称,微信正在灰测接入 DeepSeek-R1 模型。16 日上午,腾讯方面回应中新经纬称,确有其事,正在灰度测试。

腾讯表示,微信搜一搜在调用混元大模型丰富 AI 搜索的同时,近日正式灰度测试接入 DeepSeek。被灰度到的用户,可在对话框顶部搜索入口,看到“AI 搜索”字样,点击进入后,可免费使用 DeepSeek-R1 满血版模型,获得更多元化的搜索体验。

另有知情人士表示,腾讯多个产品正在探索接入 DeepSeek,如腾讯云 AI 代码助手、腾讯元宝等,为用户提供更丰富的体验和服务。

2 月 15 日,部分微信用户发现,微信搜索已经上线“AI 搜索”功能,并接入 DeepSeek-R1 提供的“深度思考”服务。有媒体实测发现,微信已为搜索功能接入 DeepSeek-R1 模型,处于小范围灰度测试中。部分用户可在微信搜索框中点击“AI 搜索”,并选择“深度思考”模式,便可获得由 R1 模型经过长思考提供的更全面的回答。若用户未显示该入口,说明暂未覆盖到账号,请耐心等待后续开放。

根据公众号“共识粉碎机”从供应链看到了腾讯加单了10-20万张H20,其判断看微信版Deepseek就是明确的用途。每张H20可以支持500个Deepseek满血版用户同时使用,这意味着10-20万张H20可以支持5000万-1亿用户同时在线用户,这基本满足了微信第一批Deepseek用户的用量,也超过了ChatGPT的同时在线用户。

目前H20成本不到1万美金,对应集群1.5万美金,假设10-20万张卡差不多是20亿美金;按照AWS最新的折旧定义修改,GPU能用5年,平均一年的折旧成本是4亿美金。“共识粉碎机”表示,Deepseek已经让成本降低到巨头充分可以试错,而且不影响主营业务了。

DeepSeek 对豆包冲击最大?百度、字节高管隔空互怼

2 月 13 日,有报道称,百度智能云事业群组昨天召开了全员会。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖提到了当下 DeepSeek 爆火,对 ACG 乃至整个模型赛道的影响。

沈抖表示,DeepSeek 在短期内会对百度产生影响,但长期来看是利大于弊的。他提到,即使现在大家看到各家之间你追我赶,但整个行业仍处于很早期的阶段,长期来看,还有很多可以创新的点。但面对 DeepSeek 的来势汹汹,首当其冲的 AI 产品,沈抖认为,是字节跳动的豆包,理由是其训练成本和投流成本都很高。

对此,火山引擎总裁谭待通过朋友圈回应称,大模型降价是通过技术创新实现的,大家应像 DeepSeek 一样聚焦基本功,少做无端猜测。谭待表示,豆包 1.5Pro 模型的预训练成本、推理成本均低于 DeepSeek V3,更是远低于国内其他模型,在当前的价格下有非常不错的毛利。

2 月 13 日上午,字节跳动内部举办新一期全员会。针对 AI 业务,字节 CEO 梁汝波在会上提出 2025 年的重点目标,包括追求“智能”上限、探索新的交互和加强规模效应。梁汝波也谈到了最近爆火的 DeepSeek。他表示,DeepSeek R1 创新点之一的长链思考模式不是业界首创。去年 9 月 OpenAI 发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但跟进速度不够,如果当时及时关注到,有机会更早实现。

月之暗面或因 DeepSeek 调整工作重心,强化学习成关注焦点

2 月 15 日消息,据媒体报道,月之暗面内部已将“持续拿到 SOTA 结果”确定为最重要的工作目标。2025 年,他们计划在模型能力方向上加强多模态和长文本推理能力。

然而,DeepSeek 的成功让外界重新审视了月之暗面的技术和用户增长模式。两者在闭源与开源、预训练与蒸馏技术等方面存在差异。虽然尚未明确是否接入 DeepSeek 或开源,但有业内人士透露可能会将强化学习作为一个工作重点方向。此举被认为是对抗 DeepSeek 等竞争对手的一种改变或尝试。

近日 OpenAI 发布研究论文报告《Competitive Programming with Large Reasoning Models》,提到中国的 DeepSeek-R1 和 Kimi 1.5 利用思维链学习方法,在数学解题与编程挑战中表现出色。这也进一步引发了对于强化学习路线带来的模型能力提升的关注。

亚马逊 Alexa 升级版因 AI 回答不准确推迟发布

亚马逊计划对其人工智能助手 Alexa 进行重大升级,原定于 2 月 26 日展示,但因技术挑战推迟至 3 月 31 日或更晚。新版本的 Alexa 将具有独特性格、记忆对话细节等功能,但在测试中出现回答不准确等问题。

亚马逊在 2023 年宣布将利用生成式 AI 技术升级 Alexa,但实现过程比预期困难,原计划 2024 年底发布也因用户反馈不佳而推迟。苹果的 Siri 升级版也面临类似问题,可能从 iOS 18.4 推迟至 18.5 版本。亚马逊需在技术创新和用户体验间找到平衡,以确保 Alexa 升级版能成功推出。

Meta 部分高绩效员工突遭解雇,公司“裁减低绩效员工”说法遭质疑

2 月 11 日凌晨,Meta 开始通知受其先前宣布的裁员影响的员工。据外媒报道,该公司向被解雇员工发送的通知电子邮件标志着一个解雇过程的开始,预计该过程将持续到 Meta 绩效周期结束(2 月底),并导致多达 3600 名员工被解雇。裁员邮件显示,美国本土员工将获得包括 16 周薪资在内的遣散费,还会根据工作年限获得额外两周薪资。此外,表现符合标准并获得奖金的员工依然会拿到奖金,员工还会在本月的股票奖励周期中收到公司股票。多名 Meta 员工表示,尽管去年年中评估时获得了正面绩效评级,他们仍在本周一被裁员。在此次裁员中,Meta 共削减了近 4000 个岗位。

在 Meta 内部沟通平台 Workplace 上,不少被裁员工发布了自己的绩效记录截图。一名员工称自己“意外”被解雇,并展示了文件,证明自己过去四年一直符合或超出公司预期,但在 2024 年底被降级。另一名员工表示,自己在 2024 年初绩效良好,但刚休完育儿假就被解雇。由于绩效评级突然下降,一些员工担心 Meta 公开裁员理由可能会影响他们的未来求职。“Meta 说自己在裁低绩效员工,这让我们像被贴上了‘低绩效’的标签一样。但事实上,我们并不是。”另一名被裁员工质疑公司的说法:“根据我过去得到的反馈,我很难相信自己是低绩效。”还有员工称,他们的经理此前从未透露过裁员风险,甚至还曾保证他们不会受到影响。“我们甚至无法查看经理对我们的考评意见。”

涉嫌代码抄袭,字节跳动败诉判赔美摄公司 8000 多万元

2 月 13 日消息,美摄科技官微发布声明称,美摄公司起诉字节跳动旗下抖音等 8 款产品代码抄袭系列案,历经三年七个月,终于迎来终审判决,且终审胜诉,字节跳动被判赔 8266.8 万元。判决判令抖音公司及其关联公司立即停止侵害美摄 SDK 软件著作权的行为,向美摄公司赔礼道歉,抖音公司及某员工立即停止侵害美摄公司技术秘密的行为。

据悉,2021 年 5 月,美摄公司发现抖音软件的音视频编辑处理等相关功能代码大量抄袭美摄公司享有著作权的美摄 SDK 软件。对此,抖音副总裁李亮回应称,一名曾经在美摄工作过的工程师,离职两年半后加入了字节。在字节工作期间,写代码时重复使用了一部分他在美摄工作时写过的代码(经司法鉴定,相关重复代码占比很小,不超过美摄软件的 4%、抖音的 0.8%)。这种行为,属于严重违规,公司是明令禁止的,目前该员工也已经离职。李亮表示:“在美国起诉时,美摄还要求字节披露 TikTok 的全部源代码。这是我们无法接受的。我们曾多次和美摄沟通,愿意向对方提供有诚意的赔偿,但美摄却提出了远超过相关代码实际价值的赔偿诉求——仅在中国法院,美摄就提出了超过 20 亿的索赔,最后法院支持了 8000 多万。”

值得注意的是,李亮最新还补充了一个细节:美摄曾向美国法院申请打印 1215 页 TikTok 源代码。李亮表示:“这个是非常险恶的,不仅明显超过了案件审理的必要,更可能导致整个 TikTok 的源代码技术泄露。”好在最后经律师抗辩,美国法院驳回了美摄的请求,并要求美摄补充具体的赔偿依据,以及明确具体涉及什么商业秘密。

一 AI 初创公司 CEO 被捕:融 4 个多亿、购豪宅办婚礼挥霍、败光后裁掉 50 名员工

据报道,总部位于旧金山的 AI 初创公司 On Platform 的创始人上周被捕,此前检察官指控他和妻子将价值数百万美元的投资者资金挥霍在了房地产、珠宝、特斯拉汽车,甚至是举办婚礼的社交俱乐部上。检察官进一步表示,这对夫妇从投资者那里骗取了 6000 多万美元(4.4 亿元人民币)。创始人 Alex Beckman 和他最近迎娶的律师 Valerie Lau 上周现身在旧金山法院。夫妇俩被指控“串谋从事电信欺诈、银行欺诈和证券欺诈,以及严重的身份盗窃和妨碍司法公正”。

2024 年 7 月警钟其实已经拉响,当时 GamesBeat 报道称 ON(前身为 GameOn Technology)在发现 1100 万美元现金凭空消失后,解雇掉了全部 50 名员工。当时 Beckman 引咎辞职,剩下的几位公司高管在一封信中告诉股东们到底发生了什么。信中写道:“令我们感到震惊和恐惧的是,我们发现,实际上银行账户里头的余额仅剩下 37 美分。这一发现让公司顿时陷入了流动性危机,董事会和管理层被迫迅速采取行动,希望能避免破产。”媒体报道称:但实际上,GameOn 的年收入从来就没有超过 50 万美元,公司也从未盈利过,GameOn 每年亏损数百万美元。此外,Beckman 一再向投资者出示虚假的公司资产负债表,谎称现金多达数百万美元,实际的现金头寸只是一个零头而已,有时甚至接近零。

被面试官连问三个小时,应届博士无缘 DeepSeek

据媒体报道,应聘者刘哲回忆起去年 5 月参加 DeepSeek 线上面试的经历。那时,面试官连续 3 小时的高强度提问让他倍感压力。尽管他作为 211、985 高校的应届博士生,在校期间已崭露头角,但面对那些深入且具有挑战性的问题,他仍感到不小的难度。

“在我所经历过的互联网公司中,DeepSeek 是唯一一家会根据应聘者的专业背景量身定制编程题目的公司。”回顾面试经历,刘哲这样描述。在刘哲看来,DeepSeek 的崛起似乎是必然的。他透露,应聘者普遍来自清华、北大等顶尖学府,面试过程严谨且要求高,当时招聘并未设定人数上限,明显感受到公司旨在网络顶尖智慧人才,只招收天才级别的精英。

据知情人透露,有朋友曾参与 DeepSeek 的面试,并直接与创始人对话。总体感受是,公司充满愿景,洋溢着理想主义精神,研究氛围优于高校实验室,非常适合对 AI 充满热情的研究人员。另外,一些参加过 DeepSeek 面试的人表示,公司不设 KPI 考核,采取扁平化管理模式,每位核心算法人员都能直接与梁文峰探讨问题,不太像传统公司,更像大学的一个研究团队。

马斯克方:若 OpenAI 维持非营利,将撤回 974 亿美元收购要约

2 月 13 日消息,Elon Musk 的律师当地时间 12 日提交法庭文件称,若 OpenAI 放弃成为营利性实体,Musk 方将撤回对 OpenAI 的 974 亿美元收购要约。文件称,Musk 牵头财团的“认真报价”旨在进一步推进 OpenAI 作为慈善机构的使命。

当地时间 11 日,OpenAI CEO Sam Altman 接受媒体采访时表示,公司为“非卖品”,Musk 提出收购很可能是想拖延公司的发展。“我认为他可能只是想拖慢我们的脚步。他显然是一个竞争对手,”Altman 说,“我希望他只是通过打造更好的产品来竞争,但我认为他已经采取了很多策略,打了很多很多官司,做了很多其他疯狂的事情,现在又这样。”

此前有消息称,Musk 牵头一组投资者提出收购 OpenAI,Altman 随后回应称,“不了谢谢,但如果你愿意,我们可以出 97.4 亿美元收购推特(X 前称)”。

摆脱英伟达依赖,OpenAI 首款自研芯片被曝上半年交由台积电流片

2 月 11 日消息,据报道,OpenAI 正积极推进其减少对英伟达芯片依赖的计划,即将完成自家首款自研人工智能芯片。据最新消息,OpenAI 已决定将这款自研芯片交由全球领先的半导体制造商台积电进行“流片”测试。这一步骤意味着,经过精心设计的芯片将被送往台积电工厂,进入试生产阶段。

OpenAI 规划着在 2026 年实现自研芯片在台积电的大规模生产。尽管每次流片测试的费用高达数千万美元,且通常需耗时约六个月。值得注意的是,首次流片测试并非万无一失。这款自研芯片在 OpenAI 内部被视为一种重要的战略性工具。随着首款芯片的顺利投产,OpenAI 的工程师团队还将以此为契机,逐步开发出性能更强、功能更广泛的处理器系列,进一步巩固其在人工智能领域的领先地位。

百度开源,并将发布新模型,与苹果合作继续

2 月 13 日晚间消息,有知情人士透露称,“尽管苹果公司已与新合作伙伴阿里巴巴集团达成合作,但仍在与百度共同开发中国 iPhone 用户的人工智能功能。”具体来说,百度一直在开发一种能处理图片和文本的人工智能搜索功能,并对中文版 Siri 语音助手进行升级。这些功能是“Apple Intelligence”的功能套件的一部分。苹果与百度以及阿里巴巴的合作显示了该公司通过与多家 AI 合作伙伴签订非独占协议来降低风险。目前,百度方面并未回应相关消息。

日前,2 月 11 日消息,据报道称,苹果已经测试了大家期待的 DeepSeek 模型,但因为 Deepseek 团队在支持像苹果这样的大客户方面缺乏必要的人力和经验,没有继续使用其模型。与之相对地,苹果最终决定与阿里巴巴合作,为中国 iPhone 用户开发人工智能功能。知情人士透露,此举是苹果为应对在中国销量下滑的策略之一,旨在为中国用户提供更具吸引力的 AI 功能。

2 月 14 日,百度官方微信公众号宣布:“我们将在未来几个月中陆续推出文心大模型 4.5 系列,并于 6 月 30 日起正式开源。”2 月 13 日,百度宣布文心一言将于 4 月 1 日 0 时起,全面免费,所有 PC 端和 APP 端用户均可体验文心系列最新模型。即日起,文心一言上线深度搜索功能;该功能也将于 4 月 1 日起免费开放使用。

2 月 12 日,据媒体报道,百度今年将推出下一代人工智能模型 Ernie5.0。消息人士称,被称为“基础模型”的 Ernie5.0,将在多模态能力方面有重大增强,但没有具体说明其功能。这一消息正值苹果公司将其潜在客户转向阿里巴巴之后,市场普遍猜测此举是百度为了应对局势的变化,试图稳住股价和市场地位。

9.9 万元起!春晚爆火的宇树机器人线上首发后当天下架

2 月 12 日,宇树科技的 Unitree H1 和 G1 人形机器人正式在京东线上首发开售。其中,Unitree G1 人形机器人在京东的售价为 99000 元,预计 45 天可交货。Unitree H1 人形机器人售价为 650000 元,预计 60 天可交货。据悉,H1 人形机器人为宇树科技的首款全尺寸人形机器人,身高约 180 厘米,体重约 70 公斤,于 2023 年 8 月推出。

然而上线后不久,该产品就从京东平台下架了。客服表示,这款产品于 2 月 11 日上线平台,并称目前不再面向个人进行销售。“任何普通用户都可以买的,我们不反对购买。”2 月 12 日晚,宇树科技市场部工作人员回应表示:“不是不对个人销售,谁都可以购买使用。只是现阶段人形机器人更加偏重二次开发阶段,比如研发机器人大脑、行走运控、全身动作, 所以个人用户购买我们也希望是‘极客’型的个人用户。”至于产品上架又下架,工作人员解释称:“这就是常规的小操作,公司主要的产品早就开始卖了。”

AI 已进化到可独立自我繁殖,科学家称这是流氓 AI 出现的早期信号

据报道,最近,科学家测试了 Meta 的 Llama 和阿里巴巴的通义大模型,结果表明,即使这些模型意识到自己被关闭或禁止复制,它们仍能够以 50% 和 90% 的概率分别创建自己的副本,也就是说,AI 能够自我繁殖以继续执行任务。这种能力可能会让人类失去对 AI 的控制,AI 可以利用这种能力提高生存能力,并做出违背人类利益的事情。科学家强调,这是 AI 智胜人类的重要一步,也是流氓 AI 出现的早期信号,是 AI 系统的红线风险之一。因此,科学家呼吁加强国际合作制定预防措施。

大模型一周大事
重磅发布
Perplexity 免费推出 Deep Research:性能超 R1,CEO:感谢 DeepSeek

AI 搜索平台 Perplexity 推出了名为 Deep Research 的新功能,能够生成深度研究报告。该功能免费向所有人开放,非订阅用户每天可查询 5 次,Pro 用户每天可查询 500 次。Deep Research 擅长金融、市场营销和技术等领域的深度研究,并能在健康、产品研究和旅行计划等领域作为个人顾问。

Perplexity 的 CEO Aravind Srinivas 表示,Deep Research 的性能优于其他主流模型,且平均 3 分钟内完成研究任务。此外,Perplexity 的 Deep Research 与谷歌和 OpenAI 的同名产品不同,其优势在于速度快、效果好且成本低廉。CEO 还预告下周 Perplexity 将发布新的产品。

OpenAI 凌晨放王炸!将推出 GPT-5:整合多项技术,取消独立发布 o3 模型

2 月 13 日凌晨,OpenAI CEO Sam Altman 放出“王炸”级别更新预告,剧透 GPT-4.5 和 GPT-5 的未来规划。奥尔特曼表示,OpenAI 将在未来几个月内推出 GPT-5 模型,该模型将在 ChatGPT 和 API 中整合包括 o3 在内的多项 OpenAI 技术。

OpenAI 不再计划发布独立模型 o3。Altman 表示,GPT-5 推出之前,OpenAI 计划先发布 GPT-4.5 模型,代号为“Orion”。他表示这将是 OpenAI 最后一个“非思维链模型”。与 o3 及其他推理模型不同,非思维链模型在数学和物理等领域往往并不可靠。此外,Altman 还透露免费版 ChatGPT 能在标准智能设置下无限制使用 GPT-5 进行对话。而付费订阅用户则能够体验更高智能水平的 GPT-5,包括语音、搜索、深度研究等。

字节豆包大模型团队提出稀疏模型架构,推理成本最高可降低 83%

据豆包大模型团队消息,字节跳动豆包大模型 Foundation 团队近期提出 UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。据介绍,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,推理成本最高可降低 83%。

企业应用
  • 2 月 13 日,谷歌 CEO Sundar Pichai 声称,谷歌正在推进浏览器扩展程序“Mariner”项目——AI 可以代替用户浏览网页、执行复杂任务,并提供完整结果。他表示,这项技术在一年前的完成度仅为 50%,如今已经提升到 85%。

  • 2 月 13 日,苹果势将宣布首次将 TV+ 流媒体视频服务扩展到安卓手机。知情人士称,苹果将推出一款适用于 TV+ 的安卓应用。在 2019 年推出的 Apple TV+ 一直用于苹果自己的操作系统和 Roku 等第三方电视平台。此举标志着苹果罕见地在对手谷歌的安卓系统上提供服务。

  • 2 月 12 日,vivo 手机操作系统 OriginOS 官方发文宣布,vivo 将深度融合满血版 DeepSeek,宣称“蓝心大模型与 DeepSeek 双擎驱动”。此前,除 vivo 外,目前华为、OPPO、荣耀、魅族都已官宣接入 DeepSeek。

  • 2 月 12 日,腾讯云开发官宣上新,开发者能够基于最新的小程序基础库,最少仅需输入 3 行代码,就可以将“满血版”DeepSeek 大模型能力接入到小程序中,实现智能对话、文本生成等功能;云开发新用户首月套餐免费,并享有 100 万 token。

  • 2 月 12 日,知情人士透露,Meta 正在讨论收购韩国人工智能芯片初创公司 FuriosaAI,这笔交易最早可能在本月完成。报道称,Meta 是有意收购这家人工智能初创公司的几家公司之一。如果 Meta 收购 FuriosaAI,这家社交媒体巨头可能会设计和制造自己的人工智能芯片,而不是在芯片供应紧张的情况下依赖英伟达。

  • 2 月 11 日,国家超算互联网平台宣布推出“AI 生态伙伴加速计划”,提供 3 个月 DeepSeek API 接口免费使用、千万卡时算力资源池等激励。据介绍,超算互联网平台已上线 DeepSeek 满血版的模型镜像,并为有需求的企业免费开放 3 个月 DeepSeek API 接口。

极客时间 Deepseek 知识库来了!!

最新整理,长期更新,优质信息源,一个就够!

  • DeepSeek 最新资讯、技术文档

  • DeepSeek 操作手册、提示词汇总、个人知识库搭建手册

  • 50+ 生态适配企业及官方教程

  • DeepSeek 提效、变现思路及案例







请到「今天看啥」查看全文