硅基流动和潞晨科技两家创始人公开互怼;Kimi 最新模型曝光,k1.6 成功登顶;90 后中国女数学家王虹证明挂谷猜想,或成为菲尔兹奖热门人选;英伟达市值跌破 3 万亿美元;胡润回应雷军当中国首富:假消息,可能涨到前三名;曝拼多多招来了多位百度大佬,已组建多个大模型小组团队;蚂蚁集团调整薪酬政策,年底 13 薪分摊到月薪;上海一明星 AI 公司倒下,员工遭停薪且社保被停缴;苹果年度股东大会,库克 7461 万美元薪酬获批,未接任董事长‘宇树机器人日租金 8000 元,40 天“回本”……
2025 年 3 月 1 日上午,DeepSeek 发布《DeepSeek-V3 / R1 推理系统概览》一文。文章首次披露了 DeepSeek 的理论成本和利润率等关键信息。据介绍,DeepSeek 使用了大规模跨节点专家并行(EP)的方法,并通过一系列技术策略,最大程度地优化了大模型推理系统,实现了惊人的性能和效率。假定 GPU 租赁成本为 2 美元 / 小时,总成本为 87072 美元 / 天;如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为 562027 美元 / 天,成本利润率为 545%。
随着 DeepSeek 对成本利润的回应,潞晨科技尤洋、硅基流动袁进辉两家创始人隔空发文,并且进行在朋友圈和知乎上互怼。
首先,袁进辉对于 DeepSeek 表达感激,并评论称:“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。现在很多供应商还做不到这个水平。”随后,尤洋发表“关于 DeepSeek MaaS 成本”和“坑人的硅基流动”两篇文章。
此前,潞晨科技 CEO 尤洋表示,满血版 DeepSeek-R1 每百万 token(输出)定价 16 元,如果每日输出 1000 亿 token,需要约 4000 台搭载 H800 的机器,以目前 H800 的市价或者折旧来计算,每月仅机器成本就达 4.5 亿元,因此企业方可能面临每月 4 亿元的亏损。DeepSeek 发文后,尤洋昨日发文回应,“我对 DeepSeek 没有任何贬低。我最开始就是抨击那些倒卖 DeepSeek API 去赔本赚吆喝的中小云厂商,然后吹嘘自己推理快 10 倍。”他表示,DeepSeek 数据对计算 MaaS 成本没有任何参考价值,文章中把 DeepSeek 网页,APP 和 MaaS API 的 token 数加在一起计算。但尤洋表示他说的 MaaS 是 ToB 的工具,不是 ChatGPT 类的 APP。DeepSeek 的 MaaS 要想有一个这么高满负荷的状态,必须要让自己的 APP 和网页始终超负荷运转。他还指出,春节期间 DeepSeek 使用体验意识到“根本就不是一个合格的 MaaS 产品。
随后,他直指硅基流动创始人袁进辉“频繁在朋友圈阴阳他”,并称“硅基流动疑似组织水军长期黑我”。尤洋在文中分析了硅基流动网站访问量大增的原因,认为主要得益于春节期间绑上国产芯片的宣传效果和邀请码送代金券的拉人头传播。他质疑硅基流动的代金券承诺与实际现金流之间存在巨大缺口,并对其 API 性能表示怀疑。
袁进辉迅速在朋友圈回应,为自家团队春节期间的努力辩护,强调“提供稳定服务”无可厚非,并反击称硅基流动曾被潞晨科技抄袭。针对抄袭指控,尤洋回应称,实施抄袭的是潞晨科技前 CTO,该人士已离职并加入了袁进辉的公司。随后袁进辉转发了去年橘皮优团队对潞晨科技的指控文章,称潞晨科技“不是一次抄袭,而是多次发生”。
争论进一步扩大,被指为抄袭总负责人的潞晨科技前 CTO 方佳瑞也加入论战,称自己是被尤洋“甩锅”,抄袭的代码与他无关,并透露自己是因质疑“诈骗式期权协议”而被赶走。并且,袁进辉回应称,“(潞晨)CTO 没加入我们公司,之前加入的是光年之外,后来加入其他大公司了。而且都是他自己犯错甩锅给别人,不是别人的问题。”
今天凌晨,尤洋发文致歉称:本人昨天情绪太冲动,说了一些让人误解 deepseek infrastructure 团队的话。deepseek infrastructure 团队技术一流并给开源社区做出巨大贡献。本人诚挚道歉,已经删除不当表述,感谢大家提醒。
3 月 1 日下午,潞晨科技宣布将暂停 DeepSeek API 服务。
2 月 27 日,网上曝出 Kimi 最新模型 k1.6。全球动态基准测试平台 LiveCodeBench 数据显示,其在代码生成测试中力压 GPT o3mini、o1 等模型,成功登顶。与此同时,月之暗面在面对 DeepSeek 爆火冲击后,对产品策略进行了深刻复盘与调整。
月之暗面研究员 Flood 在社交平台透露,“k1.6 是基于 k1.5 做的训练,性能还在提升中”。月之暗面联合创始人张予彤也表示,“k1.6 还没有发布,但看到 LiveCodeBench 的成绩感到开心,期待智能模型的持续进化。”
知情人士称,DeepSeek 的爆火给月之暗面内部带来巨大刺激。经过复盘,团队认为要坚持基础模型 SOTA。接下来,团队或重新训练基础模型,同时抓住应用层机会,其中 DeepResearch 成为内部选中的产品方向,这是 OpenAI 在 2 月发布的一款面向深度研究领域的智能体产品。
90 后中国女数学家王虹证明挂谷猜想,或成为菲尔兹奖热门人选
北大校友王虹和哥伦比亚大学副教授 Joshua Zahl 合作,在三维空间中证明了困扰数学家上百年的经典难题 —— 挂谷猜想(Kakeya 猜想)。这一成就使得王虹成为 2026 年菲尔兹奖的热门人选,有望成为首位获得该奖项的中国籍女性数学家。据悉,王虹 1991 年出生于广西桂林,16 岁考入北大,后转入数学系,2019 年博士毕业于麻省理工大学。
挂谷猜想由日本数学家挂谷宗一于 1917 年提出,涉及调和分析、数论等多个数学分支。王虹和 Joshua Zahl 通过 127 页的论文证明了这一猜想,其研究方法涉及非聚集条件、Wolff 公理、多尺度分析等技术。
英伟达股价近日大跌 8.48%,市值跌破 3 万亿美元。自 2025 年以来,英伟达已两次经历市场下滑,最近的一次是由于 AI 应用 DeepSeek 的走红,引发市场对英伟达芯片和开发支出必要性的质疑。尽管 2025 财年英伟达营收和利润大幅增长,但毛利率下降,且下季度毛利率预期低于市场预期,引发市场担忧。英伟达 CEO 黄仁勋表示新产品 Blackwell 已全面投产,市场需求巨大,但分析师指出扩大出货量产生的额外费用进一步压缩了利润空间。
近期,有关 “雷军身家超钟睒睒成为中国首富” 的消息被广泛传播,但胡润排行榜创始人胡润澄清称该消息不实。
胡润分析,雷军个人财富近期确实有所增长,可能达到前五名或前三名,但并未达到首富位置,估算其财富约为 3200 亿至 3300 亿人民币。网传雷军本人在武汉大学校友群中的回应简洁明了:这是一则假新闻。
此前,小米集团股价大涨,总市值超 1.4 万亿港元,雷军财富增至近 4400 亿元人民币,成为中国新首富。雷军财富主要来源于小米集团、金山系公司和顺为资本投资的多家独角兽企业。
2 月 27 日,小米 SU7 Ultra 发布,旨在成为全球最快的四门量产车。该车型配备小米超级三电机系统,标配赛道版散热、制动系统和纽北调校底盘系统,标准版即可直接上赛道。小米 SU7 Ultra 售价 52.99 万元,纽北限量版是 81.49 万元,已在小米汽车 App 开售。开售 2 小时后,SU7 Ultra 大定突破 10000 台。小米汽车宣布,3 月 2 日上午在小米汽车工厂交付首批小米 SU7 Ultra。
曝拼多多招来了多位百度大佬,已组建多个大模型小组团队
据悉,拼多多内部已经组建了电商推荐大模型团队,负责人之前为百度凤巢的核心成员。据消息人士透露,此人之前在百度时就已经是千万级年薪,而这次拼多多给的诚意也很足,其年包是在百度时的数倍。
另一消息人士称,拼多多去年就从百度招了一批人来做大模型相关的项目。目前,拼多多大模型产品分为几个应用:比价系统、推荐、广告、搜索、客服领域等,这些应用领域一直都有持续投入在做。每个小组的大模型团队会互相进行赛马,收益以几个小组直接 PK 的结果为准。不过,据媒体报道,对于该动向,当时拼多多内部人士解释称,“公司在 AI 大模型上暂时没啥布局,内部确实在做 AI 智能客服,但算不上大模型量级。”
2 月 28 日消息,蚂蚁集团发布内部通知,宣布对两项薪酬政策进行调整,以提升员工薪酬收入的流动性和激励即时性。
根据通知:17 级及以下员工取消年底 13 薪,改为并入到每月基本工资中发放;18 级以上的高 P 员工,13 薪并入年度奖金,与绩效激励挂钩,和年终奖一起发放。销售岗位不适合此薪资政策。同时,自 2025 年 4 月 1 日起,新授予的绩效股将从年度归属调整为季度归属,即每满一个季度,员工将获得 1/16 的股权归属。
上海一明星 AI 公司倒下,员工遭停薪且社保被停缴
2 月 24 日消息,据报道,国内企业级 AI Agent 公司上海澜码科技有限公司近期对数十名员工直接解除劳动合同。同时,“澜码科技”公众号自去年 10 月 28 日至今处于停更状态。多位澜码科技员工在社交平台上称,去年 10 月开始,公司陆续就停了员工的工资、社保、公积金,今年 1 月 6 日左右,约 50 名员工被公司直接裁员,并且给予解除通知书。今年 2 月初,多名澜码科技员工集体到位于上海徐汇的西岸智塔楼下“拉横幅”讨要薪资。员工称,他们已经进入立案、调解等阶段。
对此,2 月 23 日晚,澜码科技创始人、CEO 周健回应称,公司因融资问题进行了裁员,但并非全部裁员,目前仍保留约 20 名员工。周健表示,公司已支付了三分之二的欠薪,并正在积极寻求被并购的可能性,同时他个人也已通过借钱和卖房来偿还员工薪资。
澜码科技成立于 2023 年,是一家基于大语言模型的企业级 AI Agent 平台公司,曾于 2023 年 8 月完成数千万元人民币的 A 轮融资,投资方包括 IDG 资本、联新资本等。公司创始人周健是 ACM 国际大学生程序设计竞赛世界冠军、李开复的“关门弟子”,曾任职于谷歌、阿里云、依图和弘玑等公司,是依图科技的 10 号员工和弘玑 RPA 公司的 CTO。
494 人年入过百万,奖金分红 8 亿元,出海大公司安克创新“壕”无人性
被特朗普带火旗下充电宝产品后,消费电子品牌安克创新最近又吸引了一波关注。近日,网上流传着一组安克创新内部会议的照片,照片显示安克创新去年奖金分红 8 亿元,年收入破百万人数达 494 人。安克创新相关负责人对多家媒体回应称,该组会议图片属实。
据安克创新内部人士透露,目前安克创新员工人数约 5000 人,此次奖金分红到手较为可观,中等绩效人士分到的钱差不多等同于年薪。部分业务好的团队,奖金会在 20 个月收入以上。据企业披露数据计算,2023 年安克创新的年人均薪酬为 47.15 万元。
也有网友留言称,安克创新目前员工大比例为外包员工,分红覆盖范围并不广。并有网友质疑分红宣传有营销之嫌。针对网友质疑声,前述安克创新相关负责人表示,公司外包员工并未推行很久、仅占很小比例,远不到夸张的大比例,上述外界言论不实。
雷峰网报道,安克创新创始人阳萌曾在会议中表示,公司的愿景:“五年后做到人均百万年薪的大公司”。不过,安克和很多创新型公司一样,面临的问题是极致内卷导致大批体能跟不上的中高层离职。由于制度、管理、人效相对较高,如何吸引 95、00 后人才是不得不面临的挑战。
据知情人士透露,安克内部所有员工,都要经历环评。半年一评,一年一大评。这也是安克一直强调的价值观。环评的初衷是希望公司提高人效,不过也带来一些内耗问题。部分中高层领导发现,因为环评制度不敢错过任何同事信息,导致一天要回复 2 小时起的信息。而公司开会较多,报告字数较长,又要写 2 小时报告。分给真正业务的时间,往往不足 40%。
然而,安克创新的卷到极致的管理方式和营收形成了正比。有传言称,安克未来要做“1000 亿营收”。对此公司上下士气非常足。不过安克目前的工作时间较长,996 现象严重,创始人阳萌也希望通过制度改革,慢慢将公司回到 2021 年之前的花团锦簇。
据悉,安克创新在研发层面也在持续投入。近日,安克创新宣布,募资的 11 亿人民币有 2.48 亿元计划用于储能。据知情人士透露,2024 年安克储能营收高达 30 亿元人民币。相当于 80% 华宝新能,40% 正浩。据悉,安克的营收和利润增长,主要来自全球市场开拓及核心业务持续创新,而储能是关键因素之一。
何小鹏全员信:告别华丽 PPT,线上协同取代非必要线下会议
2 月 25 日,何小鹏发布全员信,他宣布 2025 年倡导“简单高效”无处不在,效果效率双线提升,不开长会、大会、没结论的会。线上云文档上的协同取代非必要线下会议,比例高达 30%+,观点碰撞实时化。还要告别华丽 PPT,因为 PPT 使用率极低,仅在新车发布会中保留。在这篇 1 千字左右的全员信中,他提了 22 次效率、提效或高效,要求在每一分钟的会议、每一份文档、每一次差旅中提高效率。
会议上,发言者直接公布了一组数据:一个月,小鹏汽车开了 1.2 万场会,总时长 1.4 万小时。如果压缩给同一批人,每天工作 10 小时,要不间断开 3 年多。其中,20 人以上、超过 90 分钟的大型会议有 344 场。
调研对象特别筛选过,就是公司里 “高频组织开会的人”。何小鹏说,这是 “重灾区”——按每小时平均工资 150 元计算,一场大型会的成本是 2.7 万元,“10 场会议就够买一辆小鹏 G6 顶配版”。何小鹏也在那场会议里。一年多后,他表示当时 “第一次看到数据统计,我都吐了口血”。
业务方面,据报道,从小鹏汽车自研芯片将在今年 5 月份实现首次上车。据悉,今年 5 月底或 6 月初,小鹏汽车将发布一款全新车型,该车将是搭载自研芯片的首款车型,内部代号或为“F57”。
去年 8 月 27 日,小鹏汽车召开发布会,正式发布了其自研芯片,并将芯片名命名为“图灵芯片”。据悉,小鹏图灵芯片专为 AI 大模型定制,可同时应用于 AI 汽车、飞行汽车等诸多 AI 硬件上。图灵芯片算力为同行的三倍。知情人士称,“(图灵芯片算力)对于小鹏来说是足够了,而且性价比比 Thor 高太多了。”该知情人士还透露,小鹏汽车现在“完全不鸟英伟达了”,只是在涉及此前 Orin 芯片项目时才有联系。据透露,小鹏汽车接下来所有全新车型都将会搭载自研芯片,不再计划搭载 Thor 芯片。
波士顿动力购买宇树机器人,创始人:DeepSeek 创新只是个开始
当地时间 2 月 24 日,波士顿动力(Boston Dynamics)创始人 Marc Raibert 在美国休斯顿参加活动时透露,他的智能机器人研究所 AI Institute 已经购买了中国机器人创业公司宇树科技的机器人,以测试它的能力。“我们的实验室买了宇树的人形机器人,还买了几个小型的机器人,它们相对便宜。”Raibert 称,“即便我们是竞争对手,我们也可以买来看看它究竟能做些什么。”
Raibert 表示,他对宇树的机器人的能力印象深刻。去年夏天,Raibert 参加了上海举行的世界人工智能大会(WAIC)。“当时我得知他们发布了 27 个人形机器人,非常了不起!”他表示,“那是我第一次来中国,我与宇树的 CEO 聊过,我认为他们做得非常出色。”
波士顿动力开发了四足机器人 Spot 以及人形机器人 Atlas。在谈到波士顿动力的机器人与宇树机器人的区别时,Raibert 没有具体展开细节,但表示:“它们之间有很多不同之处,我认为竞争是不可避免的。看看它们会如何发展将是非常有趣的事情。”
Raibert 特别提及这一轮由 DeepSeek 引发的中国人工智能创新热潮。他说道:“我很高兴看到 DeepSeek 这样的创新来自中国,但这只是个开始,整个人工智能领域还在不断涌现,我们并没有走到最后,未来还会有更多改变技术发展的新想法出现。”
三星半世纪来最大罢工迎来终章!涨薪 5.1%+ 股票等福利
2 月 24 日,三星电子与全国三星电子工会(NSEU)宣布达成初步协议,结束了长达数月的劳资纠纷。去年 7 月,全国三星电子工会发起史上首次总罢工,抗议长期僵持的谈判,同年 11 月临时协议被否决,但工会执行部通过信任投票得以留任,最终推动此次 3 年期协议落地。
根据协议,2023 年至 2025 年员工的平均工资上调率分别为 4.1%、5.1% 和 5.1%,其中 2025 年的涨幅由基本工资上调 3.0% 和绩效工资上调 2.1% 构成。公司还将向每位员工发放价值约 170 万韩元(约合人民币 8636 元)的 30 股公司股票,以及 200 万韩元(约合人民币 10160 元)的家庭网店积分,可购买公司产品。
除此之外协议内容还包括多项福利改进,如每月工作满 20 天的员工可获得 25 万韩元的轮班津贴,固定加班时长从 16.5 小时减少至 14 小时,以及为有 3 个以上子女的员工制定退休后再就业保障制度等。全国三星电子工会计划于 3 月 5 日前举行全员投票。
特斯拉“中国版”FSD 测试翻车?网友称驾照 12 分扣完
近日,特斯拉宣布在国内推出“中国版”FSD,但汽车博主陈震在测试过程中,却出现了多次违章。2 月 27 日一早,陈震在其个人微博发布了一则视频,晒出了多张违章通知单。他表示,“刚刚处理完此前测试特斯拉 FSD 的违章,调监控看了下,这次测试 FSD 总共有 7 个违章。”并表示,“在目前的 L2 阶段,车主开启辅助驾驶的过程中,仍然是车辆的第一责任人,因此发生的所有事故、违章都要车主承担。”
还有网友表示,特斯拉 FSD 入华的消息一公布,就立即充值 64000 元,给自己的爱车开通了这一功能。本想体验一下所谓的全球顶尖智驾实力,没想到现场翻车,30 秒内连闯两个红绿灯,扣光了驾照上的 12 分。有网友解释说,特斯拉 FSD 刚刚进入国内,还没有掌握国内交通通行习惯,过一段时间,数据喂养成熟后,这些问题就会解决。
本周二,特斯拉股价暴跌超过 8%,市值跌破 1 万亿美元,跌至 11 月 7 日(特朗普赢得大选两天后)以来的最低水平。今年迄今,该股已暴跌 25%,较 12 月 16 日的创纪录收盘价下跌了 35% 以上,而纳斯达克指数今年迄今仅下跌 1.5%。特斯拉 CEO 埃隆·马斯克的净资产今年以来缩水了超过 520 亿美元,尽管他仍然是世界上最富有的人,目前财富价值约为 3800 亿美元。
阿里巴巴 2026 届春招启动,AI 相关岗位占比近 5 成
2 月 27 日,阿里巴巴正式启动春季 2026 届实习生招聘,开放超过 3000 个岗位。当天,阿里巴巴控股集团、阿里云、高德、通义实验室、饿了么、灵犀互娱首批启动春招。接下来,淘天、阿里国际、菜鸟、阿里大文娱、智能信息、盒马等将陆续开启春季 2026 届实习生招聘。据了解,本届阿里春招与 AI 相关的岗位占比近 5 成,部分 AI 业务部门占比更高,高德 AI 类岗位占比约 65%,阿里云超过 80%。
苹果年度股东大会,库克 7461 万美元薪酬获批,未接任董事长
当地时间 2 月 25 日,苹果公司召开年度股东大会。会议审议了高管薪酬、董事会改选等多项提案。在此次股东大会上,苹果在委托声明书中披露了董事会提名的八位董事候选人名单,库克位列其中,将继任新一届董事会席位,但并非董事长职位。
除了董事会相关事宜,股东还批准了公司高管的 2024 年薪酬方案。库克在 2024 年的总薪酬为 7461 万美元(含薪资、股票与奖金),较 2023 年增长 16%。库克的收入包括 300 万美元的基本工资、5809 万美元的股票奖励、1200 万美元的基于绩效的奖励和 152 万美元的其他薪酬,而其他薪酬包括人寿保险费、安全费用和个人航空旅行费用等等。
近日,一位来自湖南长沙的雷先生以 31.9 万元的价格订购了宇树科技旗下的人形机器人 G1,后因出租爆火于网络。雷先生表示,不少人对租赁这台机器人表示兴趣,其中既有学校希望用于教学科普,也有商家希望它为店铺引流。目前,这台机器人的起租价格是每天 8000 元,会根据地址以及具体时间,有所调整,“有些时候可以租到 1 万多一天。”这台机器人已经被预订到今年 4 月,若以此计算,近 32 万元的购买费用,雷先生只需要 40 天就“回本”了。
目前,在宇树科技京东官方店铺,其人形机器人 G1 共有 4 个版本,包括 G1 标准版、G1 Edu 标准版、G1 Edu 进阶版和 G1 Edu 旗舰版,售价从 129999 元起,最贵的版本售价 349000 元,雷先生购买的则是售价 319000 元的 G1 Edu 进阶版。但是,目前京东平台下订之后需要等待至少 90 天才能交付,并且还需要用户全款预订。
亚马逊云科技(AWS)正式宣布推出其首款量子计算芯片“Ocelot”,标志着其在量子计算领域的重大进展。与当前主流方法相比,Ocelot 芯片能够将量子纠错的成本降低高达 90%。这一创新成果由位于加州理工学院的 AWS 量子计算中心团队研发,并已在权威学术期刊《自然》(Nature) 上发表相关研究论文。
在次前一天,微软发布了其最新的量子计算成果——Majorana 1 芯片。据悉,该芯片采用了独特的拓扑量子比特架构,利用马约拉纳零模式(MZM)构建量子比特,相较于谷歌 Willow 处理器和中国的 Zuchongzhi 3.0 等竞争对手的传统量子比特方法,展现出更高的稳定性和可扩展性潜力。
但有专家指出,微软论文只展示了部分内容,具体路线图存在许多障碍。牛津大学的史蒂文・西蒙提到,类似研究方法的文章曾在 2021 年被撤回。伦敦大学学院的乔纳森・奥本海姆认为,微软团队尚未证明拥有真正的拓扑量子比特。科学界正关注微软的技术进展及其与其他量子计算平台的性能对比。
10 人用 AI 生成美女谈恋爱,近千名男性遭诈骗
2 月 24 日消息,上海市公安局闵行分局今日公布了一起利用 AI 生成美女谈恋爱的诈骗案,成功捣毁了一个 10 人诈骗团伙,涉案资金高达 200 余万元。2025 年 1 月,在当地警方的协助下,上海闵行警方在广东、福建、山东等地展开了集中收网行动。查获手机 60 余部、手机卡 250 余张,同时还发现了一套“恋爱话术”和近千名潜在被害人的通讯录。
经调查,该诈骗团伙利用 AI 生成的视频或网络素材进行“广撒网”式交友短视频发布,以此引流,诱导被害人添加微信。随后,聊天业务员使用“恋爱话术”与被害人聊天,确立“恋爱关系”,并以“购买礼物”“开业花篮”等理由进一步筛选潜在被害人。最后,嫌疑人会谎称家属住院需要高额手术费等理由进行收割,期间还会展示身份证,其实也是虚假的。被害人数月以来却连美女的面都没见过,有人顿感被骗,遂向警方报案。
DeepSeek 开源周收官,大幅下调 API 价格
从计算到通信再到存储,DeepSeek“五连炸”几乎覆盖了 AI 开发的全链条,在完全没有升级现有硬件的情况下最大程度地“榨干”算力,进而实现训练效率的飞跃。
第一天:FlashMLA 架构,直接“爆改”英伟达 GPU,突破 H800 计算上限;
第二天:DeepEP,第一个用于 MoE(混合专家)模型训练和推理的开源 EP(专家并行)通信库,提供高吞吐量和低延迟的 all-to-all GPU 内核;
第三天:DeepGEMM,仅 300 行代码的通用矩阵乘法库;
第四天:连开三源,创新的双向流水线并行算法 DualPipe、用于 MoE 的负载均衡算法 EPLB,以及训练和推理框架的性能分析数据;
第五天:3FS 和 Smallpond,高效的分布式文件系统和以之为基础的数据处理框架压榨固态硬盘性能。
另外,2 月 26 日,DeepSeek 宣布即日起在北京时间每日 00:30 至 08:30 的夜间空闲时段,大幅下调 API 调用价格,其中 DeepSeek-V3 降至原价的 50%,DeepSeek-R1 更是低至 25%,降幅最高达 75%。该公司称,这一举措旨在鼓励用户充分利用夜间时段,享受更经济、更流畅的服务体验。
当地时间 2 月 27 日,OpenAI 推出 GPT-4.5 研究预览版,“这是迄今为止我们最大、最优秀的对话模型”。早期测试显示,与 GPT-4.5 的交互更加自然;其更广泛的知识储备、更强的用户意图理解能力以及更高的“情商”,使其在优化写作、编程和解决实际问题等任务中表现优异。OpenAI 预期该模型的“幻觉”现象也会显著减少,并表示以研究预览形式发布 GPT-4.5,旨在更全面评估其优势与局限。OpenAI 现面向所有付费使用层级的开发者,在 Chat Completions API、Assistants API 和 Batch API 中提供 GPT-4.5 预览版。
此外,2 月 26 日 OpenAI 宣布将向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用户推出 Deep Research 功能。根据 OpenAI 公告,这些用户每月将获得 10 次 Deep Research 查询,而 Pro 级用户每月将获得 120 次查询。并且,向免费用户推出 GPT4o mini 驱动的高级语音模式,免费用户也可以每天使用 ChatGPT 高级语音模式。自然的对话节奏和语调与 GPT-4o 版本相似,同时服务成本更低。
国内首个 AI IDE:字节跳动 Trae AI IDE 官宣下周登陆内地市场
2 月 27 日消息,字节跳动技术团队宣布:国内首个 AI IDE“字节跳动 Trae AI IDE”将于下周登陆中国内地市场。这款 IDE 可深度理解中文开发场景,支持智能 AI 协作。Trae 支持 AI 问答、代码自动补全、基于 Agent 的 AI 编程等功能,可以帮助程序员自动化完成开发任务,并在一些项目中可以实现端到端开发,用户提问后能够直接生成完整的代码项目。
超过 DeepSeek、o3,Claude 发布全球首个混合推理模型
2 月 25 日凌晨 2 点,著名大模型平台 Anthropic 发布了首个双思维模型——Claude 3.7 Sonnet。该公司表示,这是其有史以来“最智能”的 AI 模型。Claude 3.7 提供了标准和扩展两种思考模式:标准思考是无需进行复杂的推理过程,就能立刻提供答案,例如,当用户询问“巴黎的埃菲尔铁塔有多高?”,会迅速给出 324 米。
根据 SWE Bench 测试数据显示,Claude 3.7 在代码能力方面大幅度超过了 DeepSeek-R1、OpenAI 的 o1、o3 模型,MMMLU、Math500 等同样表现出色。Anthropic 称,Claude 3.7 Sonnet 是市面上唯一的此类“混合”模型,并将立即投入使用。
分析认为,这一举措或许能为 Anthropic 在与对手 OpenAI 以及那些投入巨资开发 AI 模型的大型科技公司的竞争中赢得急需的优势。此外,Anthropic 正在洽谈筹集 35 亿美元的融资,这一数字远高于此前预期。据知情人士透露,此轮融资将使这家人工智能初创公司的估值大致增至 615 亿美元。
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
2 月 27 日,腾讯混元自研的快思考模型 Turbo S 正式发布。据了解,混元 Turbo S 能够实现“秒回”,吐字速度提升一倍,首字时延降低 44%,同时在知识、数理、创作等方面也有突出表现。通过模型架构创新,Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。该模型已在腾讯元宝上线,用户可以选择 Deepseek R1 或腾讯混元 T1 模型进行回答。腾讯混元表示,正式版的腾讯混元 T1 模型 API 也将很快上线,对外提供接入服务。
微软开源多模态 AI Agent 基础模型 Magma
当地时间 2 月 25 日,微软在官网开源多模态 AI Agent 基础模型 Magma。据介绍,与传统 Agent 相比,Magma 具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,此外,Magma 还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。