专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
小众软件  ·  听说,一张 4090 显卡就能运行 ... ·  昨天  
APPSO  ·  刚刚,DeepSeek ... ·  2 天前  
APPSO  ·  xAI 宣布 Grok 3 ... ·  2 天前  
51好读  ›  专栏  ›  APPSO

黄仁勋首度回应DeepSeek冲击/AI硅胶娃娃爆火,接入ChatGPT/小米首款AI PC即将推出|Hunt Good周报

APPSO  · 公众号  · app  · 2025-02-23 10:00

正文

欢迎收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
9 条新鲜 资讯
5 个有用 工具
1 个有趣 案例
3 个鲜明 观点
Hunt for News|先进头条
👀 AI 硅胶娃娃爆火,接入 ChatGPT、Llama 等大模型
近期,广东中山成人玩偶制造商 WMDoll 因推出搭载 AI 功能的硅胶娃娃引发市场热议。
据蓝鲸新闻报道,这款产品通过接入 ChatGPT、Llama 等开源 AI 模型,实现了智能对话和情感互动功能,新一代 AI 硅胶娃娃具备理解、分析和回应能力,可以通过持续对话建立用户画像,并保持长期记忆功能。
WMDoll 负责人 Max 介绍,开发这类产品的前期投入至少需要 100 万元,目前,该公司已与国内情感 AI 仿生机器人提供商无芯科技合作,计划开发具备面部表情和生理数据联动功能的新产品。
在商业模式方面,AI 硅胶娃娃采用了基础产品加订阅服务的收费方式。产品售价在 1500-2000 美元之间,用户需额外支付 100 美元订阅费才能启用 AI 交互功能。
据报道,自产品公测以来,带有 AI 功能的订单已占总订单量的五分之一,预计 2025 年销量将增长 30%。
值得注意的是,AI 硅胶娃娃在数据安全方面采取了双重加密措施,以保护用户隐私。目前该产品已在海外市场销售,预计最快将于今年 3 月底在国内上架,但会对语料内容进行合规性调整,主要聚焦于陪伴和聊天功能。
🔗 https://mp.weixin.qq.com/s/ibrJxaHAXdpGloakIP9w_w
🍎 苹果 AI 将于 4 月正式支持简体中文
2 月 21 日,苹果官宣 Apple 智能将支持更多语言,包括法语、德语、意大利语、葡萄牙语(巴西)、西班牙语、日语、韩语和简体中文,以及新加坡与印度的本地化英语。
新语言将于四月随 iOS 18.4、iPadOS 18.4 和 macOS Sequoia 15.4 面向全球几乎所有地区发布,而开发者测试版即可进行更新测试, 已经有开发者实测,可以通过中文界面调出 ChatGPT。
随着这次更新, Apple 智能还将支持通过 Apple Vision Pro 进行体验(仅支持英文)。
随着更新的发布,欧盟的 iPhone 与 iPad 用户将可首次使用 Apple 智能功能。值得一提的是,苹果官方表示,Apple 智能在中国推出的时间依监管部门审批情况而定。
换言之,即便 Apple 智能支持中文,国行 iPhone 可能也还要再等一段时间才能用得上。
🔗 https://www.apple.com.cn/newsroom/
💰 OpenAI 前高管出走创业
本周,OpenAI 前 CTO Mira Murati 宣布,创立名为 Thinking Machines 的 AI 公司。
根据 T hinking M achines 官方介绍,工作人员由来自 ChatGPT、 Character.AI 等公司的成员构成。
在官网上可以看到,目前团队成员中, 有相当一部分的成员有过在 OpenAI 任职的经历,如前 OpenAI 研究(后培训)副总裁 Barret Zoph、前 OpenAI VP 翁荔等人。
Mira Murati 表示, T hinking M achines 正在构建一下三件事:

帮助人们调整人工智能系统以适应其的特定需求

打造强大的基础模型,用以构建更强大的 AI 系统

培养开放科学的氛围,帮助整个领域理解和改进这些系统
另外,据彭博社援引知情人士消息称, OpenAI 前首席科学家 Ilya Sutskever 的初创公司 SSI 正在以超过 300 亿美元的估值筹集资金,其中包括来自 Greenoaks Capital Partners 的 5 亿美元投资。
Greenoaks 是这一融资的主导方,该公司还投资了 AI 公司 Scale AI 和 Databricks Inc。不过,SSI 目前尚未产生收入,也不打算在近期内销售 AI 产品,而是专注于开发安全的 AI 系统。
🔗 https://www.bloomberg.com/news/articles/2025-02-17/openai-co-founder-s-startup-is-fundraising-at-a-30-billion-plus-valuation?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=xai-s-smartest-ai-on-earth-arrives
💵 惠普将以 1.16 亿美元收购 Humane 核心 AI 技术
Humane Ai Pin is Out of Business: $700 Device is Hardware Junk in Less Than  a Year!
近期,Humane 宣布 ,惠普公司将以 1.16 亿美元收购「其关键人工智能能力」,其中包括 Humane 所拥有的人工智能平台 Cosmos、高技能技术人才以及拥有 300 多项专利和专利申请的知识产权。
此外, Humane 还发布 Ai Pin 支持文件,表示将停止销售新的 Ai Pin。
而已经购买 Ai Pin 的用户,其设备将正常工作至 2025 年 2 月 28 日 12点 (太平洋标准时间)。自此之后,Ai Pin 将不再连接到 Humane 的服务器,通话、消息、AI 查询/响应或云访问等功能都无法使用。
据 TechCrunch 报道,Humane 的联合创始人和首席执行官将加入 HP IQ——一个新成立的创新实验室, 该实验室将专注于将 AI 集成到惠普的个人计算机、打印机和互联会议室中。
🔗 https://techcrunch.com/2025/02/20/inside-the-humane-acquisition-hp-offers-big-raises-to-some-others-immediately-laid-off/
📝 OpenAI 推出大模型测试基准 SWE-Lancer
OpenAI introduces SWE-Lancer: A Benchmark for Evaluating Model Performance  on Real-World Freelance Software Engineering Work - MarkTechPost
OpenAI 近日推出了一个软件工程基准数据集 SWE-Lancer。
SWE-Lancer 是首个基于 Upwork 平台真实自由职业任务的评估数据集。该数据集包含超过 1400 个软件工程任务,总价值达 100 万美元,为评估 AI 模型在实际软件开发场景中的表现提供了重要参考。
SWE-Lancer 数据集主要包含两类任务:

1. 独立工程任务:涵盖从 50 美元的 Bug 修复到 32000 美元的功能实现等不同规模的项目。这些任务通过经验丰富的软件工程师三重验证的端到端测试进行评分。
2. 管理决策任务:要求模型在不同的技术实现方案中做出选择。评估标准是与原雇佣工程经理的实际决策进行对比。
🔗 https://openai.com/index/swe-lancer/
👀 DeepSeek 发布新论文,创始人亲自挂名
2 月 18 日,DeepSeek 官方发文公布了一篇新的论文,值得关注的是,论文中提出了一种新的注意力机制「NSA」。
据 DeepSeek 介绍,「NSA」是一个用于超快长上下文训练和推断的本地可训练的稀疏注意力机制,并且还具有与硬件对齐的特点。
研究通过对现实世界语言语料库的综合实验来评估 NSA。其中作者评估了 NSA 在通用语言评估、长上下文评估和链式推理评估中的表现。 实验结果表明,NSA 实现了与 Full Attention 基线相当或更优的性能,同时优于现有的稀疏注意力方法。
此外,与 Full Attention 相比,NSA 在解码、前向和后向阶段提供了明显的加速,且加速比随着序列长度的增加而增加。这些结果验证了分层稀疏注意力设计有效地平衡了模型能力和计算效率。
🔗 https://arxiv.org/abs/2502.11089
🤖 Figure 机器人发布首个通用视觉语言行动模型
Helix: A Vision-Language-Action Model for Generalist Humanoid Control
当地时间 2 月 20 日, 美国人形机器人公司 Figure AI 发布了首个通用视觉 – 语言 – 行动(VLA)模型「Helix」 ,其能够像人类一样推理,并将感知、语言理解和学习控制融为一体。
据介绍,Helix 可以通过自然语言直接控制人形机器人整个上半身。官方表示,Helix 能够在没有特定任务演示或大量手动编程的情况下,即时生成长期、协作、灵巧的操作。Helix 拥有强大的物体理解能力,因此搭载此模型的 Figure 机器人只需通过自然语言询问,就能拿起数千种形状、大小、颜色和材料属性各异的小型家居产品。
同时, Helix 还能够在两个机器人上同时运行 VLA,使它们能够解决共享的长程操作任务,操作它们从未见过的物品。 并且 Helix 是首个在完全板载嵌入式低功耗 GPU 上运行的 VLA,可立即投入商业部署。
此外,Helix 是首创的 「系统 1 + 系统 2 」VLA 模型。Helix 通过接耦合的架构方式,允许每个系统以其最佳时间尺度运行。具体来看,系统 1 可以通过「快思考」实时执行和调整动作,同时系统 2 可以「慢思考」实现高层次目标。
整个架构中,系统 2 是 VLM 骨干,基于一个 7B 参数的开源、开放权重 VLM,并在互联网规模的数据上进行了预训练;而系统 1 是一个 8,000 万参数的交叉注意力编码器 – 解码器 transformer,用于处理底层控制。
🔗 https://www.figure.ai/news/helix
💪 Clone 展示首个双足肌肉骨骼机器人
Haunting moment world-first humanoid robot 'Protoclone' with 'muscles &  bones' twitches & spasms into life in eerie vid | The Irish Sun
波兰创业公司 Clone Robotics 近日发布了世界首个双足肌肉骨骼机器人 Clone。
Clone 最大的特点在于其独特的仿生结构。
Clone 采用 Myofiber人造肌肉技术,通过液压驱动和精确的肌腱连接系统实现运动, 其骨骼系统完整复制了人体 206 块骨骼,配备了复杂的神经系统和血管系统,上半身就拥有 164 个自由度,能实现极其灵活的动作。
在功能方面,Clone 被设计用于家庭服务场景。它可以完成日常家务如洗衣、做饭、打扫等任务,还具备空间记忆和物品操作能力。更重要的是,得益于其柔性材料构造,Clone 在与人类互动时更为安全友好。
Clone Robotics 计划限量生产 279 台高级版本,并将在 2026 年初推出面向大众市场的版本,预计售价将逐渐降至约 2 万美元。
公司创始人 Łukasz Koźlik 表示,Clone 不仅是一个人形机器人,更是「重构的人类」,在结构和功能上都更接近人体。
🔗 https://www.youtube.com/watch?v=H7dhwFcuUn0
🤖 挪威机器人公司 1X 推出家用人形机器人新品
1X built its latest humanoid NEO Gamma to better fit into the home - The  Robot Report
挪威机器人公司 1X 日前发布了其最新家用人形机器人产品 Neo Gamma。
作为 Neo Beta 的升级版本,这款新型人形机器人在设计理念上更加注重家庭使用场景,展示了包括冲咖啡、洗衣服和吸尘等多项家务能力。
为确保居家使用安全, Neo Gamma 采用了针织尼龙材质的外壳设计,可以有效降低机器人与人类接触时可能造成的伤害。 同时,该产品还搭载了先进的 AI 系统,能够精确感知周围环境,最大程度避免对人员和财物造成损害。
OpenAI 是 1X 公司的早期投资者之一。与此同时,1X 正在开发自己的 AI 模型,旨在提升机器人的语言交互能力和肢体语言表现。
1X 公司表示,Neo Gamma 目前仍处于有限的居家测试阶段,距离商业化规模部署还有很长的路要走。
🔗 https://www.1x.tech/?=latest
Hunt for Tools|先进工具
💻 小米首款 AI PC 即将推出
小米集团合伙人兼总裁卢伟冰在昨晚的直播中宣布即将推出小米首款 AI PC 产品。虽然新品具体型号尚未确定,但卢伟冰透露,该产品将配备 99Wh 超大容量电池,卡着能上飞机的容量限制打造。
值得注意的是,小米公司产品行销总监马志宇此前曾在社交媒体分享了一款名为 REDMI Book Pro 2025 的产品。
REDMI Book Pro 2025 采用英特尔酷睿 Ultra 5 处理器,支持澎湃智联和小爱同学,预装小米电脑管家,并特别提供了小米汽车 SU7 Ultra 的专属壁纸。
性能表现方面,马志宇分享的游戏测试数据显示, 这款笔记本在运行《黑神话:悟空》时平均帧率达到 67帧 /秒,最高可达 75 帧/秒,即使是最低帧率也能保持在 59 帧/秒。
对于网友关注的其他问题,马志宇表示,虽然小米品牌的笔记本产品线会继续更新,但短期内暂无新品计划。同时他也确认,这款新品不会配备 TGX 接口。
👏 Grok 3 正式发布
Elon Musk xAI Unveils Grok 3 to Challenge Rivals
2 月 18 日,马斯克旗下 xAI 正式发布 Grok 3 模型。
据官方介绍,Grok 3 在 Chatbot 竞技场之称的 LMSYS 盲测中,代码、指令响应等各个方面排名第一,超过 Gemini-2 Pro、DeepSeek-V3、GPT-4o 等模型。同时,Grok 3 mini 也一同公布,其将牺牲部分性能,换取更快的响应能力。
而推理版本的 Grok 3 Reasoning Beta 支持深度思考,其在最新的 AIME 竞赛中表现断层领先。值得关注的是,对比模型中还出现了近期火爆的 DeepSeek R1 模型。但 Grok 3 Reasoning 目前仍处于测试阶段。
据悉,Grok 3 训练累积使用了 20 万张 H100 显卡。xAI 表示,最大的挑战是让整个模型在海量的 H100 上进行训练,并保持一致性。
xAI 还一同带来了由 Grok 3 加持的 DeepSearch,号称是下一代搜索引擎。模型将自主像 agent 一样运作,并且理解用户提问背后的意图,能够在互联网以及 X 中进行全面检索。
备受关注的语音模式也有了进一步的公布。马斯克在直播中透露,语音模式将是 Grok 最好的体验之一,同时在发布直播尾声,xAI 还放出了一段语音模式的预览视频,其效果十分接近人类声音。
费用方面,X 的 Premium+ 订阅用户(每月 40 美元)将率先体验 Grok 3,而其他高级功能则被纳入 xAI 推出的新计划「SuperGrok」中。SuperGrok 的月费为 30 美元,年费为 300 美元,仅提供额外的推理和 DeepSearch 查询功能,还包含了无限量的图像生成服务。
此外,Grok API 还将在未来几周内推出,包含推理模型和深度研究功能。并且 xAI 还宣布,当 Grok 3 成熟稳定之后,大概几个月将会开源 Grok 2。
2 月 20 日,Grok 3 还一度宣布向 x 用户免费开放(直到服务器崩溃为止)。经过实测,Grok 3 有一定的次数限制,不过也可以使用 Deep Search 和推理模型。
另外,OpenAI 员工指出 xAI 公布的图表没有包括 o3-mini-high 在「consensus@64」条件下的分数,后者是一个允许模型多次尝试回答问题并采用最常见答案的方法,通常能显著提高模型的基准测试分数。
正确的基准测试成绩或许应该长这样:
🔗 https://x.ai/blog/grok-3
🧮 微软首发量子芯片 Majorana 1
Microsoft's Majorana 1 Chip Carves New Path for Quantum Computing
近期,微软发布了量子计算的新突破 — Majorana 1 芯片。
根据微软发布的论文所述,这是世界上首个由拓扑内核驱动的量子处理单元(QPU),可在单个芯片上扩展至百万量子比特,为量子计算指明了一条路径。
在过去 17 年的时间里,微软一直都在寻找一个可靠的新材料和体系结构去实现量子计算。如今,微软宣布利用了一种新型的拓扑超导材料(结合了砷化铟(半导体)和铝(超导体))首次实现对马约拉纳粒子的精准操控,可以创造出更稳定、抗干扰的量子比特(qubits)。
目前,微软宣布已经将 8 个拓扑量子比特放在一个仅有手掌大小的芯片上,而这个芯片架构的目标是要拥有 100 万个拓扑量子比特,这也是目前唯一明确具备可扩展性的架构。
微软技术研究员 Chetan Nayak 认为,「我们重新发明了量子时代的晶体管,这是通向实用量子计算的清晰路径。」同时 Chetan Nayak 还表示,从最初,团队就想制造一台对商用有影响力的量子计算机,并且不仅仅是在思想上引领,并且他强调,若想实现就必须实现规模化。
此外,微软表示,预计会在未来几年内,能够造出解决工业规模问题的量子计算机。
🔗 https://news.microsoft.com/source/features/innovation/microsofts-majorana-1-chip-carves-new-path-for-quantum-computing/
🎮 微软推出最新 AI 模型 Muse
微软近日推出了首个世界与人类行为模型(WHAM),并将其命名为「Muse」。
Muse 是一个能够一键生成游戏画面和控制器操作的生成式 AI 模型,由微软研究院游戏智能团队与 Xbox 游戏工作室忍者理论工作室合作开发。
为推动相关研究发展,微软已将模型权重、示例数据以及 WHAM 演示程序开源,供开发者在 Azure AI Foundry 平台上进行学习和实验。
Muse 模型的训练数据来自 Xbox 游戏《Bleeding Edge》的真实玩家数据, 包含超过 10 亿张图像和控制器操作记录,相当于 7 年的持续游戏时长。
这款 AI 模型具有三个关键能力:一致性、多样性和持续性。
在一致性方面,Muse 能够生成符合游戏物理规则的连贯画面;在多样性方面,它可以基于相同的初始条件生成不同的游戏场景变体;在持续性方面,模型能够将用户添加的新元素自然融入到生成的游戏画面中。
微软研究团队特别强调了用户参与的重要性。
在开发过程中,他们邀请来自不同地区和背景的游戏创作者参与设计,确保技术发展能够真正服务于创作者的需求。为方便用户使用,团队还开发了 WHAM 演示程序,提供了直观的可视化界面。
🔗 https://www.microsoft.com/en-us/research/blog/introducing-muse-our-first-generative-ai-model-designed-for-gameplay-ideation/
🔬 Google 推出基于 Gemini 2.0 的 AI 科研助手
Google 近日推出一款基于其最新大语言模型 Gemini 2.0 的 AI 科研助手工具——AI co-scientis。这款工具通过聊天机器人界面与研究人员互动,能够协助制定研究计划、分析科学文献,并提出创新性研究假设。
AI co-scientis 的核心由六个以上 AI 智能体组成,各司其职。
Generation 智能体负责分析科学现象并生成初步假设;Ranking 智能体则协同其他辅助智能体对这些假设进行优化;Proximity 智能体去除重复内容等。
整个 AI 系统由一个监督智能体统筹协调,负责收集计算数据并决定处理流程。
在实际应用中,研究人员可以输入具体研究目标,如为现有药物开发新的临床应用。系统随后会生成详细的研究计划,并从学术文献中搜索相关数据支持。用户还可以针对系统的初步建议提供反馈,帮助其不断改进输出质量。
Google 研究人员 Juraj Gottweis 和 Vivek Natarajan 表示,AI co-scientis 不仅仅是文献综述和研究总结工具,更重要的是它能够发现原创性知识,提出新颖的研究假设。
初步测试显示,在 15 个研究目标的评估中,AI co-scientis 的输出在创新性和影响力方面均优于其他同类模型。
🔗 https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=google-s-new-ai-co-scientist
Hunt for Fun|先行
🐰 Rabbit R1 功能上新






请到「今天看啥」查看全文