专栏名称: APPSO
让智能手机更好用的秘密。
目录
51好读  ›  专栏  ›  APPSO

天才AI科学家遗书曝光/马斯克称Grok 3即将推出/起底Deepseek团队,清北应届生上大分|Hunt Good周报

APPSO  · 公众号  · app  · 2025-01-05 11:56

正文

欢迎收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
10 条新鲜资讯
3 个有用工具
1 个有趣案例
3 个鲜明观点
Hunt for News|先进头条
🍎 Apple Intelligence 或将导致存储需求攀升
据外媒 9to5Mac 报道,Apple Intelligence 最新版本的设备存储需求已从原先的 4GB 激增至 7GB,几乎翻倍。
这一变化源于 iOS 18.2 版本中新增的多项 AI 功能,包括 Genmoji、ChatGPT 集成 Siri、Image Playground 等功能。
报道称,由于 Apple 智能采用设备端处理策略以保护用户隐私,这意味着 AI 模型需要直接下载到用户设备上。7GB 的存储要求适用于 iPhone、iPad 和 Mac 三类设备。
由于每台设备都需要进行独立的本地处理,对于拥有多台设备的用户来说,总存储占用将会显著增加。例如,同时在三种设备上使用 AI 功能的用户,将需要总计 21GB 的可用空间。
值得注意的是,用户目前无法通过禁用部分功能来降低存储需求。
随着今年 4 月 iOS 18.4 版本的推出,Siri 将迎来重大升级。报道指出,在接下来的几个月里,每台设备的 AI 存储需求可能会达到 10GB,甚至是在 iOS 19 的新功能发布之前。
对于计划购买新款苹果设备的用户来说,选择更高存储容量的机型可能成为一个值得考虑的选项。
🔗 https://9to5mac.com/2025/01/03/apple-intelligence-now-requires-almost-double-iphone-storage/
☺️ 马斯克称 Grok 3 即将推出
马斯克曾表示,Grok 3 的训练使用了 10 万块英伟达 H100 芯片,并期望它能够成为世界上最强大的 AI 模型。
但本该在去年底上线的 Grok 3 迟迟不露面,等急了一众网友。直到昨天,马斯克也在 X 平台透露了关于 Grok 3 的最新进展:
「Cool! Grok 3 即将发布。预训练已经完成,计算能力比 Grok 2 强大 10 倍。」
别看他说了什么,得看最终的效果如何,但愿 Grok-3 能给 OpenAI 狠狠上一波强度吧。
🔗 https://x.com/elonmusk/status/1875357350393246114
👀 OpenAI CEO 再打哑谜,网友贴脸开大
没有人能比 OpenAI CEO Sam Altman 更懂打哑谜。
这不,今天 Altman 又在 X 平台发文称:
我一直想写一个六个字的故事。这里是:临近奇点,难辨其侧。。

(这个故事要么是关于1.模拟假说,要么是关于 2.无法知道起飞的关键时刻何时真正发生,但我喜欢它也能以许多其他方式解读。)」

不过,这一顿哑谜也给网友整迷糊了。
也有网友贴脸输出,还是那个熟悉的味道,熟悉的 Altman。
还有 Altman 与 Grok 的巧妙联动。你觉得 Grok 的解读如何呢?
 🔗 https://x.com/sama/status/1875603249472139576
👨‍🎓 起底 Deepseek 团队
随着 DeepSeek-v3 在 AI 圈异军突起,这家低调的公司再次成为焦点。
据量子位调查,DeepSeek 的核心技术力量离不开一群极具天赋的高校学子。其中,清华、北大的在读生和应届生占据重要位置。

邵智宏:清华交互式人工智能课题组博士生,师从黄民烈教授。曾在微软研究院工作,参与了 DeepSeek-Prover、DeepSeek-Coder-v2 等多个重要项目。

朱琪豪:北大计算机学院 2024 届博士,在校期间就发表了 16 篇 CCF-A 类论文,两次获得 ACM SIGSOFT 杰出论文奖,主导开发了 DeepSeek-Coder-V1。

代达劢:北大计算机学院 2024 年博士毕业生,师从穗志方教授。发表 20 余篇顶会论文,获 EMNLP 2023 最佳长论文奖。
DeepSeek-V2 的突破性创新 MLA 架构,主要贡献者同样来自高校:

高华佐:北大物理系毕业

曾旺丁:北邮研究生,师从张洪刚教授

赵成钢:作为超算团队成员三获世界大学生超算竞赛冠军。目前在 DeepSeek 担任训练/推理基础架构工程师。
另外,许多重要创新出自实习生之手:

辛华剑:中山大学逻辑学专业学生,实习期间参与开发了数学定理证明模型DeepSeek-Prover,现就读于爱丁堡大学博士项目。

孙景翔:清华博士生,在实习期间与导师刘烨斌合作,在 3D 生成领域取得突破。

Peiyi Wang:北大博士生,师从穗志方教授,作为核心作者参与了DeepSeekMath 项目。
不得不说,AI 圈也算是卷起青春风暴了。

🕯️ 天才
科学家遗书公布

几天前,天才科学家 Felix Hill 离世的噩耗传来。
当时,整个海外 AI 圈都为这位英年早逝的天才科学家表达哀思,而追悼官网刚刚也公布了 Felix Hill 的遗书。
在这份遗书中,Felix Hill 详细地记录了他与严重精神疾病斗争的艰难历程。
令人感动的是,即便站在生命的悬崖边缘,这位心怀大爱的 AI 科学家仍在用最后的力量劝导他人珍惜生命,继续前行。
如果你有自杀念头,请为你的朋友和家人着想,尽力去尝试我曾尝试过的所有帮助,不管它看起来有多么艰难。即使是在医院经历痛苦,也请至少尝试一次
一个能在生命尽头依然牵挂他人的灵魂,即便选择离去,也是这个世界最温柔的存在。
在放弃前,请给生命多一次机会。
R.I.P.🕯️
附上遗书地址:
https://docs.google.com/document/d/1-jBoSEVlryiX1IaSzV4vKuihDfm_LgXUznvSpl1T1kg/edit?tab=t.0#heading=h.vnjrknmu0cff

👀 GPT-4o mini 参数仅为 8B?

开年第一瓜来了。
近日,微软发布的一篇医学相关的论文中,疑似曝光了 OpenAI 旗下模型的参数。
根据论文披露,OpenAI 的 o1-preview 模型约有 300B 参数,GPT-4o 约 200B,而 GPT-4o-mini 仅有 8B 参数。有消息指出,英伟达此前公布的 GPT-4 采用 1.8T MoE 架构,而此次微软公布的为 1.76T。
同时,论文还透露了 Claude3.5Sonnet 的参数规模约为 175B。
不过,论文也没忘叠甲声明,「几个大型语言模型(例如,GPT、Gemini 2.0 Flash)的确切参数数量尚未公开。此处报告的模型大小估计仅基于公开文章;作者无法保证其准确性,仅供参考以帮助理解模型性能的背景。」
实际上,这并非微软第一次「泄露」模型参数信息。此前微软曾在一篇论文中披露 GPT-3.5-Turbo 的 20B 参数信息,但随后又在更新版本中删除了这一信息。
此外,此篇论文的主要目的是介绍一个名为 MEDEC 的医疗领域基准测试。研究团队分析了来自三家美国医院的 488 份临床笔记,评估了各大模型在识别和纠正医疗文档错误方面的能力。
🔗 https://arxiv.org/pdf/2412.19260
💵 英伟达去年 10 亿美元投了 50 家
买买买成了英伟达 2024 年的主旋律。
据最新数据显示,全球芯片巨头英伟达在 2024 年投资 AI 企业的金额达到 10 亿美元,涉及 50 轮融资和多笔企业交易,较 2023 年的 8.72 亿美元和 39 轮融资明显增长。
凭借备受追捧的 GPU 业务,英伟达储备了大量的资金。报道称,截至 2024 年,该公司已积累了 90 亿美元的现金。
英伟达的投资主要集中在对算力需求较高的 AI 企业。
除了直接投资外,英伟达还通过其创业孵化器 Inception 项目支持数千家初创企业的发展。该项目为初创公司提供硬件优惠价格和云计算额度支持。
并购方面,英伟达在 2024 年完成了创纪录的收购,交易数量超过过去四年总和。重要收购包括以色列 AI 工作负载管理平台 Run:ai,以及 AI 软件公司 Nebulon、OctoAI、Brev.dev、Shoreline.io 和 Deci。
与此同时,All In AI 没有最壕,只有更壕。据彭博社报道称,微软预计本财年将在 AI 数据中心上投资 800 亿美元。
这算不算是兵马未动,粮草先行呢?

🔗 https://www.ft.com/content/f8acce90-9c4d-4433-b189-e79cad29f74e

👏 智元、宇树科技项目开源
12 月 30 日,智元机器人宣布发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。
智元官方表示,AgiBot World 这一开源项目标志着具身智能领域「ImageNet 时刻」已到来。
据官方介绍,相比 Google 开源的 Open X-Embodiment 数据集,AgiBot World 长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量达到了工业级标准。并能让机器人从简单的桌面任务,走进人类日常生活的方方面面。
此外,宇树科技本周也开源了旗下人形机器人全身动作数据集。
官方调整了 Unitree H1、H1-2 和 G1 人形机器人的动作捕捉数据,并通过数学优化方法使它们的运动轨迹更加自然流畅。
🔗 https://mp.weixin.qq.com/s/WGIBdd5zdsjXyU02YSSCYA
🕊️ OpenAI 又「鸽」了一款 AI 工具
OpenAI 最近仍在「吃」着版权官司,而去年许下的承诺也似乎被搁置了。
去年 5 月,OpenAI 曾高调宣布将开发一款名为 Media Manager 的工具,承诺允许创作者指定其作品是否可以被用于 AI 训练。
然而,七个月过去了, Media Manager 依旧不见踪影。
据外媒 TechCrunch 援引知情人士的消息,这款工具在 OpenAI 内部似乎并未被视为重点项目。
一位前 OpenAI 员工表示:「我不认为这是优先事项,老实说,我不记得有人在做这件事。」
更耐人寻味的是,该项目的主要负责人、法律团队成员 Fred von Lohmann 已于去年 10 月转为兼职顾问。
目前,OpenAI 只是提供了一些临时性的选择退出方案,比如允许艺术家通过提交表格将作品从未来的训练集中剔除,也为网站管理员提供了屏蔽爬虫的选项。
但这些,显然还不够。
🔗 https://techcrunch.com/2025/01/01/openai-failed-to-deliver-the-opt-out-tool-it-promised-by-2025/?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=meta-s-plan-for-ai-personas-on-facebook
💰 华为悬赏 300 万元求解 AI 难题
近期,华为在官网发布公告,宣布面向全球启动 2024 奥林帕斯奖(OlympusMons Awards)悬红难题征集,这也是华为公司第五年举办该全球赛事。
根据官网显示,2024 奥林帕斯悬红难题为:
1.
每 bit 极致性价比的存储技术
2.
面向 AI 时代的新型数据底座
向左滑动查看更多内容
2024 年奥林帕斯奖华为共设置了 2 个奥林帕斯奖,5 个奥林帕斯先锋奖,获奖人/团队与华为将与建立技术交流渠道并获得科研助力。
曾经有 300 万摆在我面前 ,我却不懂得珍惜,所以现在学还来得及吗?☺️
🔗 https://mp.weixin.qq.com/s/Lfz1eh3p2dg_o8HWV2RqlA
Hunt for Tools|先进工具
💥 智谱 GLM-Zero-Preview 重磅推出
赶在 2024 年的最后一天,智谱发布推理模型 GLM-Zero 的初代版本 GLM-Zero-Preview。
GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。
同基座模型相比,GLM-Zero-Preview 在不显著降低通用任务能力的情况下,在专家任务能力方面的表现大幅提升,其在 AIME 2024、MATH500 和 LiveCodeBench 评测中,效果与 OpenAI o1-preview 相当。
目前 GLM-Zero-Preview 已经上线使用:

用户可以在「智谱清言」(chatglm.cn)中的「Zero 推理模型」智能体免费使用,支持上传文字或图片,模型会输出完整推理过程;

开发者可以在「智谱开放平台」(bigmodel.cn)中,通过 API 进行调用。
我们也第一时间上手实测,欢迎回看 👇
有了这个国产版 o1 模型,我想能在《鱿鱼游戏》里活到最后
🔗 https://mp.weixin.qq.com/s/jJ92dNeQ-Olfy\_nMfj2e7A
🔍 百度上线「AI 搜」功能
近日,百度在百度搜索 Web 端首页上线了百度「AI 搜」入口。
报道指出,「AI 搜」基于原百度搜索 AI 伙伴改版升级而来,在此前的基础上做功能升级。
百度「AI 搜」是基于百度文心大模型打造的桌面端 AI 搜索引擎,目前内容侧已经打通百度搜索引擎、百度健康、百度律临、百度文库、百度教育等内容生态,可确保搜索结果可靠、权威。
目前百度「AI 搜」覆盖文生图、文生文、逻辑推理、多轮对话、智能摘要、AI 修图等 AI 技术。

「文创」能够针对特定场景创作,并且根据需求持续细化

「图创」融合了图片生成、编辑和进阶加工等功能

「AI 阅读」则能够节省了阅读理解的时间,一个文件、一个网址、甚至是一张图片
此外,百度「AI 搜」也提供了文心智能体入口,在对话框中可输入@方式一键召唤不同智能体专家,针对性地解决用户的问题。
🔗 https://mp.weixin.qq.com/s/XaRMZ-uJXIFKiDFaZtEqFw
📹 PixVerse V3.5 上线
12 月 30 日,爱诗科技宣布 PixVerse V3.5 正式上线。
据官方介绍,在 PixVerse V3.5 Turbo 极速生成模式下,平均 10 秒即可生成视频,最快可达 5 秒,能够帮助创作者大幅提升 AI 视频创作效率。
同时,PixVerse V3.5 具备领先的动漫生成能力,可以直接通过文生视频描述特定风格,生成对应的动漫效果;或上传各类动漫/动画图片,再输入提示词,创作精彩内容。
并且,PixVerse V3.5 支持首尾帧生成,上传两张图片,描述变化过程,即可生成流畅的过渡视频。
目前,PixVerse V3.5 已上线官网。我们也上手实测了一下。
10 秒就能出片,这个低调的国产 AI 视频让 1200 万人上头
🔗 https://mp.weixin.qq.com/s/J66AEIutu62d747HI\_GU5g
Hunt for Fun|先行

🤯 不开玩笑,文物真活了
近期,许多博物院也纷纷用文物整起了活。
比如河南博物院借助 AI 技术,让古老的文物跳脱出庄重肃穆的展陈模式,上演了一出充满烟火气的「拥抱」。
搭配粤语,更是别有一番趣味。
Hunt for Insight|先知
📱 对话 vivo 胡柏山:手机 AI 任重道远
2024 年的最后一周,爱范儿等媒体来到了 vivo 位于东莞的总部,与 vivo 执行副总裁,首席运营官胡柏山进行了一场畅所欲言的对话。
当被问及如何看待 AI 目前的状况时,胡柏山表示:
AI 确实是过去两年时间里大模型的产生,AI 的发挥在那还是很快。回归到手机本身讲,AI 还是有它的限制空间,手机的最大的问题是算力不够。
我把手机 AI 分成了三个阶段:
第一阶段就是 AI 能力加强过去一些功能,比如过去一段时间,整个手机行业比较热门的就是 AI 消除,这个功能十几年前就有,功能技术时代就有,但是那个时候算法比较低级,一直做不好。
过去的语音识别能力,用深度学习的方式,做得好的可能成功率只有 90%,这种成功率你就会发现,对话搞不了几轮,每个环节失真太厉害了。生成式大模型出来依旧,语音识别能力和语义理解能力,一下子提升很多。过去我们有个功能叫电话秘书,最早是在 NEX 3 上推出,别人一听就知道是传统 AI 做出来的,说不了两句就把电话挂了。现在因为有 AI 加持,短时间内大家听不出来是 AI 在讲话。
这些都还是基于某一个功能或者某一个模块的提升,跟通用人工智能(AGI)不是差一点,而是差了十万八千里。
第二个阶段,我认为,是大模型能力结合到系统里去。比如说,我们过去找一个功能设置,根本找不到,因为菜单选项太多,乱七八糟。未来 AI 和系统深度耦合,能够让手机清楚地知道你的意图,知道下一步要操作什么,手机交互变得更加智能。比如我们刚开始尝试的「原子岛」,就是知道你的意图,来提出解决方案。这个阶段会跑比较长的时间,因为这个阶段用户体验,现在算力勉强可以满足。
第三个阶段,就是我们在 VDC 2024 大会上说的 PhoneGPT,我们当时展示的功能就是点个外卖,说能点成功。其实每一步成功率只有 85%,跑三步就跑不动了,时间也很长,这个体验只是个模型,用户体验根本不好。
真正要实现 PhoneGPT 的要求,对算力要求不是增加一点,而是增加好多倍。现在的一体架构,封装架构,以及带宽,都不够。真正 PhoneGPT,整个能力要求就是对现在高速存储,服务器端能力,带宽能力,SoC 架构要跟服务器端要接近才有机会实现。
这个就跟影像一样,我们能看到用户的需求已经产生,很多模型跑在云端的服务器上,我们内部的算力中心差不多接近 1 万张算力卡,很多模型在云端可以跑得动,比如 130B 参数的模型,但这个规模在手机上根本跑不动,手机只能跑 2B、3B 的参数。所以手机真正实现 PhoneGPT,我估计没有五年,达不到用户体验上的要求。
AI 这个赛道,目前还在第二阶段,它是一个渐进式的提升,不是 0 到 1 的提升。所以 AI 对整个换机潮,目前来说,驱动力是不大的,因为用户没有感到了从 0 到 1 的突变,只有从 0 到 1 的突变发生,用户发现 PhoneGPT 能干那么多事情,他们才会有强大的换机欲望。
因为我自己既管产品也管技术,所以我透露的应该都是目前我们的技术或者整个行业的技术目前所处的水平。
完整版采访指路 👇
对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见
👀 英伟达高级研究科学家 Jim Fan:我们的孩子将作为「机器人原住民」长大
预测新一年 AI 发展走向早已成为每年的保留节目。
最近,英伟达高级研究科学家 Jim Fan 也在社交媒体发布了自己的最新预测:
「知道我们是没有到处都是先进机器人的最后一代人,这让我感到非常欣慰。我们的孩子将作为「机器人原住民」长大。
他们将让类人机器人烹饪米其林晚餐,让机器人泰迪熊讲睡前故事,让 FSD 自动驾驶送他们去学校。
我们是「机器人移民」的一代,正在迈向无处不在的物理人工智能新世界,就像我们的父母是「数字移民」一样,在 6 英寸的触摸屏上学会重新调整自己的生活。

这是一段既发明科幻技术又重塑自我的旅程。所有能够移动的事物都将实现自主化。
从现在起,每一年都是属于机器人的一年。
为即将到来的狂野 2025 举杯 🥂」
👀 前 Google CEO:AI 将会获得永久记忆
最近,前 Google CEO 埃里克·施密特在接受《华盛顿邮报》专访时,作出不少惊人预测。
他认为 AI 的发展速度被「低估而不是高估」,2025 年将成为关键转折点。他形容即将到来的 AI 变革是「一切,无处不在,同时发生」。


施密特指出,2025 年 AI 领域将迎来三大重要突破:
首先是「永久记忆」的实现。通过突破性的「无限注意力」技术,AI 将不再受限于当前的上下文窗口,既能记住当前对话细节,又能随时调用过去的重要记忆。
其次是 AI 智能体的崛起,它们将从单纯的对话系统进化为能真正理解并执行复杂任务的助手。第三是「文本到行动」的编程革命,届时每个人都能拥有听命于自己的 AI 程序员。
「这三件事的结合,我完全相信这将在下一波浪潮中发生。」
🔗 https://www.youtube.com/watch?v=iH60yTGtGaA
彩蛋时间
向左滑动查看更多内容
作者:@gizakdag
工具:Midjourney v6.1
链接:https://x.com/gizakdag/status/1874748553974972891