专栏名称: APPSO

让智能手机更好用的秘密。

马斯克再谈约架扎克伯格：随时奉陪/传满血版 o1 下月推出/苹果或将推出 AI 智能家居中控屏 | Hunt Good 周报

APPSO · 公众号 · app · 2024-11-17 11:57

正文

欢迎收看最新一期的 Hunt Good 周报！

在本期内容你会看到：

8 条新鲜资讯
7 个有用工具
1 个有趣案例
3 个鲜明观点

Hunt for News｜先进头条

🧑‍⚖️ 马斯克与 OpenAI 的法律纠纷再升级

本周，埃隆·马斯克与 OpenAI 的法律纠纷再次升级。

诉讼新增了联邦反垄断等多项索赔，并把微软列为共同被告。

马斯克方面指控 OpenAI 和微软违反了反垄断法规，包括以不与竞争对手交易为条件提供投资机会，以及他们的独家许可协议实质上相当于未经监管批准的合并。

马斯克的法律团队指责微软的行为构成了反竞争行为，并表示「阳光是最好的消毒剂」。

对此，OpenAI 回应称诉讼毫无根据，而微软则拒绝发表评论。

此外，一系列涉及 OpenAI 早期成员，包括马斯克和 Altman 等人的电子邮件被曝光。尽管这些邮件不能完整揭示整个事件的全貌，但一些细节也非常有趣。

邮件内容显示，前首席科学家 Ilya 对马斯克的领导能力表示担忧，认为他可能会走向独裁。同时，他对 Altman 也有所质疑，不理解他对 CEO 头衔的执着及其背后的动机。

邮件还透露了 2017 年 OpenAI 曾考虑收购芯片制造商 Cerebras，并可能利用特斯拉的资源来完成这一收购，但最终未能实现。

早期，马斯克曾希望 OpenAI 能成为他的资产之一，一些联合创始人也有类似的想法，但这一计划并未实现。

此外，邮件还显示微软早在 2016 年就有意与 OpenAI 合作，但遭到了马斯克的反对。

🔗 https://www.businessinsider.com/emails-between-sam-altman-elon-musk-kicked-off-openai-2024-11

❌ OpenAI CEO 辟谣 AI 发展「撞墙」论，满血版 o1 疑似下月推出

近期，OpenAI CEO Sam Altman 在 X 平台辟谣 AI 发展「撞墙」论：

「there is no wall .没有墙」

这一则辟谣源自近日有多家媒体报道称，OpenAI、Anthropic 等多家大模型公司下一代前沿模型训练表现不佳，这也导致 Scaling Laws 疑似「撞墙」的消息不胫而走。

此前，OpenAI 前首席科学家 Ilya Sutskever 在接受路透社采访时表示，「通过扩大预训练阶段——即使用大量未经标注的数据来训练 AI 模型，使其理解语言模式和结构——所取得的成果已经停滞不前。」

图灵奖得主 Yann Lecun、Ilya、Anthropic 创始人 Dario Amodei 也就此事纷纷展开唇枪舌战。争论的核心在于，随着模型规模的不断扩大，其性能提升是否会遇到天花板。

具体信息欢迎回看 APPSO 此前文章 👇

作为补充，在这场辩论的背景下，彭博社在近期也披露了一条引人注目的消息。

OpenAI 计划在明年一月份推出一款名为「Operator」的 AI Agent（智能体），这个 Agent 能够使用计算机代替用户执行任务，如编写代码或预订旅行。

值得注意的是，在 Altman 辟谣的推文评论区中，针对网友询问满血版 OpenAI o1 的发布日期，他回应道：

「like for a christmas present? 喜欢圣诞礼物吗？」

🔗 https://x.com/sama/status/1856940944169316843

🧬 说到做到，AlphaFold 3 重磅开源

Google 兑现承诺，重磅开源了 AlphaFold 3。

AlphaFold 3 能够与其他分子协同建模蛋白质，预测蛋白质与 DNA 相互作用时的结构，以及评估潜在药物的性能。

最初，DeepMind 通过网页服务器提供 AlphaFold 3 的访问服务，但由于限制了预测的数量和类型，且未公开代码和模型权重，遭到了科学界的批评。

面对这些反馈，DeepMind 承诺在半年内发布开源版本。

11 月 11 日，DeepMind 宣布，科学家们可以下载 AlphaFold 3 的软件代码，用于非商业目的。目前，仅限于具有学术背景的科学家可以根据要求获得训练权重。

「我们非常期待看到人们如何利用这个工具，」AlphaFold 团队负责人 John Jumper 表示。上个月，他与 Demis Hassabis 共同获得了 2024 年诺贝尔化学奖。

🔗 https://www.nature.com/articles/d41586-024-03708-4

🤖 人形机器人天工亮相北京马拉松

起猛了，看见人形机器人在北京跑马拉松。

11 月 10 日，2024 北京亦庄半程马拉松鸣枪开跑。有趣的是，参赛选手中出现了一位人形机器人「天工」。

不过，贴有「天工 001」号码牌的人形机器人并未跑完全程，跑了一分钟左右，就停到场边，向场外观众示意，并在终点处迎接参赛选手。

据悉，最新版本的「天工」人形机器人身高达到 1.8 米，最高奔跑速度已提升每小时 12公里。

🔗 https://mp.weixin.qq.com/s/HqHYEewdLt31S9Gc3JGLTw

😀 后悔抛售英伟达股票，孙正义抱着黄仁勋假装哭泣

英伟达 CEO 黄仁勋与软银集团 CEO 孙正义本周同台亮相。

在对话开始之前，黄仁勋首先进行了长达一个小时的演讲，向与会者介绍了 AI 的最新技术发展，以及 AI 将如何深刻地改变人类的生活。碰到小插曲，老黄也入乡随俗地连道多句「私密马赛」。

在与孙正义的交流过程中，黄仁勋还展示了不少「黄氏」幽默。

例如，看到孙正义，先来一段排比句式的彩虹屁，逗得孙正义开颜大笑；打趣孙正义后悔抛售英伟达股票，也调侃自己错失了收购英伟达的最佳时机。

「你们中很多人可能不知道，Masa（孙正义）曾经是英伟达的最大股东」听到这话，孙正义搂住黄仁勋，做出一副哭泣的样子，引得在场与会者大笑。

更多细节欢迎回看 APPSO 此前文章👇

黄仁勋最新演讲：每家公司都将成为 AI 制造商 | 万字实录

🔗 https://www.nvidia.cn/events/ai-summit-japan/fireside-chat/

🥊 马斯克再谈与扎克伯格的「笼中决斗」：随时奉陪

近期，58 岁的拳王泰森重返擂台，对垒 27 岁的美国网红兼职业拳击手杰克·保罗，最终落败。

在这场泰森与保罗的重量级比赛进行之际，一位网友提问：特斯拉 CEO 埃隆·马斯克和 Meta CEO 马克·扎克伯格之间的比赛何时进行？

对此，马斯克现身评论区回应称，这场比赛可以随时举行。

「Anytime, anyplace, any rules are fine by me 随时、随地、任何规则我都没问题。」

去年 6 月份，马斯克在 X 平台宣称他要和扎克伯格进行一场「笼中约架」，双方经过多轮呛声之后，马斯克的母亲宣布取消了这场比赛，并劝告网友不要起哄，希望两人不要真的动手。

看热闹不嫌事大，如果开打，你觉得谁会赢？

🔗 https://x.com/Nate\_Esparza/status/1857658369391341604

🍎 传苹果将推出 AI 智能家居中控屏

据彭博社的 Mark Gurman 报道，苹果公司正在开发一款新的智能家居产品——一款壁挂式显示屏，拥有控制家电、与 Siri 互动和视频会议等功能。

显示屏看起来像一个方形的 iPad，拥有大约 6 英寸的屏幕，顶部配有摄像头，内置扬声器和可充电电池。其已开发三年，可能会在明年 3 月正式宣布。

这款设备在功能上与 Google Home Hub 和亚马逊的 Echo Show 相似，但苹果的智能家居控制中心的独特之处可能是苹果 AI，包括 10 月下旬开始向用户推出的 Apple Intelligence 以及即将到来的 App Intents 系统，该系统可使用 AI 控制软件程序。

此外，苹果还在开发一款带有机械臂的版本，能够移动平板设备。这表明苹果可能不仅仅是在开发一个智能设备控制面板，而是在寻求更先进的智能家居解决方案。

🔗 https://www.bloomberg.com/news/articles/2024-11-12/apple-home-hub-detailed-apple-intelligence-homeos-square-ipad-like-design?srnd=undefined

📱 Google 推出适用于 iOS 的 Gemini 应用

Google 近日在全球范围内为 iOS 用户推出了 AI 助手 Gemini 的独立应用。

此前，iOS 用户仅能通过 Google 应用或移动网络与 Gemini 互动。新应用支持 35 种语言的文本提示，以及 12 种语言的 Gemini Live 对话功能。

Google 承诺还将增加更多语言支持。

此外，应用新增了 Imagen 3 模型生成图像和扩展程序查询 Google 账户信息等功能。Gemini 应用旨在简化用户访问流程，建立肌肉记忆，并能便捷地连接其他 Google 应用。

🔗 https://techcrunch.com/2024/11/14/google-launches-gemini-app-for-ios-worldwide/

Hunt for Tools｜先进工具

🐧 腾讯元宝 2.0 版本更新

腾讯元宝 2.0 版本，本周正式焕新上线。

腾讯元宝支持对话列表焕新，可以更轻松地查找历史对话和使用过的智能体。

此外，腾讯元宝精选 AI 搜索、AI 阅读、创意绘画、灵感图库、AI 美照五大应用，多维度满足搜、读、写、画创作需求。

除微信公众号外，腾讯元宝还升级整合微信视频号、QQ 音乐等信息资源，提供更加智能、便捷的搜索服务，随时随地想搜就搜。

基于新一代大模型「混元 turbo」，元宝性能大幅提升，训练和推理效率提升一倍。

得益于国内首个自研 MoE 多模态大模型，其还支持任意长宽比及最高 7K 分辨率图片的理解分析；中文原生 DiT 文生图架构，语义理解、画面质感与真实性方面得到全面提升。

🔗 https://mp.weixin.qq.com/s/9CfdKnDRfpqlfWaZs4rg9Q

📗 腾讯发布 AI 智能工作台 ima

11 月 15 日，腾讯正式发布 AI 智能工作台 ima.copilot（简称 ima）。

据介绍，ima 搜索得出的答案，除开全网信源，还打通——微信公众号文章的生态，能为用户提供好答案和高质量的问题相关信息，有效提升信息获取效率。

除了能搜出答案，ima 还有一个特点——边问边看，边搜边记。

不止网络上的资料，本地上百页的文献，几十万字的行业经验，只需要把文件拉入到 ima 的对话框里，它便可以总结内容，提炼要点，生成脑图。

ima 还是一款非常好用的编辑工具。搜到的答案，解读的资料，只需要选中你要的部分，就可以生成笔记，直接进行编辑。

值得注意的是，ima 是由腾讯混元大模型提供技术支持。

🔗 https://mp.weixin.qq.com/s/IVYdGePcu2Gw6Wm5fYygOA

👏 Kimi 发布新推理模型

Kimi 近期正式发布新一代数学推理模型 k0-math。

基准测试显示，Kimi k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型：o1-mini和o1-preview。

在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中，k0-math 初代模型成绩超过 o1-mini 和 o1-preview 模型。

‍

在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中，k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。

同时，Kimi 探索版也通过运用强化学习技术创新了搜索体验，在意图增强、信源分析和链式思考三大推理能力上实现突破。

据悉，k0-math 模型和更强大的 Kimi 探索版，未来几周将会分批陆续上线。

🔗 https://mp.weixin.qq.com/s/OCn6fgkccaRypT1TeLYBMg

🎥 即梦 AI 视频生成模型更新

11 月 15 日，即梦 AI 两大视频模型正式全量上线。

据悉，S2.0 Pro 在 i2v 场景下有非常好的首帧一致性，可以保持与用户输入图的一致性、色彩等细节还原，在视频生成体验上更惊喜、更可控。

P2.0 Pro 拥有极高的提示词遵循能力，对复杂的提示词能够保持严格的遵循。

此外，P2.0 Pro 还能够在一句提示词内，实现多个镜头切换及多镜头组合，同时保持视频内形象主体、风格和氛围的一致性，让视频讲述更加丰富和完整的故事。

🔗 https://mp.weixin.qq.com/s/FESYMwIkL\_leYVyw019Xuw

🔨 文心 iRAG 和无代码「秒哒」发布

百度本周发布两大 AI 技术——检索增强的文生图技术（iRAG）和无代码工具「秒哒」。

文心 iRAG 用于解决大模型在图片生成上的幻觉问题，通过将百度搜索的亿级图片资源跟强大的基础模型能力相结合，可以生成各种超真实的图片：

「整体效果远远超过文生图原生系统，去除了机器味儿。」

「秒哒」具备无代码编程、多智能体协作和多工具调用三大特性，李彦宏宣称让每个人都拥有程序员的能力，不用写代码就能实现任意想法。

在 AI 应用的发展趋势上，李彦宏表示，智能体是 AI 应用的最主流形态，即将迎来爆发点。

🔗 https://mp.weixin.qq.com/s/i5XBGZ-gUGnX4tuW2Mbt8g

📀 生数科技 Vidu 大模型迎来新版本

11 月 13 日，生数科技官方公众号宣布，Vidu 大模型迎来 1.5 版本。

官方表示，Vidu 的技术突破主要在以下三个方面：

复杂主体的精准控制：无论是细节丰富的角色，还是复杂的物体，Vidu 都能保证其在多个不同视角下的一致性。

人物面部特征和动态表情的自然一致：在人物特写镜头中，Vidu 能够自然且流畅地保持人物面部特征和表情的连贯性，避免了面部僵硬或失真的现象。

多主体一致性：Vidu 允许用户上传多个主体图像，包括人物角色、道具物体、环境背景等，并在视频生成中实现这些元素的交互。

官方表示，Vidu 1.5 的推出，揭示了一个重要现象：视觉模型与语言模型一样，经过充分的训练，模型能够展现出对上下文的深刻理解、记忆等能力。

具体实测细节欢迎回看 APPSO 此前文章👇

给马斯克上了瑞士卷大考后，我终于拿捏这个国产 AI 视频模型的最强新功能

🔗 https://mp.weixin.qq.com/s/Hsuxys06l-ADoEa0NRbNGQ

💻 Windows 版 ChatGPT 人人可用了

OpenAI 宣布为微软 Windows 10 和 11 用户全量推出桌面版 ChatGPT 应用。

Windows 版 ChatGPT 保留了网络版的大部分功能，包括 ChatGPT 搜索和高级语音模式，但这些高级功能仅对付费用户开放。

该桌面版应用还能通过快捷键「Alt + 空格」快速调用，并支持文件、照片或截图的上传和聊天问答。

另外，Mac 版 ChatGPT 也迎来一波大更新。

Plus 用户现已能够与一系列编程工具无缝协作，比如 VS Code 和 Xcode。

简单来说，开发者无需再将代码在不同应用间复制粘贴。启用新功能后，ChatGPT 客户端会自动读取开发工具中的代码。不过，ChatGPT 目前还不能在你的代码编辑器中自动创建或修改代码文件。

🔗 https://techcrunch.com/2024/11/14/chatgpt-can-now-read-some-of-your-macs-desktop-apps/

Hunt for Fun｜先行

🎮 浏览器变身虚拟办公室，WorkAdventure 让你的会议活起来

WorkAdventure 是一个基于浏览器的虚拟办公平台。

它通过像素风格的 2D 图形创建一个可交互的在线办公环境，模拟现实中的办公室布局，用户可以通过浏览器访问，无需安装任何软件，即可快速创建和管理自己的虚拟办公室，进行团队协作和互动。

用户都可以为团队创建和设计个性化的办公室环境。

每个团队成员都有一个虚拟角色，可以在虚拟空间内自由移动、与其他成员互动、开设私人对话。

WorkAdventure 还集成了语音和视频通话功能。语音聊天是基于位置的，即你越接近其他成员，你的语音音量越大，真实模拟了现实中的沟通感受。

用户可以进行私聊、组建小组或使用公共频道。

WorkAdventure 集成了常见的视频会议工具（如 Google Meet、Zoom 等），能够直接启动会议，并支持分享文件、演示内容以及其他资源。

附上体验地址：
https://play.staging.workadventu.re/@/tcm/workadventure/wa-village

🔗 https://x.com/seclink/status/1856325191741374519

Hunt for Insight｜先知

👀 OpenAI 产品负责人：现在的模型受限于评估方法

OpenAI 的首席产品官 Kevin Weil 和 Anthropic 的首席产品官 Mike Krieger 共同探讨了 AI 领域的多个核心议题。

他们讨论了当前 AI 模型的局限性，强调这些局限更多地在于评估方法而非智能水平本身，指出产品经理的角色正在经历转变，从传统的角色向研究型产品经理演进，这要求他们掌握编写评估标准和模型微调等新技能。

两位产品负责人还展望了 AI 的未来。

他们提出认为「主动性」和「延时响应」将作为 AI 发展的关键词，预测模型将变得更加主动，监控用户邮件、发现趋势、准备会议内容，同时也会更「异步」，可能需要时间来思考和回答。

此外，他们还对用户适应 AI 的速度表示惊叹，预计 AI 将模仿人类思维，以指数级速度迭代升级，并以我们人类互动的所有方式进行互动，预示着全新的人机交互范式。

🔗 https://www.youtube.com/watch?v=IxkvVZua28k

🫀 Anthropic 创始人：Scaling Laws 在人类水平以下无上限

Anthropic 创始人兼 CEO Dario Amodei 近期与播客主持人 Lex Fridman 进行了深入访谈，内容涵盖多个方面。

作为 OpenAI 的前高管，谈及离开的原因时，Amodei 表示，离开并非是因为不喜欢与微软的协议，而是希望带着信任的人去实现自己的愿景。

Amodei 更关注负责任地发展 AI，如在早期他就很喜欢向行业公开分享结果。

他还认为 Scaling Laws 在人类水平以下无上限，不同领域的上限可能不同。在生物学等领域，AI 有很大空间变得更聪明；而在某些领域可能接近人类水平。未来只有在构建系统时才能确定上限，可能的限制包括数据耗尽、计算受限或需要新架构等。

谈及 Claude 模型命名方式混乱时，这位 Anthropic 的创始人解释说，不同大小的模型需要不同的训练时间，根据模型发布的时间的前后不同，命名也会有所变化。

「我认为我们做得非常好。我们有 Haiku、Sonnet 和 Opus ，在命名方面处于有利地位。我们正在努力保持这种状态，但它并不完美，所以我们会尝试回归简单。但就这个领域的性质而言，我觉得没有人能找到完美命名方法。」

🔗 https://www.youtube.com/watch?v=ugvHCXCOmm4

🤯 月之暗面创始人杨植麟最新回应

月之暗面创始人杨植麟最近在媒体交流中回应了一连串问题。

关于 AI 创业公司被收购和人才流失的问题，他表示他的公司没有遇到人才流失，并且认为行业整合是必然趋势。他强调公司始终保持小规模和高效率，专注于核心业务，避免团队扩张对创新的负面影响。

他提到，今年二三月份开始聚焦于 Kimi 产品，减少产品线，以提升留存作为核心任务，并认为留存的提升与技术成熟度正相关。

对于深层推理和数学模型，他认为这些技术在教育产品中有价值，并能应用于更多场景。

关于多模态能力，他表示公司正在内测，认为 AI 的未来在于思考和交互能力，其中思考能力更为关键。在竞争方面，他更关注为用户提供价值，而不是竞争本身，并强调提升模型的思考推理能力。

他认为 ChatGPT 已经接近一个超级应用，对于大模型预训练的瓶颈，他持乐观态度，认为预训练还有空间，强化学习将是未来重点。

🔗 https://mp.weixin.qq.com/s/OCn6fgkccaRypT1TeLYBMg

彩蛋时间

🐱《全军出击》

作者：@asdcake0206_38683

工具：Midjourney v6.1

Pormopt:Cute little girl general riding a giant white cat, ancient China, battle scene, full body shot, movie stills, highly realistic.

链接：https://www.midjourney.com/jobs/8667fe78-deca-496a-8c94-40d2509686eb?index=0