专栏名称: APPSO

让智能手机更好用的秘密。

张艺谋为《三体》电影成立AI小组/字节回应大模型训练遭实习生「投毒」/传OpenAI前CTO创业融资7亿|Hunt Good周报

APPSO · 公众号 · app · 2024-10-20 11:58

正文

欢迎收看最新一期的 Hunt Good 周报！

在本期内容你会看到：

10 条新鲜资讯
4 个有用工具
2 个有趣案例
4 个鲜明观点

Hunt for News｜先进头条

🤖 回击传言！特斯拉公布 TeslaBot 最新进展

最近，特斯拉人形机器人 TeslaBot 因为表现过于逼真，导致不少网友质疑有人在幕后进行远程操控。

本周，特斯拉也公布了 TeslaBot 的最新进展来回应传言。

视频中，TeslaBot 能够自主稳健行走，探索看不见的空间，甚至在电量不足时，还能自行定位并导航到最近的充电站，使用后置摄像头实现准确的自行充电，真·自给自足。

此外，TeslaBot 还能轻松拿起 11 公斤的电池托盘，上下楼梯也不在话下。更重要的是，它可以根据人的请求分发不同的物品，更好地实现机器人与人类的交互。

不过，外媒 Gizmodo 指出，这段最新公布视频也藏着许多「猫腻」。

例如，画面的右上角显示 TeslaBot 的行动在某些时候被加速了 2 倍、8 倍甚至 10 倍，以及时有时无的「autonomous（自主）」等标识。

值得一提的是，英伟达高管莱巴雷迪安曾为 TeslaBot 疑似远程遥控一事发声。

他表示尽管不知道其当时是否为远程操控，但即便如此，以那种精确度控制机器人也需要非常先进的 AI 技术。

🔗 https://gizmodo.com/tesla-makes-autonomous-robot-look-cooler-with-sped-up-video-2000513073

💰 OpenAI 前 CTO 创业，还挖角老东家

据路透社援引知情人士消息，OpenAI 前 CTO Mira Murati 正在为其新成立的 AI 创业公司募集资金。

消息人士指出，该公司计划将基于专有模型开发 AI 产品，但目前尚不清楚 Murati 是否担任该新公司的 CEO。

Murati 的代表对此事未予置评。

消息人士还透露，尽管目前谈判仍在初期阶段，但由于 Murati 的良好声誉以及训练专有模型所需的巨额资金，她的新公司有望筹集到超过 1 亿美元的资金，但具体金额尚未确定。

此外，与 Murati 同一天离开 OpenAI 的知名研究员 Barret Zoph 也可能加入这一新项目。

外媒 The Information 先前报道称，Zoph 正在筹备一家新的初创公司，而 Murati 则在积极招募 OpenAI 员工加入她的新企业。

🔗 https://www.reuters.com/technology/artificial-intelligence/former-openai-technology-chief-mira-murati-raise-capital-new-ai-startup-sources-2024-10-18/

🤔 假开源真噱头？Meta 陷「开源」争议

Meta 是 AI 开源领域的领头羊，至少扎克伯格自己是这么认为的。

但据《金融时报》报道，Meta 因称其 AI 模型 Llama 为「开源」而受到 Stefano Maffulli 的批评。

Maffulli 目前是开源促进会（Open Source Initiative，简称 OSI）的执行董事，该机构通过定义开源软件的准则和认证开源许可证，成为守护开源概念的重要组织。

Maffulli 认为 Meta「混淆」了用户并「污染」了开源一词。

报道称，Llama 下载量超 4 亿次，但并非完全开放，发布 Llama 的许可也不符合 OSI 认可的开源定义，模型开发人员需更加透明，还应披露训练算法等。

Maffulli 警告，如果 Meta 等公司将开源变成对自己有利的通用术语，他们将「把 Meta 的盈利性专利纳入欧盟和其他机构正在倡导的开放标准中」。

🔗 https://www.ft.com/content/397c50d8-8796-4042-a814-0ac2c068361f

🏀 OpenAI CEO 打造了一个「水晶球」

Hello World！

OpenAI CEO Sam Altman 参与创立的 AI 初创公司 World（原名 Worldcoin）本周举办发布会，并推出了最新版本的眼球扫描器 Orb。

这个眼球扫描仪的目标是扫描人的眼睛，以确认这是真人和本人，而不是 AI 深度伪造的。用户通过 Orb 扫描后，会生成一个名为 World ID 的电子「身份证」，用于在网络上验证自己的身份。

这家公司还推出了一个叫 Deep Face 方案。

该方案用于 FaceTime、Zoom 等视频通话平台。如果用户此前经过 Orb 认证生成了 World ID，那么 Deep Face 就能检测这些视频平台上的用户形象是不是用 Deepfake 冒充的。

World 公司表示，明年开始 Orb 就面向消费者推出，但不是售卖这个产品本身，用户会收到这个 Orb，在扫描后寄回公司，继续流转重复使用。Orb 也会在街头巷尾的咖啡店等公共场所提供，方便用户进行扫描。

🔗 https://x.com/worldcoin/status/1846987603968410093

💥 大模型训练遭实习生「投毒」，官方回应

近期，关于字节跳动大模型训练被实习生「投毒」事件闹得沸沸扬扬。

网传字节跳动商业化团队实习生田某某对团队资源分配不满，在公司共享模型注入破坏代码，导致团队模型训练成果受损。

据称此次遭到入侵的代码已注入 8000 多张卡，损失或达千万美元。

对此，字节跳动官方昨日下午发布声明👇

🧬 AI 永远无法代替人类

用 AI「留住」即将逝去的亲人似乎已经成为了一种趋势，但 Reddit 上的网友们却有着不同的看法。

事情源于网友在 Reddit 提出了这样一个问题：

「我的妻子不幸患上了晚期癌症，她还很年轻，只有 36 岁。她在社交媒体上有着广泛的影响力，并且我们之间有着丰富的聊天记录。是否有可能通过上传她的数据，创建一个她的虚拟形象，以便在她离世后我仍能与她对话？」

然而，一条获得众多点赞的评论给出了截然不同的建议。

原评论翻译如下：

我真的很为你的妻子感到难过。我能理解你为什么想要制作她的虚拟版本。

我只是想让你思考一下，比如 4-5 年后，当你对她的回忆开始与 AI 的对话混淆，那会是什么感觉？这样可能会让你对她的真实记忆与 AI 创造的假记忆相混淆。

珍惜和你美丽妻子在一起的每一刻。记录她的声音、她的笑容，创造尽可能多的美好回忆。回顾这些，而不是用 AI 来取代她。

保持对她真实记忆的珍视，还想补充一点。

或许你可以把 ChatGPT 作为一个倾诉的对象，在这里安全、私密地表达你的感受，把它作为一个支持系统，而不是替代品。

当然，如果条件允许，我建议你寻求现实生活中的心理咨询师帮助，因为预期性悲伤确实很难应对。

向你和你的妻子致以最深的祝福 ✨

🔗 https://www.reddit.com/r/ChatGPT/comments/1g5och2/keeping_my_wife_alive_with_ai/

🤩 Midjourney 下周初再发新品

据外媒 Techcrunch 报道，Midjourney 计划推出一个升级版的 Web（网络）工具。

该工具将允许用户利用 Midjourney 的生成式 AI 技术编辑从网络上上传的任何图片。Midjourney CEO David Holtz 表示，这个升级版的工具将在「下周初」发布。

除了编辑图片，这个工具还将允许用户根据图片的标题对图片中的对象进行重新着色和细节调整。

在 Midjourney 官方 Discord 服务器上的一篇文章中，Holz 表示，升级版的图片工具将首先对部分用户开放，并将增加人工审核以及「新的、更高级的 AI 审核员」，以防止功能滥用。

「老实说，我们不确定如何精确限制这个功能的部署，」他说。Midjourney 正在通过一项民意调查征求社区反馈，以确定哪些用户将首先获得访问权限。

🔗 https://techcrunch.com/2024/10/19/midjourney-plans-to-let-anyone-on-the-web-edit-images-with-ai/

🥊 一个小人物与 OpenAI 的十年官司

一个是当今最负盛名的 AI 独角兽，一个是名不见经传的创业「失败者」，如果不是彭博社的跟踪报道，我们很难相信看似毫无交集的两方，却能牵涉出一桩长达十年的官司。

长话短说，2015 年，一位创业者 Guy Ravine 抢先 OpenAI 一步，申请了「Open AI」（有空格）的商标和买下了 open.ai 的域名。

Guy Ravine，图片来自彭博社

基于此，OpenAI 方只能被迫选择无空格的「OpenAI」以及 openai.com 域名。

十年间，Altman 也和 Guy 产生多次交集。

盖伊方声称，Altman 和 Greg Brockman 从他那里抢走了与 OpenAI 类似的「创意」，并试图将他描述成骗子。

而 OpenAI 方则认为 Guy 是一种「碰瓷」行为，多次交涉无果，最终于去年起诉了 Guy。

现在，这桩诉讼仍在进行中。

附上报道原文，故事经历十分精彩，感兴趣的朋友不妨耐心查看：

https://www.bloomberg.com/news/features/2024-10-14/why-openai-is-at-war-with-a-guy-named-guy

🥳 张艺谋为《三体》电影成立 AI 小组

最近，中国知名导演张艺谋接受了新华社的采访。

针对执导电影版《三体》一事，张艺谋在采访中透露，目前已精选 10 多个「90 后」精英，组成 AI 小组，将运用「中国制造」的新科技、新观念开展创作。

图片来自新华社视频号截图

我们精选了一批有干劲、能创新、熟悉网络新技术和电影行业制作流程的《三体》迷，组成 AI 小组，目前已工作半年多，采用的 AI 技术和平台都是中国制造、中国力量。

比如，外星飞船如何呈现？要梳理、学习以往上千部科幻电影和游戏中的设计。这个过程，AI 能帮上大忙。

此外，他还表示将计划用 4 到 5 年时间完成电影《三体》的摄制，目前还处在剧本打磨阶段。

「打磨剧本的时间会很长，没那么简单……我和刘慈欣约定，随时去山西当面请教，希望他别嫌我烦。」

🔗 https://mp.weixin.qq.com/s/ajEsjUnHehk-zfmDOLa6Bw

💥 传 Anthropic 下周发布新品

近日，在 X 平台陆续有不少消息称，Anthropic 即将发布超大杯模型 Claude 3.5 Opus。

据可靠爆料人 @apples_jimmy 爆料称，Anthropic 预计将在当地时间 10 月 22 日发布新产品。

需要说明的是，目前尚不确定该产品是否为 Claude 3.5 Sonnet，同时该消息的准确性尚未得到确认，请谨慎看待。

🔗 https://x.com/apples_jimmy/status/1847406779950649566

Hunt for Tools｜先进工具

👏 Adobe 推出 AI 视频神器，支持一句话 P 视频

最近 AI 视频领域异常热闹，Adobe 也刚刚加入了这场混战。

在今年的 Adobe Max 大会上，Adobe 正式推出了自己的 AI 视频模型——Firefly Video Model，进军生成式人工智能领域。

概括来讲，这个模型包含三个有趣且实用的功能：

Generative Extend（生成拓展）

Text-to-Video（文生视频）

Image-to-Video（图生视频）

以下是使用 Text-to-Video 功能生成视频片段，感受一下：

Adobe 强调，Firefly Video Model 只会在许可内容（如 Adobe Stock）和公共领域内容上对该模型进行训练，而不会在客户提供的内容上进行。

附上体验候补名单：
https://www.adobe.com/products/firefly/features/ai-video-generator.html

🤯 英伟达、Mistral AI 发布多款模型

本周有一些模型值得关注。

英伟达发布了一个基于 Llama-3.1-70B 架构的开源模型，宣称超越了包括 GPT-4o、以及 Claude 3.5 Sonnet 等多个开闭源模型，仅次于 OpenAI o1 模型。

据悉，Nemotron-70B 的核心训练技术是 RLHF（基于人类反馈的强化学习）。

高质量的训练数据是 Nemotron-70B 成功的关键因素。

该模型训练过程中使用了 21362 个精心设计的 prompt-response 数据对，这些数据覆盖了广泛的对话场景，确保了模型生成内容的准确性和合理性。

附上官网地址：
https://build.nvidia.com/nvidia/llama-3_1-nemotron-70b-instruct/modelcard

端侧方面，Mistral AI 最近也推出了两款专为端侧计算设计的模型——Ministral 3B 和 Ministral 8B。

官方宣称这是「世界上最好的边缘模型」。

两款模型均配备 128K 的上下文窗口，能够一次性处理相当于 50 页文档的内容。这个特性使得模型在处理长文档和复杂文本分析时显得尤为高效，适用于文档总结、翻译、长时间对话生成等任务。

附上官网博客：https://mistral.ai/news/ministraux/

网友 @shivang_in 梗图

🎵 Suno 支持一键为表情包照片写歌

用文字和音频生成音乐之后，Suno 又来刷新我们的想象力了。

10 月 16 日，Suno 推出了一个新功能 Suno Scenes——以视频和图片为提示词，生成 30 秒的音乐。

自拍，表情包，旅游照，不妨都丢给 AI，准备接受惊喜，或者惊吓。

我上传了一张微信默认表情的截图，没有写提示词，就想看看，AI 能不能无师自通，像每个网速 5G 的年轻人一样，读懂未曾言明的微妙情绪。

AI 生成了一首古灵精怪的电子流行音乐，旋律很抓耳，但歌词就是对表情的直接翻译。AI 看图说话，教你没有被社会毒打过的纯良。

更多具体测试欢迎回看 APPSO 此前文章
这个 AI 功能刚上线就被玩疯，一键为表情包照片写歌太上头了

🔗 https://x.com/suno_ai_/status/1846574384963633345

👓 这款眼镜，可以察觉你的情绪

来自英国的科技公司 Emteq Labs 于近日推出了世界上首款「情感感知智能眼镜」——Sense 智能眼镜。

官方希望通过 Sense 智能眼镜，能够「更深入地了解我们的情绪反应来改善生活和健康状况」。

这款眼镜可以跟踪包括面部表情、饮食习惯、情绪、姿势、注意力水平和身体活动在内的多种指标。

据 Emteq Labs 的设想，这款革命性产品的主要用途有二：心理健康监测和饮食管理。

比如，它能够实时追踪面部肌肉活动，捕捉微妙的面部动作，并通过机器学习算法分析这些数据，以此来洞察用户的情绪状态和心理健康状况。

未来，该功能或可应用于区分抑郁症患者和非抑郁症患者，为抑郁或自闭症状的诊疗提供辅助手段。

Emteq Labs 的新任首席执行官 Steen Strand 认为，「情感感知眼镜」是可穿戴智能设备的下一个前沿领域，并且断言，Emteq 将改变智能眼镜的格局，改善人们的生活，甚至挽救生命。

🔗 https://www.geeky-gadgets.com/emotion-sensing-eyewear/?utm\_source=flipboard&utm\_content=topic%2Fartificialintelligence

Hunt for Fun｜先行

🤯 AI 伴侣产品又双叒叕进化了

3D AI 伴侣产品终于还是来了。

最近，自然选择公司发布首款 3D AI 伴侣产品《EVE》，旨在提供前所未有的超逼真 AI 恋爱体验。

目前该产品的预告片在 B 站轻松斩获了百万+ 的观看量。

遗憾的是，该产品尚未正式全面开放，目前第一批测试渠道为 iOS，Android 渠道还需要等一段时间。

公开资料显示，《EVE》创始人张筱帆此前也有不少游戏代表作，比如曾推出过男性向恋爱养成手游《奇点时代》。

🧐 这个 App，让陌生人叫你起床

最近，《胃之书》作者赵纯想的最新作品在 X 平台引起了广泛的关注。

陌生人闹钟 App 支持 iOS、Android 双端原生体验，功能有点类似于早期的 Wakie，是一款旨在用陌生人的声音叫你起床的闹钟。

每天早晨，一个陌生人叫你起床。多管线的 AI 裁判，不知疲倦地负责监督声音，避免性别欺诈、声纹不一致性（变声器）和一切不友好、无意义内容。

创始用户将拥有 5000 份时间窗口期，可以在贡献 Tab 栏贡献你的声音。早期声音会被更优先地传递。

作者在 X 平台表示，产品的视觉灵感都来自苹果在 1999 年发布的 Mac OS 9。

🔗 https://x.com/liseami1/status/1847095314127396933

Hunt for Insights｜先知

💰 李开复：AI 六小虎都够钱做预训练

在最近国内大模型行业暗流涌动的时候，零一万物发布了全新 SOTA 旗舰模型 Yi-Lightning。

在对大模型的测评中，LMSYS Org 发布的 Chatbot Arena，以「盲测」机制著称，是最能反映用户体验的测评标准之一。

这一次，零一万物的 Yi-Lightning 排名世界第六，中国第一。

在中文子榜单上，Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13、智谱发布的 GLM-4-Plus 等国内外优质模型，与 o1-mini 等模型并列排名世界第二。

李开复在发布会上强调，中国的六家大模型公司，只要有足够好的人才，想做预训练的决心，融资额跟芯片都不会是问题的。

而对于中美之间的差距，他表示：

很多人问中国的预训练是否落后美国？

我们也坦诚中国是落后美国，但有人说落后十年、二十年，今天我们可以用非常精确的数字来算：

GPT4o 在 5 月做出来的模型，我们在 10 月的今天已经把它打败了。如果真的算中国赶超美国有多远的距离，至少，零一万物离 OpenAI 的模型，只差五个月。

🔗 https://mp.weixin.qq.com/s/Q-1-3RoWzHatV2Q90dfExw

🦸🏿‍♂️ 黄仁勋：19 天打造超级 AI 训练集群，马斯克像超人

在最近的采访中，英伟达 CEO 黄仁勋谈及马斯克旗下 xAI 公司时，盛赞其在短时间内建成了 AI 训练集群 Colossus。

黄仁勋表示，马斯克像超人一样完成了一项艰难的任务。

据我所知，世界上只有一个人能做到这一点。你知道，我的意思是，马斯克在工程、建筑和大型系统以及资源调配方面的理解是独一无二的。

他解释道，从长远来看，由 10 万个 GPU 构成的训练集群通常需要三年时间规划，等到英伟达交付芯片，至少也得一年时间才能完全运作起来，而 xAI 从硬件安装到开始培训只花了 19 天。

上个月，马斯克在 X 平台上宣布，xAI 打造的超级 AI 训练集群「Colossus」正式上线。据其透露，Colossus 项目「从开始到结束」只花了 122 天的时间。

🔗 https://www.businessinsider.com/jensen-huang-elon-musk-supercomputer-xai-grok-2024-10

👀 微软 AI CEO 预测：未来 18 个月内，AI 的记忆力将得到显著提升

今年 3 月，前 Inflection AI CEO 穆斯塔法·苏莱曼官宣加盟微软，并负责领导消费者 AI 项目。

在周三的活动上，苏莱曼分享了他对 AI 未来发展的看法。

在人类历史上，机器首次学会了使用我们的语言进行交流……编程界面已经发生了根本性的变化。未来，每个人都能使用这个工具来编程他们周围的数字世界。显然，这种编程方式也会反过来影响我们。

在讨论 AI 系统的组成部分时，苏莱曼指出，AI 模型在事实性和准确性方面（IQ）正在不断提升。同时，他在情感智能（EQ）和代表用户采取行动（AQ）方面也看到了进步。

他表示，「我认为，将所有这些循环在一起的缺失部分是记忆。…我很确定在接下来的 18 个月里，我们将拥有具有记忆力非常好的 AI。」

苏莱曼认为，尽管行业对 AGI 的潜力充满兴趣，但真正的智能不仅仅是这些能力的总和，而是能够在正确的时间集中处理能力于正确的任务上。

🔗 https://www.geekwire.com/2024/microsoft-ai-ceo-sees-long-term-memory-as-key-to-unlocking-future-ai-experiences/

🤯 诺奖得主：AGI 还差 2 到 3 项重大创新

近日，诺奖得主、Google DeepMind CEO Demis Hassabis 在科技峰会上发表演讲。

Hassabis 认为 AI 不是普通技术，影响将比互联网等更大，是「划时代」的，能治愈疾病、应对气候和能源问题并丰富生活。

他觉得现在的系统比较被动，需要更好的规划、推理、行动执行能力等，而如何在游戏之外的现实世界中进行规划是下一个重大突破。

在通往 AGI 的道路上， Hassabis 认为多模态模型是 AGI 的关键组成部分，DeepMind 的目标从开始到今天仍是达到 AGI。

在他看来，现在距离 AGI 还有大约 10 年，需要两到三个重大创新。

虽然目前语言模型虽然发展迅速，但仍不够接近 AGI。未来基于 Agent 的系统需要具备规划、推理、行动、更好记忆和个性化等能力。

作为谨慎的乐观主义者，他认为 AI 有风险但也有积极影响（如治愈疾病、解决气候问题等），签署风险警告公开信是想引起对未知风险的重视，需要国际合作研究解决风险问题。

🔗 https://x.com/GoogleDeepMind/status/1846974292963066199

彩蛋时间

📲《蒙娜丽莎》的微笑

作者：@ashadedetare

工具：Midjourney v6.1

Prompt：Create a modern rendition of the Mona Lisa, styled as a Gen Z individual. She should be holding a smartphone in her hand, appearing to be engaged with social media. Additionally, she should be blowing a bubble with chewing gum. The setting should remain similar to the original painting with a hint of modern elements. The image should be in a 1:1 aspect ratio.

链接：https://www.midjourney.com/jobs/b0614250-ebcb-4ec4-8a5f-bc2ca453341d?index=0