专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
小众软件  ·  另外两件事[241116] ·  昨天  
APPSO  ·  独家首测:全新 Mac mini 的 ... ·  1 周前  
小众软件  ·  双11 推荐几款值得买的软件 ·  1 周前  
51好读  ›  专栏  ›  APPSO

马斯克再谈约架扎克伯格:随时奉陪/传满血版 o1 下月推出/苹果或将推出 AI 智能家居中控屏 | Hunt Good 周报

APPSO  · 公众号  · app  · 2024-11-17 11:57

正文

欢迎收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
8 条新鲜资讯
7 个有用工具
1 个有趣案例
3 个鲜明观点
Hunt for News|先进头条
🧑‍⚖️ 马斯克与 OpenAI 的法律纠纷再升级
本周,埃隆·马斯克与 OpenAI 的法律纠纷再次升级。
诉讼新增了联邦反垄断等多项索赔,并把微软列为共同被告。
马斯克方面指控 OpenAI 和微软违反了反垄断法规,包括以不与竞争对手交易为条件提供投资机会,以及他们的独家许可协议实质上相当于未经监管批准的合并。
马斯克的法律团队指责微软的行为构成了反竞争行为,并表示「阳光是最好的消毒剂」。
对此,OpenAI 回应称诉讼毫无根据,而微软则拒绝发表评论。
此外,一系列涉及 OpenAI 早期成员,包括马斯克和 Altman 等人的电子邮件被曝光。尽管这些邮件不能完整揭示整个事件的全貌,但一些细节也非常有趣。
邮件内容显示,前首席科学家 Ilya 对马斯克的领导能力表示担忧,认为他可能会走向独裁。同时,他对 Altman 也有所质疑,不理解他对 CEO 头衔的执着及其背后的动机。
邮件还透露了 2017 年 OpenAI 曾考虑收购芯片制造商 Cerebras,并可能利用特斯拉的资源来完成这一收购,但最终未能实现。
早期,马斯克曾希望 OpenAI 能成为他的资产之一,一些联合创始人也有类似的想法,但这一计划并未实现。
此外,邮件还显示微软早在 2016 年就有意与 OpenAI 合作,但遭到了马斯克的反对。
🔗 https://www.businessinsider.com/emails-between-sam-altman-elon-musk-kicked-off-openai-2024-11
❌ OpenAI CEO 辟谣 AI 发展「撞墙」论,满血版 o1 疑似下月推出
近期,OpenAI CEO Sam Altman 在 X 平台辟谣 AI 发展「撞墙」论:
「there is no wall .没有墙」
这一则辟谣源自近日有多家媒体报道称,OpenAI、Anthropic 等多家大模型公司下一代前沿模型训练表现不佳,这也导致 Scaling Laws 疑似「撞墙」的消息不胫而走。
此前,OpenAI 前首席科学家 Ilya Sutskever 在接受路透社采访时表示,「通过扩大预训练阶段——即使用大量未经标注的数据来训练 AI 模型,使其理解语言模式和结构——所取得的成果已经停滞不前。
图灵奖得主 Yann Lecun、Ilya、Anthropic 创始人 Dario Amodei 也就此事纷纷展开唇枪舌战。争论的核心在于,随着模型规模的不断扩大,其性能提升是否会遇到天花板。
具体信息欢迎回看 APPSO 此前文章 👇
OpenAI 最新产品全曝光!奥特曼驳斥 AI 发展撞墙,Ilya 认错,秘密寻找下一个重大突破
作为补充,在这场辩论的背景下,彭博社在近期也披露了一条引人注目的消息。
OpenAI 计划在明年一月份推出一款名为「Operator」的 AI Agent(智能体),这个 Agent 能够使用计算机代替用户执行任务,如编写代码或预订旅行。
值得注意的是,在 Altman 辟谣的推文评论区中,针对网友询问满血版 OpenAI o1 的发布日期,他回应道:
「like for a christmas present? 喜欢圣诞礼物吗?」
🔗 https://x.com/sama/status/1856940944169316843
🧬 说到做到,AlphaFold 3 重磅开源
Google 兑现承诺,重磅开源了 AlphaFold 3。
AlphaFold 3 能够与其他分子协同建模蛋白质,预测蛋白质与 DNA 相互作用时的结构,以及评估潜在药物的性能。
最初,DeepMind 通过网页服务器提供 AlphaFold 3 的访问服务,但由于限制了预测的数量和类型,且未公开代码和模型权重,遭到了科学界的批评。
面对这些反馈,DeepMind 承诺在半年内发布开源版本。
11 月 11 日,DeepMind 宣布,科学家们可以下载 AlphaFold 3 的软件代码,用于非商业目的。目前,仅限于具有学术背景的科学家可以根据要求获得训练权重。
「我们非常期待看到人们如何利用这个工具,」AlphaFold 团队负责人 John Jumper 表示。上个月,他与 Demis Hassabis 共同获得了 2024 年诺贝尔化学奖。
🔗 https://www.nature.com/articles/d41586-024-03708-4
🤖 人形机器人天工亮相北京马拉松
起猛了,看见人形机器人在北京跑马拉松。
11 月 10 日,2024 北京亦庄半程马拉松鸣枪开跑。有趣的是,参赛选手中出现了一位人形机器人「天工」。
不过,贴有「天工 001」号码牌的人形机器人并未跑完全程,跑了一分钟左右,就停到场边,向场外观众示意,并在终点处迎接参赛选手。
据悉,最新版本的「天工」人形机器人身高达到 1.8 米,最高奔跑速度已提升每小时 12公里。
🔗 https://mp.weixin.qq.com/s/HqHYEewdLt31S9Gc3JGLTw
😀 后悔抛售英伟达股票,孙正义抱着黄仁勋假装哭泣
英伟达 CEO 黄仁勋与软银集团 CEO 孙正义本周同台亮相。
在对话开始之前,黄仁勋首先进行了长达一个小时的演讲,向与会者介绍了 AI 的最新技术发展,以及 AI 将如何深刻地改变人类的生活。碰到小插曲,老黄也入乡随俗地连道多句「私密马赛」。
在与孙正义的交流过程中,黄仁勋还展示了不少「黄氏」幽默。
例如,看到孙正义,先来一段排比句式的彩虹屁,逗得孙正义开颜大笑;打趣孙正义后悔抛售英伟达股票,也调侃自己错失了收购英伟达的最佳时机。
「你们中很多人可能不知道,Masa(孙正义)曾经是英伟达的最大股东」听到这话,孙正义搂住黄仁勋,做出一副哭泣的样子,引得在场与会者大笑。
更多细节欢迎回看 APPSO 此前文章👇
黄仁勋最新演讲:每家公司都将成为 AI 制造商 | 万字实录
🔗 https://www.nvidia.cn/events/ai-summit-japan/fireside-chat/
🥊 马斯克再谈与扎克伯格的「笼中决斗」:随时奉陪
近期,58 岁的拳王泰森重返擂台,对垒 27 岁的美国网红兼职业拳击手杰克·保罗,最终落败。
在这场泰森与保罗的重量级比赛进行之际,一位网友提问:特斯拉 CEO 埃隆·马斯克和 Meta CEO 马克·扎克伯格之间的比赛何时进行?
对此,马斯克现身评论区回应称,这场比赛可以随时举行。
「Anytime, anyplace, any rules are fine by me 随时、随地、任何规则我都没问题。」
去年 6 月份,马斯克在 X 平台宣称他要和扎克伯格进行一场「笼中约架」,双方经过多轮呛声之后,马斯克的母亲宣布取消了这场比赛,并劝告网友不要起哄,希望两人不要真的动手。
看热闹不嫌事大,如果开打,你觉得谁会赢?
🔗 https://x.com/Nate\_Esparza/status/1857658369391341604
🍎 传苹果将推出 AI 智能家居中控屏
据彭博社的 Mark Gurman 报道,苹果公司正在开发一款新的智能家居产品——一款壁挂式显示屏,拥有控制家电、与 Siri 互动和视频会议等功能。
显示屏看起来像一个方形的 iPad,拥有大约 6 英寸的屏幕,顶部配有摄像头,内置扬声器和可充电电池。其已开发三年,可能会在明年 3 月正式宣布。
这款设备在功能上与 Google Home Hub 和亚马逊的 Echo Show 相似,但苹果的智能家居控制中心的独特之处可能是苹果 AI,包括 10 月下旬开始向用户推出的 Apple Intelligence 以及即将到来的 App Intents 系统,该系统可使用 AI 控制软件程序。
此外,苹果还在开发一款带有机械臂的版本,能够移动平板设备。这表明苹果可能不仅仅是在开发一个智能设备控制面板,而是在寻求更先进的智能家居解决方案。
🔗 https://www.bloomberg.com/news/articles/2024-11-12/apple-home-hub-detailed-apple-intelligence-homeos-square-ipad-like-design?srnd=undefined
📱 Google 推出适用于 iOS 的 Gemini 应用
Google 近日在全球范围内为 iOS 用户推出了 AI 助手 Gemini 的独立应用。
此前,iOS 用户仅能通过 Google 应用或移动网络与 Gemini 互动。新应用支持 35 种语言的文本提示,以及 12 种语言的 Gemini Live 对话功能。
Google 承诺还将增加更多语言支持。
此外,应用新增了 Imagen 3 模型生成图像和扩展程序查询 Google 账户信息等功能。Gemini 应用旨在简化用户访问流程,建立肌肉记忆,并能便捷地连接其他 Google 应用。
🔗 https://techcrunch.com/2024/11/14/google-launches-gemini-app-for-ios-worldwide/
Hunt for Tools|先进工具
🐧 腾讯元宝 2.0 版本更新
腾讯元宝 2.0 版本,本周正式焕新上线。
腾讯元宝支持对话列表焕新,可以更轻松地查找历史对话和使用过的智能体。
此外,腾讯元宝精选 AI 搜索、AI 阅读、创意绘画、灵感图库、AI 美照五大应用,多维度满足搜、读、写、画创作需求。
除微信公众号外,腾讯元宝还升级整合微信视频号、QQ 音乐等信息资源,提供更加智能、便捷的搜索服务,随时随地想搜就搜。
基于新一代大模型「混元 turbo」,元宝性能大幅提升,训练和推理效率提升一倍。
得益于国内首个自研 MoE 多模态大模型,其还支持任意长宽比及最高 7K 分辨率图片的理解分析;中文原生 DiT 文生图架构,语义理解、画面质感与真实性方面得到全面提升。
🔗 https://mp.weixin.qq.com/s/9CfdKnDRfpqlfWaZs4rg9Q
📗 腾讯发布 AI 智能工作台 ima
11 月 15 日,腾讯正式发布 AI 智能工作台 ima.copilot(简称 ima)。
据介绍,ima 搜索得出的答案,除开全网信源,还打通——微信公众号文章的生态,能为用户提供好答案和高质量的问题相关信息,有效提升信息获取效率。
除了能搜出答案,ima 还有一个特点——边问边看,边搜边记。
不止网络上的资料,本地上百页的文献,几十万字的行业经验,只需要把文件拉入到 ima 的对话框里,它便可以总结内容,提炼要点,生成脑图。
ima 还是一款非常好用的编辑工具。搜到的答案,解读的资料,只需要选中你要的部分,就可以生成笔记,直接进行编辑。
值得注意的是,ima 是由腾讯混元大模型提供技术支持。
🔗 https://mp.weixin.qq.com/s/IVYdGePcu2Gw6Wm5fYygOA
👏 Kimi 发布新推理模型
Kimi 近期正式发布新一代数学推理模型 k0-math。
基准测试显示,Kimi k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。
在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型成绩超过 o1-mini 和 o1-preview 模型。

在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。
同时,Kimi 探索版也通过运用强化学习技术创新了搜索体验,在意图增强、信源分析和链式思考三大推理能力上实现突破。
据悉,k0-math 模型和更强大的 Kimi 探索版,未来几周将会分批陆续上线。
🔗 https://mp.weixin.qq.com/s/OCn6fgkccaRypT1TeLYBMg
🎥 即梦 AI 视频生成模型更新
11 月 15 日,即梦 AI 两大视频模型正式全量上线。
据悉,S2.0 Pro 在 i2v 场景下有非常好的首帧一致性,可以保持与用户输入图的一致性、色彩等细节还原,在视频生成体验上更惊喜、更可控。
P2.0 Pro 拥有极高的提示词遵循能力,对复杂的提示词能够保持严格的遵循。
此外,P2.0 Pro 还能够在一句提示词内,实现多个镜头切换及多镜头组合,同时保持视频内形象主体、风格和氛围的一致性,让视频讲述更加丰富和完整的故事。
🔗 https://mp.weixin.qq.com/s/FESYMwIkL\_leYVyw019Xuw
🔨 文心 iRAG 和无代码「秒哒」发布
百度本周发布两大 AI 技术——检索增强的文生图技术(iRAG)和无代码工具「秒哒」。
文心 iRAG 用于解决大模型在图片生成上的幻觉问题,通过将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片
「整体效果远远超过文生图原生系统,去除了机器味儿。」
「秒哒」具备无代码编程、多智能体协作和多工具调用三大特性,李彦宏宣称让每个人都拥有程序员的能力,不用写代码就能实现任意想法。
在 AI 应用的发展趋势上,李彦宏表示,智能体是 AI 应用的最主流形态,即将迎来爆发点。
🔗 https://mp.weixin.qq.com/s/i5XBGZ-gUGnX4tuW2Mbt8g
📀 生数科技 Vidu 大模型迎来新版本
11 月 13 日,生数科技官方公众号宣布,Vidu 大模型迎来 1.5 版本。
官方表示,Vidu 的技术突破主要在以下三个方面:

复杂主体的精准控制:无论是细节丰富的角色,还是复杂的物体,Vidu 都能保证其在多个不同视角下的一致性。

人物面部特征和动态表情的自然一致:在人物特写镜头中,Vidu 能够自然且流畅地保持人物面部特征和表情的连贯性,避免了面部僵硬或失真的现象。

多主体一致性:Vidu 允许用户上传多个主体图像,包括人物角色、道具物体、环境背景等,并在视频生成中实现这些元素的交互。
官方表示,Vidu 1.5 的推出,揭示了一个重要现象:视觉模型与语言模型一样,经过充分的训练,模型能够展现出对上下文的深刻理解、记忆等能力。
具体实测细节欢迎回看 APPSO 此前文章👇
给马斯克上了瑞士卷大考后,我终于拿捏这个国产 AI 视频模型的最强新功能
🔗 https://mp.weixin.qq.com/s/Hsuxys06l-ADoEa0NRbNGQ
💻 Windows 版 ChatGPT 人人可用了
OpenAI 宣布为微软 Windows 10 和 11 用户全量推出桌面版 ChatGPT 应用。
Windows 版 ChatGPT 保留了网络版的大部分功能,包括 ChatGPT 搜索和高级语音模式,但这些高级功能仅对付费用户开放。
该桌面版应用还能通过快捷键「Alt + 空格」快速调用,并支持文件、照片或截图的上传和聊天问答。
另外,Mac 版 ChatGPT 也迎来一波大更新。
Plus 用户现已能够与一系列编程工具无缝协作,比如 VS Code 和 Xcode。
简单来说,开发者无需再将代码在不同应用间复制粘贴。启用新功能后,ChatGPT 客户端会自动读取开发工具中的代码。不过,ChatGPT 目前还不能在你的代码编辑器中自动创建或修改代码文件。
🔗 https://techcrunch.com/2024/11/14/chatgpt-can-now-read-some-of-your-macs-desktop-apps/
Hunt for Fun|先行
🎮 浏览器变身虚拟办公室,WorkAdventure 让你的会议活起来
WorkAdventure 是一个基于浏览器的虚拟办公平台。
它通过像素风格的 2D 图形创建一个可交互的在线办公环境,模拟现实中的办公室布局,用户可以通过浏览器访问,无需安装任何软件,即可快速创建和管理自己的虚拟办公室,进行团队协作和互动。
用户都可以为团队创建和设计个性化的办公室环境。
每个团队成员都有一个虚拟角色,可以在虚拟空间内自由移动、与其他成员互动、开设私人对话。
WorkAdventure 还集成了语音和视频通话功能。语音聊天是基于位置的,即你越接近其他成员,你的语音音量越大,真实模拟了现实中的沟通感受。
用户可以进行私聊、组建小组或使用公共频道。
WorkAdventure 集成了常见的视频会议工具(如 Google Meet、Zoom 等),能够直接启动会议,并支持分享文件、演示内容以及其他资源。
附上体验地址:
https://play.staging.workadventu.re/@/tcm/workadventure/wa-village
🔗 https://x.com/seclink/status/1856325191741374519
Hunt for Insight|先知
👀 OpenAI 产品负责人:现在的模型受限于评估方法
OpenAI 的首席产品官 Kevin Weil 和 Anthropic 的首席产品官 Mike Krieger 共同探讨了 AI 领域的多个核心议题。
他们讨论了当前 AI 模型的局限性,强调这些局限更多地在于评估方法而非智能水平本身,指出产品经理的角色正在经历转变,从传统的角色向研究型产品经理演进,这要求他们掌握编写评估标准和模型微调等新技能。
两位产品负责人还展望了 AI 的未来。
他们提出认为「主动性」和「延时响应」将作为 AI 发展的关键词,预测模型将变得更加主动,监控用户邮件、发现趋势、准备会议内容,同时也会更「异步」,可能需要时间来思考和回答。
此外,他们还对用户适应 AI 的速度表示惊叹,预计 AI 将模仿人类思维,以指数级速度迭代升级,并以我们人类互动的所有方式进行互动,预示着全新的人机交互范式。
🔗 https://www.youtube.com/watch?v=IxkvVZua28k
🫀 Anthropic 创始人:Scaling Laws 在人类水平以下无上限
Anthropic 创始人兼 CEO Dario Amodei 近期与播客主持人 Lex Fridman 进行了深入访谈,内容涵盖多个方面。
作为 OpenAI 的前高管,谈及离开的原因时,Amodei 表示,离开并非是因为不喜欢与微软的协议,而是希望带着信任的人去实现自己的愿景。
Amodei 更关注负责任地发展 AI,如在早期他就很喜欢向行业公开分享结果。
他还认为 Scaling Laws 在人类水平以下无上限,不同领域的上限可能不同。在生物学等领域,AI 有很大空间变得更聪明;而在某些领域可能接近人类水平。未来只有在构建系统时才能确定上限,可能的限制包括数据耗尽、计算受限或需要新架构等。
谈及 Claude 模型命名方式混乱时,这位 Anthropic 的创始人解释说,不同大小的模型需要不同的训练时间,根据模型发布的时间的前后不同,命名也会有所变化。
「我认为我们做得非常好。我们有 Haiku、Sonnet 和 Opus ,在命名方面处于有利地位。我们正在努力保持这种状态,但它并不完美,所以我们会尝试回归简单。但就这个领域的性质而言,我觉得没有人能找到完美命名方法。」
🔗 https://www.youtube.com/watch?v=ugvHCXCOmm4
🤯 月之暗面创始人杨植麟最新回应
月之暗面创始人杨植麟最近在媒体交流中回应了一连串问题。
关于 AI 创业公司被收购和人才流失的问题,他表示他的公司没有遇到人才流失,并且认为行业整合是必然趋势。他强调公司始终保持小规模和高效率,专注于核心业务,避免团队扩张对创新的负面影响。
他提到,今年二三月份开始聚焦于 Kimi 产品,减少产品线,以提升留存作为核心任务,并认为留存的提升与技术成熟度正相关。
对于深层推理和数学模型,他认为这些技术在教育产品中有价值,并能应用于更多场景。
关于多模态能力,他表示公司正在内测,认为 AI 的未来在于思考和交互能力,其中思考能力更为关键。在竞争方面,他更关注为用户提供价值,而不是竞争本身,并强调提升模型的思考推理能力
他认为 ChatGPT 已经接近一个超级应用,对于大模型预训练的瓶颈,他持乐观态度,认为预训练还有空间,强化学习将是未来重点。
🔗 https://mp.weixin.qq.com/s/OCn6fgkccaRypT1TeLYBMg
彩蛋时间
🐱《全军出击》


作者:@asdcake0206_38683
工具:Midjourney v6.1
Pormopt:Cute little girl general riding a giant white cat, ancient China, battle scene, full body shot, movie stills, highly realistic.
链接:https://www.midjourney.com/jobs/8667fe78-deca-496a-8c94-40d2509686eb?index=0