7 条新鲜资讯
5 个有用工具
1 个有趣案例
3 个鲜明观点11 月 19 日,华为终端官方发布了三条 Mate70 系列新机特性预热视频,分别是:不可思议,分身有戏:预计指新机可拍摄分身照片或视频内容;见所未见,仅你可见:预计指新机可自动识别机主身份,在其他人出现时自动隐藏手机画面或通知内容。预热视频展现了华为 Mate70 系列手机在交互方式上的更新,以及其在影像和隐私管控方面的新特性。值得注意的是,每一条预热视频的宣传文案中,均含有「Mate 有真 AI」的标签。因此,有不少观点认为,以上三条预热视频分别暗示三项 AI 功能:AI 手势、AI 分身、AI 防窥。目前 Mate70 系列新品已经开启预订,将在 11 月 26 日举行品牌盛典。19 日晚些时候,华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长余承东在微信视频号发表视频称「Mate 70 真捂不住了」,并展示了新机的「金丝银锦」配色。🔗 https://mp.weixin.qq.com/s/dXi7rLT0jXd4P-x0B8fuoA💰 马斯克 xAI 又融资 50 亿美元,用于购买英伟达 GPU据华尔街日报报道,马斯克旗下 AI 初创公司 xAI 在一轮融资中筹集 50 亿美元,总估值达到 500 亿美元。知情人士透露,卡塔尔主权财富基金、Valor Equity Partners、红杉资本、以及Andreessen Horowitz 预计参与本轮融资。此次融资也意味着 xAI 今年筹集的总金额达到 110 亿美元。xAI 的主要产品是 Grok 聊天机器人,于去年 11 月份推出,可供 X 的高级订阅者及企业客户使用。xAI 计划用新资金购买 10 万个英伟达芯片训练模型。目前正在训练中的 Grok-3 预计将于 12 月份推出 ,马斯克称其为世界上最强大的 AI。🔗 https://www.wsj.com/tech/ai/elon-musks-startup-xai-valued-at-50-billion-in-new-funding-round-7e3669dc?mod=Searchresults\_pos1&page=1🔍 与 Google 硬碰硬!OpenAI 被曝打造浏览器据外媒 The Information 报道,OpenAI 正在积极扩展其业务范围,计划推出一款基于 AI 聊天机器人的自研浏览器,意在直接挑战 Google Chrome 的市场地位。知情人士透露,OpenAI 已接触旅游、零售、房地产和餐饮网站,商讨推出一款名为 NLWeb(Natural Language Web)的搜索工具。该工具将允许用户以与 ChatGPT 类似的对话方式与这些网站进行互动。值得关注的是,OpenAI 今年已从 Google Chrome团队挖来两名核心开发者,包 括Chrome 创始成员 Ben Goodger,显示出该公司在浏览器领域的布局意图。不过多位消息人士表示,OpenAI 距离推出浏览器还有相当长的时间。值得一提的是,OpenAI 此前曾推出 ChatGPT 搜索功能,支持天气和股市等实时信息查询。与此同时,美国司法部本周要求强制出售 Chrome 浏览器,预计将对 Google 的市场主导地位构成威胁。🔗 https://www.theinformation.com/articles/openai-considers-taking-on-google-with-browser👏 苹果 Siri 大升级,2026 年拟超 ChatGPT据彭博社报道,苹果公司正在开发一个被称为「LLM Siri」的新版 Siri,旨在通过采用更先进的大型语言模型(LLM)来增强其对话能力。这一新版本将支持更流畅的交流,缩短响应时间,并提升处理复杂问题的能力,使其在与用户对话时更像人类,从而改善用户体验。苹果希望新 Siri 能够更好地与市场上的其他聊天机器人如 OpenAI 的 ChatGPT 等竞争。苹果的目标是让 Siri 在对话能力上赶超现有的语音服务,最终将其整合到 Apple Intelligence 中。目前,苹果正在 iPhone、iPad 和 Mac 上测试这一新版本。据悉,苹果计划在 2025 年 6 月的全球开发者大会上随着 iOS 19 系统发布,也有消息称其将在 2026 年春季向消费者推出。🔗 https://www.bloomberg.com/news/articles/2024-11-21/apple-readies-more-conversational-llm-siri-in-bid-to-rival-openai-s-chatgpt?srnd=phx-technology💵 亚马逊追加 40 亿美元投资 Anthropic据路透社报道,电商巨头亚马逊近期宣布向 OpenAI 竞争对手 Anthropic 追加 40 亿美元投资。此次投资使亚马逊对 Anthropic 的总投资额翻倍,但仍保持少数股东地位。消息人士称,Anthropic 正在与其他投资者洽谈,计划在亚马逊支持的基础上筹集更多资金。作为 Anthropic 的主要云计算合作伙伴,亚马逊正与微软和 Google 激烈竞争,争相为云计算客户提供AI工具。Anthropic 计划在亚马逊的 Trainium 和 Inferentia 芯片上训练和部署其基础模型。该公司还与亚马逊的 Annapurna Labs 部门密切合作,协助开发处理器。🔗 https://www.reuters.com/technology/artificial-intelligence/anthropic-receives-4-billion-investment-amazon-makes-aws-official-cloud-provider-2024-11-22/可口可乐公司的圣诞 AI 宣传片最近引起了强烈的讨论。据 Forbes 报道,这支广告由 Secret Level、Silverside AI 和 Wild Card 三家 AI 工作室使用四种不同的生成式 AI 模型制作,意在致敬该公司 1995 年的「节日来临」广告。画面包含驶过雪街的红色可口可乐卡车,以及戴着围巾和针织帽、手持可乐瓶的人群。
不过,许多创意人士批评该广告「缺乏灵魂」和「毫无创意」。许多细节也处理得不够准确,卡车的轮子在地面上滑行却未旋转,以及一些圣诞灯饰和建筑物的形状和图案在背景中显得不协调等。爱整活的 Reddit 网友也根据原版生成了一个疯狂版的广告,一起来看看具体效果 😀🔗 https://www.forbes.com/sites/danidiplacido/2024/11/16/coca-colas-ai-generated-ad-controversy-explained/在 OpenAI 的 GPT-4o 更新版本摘得 Chatbot Arena 榜首仅仅一天后,Google 便发布了实验性模型 Gemini Exp 1121,并迅速攀升至榜首。与前代版本 Exp 1114 相比,新版 Gemini 在复杂提示处理、代码编程、数学运算和创意写作等方面都有明显提升。Google 高级产品经理 Logan Kilpatrick 也在 X 平台发文介绍这一新版本。他表示,这个实验性模型在代码编程能力上取得了「显著进步」,同时在推理能力和视觉理解方面也有所提升。目前,用户可以通过 Chatbot Arena 平台体验 Gemini Exp 1121 的性能。该模型已在 Google AI Studio 和 Gemini API 上线。Kilpatrick 在另一条帖子中透露,面向普通用户的正式版本正在开发中,但未透露具体发布日期。🔗 https://www.zdnet.com/article/why-there-could-be-a-new-ai-chatbot-champ-by-the-time-you-read-this/DeepSeek 公司近日宣布,其最新研发的推理模型 DeepSeek-R1-Lite 预览版已正式上线。该模型通过强化学习训练,具备长思维链推理能力,长度可达数万字,尤其在数学、编程和复杂逻辑推理任务上表现出色,被认为推理效果可与 OpenAI 的 o1-preview 相媲美,甚至能展示 o1 未公开的完整思考过程。在 AMC 的 AIME 和 codeforces 等国际竞赛评测中,DeepSeek-R1-Lite 超越了 GPT-4o 等知名模型。尽管目前仅支持网页使用,且处于迭代开发阶段,但官方承诺正式版 DeepSeek-R1 模型将完全开源,并提供技术报告及 API 服务,以释放长思维链的全部潜力。具体上手实测细节欢迎回看 APPSO此前的文章 👇🔗 https://mp.weixin.qq.com/s/e1YnTxZlzFvjcmrLLTA8fw近期,生成式 AI 初创公司 Suno 推出最新一代音乐生成模型 Suno v4。据介绍,新模型在音频清晰度、歌词质量以及歌曲结构的动态性方面均有显著提升。
值得关注的是,v4 模型将为该平台两项核心功能提供技术支持:一是音频重构功能 Covers,二是可捕捉并迁移歌曲人声、风格与氛围的 Personas 功能。值得一提的是,今年夏季,索尼音乐、环球音乐和华纳音乐三大唱片公司对 Suno 及其竞争对手 Udio 提起诉讼,指控两家公司在模型训练中未经授权使用受版权保护的音乐作品。对于诉讼,Suno 和 Udio 在回应中承认其模型训练可能涉及版权音乐,但主张这一行为受美国版权法中「合理使用」原则的保护。🔗 https://x.com/sunomusic/status/1858918710008049866?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=microsoft-s-ai-agent-army🥳 对标 ChatGPT,Mistral 全面升级 le Chat近期,法国 AI 初创公司 Mistral 宣布对其产品组合进行全面升级。据悉,Mistral 旗下 Le Chat 聊天机器人平台现已具备网络搜索功能,并可提供引用来源。同时,该平台还推出了类似 ChatGPT Canvas 的「画布」工具,用户可借助 Mistral 的 AI 模型修改、转换或编辑网页模型和数据可视化等内容。在功能升级方面,Le Chat 现可处理包含图表和方程式的大型 PDF 文档和图像,进行分析和总结。平台还整合了 Black Forest Labs 的 Flux Pro 模型用于图像生成,并新增了可共享的自动化工作流程功能,可用于扫描费用报告和发票处理等任务。值得关注的是,Mistral 同时发布了两个重量级模型。其中,具备 1240 亿参数的多模态模型 Pixtral Large 在某些基准测试中已达到或超越 Anthropic 的 Claude 3.5 Sonnet、Google 的 Gemini 1.5 Pro 和 OpenAI 的 GPT-4 等行业领先模型的水平。另一款文本模型 Mistral Large 也推出了新版本 24.11,在长文本理解方面有显著提升。🔗 https://techcrunch.com/2024/11/18/mistral-unveils-new-ai-models-and-chat-features/🤯 Google Gemini 推出「记忆」功能,可记住用户个人偏好近期,Google 旗下 AI 聊天机器人 Gemini 推出新功能,现可记住用户的生活、工作和个人偏好等信息。据报道,这项「记忆」功能目前正逐步向部分 Gemini 用户开放。与 ChatGPT 的记忆功能类似,Gemini 的记忆功能可为当前对话添加上下文。例如,用户告诉 Gemini 自己喜欢的食物后,下次询问餐厅推荐时,系统将根据用户的饮食偏好提供个性化建议。消息称,该功能目前仅向订阅每月 20 美元 Google One AI Premium 计划的用户开放,且仅支持网页端,尚未在 iOS 和 Android 应用程序上线。功能目前仅支持英语输入,用户可随时关闭,但记忆内容需手动删除。Google 发言人表示,Gemini 的记忆功能不会用于模型训练,用户保存的信息不会被共享。🔗 https://www.theverge.com/2024/11/19/24300709/google-gemini-chatbot-memory本周,BlackForestLabs 宣布推出 FLUX.1 Tools 套件,为其 FLUX 文生图模型增添多项图像控制和编辑功能。据悉,新套件包含 Fill、Depth、Canny 和 Redux 四大功能模块。其中,Flux.1 Fill 提供图像内部修复和外部扩展能力,用户可无缝删除或添加图像内容,甚至将图像扩展至原始边框之外。FLUX.1 Tools 还引入结构调节功能,通过 Canny 边缘检测或深度检测来映射图像结构元素,确保在后续生成中保持构图和结构的一致性。此外,Redux 适配器使用户能够对现有图像进行细微变化,生成新版本。根据基准测试结果,FLUX.1 Tools 在各项功能上均超越了 Ideogram V2、Stable Diffusion 1.5 和 Midjourney Retexture 等目前主流模型的表现。值得一提的是,与大多数设有内容安全限制的 AI 图像生成器不同,FLUX.1 平台因其逼真的图像生成效果和较少的限制,在 X 平台引发热议。目前,FLUX.1 Tools 已在 FLUX.1 [dev] 模型系列中开放访问,同时也支持 FLUX.1 [pro] 的 BFL API。用户也可通过订阅每月 7 美元起的 X 平台会员,在Grok上体验 FLUX.1 生成器。🔗 https://www.zdnet.com/article/this-ai-image-generator-that-went-viral-for-its-realistic-images-gets-a-major-upgrade/
关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察
🎨 这个开源 AI 图像神器,在玩一种很新的 P 图但一款新的 AI 图像编辑神器表示:真的吗?不一定吧。这个工具叫作 MagicQuill,你随便画上几笔,甚至不用自己写提示词,AI 就能懂你意思,帮你修图。MagicQuill,不就是「魔法羽毛笔」的意思吗?顾名思义,它好玩的地方在于画笔,分为以下三种。加法画笔(add brush):根据提示词,添加细节和元素。减法画笔(subtract brush):根据提示词,去除多余细节或重绘区域。颜色画笔(color brush):精确地为图像上色,和画笔的颜色相匹配。先来试试颜色画笔,我随意给马斯克的头发涂了点红色和蓝色,AI 主动写好了提示词,我才知道,原来蓝是岩蓝,红是砖红。接下来是加法画笔,很好理解,用在无中生有。天冷了,给《戴黑帽的男人》加条围巾。还有一个特别有趣的玩法——同时使用加法画笔和减法画笔。指路👉 https://magicquill.art/demo/MagicQuill 支持本地部署,也能通过 Hugging Face 或 Alipay Cloud 在线体验。⬆️ 图灵奖得主:新的 Scaling Law 正在出现近日,图灵奖得主 Yoshua Bengio 在外媒《金融时报》上发布了关于 AI 的最新看法。Yoshua Bengio 认为缺乏内部思考能力,也就是「思维」,长期以来被认为是 AI 的一大主要弱点,而最近 OpenAI 在这一领域取得了显著进展。在他看来,更强的推理能力可以解决当前 AI 的两大核心问题:答案的连贯性较差,以及规划和实现长期目标的能力不足。前者在科学领域应用中尤为关键,后者则是实现自主智能体的重要基础。这两方面的提升都可能催生重大的实际应用。Yoshua Bengio 指出 OpenAI 的新「o」系列更进一步推进了推理理念。然而,这一进展需要消耗大量的计算资源和能源支持。通过训练一个极长的推理链,这些模型被优化为能够「更好地思考」。「因此,我们看到了一种新的 Scaling Law 的出现。这不仅包括更多的训练数据和更大的模型规模,还包括为『思考』答案而投入更多的时间。这种改进显著增强了模型在数学、计算机科学以及更广泛的科学领域中以推理为核心的任务表现。」🔗 https://www.ft.com/content/894669d6-d69d-4515-a18f-569afbf710e8在 2024 年世界互联网大会乌镇峰会上,知乎创始人周源对 AI 搜索的现状和未来发展提出了深入的见解。周源指出,尽管 AI 搜索技术已经取得了一定的进步,特别是在提升查询效率方面,但整体而言,AI 搜索仍处于一个相对早期的阶段。他强调,AI 搜索在场景应用的深入程度还不够,未能完全满足用户的个性化需求和刚需。周源通过对比传统搜索和 AI 搜索,提出传统搜索引擎的能力和所索引的网页及服务应该作为一个整体来看待,而 AI 搜索需要在产品侧有更多的升级,以更好地服务于用户的长尾查询和个性化服务需求。他认为,尽管消费者还没有完全习惯 AI 搜索,但随着时间的推移和便利性的展现,人们会逐渐适应并接受这项技术。周源对 AI 搜索的未来持乐观态度,相信在 AI 的驱动下,搜索技术能够实现比以前更好的服务和体验。🥅 Anthropic 创始人:AI 不够聪明,但必须加强监管Anthropic CEO Dani Amodei 在旧金山 AI 会议上与知名风投马克·安德森就 AI 监管问题展开争论。安德森此前发文称「AI 只是数学」,反对监管。Amodei 对此反驳说,「按这逻辑,人脑甚至整个宇宙都可以简化为数学,但这并不意味着我们就不需要对其加以管控。」Amodei 强调当前 AI 模型虽「不够聪明、不够自主」,但技术正快速发展。他警示随着 AI Agent 技术走向前沿,其潜在风险不容忽视,必须加强管控。「当聊天机器人说出一些有点出乎意料的话时,人们现在会笑,」Amodei 说。「但我们需要更好地控制这些聊天机器人。」而安德森则坚持主张 AI 技术应「不受限制地发展」。值得注意的是,Anthropic 此前曾支持加州一项AI监管法案,但该法案最终被否决。对于 Amodei 的批评,安德森方面拒绝置评。🔗 https://fortune.com/2024/11/21/anthropic-ceo-dario-amodei-marc-andreessen-ai-danger-regulation-math/Prompt:cute capybara at the dance floor, disco light链接:https://www.midjourney.com/jobs/a80c5a60-40db-4dd3-840c-d0c387d6c418?index=0