主要观点总结
本文报道了关于人工智能领域的最新进展,包括OpenAI发布的新的GPT-4继任模型“猎户座”,神秘模型草莓的发布,以及Anthropic推出的Artifacts AI功能等。此外,还介绍了智谱AI开源的视频生成模型,全球最快的AI推理解决方案Cerebras Systems的推出,谷歌Gemini模型的升级等内容。同时,也报道了关于大模型的最新研究论文和成果。
关键观点总结
关键观点1: OpenAI发布GPT-4继任模型“猎户座”,据称拥有超过现任所有模型的推理和生成能力,并可以更加自然的方式与人类、环境进行交互。
猎户座模型的预训练数据由草莓模型生成。
关键观点2: OpenAI计划在今年秋季发布内部代号为草莓的神秘新模型,该模型是Q*模型,旨在解决多步骤任务的智能体问题。
草莓模型将融入ChatGPT中,扩展其功能。
关键观点3: Anthropic向Claude用户开放了Artifacts AI功能,该功能可以创建一个动态工作区,用户可以通过对话生成文档、代码、矢量图等。
Artifacts已经推出了预览版,并声称用户已经创建了数千万个Artifacts。
关键观点4: 智谱AI开源了CogVideoX-5B视频生成模型,官方称其视频生成质量更高,视觉效果更好,并大幅度优化了模型的推理性能。
该模型可以在GTX 1080Ti等早期显卡运行。
关键观点5: Cerebras Systems推出了全球最快的AI推理解决方案Cerebras Inference,其速度远超微软Azure等超大规模云中提供的基于英伟达GPU的AI推理解决方案。
该解决方案的定价也比流行的GPU云低得多。
正文
-
OpenAI 或在今年发布内发布 GPT-4 继任模型“猎户座”
-
-
Anthropic 宣布向 Claude 用户开放 Artifacts AI 功能
-
智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行
-
Cerebras Systems 宣布推出全球最快AI 推理解决方案
-
谷歌Gemini 1.5系列模型大升级,排名提升至第六位
-
-
-
智谱 AI 宣布 GLM-4-Flash 大模型免费开放,支持 26 种语言
OpenAI 或在今年发布内发布 GPT-4 继任模型“猎户座”
据 The Information 报道,除了擅长推理的草莓模型,OpenAI 还在秘密开发一款名为猎户座的大模型,该模型获将会成为 GPT-4 的继任模型。
据报道,猎户座的预训练数据由草莓模型生成,将拥有超过现任所有模型的推理和生成能力。此外,猎户座模型还可以以更自然地方式与人类、环境进行综合交互。
据 The Information 报道,OpenAI 正计划在今年秋季发布内部代号为草莓的神秘新模型。
据悉,草莓就是此前引起业内讨论的 Q* 模型,该模型将会被融入 ChatGPT 之中,作为其功能拓发布。根据此前透露的消息,Q* 将是一款专注于推理能力的模型,可以解决此前从未见过的数学问题,并且还经过训练能够解决与编程相关的问题。
报道称,这项技术对未来 AI 产品,特别是旨在解决多步骤任务的智能体,具有重要意义。
Anthropic 宣布向 Claude 用户开放 Artifacts AI 功能
据 Anthropic 官方宣布,将向所有 Claude 用户开放 Artifacts。您现在还可以在 Claude iOS 和 Android 应用上创建和查看 Artifacts。
Artifacts 相当于创建了一个动态工作区,用户和 Claude 对话让其生成文档、代码、矢量图,甚至是简单的游戏过程中,Artifacts 会出现聊天界面旁边,方便用户实时查看、迭代和创建你的作品。
Artifacts 于今年 6 月推出预览版,官方称用户目前已经创建了数千万个 Artifacts。
智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行
智谱 AI 官方宣布,已开源 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。
官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模型。
CogVideoX 是一个大规模 DiT(diffusion transformer)模型,用于文本生成视频任务。
Cerebras Systems 宣布推出全球最快AI 推理解决方案
据siliconangle 报道,Cerebras Systems 宣布 推出全球最快的 AI 推理解决方案 Cerebras Inference。
据悉,该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达 GPU 的 AI 推理解决方案的 20 倍。
除了令人难以置信的性能之外,这款新型推理解决方案的定价也比流行的 GPU 云低得多,起价仅为每百万个 token 10 美分,从而为 AI 工作负载提供 100 倍更高的性价比。
谷歌Gemini 1.5系列模型大升级,排名提升至第六位
据谷歌的 AI 产品负责人 Logan Kilpatrick 表示,谷歌推出了最新的 Gemini1.5模型,其性能大幅提高。
据悉, Gemini1.5模型包括了一个小型变体 Gemini1.5Flash-8B,以及性能明显提高的 Gemini1.5Flash 和 Gemini1.5Pro。Gemini1.5Flash 的全面性能得到了“巨大提升”,而1.5Pro 在数学、编码和复杂提示方面要好得多。
新模型发布之后,大模型竞技场lmsys 发推表示,Gemini1.5-Flash 性能大幅提高,从第23位攀升至第6位,与 Llama 水平持平,性能超过了 Google 的 Gemma 开放式模型。
据第一财经报道,针对字节跳动成立大模型研究院这一传闻,字节跳动辟谣表示,字节跳动有加强大模型相关研究的长期计划,但并未决定建立独立机构。
昨天有消息称,字节跳动正在秘密筹备成立一家大模型研究院目前正处于人才招揽阶段。
据悉,该研究院已经有非字节跳动的 AI 大牛加盟直接向张一鸣汇报。此外,原面壁智能核心成员秦禹嘉、原零一万物核心成员黄文灏已加入字节大模型团队,目前暂不清楚是否归属在大模型研究院。
据 PCmag 报道,马斯克现已表示支持加州的 AI 安全法案,该法案将为大型 AI 系统引入全新的安全和问责机制。
马斯克与人类学公司首席执行官Dario Amodei一起支持这项法案。Amodei表示,这是保护公众和提高行业透明度所必需的。其他主要参与者则表示反对,包括谷歌、Meta和OpenAI,这些企业表示,该法案这可能会扼杀创新,延缓进步。
该法案将要求花费至少 1 亿美元开发强大人工智能模型的公司在发布模型前对其进行测试,并引入一个 “关闭开关”,以便在模型发布后失控时将其关闭。
智谱 AI 宣布 GLM-4-Flash 大模型免费开放,支持 26 种语言
据智谱 AI 官方消息,旗下 AI 大模型免费开放。现在只需要注册开放平台
bigmodel.cn
就可以通过调用 GLM-4-Flash 构建专属模型和应用。
据介绍,GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务,具备多轮对话、网页浏览、Function Call 和长文本推理(支持最大 128K 上下文)等高级功能,同时支持包括中文、英语、日语、韩语、德语在内的 26 种语言。
智谱表示通过多种方式优化了大模型运行效率。开放平台采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法,在推理层面实现模型的延迟降低与速度提升,更大并发量和吞吐量不仅提升了效率,而且让推理成本显著降低。