大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。
InfoQ 研究中心
期望通过每周更新大模型行业最新动态,为广大读者提供全面的行业回顾和要点分析。现在,让我们回顾过去一周的大模型重大事件吧。
AI 创新不止步,金山办公、谷歌、OpenAI、蚂蚁集团接连升级或推出新产品,持续拓展应用范围。大模型基础研究不断取得突破,能解码 mRNA 非翻译区序列的大模型为预测 mRNA 功能和设计 mRNA 疫苗新序列提供了新的可能。同时,亚马逊云科技、阿里云通义千问、aiXcoder 等企业或团队也开源了各自的大模型,提升了 AI 在视频生成、文本控制、代码编写等领域的能力。此外,多家公司在具身智能领域取得了新进展。谷歌、英特尔推出了一系列 AI 相关更新和新产品,推动了行业基础设施能力的发展。本文将为你揭示这些新品的魅力和价值。
-
4 月 7 日,亚马逊云科技宣布,Mistral AI 的 Mistral Large 模型现已在 Amazon Bedrock 平台上正式可用。
-
4 月 7 日,阿里云通义千问再次开源了一款大语言模型——拥有 320 亿参数的 Qwen1.5-32B。
-
4 月 7 日,北大 - 兔展 AIGC 联合实验室发布了复现 OpenAI 公司的 sora 的开源 Open-Sora-Plan v1.0.0 模型。该模型大幅提升了视频生成质量和文本控制能力,能生成 10 秒、24 FPS 的 1024×1024 视频及高分辨率图像,并支持华为昇腾 910b 等国产 AI 芯片的训练与推理。
-
4 月 9 日,aiXcoder 团队开源了全自研 aiXcoder 7B 代码大模型。该模型专注于代码生成与补全任务,提供了个性化训练、私有化部署和定制化开发的解决方案,以满足不同企业的特定需求。
-
Mistral AI 开源了 Mistral 8X22B 大模型,共有 1760 亿个参数,Context 长度为 6.5 万个 token,可通过 Torrent 下载。
-
普林斯顿大学王梦迪领导的研究团队开发了全球首个能够解码 mRNA 非翻译区序列的大模型。这一模型的应用目标是精确预测 mRNA 转录为蛋白质的功能,并设计用于 mRNA 疫苗的新序列。该研究的论文为「A 5’ UTR Language Model for Decoding Untranslated Regions of mRNA and Function Predictions」,已被《Nature Machine Intelligence》采纳。
-
朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。该研究探讨了三种合成数据类型:bioS、bioR 和 bioD,分别代表使用英语模板编写的人物传记、由 LlaMA2 模型辅助撰写的人物传记,以及可以控制细节的虚拟知识数据。研究重点在于分析基于 GPT2、LlaMA 和 Mistral 的语言模型架构。
-
4 月 9 日,金山办公发布了专为组织和企业设计的办公新质生产力平台 WPS 365。该平台集成了升级的 WPS Office、新发布的 WPS AI 企业版及 WPS 协作,实现了文档、AI、协作的无缝整合。用户仅需一个工具,即可调用各类主流大模型。
-
谷歌升级了 Gemini 1.5 Pro 大语言模型,为其新增音频分析能力,可直接从音频文件中提取关键信息,无需转换为文字。
-
4 月 10 日,OpenAI 宣布 GPT-4 Turbo with Vision 版现已对外开放,用户现可通过 API 接口对其进行访问。此外,该功能支持使用 JSON 模式和函数进行调用。
-
4 月 11 日,蚂蚁集团的智能研发平台 CodeFuse 新增了一项新功能——“图生代码”,该功能允许开发人员通过产品设计图快速生成相应的代码,显著提高了前端页面开发的效率。目前,这项新功能正处于内部测试阶段。
-
4 月 9 日,在 Google Cloud Next 2024 大会上,谷歌推出 Vertex AI Agent Builder,是一个帮助企业构建 AI 智能体的新工具,它使得构建和部署生成式对话智能体变得简单快捷。
-
逐际动力的人形机器人 CL-1 在最新视频中展示了其改进的上楼梯和跑步能力,同时在实时地形感知、全身运动控制和硬件性能上都有所提升。CL-1 能够交替上楼梯,流畅完成跑步动作,并优化了运动控制和硬件结构,实现了更强的稳定性和动力性能。
-
斯坦福大学的 ALOHA 家务机器人团队发布了最新研究 Yell At Your Robot,使用者能够通过喊话纠正机器人的错误动作。机器人能动态提升动作水平、调整策略,并根据反馈不断自我改进。
-
4 月 9 日,曾担任特斯拉 Autopilot 项目负责人以及 OpenAI 科学家的 Andrej Karpathy 推出了一个创新项目,名为“llm.c”,该项目通过仅 1000 行代码便能在 CPU 和 fp32 精度下实现对 GPT-2 模型的训练。
-
4 月 9 日,在 Google Cloud Next 2024 大会上,谷歌宣布了一系列 AI 相关的更新和新产品。Gemini 1.5 Pro 在 Vertex AI 平台上提供了公共预览版。谷歌还推出了三大开源工具:Max Diffusion、Jetstream 和 MaxText,这些工具旨在支持生成式 AI 项目和基础设施。在硬件方面,谷歌云宣布推出首款自主研发的 Arm 处理器 Axion,据称其性能比竞争对手高出 30%,能效提高了 60%。此外,谷歌推出的 CodeGemma 是基于 Gemma 模型的代码生成和补全工具,它提供了智能代码补全、高准确性和多语言支持,能够简化开发人员的工作流程。Google DeepMind 发布的 RecurrentGemma 是一系列开放权重语言模型,基于 Griffin 架构,通过局部注意力和线性循环实现快速推理。Google Vids 是谷歌推出的 AI 视频创建工具,它允许用户在 Google Workspace 中与其他工具如文档和表格一起制作视频,并支持实时协作。最后,Gemini Code Assist 是谷歌推出的企业级 AI 代码完成和辅助工具,旨在提供更准确的代码建议和处理大段代码的能力。
-
4 月 10 日,在 Vision 2024 大会上,英特尔展示了由其子公司 Habana Labs 开发的最新款高性能 AI 加速器——Gaudi 3,并计划在 2024 年第三季度正式推出。
Sora 来袭,国内如何迅速跟上?开源在大模型市场进程中的价值正在被重新定义吗?人型机器人重回视野,其能力是否有所提升和刷新?Devin 和智能编码助手是同一条赛道上的不同节点?多家企业宣布 All in AI,对市场意味着什么?InfoQ 研究中心即将发布的
《2024 年第 1 季度大模型监测报告》
,即将给出答案。
每周动态更新和季度报告后续均会在
AI 前线
上发布,欢迎持续关注
AI 前线
公众号,共同见证大模型行业的发展与突破!
跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「
AI 前线
」公众号,回复「
开发者洞察
」领取。
AICon 全球人工智能开发与应用大会 暨 大模型应用生态展将于 5 月 17 日正式开幕,本次大会主题为「
智能未来,探索 AI 无限可能
」。如您感兴趣,可点击「
阅读原文
」查看更多详情。
今天是会议 9 折购票阶段,购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。