专栏名称: AI科技大本营
为AI领域从业者提供人工智能领域热点报道和海量重磅访谈;面向技术人员,提供AI技术领域前沿研究进展和技术成长路线;面向垂直企业,实现行业应用与技术创新的对接。全方位触及人工智能时代,连接AI技术的创造者和使用者。
目录
相关文章推荐
湖北经视  ·  确认了!全智贤方最新回应 ·  2 天前  
湖北经视  ·  安踏宣布:永不合作! ·  2 天前  
湖北经视  ·  直播微视评:好人,就是最无畏的凡人 ·  3 天前  
51好读  ›  专栏  ›  AI科技大本营

AMD芯片路线与英伟达周期一致,发布下一代AI PC;Perplexity 推出可撰写研究报告新功能 | AI头条

AI科技大本营  · 公众号  ·  · 2024-06-03 18:27

正文


整理 | 王轶群
出品 | AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!

  • 英伟达宣布2025 年推出 Blackwell Ultra 芯片、2026 年推出Rubin 芯片

  • 华硕、和硕、纬创等公司将利用 Nvidia Blackwell GPU 提供云端、本地、嵌入式和边缘 AI 系统

  • AMD 将推出Instinct MI325X加速器,发布一代AI笔记本电脑的Ryzen AI 300系列

  • 在 Computex 2024上,英伟达 Project G-Assist AI Assistant 揭晓

  • AI 搜索引擎 Perplexity 推出 Pages,可进行研究并撰写报告

  • 昆仑万维开源2千亿稀疏大模型天工MoE,系首个支持用单台 4090 服务器推理的开源千亿 MoE大模型

  • 翠贝卡电影节将放映 OpenAI 的 Sora 创作的人工智能短片

  • 调查显示大众并不常用 ChatGPT 等 AI 产品

  • Suno 3.5 版本模型已向所有人开放,可制作 4 分钟歌曲

全球 AI 要闻

英伟达宣布2025 年推出 Blackwell Ultra 芯片、2026 年推出Rubin 芯片

英伟达首席执行官黄仁勋在Computex 2024上发表的主题演讲中表示,Blackwell芯片现已开始投产。他还表示,该公司计划每年升级其 AI 加速器,计划每年升级其 AI 加速器,2025 年推出 Blackwell Ultra 芯片,2026 年推出使用 HBM4 内存的 Blackwell 继任者 Rubin 芯片。

Nvidia 表示,华硕和 MSI 新发布的 RTX AI PC 笔记本电脑将配备高达 GeForce RTX 4070 的 GPU 和“具有 Windows 11 AI PC 功能的片上系统”。

华硕、和硕、纬创等公司将利用 Nvidia Blackwell GPU 提供云端、本地、嵌入式和边缘 AI 系统

Nvidia 首席执行官黄仁勋在 Computex 2024上宣布,全球顶级计算机制造商今天将推出基于Nvidia Blackwell架构的系统,该系统配备 Grace CPU、Nvidia 网络和基础设施,供企业打造 AI 工厂和数据中心。

Nvidia Blackwell 图形处理单元 (GPU) 的能耗降低了 25 倍,并且 AI 处理任务的成本更低。而 Nvidia GB200 Grace Blackwell 超级芯片(即同一封装内包含多个芯片)有望带来卓越的性能提升,与之前的版本相比,LLM 推理工作负载的性能提升高达 30 倍。

黄仁勋表示,为了推动下一波生成式人工智能的发展,ASRock Rack、华硕、技嘉、Ingrasys、英业达、和硕、QCT、超微、纬创和 Wiwynn 将使用 Nvidia 图形处理单元 (GPU) 和网络提供云端、本地、嵌入式和边缘人工智能系统。(VentureBeat)

AMD 将推出Instinct MI325X加速器,发布一代AI笔记本电脑的Ryzen AI 300系列

AMD 宣布每年发布一次数据中心 GPU,AMD详细介绍了其数据中心芯片路线图,其中Instinct MI325X加速器(MI300系列的增强版)计划于第四季度上市。基于下一代架构的本能MI350系列将于2025年发布,而本能MI400系列计划于2026年发布。芯片设计师表示,Instinct MI325X 数据中心 GPU 将在内存容量、内存带宽方面胜过 Nvidia 的 H200。

AMD大约每年一次的发布周期与英伟达首席执行官黄仁勋(Jensen Huang)前一天晚上在 Computex 2024 发表演讲时提出的一年一次AI芯片新品发布的计划相符。

“人工智能是我们的首要任务,我们正处于一个令人难以置信的激动人心的时刻的开始,因为人工智能几乎改变了每一项业务,提高了我们的生活质量,重塑了计算市场的每一个部分,”董事长兼首席执行官 Lisa Su 在 Computex 科技大会上表示。 在主题演讲中,Lisa Su发布了用于下一代 AI 笔记本电脑的 Ryzen AI 300系列。这条生产线可能直接与英特尔即将推出的月球湖和高通竞争。

在 Computex 2024 上,英伟达 Project G-Assist AI Assistant 揭晓

Nvidia 的 G-Assist 是一款 AI 聊天机器人,旨在辅助玩家完成游戏并优化 PC 设置的 AI 助手。

Project G-Assist 接收玩家的语音或文本输入,以及游戏窗口中内容的快照。快照被输入到 AI 视觉模型中,该模型为大型语言模型 (LLM) 提供情境感知和特定于应用的理解,该模型连接到 wiki 等游戏知识数据库。

在技术演示中,G-Assist 展示了它如何通过语音查询回答游戏中的问题,比如 “下一个早期游戏武器是什么,我在哪里可以找到它的制作材料?” 这样的问题。

Nvidia 自己的 AI 助手还可以优化和调整 PC 设置,包括提供过去 60 秒内 PC 延迟和每秒帧数的图表。它可以扫描系统并注意到当显示器支持 240Hz 时,用户只能以 60Hz 的速度玩游戏。用户还可以向助手寻求建议,以提高游戏性能、达到 60fps 的性能目标,甚至超频的 GPU。(The Verge)

AI 搜索引擎 Perplexity 推出 Pages,可进行研究并撰写报告

AI 搜索平台 Perplexity正在推出一项名为 Pages 的新功能,该功能将 根据用户提示生成可自定义的网页。这项新功能就像是制作学校报告的一站式服务,Perplexity 会进行研究和撰写。

Pages 利用Perplexity 的 AI 搜索模型来查找信息,然后创建可以发布并与他人共享的研究演示文稿。Perplexity 在一篇博客文章中表示,它设计 Pages 是为了帮助教育工作者、研究人员和“爱好者”分享他们的知识。(The Verge)

昆仑万维开源2千亿稀疏大模型天工MoE,系首个支持用单台 4090 服务器推理的开源千亿 MoE大模型

6月3日,昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE , 性能强劲, 同时推理成本更低。Skywork-MoE 基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来, 是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 MoE大模型,也是首个支持用单台 4090 服务器推理的开源千亿 MoE大模型。

据悉,Skywork-MoE 的模型权重、技术报告完全开源。

模型权重下载:

https://huggingface.co/Skywork/Skywork-MoE-base

https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

模型开源仓库:

https://github.com/SkyworkAI/Skywork-MoE

模型技术报告:

https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

模型推理代码(支持 8x4090 服务器上 8 bit 量化加载推理):

https://github.com/SkyworkAI/vllm

据介绍,本次开源的 Skywork-MoE 模型隶属 于天工 3.0 的研发模型系列,是其中的中档大小模型(Skywork-MoE-Medium),模型的总参数量为 146B,激活参数量 22B,共有 16 个 Expert,每个 Expert 大小为 13B,每次激活其中的 2 个 Expert。

同时,天工 3.0 还训练了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)两档 MoE 模型,并不在此次开源之列。

昆仑万维表示,团队基于目前各大主流模型评测榜单评测了 Skywork-MoE,在相同的激活参数量 20B(推理计算量)下,Skywork-MoE 能力在行业前列,接近 70B 的 Dense 模型,使得模型的推理成本有近 3 倍的下降。同时 Skywork-MoE 的总参数大小比 DeepSeekV2 的总参数大小要小 1/3,用更小的参数规模做到了相近的能力。







请到「今天看啥」查看全文