专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
目录
相关文章推荐
黄建同学  ·  这个新AI硬件卖89刀,你会买吗?Omi.m ... ·  6 小时前  
爱可可-爱生活  ·  通过统一稀疏注意力机制实现高效的长序列大语言 ... ·  19 小时前  
营销之美  ·  DeepSeek使用图鉴:人类和AI谁在玩弄谁? ·  昨天  
营销之美  ·  DeepSeek使用图鉴:人类和AI谁在玩弄谁? ·  昨天  
爱可可-爱生活  ·  [LG] A Survey of ... ·  2 天前  
爱可可-爱生活  ·  【[196星]SkyReels-A1:用视频 ... ·  3 天前  
51好读  ›  专栏  ›  黄建同学

AI自己写AI来了↓ 来自Sakana AI的突破性技术——AI-20250221124719

黄建同学  · 微博  · AI  · 2025-02-21 12:47

正文

2025-02-21 12:47

AI自己写AI来了↓

来自Sakana AI的突破性技术——AI CUDA工程师:自动化CUDA内核发现、优化及组合

1. Sakana AI坚信利用AI自动化AI的开发是提升AI系统性能的关键。其最新推出的AI CUDA工程师,是一种能自动生成高度优化的CUDA内核的代理系统,其性能提升达到10-100倍,极大超越了PyTorch中常见的机器学习操作。

2. 技术核心:AI CUDA工程师使用先进的大型语言模型(LLMs),通过进化优化技术,自动将标准的PyTorch代码转换为高度优化的CUDA内核。这一进程不仅自动化了PyTorch模块到CUDA内核的转换,并且发现的CUDA内核在运行时显著快于现有生产中常用的CUDA内核,速度提升高达5倍。

3. 实现步骤:
- 阶段1和2(转换与翻译):首先将PyTorch代码翻译为功能性CUDA内核。
- 阶段3(进化优化):借鉴生物进化理论,“适者生存”的原则确保产生最优CUDA内核。
- 阶段4(创新存档):建立一个从过去的创新中学习的“创新存档”,以便实现更进一步的转换和性能提升。

4. 该方法不仅为基础操作如矩阵乘法等发现了更高效的CUDA内核,并且在KernelBench上达到了最佳性能。此外,还发布了一个包含超过17,000个经验证的内核的数据集,为CUDA模块的后续训练提供支持。

访问:sakana.ai/ai-cuda-engineer/

#ai创造营# #deepseek# #科技#






请到「今天看啥」查看全文