英伟达让 Deepseek R1 编写 GPU 内核
#AI创造营#
#ai#
#Deepseek#
结果 R1 写的内核比英伟达熟练工程师的还好 !
他们使用的方法也很简单:
1️⃣DeepSeek-R1 生成初始 GPU 内核代码
2️⃣验证器(H100)分析生成的内核并提供反馈
3️⃣将其反馈回 DeepSeek-R1 以生成修订后的内核
4️⃣过程重复一定的持续时间
他们发现只要持续超过 10 分钟就能生成大多数问题的正确代码
详细信息:developer.nvidia.com/blog/automating-gpu-kernel-generation-with-deepseek-r1-and-inference-time-scaling/
结果 R1 写的内核比英伟达熟练工程师的还好 !
他们使用的方法也很简单:
1️⃣DeepSeek-R1 生成初始 GPU 内核代码
2️⃣验证器(H100)分析生成的内核并提供反馈
3️⃣将其反馈回 DeepSeek-R1 以生成修订后的内核
4️⃣过程重复一定的持续时间
他们发现只要持续超过 10 分钟就能生成大多数问题的正确代码
详细信息:developer.nvidia.com/blog/automating-gpu-kernel-generation-with-deepseek-r1-and-inference-time-scaling/