Replicate 写了个博客,介绍了一下他们是如何让 FLUX Dev 的图片生成只需要 300 毫秒的。
#ai画图#
对有需要在生产环境部署 FLUX Dev 的朋友应该会很有帮助。
他们主要做了两件事:
1)以 Alex Redden 的 flux-fp8-api 为基础,然后使用 torch.compile 进行了优化,并在 Torch 的每日构建版本中采用了快速的 CuDNN 注意力核心 (attention kernels)。
2)添加了一个新的同步 HTTP API,大大提高了 Replicate 平台上所有图像模型的速度。
而且关于 FLUX 模型生成速度优化的代码是开源的。
来源:replicate.com/blog/flux-is-fast-and-open-source
对有需要在生产环境部署 FLUX Dev 的朋友应该会很有帮助。
他们主要做了两件事:
1)以 Alex Redden 的 flux-fp8-api 为基础,然后使用 torch.compile 进行了优化,并在 Torch 的每日构建版本中采用了快速的 CuDNN 注意力核心 (attention kernels)。
2)添加了一个新的同步 HTTP API,大大提高了 Replicate 平台上所有图像模型的速度。
而且关于 FLUX 模型生成速度优化的代码是开源的。
来源:replicate.com/blog/flux-is-fast-and-open-source