【AI绘图工具】太爆炸了，AI出图速度100fps（每秒100张图片），比LCM、SDXL Turbo更快，目前No.1

记得前面介绍的LCM、SDXL Turbo吗，出图够快了吧，还有更快的，目前世界上出图最快的产品。

今天被一则消息惊到了

就是前段时间刷屏的基于LCM和SDXL Turbo每秒生成110张图像的项目，StreamDiffusion居然开源了。

项目地址：https://github.com/cumulo-autumn/StreamDiffusion

论文地址：https://arxiv.org/abs/2312.12491

想做相关实时图像生成产品的可以去用起来了，我们都喜欢开源的项目，我在colab上也建好了，感兴趣可以去体验一下，生成图片速度真的快

colab地址：

https://colab.research.google.com/github/hewis123/stream-d/blob/main/Untitled2.ipynb

今天我就来介绍一下这个产品工具吧，我都不知道该把它归类入视频工具还是图像工具，底层逻辑当然还是AI绘图工具了。

一、StreamDiffusion 产品介绍

项目研究团队来自美国和日本相关大学机构的成员

StreamDiffusion可以以几乎 100fps（每秒100张）的速度生成图像！

使用 SD-Turbo，512x512，txt2img，可以在 10 毫秒内生成一张图像！

这肯定是目前AI生成图片速度最快的，毫无疑问！

二、现有扩散模型在解决实时性方面的策略

针对扩散模型在商业化中的应用趋势，主要集中在提高扩散模型的运行速度，以便在实时交互场景中更有效地生成图像方面开展工作，主要有以下一些关键点：

1、商业化扩散模型：扩散模型因其在商业领域的潜力而受到关注，特别是在元宇宙、在线视频流和广播等领域，这些领域需要高吞吐量和低延迟的扩散管道以确保高效的人际交互。

2、减少去噪迭代次数：为了提高吞吐量和实时交互能力，当前的研究主要集中在减少去噪迭代的次数。例如，将50次迭代减少到只有几次，或者甚至一次迭代。

3、使用神经常微分方程（ODE）：通过使用ODE求解器，可以在不需要额外训练的情况下提高扩散模型的速度。这种方法通过将扩散过程重新框架化为ODE来实现。

4、自适应步长求解器：这种方法通过调整步长来加速扩散过程，同时保持图像质量。

5、预测-校正方法：这是一种通过预测中间步骤并进行校正来提高扩散模型效率的方法。

6、量化：通过量化扩散模型可以减少模型的计算复杂度，从而提高运行速度。

7、模型蒸馏：通过蒸馏技术，可以将大型的扩散模型压缩到更小的模型，同时保持图像生成的质量。

8、一致性模型：通过改进采样过程的效率来提高扩散模型的效率，而不会显著牺牲图像质量。

这些策略都是为了在不牺牲图像质量的前提下，提高扩散模型的运行速度，使其能够在实时交互环境中更有效地工作。

StreamDiffusion 与这些现有策略不同，它提供了一个全面的管道级解决方案，专门针对高吞吐量进行了优化。

三、StreamDiffusion工作原理

现有的扩散模型在从文本或图像提示创建图像方面表现出色，但在实时交互方面往往表现不佳。为了解决这个问题，项目团队提出了一种新的简单方法，将原始的顺序去噪过程转化为批量去噪过程。这种方法通过消除传统的等待和交互方法，实现了流畅和高吞吐量的流。为了处理数据输入频率和模型吞吐量之间的差异，他们设计了一种新的输入输出队列来并行化流处理过程。此外，现有的扩散管道使用无分类器指导来强制生成的结果与提示条件一致，但项目团队指出当前的实现由于负面条件去噪的固有冗余性而效率低下。为了缓解这种冗余计算，他们提出了一种新的残差无分类器指导（RCFG）算法，将负面条件去噪步骤减少到只有一步或者零步。