近日,一款AI绘画模型Stable Cascade发布。
只需输入一段描述文字,即可在4秒钟内获得令人惊艳的图像。
无论你是设计师、艺术家,还是普通用户,都能轻松上手,释放无限创意。
Stable Cascade不仅在使用上极具便捷性,还拥有开放的源码。
任何人都可以在Stability的GitHub页面上找到用于微调、ControlNet和LoRA训练的脚本,进一步挖掘这个全新架构的潜力。
而且,Stable Cascade在硬件友好性方面也表现出色。
它仅需大约9GB的GPU内存就能保持出色的生成速度,让你的创作过程更加流畅高效。
无论是在Windows、Mac还是Linux平台上,你都能轻松启动这款应用,享受一键生成图像的便捷体验。
使用便捷性提升性价比
使用方式很多!
Gradio App
pip3 install gradio
pip3 install accelerate # optionally
pip3 install git+https://github.com/kashif/diffusers.git@wuerstchen-v3
# 项目根目录执行
PYTHONPATH=./ python3 gradio_app/app.py
ComfyUI
ComfyUI 新版本正式 Stable Cascade 新模型。
首先,更新你的ComfyUI。
然后,把B、C模型放到ComfyUI/models/unet路径下。
A模型放到ComfyUI/models/vae。
还有CLIP模型,别忘了放到ComfyUI/models/clip。
我试了下用bf16的B/C双模型,显存不到16G也能轻松应对。
这个新模型的表现真是让人眼前一亮。构图和细节都处理得非常好,对自然语言的理解也更上一层楼。属性匹配方面也提升了不少,感觉更加智能了。
最让我惊喜的是,文字生成功能也有了很大的进步。
生成短单词和词组的准确率非常高,长句也有一定概率可以完美呈现(目前支持英文)。
文字与画面的融合度也非常高,用来做简单的logo和poster完全没问题。
Pinokio 安装
本地一键启动,支持Windows, Mac,
Linux系统。
https://pinokio.computer/
huggingface
体验地址:https://huggingface.co/spaces/multimodalart/stable-cascade
一如既往简单操作就能够生成目标图像:输入对图像的文字描述即可。
源码开放性助力性价比
在这里插入图片描述
在推理部分,提供notebook源码,它们将引导你一步步完成模型的运行。 例如:
- Text-to-Image
- ControlNet
- LoRA
- Image Reconstruction
具体源码:https://github.com/Stability-AI/StableCascade/blob/master/inference/readme.md
硬件友好性拓宽性价比
使用 Stable Cascade 的预训练脚本可以进行推理。
尽管从gdf开始看似直接就可以,但还需要一些工作。
设置简单的VRAM消耗优化后,生成1024x1024分辨率、bf16格式的图片大约需要8GB的显存。
结语
Stable Cascade的便捷性、开放性和硬件友好性让每一个人都有机会将心中的创意转化为令人惊艳的图像。
未来,Stable Cascade还将继续优化和完善,为我们带来更多惊喜和可能性。