
在介绍扣子的图像流之前,有必要先讲讲 ComfyUI.ComfyUI 是一个爆火的开源项目,目前在 Github 上拥有 34k+ stars. 用户无需编程基础,即可通过创建节点的方式,搭建工作流,轻松部署使用复杂的 Stable Diffusion.如果你是研究 AI 生图的朋友,却不知道 ComfyUI,那就好比 Agent 相关的爱好者/从业者,却不知道特工宇宙一样,属于是落后版本了
而就在 5 月 13 日晚,即 OpenAI 春季发布会前两个多小时,扣子也上线了“字节版 ComfyUI”——图像流。

图像流,简单来说就是生成图像的工作流。图像流支持通过可视化的方式,对图像获取、生成、编辑和发布等功能进行组合,从而实现稳定的图像处理流程的编排。图像流的入口在这里
然后我们就来到了图像工作流页面。



目前涵盖的工具包括智能生成、智能编辑、基础编辑三部分,具体整理如下
支持 AI 扩图、AI 抠图,多图融合,智能换脸等主流功能。
不过非常遗憾的是,图像流功能刚上线一小时左右,就被下架了。有说是出了 Bug 的,有说是没做安全性测试的,还有说是撞车 OpenAI 发布会改期发布了的...
我们也第一时间向扣子官方求证,得到的答复是——目前仅为测试,5 月 15 日发布会(如下)后将全量上线,可以关注一下。


虽然但是,在这极短的时间内,我们也快速的做了测试(只能说不愧是特工
)
我们先做了一个提升画质然后抠图的工作流。

然后拿了有点糊的这个东东做了测试。
运行的速度非常快,效果也非常满意,确实图像放大了也抠的特别好。
不过目前抠图不是自定义的,我们又测试了一些复杂的图片,会出现抠图不全/扣的不是理想的图案等情况。
再之后,我们测试了这个智能换脸的功能。一开始想模仿网红听泉猫,做一个把人脸替换成猫猫的表情包 bot 的。

但是失败了,没检测到人脸(看来猫脸不行)。
于是,我拿了我和红衣大叔周鸿祎的合影...重新测试...替换成了我和马斯克的合影...不得不说,还真有点东西
另外智能换脸比较有意思的一点是,还可以设置这个美肤效果。
此外,我们还测试了给图片添加文字。
还有人像风格化和空间风格化。



图像流功能,还能玩出什么花呢?官方很贴心的提供了许多模板,供参考学习。包括毛坯房装修、生成产品图、生成文字海报、生成模特图等等模板,不过现在因为下架查看不了了。
最后,建议大家加入我们特工宇宙的 Coze 爱好者社群,一起蹲更新,一起看发布会,一起搓 Bots!还有,各位义父们多多转发文章,别被隔壁 GPT-4o 抢光了热度


说到这我还迅速搞了个
GPT-4o 的 API,部署到了扣子上。(很多功能都还没开放,其实除了更快了一点,个人觉得没有特别惊艳,跟 4v 差不多)。不知道有些国内媒体在瞎吹什么“AGI 已然到来”。

出自:https://mp.weixin.qq.com/s/FDg0OH8VSFFP0cg7Wu9IRA