最近AI绘画爆火,由于是艺术和技术的跨界结合,因此出现了大量专有名词(英文和中文都有),有些是公司名,有些是项目名,有些是技术名词,有些特指模型,有些特指插件或者网站,有些是二次元人物,游戏风格等,经常还会缩写简写等,初入坑者听到或者看到了这些名词往往一头雾水,即使想通过某度或者某歌搜索也很难得到正确的结果,在此罗列了一些名词和满含个人观点的解析,同时贴出官方原始链接,通过使用浏览器的翻译功能看原文能更好的理解,希望这些对他人有帮助。
最近AI绘画爆火,由于是艺术和技术的跨界结合,因此出现了大量专有名词(英文和中文都有),有些是公司名,有些是项目名,有些是技术名词,有些特指模型,有些特指插件或者网站,有些是二次元人物,游戏风格等,经常还会缩写简写等,初入坑者听到或者看到了这些名词往往一头雾水,即使想通过某度或者某歌搜索也很难得到正确的结果,在此罗列了一些名词和满含个人观点的解析,同时贴出官方原始链接,通过使用浏览器的翻译功能看原文能更好的理解,希望这些对他人有帮助。
****************************************************
英文:AI 全写:Artificial Intelligence
说明:在本文论述范围内指人工智能,而不是Adobe
Illustrator绘图软件,也叫AI,两者容易混淆。
****************************************************
英文:Stable-Diffusion 简写:sd 中文直译:稳定-扩散
说明:简单粗暴的理解为AI绘画的一种技术,项目名,于2022年8月10日官宣开放源代码,8月22日在github上放出源码,同时提供了训练后的计算模型,母公司是Stability AI(英国公司 成立于2020年)其最大的特色在于开源、许可宽松、硬件设备要求低(普通家用级单张n卡10系列 16系列显卡就可实现Text To Image、Image To Image、Inpainting(图像修复)、Textural Inversion(神经网络文本学习),而无须专业的集群GPU来进行深度学习才能使用)操作简单,出图快,平均10-20秒,画人物很强,西方魔幻风格
其实AI绘画从21年起就开始快速发展,但只有sd项目开源(关于开源 下面有论述)了,其他诸如Dall-E(读音 达里),Dall-E-2、Imagen、GLIDE等等要么只提供接口,开始收费,有些只有展示一个结果。这些名词下面有论述。
官方BLOG:https://stability.ai/blog
官宣开源申明:https://stability.ai/blog/stable-diffusion-announcement
2022-8-10官宣开源官宣里放出的代码地址和模型地址
sd开源项目链接:https://github.com/CompVis/stable-diffusion
查看后可以发现 该代码是于2022-8-23提交的
参看:https://www.oschina.net/news/206691/stable-diffusion-open-sources
提外话:
开源和不开源的区别
一、开源 有源代码 可以自行修改重新编译 增加功能等等 不仅可以离线断网获得结果 并且还能在代码里学习是如何实现的 可以不受限制(除了开源许可本身的限制)的增加扩展各种功能 这就是开源魅力之所在
二、不开源 再分两种
1. 编译后直接使用的工具软件(例如:Office软件、WinRAR压缩软件等等)可以安装使用,断网也不受影响 但只有程序 没有代码 并不能学习到如何实现的 除了使用软件本身带的扩展接口外进行编程开发 无法增加功能
2. 只提供网络API接口 只能在线联网调用接口提交数据 获得返回结果 并不知道是怎么来的 会有很多限制 为了避免法律风险 AI绘画项目对于某些人名或者不可描述画面作了限制不允许生成 此外对于调用频次 数量也有限制 限于GPU算力费用 很多可能一开始免费 后续就开始收费 以充值点数或以按月订阅(subscribe)的形式(大部分其他AI绘画都是这种形式)
****************************************************
英文:Stability
AI CompVis Runway
说明:Stability AI是公司名称 CompVis和Runway是其中两个Team小组
Stability AI主页: https://stability.ai/
RunWay主页:https://runwayml.com/
Stability AI出钱:计算模型需要租用Amazon云服务器对图片集进行运费,耗资巨大,目前放出的1.4版本的计算模型就是用托管在Amazon云上的A100 GPU集群在进行了深度学习后的结果
runwayml 出力:算法,想法,代码,架构
****************************************************
英文:github
说明:代码仓库的网站,开源项目托管在上面
网站链接:https://github.com/
****************************************************
英文:sd模型
官方链接:https://huggingface.co/CompVis/stable-diffusion
说明:Stable-Diffusion开源后同步发布的官方原始模型,该模型擅长风景,二次元并不擅长 该模型是托管在huggingface上 并没有和源代码一起放在github上 撰文时最新版本为1-4 至于每一个版本怎么迭代来的 参看原网页更易理解
很多人在官方链接上找不到入口 因为该网站是需要注册登录后才能看到的
官方对于模型的说明 下载位置下载位置
磁力链接下载:magnet:?xt=urn:btih:3a4a612d75ed088ea542acac52f9f45987488d1c&dn=sd-v1-4.ckpt
推荐官网下载
****************************************************
英文:dreamstudio dream
官方网址:https://beta.dreamstudio.ai/dream
说明:stability.ai官方运用自己的stabel-diffusion搭建的平台 谷歌账号登录 有两个模型可以选择 1.4 和 1.5
使用参看:https://zhuanlan.zhihu.com/p/560226367
****************************************************
英文:Disco Diffusion
说明:Disco Diffusion 是发布于Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具,它是基于MIT 许可协议的开源工具,可以在Google Drive 直接运行,也可以部署到本地运行。Disco Diffusion 有一个弊端,就是速度非常慢,动辄10多分钟半小时起步。上手较难,画面主要为大场景和抽象画面,不擅长人物和具象的物体
项目:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
使用参考:https://baijiahao.baidu.com/s?id=1742217322940045162
****************************************************
英文:DALL-E DALL-E-2
说明:OpenAI公司出的AI绘画项目 实现了更高分辨率和更低延迟,而且还包括了新的功能,可以对图像进行非常逼真的改动,即用嘴PS。但是需要提交资格审核才能参与
图中的狗由AI添加 很好的融合进图片
****************************************************
英文:Midjourney
官网:https://www.midjourney.com/
说明:Disco Diffusion的原作者Somnai所加入的AI艺术项目实验室 对 Disco Diffusion 进行了改进,平均1分钟能出图 目前是依托于discord(相当于微信QQ)聊天软件中的聊天机器人 初始免费20张图 后面以订阅的形式提供 分10美元档 和 30美元档
右上角的画廊里有大量公共作品
英文:Discord
官网:https://discord.com/
Disocrd上的Midjourney频道midjourney频道中newbies(新用户)房间里 midjourney机器人回复用户提示词的图片私聊(DM DirectMessage)Midjourney Bots机器人 /subscribe 进行订阅10美元1月200张图 30美元无限制
****************************************************
英文:colab
谷歌的平台 可以理解为云电脑 通过网页运行代码 需要挂载Google Drive来使用 免费的只有15G 而不需要在你自己的电脑上运行 一开始GPU资源也是免费的 可以用来对模型进行计算 现在可能只有CPU资源是免费的了
****************************************************
英文:naifu
说明:对stable-diffusion进行封装,目前据我解的只有整合包,界面风格和novelai(后文有解释)的界面很像,而novelai又和dream的界面很像,可调节的参数不如webui的
****************************************************
英文:stable-diffusion-webui 略写:webui (AUTO111)
项目链接:https://github.com/AUTOMATIC1111/stable-diffusion-webui
说明:其实不止一个webui版本对stable-diffusion进行了封装,但目前基本上只要提及webui都是指AUTOMATIC1111的这个版本 更新快
另一个webui链接:
https://colab.research.google.com/github/altryne/sd-webui-colab/blob/main/Stable_Diffusion_WebUi_Altryne.ipynb
****************************************************
英文:novelai
官网:http://novelai.net/
说明:原是AI辅助写小说的网站,为了给小说角色配图使用了stable-diffusion,训练了大量二次元图片后,扩展了通过图片生成可视化角色的功能,后来由于泄露了训练的模型包(俗称52G包 下载链接在下面),该模型包基于stable-diffusion的模型包。由于该模型生成二次元图片效果很不错,所以大量的文章提及如何仿novelai就是这个原因。
通过图片生成功能来可视化你喜欢的角色收费方式
泄露包的磁力链接:magnet:?xt=urn:btih:5bde442da86265b670a3e5ea3163afad2c6f8ecc&dn=novelaileak
****************************************************
英文:Danbooru
网址:https://danbooru.donmai.us/
说明:二次元图片网站,对图片有关键字标柱 前方高能 谨慎打开
Danbooru官网
****************************************************
英文:DeepDanbooru
项目链接:https://github.com/benbenmumu/DeepDanbooru
可以理解为stable-diffusion-webui的插件,增加生成图片带Tag的文本文件
****************************************************
英文:Waifu
说明:指Waifu模型 二次元生成模型 本质还是使用sd的模型 并进行了训练调整
链接:https://gist.github.com/harubaru
链接:https://github.com/harubaru/waifu-diffusion
链接:1-3版本https://gist.github.com/harubaru/f727cedacae336d1f7877c4bbe2196e1
目前是1-3版本 1-4进行中
4个最终模型的不同用途
训练过程:
模型下载:https://huggingface.co/hakurei/waifu-diffusion-v1-3
模型托管在huggingface上
1-4版本的目标:
****************************************************
英文:waifu2x
链接:http://waifu2x.udp.jp/
说明:日本的一个网站 使用卷积神经网络对动漫风格的图片进行放大操作(支持照片)。
本文档由网友提供,仅限参考学习,如有不妥或产生版权问题,请联系我们及时删除。
客服请加微信:skillupvip