首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· ComfyUI官方使用手册【官网直译+关键补充】
· “大模型+机器人”的现状和未来,重磅综述报告来了!
· 长窗口大战要终结了?谷歌魔改Transformer,推出了“无限注意力”
· Stable Diffusion 30种采样器全解!
· 教会AI画汉字(ComfyUI篇)
· 腾讯出品!开源AI数字人框架!号称可以不限时长
· GPU 性能(数据表)快速参考
· WeChatpy:Python中优秀的微信开发库,与微信官方接口交互的工具
· Suno音乐新手指南(手把手完整版教程)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
硬核解读Stable Diffusion(系列一)
latent空间,然后用扩散模型来生成图
像
的latents,最后送入autoencoder的decoder模块就可以得到生成的图
像
。
StableDiffusion
文生图
造梦师手记:C站最受欢迎的LoRA竟然是... ...
适用于SDXL的LoRA中,在C站排名第一的,是一个
像
素LoRA。
SDXL
文生图
换脸
AI换脸工具:facefusion使用心得
frame_enhancer: 提升整个帧的图
像
质量。
FaceFusion
文生图
大模型
七问大模型幻觉|LLM Hallucination
Enhanced Language Models for Open-Ended Text Generation》 在这种方法中,作者认为,采样的“随机性”在用于生成句子的后半部分时,对事实性的损害比在句子的开
头
更大
大模型
大模型
详解大模型RLHF过程(配代码解读)
第二部分开
头
我们说过,共涉及actor model, ref_model,reward model和critic model这四个模型,其实更新参数的模型只有actor model和critic model
训练
大模型
阿里云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
Qwen-VL是支持中英文等多种语言的视觉语言(Vision Language,VL)模型,相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图
像
中文字理解等能力
大模型
换脸
一键AI换脸!小红书和北大合作的InstantID
这个模块通过解耦的交叉注意力机制,使得图
像
和文本能够独立地影响生成过程,从而在保持身份信息的同时,允许用户对图
像
风格进行精细控制,实现「双赢」。
InstantID
文生图
如何用大语言模型构建一个知识问答系统
这里提供一个 python 库textract[12],支持从多种类型文件中提取文字信息,普通文本文件自不必说,其它各种常用格式文件也都支持,比如:Microsoft 全家桶 docx, xlsx;图
像
知识库
ComfyUI
ComfyUI学习笔记2,一文看透Workflow
上图,从最左边加载模型开始,经过中间的CLIP Text Encode对关键词Prompt做处理,加入一个初始的Latent Image,然后是采样器,VAE解码,最后得到生成的图
像
。
comfyui
文生图
ChatGPT
麦肯锡专家都在用的方法:用ChatGPT速览用户研究领域的 50 个核心概念
这个过程就
像
在绘制现实生活中的同理心地图。
用户
工作
新模型Cascade你真的用对了吗?!
而Stable Cascade 的压缩系数为 42,这意味着可以将 1024x1024 图
像
,在潜空间的编码为 24x24,这样就可以使用更小的潜空间尺寸,并且实现清晰的图
像
输出。
Stable
Cascade
模型
大模型
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
从几万字到几十万字,
头
部创业公司都在抢滩「长窗口」 如果你关注大模型在文本理解方向的应用,或许会注意到一个现象:一开始,大家用来测评模型能力的文本可能都是一些财报、技术报告,这些文本通常有十几页到几十页不等
Baichuan2
百川
开源
ComfyUI
ComfyUI | 这么入门就顺了,硬入疼的是自己
基础工作流五核心板块(大模型、VAE、提示词、参数采样设置和生图窗口) 本人是三维软件爱好者,
像
OC渲染器这种节点连节点的看多了,看Comfy界面自带好感,但是直接看内容逻辑就有点卡眼睛,于是就从熟悉的
生成式AI
Stable Diffusion
Stable Diffusion 和 Midjourney的优劣势比较,如何选择?
Stable Diffusion是2022年发布的深度学习文本到图
像
生成模型,它是一种潜在扩散模型,它由创业公司Stability AI与多个学术研究者和非营利组织合作开发。
文生图
换脸
全新换脸工具ReActor,比roop更强!
「Swap in source image」代表在源图
像
中进行替换,相当于替换存在的图片中的脸部,可以在图生图中使用。
ReActor
SD
文生图
<
...
37
38
39
40
41
42
43
44
45
46
...
>
1
2
4
5
6
7
8
9
100