首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· GitHub上很火的RPA框架:一款用于验收测试和 RPA 的通用自动化框架robotframework
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· AI声音克隆 | 最全最简教程(权威版)
· Stable Diffusion|提示词高阶用法(二)双人同图
· DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好
· 80多个罕见的论文prompt,让你起飞!
· 14.4K Star,一款漂亮、快速、现代化的开源免费UI组件库
· 达摩院SPACE对话大模型:知识注入与知识利用
· 大模型微调应用实践,没那么简单,看看曾经踩过的坑
· 【ComfyUI】爽玩必备,6大插件汇总推荐 !
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
爆火「
视
频版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
(ControlNet实现了根据提示词精准控制
图
像元素改变,如人物动作、
图
像结构等) 根据给到的提示词,它仅改变
视
频的画风,而且是针对完整
视
频。
ControlNet
大模型
OCR终结了?旷
视
提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
背后原理 目前的多模态大模型几乎都是用 CLIP 作为 Vision Encoder 或者说
视
觉词表。
OCR
手写
文字识别
Stable Diffusion
stable diffusion 远端跑
图
—— Api基础知识掌握
如果你想用手机或者电脑访问自己的服务器进行stable diffusion(以下简称sd)跑
图
,学会使用sd的api是必须的技能 上个月做了安卓和苹果手机用远端sd进行跑
图
的几个demo,整体流程很简单
文生图
api
ComfyUI
使用python调用comfyui-api,实现出
图
自由
使用python调用comfyui-api,实现出
图
自由 1.
comfyui
工作流
Stable Diffusion
【Stable Diffusion】SD迎来动画革命,AnimateDiff快速出
图
参数可以按照正常出
图
的思路设置,尺寸512x512,根据电脑配置量力而行。
文生图
开源模型
Stable Diffusion
AnimateDiff:一篇文章教你学会用Stable Diffusion制作GIF动
图
这是一个AnimateDiff介绍教程,这个工具可让您使用Stable Diffusion创建令人惊叹的 GIF 动画,这是目前为止最好的文本生成
视
频(Text-to-video)人工智能工具之一。
AnimateDiff
视频
训练
DALL-E 3 不只是文生
图
!10 个案例颠覆认知
你只需要告诉 DALL-E 3 你的想法,并让它把想法可
视
化即可。
DALL-E
3
文生图
大模型
图
解大模型训练之:张量模型并行(TP),Megatron-LM
则每次forward的过程如下: 为画
图
方便,
图
中所绘是b=1时的情况。
开源模型
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
这款软件以其独特的优势和无限的可能性,为艺术家、设计师乃至广大创意爱好者提供了前所未有的
视
觉表达工具。
SD
视频课程
AI绘画
Sora
OpenAI Sora
视
频生成模型技术报告中英全文+总结+影响分析
我们利用了一种在
视
频和
图
像潜码的时空块上操作的变压器架构。
sora
openai
视频生成
Sora
通俗易懂地解释OpenAI Sora
视
频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
另外值得一提的是,OpenAI Sora模型还可以直接生成
图
片,也就是说,它是一个以
视
频生成为核心的多能力模型。
sora
视频生成
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
你就感觉,像在看电
视
剧。
sora
视频生成
ComfyUI
SD的老舅ComfyUI来了,节点式工作流,分部控制出
图
方便大家看,我把板块调整为竖版,有一定SD基础的同学可以看到这其实就是SD的界面板块打散: ComfyUI有以下特点: 优点: 1.上限高,更适合复杂长线的大型工作 2模块化工作流 3.可
视
化
文生图
comfyui
提示词
好看的
图
片不知道怎么写提示词?用AI读出来
所谓反推,就是能够根据
图
片,倒推出这张
图
片的提示词。
文生图
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像
视
频
简介 一次性音频驱动的说话头生成旨在通过音频作为输入信号来驱动任意面部
图
像,并具有广泛的应用场景,如虚拟化身、
视
觉配音和
视
频会议。
VividTalk
视频
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100