首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
· 技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
· 图文生成短视频的方法
· 免费的文本生成视频解决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· SD好复杂,是不是很糊,一文搞懂Stable Diffusion的各种模型及用户操作界面
· 国产视频制作之光-可灵:提示词大全整理
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 它来了!SDXL + ControlNet 终于强强联合!
· 完全指南——使用python提取PDF中的文本信息(包括表格和图片OCR)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
一文带你看懂OpenAI-Sora生成
视
频
的原理
举个例子,如果我们有一个补丁显示一个人正在跑
步
,模型会通过学习人类跑
步
的动态模式,来预测下一系列补丁中这个人的位置和姿态的变化。
视频生成
sora
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频
生成栩栩如生的人物说话头像
视
频
,支持生成高质量的说话人
视
频
,包括唇形
同
步
、表情和头部姿态等特征。
VividTalk
视频
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频
驱动唇部
同
步
模型。
MuseTalk
数字人
音频
ChatGPT
一个完整Prompt让ChatGPT自动生成短
视
频
制作脚本
———————— 把你想象成热门短
视
频
脚本撰写的专家。
ChatGPT
Prompt
视频
Sora
中学生也能看懂的Sora
视
频
生成原理解读
具体到Sora的实现,这个过程开始于一段与目标
视
频
同
样时长、但是内容完全是随机噪声的
视
频
。
视频生成
sora
开源
Stability AI开源上新:3D生成引入
视
频
扩散模型
也就是说,此番登场的SV3D首次将
视
频
扩散模型应用到了3D生成领域。
sv3d
建模
换脸
Wunjo AI: 合成和克隆英语/俄语/中文语
音
,实时语
音
识别,深度换脸和唇动合成,通过文本提示更改
视
频
,分割和修饰
无论您是钻研语
音
合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散
视
频
还是
视
频
制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成
视
频
插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短
视
频
剪辑的训练,它能够调整图像生成过程,生成一系列与训练
视
频
剪辑相似的图像。
动画
视频
AnimateDiff
下载
绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,
音
乐、
视
频
、图像、文件等!
看到网上有超赞的
视
频
、
音
乐或图片,却无法轻松地保存到自己的电脑或手机上?
AixDownloader
下载
阿里
阿里出品自动化
视
频
剪辑工具FunClip!
它依托于阿里巴巴通义实验室的FunASR Paraformer系列模型,实现了
视
频
中语
音
的自动识别。
FunClip
视频
阿里
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在
音
频
驱动的
视
频
生成领域,制作普通话
视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频
克隆声
音
的黑科技!
2、独特的
音
频
处理三
步
法
音
频
标记化(Audio tokenization) 使用 WavTokenizer 对
音
频
进行处理,每秒可处理 75 个标记
OuteTTS-0.1-350M
音频
工具
开箱即用的图像增强、
视
频
增强AI工具,Upscapl、Topaz Video AI
图像和
视
频
领域使用较多的AI工具,免安装,无需会员,开箱即用!
图像增强
视频增强
Stable Diffusion
【Stable Diffusion】高效率
视
频
转AI动画!EbSynth插件全流程操作
最近小朋友开始学习跑酷,这段动画是我用他上课时候的一段练习
视
频
制作的。
AI编程
EbSynth
动画
字正腔圆,万国
同
音
,coqui-ai TTS跨语种语
音
克隆,钢铁侠讲16国语言
coqui-ai TTS实现跨语种、无需训练克隆语
音
的方法是基于Tacotron模型,该模型使用了一种
音
素输入表示来鼓励在不
同
语种之间共享模型容量。
coqui-ai
TTS
语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100