首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stability AI推出
视
频
生成模型Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的
视
频
生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成
视
频
Video
视频创作
SD
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的
音
频
生成开发框架
在过去的几年里,我们看到了AI在图像、
视
频
和文本生成方面的巨大进步。
开源模型
提示词
国产
视
频
制作之光-可灵:提示词大全整理
🍎图生
视
频
建议一次一个词,如托腮,抬头。
可灵
kling
视频
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、
视
频
融合语
音
(这里的核心都是人物口型与
音
频
中的语
音
唇形同步)。
数字人
视频
开源
从声纹模型到语
音
合成:
音
频
处理 AI 技术前沿 | 开源专题 No.45
facebookresearch/audiocraft[1] Stars: 16.6k License: MIT AudioCraft 是一个用于
音
频
生成的
AudioCraft
音频
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将文本变换成语
音
的AI工具。
TTS
文本转语音
ComfyUI
免费的文本生成
视
频
解决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
AnimateDiff 是一个基于 Stable Diffusion 模型的文本生成
视
频
插件,它通过控制模块影响图像生成过程,使得生成的图像序列具有与训练
视
频
剪辑相似的特征。
视频生成
文生视频
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在
音
频
驱动的
视
频
生成领域,制作普通话
视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
VividTalk:用一张照片和一段
音
频
让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段
音
频
结合起来,创造出仿佛真人在说话的
视
频
的技术。
VividTalk
视频
Sora
OpenAI
视
频
模型Sora的推理生成成本多高?
由于 Diffusion 模型训练 text to video 需要高质量的标注
视
频
,因此我们可以估计 Sora 训练的
视
频
量级为 1亿 分钟 左右。
Sora
推理
算力
大模型
中国首个长时长、高一致性、高动态性
视
频
大模型,Vidu 登场
今日,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性
视
频
大模型——「Vidu」。
Vidu
大模型
视频
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和
视
频
焕发新生!
上传一段
视
频
,AI 自动识别
视
频
中的运动主体人物,并一键替换成有趣的 3D 角色模型,生成与众不同的 AI
视
频
。
阿里云
视频
音频
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片
音
频
可以生成,而用自己的图片、
音
频
生成
视
频
就不行。
SadTalke
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短
视
频
火爆全网,同类型的AI短
视
频
层出不穷,更有好莱坞明星说中文的短
视
频
,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短
视
频
吧!
数字人
音视频
开源
【开源项目】Flow Matching 语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100