文章列表-AI魔法学院

文章列表

一文带你看懂OpenAI-Sora生成视频的原理

举个例子，如果我们有一个补丁显示一个人正在跑步，模型会通过学习人类跑步的动态模式，来预测下一系列补丁中这个人的位置和姿态的变化。

视频生成 sora

阿里&字节发表VividTalk，只需单张照片即可根据音频生成栩栩如生的人物说话头像视频

，支持生成高质量的说话人视频，包括唇形同步、表情和头部姿态等特征。

VividTalk 视频

腾讯开源的数字人MuseTalk到底行不行？

MuseTaIk是由腾讯团队开发的先进技术，它是一个实时高质量的音频驱动唇部同步模型。

MuseTalk 数字人音频

一个完整Prompt让ChatGPT自动生成短视频制作脚本

———————— 把你想象成热门短视频脚本撰写的专家。

ChatGPT Prompt 视频

中学生也能看懂的Sora视频生成原理解读

具体到Sora的实现，这个过程开始于一段与目标视频同样时长、但是内容完全是随机噪声的视频。

视频生成 sora

Stability AI开源上新：3D生成引入视频扩散模型

也就是说，此番登场的SV3D首次将视频扩散模型应用到了3D生成领域。

sv3d 建模

Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰

无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视频还是视频制作，Wunjo AI 都能满足您的需求。

AI语音克隆实时语音识别

Stable Diffusion

Stable Diffusion AnimateDiff | 最火文本生成视频插件

AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型，通过大量短视频剪辑的训练，它能够调整图像生成过程，生成一系列与训练视频剪辑相似的图像。

动画视频 AnimateDiff

绝对是你的下载神器！AixDownloader可让你从任何网页下载你想要的内容，音乐、视频、图像、文件等！

看到网上有超赞的视频、音乐或图片，却无法轻松地保存到自己的电脑或手机上？

AixDownloader 下载

阿里出品自动化视频剪辑工具FunClip！

它依托于阿里巴巴通义实验室的FunASR Paraformer系列模型，实现了视频中语音的自动识别。

FunClip 视频阿里

京东开源普通话数字人JoyHallo，一口流利标准普通话还会讲英语

在音频驱动的视频生成领域，制作普通话视频面临着许多挑战。

JoyHallo 数字人开源模型

神奇的 OuteTTS - 0.1 - 350M：用几秒钟音频克隆声音的黑科技！

2、独特的音频处理三步法音频标记化（Audio tokenization）使用 WavTokenizer 对音频进行处理，每秒可处理 75 个标记

OuteTTS-0.1-350M 音频

开箱即用的图像增强、视频增强AI工具，Upscapl、Topaz Video AI

图像和视频领域使用较多的AI工具，免安装，无需会员，开箱即用！

图像增强视频增强

Stable Diffusion

【Stable Diffusion】高效率视频转AI动画！EbSynth插件全流程操作

最近小朋友开始学习跑酷，这段动画是我用他上课时候的一段练习视频制作的。

AI编程 EbSynth 动画

字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言

coqui-ai TTS实现跨语种、无需训练克隆语音的方法是基于Tacotron模型，该模型使用了一种音素输入表示来鼓励在不同语种之间共享模型容量。

coqui-ai TTS 语音

<123 4 5 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1