文章列表-AI魔法学院

文章列表

Prompt | 抖音视频脚本

这个prompt可帮助您为 TikTok 视频生成极具吸引力的脚本。

prompt

语音、视频转文字神器：开源whisper介绍

OpenAI的Whisper是一种基于深度学习的语音识别模型，它是一种通用的语音识别模型，可以用于语音识别、语音翻译和语言识别等任务。

人工智能大模型 wisper

AI视频新技能！这套流程教你打造视频人物和声音完美同步！

这个视频中人物的身体姿势、头发、头部姿势、面部表情都在发生运动，看了上面的视频后，群里一位朋友问如何实现视频中的人物口型与音频的完美同步，以及当前可行的方法。

AI视频

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践

本次让我们基于Bert-vits2项目来克隆渣渣辉和刘青云的声音，打造一款时下热搜榜一的“青岛啤酒”鬼畜视频。

Bert-vits 语音

一款构建AI数字人项目开源了！自动实现音视频同步！

本周GitHub项目圈选: 主要包含音视频同步、多代理框架、3D对象模型、适用于开发者的演示文档构建工具、网页程序打包、自构建CRUD应用等热点项目。

AI数字人音视频同步

图文生成短视频的方法

这还需要从我接触到视频号说起，当时，很多人告诉我，做视频号，是一个红利期。

视频 ChatGPT

GPT-4o实时语音方案提供商Livekit开源voice agent：轻松处理音视频流

轻松访问 LiveKit WebRTC 会话并处理或生成音频、视频和数据流。

voice agent 开源音视频

Stable Diffusion

Stable Diffusion AnimateDiff | 最火文本生成视频插件库

AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型，通过大量短视频剪辑的训练，它能够调整图像生成过程，生成一系列与训练视频剪辑相似的图像。

动画视频 AnimateDiff

解读OpenAI Sora文生视频技术原理

OpenAI Sora文生视频（图像看作单帧视频）一放出就炸翻整个AI 圈，也是ChatGPT掀起GenAI热潮时隔一年后，OpenAI再次史诗级的更新。

sora

视频大模型训练相关词条解释

Sora是OpenAI公司发布的一款AI视频生成模型。

视频生成 sora 词条

炸裂！百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本

在音频输入完成后，相应的特征被输入到MLLM进行推理，从而便于处理音频和视频输入。

Baichuan-Omni 多模态大模型

FFmpeg之父新作——音频压缩工具 TSAC

前两天FFmpeg作者Fabrice Bellard在个人主页发布了一款音频压缩工具TSAC。

TSAC 音频工具

一文带你看懂OpenAI-Sora生成视频的原理

那么，视频压缩网络究竟是如何做到的呢？

视频生成 sora

阿里&字节发表VividTalk，只需单张照片即可根据音频生成栩栩如生的人物说话头像视频

它通过先进的音频到3D网格映射技术和网格到视频的转换技术，实现了高质量、逼真的音频驱动的说话头像视频生成。

VividTalk 视频

一个完整Prompt让ChatGPT自动生成短视频制作脚本

———————— 把你想象成热门短视频脚本撰写的专家。

ChatGPT Prompt 视频

<12 3 4 5 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1