文章列表-AI魔法学院

文章列表

动画制作工具AnimateDiff用法详解

AnimateDiff 使用Stable Diffusion模型将文本提示转换为视频。

AnimateDiff 视频训练

AI+音乐｜对话 Suno CEO：破圈的音乐生成产品是如何诞生的？

包括拥有哈佛物理学博士学位的Mikey Shulman在内的创始人都是音乐家，他们将Suno视为解决音乐听众与创作者之间数量不平衡的工具。

suno 音乐

RVC和SVC声音模型难找？推荐这个网站

本篇文章介绍：1，声音数据集训练到模型的过程 2 ，SVC和RVC声音模型网站推荐一、声音数据集训练到模型的过程 AI声音模型训练是通过分析大量音频数据来学习声音特性，生成与目标声音相似的新音频

声音克隆数字人

探索Sora的魔法世界：功能展示、原理解析、未来市场影响大猜想！

，即便通过视频扩展等手段，最多也只能生成十几秒的视频。

视频生成 sora

[Midjourney]人物镜头拍摄视角大全

掌握常用的10种拍摄视角，教你绘画出好的人像。

视图视角构图

whisper-live：OpenAI Whisper模型的近实时实现

它可用于转录来自麦克风的实时音频输入和预先录制的音频文件。

OpenAI Whisper 大模型

6个AI音乐软件推荐，让你学会人工智能AI作曲

这款AI音乐生成器支持为任何视频或游戏创作音乐，它还附带一个免版税的音乐生成器，以避免与授权有关的问题。

训练音乐

《嬛嬛朕emo啦》但马斯克！阿里这项技术开放试玩

选择喜欢的音频片段，并上传一张大头照。

音频阿里

两天star量破千：OpenAI的Whisper被蒸馏后，语音识别数倍加速

前段时间，「霉霉大秀中文」的视频在各个社交媒体走红，随后又出现了「郭德纲大秀英语」等类似视频。

语音 HeyGen

AI文本转语音工具（TTS）：MeloTTS

今天给大家介绍一个效果不错的开源文本转语音工具：MeloTTS MeloTTS是一个可以把文字转换成声音的工具，它支持英语、西班牙语、法语、中文、日语和韩语等多种语言。

MeloTTS 语音工具

阿里通义实验室薄列峰：从兵马俑跳“科目三”到照片唱歌，四大框架让AI生成的人物活起来丨GenAICon 2024

采用Video2Motion，基于视频人物动作驱动3D数字人；人物唱演视频生成框架Emote Portrait Alive能够基于单张图和音频，输出准确、生动的人物唱演视频。

通义文生视频

开源语音大语言模型来了！阿里基于Qwen-Chat提出Qwen-Audio!

使LLMs能够感知和理解丰富的音频信号以进行音频交互引起了广泛关注。

大模型语音

17K star！30秒偷走你的声音，开源声音克隆工具

OpenVoice 只需要来自目标说话者的简短音频样本即可准确复制其独特的声调和特征。

OpenVoice 声音克隆开源

基于 OpenAI Whisper 模型的实时语音转文字工具

今天给大家分享一款专注于音频处理和创作的开源软件【WhisperLive】什么是 WhisperLive？

WhisperLive 音频开源软件

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

音频克隆的开源项目很多，但是每次项目里要用的时候，总还是惦记着11labs的api。

F5-TTS 音频克隆

<...2 3 4 567 8 9 10 11 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1