文章列表-AI魔法学院

文章列表

AI换脸：FaceFusion 3.5.0更新，解决老版本无法使用问题！

:使用来自 ddcolor 和 deoldify 的先进模型，为黑白或低色彩素材添加色彩。

FaceFusion 文生图

DeepMusic发布“和弦派”2.0：重塑AI音乐创作范式，赋予创作者全方位掌控

4月29日，国内领先的人工智能音乐服务商DeepMusic，发布了自主研发的AI音乐工作站——“和弦派”2.0正式版。

和弦派 DeepMusic 音乐创作

将文本转化为3D动画：DeepMotion推出MotionGPT，开启动画新时代！

这是一款基于生成式AI的工具，可以将文本提示无缝转换为复杂的3D动画，简化了动画创作过程，同时也超越了物理障碍，使得更多不同类型的创作者和行业可以使用3D动画。

3D 动作捕捉

字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言

按照固有的思维方式，如果想要语音克隆首先得有克隆对象具体的语言语音样本，换句话说，克隆对象必须说过某一种语言的话才行，但现在，coqui-ai TTS V2.0版本做到了，真正的跨语种无需训练的语音克隆技术

coqui-ai TTS 语音

实时语音克隆

项目简介这份内容介绍了实时语音克隆的技术实现，作者通过将说话者验证技术转移到多说话人文本到语音合成（SV2TTS）来实现语音克隆。

语音克隆

数字人之声音克隆：无样本，1分钟样本完美克隆声音，开源

零样本文本到语音（TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。

数字人声音克隆 GPT-SoVITS

Roop升级版FaceFusion换脸AI技术使用以及部署教程

一、介绍：前些日子比较火的换脸AI技术是Roop，但是Roop已经停止更新了，好像是因为团队成员用这个东西搞颜色吧。

FaceFusion 教程

clone-voice：一键克隆声音，开源AI技术让声音创作更便捷、更个性化

其具体的技术流程主要包括以下几个关键步骤： 1、数据预处理：首先，对输入的音频文件进行采样率转换和分帧等预处理操作。

clone-voice 声音克隆

FaceSwapLab，截止2023年8月最好用的一键换脸工具

几周前，我介绍了基于stable diffsion的一个换脸插件：roop（这个插件也有独立版，功能更多，甚至可以给视频换脸）。

一键换脸

动画制作工具AnimateDiff用法详解

AnimateDiff 使用Stable Diffusion模型将文本提示转换为视频。

AnimateDiff 视频训练

为什么大佬都在说Agent是未来？换个角度来谈一谈

这和我们在抖音或者小红书上看到了内容攻略没有本质区别，其核心差异在于内容制造的效率和质量。

Agent 大模型

十大开源语音识别项目

Automatic Speech Recognition（ASR）是一项自动语音识别技术，其目标是通过计算机自动将人类口头语音转录为文本。

语音识别开源项目

OpenAI大动作：Whisper large-v3重塑语音识别技术

这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步，而且还将很快在OpenAI的API中得到支持。

Whisper 语音识别

Suno音乐新手指南（手把手完整版教程）

为方便更多音乐爱好者使用AI创作音乐，中国AIGC产业联盟（AIGCxChina）发起了Suno爱好者社群并编写了以下指南。

suno 歌曲教程

Stable Diffusion

Stable Diffusion教程：采样器

简单点说，前向扩散是将图片转换为数据模型，而后向扩散是从数据模型生成图片。

画图 SD 采样器

<...2 3 4 567 8 9 10 11 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1