首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 30 多年前被 Windows、Linux “灭掉”的操作系统 MS-DOS 4.0,微软在 GitHub 上开源了!
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 剪映专业版智能补帧
· Fooocus,webui,comfyui优缺点
· TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
· 第3期 SDXL和SD的10大区别!你知道几个?
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· MCP服务介绍及应用场景报告-来自Manus
· Stable Diffusion WebUI v1.8.0重大更新!
· 开源大语言模型完整列表
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
clone-voice:一键克隆声
音
,开源
AI
技术让声
音
创作更便捷、更个性化
声码器的作用是将模型生成的语
音
特征还原为可听的声
音
信号,通过这一步骤,最终生成与原始声
音
高度相似的克隆语
音
,实现声
音
克隆的效果。
clone-voice
声音克隆
字正腔圆,万国同
音
,coqui-
ai
TTS跨语种语
音
克隆,钢铁侠讲16国语言
按照固有的思维方式,如果想要语
音
克隆首先得有克隆对象具体的语言语
音
样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-
ai
TTS V2.0版本做到了,真正的跨语种无需训练的语
音
克隆技术
coqui-ai
TTS
语音
教程
AI
声
音
克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为语
音
的技术,通过TTS技术,计算机可以将文字信息转换成人类可听懂的语
音
输出,实现语
音
合成的功能 目前市场上的
AI
声
音
我们最多用的还是普通的
声音克隆
教程
开源
网易(TTS)EmotiVoice:开源语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的声
音
来朗读任何文本,那该多好?
EmotiVoice
语音合成
剪映克隆声
音
功能详解:剪映上线5秒“
AI
克隆
音
色”,一堆
AI
公司又要进入慢性死亡了...
我慌的是:
AI
声
音
这个赛道的创业者。
剪映
声音克隆
懒人福
音
!用
AI
生成会议纪要,让你的工作更高效!
下面我会把已经在用的流程和经验分享给大家,包括语
音
转文本工具的用法,
AI
总结会议的提示词等等。
会议纪要
AI工具
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字化时代,文本转语
音
(TTS)技术的应用愈发广泛,从智能语
音
助手到有声读物,从无障碍服务到教育娱
乐
领域,都离不开高质量的语
音
合成。
OuteTTS-0.1-350M
音频
数字人
一款构建
AI
数字人项目开源了!自动实现
音
视频同步!
1、Video-Tetalking Video-ReTalking 是一个利用
AI
实现视频人物嘴型与输入的声
音
同步的创新技术。
AI数字人
音视频同步
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
现在的
AI
发展越来越快,生成一段语
音
不是难事,那如果生成的是你自己的声
音
?
OpenVoice
声音克隆
开源
视频
栩栩如生,
音
色克隆,Bert-vits2文字转语
音
打造鬼畜视频实践
语
音
素材和模型 首先我们需要渣渣辉和刘青云的原版
音
频素材,原版《扫毒》素材可以参考:https://www.bilibili.com/video/BV1R64y1F7SQ/。
Bert-vits
语音
换脸
除了深度换脸、模拟配
音
,还能口型匹配的
AI
软件出现了
Captions:利用
AI
轻松实现视频翻译本地化 Captions以制作
AI
生成的字幕、语
音
纠正以及在后期制作中纠正视频创作者眼球位置的技术而闻名。
AI
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的
AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
视频
Wunjo
AI
: 合成和克隆英语/俄语/中文语
音
,实时语
音
识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
无论您是钻研语
音
合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视频还是视频制作,Wunjo
AI
都能满足您的需求。
AI语音克隆
实时语音识别
Google
AI
“同声传译”新进展!Google发布,无监督,语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的语
音
转换为文本的技术,然而,目前的语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
开源
通过声
音
生成逼真的全身形象?!Meta开源
AI
工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据
音
频生成逼真的人物视频!
audio2photoreal
开源工具
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100