首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· Coze多智能体(Multi-Agents)模式体验!
· 一键AI换脸!小红书和北大合作的InstantID
· 【AI绘画】入门英文名词解析
· 让你每次都随机生成各种图片,开盲盒的感觉:SD插件之无限抽卡神器Dynamic Prompts
· ComfyUI官方使用手册【官网直译+关键补充】
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
· 【AI代理】扣子,开始探索多代理模式
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
字正腔圆,万国同
音
,coqui-
ai
TTS跨语种语
音
克隆,钢铁侠讲16国语言
按照固有的思维方式,如果想要语
音
克隆首先得有克隆对象具体的语言语
音
样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-
ai
TTS V2.0版本做到了,真正的跨语种无需训练的语
音
克隆技术
coqui-ai
TTS
语音
教程
AI
声
音
克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为语
音
的技术,通过TTS技术,计算机可以将文字信息转换成人类可听懂的语
音
输出,实现语
音
合成的功能 目前市场上的
AI
声
音
我们最多用的还是普通的
声音克隆
教程
开源
网易(TTS)EmotiVoice:开源语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的声
音
来朗读任何文本,那该多好?
EmotiVoice
语音合成
懒人福
音
!用
AI
生成会议纪要,让你的工作更高效!
下面我会把已经在用的流程和经验分享给大家,包括语
音
转文本工具的用法,
AI
总结会议的提示词等等。
会议纪要
AI工具
剪映克隆声
音
功能详解:剪映上线5秒“
AI
克隆
音
色”,一堆
AI
公司又要进入慢性死亡了...
我慌的是:
AI
声
音
这个赛道的创业者。
剪映
声音克隆
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
现在的
AI
发展越来越快,生成一段语
音
不是难事,那如果生成的是你自己的声
音
?
OpenVoice
声音克隆
开源
开源
开源版GPT-4o语
音
来袭,Mini-Omni开启实时语
音
对话
如今,一个甚至更加强大的实时语
音
对话
AI
模型开源了!
Mini-Omni
语音
开源
换脸
除了深度换脸、模拟配
音
,还能口型匹配的
AI
软件出现了
Captions:利用
AI
轻松实现视频翻译本地化 Captions以制作
AI
生成的字幕、语
音
纠正以及在后期制作中纠正视频创作者眼球位置的技术而闻名。
AI
视频
栩栩如生,
音
色克隆,Bert-vits2文字转语
音
打造鬼畜视频实践
语
音
素材和模型 首先我们需要渣渣辉和刘青云的原版
音
频素材,原版《扫毒》素材可以参考:https://www.bilibili.com/video/BV1R64y1F7SQ/。
Bert-vits
语音
数字人
一款构建
AI
数字人项目开源了!自动实现
音
视频同步!
1、Video-Tetalking Video-ReTalking 是一个利用
AI
实现视频人物嘴型与输入的声
音
同步的创新技术。
AI数字人
音视频同步
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本文本到语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验文本到语
音
转换。
数字人
声音克隆
GPT-SoVITS
开源
十大开源语
音
识别项目
这项技术在多个领域有着广泛的应用,包括但不限于语
音
助手、语
音
搜索、自动转写以及语
音
命令识别。
语音识别
开源项目
Google
AI
“同声传译”新进展!Google发布,无监督,语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的语
音
转换为文本的技术,然而,目前的语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
开源
通过声
音
生成逼真的全身形象?!Meta开源
AI
工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据
音
频生成逼真的人物视频!
audio2photoreal
开源工具
视频
Wunjo
AI
: 合成和克隆英语/俄语/中文语
音
,实时语
音
识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
无论您是钻研语
音
合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视频还是视频制作,Wunjo
AI
都能满足您的需求。
AI语音克隆
实时语音识别
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100