首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 你的下一个浏览器,可以是豆包电脑版!
· MCP服务介绍及应用场景报告-来自Manus
· DeepMusic发布“和弦派”2.0:重塑AI音乐创作范式,赋予创作者全方位掌控
· 【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
· Stable Diffusion | SD腾讯云3步部署,全程五分钟,附价格费用清单
· 提示词框架:BROKE
· AI写作:如何用AI一键提炼文章要点,10倍提效(含提示词)
· Suno音乐新手指南(手把手完整版教程)
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大
语
言模型应用中的
文
本
分块策略
分块的主要原因是确保我们向量化的内容的噪
音
尽可能少,并且具有
语
义相关性。
开源模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
TTS 的英
文
全名是 Text To Speech,中
文
译名是“
文
本
转
语
音
”。
声音克隆
教程
GLM-4-Voice 9B——实时多
语
言
语
音
对话 AI——几分钟内即可在
本
地安装
在
本
文
中,我们将探讨为什么GLM-4-Voice值得关注,它的独特之处,以及如何在
本
地设置和开始使用它。
GLM-4-Voice
9B
语音
安装
开源
网易(TTS)EmotiVoice:开源
语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的声
音
来朗读任何
文
本
,那该多好?
EmotiVoice
语音合成
字正腔圆,万国同
音
,coqui-ai TTS跨
语
种
语
音
克隆,钢铁侠讲16国
语
言
按照固有的思维方式,如果想要
语
音
克隆首先得有克隆对象具体的
语
言
语
音
样
本
,换句话说,克隆对象必须说过某一种
语
言的话才行,但现在,coqui-ai TTS V2.0版
本
做到了,真正的跨
语
种无需训练的
语
音
克隆技术
coqui-ai
TTS
语音
视频
Prompt | 抖
音
视频脚
本
复制脚
本
并访问 https://beta.elevenlabs.io/speech-synthesis 以生成
文
本
转
语
音
。
prompt
教程
用so-vits-svc-4.1进行
音
色
转
换的极简教程!
其实歌声
转
换不仅仅适用于歌声,普通讲话也可以,只是歌唱的
音
调基
本
能覆盖到低、中、高全域声
音
类型,而正常说话可能无法做到全域覆盖,但是如果在录制声
音
的时候能够做到覆盖多种
音
调类型,也可以实现声
音
转
换。
so-vits-svc
音色转换
教程
数字人
数字人之声
音
克隆:无样
本
,1分钟样
本
完美克隆声
音
,开源
零样
本
文
本
到
语
音
(TTS): 输入 5 秒的声
音
样
本
,即刻体验
文
本
到
语
音
转
换。
数字人
声音克隆
GPT-SoVITS
开源
阿里巴巴
语
音
实验室发布开源
语
音
处理框架ClearerVoice-Studio,支持
语
音
增强、分离、目标说话人提取
它集成了先进的
语
音
增强(Speech Enhancement)、
语
音
分离(Speech Separation)和
音
视频扬声器提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理
音
频
ClearerVoice-Studio
语音
大模型
“实时”
语
音
翻译!AI
语
音
具有“情绪”!最强开源AI大模型来了
你想把一段
语
音
转
成
文
字,或者把一段
文
字
转
成
语
音
,但是你不知道怎么操作!
大模型
开源模型
语音
语
义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样
本
策略的学术
文
献
语
义检索
语
义索引模型的目标是:给定输入
文
本
,模型可以从海量候选召回库中快速、准确地召回一批
语
义相关
文
本
。
开源模型
实时
语
音
克隆
项目简介 这份内容介绍了实时
语
音
克隆的技术实现,作者通过将说话者验证技术
转
移到多说话人
文
本
到
语
音
合成(SV2TTS)来实现
语
音
克隆。
语音
克隆
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时
转
录应用程序,使用 OpenAI Whisper 模型将
语
音
输入
转
换为
文
本
输出。
OpenAI
Whisper
大模型
开源
十大开源
语
音
识别项目
Automatic Speech Recognition(ASR)是一项自动
语
音
识别技术,其目标是通过计算机自动将人类口头
语
音
转
录为
文
本
。
语音识别
开源项目
语
音
克隆又又又又又升级了
之前在前面的
文
章中有介绍,克隆你的声
音
,只需要你三秒的录
音
,声
音
克隆又进化了!
Meta
语音生成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100