首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· SD入门教程六:ControlNet基础入门
· 大语言模型的拐杖——RLHF基于人类反馈的强化学习
· 【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
· Stable Diffusion使用Roop插件一键换脸教程
· 10秒换脸,一张图片够了!SD Roop插件教程
· 九个让你成为GPT提示高手的提示词框架
· 大规模中文开源数据集发布!2TB、几十亿条可商用的中文数据集书生·万卷 1.0开源~中文大模型能力可能要更上一层楼了!
· AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动态提示词)
· 会“追问”的Agent,大模型知识库另类实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
诸公可知目前最牛逼的
TTS
免费开源项目是哪一个?
Bert-vits
语音
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
· 支持多个 ASR (自动演讲识别) 配方 · 支持类似于 ASR 配方一样的
TTS
(文本转声) · 支持 ST (Speech Translation
AudioCraft
音频
开源
网易有道强力开源中英双语语音克隆
8501:8501 syq163/emoti-voice:latest 现在打开浏览器,导航到 http://localhost:8501 ,就可以体验EmotiVoice强大的
TTS
语音
开源
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
STT livekit-plugins-elevenlabs
TTS
voice
agent
开源
音视频
语音
关于AI声音生成的一切(语音+音乐+嘴型)
audioldm2/ •Amphion:支持多种音频生成任务,包括文本到语音(
TTS
声音
开源
17K star!30秒偷走你的声音,开源声音克隆工具
使用 OpenVoice 项目组说体验OpenVoice最方便的方法是直接使用MyShell中免费的
TTS
和即时语音克隆服务.
OpenVoice
声音克隆
开源
【2023.10】看目前巨头的AI原生产品布局
【OA.2】ChatGPT Voice 按照OpenAI的说法,Voice能力只是简单地在ChatGPT模式上使用了语音识别和一个高质量的
TTS
。
大模型
产品
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
LiveKit 支持语音、视频和数据流处理,内置了自动语音识别(ASR)和文本转语音(
TTS
)功能,简化了语音到文本和文本到语音的转换过程。
GPT-4o
语音交互
智谱AI静悄悄的上线了一大波新模型,过年了,真的
可以标记,不过可惜的是声音能明显的感觉到是极低延时的
TTS
,在实时对话中是可以打断的。
智谱AI
大模型
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
对于图像-文本数据,作者将文本数据按1:3比例分割,使用文本转语音(
TTS
)技术将初始四分之一文本转换为音频描述。
Baichuan-Omni
多模态大模型
人工智能
2023年人工智能行业总结
而变声模型vits和文本转语音
TTS
的发展,也让GPT有了耳朵和嘴巴。
人工智能
AGI
思考总结
大模型
AI+智能客服:大模型可落地的最成熟场景之一
、激动、嫌弃、懊悔、羞愧、解恨、犹豫、思念、感动、敬佩、心慌、低落、骄傲、心虚、羡慕、辱骂 ) 阿里小蜜团队 (2)智能语音技术 智能语音技术包括语音识别(ASR)和语音合成(
TTS
ai
客服
<
1
2
>
1
2
4
5
6
7
8
9
100