首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 从第一性原理看大模型Agent技术
· ComfyUI官方使用手册【官网直译+关键补充】
· 芯片拼接技术:英伟达新核弹,站在苹果的肩膀上
· AI声音克隆 | 最全最简教程(权威版)
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 生成式AI与大语言模型的区别
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 深入解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
网易有道强力开源中英双语语音克隆
8501:8501 syq163/emoti-voice:latest 现在打开浏览器,导航到 http://localhost:8501 ,就可以体验EmotiVoice强大的
TTS
语音
开源
开源
17K star!30秒偷走你的声音,开源声音克隆工具
使用 OpenVoice 项目组说体验OpenVoice最方便的方法是直接使用MyShell中免费的
TTS
和即时语音克隆服务.
OpenVoice
声音克隆
开源
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
STT livekit-plugins-elevenlabs
TTS
voice
agent
开源
音视频
开源
开源版GPT-4o语音来袭,Mini-Omni开启实时语音对话
功能特点 ✅ 实时语音对话功能,无需额外的ASR或
TTS
模型。
Mini-Omni
语音
开源
语音
关于AI声音生成的一切(语音+音乐+嘴型)
audioldm2/ •Amphion:支持多种音频生成任务,包括文本到语音(
TTS
声音
【2023.10】看目前巨头的AI原生产品布局
【OA.2】ChatGPT Voice 按照OpenAI的说法,Voice能力只是简单地在ChatGPT模式上使用了语音识别和一个高质量的
TTS
。
大模型
产品
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
LiveKit 支持语音、视频和数据流处理,内置了自动语音识别(ASR)和文本转语音(
TTS
)功能,简化了语音到文本和文本到语音的转换过程。
GPT-4o
语音交互
智谱AI静悄悄的上线了一大波新模型,过年了,真的
可以标记,不过可惜的是声音能明显的感觉到是极低延时的
TTS
,在实时对话中是可以打断的。
智谱AI
大模型
人工智能
2023年人工智能行业总结
而变声模型vits和文本转语音
TTS
的发展,也让GPT有了耳朵和嘴巴。
人工智能
AGI
思考总结
大模型
AI+智能客服:大模型可落地的最成熟场景之一
、激动、嫌弃、懊悔、羞愧、解恨、犹豫、思念、感动、敬佩、心慌、低落、骄傲、心虚、羡慕、辱骂 ) 阿里小蜜团队 (2)智能语音技术 智能语音技术包括语音识别(ASR)和语音合成(
TTS
ai
客服
<
1
2
>
1
2
4
5
6
7
8
9
100