首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语
音
克隆又又又又又升级了
之前在前面的文章中有介绍,克隆你的
声
音
,只需要你三秒的录
音
,
声
音
克隆又进化了!
Meta
语音生成
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
01 前言 近日,香港中文大学(深圳)联手趣丸科技推出了新一代大规模
声
音
克隆TTS模型——MaskGCT。
MaskGCT
声音克隆
开源
开源语
音
大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
作为一种重要模态,语
音
提供了超越文本的多样且复杂的信号,如人
声
中的情感、语调和意图,自然
声
音
中的火车汽笛、钟
声
和雷
声
,以及
音
乐中的旋律。
大模型
语音
教程
郭德纲讲英语相
声
详细教程
郭德纲用英文说相
声
的短视频火爆全网,同类型的AI短视频层出不穷,更有好莱坞明星说中文的短视频,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短视频吧!
数字人
音视频
开源
【语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
情感识别:SenseVoice 提供最先进的情感识别能力(例如高兴、悲伤、生气等),能够检测
音
频中的特定事件,如
音
乐、掌
声
和笑
声
等。
asr
tts
声音
OpenAI
【语
音
识别】OpenAI语
音
力作Whisper
首先,通过特征提取器将原始
音
频输入变换为对数梅尔
声
谱图 (log-Mel spectrogram)。
语音转文字
whisper
RAG
24年首篇离奇论文:加点噪
声
,RAG效果翻倍?
· 研究结果发现相关文档比无关文档更有害于RAG系统,并且当放置正确时,无关但噪
声
的文档实际上有助于提高系统的准确性。
RAG
检索增强
开源
网易(TTS)EmotiVoice:开源语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的
声
音
来朗读任何文本,那该多好?
EmotiVoice
语音合成
工具
AI文本转语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成
声
音
的工具,它支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
MeloTTS
语音工具
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
与主要关注器乐作品的传统工具不同,Suno的独特之处在于它能够创作包含歌词和人
声
的完整歌曲。
suno
音乐
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
根据官网介绍,TSAC可达到非常低的比特率,例如44.1 kHz采样率下的码率可以达到单
声
道 5.5 kb/s 或立体
声
7.5 kb/s,具有良好的感知质量。
TSAC
音频工具
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
只需提供一段
音
频和一个视频,PersonaTalk便能精准同步人物的口型,不仅让
声
音
和嘴型无缝贴合,还能保留视频中人物的表情和个性化说话风格,仿佛原生发
声
一般自然流畅。
PersonaTalk
视频
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频驱动唇部同步模型。
MuseTalk
数字人
音频
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置语速、添加停顿词、口头语、笑
声
!!
torch.tensor(np.concatenate(wavs,axis=-1)) Audio(finally_wavs, rate=24_000, autoplay=True) 效果展示: 男
声
音
展示
chattts
tts
文生语音
RAG
24年首篇离奇论文:加点噪
声
,RAG效果翻倍?!
· 研究结果发现相关文档比无关文档更有害于RAG系统,并且当放置正确时,无关但噪
声
的文档实际上有助于提高系统的准确性。
RAG
检索
论文
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100