首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
网易(TTS)EmotiVoice:开源语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的
声
音
来朗读任何文本,那该多好?
EmotiVoice
语音合成
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
详见 语
音
克
隆
最佳实践指南[https://docs.fish.audio/text-to-speech/voice-clone-best-practices]。
Fish
Speech
本地搭建
工具
AI文本转语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成
声
音
的工具,它支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
MeloTTS
语音工具
大模型
中国大模型融资暗战:罗曼蒂
克
的快速消亡
多位接近闫俊杰的人士表示,“闫俊杰是典型的技术宅,说话
声
音
小,可能并不擅长对外”,所以平时公司对外融资、以及一些管理、外部活动也通常由贠烨祎负责。
大模型
暗战
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
创始团队 Mikey Shulman:担任首席执行官,他曾担任Kensho的机器学习主管,麻省理工学院斯
隆
管理学院的讲师,哥伦比亚大学应用物理专业的学士学位和哈佛大学物理学专业的博士学位;
suno
音乐
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
根据官网介绍,TSAC可达到非常低的比特率,例如44.1 kHz采样率下的码率可以达到单
声
道 5.5 kb/s 或立体
声
7.5 kb/s,具有良好的感知质量。
TSAC
音频工具
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
只需提供一段
音
频和一个视频,PersonaTalk便能精准同步人物的口型,不仅让
声
音
和嘴型无缝贴合,还能保留视频中人物的表情和个性化说话风格,仿佛原生发
声
一般自然流畅。
PersonaTalk
视频
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频驱动唇部同步模型。
MuseTalk
数字人
音频
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
它可用于转录来自麦
克
风的实时
音
频输入和预先录制的
音
频文件。
OpenAI
Whisper
大模型
对于AI,我们现阶段可以有的态度
但这不妨碍我们现在开始尝试着接触他,了解他,至少在有一定认知后,不至于出现最近的那条“AI换脸、
声
音
克
隆
后,被诈骗400多万元”新闻那样的事情发生。
文生图
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置语速、添加停顿词、口头语、笑
声
!!
torch.tensor(np.concatenate(wavs,axis=-1)) Audio(finally_wavs, rate=24_000, autoplay=True) 效果展示: 男
声
音
展示
chattts
tts
文生语音
RAG
24年首篇离奇论文:加点噪
声
,RAG效果翻倍?!
· 研究结果发现相关文档比无关文档更有害于RAG系统,并且当放置正确时,无关但噪
声
的文档实际上有助于提高系统的准确性。
RAG
检索
论文
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
/Win11/Mac/Ubuntu)上安装配置Python3.10开发环境 v3u.cn/a_id_200 so-vits-svc安装 在你自定义的目录下使用Git命令
克
隆
项目
音乐
AI绘画:InstantID Win11本地安装记录!
Windows11+Conda+git 1.
克
隆
代码 打开CMD工具,通过CD命令进入到指定目录,然后
克
隆
代码。
InstantID
Win11
安装
工具
惊艳推荐!8款好用又免费的文本转语
音
TTS工具
在早期,TTS技术主要依赖于预录制的
声
音
样本,通过组合这些样本来生成语
音
。
TTS
Maker
语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100