首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
通过约70万小时的多
语
种数据训练,实现了接近人类水平的
语
音
合
成
效果,目前已更新到1.4版本。
Fish
Speech
本地搭建
Ollama 与 Dify:AI 应用开发的强强联
合
介绍 随着大型
语
言模型(LLM)的快速发展,它们为 AI 应用开发提供了强大的功能和灵活性。
Ollama
Dify
大型语言模型
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
现在的AI发展越来越快,生
成
一段
语
音
不是难事,那如果生
成
的是你自己的声
音
?
OpenVoice
声音克隆
开源
数字人
数字人:从科幻走向现实的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合
成
以及人工智能算法等。
数字人
语音
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字化时代,文本转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合
成
。
OuteTTS-0.1-350M
音频
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI
语
音
克隆工具!
而 OpenVoice 作为一款强大的多
语
言即时
语
音
克隆AI工具,可以为用户提供高效、个性化的
语
音
克隆服务,是一款值得推荐的项目。
tts
文本转语音
混
合
专家模型 (MoE) 详解
这些研究的融
合
促进了在自然
语
言处理 (NLP) 领域对混
合
专家模型的探索。
MoE大模型
ComfyUI
AA大佬新作:ComfyUI整
合
包,打造极简解决方案
ComfyUI整
合
包的介绍: AA发布的ComfyUI整
合
包是一个预装了大量节点的版本,它不仅简化了安装过程,还提供了一个启动器,用于完
成
节点的更新和安装。
comfyui
文生图
工作流程
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频生
成
栩栩如生的人物说话头像视频
只需提供一张人物的静态照片和一段
语
音
录
音
,VividTalk即可制作出一个看起来像是实际说话的人物的视频。
VividTalk
视频
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生
成
(RAG)技术,对行业来说意味着什么?
这个想法是使用预先训练的
语
言模型 (LM) 来生
成
文本,但使用单独的检索系统来查找相关文档来调节
语
言模型。
检索增强生成
大语音模型
歪理大集
合
,谁也跑不了
一边发文一边很是写了一点“歪理邪说”,有读者说因为自定义的话
语
体系,逻辑抽象读起来费劲,所以先简单梳理下。
大模型
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的
语
音
合
成
,同时支持多说话人。
chattts
tts
文生语音
SDXL
它来了!SDXL + ControlNet 终于强强联
合
!
就好比当我们想要一张“鲲鲲山水图”的时候,会发现很难通过
语
言来描述这样的景象。
SDXL
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
核心模型二:
语
音
合
成
模型CosyVoice介绍 CosyVoice 是一个
语
音
生
成
模型,能够
合
成
自然声
音
,适用于多种应用。
asr
tts
声音
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100