首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· SD入门教程六:ControlNet基础入门
· 大语言模型的拐杖——RLHF基于人类反馈的强化学习
· 【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
· Stable Diffusion使用Roop插件一键换脸教程
· 10秒换脸,一张图片够了!SD Roop插件教程
· 九个让你成为GPT提示高手的提示词框架
· 大规模中文开源数据集发布!2TB、几十亿条可商用的中文数据集书生·万卷 1.0开源~中文大模型能力可能要更上一层楼了!
· AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动态提示词)
· 会“追问”的Agent,大模型知识库另类实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生
成
(RAG)技术,对行业来说意味着什么?
这个想法是使用预先训练的
语
言模型 (LM) 来生
成
文本,但使用单独的检索系统来查找相关文档来调节
语
言模型。
检索增强生成
大语音模型
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI
语
音
克隆工具!
而 OpenVoice 作为一款强大的多
语
言即时
语
音
克隆AI工具,可以为用户提供高效、个性化的
语
音
克隆服务,是一款值得推荐的项目。
tts
文本转语音
数字人
数字人:从科幻走向现实的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合
成
以及人工智能算法等。
数字人
语音
ComfyUI
AA大佬新作:ComfyUI整
合
包,打造极简解决方案
ComfyUI整
合
包的介绍: AA发布的ComfyUI整
合
包是一个预装了大量节点的版本,它不仅简化了安装过程,还提供了一个启动器,用于完
成
节点的更新和安装。
comfyui
文生图
工作流程
混
合
专家模型 (MoE) 详解
这些研究的融
合
促进了在自然
语
言处理 (NLP) 领域对混
合
专家模型的探索。
MoE大模型
歪理大集
合
,谁也跑不了
一边发文一边很是写了一点“歪理邪说”,有读者说因为自定义的话
语
体系,逻辑抽象读起来费劲,所以先简单梳理下。
大模型
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的
语
音
合
成
,同时支持多说话人。
chattts
tts
文生语音
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
该项目各模块之间耦
合
度非常低,包括声
音
来源、
语
音
识别、情绪分析、NLP处理、情绪
语
音
合
成
、
语
音
输出和表情动作输出等模块。
Fay
开源项目
数字人
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本文本到
语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验文本到
语
音
转换。
数字人
声音克隆
GPT-SoVITS
ChatGPT
ChatGPT提示工程5篇
合
集 - 吴恩达和OpenAI出品
吴恩达和OpenAI
合
作开发了一套针对ChatGPT提示工程的最佳实践课程,课程名为《ChatGPT Prompt Engineering for Developers》。
ChatGPT
prompt
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
核心模型二:
语
音
合
成
模型CosyVoice介绍 CosyVoice 是一个
语
音
生
成
模型,能够
合
成
自然声
音
,适用于多种应用。
asr
tts
声音
VividTalk:用一张照片和一段
音
频让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段
音
频结
合
起来,创造出仿佛真人在说话的视频的技术。
VividTalk
视频
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时转录应用程序,使用 OpenAI Whisper 模型将
语
音
输入转换为文本输出。
OpenAI
Whisper
大模型
SDXL
它来了!SDXL + ControlNet 终于强强联
合
!
就好比当我们想要一张“鲲鲲山水图”的时候,会发现很难通过
语
言来描述这样的景象。
SDXL
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100