首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
SDXL
它来了!SDXL + ControlNet 终于强强联
合
!
就好比当我们想要一张“鲲鲲山水图”的时候,会发现很难通过
语
言来描述这样的景象。
SDXL
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将文本变换
成
语
音
的AI工具。
TTS
文本转语音
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
ChatGPT
ChatGPT提示工程5篇
合
集 - 吴恩达和OpenAI出品
吴恩达和OpenAI
合
作开发了一套针对ChatGPT提示工程的最佳实践课程,课程名为《ChatGPT Prompt Engineering for Developers》。
ChatGPT
prompt
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
而未来的研究重点则可能是发展LLM的自我学习和自我改进能力,使其能够更独立地理解和生
成
语
言,而不是仅仅依赖于人类输入的数据。
大语音模型
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
该项目各模块之间耦
合
度非常低,包括声
音
来源、
语
音
识别、情绪分析、NLP处理、情绪
语
音
合
成
、
语
音
输出和表情动作输出等模块。
Fay
开源项目
数字人
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
语
义到声学模型同样采用非自回归掩码生
成
Transformer,该模型以
语
义标记为条件,生
成
多层声学标记序列以重建高质量
语
音
波形。
MaskGCT
声音克隆
VividTalk:用一张照片和一段
音
频让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段
音
频结
合
起来,创造出仿佛真人在说话的视频的技术。
VividTalk
视频
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时转录应用程序,使用 OpenAI Whisper 模型将
语
音
输入转换为文本输出。
OpenAI
Whisper
大模型
ChatGPT
ChatGPT提示工程5篇
合
集(一):ChatGPT提示工程的两个关键原则 - 吴恩达和OpenAI
合
作(珍藏版)
不久前,吴恩达和OpenAI
合
作开发了一套针对ChatGPT提示工程的最佳实践课程,课程名为《ChatGPT Prompt Engineering for Developers》。
prompt
提示词
大模型
大模型与游戏结
合
的一个思路
,甚至可以是
语
音
,就好像面对你的部下或通过电话直接下达命令。
人工智能
游戏
Sora
Sora相关论文
合
集---全32套大放送
附件是Sora相关论文
合
集,一共32套大放送,同时附上阅读这些论文相关的提示词,包括翻译、论文分析、文档阅读等。
Sora
论文
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本文本到
语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验文本到
语
音
转换。
数字人
声音克隆
GPT-SoVITS
大模型
AI Agent:大模型与场景间的价值之桥,但不适
合
当纯技术看
这部分其实很适
合
大模型内置。
大模型
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
二、技术原理剖析 clone-voice的核心技术基于深度学习模型,特别是WaveNet和Tacotron系列模型,这些模型在
语
音
合
成
领域有着出色的表现.
clone-voice
声音克隆
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100