首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
数字人:从科幻走向现实的技术革命
它们不仅为我们带来了前所未有的娱
乐
体验,还在教育、医疗、社交等多个领域展现出了广阔的应用前景。
数字人
语音
开源
【语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
包含两个核心模型:SenseVoice 负责语
音
识别和
音
频处理,CosyVoice 负责语
音
生成和控制。
asr
tts
声音
大模型
我为什么不看好大模型行业
展望未来总是宏大而
乐
观的,这一篇则恰恰相反。
大模型
视频
AI视频新技能!这套流程教你打造视频人物和声
音
完美同步!
但目前的AI视频尚未解决视频和
音
频结合的问题,让人物的嘴与
音
频完美同步仍然具有挑战性。
AI视频
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语
音
克隆工具!
其核心功能是通过提供发言者的短
音
频片段(参考语
音
),实现声
音
的高效克隆。
tts
文本转语音
GLM-4-Voice 9B——实时多语言语
音
对话 AI——几分钟内即可在本地安装
如何设置 GLM-4-Voice 9B 以实现无缝的实时语
音
交互,支持英语和中文,并探索其独特的架构、低延迟响应和可定制的声
音
属性。
GLM-4-Voice
9B
语音
安装
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
语
音
语义表示编解码器:将语
音
转换为语义标记。
MaskGCT
声音克隆
ComfyUI
【ComfyUI】爽玩必备,6大插件汇总推荐 !
工欲善其事必先利其器,今天来给大家介绍6款ComfyUI中必备的插件,有了它们,你才能真正的享受到连连看的快
乐
!
comfyui
文生图
ComfyUI
【ComfyUI】爽玩必备!6大插件汇总推荐
工欲善其事必先利其器,今天来给大家介绍6款ComfyUI中必备的插件,有了它们,你才能真正的享受到连连看的快
乐
!
大模型
大模型
使用大模型自动回复小红书/抖
音
/快手评论:通过RAG 优化LLMs实现
在这里需要重点说明:我们在做搜索的过程中面临的所有技术难点, 在RAG中都会碰到,搜索相关的内容也可以参见: 在高德吃喝玩
乐
!
RAG
大模型
自动回复
生成式AI与大语言模型的区别
生成式人工智能可以被定义为专注于创建具有生成原创内容能力的模型,例如图像、
音
乐
或文本。
生成式AI
大语言模型
区别
视频
图文生成短视频的方法
画框和箭头指向的
音
频,需要删除,替换成自己声
音
,或用视频文案生成一段
音
频,导入剪映中~ 一键生成的字幕朗读,个人觉得不是很好,所有这里推荐一款软件:掌上配
音
app。
视频
ChatGPT
Github
8月份最火的 5 个 GitHub 项目
一个开源的
音
乐
软件 3.
下载
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在
音
频驱动的视频生成领域,制作普通话视频面临着许多挑战。
JoyHallo
数字人
开源模型
开源
6个最佳开源TTS引擎
· 它带有两个合成器:eSpeakinG合成器,通过声
音
添加技术转换元
音
和响亮的辅
音
,以完成声
音
。
TTS引擎
开源模型
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100