首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频生成栩栩如生的人物说话头像视频
它通过先进的
音
频到3D网格映射技术和网格到视频的转换技术,实现了高质量、逼真的
音
频驱动的说话头像视频生成。
VividTalk
视频
Prompt
Claude 官方提示词,中文版(含API Prompt)
刚刚 Claude 官方发布了提示词模板 涵盖了工作和娱
乐
的各个方面 共 63 组,英文 我复刻了一套,中文版 由本大聪明倾心产出 请享用 顺道说一下
prompt
写作
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合语
音
(这里的核心都是人物口型与
音
频中的语
音
唇形同步)。
数字人
视频
开源
【语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
包含两个核心模型:SenseVoice 负责语
音
识别和
音
频处理,CosyVoice 负责语
音
生成和控制。
asr
tts
声音
数字人
数字人:从科幻走向现实的技术革命
它们不仅为我们带来了前所未有的娱
乐
体验,还在教育、医疗、社交等多个领域展现出了广阔的应用前景。
数字人
语音
视频
AI视频新技能!这套流程教你打造视频人物和声
音
完美同步!
但目前的AI视频尚未解决视频和
音
频结合的问题,让人物的嘴与
音
频完美同步仍然具有挑战性。
AI视频
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语
音
克隆工具!
其核心功能是通过提供发言者的短
音
频片段(参考语
音
),实现声
音
的高效克隆。
tts
文本转语音
GLM-4-Voice 9B——实时多语言语
音
对话 AI——几分钟内即可在本地安装
如何设置 GLM-4-Voice 9B 以实现无缝的实时语
音
交互,支持英语和中文,并探索其独特的架构、低延迟响应和可定制的声
音
属性。
GLM-4-Voice
9B
语音
安装
大模型
使用大模型自动回复小红书/抖
音
/快手评论:通过RAG 优化LLMs实现
在这里需要重点说明:我们在做搜索的过程中面临的所有技术难点, 在RAG中都会碰到,搜索相关的内容也可以参见: 在高德吃喝玩
乐
!
RAG
大模型
自动回复
ComfyUI
【ComfyUI】爽玩必备,6大插件汇总推荐 !
工欲善其事必先利其器,今天来给大家介绍6款ComfyUI中必备的插件,有了它们,你才能真正的享受到连连看的快
乐
!
comfyui
文生图
ComfyUI
【ComfyUI】爽玩必备!6大插件汇总推荐
工欲善其事必先利其器,今天来给大家介绍6款ComfyUI中必备的插件,有了它们,你才能真正的享受到连连看的快
乐
!
大模型
生成式AI与大语言模型的区别
生成式人工智能可以被定义为专注于创建具有生成原创内容能力的模型,例如图像、
音
乐
或文本。
生成式AI
大语言模型
区别
视频
图文生成短视频的方法
画框和箭头指向的
音
频,需要删除,替换成自己声
音
,或用视频文案生成一段
音
频,导入剪映中~ 一键生成的字幕朗读,个人觉得不是很好,所有这里推荐一款软件:掌上配
音
app。
视频
ChatGPT
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
语
音
语义表示编解码器:将语
音
转换为语义标记。
MaskGCT
声音克隆
大模型
我为什么不看好大模型行业
展望未来总是宏大而
乐
观的,这一篇则恰恰相反。
大模型
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100