首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· AI声音克隆 | 最全最简教程(权威版)
· ComfyUI官方使用手册【官网直译+关键补充】
· Coze多智能体(Multi-Agents)模式体验!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了
· 从第一性原理看大模型Agent技术
· 精通百种语言的翻译AI来了!Meta推出,免费、开源!
· 6个最佳开源TTS引擎
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片
音
频可以生成,而用自己的图片、
音
频生成视频就不行。
SadTalke
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的
音
频生成开发框架
音
乐
可能是最具挑战性的
音
频类型,因为它由局部和长程模式组成,从一系列
音
符到具有多种
乐
器的全局
音
乐
结构。
开源模型
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合语
音
(这里的核心都是人物口型与
音
频中的语
音
唇形同步)。
数字人
视频
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频驱动唇部同步模型。
MuseTalk
数字人
音频
Google
AI“同声传译”新进展!Google发布,无监督,语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的语
音
转换为文本的技术,然而,目前的语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
开源
通过声
音
生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据
音
频生成逼真的人物视频!
audio2photoreal
开源工具
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频生成栩栩如生的人物说话头像视频
它通过先进的
音
频到3D网格映射技术和网格到视频的转换技术,实现了高质量、逼真的
音
频驱动的说话头像视频生成。
VividTalk
视频
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
用GPT4创建一部连环画故事
今天的故事主题是戒掉电子产品,享受户外活动的
乐
趣。
GPT4
连环画故事书
「语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI技术的浪潮中,一款新型的语
音
识别模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。
Distil-Whisper
语音识别
Prompt
Claude 官方提示词,中文版(含API Prompt)
刚刚 Claude 官方发布了提示词模板 涵盖了工作和娱
乐
的各个方面 共 63 组,英文 我复刻了一套,中文版 由本大聪明倾心产出 请享用 顺道说一下
prompt
写作
开源
6个最佳开源TTS引擎
· 它带有两个合成器:eSpeakinG合成器,通过声
音
添加技术转换元
音
和响亮的辅
音
,以完成声
音
。
TTS引擎
开源模型
大模型
我为什么不看好大模型行业
展望未来总是宏大而
乐
观的,这一篇则恰恰相反。
大模型
开源
【语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
包含两个核心模型:SenseVoice 负责语
音
识别和
音
频处理,CosyVoice 负责语
音
生成和控制。
asr
tts
声音
视频
AI视频新技能!这套流程教你打造视频人物和声
音
完美同步!
但目前的AI视频尚未解决视频和
音
频结合的问题,让人物的嘴与
音
频完美同步仍然具有挑战性。
AI视频
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100