首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· Fooocus,webui,comfyui优缺点
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 2024!深入了解 大语言模型(LLM)微调方法(总结)
· YOO简历
· Midjourney AI绘画美女提示词分享三
· stable diffusion如何确保每张图的面部一致?
· Stable Diffusion使用Roop插件一键换脸教程
· AI换脸工具:facefusion使用心得
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
今天,介绍一个开源
创
新的虚拟人
视
频
生成框架:MuseV MuseV是由腾讯音乐娱乐的天琴实验室开源,MuseV专注于生成高质量的虚拟人
视
频
和口型同步,能够制
作
出具有高度一致性和自然表情的长
视
频
内容
MuseV
视频
数字人
框架
工具
动画制
作
工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转换为
视
频
。
AnimateDiff
视频
训练
阿里
阿里最近推出AI项目的动
作
太过
频
繁,脑子跟不上了,事出反常必有妖,盘点一下
阿里动
作
太过
频
繁,就我的脑海回忆,推出了挺多东西的,效果还都不错,今天盘点下都有哪些。
阿里
大模型
数字人
SadTalker数字人常见问题3
SadTalker数字人制
作
工具,用自带的图片音
频
可以生成,而用自己的图片、音
频
生成
视
频
就不行。
SadTalke
换脸
除了深度换脸、模拟配音,还能口型匹配的AI软件出现了
据海外媒体报道,上周一款名为LipDub 的翻译软件正式发布,这款AI程序可以让
视
频
创
作
者在几分钟内使用不同语言进行交流。
AI
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
人物动
作
视
频
生成框架Animate Anyone可基于单张图和动
作
序列,输出稳定、可控的人物动
作
视
频
;人物换装
视
频
生成框架Outfit Anyone是基于服饰图和人物形象;人物
视
频
角色替换框架Motionshop
通义
文生视频
AIGC
300天里,我帮你踩遍了AIGC
创
业的各种坑
似乎借助AI的力量,个体也能
创
造以往难以想象的
作
品:只要抄写提示词,剩下的事交给AI就行,人人都是超级个体,
创
业/赚外快近在咫尺。
AIGC
创业
数字人
AI虚拟主播数字人技术实现Wav2Lip
主要通过将两个不相关的人的
视
频
、音
频
,采用Wav2Lip技术,最终得到一个完整的
视
频
文件,且
视
频
的人物口型与音
频
内容一致。
数字人
视频
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
Sora也可以通过其他输入进行
创
作
,例如预先存在的图片或
视
频
。
视频生成
sora
Midjourney
[Midjourney]人物镜头拍摄
视
角大全
掌握常用的10种拍摄
视
角,教你绘画出好的人像。
视图
视角
构图
OpenAI
基于 OpenAI Whisper 模型的实时语音转文字工具
今天给大家分享一款专注于音
频
处理和
创
作
的开源软件【WhisperLive】 什么是 WhisperLive?
WhisperLive
音频
开源软件
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工
作
流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
前段时间,「霉霉大秀中文」的
视
频
在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似
视
频
。
语音
HeyGen
人工智能
【AI科技大
创
意】2024年人工智能10大趋势
此报告咨询了超过 40 家跨越 a16z 投资组合的合
作
伙伴,探讨他们认为会在 2024 年引领
创
新浪潮的重大理念。
人工智能
趋势
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音
频
生成开发框架
在过去的几年里,我们看到了AI在图像、
视
频
和文本生成方面的巨大进步。
开源模型
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100