首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 解读 | SuperCLUE 2023年9月全面测评大模型四大能力
· 超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
· ComfyUI 基础教程(一)环境部署和插件安装
· 火山写作
· 深入浅出人工智能常用技术,让你轻松掌握AI应用核心!
· 耗时7天,终于把15种ControlNet模型搞明白了
· 绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,音乐、视频、图像、文件等!
· 大模型训练工程那些事
· 教会AI画汉字(ComfyUI篇)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
读取大脑重建高清
视
频
,Stable Diffusion还能这么用
但以往的研究都主要聚焦在重建静态图像,而以高清
视
频
形式来展现的工作还是较为有限。
stablediffusion
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类
视
频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类
视
频
生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MagicPose
视频
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
动画
animate
sd
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法!
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
文本生成视频
AnimateDiff
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频
流
轻松访问 LiveKit WebRTC 会话并处理或生成音
频
、
视
频
和数据流。
voice
agent
开源
音视频
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
“
视
频
版ControlNet”来了!
ControlNet
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/
视
频
/音
频
/文本
在
视
频
对齐领域,作者从开源和内部来源获取
视
频
数据。
Baichuan-Omni
多模态大模型
Roop参数说明,ROOP->StyleGAN演示!
首先,简单说一下,
视
频
的原素材全部由
AI
生成!
视频
StyleGAN
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音
频
生成栩栩如生的人物说话头像
视
频
它通过先进的音
频
到3D网格映射技术和网格到
视
频
的转换技术,实现了高质量、逼真的音
频
驱动的说话头像
视
频
生成。
VividTalk
视频
Sora
OpenAI Sora
视
频
生成模型技术报告中英全文+总结+影响分析
AI
生成的可用工具都已齐备,一个人可以无痛carry一个短片,好故事将价值千金,有才华的人更难被埋没。
sora
openai
视频生成
人工智能
AI
产品经理
视
角:如何构建人工智能产品
虽然它们都提供了令人兴奋的研究
视
角,但现实生活中的产品需要将数据、模型和人机交互结合到一个连贯的系统中。
大模型
产品经理
语音
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜
视
频
实践
本次让我们基于Bert-vits2项目来克隆渣渣辉和刘青云的声音,打造一款时下热搜榜一的“青岛啤酒”鬼畜
视
频
。
Bert-vits
语音
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、
视
频
,还可在端侧部署
总参数量 8B,单图、多图和
视
频
理解性能超越了 GPT-4V。
minicpm
面壁
换脸
Wunjo
AI
: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改
视
频
,分割和修饰
无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散
视
频
还是
视
频
制作,Wunjo
AI
都能满足您的需求。
AI语音克隆
实时语音识别
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短
视
频
火爆全网,同类型的
AI
短
视
频
层出不穷,更有好莱坞明星说中文的短
视
频
,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的
AI
短
视
频
吧!
数字人
音视频
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100