首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 必看!阿里通义千问完整技术报告
· MCP服务介绍及应用场景报告-来自Manus
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 实测:本地跑llama3:70B需要什么配置
· SD插件|EasyPhoto|妙鸭相机平替|美颜算法
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion教程:提示词
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 爆火的“女孩的一生”,plus版教程它来了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视
频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类视
频
生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MagicPose
视频
Stable Diffusion
读取大脑重建高清视
频
,Stable Diffusion还能这么用
但以往的研究都主要聚焦在重建静态图像,而以高清视
频
形式来展现的工作还是较为有限。
stablediffusion
阿里
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
现在登
录
通义App(原通义千问),选择全民演唱功能,只需上传任意一张人物正面大头照,你也能玩儿了。
音频
阿里
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成视
频
的方法
它通过各种短视
频
剪辑进行训练。
动画
animate
sd
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成视
频
的方法!
它通过各种短视
频
剪辑进行训练。
文本生成视频
AnimateDiff
工具
再次重点介绍!!!这款国内的AI制作视
频
工具
之前介绍过一款图片生成视
频
的工具-Flow Photo,99%的人不知道的一款国内的AI制作视
频
工具。
Flow
Photo
视频
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视
频
流
轻松访问 LiveKit WebRTC 会话并处理或生成音
频
、视
频
和数据流。
voice
agent
开源
音视频
开源
爆火「视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
比如输入“Chinese ink painting”,风景纪
录
片能秒变国风水墨大作。
ControlNet
教程
用AI做郭德纲说英文相声的爆款视
频
(详细教程)
郭德纲用英文说相声的短视
频
火爆全网,单条视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音
频
克隆声音的黑科技!
2、独特的音
频
处理三步法 音
频
标记化(Audio tokenization) 使用 WavTokenizer 对音
频
进行处理,每秒可处理 75 个标记
OuteTTS-0.1-350M
音频
Sora
OpenAI Sora视
频
生成模型技术报告中英全文+总结+影响分析
•目前当红的短视
频
推荐的形态可能会发生改变——从系统根据用户喜好推荐短视
频
,变成针对性生成短视
频
?
sora
openai
视频生成
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、视
频
,还可在端侧部署
总参数量 8B,单图、多图和视
频
理解性能超越了 GPT-4V。
minicpm
面壁
语音
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视
频
实践
本次让我们基于Bert-vits2项目来克隆渣渣辉和刘青云的声音,打造一款时下热搜榜一的“青岛啤酒”鬼畜视
频
。
Bert-vits
语音
Roop参数说明,ROOP->StyleGAN演示!
因为这个视
频
刚好有很多张脸,然后又是多角度60帧4K的动态视
频
,所以我觉得非常适合拿来测试ROOP。
视频
StyleGAN
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音
频
生成开发框架
在过去的几年里,我们看到了AI在图像、视
频
和文本生成方面的巨大进步。
开源模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100