首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
字节跳动最近推出了一款名为PersonaTalk的AI模型,这项黑科技让
视
频
配
音
彻底摆脱了传统的“僵硬感”。
PersonaTalk
视频
开源
【开源项目】Flow Matching 语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
动画
animate
sd
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法!
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
文本生成视频
AnimateDiff
工具
再次重点介绍!!!这款国内的AI制作
视
频
工具
之前介绍过一款图片生成
视
频
的工具-Flow Photo,99%的人不知道的一款国内的AI制作
视
频
工具。
Flow
Photo
视频
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类
视
频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类
视
频
生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MagicPose
视频
教程
用AI做郭德纲说英文相声的爆款
视
频
(详细教程)
郭德纲用英文说相声的短
视
频
火爆全网,单条
视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把
视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
关于AI声
音
生成的一切(语
音
+
音
乐+嘴型)
2D/3D/
视
频
生成最近都有很多值得关注的工具,但是要输出完整的AIGC作品,肯定少不了声
音
。
声音
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
“
视
频
版ControlNet”来了!
ControlNet
开源
有感情的语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语
音
生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语
音
和
视
频
介绍等应用。
ChatTTS
语音合成
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
不管是唱歌
视
频
,还是讲话
视
频
,只要提供一张肖像照片,外加一段
音
频
,算法就会自动生成一段口型完全能对上、画面生动的
视
频
出来。
EMO
阿里
全民演唱
Roop参数说明,ROOP->StyleGAN演示!
因为这个
视
频
刚好有很多张脸,然后又是多角度60帧4K的动态
视
频
,所以我觉得非常适合拿来测试ROOP。
视频
StyleGAN
Sora
OpenAI Sora
视
频
生成模型技术报告中英全文+总结+影响分析
ensp;Sora发布的潜在影响 ▎C端 / 对于普通人 •这或许是独立创作者最好的年代,Sora发布之后,文案、
音
效
sora
openai
视频生成
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、
视
频
,还可在端侧部署
总参数量 8B,单图、多图和
视
频
理解性能超越了 GPT-4V。
minicpm
面壁
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频
往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声
音
不是他发出来的,以至于大家看对口型
视
频
的时候,会有一种割裂感。
Loopy
视频
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100