首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
读取大脑重建高清
视
频
,Stable Diffusion还能这么用
但以往的研究都主要聚焦在重建静态图像,而以高清
视
频
形式来展现的工作还是较为有限。
stablediffusion
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类
视
频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类
视
频
生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MagicPose
视频
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
动画
animate
sd
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法!
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
文本生成视频
AnimateDiff
工具
再次重点介绍!!!这款国内的AI制作
视
频
工具
之前介绍过一款图片生成
视
频
的工具-Flow Photo,99%的人不知道的一款国内的AI制作
视
频
工具。
Flow
Photo
视频
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
字节跳动最近推出了一款名为PersonaTalk的AI模型,这项黑科技让
视
频
配
音
彻底摆脱了传统的“僵硬感”。
PersonaTalk
视频
教程
用AI做郭德纲说英文相声的爆款
视
频
(详细教程)
郭德纲用英文说相声的短
视
频
火爆全网,单条
视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把
视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
“
视
频
版ControlNet”来了!
ControlNet
关于AI声
音
生成的一切(语
音
+
音
乐+嘴型)
2D/3D/
视
频
生成最近都有很多值得关注的工具,但是要输出完整的AIGC作品,肯定少不了声
音
。
声音
开源
有感情的语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语
音
生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语
音
和
视
频
介绍等应用。
ChatTTS
语音合成
Roop参数说明,ROOP->StyleGAN演示!
因为这个
视
频
刚好有很多张脸,然后又是多角度60帧4K的动态
视
频
,所以我觉得非常适合拿来测试ROOP。
视频
StyleGAN
Sora
OpenAI Sora
视
频
生成模型技术报告中英全文+总结+影响分析
ensp;Sora发布的潜在影响 ▎C端 / 对于普通人 •这或许是独立创作者最好的年代,Sora发布之后,文案、
音
效
sora
openai
视频生成
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
不管是唱歌
视
频
,还是讲话
视
频
,只要提供一张肖像照片,外加一段
音
频
,算法就会自动生成一段口型完全能对上、画面生动的
视
频
出来。
EMO
阿里
全民演唱
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、
视
频
,还可在端侧部署
总参数量 8B,单图、多图和
视
频
理解性能超越了 GPT-4V。
minicpm
面壁
开源
阿里巴巴语
音
实验室发布开源语
音
处理框架ClearerVoice-Studio,支持语
音
增强、分离、目标说话人提取
.01 概述 在日常生活和工作中,你是否常因嘈杂的环境、重叠的对话或
音
视
频
信号的混杂而感到沟通困难?
ClearerVoice-Studio
语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100