首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· Coze多智能体(Multi-Agents)模式体验!
· 一键AI换脸!小红书和北大合作的InstantID
· 【AI绘画】入门英文名词解析
· 让你每次都随机生成各种图片,开盲盒的感觉:SD插件之无限抽卡神器Dynamic Prompts
· ComfyUI官方使用手册【官网直译+关键补充】
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
· 【AI代理】扣子,开始探索多代理模式
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Midjourney
[Midjourney]人物镜头拍摄
视
角大全
掌握常用的10种拍摄
视
角,教你绘画出好的人像。
视图
视角
构图
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让
AI
生成的人物活起来丨GenAICon 2024
四大框架玩转
AI
人物
视
频
生成,已落地通义千问APP。
通义
文生视频
AI
绘画Stable-Diffusion风格化实战
在社交软件和短
视
频
平台上,我们时常能看到各种特色鲜明的
视
觉效果,比如卡通化的图片和中国风的
视
频
剪辑。
Stable-Diffusion
文生图
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程图
音视频
Flow
Matching
换脸
AI
换脸——Deepfacelab 下载与安装,新手教程
AI
换脸越来越火,换脸的
视
频
到处都是,那种还是那种的都有。
Deepfacelab
换脸
在 WebUI 中使用 AnimateDiff 的一些问题和技巧
这两天晚上没事的时候就会尝试下AnimateDiff,发现这真的让
视
频
生成上了一个大台阶,估计是到了
AI
视
频
爆发的前夜了。
AnimateDiff
SD
开源
从声纹模型到语音合成:音
频
处理
AI
技术前沿 | 开源专题 No.45
它包含了两个最先进的
AI
生成模型 (AudioGen 和 MusicGen) 的推理和训练代码,可以产生高质量音
频
。
AudioCraft
音频
工具
FFmpeg之父新作——音
频
压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的
AI
语音编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
阿里
阿里最近推出
AI
项目的动作太过
频
繁,脑子跟不上了,事出反常必有妖,盘点一下
· I2VGen-XL, 阿里推出的图像到
视
频
生成模型,也就是图生成
视
频
又新增了一个
AI
工具,之前常用的效果好的有
阿里
大模型
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片音
频
可以生成,而用自己的图片、音
频
生成
视
频
就不行。
SadTalke
Sora
Sora物理悖谬的几何解释
这里笔者依据现代数学特别是整体微分几何领域的一些观点来解释目前Sora技术路线中的缺陷,希望能够抛砖引玉,为广大
AI
研究和工程人员拓宽思路,共同促进提高。
Sora
解释
AI
资讯速递 - 快人一步!为你填平
AI
领域信息差及时揭示
AI
领域的最新动态
AI
能够制作
视
频
吗?
AI资讯
AI新闻
Stable Diffusion
Stable Diffusion 快速创作角色三
视
图
天分享分享如何通过 Stable Diffusion 快速创造出角色三
视
图。
SD
三视图
文生图
ChatGPT
ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记
对于大模型prompt的设计,近期斯坦福吴恩达伙同OpenAl出了一套
视
频
教程(B站地址:https://www.bilibili.com/video/BV1AT41187qt?
prompt
大模型
开源
有感情的语音合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和
视
频
介绍等应用。
ChatTTS
语音合成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100