首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 必看!阿里通义千问完整技术报告
· MCP服务介绍及应用场景报告-来自Manus
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 实测:本地跑llama3:70B需要什么配置
· SD插件|EasyPhoto|妙鸭相机平替|美颜算法
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion教程:提示词
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 爆火的“女孩的一生”,plus版教程它来了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
Sora懂不懂物理世界?
Sora的基本原理 Sora的训练集为短视
频
集,每个样本是一个短视
频
,Sora将其编码到数据空间进行降维,然后在隐空间中将特征向量切割成补丁,加上时间顺序,构成时空补丁,亦即时空令牌(time-space
文生视频
视频生成
sora
AI音乐热潮下,“神曲工作室”率先失业
“普通人肯定记不住你今天刷了多少视
频
,听到了多少BGM。
音乐
音频
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片音
频
可以生成,而用自己的图片、音
频
生成视
频
就不行。
SadTalke
Agent
聊聊我对AI Agents技术的一些看法
最近这几个月,Agent 这一概念可谓火出天际,从 AutoGPT 一周 6 万 star 刷新 Github 涨星速度记
录
开始,AI Agent 项目如雨后春笋开始在各大技术平台涌现。
AI
Agents
大模型
LLM
ChatPDF | LLM文档对话 | pdf解析关键问题
在此记
录
一些难题和解决方案,首先讲解主要思想,其次以问题+回答的形式展开。
大模型
工具
TTS,一个奇妙的AI工具
在自媒体盛行的今天,很多人尝试制作视
频
发到自媒体平台上,通过获得流量的方式实现直接或间接变现。
TTS
文本转语音
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短视
频
火爆全网,同类型的AI短视
频
层出不穷,更有好莱坞明星说中文的短视
频
,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短视
频
吧!
数字人
音视频
教程
爆火的“女孩的一生”,plus版教程它来了
嘿,动画和视
频
制作的小伙伴们,今天我们来聊聊怎样用animatediff和LCM(Lower Complexity Model)来制作超炫酷的视
频
。
动画
视频
AnimateDiff
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转换为视
频
。
AnimateDiff
视频
训练
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的音
频
驱动唇部同步模型。
MuseTalk
数字人
音频
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
不管是唱歌视
频
,还是讲话视
频
,只要提供一张肖像照片,外加一段音
频
,算法就会自动生成一段口型完全能对上、画面生动的视
频
出来。
EMO
阿里
全民演唱
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
,即便通过视
频
扩展等手段,最多也只能生成十几秒的视
频
。
视频生成
sora
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
前段时间,「霉霉大秀中文」的视
频
在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似视
频
。
语音
HeyGen
换脸
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视
频
,分割和修饰
无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视
频
还是视
频
制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程图
音视频
Flow
Matching
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100