首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频
往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声
音
不是他发出来的,以至于大家看对口型
视
频
的时候,会有一种割裂感。
Loopy
视频
开源
通过声
音
生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据
音
频
生成逼真的人物
视
频
!
audio2photoreal
开源工具
OpenAI
【语
音
识别】OpenAI语
音
力作Whisper
与Wav2Vec 2.0等前作不同,以往的模型都是在未标注的
音
频
数据上预训练的,而 Whisper 是在大量的已标注
音
频
转录数据上预训练的。
语音转文字
whisper
Sora
快手版Sora「可灵」开放测试:生成超120s
视
频
,更懂物理,复杂运动也能精准建模
与
视
频
一同曝光的,是一款名为「可灵」全新国产
视
频
生成大模型。
可灵
快手
文生视频
Stable Diffusion
AnimateDiff:一篇文章教你学会用Stable Diffusion制作GIF动图
这是一个AnimateDiff介绍教程,这个工具可让您使用Stable Diffusion创建令人惊叹的 GIF 动画,这是目前为止最好的文本生成
视
频
(Text-to-video)人工智能工具之一。
AnimateDiff
视频
训练
Sora
通俗易懂地解释OpenAI Sora
视
频
生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
Sora生成的
视
频
与此前其它平台生成的
视
频
到底有哪些区别?
sora
视频生成
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
而这一次的项目,就是被N多人期待了很久的,腾讯混元
视
频
生成模型。
sora
视频生成
Insanely Fast Whisper:超快的Whisper语
音
识别脚本
通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的
音
频
。
音频
Whisper
AI
音
乐热潮下,“神曲工作室”率先失业
她觉得,AI
音
乐可能会对抖
音
等平台上批量产出的歌曲产生较大影响,甚至不排除
视
频
平台自主引入AI作曲机制,影响由第三方负责的“神曲”创作的生存空间。
音乐
音频
开源
网易(TTS)EmotiVoice:开源语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的声
音
来朗读任何文本,那该多好?
EmotiVoice
语音合成
一文彻底搞懂多模态 - 多模态推理
这两种模态的信息可以是图片和文本、
视
频
和语
音
等。
多模态推理
大模型
Sora
Sora懂不懂物理世界?
Sora的基本原理 Sora的训练集为短
视
频
集,每个样本是一个短
视
频
,Sora将其编码到数据空间进行降维,然后在隐空间中将特征向量切割成补丁,加上时间顺序,构成时空补丁,亦即时空令牌(time-space
文生视频
视频生成
sora
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频
驱动唇部同步模型。
MuseTalk
数字人
音频
ChatGPT
15种ChatGPT高
频
用法
本文列出了15个可以高频使用chatgpt以及其他大模型的场景,希望对您会有启发
大模型
效率
教程
爆火的“女孩的一生”,plus版教程它来了
嘿,动画和
视
频
制作的小伙伴们,今天我们来聊聊怎样用animatediff和LCM(Lower Complexity Model)来制作超炫酷的
视
频
。
动画
视频
AnimateDiff
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100