首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· LangChain Agent 原理解析
· 无需翻墙,可合法使用的8款国内AI大模型产品
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· SD入门教程零:应用场景
· 教会AI画汉字(ComfyUI篇)
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
视频魔法
Sora
Stablediffusion3论文下载-确定了Stablediffusion3与Sora的架构是一致的
2月16日伴随着OpenAI世界大模型Sora的发布,stability_ai也发布了其最新的模型Stablediffusion3,如果说一个是音视频方向,一个是图像生成方向,那么两者没有必然的联系,但Sora和Stablediffusion3的架构是出奇的一致,核心部分都是采用了Difusion Transformer的方式(在Stablediffusion3中称之为DiT)。
SD
论文
2024-03-11
2024-03-11
AI拟声: 5秒内克隆您的声音
MockingBird是一个人工智能开源项目,它可以在仅仅5秒钟内克隆你的声音。这种独特的能力使得MockingBird在许多不同的领域中具有广泛的应用场景。
声音克隆
开源
2024-03-07
2024-03-07
剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
剪映应用推出了一项名为“AI克隆音色”的创新功能,这一功能允许用户在短短5秒内捕捉并复制特定的声音样本。通过先进的人工智能技术,剪映能够分析并学习目标声音的特征,然后生成与原声音极为相似的复制品。这一功能的上线,不仅为用户提供了前所未有的创作自由度,也为声音设计和个性化服务开辟了新的可能性。
剪映
声音克隆
2024-03-06
2024-03-06
Sora
OpenAI视频模型Sora的推理生成成本多高?
Sora 的训练算力需求大概率是 GPT-4 的 1/4 左右。Sora 的推理算力需求是 GPT-4 的 1000 倍 以上(这么看来 2 万亿美元市值的 NVIDIA 仍然不是高点)。复现 Sora 的难度没有预想中的大,至少训练算力不是瓶颈; 国内靠 A800/H800 的余量仍可以满足。国产芯片迎来一次机会,设计并量产 14nm 的中算力、大显存 LLM 推理芯片,可以绕开芯片制程的瓶颈迅速商业化
Sora
推理
算力
2024-03-04
2024-03-04
Sora
Sora懂不懂物理世界?
我们真实的视频是会体现 真实世界的物理规律,以航行为例这意味着 AI 需要考虑到重力、浮力、碰撞以及船体结构在动态环境中的行为。那么问题来了,Sora到底懂不懂物理世界呢?
文生视频
视频生成
sora
2024-02-22
2024-02-22
ComfyUI
免费的文本生成视频解决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
AnimateDiff 是一个基于 Stable Diffusion 模型的文本生成视频插件,它通过控制模块影响图像生成过程,使得生成的图像序列具有与训练视频剪辑相似的特征。这个插件的核心功能是通过大量短视频剪辑的训练,优化图像之间的过渡,确保视频帧的流畅性,从而生成高质量的短视频。
视频生成
文生视频
2024-02-22
2024-02-22
大模型
视频大模型训练相关词条解释
Sora是OpenAI公司发布的一款AI视频生成模型。它不仅能够根据文字指令创造出既逼真又充满想象力的场景,而且能生成长达1分钟的超长视频,不管是一镜到底还是分镜头切换模式,都能够保持角色及背景神一般的一致性和稳定性。那么视频大模型的训练都有哪些技术点呢?今天给大家带来视频模型训练相关的词条解释,而且是小学生也能看懂的哦
视频生成
sora
词条
2024-02-21
2024-02-21
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
阅读本文你将完全理清什么是Sora、它能干什么、它为啥牛、它的原理以及将带来什么影响,而且文末还有干货附送哦。
视频生成
sora
2024-02-18
2024-02-18
Sora
解读OpenAI Sora文生视频技术原理
OpenAI Sora文生视频(图像看作单帧视频)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗级的更新。OpenAI 随后公布的技术综述[文献1],难掩其勃勃雄心:视频生成模型作为世界模拟器。
sora
2024-02-18
2024-02-18
Sora
中学生也能看懂的Sora视频生成原理解读
首先,Sora通过一个叫做“视频压缩网络”的技术,将输入的图片或视频压缩成一个更低维度的表示形式,接下来,Sora将这些压缩后的数据进一步分解为所谓的“空间时间补丁”(Spacetime Patches),然后通过“文本条件化的Diffusion模型”Sora不仅能生成具有高度创造性的视频和图片,还能确保生成内容与用户的文本提示保持高度一致。
视频生成
sora
2024-02-18
2024-02-18
Sora
一文带你看懂OpenAI-Sora生成视频的原理
OpenAI非常突然地发布了其首款AI视频生成模型——“Video generation models as world simulators”(作为世界模拟器的视频生成模型),名字叫做Sora,可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。这标志着我们如何理解和创造虚拟世界的方式即将迎来根本性的变革。本文将带你看懂Sora生成视频的原理
视频生成
sora
2024-02-18
2024-02-18
Sora
通俗易懂地解释OpenAI Sora视频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
为什么Sora可以引起如此大的关注?Sora生成的视频与此前其它平台生成的视频到底有哪些区别?有很多童鞋似乎对这些问题依然有疑问,本文将以通俗的语言解释Sora的独特之处。
sora
视频生成
2024-02-18
2024-02-18
Sora
OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
就说Sora有多火吧。生成的视频上线一个、疯传一个。英伟达高级研究科学家Jim Fan高呼,这就是视频生成的GPT-3时刻啊!尤其在技术报告发布后,讨论变得更加有趣。因为其中诸多细节不是十分明确,所以大佬们也只能猜测。包括“Sora是一个数据驱动的物理引擎”、“Sora建立在DiT模型之上、参数可能仅30亿”等等。所以,Sora为啥能如此惊艳?它对视频生成领域的意义是?这不,很快就有了一些可能的答案。
sora
openai
视频生成
2024-02-17
2024-02-17
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
在GPT技术不断爆火的背景下,人工智能技术也在不断的发展和演化。各种AI工具也层出不穷,其中 语音克隆技术 也是尤为引人瞩目的产品之一。而 OpenVoice 作为一款强大的多语言即时语音克隆AI工具,可以为用户提供高效、个性化的语音克隆服务,是一款值得推荐的项目。
tts
文本转语音
2024-02-15
2024-02-15
换脸
全新换脸工具ReActor,比roop更强!
之前介绍过 SD 的换脸插件 roop,今天我们介绍一个比 roop 更强的换脸插件 ReActor,嗯,它们其实是一个作者,ReActor 是在 roop 的基础上更新换代的,roop 后续作者应该不维护了,所以小伙伴们可以直接使用 ReActor。 之前 roop 介绍的比较简单,我们今天来详细介绍一下 ReActor。 话不多说,我们直接开整。
ReActor
roop
换脸
2024-02-01
2024-02-01
<
1
2
3
4
5
6
7
8
9
>
1
2
4
5
6
7
8
9
100