SD3 正式开源 Sora同源架构 - AI魔法学院

SD3 正式开源 Sora同源架构

本文介绍了stability_ai发布的最新模型Stablediffusion3，该模型与OpenAI的Sora在架构上相似，都采用了Diffusion Transformer方式。Stablediffusion3具有生成视频、3D内容的能力，模型参数量增加至8亿，提升了图像质量。同时，介绍了即将推出的SD3 Medium模型，具有照片级真实感、优秀的字体排印学表现、高效性能以及微调能力，适用于定制和创意工作。

2月16日伴随着OpenAI世界大模型Sora的发布，stability_ai也发布了其最新的模型Stablediffusion3,如果说一个是音视频方向，一个是图像生成方向，那么两者没有必然的联系，但Sora和Stablediffusion3的架构是出奇的一致，核心部分都是采用了Difusion Transformer的方式(在Stablediffusion3中称之为DiT)。本次模型参数量不是很大就当8-12G起吧

SD3的更新特点

采用Diffusion Transformer（DiT）架构：Stable Diffusion 3.0采用了与Sora相同的DiT架构，这种架构设计使得系统的扩展性更强，能够处理多种类型的输入数据

支持生成视频、3D内容：Stable Diffusion 3.0发布时，将包含一套完整的工具，支持生成视频、3D以及更多类型的内容创作

模型参数量的增加：从之前的800M参数升级到8亿参数量，这意味着新的模型能够为用户提供更多扩展性选择，同时生成的图片效果更加惊人

图像质量的提升：Stable Diffusion 3.0在图像质量和色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强

今天收到邮件即将在下周三进行模型放出，如果想要商用记得填写申请许可证申请。

确定了Stablediffusion3与Sora的架构是一致的

Stable Diffusion 3 Medium，我们最先进的文本到图像即将推出！从6月12日下周星期三开始，您将能够在Hugging Face上下载重量。

SD3 Medium 是一个 20 亿参数的 SD3 模型，专门设计用于在以前模型难以解决的领域表现出色。以下是一些突出的功能：

· 照片级真实感：克服手部和面部的常见伪影，无需复杂的工作流程即可提供高质量的图像。

· 字体排印学： 在排版方面取得稳健的结果，优于更大的最先进的模型。

· 性能： 由于其优化的尺寸和效率，非常适合消费者系统和企业工作负载。

· 微调：能够从小型数据集中吸收细微的细节，非常适合定制和创意。

https://stability.ai/

本文档由网友提供，仅限参考学习，如有不妥或产生版权问题，请联系我们及时删除。客服请加微信：skillupvip

这个创作者的更多内容

变天了，AI可以一键生成中文海报了......

登顶的小熊猫模型出AI产品了！3步10秒出一张海报，可免费商用

神秘模型“小熊猫”一夜刷屏：排名超Flux、Midjourney，网友：一看就中国的

评论

1 评论

小黑屋2024/6/3 14:53:34

看完这文章，真心觉得技术进步飞快啊！不过，这Stablediffusion3这么强大，能生成视频和3D内容，我有点担心人文和伦理方面的问题。模型越来越逼真，我们得小心别滥用啊，别一不小心就侵犯了别人的隐私或者版权。还有，这些模型这么容易微调，要是被用来制造假新闻或者误导大众怎么办？

20秒读懂全文

SD3 绘画

伴读

# 1. 一句话总结文章摘要：
Stable Diffusion 3.0模型采用与Sora相同的Diffusion Transformer架构，支持生成视频、3D内容，拥有8亿参数和卓越的图像质量，其中SD3 Medium模型具有照片级真实感、字体排印学优化、高效性能以及微调能力。

# 2. 生成关键词和可能相关的关键词
关键词：
- Stable Diffusio

查看更多...

推荐阅读

· 中文原生文生图大模型来了！腾讯混元推出，Sora 同架构

· 腾讯悄悄开源混元版「Sora」，这就是开源领域的No.1。

· 一款构建AI数字人项目开源了！自动实现音视频同步！

· 构建开源多模态RAG系统

· 大模型应用的10种架构模式

· Stablediffusion3论文下载-确定了Stablediffusion3与Sora的架构是一致的

· 5个最佳开源RPA框架！

One More Thing

One More Thing again ...

找组织，加入AI魔法学院群

Ai魔法学院精选

SD3 正式开源 Sora同源架构

本文介绍了stability_ai发布的最新模型Stablediffusion3，该模型与OpenAI的Sora在架构上相似，都采用了Diffusion Transformer方式。Stablediffusion3具有生成视频、3D内容的能力，模型参数量增加至8亿，提升了图像质量。同时，介绍了即将推出的SD3 Medium模型，具有照片级真实感、优秀的字体排印学表现、高效性能以及微调能力，适用于定制和创意工作。

2024-06-03

Recommend

智能未来，AI悉心，学无止境

扫码阅读原文

下载到本地分享

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1