刚刚，Stable Diffusion 3.5重磅开源，文生图模型霸主归来！

原标题：刚刚，Stable Diffusion 3.5重磅开源，文生图模型霸主归来！

导读：

鞭牛士报道月日消息据外电报道谷歌前首席执行官埃里克施密特表示现在是我们全力投资人工智能基础设施的时候了因为气候目标无论如何都太过崇高而难以实现人工智能热潮引发了数据中心的支出热...

鞭牛士报道，10月7日消息，据外电报道，谷歌前首席执行官埃里克施密特表示，现在是我们全力投资人工智能基础设施的时候了，因为气候目标无论如何都太过崇高而难以实现。人工智能热潮引发了数据中心的支出热潮，数据中心提供了训练和运行人工智能模型所需的计算能力。但发展热潮是有代价的，因为数据中心消耗了大量的自然资...

声明:本文来自于微信公众号 AIGC开放社区，作者:AIGC开放社区，授权转载发布。

著名大模型开源 Stability AI，开源了文生图模型——Stable Diffusion3.5。

Stable Diffusion3.5一共有Large、Large T bo和Medium三个版本，可根据不同的商业环境提供高度定制功能，同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。

开源地址:https://huggingface.co/stabilityai

Github:https://github.com/Stability-AI/sd3.5

今年6月Stability AI首次开源了Stable Diffusion3Medium，但效果未达到预期，在听取了社区用户的反馈后，Stability AI花费大量时间进一步开发，便有了的3.5版本。

Large、T bo、Medium简单介绍

在这次发布中，Stable Diffusion3.5提供了多种模型，以满足不同用户群体的需求。Stable Diffusion3.5Large模型拥有80亿参数，提供了卓越的图片质量和高度文本语义还原，是Stable Diffusion家族中最强大的模型，适合专业使用，尤其是在100万像素分辨率的图片。

而Stable Diffusion3.5Large T bo模型则是一个蒸馏版本，它能够在仅仅4步之内生成高质量的图像，并且对提示的遵循性好，速度比Stable Diffusion3.5Large快得多。

Stable Diffusion3.5Medium模型将在10月29日发布，这个模型有25亿参数，采用了改进的MMDiT-X架构和训练方法，能在消费级硬件上即开即用，可生成0.25—200万像素之间生成图像，兼顾了质量和易定制性。

在开发这些模型的过程中，Stability AI优先考虑了可定制性，提供了一个灵活的基础来构建。

将Query-Key归一化集成到了变换器块中，这不仅稳定了模型训练过程，还简化了进一步的微调和开发。

为了支持这种下游的灵活性，Stability AI不得不做出一些权衡，例如，同一个提示使用不同种子可能会产生更大的输出变化，这是有意为之的，以帮助在基础模型中保留更广泛的知识库和多样化的风格。