英国欢迎先进图像生成模型Stable Diffusion 3 Medium推出

稳定AI推出了其最复杂的开源文本转图像转换模型——Stable Diffusion 3 Medium，适用于英国消费者。SD3 Medium拥有20亿个参数，旨在产生逼真的图像结果，避开复杂的工作流程。据公司称，该模型在个体消费者系统上高效运行，并解决了手部和面部图像中的常见伪影。

稳定AI通过扩散变压器架构提升了文本生成的精度。尽管参数众多，SD3 Medium仍然紧凑，比起800亿至80亿参数的同类模型，占用内存更小。该尺寸使其在标准消费者GPU上运行”理想”，即使在小数据集中也能保持性能，允许个性化细节吸收。

Stability的联合首席执行官Christian Laforte向TNW透露了他们进一步完善这一模型的承诺，旨在保持其在图像生成领域的领先地位。SD3 Medium的提示和图像可通过Stability API获得。模型权重可根据非商业开放许可和经济创作者许可获得，商业规模用户可以联系该初创公司了解许可细节。

SD3 Medium在稳定AI面临挑战的环境下问世。该初创公司成立于2020年，迅速被认可为生成式人工智能领域的领军者，与Midjourney和OpenAI的Dall-E齐名。2022年，投资者将该公司估值达到10亿美元。然而，这段时间并不平静，公司遭遇了一波诉讼风波和财务问题。艺术家指责公司非法使用其作品训练人工智能模型。在面临财务压力的同时，有关公司出售的讨论不绝，并于三月份，首席执行官Emad Mostaque辞职以探索去中心化人工智能。

然而，该软件的性能依然令人印象深刻，SD3 Medium表现出明显的改进。稳定AI并没有止步于图像领域，Laforte暗示公司将开展多模态尝试，包括视频、音频和语言。

关键问题和回答：

什么是Stable Diffusion 3 Medium（SD3 Medium）？
Stable Diffusion 3 Medium是稳定AI推出的最新一代开源文本转图片生成器。它是一个20亿参数模型，旨在产生高质量、逼真的图像，并且足够高效以在标准消费级GPU上运行。

SD3 Medium在哪些方面突出于其他模型？
SD3 Medium之所以突出，是因为它兼具高质量图像生成能力和紧凑的尺寸，使其拥有更小的内存占用，同时仍能在消费级GPU上运行。它解决了手部和面部图像中的常见问题，如伪影。

与稳定AI和SD3 Medium相关的挑战或争议有哪些？
挑战包括法律争议，源于指控该公司未经授权对艺术家作品进行AI训练。财务挑战明显，公司讨论潜在出售，首席执行官Emad Mostaque辞职，探索去中心化人工智能模型。

SD3 Medium有哪些优点？
优点包括生成逼真图像结果，提高文本生成精度，并能够在消费级硬件上高效运行。此外，它是开源的，可根据不同的许可条件供非商业和商业用途支持。

SD3 Medium有哪些缺点？
潜在的缺点可能包括对将AI模型训练在可能具有版权的艺术作品上的道德顾虑，尤其是未获得明确许可的情况。与任何AI生成的内容一样，也存在真实性和可能被误用用于创造误导性或虚假图像的问题。

相关链接：
要了解更多有关文本转图像AI发展以及其他相关人工智能创新，请访问Stability AI网站，链接如下：Stability AI。请注意，提供的URL将引导至主域名，并且应在查询时段内有效，除非在知识截止日期之后对域名或网站结构进行了不可预见的更改。