英国欢迎先进图像生成模型Stable Diffusion 3 Medium推出

稳定AI推出了其最复杂的开源文本转图像转换模型——Stable Diffusion 3 Medium,适用于英国消费者。SD3 Medium拥有20亿个参数,旨在产生逼真的图像结果,避开复杂的工作流程。据公司称,该模型在个体消费者系统上高效运行,并解决了手部和面部图像中的常见伪影。

稳定AI通过扩散变压器架构提升了文本生成的精度。尽管参数众多,SD3 Medium仍然紧凑,比起800亿至80亿参数的同类模型,占用内存更小。该尺寸使其在标准消费者GPU上运行”理想”,即使在小数据集中也能保持性能,允许个性化细节吸收。

Stability的联合首席执行官Christian Laforte向TNW透露了他们进一步完善这一模型的承诺,旨在保持其在图像生成领域的领先地位。SD3 Medium的提示和图像可通过Stability API获得。模型权重可根据非商业开放许可和经济创作者许可获得,商业规模用户可以联系该初创公司了解许可细节。

SD3 Medium在稳定AI面临挑战的环境下问世。该初创公司成立于2020年,迅速被认可为生成式人工智能领域的领军者,与Midjourney和OpenAI的Dall-E齐名。2022年,投资者将该公司估值达到10亿美元。然而,这段时间并不平静,公司遭遇了一波诉讼风波和财务问题。艺术家指责公司非法使用其作品训练人工智能模型。在面临财务压力的同时,有关公司出售的讨论不绝,并于三月份,首席执行官Emad Mostaque辞职以探索去中心化人工智能。

然而,该软件的性能依然令人印象深刻,SD3 Medium表现出明显的改进。稳定AI并没有止步于图像领域,Laforte暗示公司将开展多模态尝试,包括视频、音频和语言。

关键问题和回答:

什么是Stable Diffusion 3 Medium(SD3 Medium)?
Stable Diffusion 3 Medium是稳定AI推出的最新一代开源文本转图片生成器。它是一个20亿参数模型,旨在产生高质量、逼真的图像,并且足够高效以在标准消费级GPU上运行。

SD3 Medium在哪些方面突出于其他模型?
SD3 Medium之所以突出,是因为它兼具高质量图像生成能力和紧凑的尺寸,使其拥有更小的内存占用,同时仍能在消费级GPU上运行。它解决了手部和面部图像中的常见问题,如伪影。

与稳定AI和SD3 Medium相关的挑战或争议有哪些?
挑战包括法律争议,源于指控该公司未经授权对艺术家作品进行AI训练。财务挑战明显,公司讨论潜在出售,首席执行官Emad Mostaque辞职,探索去中心化人工智能模型。

SD3 Medium有哪些优点?
优点包括生成逼真图像结果,提高文本生成精度,并能够在消费级硬件上高效运行。此外,它是开源的,可根据不同的许可条件供非商业和商业用途支持。

SD3 Medium有哪些缺点?
潜在的缺点可能包括对将AI模型训练在可能具有版权的艺术作品上的道德顾虑,尤其是未获得明确许可的情况。与任何AI生成的内容一样,也存在真实性和可能被误用用于创造误导性或虚假图像的问题。

相关链接:
要了解更多有关文本转图像AI发展以及其他相关人工智能创新,请访问Stability AI网站,链接如下:Stability AI。请注意,提供的URL将引导至主域名,并且应在查询时段内有效,除非在知识截止日期之后对域名或网站结构进行了不可预见的更改。

Privacy policy
Contact