“旗舰版”文生图开源模型来袭，Stability AI发布SDXL 1.0｜最前线

2023-07-28 10:24:39 来源：36氪

作者 | 黄金琼

【资料图】

编辑 | 邓咏仪

北京时间7月27日，Stability AI宣布推出最新的图像生成模型Stable Diffusion XL 1.0，Stable Diffusion XL 1.0的开源版本，当前可在GitHub上进行访问。

Stable Diffusion已经是目前全球使用最广泛的开源文生图模型。本次推出的Stable Diffusion XL 1.0，其实只和上一个版本0.9的推出时间相差不久，新版本相当于是一个“旗舰版本”。

来源：Stability AI

Stability AI也称其是目前为止“最先进”的版本，事实也如此。Stable Diffusion XL 1.0在图片的色彩更鲜艳和准确，并且对比度、阴影以及光影效果方面更佳。

并且，Stability AI这次还发布了Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。其中发布的API包含了测试版的微调功能，允许用户使用最少5张图像来“专门”生成特定的人、产品等。

参数是模型的核心参数，在这一方面，Stable Diffusion XL 1.0有进一步的提升。据TechCrunch报道，Stability AI的应用机器学习负责人Joe Penna表示，Stable Diffusion XL 1.0包含35 亿个参数，能在“几秒钟内”生成多种长宽比的100 万像素分辨率的完整图像。

相对于此，上一代模型Stable Diffusion XL 0.9尽管能生成更高分辨率的图像，并且在修复、补全图像上能力更强，但同时要求更高的计算能力。

Stable Diffusion XL 1.0在操作上也更方便快捷，提供更具个性化的操作。Penna表示：“Stable Diffusion XL 1.0 是可定制的，可以根据概念和风格进行微调。它也更容易使用，可以通过基本的自然语言处理提示，来实现复杂的设计。”

目前，Stability AI已将稳定的Stable Diffusion XL 1.0部署亚马逊关于生成式AI模型的云平台项目（Amazon Bedrock）中，也宣布与AWS进行深度合作。

不过，Stability AI当前还是面临各类道德争议。比如在训练模型的数据来源方面，Stability AI采用了包括艺术家的作品等数据用于训练，这引发了艺术家本人的抗议。

尽管Stability AI认为，这符合美国的合理使用原则并坚持使用，但在艺术家们选择诉讼来警告这种行为后，Stability AI还是选择尊重艺术家们的要求——从数据集中删除作品。而后，Stability AI转而与新兴企业Spawning合作，以寻求训练数据。

并且，Stable Diffusion XL 1.0也和之前的版本尚未能避免被滥用的问题——不少人利用开源版本来进行换脸、生成有害的内容。

除此之外，Stability AI近期也深陷负面新闻漩涡，包括创始人Emad的造假传闻等等。而据TechCrunch，Stability AI由于在快速烧钱，在资金方面也颇有压力，正在大力拓展销售，并且寻找融资。

标签：