我们尝试让绘画AI成为负责插图的新同事( 二 ) _插图

一般而言，用一组关键字生成4张512×512的例图大约需要1积分。每个绘画AI的积分定价略有差别——DALL·E的付费积分相对更贵一些，大约是15美元115积分，折合人民币大约1元生成一次；Midjourney提供了每月10美元约200张图的包月套餐，算下来便宜不少。
不管是DALL·E、Midjourney还是Stable Diffusion ，最关键的，当然还是图片生成的质量。我们使用了几组不同的关键词，测试AI们的表现。

描述与关键词

在插图这方面，相比起精美的3D建模图片或是贴近照片的现实风格图片，祝佳音老师更加青睐的是手绘杂志插图风格。但在风格的描述上却遇见了不少麻烦：该怎样告诉AI我们需要什么？
一开始，我们尝试用某一本杂志的刊名笼统地描述它的插图风格：例如，在关键词里加上《纽约客》（New Yorker）。问题随之而来：即使在同一本杂志里，插图风格并非单一不变。在这一点上，免费的Stable Diffusion为我们提供了不少试错的案例——即便你加入了“手绘”“无模糊”“清晰线稿”与艺术家的名字等关键词，绘画AI还是不太明白你究竟想要什么，只能一次给你端上来几张不同风格的图片任你挑选，你可以看得出来，这些风格确实都曾出现在杂志中。至于是否能够找到你想要的，就得指望运气了。

文章插图

指定的范围比较宽泛时，Stable Diffusion会一次生成数张不同风格的图片
想知道某种具体绘画风格的名字也不算容易。在大多数情况下，我们想了半天也只能想出来“手绘”或是“水彩”等笼统的描述。好在我们找到了搜索引擎Lexica，网站上整理了不少描述词与生成图片的案例，可以通过文字或是图片搜索找到你想要的词汇。

文章插图

Lexica上可以搜索到其他用户分享的案例
不过，Lexica也并非百试百灵。一方面，如果你瞄准的是不那么大众的艺术家，尝试生成对应风格图片的用户不多，能提供的例子也十分有限。另一方面，AI生成图片的过程伴随不小的随机性，用户上传的图片与关键词不是每次都足够准确——上传的例图看起来不错，实际生成时怎么也跑不出类似的图片更是常态。
Stable Diffusion的问题在这里也渐渐显露：模型在生成真实照片风格或是细腻的原画风格上可谓一骑绝尘，特别是更新后的Stable Diffusion2.1版本，生成的照片风格图像几乎可以以假乱真。但相对应的，当涉及相对平面的艺术风格时，想要生成出合适的图片，需要做出不少尝试。

文章插图

Stable Diffusion在生成真实照片风格的图片上做得相当好

文章插图

生成平面风格的图像，则需要更多尝试
当然，描述词带来的门槛也是问题之一——任何人在生成图片的过程中，不断调整、修正并找到合适的关键词同样需要时间。从这一点上来说，Stable Diffusion对零基础使用者并非那么友好。如果不细致调整关键词，直接用自然语言描述想要的图片，可能需要生成不少图片才能获得一张令人满意的图像。例如，我们描述了一个具体的场景：“一个女孩在堆满了杂物的办公桌前，桌上的外卖袋和泡面摞得很高，墙上有个日历，日历上‘发售日’后面的数字被红笔划掉了好几道。女孩抱着头，显得非常痛苦。”