我们尝试让绘画AI成为负责插图的新同事( 二 )


一般而言,用一组关键字生成4张512×512的例图大约需要1积分 。每个绘画AI的积分定价略有差别——DALL·E的付费积分相对更贵一些 , 大约是15美元115积分,折合人民币大约1元生成一次;Midjourney提供了每月10美元约200张图的包月套餐,算下来便宜不少 。
不管是DALL·E、Midjourney还是Stable Diffusion , 最关键的,当然还是图片生成的质量 。我们使用了几组不同的关键词,测试AI们的表现 。

描述与关键词

在插图这方面,相比起精美的3D建模图片或是贴近照片的现实风格图片 , 祝佳音老师更加青睐的是手绘杂志插图风格 。但在风格的描述上却遇见了不少麻烦:该怎样告诉AI我们需要什么?
一开始 , 我们尝试用某一本杂志的刊名笼统地描述它的插图风格:例如,在关键词里加上《纽约客》(New Yorker) 。问题随之而来:即使在同一本杂志里,插图风格并非单一不变 。在这一点上,免费的Stable Diffusion为我们提供了不少试错的案例——即便你加入了“手绘”“无模糊”“清晰线稿”与艺术家的名字等关键词 , 绘画AI还是不太明白你究竟想要什么,只能一次给你端上来几张不同风格的图片任你挑选 , 你可以看得出来,这些风格确实都曾出现在杂志中 。至于是否能够找到你想要的,就得指望运气了 。

我们尝试让绘画AI成为负责插图的新同事

文章插图


指定的范围比较宽泛时,Stable Diffusion会一次生成数张不同风格的图片
想知道某种具体绘画风格的名字也不算容易 。在大多数情况下,我们想了半天也只能想出来“手绘”或是“水彩”等笼统的描述 。好在我们找到了搜索引擎Lexica,网站上整理了不少描述词与生成图片的案例 , 可以通过文字或是图片搜索找到你想要的词汇 。
我们尝试让绘画AI成为负责插图的新同事

文章插图


Lexica上可以搜索到其他用户分享的案例
不过,Lexica也并非百试百灵 。一方面,如果你瞄准的是不那么大众的艺术家,尝试生成对应风格图片的用户不多,能提供的例子也十分有限 。另一方面,AI生成图片的过程伴随不小的随机性,用户上传的图片与关键词不是每次都足够准确——上传的例图看起来不错,实际生成时怎么也跑不出类似的图片更是常态 。
Stable Diffusion的问题在这里也渐渐显露:模型在生成真实照片风格或是细腻的原画风格上可谓一骑绝尘 , 特别是更新后的Stable Diffusion2.1版本,生成的照片风格图像几乎可以以假乱真 。但相对应的,当涉及相对平面的艺术风格时,想要生成出合适的图片,需要做出不少尝试 。
我们尝试让绘画AI成为负责插图的新同事

文章插图


Stable Diffusion在生成真实照片风格的图片上做得相当好
我们尝试让绘画AI成为负责插图的新同事

文章插图


生成平面风格的图像,则需要更多尝试
当然,描述词带来的门槛也是问题之一——任何人在生成图片的过程中,不断调整、修正并找到合适的关键词同样需要时间 。从这一点上来说,Stable Diffusion对零基础使用者并非那么友好 。如果不细致调整关键词,直接用自然语言描述想要的图片,可能需要生成不少图片才能获得一张令人满意的图像 。例如,我们描述了一个具体的场景:“一个女孩在堆满了杂物的办公桌前 , 桌上的外卖袋和泡面摞得很高,墙上有个日历,日历上‘发售日’后面的数字被红笔划掉了好几道 。女孩抱着头,显得非常痛苦 。”

相关经验推荐