03 AI智能绘图DALL·E 2
DALL·E 2是OpenAI开发的一种全新的人工智能技术,能够根据给定的文字描述生成多样性和高质量的图像,如下图所示。DALL·E 2基于Transformer模型,是一种多层的神经网络,可以理解与生成语言。它是一种自然语言处理(NLP)技术和生成式对抗网络(GAN)技术的结合。

DALL·E 2的目的是利用人工智能技术和大规模的数据,展示机器学习模型生成高质量图像的能力,模拟人类的创造力和想象力,激发AI的创意应用。DALL·E 2的应用非常广泛,可以应用于动画、广告创意、游戏开发、建筑设计等多个领域。
例如,输入一段文字描述:“绘制一幅关于长城的水墨山水画”,DALL·E 2就可以生成与描述文字相符的图像,如下图所示。

但不足之处在于,DALL·E 2和前面介绍的人工智能工具一样,就目前来说,针对中文的识别不如英文智能。举个例子,若输入文字描述:“在白色背景中,一只戴着领带的小恐龙正在研究植物”,得到的结果如下图所示。

而采用英文进行描述得到的结果如下图所示。

显然,采用英文描述生成的图片更符合我们的想象。但这并不影响DALL·E 2是一个非常具有潜力和前瞻性的人工智能技术,在未来,它会发挥更大的作用。
在DALL·E 2中通过文本生成图片后,可以根据实际需求对生成的图片进行编辑,还可以实现同类图片的批量输出、智能抠图、智能填充、空白区域填充等。下面通过一个例子来详细介绍具体的操作方法。
在文本框中输入需要生成图片的描述性文字:Part of an extremely delicate and beautiful work, close-up of Daniel Gerhartz,side angle, arms crossed, short yellow hair, looking into the distance,upper body, off shoulders, bun, light colored dress, rainy weather,backlight。这段文字表述得很细致,生成的图片如下图所示。

此时可以发现,在界面右侧会出现通过该工具生成的所有图片集合,如下图所示,方便后续调用。如果不需要保存,则可以把它们清除。

在本次生成的图片中选择第4幅图片来进行编辑操作。单击图片将其放大显示,选择下方的橡皮擦工具,擦除图片的背景,如下图所示。

调整画布的框架,对左侧的画幅进行延展,并在编辑框中输入需要智能填充的图像信息,如下图所示。然后单击“Generate”按钮,进行图像的智能生成操作。

智能生成的图像和需要填充的背景是可以完美融合的,并且它还提供了4个填充效果给用户选择。单击小圆点就可以在多个填充好的背景之间进行切换。选定需要的背景后,单击“Accept”按钮确定选中的背景图像,如下图所示。

若还想进行进一步的智能补图,可以重复上面的操作,最终得到如下图所示的画面效果。

