第2章　OpenAI应用三剑客 - 03　AI智能绘图DALL·E 2 - 《ChatGPT：AI革命》

03　AI智能绘图DALL·E 2

03　AI智能绘图DALL·E 2

DALL·E 2是OpenAI开发的一种全新的人工智能技术，能够根据给定的文字描述生成多样性和高质量的图像，如下图所示。DALL·E 2基于Transformer模型，是一种多层的神经网络，可以理解与生成语言。它是一种自然语言处理（NLP）技术和生成式对抗网络（GAN）技术的结合。

DALL·E 2的目的是利用人工智能技术和大规模的数据，展示机器学习模型生成高质量图像的能力，模拟人类的创造力和想象力，激发AI的创意应用。DALL·E 2的应用非常广泛，可以应用于动画、广告创意、游戏开发、建筑设计等多个领域。

例如，输入一段文字描述：“绘制一幅关于长城的水墨山水画”，DALL·E 2就可以生成与描述文字相符的图像，如下图所示。

但不足之处在于，DALL·E 2和前面介绍的人工智能工具一样，就目前来说，针对中文的识别不如英文智能。举个例子，若输入文字描述：“在白色背景中，一只戴着领带的小恐龙正在研究植物”，得到的结果如下图所示。

而采用英文进行描述得到的结果如下图所示。

显然，采用英文描述生成的图片更符合我们的想象。但这并不影响DALL·E 2是一个非常具有潜力和前瞻性的人工智能技术，在未来，它会发挥更大的作用。

在DALL·E 2中通过文本生成图片后，可以根据实际需求对生成的图片进行编辑，还可以实现同类图片的批量输出、智能抠图、智能填充、空白区域填充等。下面通过一个例子来详细介绍具体的操作方法。

在文本框中输入需要生成图片的描述性文字：Part of an extremely delicate and beautiful work, close-up of Daniel Gerhartz,side angle, arms crossed, short yellow hair, looking into the distance,upper body, off shoulders, bun, light colored dress, rainy weather,backlight。这段文字表述得很细致，生成的图片如下图所示。