我的画拿奖了，但是用AI画的

作者：张晓迪

2022-12-30

“

古典梦幻的巴洛克歌剧院舞台上，墙壁上画满了精妙的壁画，在大厅内，两位穿着华丽鲜艳裙子的妇人站在两侧，围绕着穿着一袭白裙的歌者，向黑暗中的观众表演歌唱。在观众席之中的巨大的弧形玻璃窗外，是通往另一个世界的入口……

这是一副刚刚获得获得了美国科罗拉多州博览会举办的艺术比赛一等奖的作品《太空歌剧院》。而该画的创作者杰森艾伦自曝该作品是其用AI绘画 App“Midjourney”创作产生的。

《太空歌剧院》的出现，让人们再次将目光放在AI与艺术的融合上。伴随着技术和软件能力的提升，“人人都可以画画”的时代已经到来了。百度文心一格相关负责人表示，计算机与艺术创作的融合，具有很大的想象空间，AI将对艺术创新起到正向促进作用。

每个普通人都可以通过文字来描述自己的想法，然后通过机器来实现创作，人工智能在艺术领域的学习与创作能力正以蓬勃之势不断刷新我们的认知，一个新的艺术类别也逐渐兴起。

艺术因为AI消亡？

“我们正在目睹艺术在眼前消亡。”这是诸多网友在得知《太空歌剧院》的创作过程后最直观的看法。他们认为Allen使用AI生成图像完全是在作弊，但Allen自己却不以为然。

他介绍了这幅作品的创作过程耗时一个月，不停地修改输入关键词，给MidJourney提交尽可能精确具体的词语，创作了100多张作品后，挑选出了三张自己认为最满意的，用GipaPixel AI将图片清晰化，又用Photoshop进行多次调整，最后才打印在画布上。

这并不是AI作品第一次在正式的艺术舞台上亮相，2018年10月，艺术品拍卖行佳士得曾以约一万美元的价格成交了一幅由AI生成的油画《Edmond Belamy的肖像》。创作者让AI模型分析了15000幅14至20世纪的油画后，仿出了一幅风格类似的作品。

佳士得对作品的形容是：在艺术与人工智能之间交互的实验。意味着，这幅拍卖作品的核心价值并不在画作本身，人们关注更多的是当时看来前所未有的生产方式。这足以说明，AI技术生成的图片不是既有图片的拼凑，而是类似人类经过长期绘画训练后的“再创作”。

尽管人工智能作品充满了冲击力和视觉张力，但和几乎所有其他的深度学习模型一样，在理解知识、推理、逻辑方面做得都不够好。一个已经被广泛注意到的问题，是人工智能经常会生成奇形怪状的手。

这就要先提到AI绘图的原理。据百度文心一格相关负责人介绍，AI从海量图文对应的数据中学习到了“语言描述”与“艺术画面”的关联，以随机化的起点开始，不断修正画作，最终形成在审美上与人类经验与知识高度一致的成品。

人的一只手有超过 20 个关节，是人类身体上形状最丰富的结构之一。在大部分用来训练的图片中，手部经常不是最核心的部位，不同角度、不同距离、手不同势、还有被阴影和其他物体遮挡等现象，就会让AI在手的表现上出现问题。

从技术角度来看，需要提高的主要是两个方面，包括生成的可控性和细节描述能力。目前AI对于数量、逻辑、关系、多图关联等问题暂无有效的解决方案。例如要求生成2个苹果，左边是红色，右边是绿色。虽然这边的关系并不负责，但是在通常情况下，模型并不能稳定的生成正确的结果。

另一方面，AI对于更加复杂的、有规律性细节的描述能力有待提升。例如一栋居民楼的窗户应该具有多种形态，开着的、关上的、有人在窗边看风景、有晾在阳台上的衣服等等……但目前的AI绘画尚未具备这样的能力，同理，手部绘画也是这样的问题。

“大力出奇迹”的大模型

人工智能上一次惊艳互联网还是2020年。

这一年，由OpenAI公司开发的GPT-3横空出世。有开发者给GPT-3 做了图灵测试，发现GPT-3对答如流，正常得不像个机器。而最近又一次惊艳互联网的ChatGPT同样出自这家公司。

相比GPT-3，ChatGPT的主要提升点在于记忆能力。ChatGPT可以储存对话信息，延续上下文，从而实现连续对话，这在对话场景中至关重要，极大地提升了对话交互模式下的用户体验。

ChatGPT的背后离不开大模型、大数据、大算力。根据国盛证券研报数据显示，ChatGPT技术底座使用的是微调后的GPT-3.5系列模型，有着多达1750亿个模型参数，OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。GPT-3.5在微软Azure AI超算基础设施上进行训练，总算力消耗约3640PF-days（即每秒一千万亿次计算，运行3640个整日）。

而为AI绘画提供优质应用体验的关键技术是大模型。2021年3月OpenAI发布人工智能绘画产品DALL·E，现已升级到DALL·E 2；谷歌、Meta、百度、阿里等互联网巨头也推出了支持生成内容的AI大模型以及对应产品。

百度基于文心大模型推出了AI艺术与辅助创作平台文心一格，是百度依托于飞桨、文心大模型持续的技术创新，在“AI作图”方面发布的产品和技术工具。定位为面向有设计需求和创意的人群，基于文心大模型智能生成多样化AI创意图片，辅助创意设计，打破创意瓶颈。

文心一格是基于文心大模型的文生图系统实现的产品化创新。在文心一格官网，用户只需输入自己的创想文字，并选择期望的画作风格，即可快速获取由一格生成的相应画作。文心一格既能生产恢弘绚丽的艺术画，也能生产创意脑洞的超写实图，兼具中国特色，支持国风、动漫、插画、油画等十余种绘画风格和不同画幅的选择。

百度文心大模型已摸索出一条大模型产业化路径。百度CTO王海峰指出，具有算法、算力和数据综合优势的企业，可以将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务，从而形成一条大模型产业化路径。

突破绘画的边界

1839年，照相机问世，给彼时纯手工的绘画带来了巨大的冲击。法国知名艺术家德拉洛奇也曾发出悲叹：“绘画已死！”但随着相机普及，摄影作品作为一种艺术品的观念，也逐渐为大众所接受。

19世纪英国著名的“卢德运动”中，大量英国工人闯进工厂破坏纺织机等机器，因为他们认为机器抢走了他们的工作。

但最终，绘画没有死，艺术出现了新的表现形式，机器帮助社会创造了更多的生产力。经济学家凯恩斯曾分析，新技术的出现会导致技术性失业。为了避免被淘汰，人们总是不得不提升应用各类技术的能力。

从目前的实践来看，AI绘画带来了新的创作方式，大幅提高了绘画效率。无论是对画师、设计师、艺术家等专业视觉内容创作者还是媒体、作者等文字内容创作者来说，AI作画无疑是提供创意思路，辅助进行艺术创作，既提升效率也提升质量。

对于未来，技术和应用都还将快速发展。从技术上来看，未来AI不止可以作画，还可以基于文字内容一键生成AI原创短视频，并自动配上字幕、语音、音乐等等。例如，2022万象·百度移动生态大会上，由百度APP推出的数字人度晓晓作词作曲演唱的《启航星》，是首支全AIGC生成的MV，其中画面部分由文心一格根据歌词自动生成。应用上，AI作画将不断的融入到各种内容创作场景，除了常见的插画师和艺术设计领域，未来在移动内容生产、游戏、工业设计、AI教育等场景都会有越来越广泛的应用。

对于卓越的艺术家来说，他们不可能会被AI替代。但普通的艺术家为了更具竞争力，很可能需要学习利用AI进行艺术创作，就好像现在的画师都要掌握数字绘图软件一样，先进的工具最终会成为必要的生产资料。

就像《太空歌剧院》的创作者对于争议回应时说的那样：“我不会为此道歉，我没有违反任何规则，我赢了。”

本文章选自《AI启示录》杂志，阅读更多杂志内容，请扫描下方二维码