Midjourney,悄悄站上AI之巅

  文|雷科技 leitech

  自 ChatGPT 走红以来,以“聊天”为核心的人工智能协作工具们受到了各行各业的关注,让 AI 写首诗、发封邮件,或是做一份计划书,这些工作已经成为 AI 聊天机器人的“日常需求”。

  但似乎,人们遗忘了 AI 还具有创作文字以外的内容,比如,一幅画。

  2022 年 8 月,美国科罗拉多州博览会艺术比赛宣布了一名令人惊喜的获奖者,这位获奖者名为杰森·艾伦,他既不是专业的画家,也不是自由艺术家,而是一款桌面游戏的 CEO。他的获奖作品《太空歌剧院》,由新型 AI 绘画工具“Midjourney”创作而成。

  《太空歌剧院》是一幅神奇的画作,它结合了古典与科幻的元素,将 17 世纪欧洲的歌剧院场景与极具科幻的太空相融,画中身穿华丽服饰的贵妇们站立于穹顶之上,漫游于太空之间,极具魔幻色彩。这样一副“神奇”的画作,竟是出自 AI 之手。

  没错,Midjourney,这款完成度极高的 AI 绘画工具,正在开启 AIGC(人工智能生成内容)的新世代。

  Midjourney 为何突然走红?

  在《太空歌剧院》获奖之前,Midjourney 其实一直处于不温不火的状态,即便它拥有不俗的内容创作能力,但依然只在 AIGC 爱好者的小众圈子里流行。可以说,美国科罗拉多州博览会,让 Midjourney 走进了大众的视线。

  2021 年,OpenAI 发布了第一代 AI 绘图工具 DALL E,使用文字描述,即可生成一张图像,打开了 AI 绘图的新世代。由于是初代工具,DALL E 的表现并不完美,很多场景都没法真实呈现,或者说,这个工具创作的作品,看起来依旧是一张来自人工智能生成的图片。

  这样的结果并不让人意外。自 2020 年以来,不少小众 AI 绘图工具走红,基本遵循了“临摹”、“描述生成”和“参考生成”这三种工作模式,早些时候在短视频平台“抖音”上很火的“AI 一件变装”,正是基于参考生成实现。即使是有参照物、有一定的描述,这些 AI 工具依然很难令人满意。

  AI 绘图之所以“一眼假”,主要还是两个部分:光影和手指。

  与人类作画不同,AI 绘图工具没法了解到用户所描述的场景里光源的正确走向,以 Stable-Diffusion、Lora 这样的热门绘图工具为例,它们处理光影的方式往往具有一定的随机性,左右光源不分,导致产出的作品不够真实。同理,手指的几何形状十分复杂,没有一定的规律,AI 工具很难有针对性的处理。

  这些问题,在 V5 版本的 Midjourney 上全都被解决了。

  上周,有网友利用 Midjourney 制作了一系列“情侣合照”,因过于真实的场景塑造和人物表情,走红网络。不少网友表示,在得知它是由 AI 工具创作之前,只觉得是一张平平无奇的照片。像“一张照片”,在某种意义上,诠释了 Midjourney 的成功。

  网友们大开脑洞地将马斯克与炼铁工厂组合到了一起、把爱因斯坦带到了热闹非凡的音乐节、甚至帮中国男足“拿下”了卡塔尔世界杯的冠军。天马行空的想法,如今只需文字描述就能做到。

  Midjourney,真正智能的 AI 绘图工具

  Midjourney 能够大获成功,除了对细枝末节的精准把控之外,更重要的还是对场景的还原。

  前面提到,AI 制图之所以能被人们快速识别,细节的成败是关键,但实际上,作品的风格十分重要。从网友的一些作品中不难看出,Midjourney 拥有根据场景自动调色的能力。

  举个例子,当你尝试生产一张 90 年代的照片时,你是否会对照片的质量有所顾虑,毕竟在那个年代,胶卷相机才是主流。而胶卷相机往往没有那么清晰的画质,对曝光的控制也比较差劲,这样的风格被摄影玩家称为“胶片感”。Midjourney 在接到关于年份的描述时,会主动匹配用户的需求,不会让一张高清图片出现在“90 年代”的场景描述之下。

  这正是 Midjourney 的精妙之处。

  当然,匹配风格对于 V5 版本的 Midjourney 来说,还算不上什么真正的主菜。Midjourney 现在可以按照用户的需求,模拟不同摄影设备的摄影效果,例如“shot on Canon R6 with 50mm f1.4”,此处包含了相机型号为佳能 R6,50mm 焦段与 f1.4 光圈等信息。Midjourney 可以根据用户提供的信息,模拟出所需的效果。

  不得不说,Midjourney 这项功能不仅是“惹”到了绘画创作者,还同时“惹”到了光学设备制造商,同时让两个领域的专业人士失业,很难不让人感到担忧。

  AI 绘图越来越逼真,真的没问题吗?

  当人们还在讨论人工智能作为辅助工具,会不会一步一步抢走大部分基础从业者饭碗的时候,AI 绘图暴露了巨大的问题。

  3 月 28 日,Midjourney 正式宣布关闭所有免费账户通道,并通过官方平台发布公告称,将对由 Midjourney 生成的图像进行严格监管。为何势头正盛的 Midjourney 会做出这样的决定呢?原来,有人利用它生成的照片,制造了假新闻。

  此前,有新闻平台发布了一则“美国前任总统特朗普被捕”的快讯,图片上,特朗普被美国警察挽住双臂前行,配合文字描述,不少网友真的以为特朗普被捕了。随后,经证实,这张图片由 AI 生成,且文字描述也为虚假消息。

  事实上,越发逼真的 AI 制图工具,必然会遇到这样的问题。仔细研究这张“假新闻图”,不难发现,无论是光影、构图还是人物神态,几乎已经达到了以假乱真的程度。这样的图片制作简单,造假成本极低,且能引起的舆论空间深远,对新闻业界造成的影响巨大。

  另一方面,AI 绘图的数据也不是凭空而来,训练其数据模型需要用都大量图片,而这些图片的来源也存在不小的版权争议。早些时候,Stability AI 的母公司 Stable Diffusion 被全球最大的图库公司 Getty Images 告上法庭,指责其使用不正当手法训练旗下的 AI 制图工具,涉及商业侵权。同样地,这些 AIGC 创造的图片,版权可以来自于拥有独立版权的作品,归属权难以辨别。

  尽管人工智能正在快速发展,其背后存在的问题还有非常大的讨论空间,版权、道德和职业素养等方面争议不断。AI 制图距离被广泛应用,还差临门一脚。

  写在最后

  可以预见,在人工智能辅助工具的加持下,人们的生活会变得更加方便,AI 生成文字、AI 制图,这一切都变得更加简单化。但愈发真实 Midjourney 也拉响了人工智能“入侵”生活的警报。

  现阶段的 Midjourney,已经可以做到“以假乱真”,这是一件好事,同时也是一件坏事。好的方面,我们可以利用自己的想象力与文字描述,创作更加真实的画作,即便自己在绘画方面没有掌握任何一项技能,这也并不是难事;而坏处是,这些看似真实的作品,拥有极高的可信度,影响着人们的判断能力。

  无论如何,人工智能的快速发展让创作变得不再有门槛,但创作的核心其实一直没有变,那就是想法与创意。Midjourney 看似强大,但无法脱离用户提供的描述,自主地创作作品,这就是为何自 AIGC 诞生以来,不少利用 AI 工具创作作品的用户,依然可以被称为艺术家。

  所以说,只要创意不断,强如 Midjourney 也抢不走你的饭碗。