ChatGPT很厉害,但还有关键问题悬而未决

  出品虎嗅科技组

  作者齐健

  编辑陈伊凡

  头图 6penAI 生成

  1 月 27 日,路透社消息称法国顶尖学府之一的巴黎政治学院宣布该校将禁止使用 ChatGPT,对使用该软件的处罚可能会严重到被学校开除,甚至被整个法国高等教育开除。

  “ChatGPT 软件正在向全世界的教育工作者和研究人员提出一个涉及欺诈和剽窃的严肃问题,”巴黎政治学院在这份通知中称,“在没有透明参考的情况下,除特定课程目的外,学生不得使用该软件制作任何书面作品或演示文稿。”

  巴黎政治学院并不是第一所宣布禁用 ChatGPT 的学校。ChatGPT 发布不到一个月,就引起了美国教育界的高度重视。多所美国中学及大学陆续宣布校内禁用 ChatGPT,并通过减少课后作业的方式,避免学生利用家庭网络访问 ChatGPT 作弊。美国纽约市教育部,甚至要求全纽约市的学生和教师不要使用这款 AI 工具,并对下辖的教育部设备或互联网设卡,限制访问 ChatGPT。

  AI 生成内容的伦理和法律问题,正在引发社会各界的广泛讨论与思考。

  AI 背后的学术隐忧

  “ChatGPT 很好玩,但它不是作者”,这是《Science》期刊主编 Holden Thorp 在 1 月 26 日发表的一篇关于人工智能的社论。Holden Thorp 指出,“原创”是 Science 发表论文的基础,而利用 ChatGPT 编写文本的行为,等同于从 ChatGPT 中抄袭。

  “我们正在更新编辑政策,要求作者不要使用 ChatGPT(或任何其他人工智能工具)生成的文本、数据、图像或是图形。违反这一政策将被 Science 期刊视为学术不端行为,这与篡改图像或抄袭无异。”不过 Holden Thorp 也表示,上述规定并不包含 AI 论文中以研究为目的生成的数据。

  在 AI 学界,知名机器学习会议之一的 ICML(International Conference on Machine Learning)最近也宣布禁止“发表包含从大型语言模型(LLM,Large Language Model)生成的文本(例如 ChatGPT)的论文(相关研究除外)”,以免出现“意想不到的后果和无法解决的问题”。

  对于学术期刊和顶会论文来说,AI 生成的内容最大的问题在于知识权属和责任确定问题。作为论文作者,研究人员无疑要对论文的观点和内容负责,而 AI 要如何对文章内容负责?如果 AI 生成的内容出现了谬误、不恰当、造假,甚至是抄袭剽窃,又该如何追责呢?

  考虑到“AI 作弊”带来的普遍问题,目前从 OpenAI 官方,到学术期刊出版商,以及“草根”开发者都在研究如何分辨一篇文章的“作者”到底是人还是机?

  目前,OpenAI 正在研发相应的 AI 检测工具。OpenAI 客座研究员 Scott Aaronson 在德克萨斯大学的一次演讲中表示,他们正在通过给 AI 生成内容打“水印”来打击作弊。这项技术将通过调整 ChatGPT 生成单词的规则,在生成内容的特定位置制造“伪随机”的特定单词,读者很难察觉,但就如同密电码一样,“握有密钥”的人就轻易判断这篇内容是否是 ChatGPT 生成的了。

  《Nature》的出版商 Springer Nature 也正在开发可以检测 LLM 的技术。而就在前不久,普林斯顿大学的一位 22 岁的华裔学生 Edward Tian 研究出了一款专门给 ChatGPT 挑毛病的应用 GPTZero,可以通过检测文本的“困惑性(Perplexity)”和“突发性(Burstiness)”这两项指标,来判断内容是人类创作还是机器生成。

  AI 引发版权问题

  在校外,AI 本身的“道德”问题,则让美术“老师”们对新生的 AI 绘图工具提出了严重的质疑,这直指另一个至关重要的问题——版权。

  自从 AIGC 火了以后,很多行业的配图工作变得轻松了许多。以媒体行业为例,严肃媒体对新闻配图要求高,既要符合文意,又要对版权负责。所以无论是美术作品还是照片,要么是亲手创作,要么来自授权图库,但很多文章受客观条件限制,要找到一张符合要求的配图并不容易。

  有了 AI 绘图以后,很多媒体人开始尝试用 AI 画配图,甚至是直接绘制新闻人物的肖像。那发自己用 AI 做的图,总不会侵权吧?这个问题,还真不一定。

  使用 6penAI 生成的拜登&特朗普画像

  2022 年下半年,AIGC 刚刚蹿红,就有一些小有名气的艺术家对 AI 绘图提出了抗议。2022 年,Erin Hanson 等众多美国艺术家发起了反对 Stable Diffusion 的抗议行动,他们认为 Stable Diffusion 生成的部分画作抄袭了他们的风格,而这种行为严重侵犯了他们的合法权益。

  AIGC 虽然叫做 AI 生成,但其本身并没有创造能力,只能通过不断学习人类的生产过程,照猫画虎,AI 绘图就是典型。在 AI 训练过程中,需要“投喂”大量的人类画作,从而学习人类的构图、绘画技巧,实现 AIGC(AI Generative Content,AI 生成内容)。

  不过在这个生成的过程中,AI 学的实在太像了,以至于很多画作直接与模型库中的人类画师风格完全一致。

  “稍有名气的画师可能都遇到过作品被盗用、创意被侵权的事件。”一位国内某知名游戏公司的美术总监向虎嗅表示,虽然 AI 没有完全盗用画师的作品,但画师对风格上的抄袭也是很难接受的,不论抄袭者是人类还是 AI。“如果有人拿着与我绘图风格完全一样的画,说是学习或是参考我觉得没什么。但如果说这是他‘生成’的,那就跟声明原创没什么差别了。不管是否用于商业用途,我都会觉得被严重冒犯了。”

  AI 的抄袭、剽窃和作弊不应该只是道德问题,还需要法律法规的约束。而目前,AI 在很多领域都存在法律盲区。

  我国 AI 领域的立法还处于建章立制阶段。当前已经出台了两部与 AI 相关的监管条例,分别是《互联网信息服务算法推荐管理规定》和《互联网信息服务深度合成管理规定》,并均已开始生效。除此以外,还有一些分散在《民法典》、《数据安全法》、《网络安全法》、《个保法》、《网络音视频信息服务管理规定》、《网络信息内容生态治理规定》等法律法规中的个别条款规定以及一些支持产业发展性质的文件,目前来说还没有成为一个完整的体系。

  “AI 生成内容是一项新兴的技术,法律的滞后性和稳定性导致目前还没有专门对这种 AI 疑似抄袭的现象进行规制。”观韬中茂律师事务所合伙人王渝伟表示,从国外行业实践来看,越来越多的平台和 AI 绘图工具对作品版权作出了严格要求,谨防 AI 抄袭导致著作权侵权。在我国,目前还是应当根据《著作权法》,判断 AI 生成内容与人类艺术家作品之间是否存在实质性相似,进而认定是否抄袭。

  除了涉嫌抄袭艺术家作品的 AIGC 内容,在另一方面,即使是随机生成的内容及画作,也还是会涉及版权问题。

  AI 绘图在抖音和小红书上刚刚兴起之时,即有脑洞大开的网友提出,可以把 AI 生成的图片挂到付费图库作为收费资源,实现“躺赚”。

  面对这样的骚操作,Adobe 选择“有限制”地开放 AI 绘图。只要符合特定标准,就允许在图片库 Adobe Stock 中上传生成式 AI 艺术品进行售卖。但上传前必须标记 AI 制作的内容,并且需要拥有其参考图像或文本的商业版权。

  作为一款开源模型,Stable diffusion 的开发者 Stability AI 和 RunwayML 则认为既然开源,那么它也应该依此引用开源 CC0 协议,即版权归公,同时任何人也可以自由地使用,包括商业使用。而对于 DALL-E 2 和 Midjourney 这样并未开源的 AIGC 模型来说,生成内容的权属则相对模糊。

  目前 AIGC 市场上也存在很多版权乱象,一些基于 Stable Diffusion 开发应用的厂商声称,使用自己 AI 程序生成的图片版权归自己,甚至依此生产 NFT 向使用者兜售。

  对此,王渝伟认为,AI 应用的使用者,在使用这种应用进行创作时,生成的图片如果符合独创性的要件,就能够构成《著作权法》上的作品。而厂商已明确告知了使用者著作权的归属问题,相当于在合同中已经进行了约定,所以这种作品的著作权应当归属于厂商。并不是说 AI 应用基于开源模型开发,它所生成的作品就不存在著作权,还是应当根据《著作权法》的规定判定著作权归属。

  “目前相关法律制定最大的障碍和阻力,可能是法律如何保持科技发展和伦理价值的平衡。”王渝伟提出,一方面,AI 技术的高速发展,可能会与人类的基本伦理认知相违背,违反社会公序良俗;另一方面,法律的规制也不能对 AI 技术设置过于严苛的标准,影响 AI 的进一步发展。