百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴

  作者/  IT 时报

  记者   孙妍

  编辑/  钱立富  孙妍

  3 月 16 日,李彦宏携百度文心一言亮相,并宣布开放邀请测试。

  虽然文心一言的能力受到了质疑,但毋庸置疑的是,百度是全球第一个挑战 ChatGPT 的大厂。李彦宏也已经预见,文心一言在与 ChatGPT 正面比较时会令大众失望,但百度认为,文心一言有两大优势:一是,画图、写长文、文字转视频等多模态生态能力是 ChatGPT 所不具备的;二是,文心一言具备中文理解能力优势。

  但是,百度自诩的优势也许会成为文心一言所面临的大问题。近日,有网友在对百度文心一言 AI 作画功能进行大量测试后产生怀疑,认为其可能只是一个套壳的 AI 模型,先将用户的中文指令翻译成英文,然后用国外开源的 AI 模型生成作品。百度方面针对此回应表示,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型 ERNIE-ViLG。

  不过《IT 时报》记者发现,百度低调向百家号入驻作者开放的 AI 图文转视频功能存在版权风险:百度视频素材来源不明。但这一风险被转嫁至媒体及其他百家号作者,若被告侵权,作者将承担巨大的版权风险。截至发稿,百度没有对文心一言版权问题进行回复。

  百度即将在今天(3 月 27 日)上线文心一言云服务,届时,AI 写作、AI 作图、AI 文字生成视频等功能都有可能对外开放,这些危险的 AI 生成作品,也许会把百度席卷至版权风暴之中。

  AI 视频潜藏版权风险

  《IT 时报》记者实测比较百度文心一言和微软必应 ChatGPT 后发现,文心一言在文学创作、商业文案创作、数理推算方面仍有较大的追赶空间。但正如李彦宏所言,百度文心一言的优势在中文理解和多模态生成能力。

  李彦宏表示,文心一言目前版本已经能生成文字、图片和语音。生成视频因为成本比较高,还没有对所有用户开放,未来百度会逐步接入。但熟悉百家号创作的用户,不少都已经体验过这个功能,每天有几万篇文章通过这个能力转成视频内容在百度平台分发。

  但是,巨大的版权风险正潜藏在这每天几万条根据文字自动生成的视频中。

  百度 AI 文字转视频功能早在 2022 年 3 月就已在百家号低调上线,百家号作者鲜少第一时间发现,是因为这一功能是在发布文章时默认勾选。在默认勾选状态下,百度 AI 会自动根据文字内容寻找合适的视频素材,生成视频后并自动发布,其中文章配图只占 10% 以内的占比,其他视频素材均来自百度视频库。

  这是属于文心一言 AIGC(人工智能自主生成内容)的 TTV(文本内容情感化分析)功能。危险的是,百度并未公开其 AI 视频素材来源。多位百家号工作人员向《IT 时报》记者表示,的确存在版权风险,至于其视频素材来源,一部分由百度进行版权采买,一部分是公开 CC0(放弃版权)素材,建议不发到百度站外,或关闭该功能。

  目前,这些 AI 视频主要自动发布在百家号及百度好看视频平台,但可以下载。“如果在百度平台内,可能由百度来处理版权纠纷,但目前还没了解到有什么版权侵权的案例。”百度百家号工作人员向《IT 时报》记者透露。

  但在社交平台上,多名百家号作者表示,AI 根据其文章自动生成的视频被投诉侵权,其账号信用分被扣至 0 分而被封禁。还有百家号作者表示,AI 自动生成视频中疑似含有版权水印。

  《IT 时报》记者发现,百度 AI 视频库里还有不少电视台等媒体拍摄视频,但无处查询视频素材出处。

  百家号只在图文转视频的相关权益说明中提到,“如果您是原创视频作者,那么您发布的图文为原创时,转出的视频会自动声明该视频为原创视频,并且视频的阅读收益归您所有。”

  截至发稿,百度没有对文心一言 AI 视频来源等问题做出回复。

  风险转嫁至作者

  更不合理的是,百度可以无偿使用百家号作者上传的内容,又将版权风险转嫁给百家号作者。

  百家号在平台服务协议 9.7 条中提到:“您使用百家号平台服务上传、发布或传输内容即代表了您有权且同意在全世界范围内,永久性地、不可撤销地、免费地授予百度及其关联方对该内容的存储、使用、发布、复制、修改、改编、出版、翻译、据以创作衍生作品、传播、表演和展示等权利;将内容的全部或部分编入其他任何形式的作品、媒体、技术中的权利;对您的上传、发布的内容进行商业开发的权利……以及再授权给其他第三方以上述方式使用的权利。”

  据此协议理解,百度有权使用百家号A作者上传的文字、图片、视频等内容,编入B作者的作品中,甚至用于商业用途,完全不需要得到A作者的授权,也不需要付费给A作者。

  《IT 时报》记者查询抖音及其他新闻媒体平台与作者签订的协议发现,并没有存在如百度百家号这般不合理的条款。

  上海大邦律师事务所高级合伙人、知识产权律师游云庭解读认为,如果上述条款有效,那百度就可以使用这些视频素材,不构成侵权也无须支付对价,如果该条款被法院认定为无效,则百度对外使用就构成侵权。

  而当该条款遇上 AI 生成内容,潜藏的版权风险将对百家号作者更加不利。游云庭认为,文字内容是媒体创作的,百度只是提供了技术服务,因为 AI 生成的视频是无权享受著作权的,所以知识产权应该归媒体所有。媒体发布的视频,对外应该由媒体承担责任,如果权利人起诉媒体就是媒体承担责任,如果权利人起诉双方共同侵权,则构成连带侵权责任。

  “由百度提供模型,素材库按照百度的合同规则使用的情况下,发生侵权可能责任是百度的。这当中任何一个节点发生变化,可能就是使用者的责任或者共同责任。这里面变量很多,要看具体细节。判断依据是人工智能生成品是不是侵权,模型数据提供者和使用者有没有过错等。”上海段和段律师事务所合伙人刘春泉认为,人工智能生成品有没有版权?与责任风险由谁承担?应该按照权利义务相一致原则来处理。纯粹人工智能生成品与动物按快门拍照片和大象画画一样没有版权。但是人利用 AI 作为工具制作的产品,符合法律规定的构成作品,可以受保护。

  制作 1 条 AI 视频最低 9.99 元

  《IT 时报》记者发现,百度已经在进行文心一言的商业化尝试,而上述 AI 文字转视频的服务正是文心一言云服务的主要盈利点。

  目前,百度大脑智能创作平台推出了两种会员套餐,视频创作会员 1698 元/月,智能写作会员 198 元/月。其中,视频创作会员的权益就包括每月 50 次图文转视频等。此外,图文转视频 200 条的报价是 1998 元,50 条的报价是 698 元,20 条的报价是 298 元,也就是说,1 条图文转视频的价格最低是 9.99 元。

  “目前不管是 API 还是线上售卖的套餐,我们都没接入素材库。”百度云客户经理没有正面回答文字转视频素材来源的问题,但就 AI 生成图片的版权问题回复表示:“AI 生成内容的可版权性在法律上仍处于不确定状态,百度不限制您将生成图片用于商业用途,但您应确保自身使用行为的合法合规性,在享有生成图片使用权益的同时,自行承担使用生成图片的一切后果。”

  截至 3 月 27 日,百度大脑智能创作平台显示,其自动创作文章已超 200 万篇,自动创作短视频已超 15 万条。

  风口上的百度急了

  “现在百度最卷的部门已经不是自动驾驶了,而是文心一言。”一位百度自动驾驶部门的员工说道。

  基于 20 多年搜索业务的积累,百度建立起世界上最大的知识图谱,包含 50 亿实体、5500 亿级事实,每天调用量超过 400 亿次。受益于百度知识图谱,文心大模型也成为全球首个知识增强千亿级大模型。研究表明,数据达到千亿级,大模型就可能发生“智能涌现”,但最快跑出 ChatGPT 的为什么不是百度?

  过去 10 年,百度在 AI 领域投入超 1100 亿元的研发费用,2019 年就推出了文心大模型 ERNIE 1.0。论起步时间,文心一言并不比 ChatGPT 晚,但论专注度,百度没有 OpenAI 聚焦。此前百度之前一直将最大的精力投向了自动驾驶,以及一系列的 AI 风口追逐,当初希壤也让百度争得了国内元宇宙“头号玩家”等名号。

  “百度的主要收入还是搜索广告,这也是百度为什么着急做文心一言的原因之一。”一位百度昆仑芯的员工认为。

  ChatGPT 焦虑已经是业内的常态。

  国内 ChatGPT 模型跟 OpenAI 的差距到底在哪里?“算法上还有细节要打磨,其次,高质量的文本数据还需要多积累。”一家研发 GPT 模型公司 CEO 对《IT 时报》记者道出了多数国内 ChatGPT 从业者的现实和心态,“类 ChatGPT 的产品可能有版权上的顾虑,但先把技术用起来,以后再想办法更好地规范。”

  不过,也有一家国内 AI 大厂的相关人士对《IT 时报》记者表示,目前已跑出 AI 作图等 ChatGPT 大模型,但是主要考虑到版权等风险,没有快速上线。

  AI 版权风暴即将来袭

  最近,网易旗下轻博客社区 LOFTER 上的大量创作者删档销号,退出平台,用行动抵制 AI 作画。起因是网易 LOFTER 上线 AI 作画功能“老福鸽画画机”,部分创作者认为该功能可能用到原创作者的画作,有侵犯版权之嫌。

  对此,网易 LOFTER 强调“该功能训练集来自于开源,没有使用 LOFTER 用户的作品数据,并明确注明不得用于商业用途”。3 月 16 日,网易 LOFTER 官微向创作者发出一份公开致歉信,为伤害了很多创作者而表达歉意。该 AI 作画功能已于 3 月 8 日下线,网易 LOFTER 单独设立的“AI 内容冒充原创”反侵权投诉渠道,截至 3 月 25 日收到 1148 条举报投诉。

  在国外,AI 侵权问题已经引起社会关注。近日,《华尔街日报》等多家国外主流新闻媒体指控 OpenAI 及其聊天机器人模型 ChatGPT 未经许可使用新闻来源进行训练,并拒绝向媒体支付相关费用。

  早在 2022 年,一名程序员起诉 GitHub、微软和 OpenAI,指控 GitHub Copilot 的 AI 编程工具抄袭代码。今年 1 月,一群艺术家起诉 AI 绘画 Stability AI Ltd.、Midjourney Inc.和 DeviantArt Inc.,声称这些公司下载并使用了数十亿张受版权保护的图像,但没有获得艺术家的授权并对其进行补偿。

  一场 AIGC 的版权风暴正在来袭。

  2 月 15 日,爱奇艺宣布将全面接入百度文心一言,双方将共同探索 AIGC 在内容搜索、内容宣发、内容创作工具、小说创作等业务上的应用。近期,文心一言开发的 AI 文档写作助手也将上线百度文库,作者只要输入主题及内容要求,AI 写作助手就能帮助搜集资料、搭建框架、填充内容、理顺文档、制造亮点,最终生成范文。

  李彦宏认为,多模态生成能力是 ChatGPT 不具备的能力,这是文心一言的优势。但是,百度一旦开放 AI 写作、AI 作图、AI 文字生成视频等,受到的版权类指控并不会比 ChatGPT 少。训练数据是否得到授权,AI 生成作品是否涉嫌侵权等问题会接踵而至。

  关于 AI 生成内容的版权问题正在业内掀起大讨论。

  知识产权界绝大多数专家都认为,AI 生成内容是不受版权保护的。中国社会科学院知识产权中心主任李明德认为,《著作权法》只保护人的作品,AI 生成的内容不是作品,没有版权。只有个人使用存在免责情况,公司拿媒体的作品去训练 AI,但没有拿到媒体的授权,就构成侵权,文字三四行就能构成作品,视频每一帧都是作品。