本文字数:2296,阅读时长大约 4 分钟
导读:2 月 21 日晚,第一财经连麦学界、法律界大V,共同探讨了 ChatGPT 的应用、误读以及其牵涉的法律风险和商业伦理问题。
作者 第一财经刘晓洁
时下科技领域最热的概念莫过于 ChatGPT。
2 月 20 日,复旦大学邱锡鹏团队推出中国版 ChatGPT“MOSS”,这是国内第一个公布的对话式大型语言模型,热情的用户涌入一度导致其服务器被挤崩。
21 日晚,第一财经连麦学界、法律界大V,共同探讨了 ChatGPT 的应用、误读以及其牵涉的法律风险和商业伦理问题。
复旦大学计算机科学技术学院教授张奇参与了本次讨论,他正是推出 MOSS 的复旦大学 NLP 实验室的核心成员之一,就当下所面临的一些争议,他表示 MOSS 并不代表国内最好的模型,团队只是想在学术上进行数据收集,进入更详细的探讨。
作为专业研究者,张奇复现了 ChatGPT 推出背后所需要投入的资源,这是一个非常耗时、耗人且耗钱的一个过程。他表示,这不仅对于学术界来说是不小的投入,甚至对于互联网大厂来说,做这类研究都是一个不小的投入。
MOSS 迈出第一步
相对于 ChatGPT,MOSS 仍然有非常大的差别,在直播中,张奇直言,“ChatGPT 是千亿级的模型,我们只有百亿级。此外在指定微调的阶段 ChatGPT 并没有公开,但是能够看到的版本已经有 1800 种任务,团队只有数百种任务,规模上远远小于它。”
张奇所在的复旦团队从整体上复现了 ChatGPT 的步骤,他解释道,语言模型的最后一步需要人的参与,如果没有用户的真实数据,团队很难对模型进行提升,也很难再进行下一步的研究。这也是 MOSS 推出的背景。
推出当时团队并没有考虑太多,随后而来的热度和争议也是团队没有想到的,“我们低估了 ChatGPT 和 MOSS 的影响力。”
面临争议,2 月 21 日,复旦团队在 MOSS 官网发布公告致歉,称模型还不成熟,距离 ChatGPT 还有很长的路需要走,“我们一个学术研究的实验室无法做出和 ChatGPT 能力相近的模型,MOSS 只是想在百亿规模参数上探索和验证 ChatGPT 的技术路线,并且实现各种对话能力。”
对于 ChatGPT 背后模型所拥有的 1750 亿的参数规模,张奇表示,学校这类机构很难去完成,目前百亿级的规模都已经非常困难。
按照 ChatGPT 目前开源的最简单的复现版本、最便宜的模式去计算,要做到 1750 亿的参数规模,需要大概 6000 万的硬件成本,同时运算 3.5 个月。这还是所有事情都做对的情况,如中间有参数调整,或者想加速训练过程,就需要更高规模的投资。
按 ChatGPT 的规模估算,张奇判断 OpenAI 大概为此耗费了十几亿的硬件投资,不包括顶级的算法研究人员的投资,以及后续对大量用户数据收集的投资。
“这其实是一个非常耗时、耗人且耗钱的一个过程。”不仅对于学术界来说是不小的投入,甚至对于互联网大厂来说都是一个不小的投入。
因此,在资金、算力的投入门槛下,面临应用场景和商业化的不确定性,团队和企业敢不敢去做这类研究,每一步都制约着在这个领域的进步。
尽管当下面临很多问题,张奇所在的实验室对于 ChatGPT 所带来的通用人工智能的可能性仍充满期待。
“实验室很多同学都已经是 997,我们大概 8 点就已经到办公室,晚上 10 点才回家。这种状态就像我们看到了莱特兄弟的飞机飞 10 米的那个状态,然后我们想把它飞到 100 米,去实现那样的可能性。”
ChatGPT 被过誉了吗
ChatGPT 的能力到底如何?张奇团队对此做了一个针对 ChatGPT 的高考测试,发现其展现了很好的理解和推理能力。
以 2022 年的高考全国卷为例,在把一些复杂的问题排除掉后,ChatGPT 可以达到 76% 的准确率和 67% 的得分率,在文科上能够达到 78% 的得分率。综合来看,ChatGPT 在高考中可以获得 500 分左右的成绩,相当于是二本线的一个结果。
但就目前 ChatGPT 所引起的追捧来看,它是否被过誉了?上海大邦律师事务所高级合伙人游云庭提到,自己是国内较早使用 ChatGPT 的用户,但用了两天就失去兴趣,因为现有的互联网对他这类成熟网民来说仍然是更好的选择。
游云庭并不认为 ChatGPT 可以颠覆搜索,ChatGPT 更多偏向于咨询,和搜索引擎是两类产品,且主流用户已经适应了搜索引擎,以目前 ChatGPT 所展现的能力还无法替代。
此外,ChatGPT 还需要很长的时间去开发进行二次落地,“像 VR、元宇宙这些概念提出来之时都很热,但现在都相对平静了,因为这些技术的开发实际上都需要很长的时间,这是误导性的问题。”游云庭表示。
复旦大学管理学院助理教授李文文还提到,目前大众的一个误区是对 ChatGPT 取代人类的工作的担忧,现在网上一些文章或者短视频,用一些或许比较夸张的标题营造了一些恐慌,对于不了解 AI 产品或是技术的人,甚至会对技术产生消极的情绪。
但实际上,就现阶段的 ChatGPT 而言,它仍然是一个对话型的 AI 产品,距离商业落地有比较长的路要走。在试用 ChatGPT 的时候也会发现它其实存在一些事实性的错误。
如果仅仅把 ChatGPT 当做娱乐向的产品,错误是可以接受的,但如果要将它应用在企业的业务,如医疗健康、法律领域,它会产生一些严重的后果。
基于此,李文文认为 ChatGPT 并不会对人类的工作造成太大威胁,未来可能更多是人工智能产品被引入到更多的行业,去辅助而不是取代我们的工作。
作为一名律师,游云庭也提到,作为一个工具,ChatGPT 确实能够一定程度提高效率,但并不会对法律行业造成挑战。
“我试着用 ChatGPT 生成一份合同,给它设定一个任务,给了一些条件,这份合同出来之后我松了一口气,我的职业看起来是比较难取代的。”游云庭提到,在 ChatGPT 的合同中,有一些逻辑上的错误,前后仍然有一些矛盾,还需要很多的细调。但仅仅是这样的细调,在人工智能领域或许就需要耗时不短的时间,才能达到对于商业化的要求。
在诉讼方面,美国一家企业已经开发了一个人工智能律师,一定程度上的确可以取代律师的工作,但法律服务在所有国家都是有壁垒的,包括律师的牌照。而是否允许人工智能参与到法律服务中,还涉及到人工智能的伦理问题。
“在这些问题没有搞清楚之前,我相信任何一个国家的律师主管部门,都不会轻易给人工智能发牌照。从诉讼的角度来说类似 ChatGPT 的一些应用,要挑战律师饭碗也挺难。”游云庭说。