Meta生成式AI竞赛下一站:让开发者靠开源大模型挣

  编译程茜

  编辑云鹏

  智东西 6 月 16 日消息,今天凌晨,据外媒 The Information 报道,Meta CEO 马克·扎克伯格(Mark Zuckerberg)正在考虑将开源大型语言模型 LLaMA 的新版本商业化,让其它公司免费使用 LLaMA 开发相关 AI 软件,并允许开发者将这些产品用于商业用途。

  最初,Meta 仅将开源大型语言模型 LLaMA 授权给学术界的研发人员使用,此次将其开源模型用于商业用途或许会颠覆谷歌、OpenAI、微软等公司的商业模式,因为它们一直是以付费形式让开发者获得其大型语言模型的访问权。

  知情人士透露,此举可能会引发 AI 相关开发人员的狂热支持,因为这些开发者希望获得谷歌、OpenAI 出售的相关付费软件的替代品。同时,这也有助于 Meta 改进自己的 AI 模型。

  但 Meta 的开源大型语言模型用于商业用途的计划现在已经面临诸多挑战,此前也有相关信息爆出,OpenAI 正准备向公众发布一种新的开源大型语言模型,并且大型语言模型商业化意味着 Meta 用于训练的数据将受到更加严格的法律监管,一旦被发现其数据中包含受版权保护的部分,Meta 将承担相应的法律责任。

  01.

  此前仅做研究用途

  LLaMA 广泛应用受限

  今年 2 月,Meta 发布了开源大型语言模型第一个版本 LLaMA,可以帮助学术界的研究人员开发 ChatGPT 的替代品。

  ▲LLaMA 相关研究论文

  Meta 的大型语言模型虽然只被授权用于研究,但仍然在业内产生了不小的影响。研究人员使用 LLaMA 来开发开源模型,例如 130 亿参数规模的开源模型 Vicuna,其性能在某些指标上已接近 OpenAI、谷歌的大型语言模型。

  同时,这一开源大型语言模型在研究领域的应用也能帮助 Meta 改进自己的产品和模型。今年 4 月,扎克伯格在与股票分析师的电话会议上称,开发人员开始采用、改进这些模型或者修补安全漏洞,与此同时,Meta 也可以将他们对模型的优化集成到自己的大型语言模型中,同时使自己的消费者或者广告产品的体验更好。

  扎克伯格此前曾提到,他希望使用社交平台 Facebook 的小型企业和内容创作者都能拥有“AI agents(AI 代理)”,这些代理可以帮助企业和内容创作者自动与客户或者粉丝沟通,代替他们完成工作。他在上周接受采访时说:“LLaMA 或它背后的大型语言模型基本上将成为推动它的引擎。”

  此前,Meta 选择将 LLaMA 用于研究,所以目前其大型语言模型并不能用于商业目的,这也进一步限制了 LLaMA 的更广泛应用,同时决定了它被应用于商业应用程序的难度更大。

  而特殊情况下,LLaMA 也能用于商业用途,但会存在很多限制,比如应用程序访问的专用服务器供应量并不充足,并且这类服务器的成本会更高。

  02.

  开源模型或面临法律风险

  OpenAI 也要将开源提上日程?

  现在已经有一些开源大型语言模型发布,或者有相应公司已经将大型语言模型提上日程,因此 Meta 在开源 AI 的竞赛中可能面临诸多竞争。

  6 月初,阿联酋阿布扎比科技创新研究所开发了开源大型语言模型 Falcon,该模型已经受到众多开发者青睐。

  5 月初,The Information 曾报道过,有知情人士透露,OpenAI 正准备向公众发布一种新的开源大型语言模型。这一计划如果能被推进下去,OpenAI 可能会进一步对 AI 行业产生重大影响。

  还有一位直接知情的人士透露,OpenAI 已经内部讨论过将大型语言模型用于商业用途。但值得注意的是,这一大型语言模型的性能可能与其最先进的 GPT-4 有一定差距。

  除其它大型语言模型的竞争外,Meta 将其下一个版本的大型语言模型商业化时,如果一旦被发现其使用受版权保护的数据进行训练,可能使该公司承担潜在的法律责任。

  上个月,Meta 的首席 AI 科学家 Yann LeCun 在接受采访时也提到了为什么 Meta 迄今尚未许可 LLaMA 用于商业用途,他谈到两个原因,首先他并不是唯一参与此类决定的人,其次这一决定的执行可能存在法律责任问题。

  不过,据一位直接了解情况的 Meta 前员工称,Meta 在发布 LLaMA 第一个版本的时候就解决了法律问题,当时 Meta 的法律、产品、隐私部门的员工就如何将其授权给开发者进行了广泛的讨论。

  Meta 和 OpenAI 的发言人都拒绝就上述信息置评。

  03.

  结语:开源让生成式 AI 竞赛继续升温

  此前,Meta 将 LLaMA 模型开源开放,就在业界引起了广泛讨论。其中,谷歌高级工程师卢克·塞尔瑙(Luke Sernau)关于开源大型语言模型的一份内部备忘录引起了众多开发者共鸣,他提到,“如果有免费、高质量的替代品,谁还会为有使用限制的谷歌产品付费?”。尽管他可能夸大了开源大型语言模型的影响力以及开源带来的挑战,但他的一个观点得到了众多从业者的认可,那就是 Meta 将从发布其开源模型中获益。

  据了解,LLaMA 发布几周后学术界就通过这一模型开发了开源软件,打造了 ChatGPT 等软件的免费替代产品。

  现在,Meta 要将新版本的大型语言模型用于商业用途,又有相关爆料显示,OpenAI 也将加入开源大型语言模型的竞赛中,下一步围绕开源可能会成为 AI 产业玩家们的又一大竞争点。