对话戴文渊:大模型价格战不解决核心问题

  网易科技重磅推出系列对话栏目《态度 AGI》。过去三年,AI 变革风起云涌,全球科技秩序正在重构,通往 AGI 的道路或许正在悄然临近。本栏目以 AGI 为题,将对话 100 位 AI 专家、企业家、投资人,试图拨开云雾,与大家一道见证 AGI 时代的到来。第三期对话第四范式公司创始人、CEO 戴文渊。

  出品|网易科技《态度 AGI》栏目

  作者|薛世轩

  编辑|丁广胜

  在大模型商业化如此卷的当下,第四范式仿佛清流一般的存在。

  他们专注在自己的“三驾马车”,即先知 AI 平台、SHIFT 智能解决方案、式说 AIGS 服务。

  第四范式公司创始人、CEO 戴文渊的思考是,所谓通用的大语言模型,或者相关的多模态大模型,并不解决企业核心问题。我们需要知道,正在能产生价值的点在哪里。

  近期,第四范式发布 2024 年第一季度财报,实现营收 8.28 亿元,同比增长 28.5%,毛利润 3.41 亿元,同比增长 21.1%。

  第四范式已经遵循自己的方法论,靠大模型赚到了钱。

  谈及价格战,戴文渊淡然表态,现在绝大多数的价格战是一个通用大语言模型的价格战,这来自于同质化的竞争。

  “其实并不需要去关注价格战本身,期望是随着整个市场越来越趋于理性回归到价值,让市场更加关注到生产力能够更好的作用于什么场景。”

  戴文渊表示,我们先不要太多的关注所谓的竞争。我们存在的价值不是为了打败别人,我们存在的价值是为了去创造价值。

  以下为对话戴文渊精华内容(经整理):

  一、价格战不是关注重点

  问:先知 AI5.0 业务开展情况如何?落地在什么场景?

  戴文渊:我们的定位和你在市面上看到的绝大多数的大模型不太一样,我们致力于用生成式 AI 帮助企业打造它的场景所专属的基础大模型,你在市面上看到的绝大多数的是所谓的通用的大语言模型。我们现在看到的绝大多数的市面上通用的大模型,并不解决企业核心问题。

  其实我们看到绝大多数的企业核心问题,其实需要解决的是基于一个企业的专属场景下的模态,比如说以风控场景为例,我们生成的不是一段文字或者一张图片,而是要生成一个客户在下个月或者下两个月的报告,对于一个慢病管理的场景,生成的可能是未来三到五年内的体检报告,同样不是文字和图片。先知 AI5.0 解决的是对于任意模态,都要能够基于这个场景下的该模态数据,帮助企业构建它的基础大模型,从而解决它的核心问题。

  再回到您说的落地在哪些场景,除了我介绍的金融风险的场景、慢病管理,也尝试在一些制造业,比如说设备故障场景,我们都可以基于他们的这些场景的模态数据,帮助他们去解决这些场景问题。

  问:您对近期大模型价格战怎么看?

  戴文渊:实际上我认为我们并不需要去关注价格战本身,因为价格战其实是来自于同质化的竞争。今天看到绝大多数的价格战是一个通用大语言模型的价格战,而我们绝大多数的问题不在这方面,针对大模型我们是具有核心的优势以及壁垒的。

  问:第四范式的技术优势有哪些?

  戴文渊:我们和市面上绝大多数的大模型公司面临的主要区别是,他们要解决几个模型,集中全部的力量做好一个大语言模型,集中全部力量做好一个视频的模型,我们需要的是各行各业万级、十万级的大模型构建问题。所以,为什么我们会非常强调一个技术是自动机器学习,是因为我们做一个模型,一个优秀的几百个科学家团队做一个模型,把一个模型做好就行了。但是如果你要做一百万个模型,不可能招那么多科学家去做一个模型,全世界也没有那么多科学家。

  所以,我们需要能够让这些普通的开发者在平台上把大模型做出来,自动机器学习要解决的问题是让不同的开发者在平台上把模型做出来。在自动机器学习领域,我们已经深耕了将近十年,在业界处于一个领先位置。同时,我们非常关注一些能够让企业用的起的技术,如果关注我们 3 月份发布的推理框架,能够大概把推理的性能提升五到六倍,这些都是我们非常注重去投入的。

  获取 AI 成本比较高的,我们希望能够通过不断的科技投入,让我们的客户用的起,让普通的开发者可以构建 AI,让客户以越来越低的成本获得 AI。

  我们期望的是随着整个市场越来越趋于理性回归到价值,让市场更加关注到 AI 作为生产力能够更好的作用于什么场景。

  问:先知平台已经经历了第五个版本的迭代,客户在使用先知平台或者相关的生成式 AI 的应用,它在使用门槛包括价格成本方面,是不是已经有一些直观的数据可以分享一下。

  戴文渊:实话实说,每一代都有每一代做到的成绩,也有每一代的遗憾,所以为什么不断的推出新的模型,比如说先知 2.0 的时候,在那个时候绝大多数的客户使用先知平台的门槛很高,只有最优秀的一些科技人员能够和先知平台做出比较大的模型,绝大多数的客户使用先知平台的门槛比较高。

  然后是开源的框架,从 2.0 开始推出自动机器学习这样的技术,致力于把门槛下降。3.0、4.0、5.0 一直以来我们的方向是不变的,3.0 是打通端到端,从数据到上线的平台,4.0 希望让 AI 能够更好的服务于企业核心竞争力。

  再到 5.0 我们希望把先知打造成一个做垂类的生成式 AI 大模型平台。其实都在不断的下降企业获得大模型的门槛,同时我们每一代都在不断的优化获得大模型的成本,优势在于我们在软件端,我们也可以知道软件如何和硬件做规划,软件能够获得五到十倍的提升,这是我们坚持在算力端提升的核心价值。

  二、要让 AI 作用在有价值的地方

  问:业界有一些担忧,微软、苹果整合后的 AI 大模型操作系统在市场端将会对中国形成碾压的优势。国内缺乏底层创新,这种通用的大模型已经毫无疑义,所以业内才会卷垂直领域的大模型,有一种观点就认为我们的底层创新都不行,我们去卷产业大模型、卷垂直领域的大模型有什么意义呢?您是怎么去看待这种观点呢?

  戴文渊:我觉得这个事情我们还是回归到价值本身,没有价值的就没有意义,如果算的出价值为什么不去选择呢?

  我们算一算中国企业创造的总值有多少,如果 AI 都是作用在它的核心竞争力的地方,人工智能哪怕能够帮企业提升1% 的业绩,所有的企业业绩都提升1%,这是多大的一个价值。现在更多的其实不要去担心人工智能创造价值的能力,担心的是我们到底用不用人工智能作用在了有价值的地方。

  问:您觉得现在国内的人工智能和国外的差距有多大?

  戴文渊:芯片限制是一个层面,但是对人工智能来说不是光看芯片。另外一个是数据,数据代表是人工智能努力的程度,看了越多的数据,就看了越多的书本,前提是这些数据是高质量的。如果看的这些书是一些不好的书,看的越多就越差。

  今天你有机器人,这个机器人的智商有一点差距,你要做一个更好的成果出来,你怎么做呢?应该更努力一点,勤能补拙。怎么更努力一点呢?你要找到我们在数据上有优势,我们比别人看更多的书,最后我的能力就比你好。我们什么地方更有优势?我们国家有很多的产业不一定是世界上最领先,但世界上规模最大。

  世界上规模最大的产业,意味着数据量是世界上最大,意味着获取数据的成本是世界上最低的。

  就像慢病管理的合作,我们合作的这家医疗机构所获取的数据量就是全世界最大的,并且他们获取数据的成本比海外很多国家有两个数量级以上的成本优势。在这个地方,我们就是有机会做出世界上最好的成果,并且价值也非常大。

  所以,我们先不要太多的关注所谓的竞争。其实我们作为科技从业者,我们存在的价值不是为了打败别人,我们存在的价值是为了去创造价值。我们在这边有什么样的市场和什么样的价值,我们有什么样的客观优势,把这些优势发挥出来,做出好的东西传递给市场做出价值,这是我们最大的价值。

  问:接触C端大模型的时候,他们会提到遇到训练数据优质数据短缺,或者质量参差的一个问题。第四范式做行业大模型,或者落地行业的时候,对于数据这一块是怎样的业务感知?是不是也会面临这样的问题?

  戴文渊:这个问题一定都会遇到,C端我理解的是大语言模型,实际上很多时候构建大语言模型的时候,要做的是减数据,不是加数据。把一些劣质的数据从数据集里拿掉以后,这个模型会更好。同时,场景数据也是一样的,我们经常和客户交流的时候,让客户放弃什么东西,很多客户历史上的数据质量不好,这些数据训练出的垂直模型,从开始的时候有一些不好的数据,有的时候做减法更好,我们经常引导客户先要想清楚这个场景的优质数据是什么,我们去获取和整理这个优势的数据,最后再为这些模型获得优质大模型的产出。其实,每个模型都是类似的,在C端或者大语言模型看到的,所有的大模型都是一样的。

  问:您觉得人工智能+会形成怎样的产业生态呢?中国的人工智能到底要走怎样的道路呢?

  戴文渊:产业生态毫无疑问从终端的消费者到产业再到技术的提供方,然后再到算力的提供方,再到能源的提供方,这是一整个产业。其实整个 AI 从最终的消费者开始带动,其实是可以带动一个巨大的产业链升级。

  中国的人工智能,确确实实它的优势是在产业端,因为中国有很多的产业都是全世界最大的,并且中国的这些产业,不仅是产业规模大,市场规模也大,两端大代表的是我们数据上有优势,客观上来讲我们在这些产业上面 AI 比别人要努力一点。这些产业我们优化了以后,它所带来的价值也是巨大的。所以这两个方面来看,中国 AI 的机会确实在产业生态是更大的。