文互联网怪盗团
在 5 月 15 日的火山引擎大会上,字节跳动将自研的“云雀”大模型统一改名为“豆包”大模型,并一次发布了 9 个大模型产品。毫无疑问,当前的国内生成式 AI 行业还处于群雄逐鹿的混乱状态,竞争格局高度不稳定,字节跳动在技术上并不属于最领先的(就连是否属于第一集团都还有争议);但是,凭借自己的消费端产品开发经验、内容数据储备、以及管理层的重视,它已经在国内生成式 AI 市场占据了举足轻重的地位。
我认为字节跳动的 AI 野心相当庞大:它想建立一个以消费端(C端)应用为基础,横跨C端和B端(企业端)的“大而全”的体系,然后以此为支点,进一步打入云计算等技术基建生态。相比之下,阿里是希望以云计算为基础、以B端为突破口,对C端不是特别重视;百度是摇摆于B端和C端之间,两边好像都取得了一些成果,但两边都没有做好;腾讯则尚未形成清晰统一的 AI 战略,或许形成了但是没有对外公开;至于华为的主要精力则是集中在硬件相关生态,对于 AI 应用层的实际投入有限。
基于从各种渠道获得的信息,我们可以确信,字节跳动赋予了 AI 相当高的战略定位,聚集了很多资源,并确定了未来一段时间的打法:
-
字节跳动在 AI 技术及产品方面聚集了大批精兵强将,其中包括抖音和 TikTok 当年的一些灵魂人物,这是它所能拿出的最强有力的阵容了。
-
字节跳动的 AI 业务可以说是应用驱动的,其C端应用发展非常快,数量多、垂类覆盖广,大有当年做“移动 APP 工厂”的架势。
-
豆包大模型设置了极低的价格,对于国内所有大模型创业公司而言是一个严峻冲击,不过我们尚不知道这种冲击的实际效果如何。
字节跳动大模型的负责人是朱文佳,曾任 TikTok 产品技术负责人。2023 年 11 月成立的 Flow(AI 应用)部门负责人是朱骏,是原 Music.ly 创始人、原 TikTok 负责人;Flow 移动产品负责人是陆游,曾任抖音社交负责人。不久前从抖音调任剪映的张楠(女),其重要任务也是依托 AI 去改造剪映产品。上述阵容不仅是字节跳动最拿得出手的精兵强将,在整个中国互联网行业也堪称豪华。对于其他互联网大厂而言,派出一线大将主管 AI 大模型是常见的,但是在 AI 应用层堆积这么多大将就显得太奢侈了。
有人会问:为什么不把这些大将用于抖音等“旗舰业务”,而要用于前途未卜的 AI 业务?答案很简单:因为抖音不再需要那么多人了,对于业务领导者的素质要求也有很大改变。上面列举的张楠、朱骏、朱文佳、陆游等人,几乎全是产品向人才,即所谓“打江山的人”;现在抖音大局已定,没什么江山可以打了,要打也是作为防御一方而不是进攻一方。在用户渗透率见顶、产品功能和技术不需要激进迭代的情况下,抖音最需要的是商业化人才,即“从打下的江山上收钱的人”。
过去一年多在抖音内部地位上升的人,例如新任本地生活业务负责人浦燕子,基本都来自张利东麾下,而张利东是整个中国互联网行业最成功的商业化负责人之一。抖音的商业化已经非常成功了,在此基础上若还想深挖,就要对领导团队进行改组,使其从“产品驱动”进一步转向“商业化驱动”。AI 技术及其应用,恰恰是吸纳那些从抖音退下来的“产品型人才”的最佳场所。
字节跳动的生成式 AI 业务从一开始就是应用驱动的。作为大模型负责人,朱文佳对朱骏虽然没有实线汇报关系,但仍然存在虚拟汇报关系(这在字节跳动内部相当常见);在大模型统一改名“豆包”之后,Flow 应用部门对 AI 大模型开发的影响力可能进一步加强。在其他互联网大厂,大模型研发团队可能具备相当高的自主性,乃至“自下而上”推动应用建设;在字节跳动,“自上而下”的逻辑则占据主导地位,应用团队奖其需求传导到了基础研发团队,由此形成高度实用的组织决策模式。
迄今为止,字节跳动已经推出了 11 款 AI 应用;其中,豆包是国内用户最多的 AI 独立应用,其 MAU 可能已达到 2000 万量级。需要指出的是,这并不意味着豆包大模型(原名云雀大模型)的使用量是全国最大的,因为阿里的通义千问、百度的文心一言均通过网页端和 API 拥有上亿级别的客户,其 API 调用次数也远远高于豆包。但是如果只比较独立 APP,豆包的用户优势是无可争议的——这就是字节跳动一贯的打法,以高效率的移动应用迭代去占领新兴市场。
我们不难看出,同样是在战略上高度重视生成式 AI 的大厂,字节跳动与阿里的打法完全不同。后者以阿里云为基础,先建立一个涵盖闭源和开源大模型、具备成熟开发环境和开发工具的完整生态,以B端客户为主攻方向,与现有应用融合时也是优先考虑钉钉这样的 To B 应用。前者则以豆包等C端 APP 为基础,先建立一个广阔的、用户众多的、覆盖各种垂类的 AI 移动 APP 生态,然后再逐步扩大对B端的影响力。5 月 15 日的火山引擎发布会,在一定程度上体现了字节跳动对目前的C端 AI 进展比较满意,计划加强对B端的进攻了。
豆包大模型最重要的特点是价格低廉:与类似水平的国产通用大模型相比,其 Token 价格要低 95% 以上。如果这个价格是真实的、不限量的,那么对于国内大模型创业公司而言,简直是灭顶之灾!请注意以下事实:
-
在现有的 Token 价格水平上,如果考虑到训练成本摊薄的因素,几乎所有国产大模型在财务上都是亏损的。
-
由于国产大模型太多,价格战愈演愈烈,有的大模型甚至是边际亏损的:不考虑训练成本摊薄,只考虑推理成本,毛利率仍然是负数。
-
受到国内经济形势以及人力成本低廉的影响,B端客户对大模型的价格相当敏感,即使技术水平比较优越的大模型也卖不出更高的价格。
-
虽然 AI 创投看起来很热闹,但是雷声大雨点小,创业公司拿到的钱很少(其中很大一部分还以算力形式支付),根本没有本钱打价格战。
假如豆包真的打穿了大模型的“地板价”并且坚持执行下去,其他互联网大厂肯定也会跟进,那么国产大模型创业赛道可能迎来一场浩劫。只有大厂才能在这种不计成本的消耗战当中幸存,绝大多数创业公司难逃垮掉或被整合的命运!这就是用C端应用思维做B端产品的可怕之处,至于这套思维在长期是不是可持续,那又是另一个问题了。反正字节跳动烧得起钱,其他大厂也跟得起,只有小公司受伤的世界达成了?
至于豆包大模型的技术水平如何,倒不是一个特别重要的问题。很多人会疑惑,字节跳动生成式 AI 部门的人员背景相当庞杂,其中仅有极少数具备真正的 AI 技术背景,而且是“应用驱动”的——这是否天然不利于大模型技术开发?不过,在国内现有环境下,哪怕豆包大模型的技术水平不领先,也不影响其业务应用在短期的蓬勃发展。我们需要意识到:
-
与国内最先进的一些大模型(名字就不点了)相比,豆包的最新版本可能有 10% 左右的效率差距。但是对于C端用户而言,这种差距不太明显;对于B端用户而言,巨大的价格优势足以弥补这一点技术差距。
-
国内大模型创业公司在产品、商务、二次开发等层面上,普遍处于“草台班子”阶段,能够把大模型研发做好已属不易。无论面向C端还是B端用户,与字节跳动等武装到牙齿的大厂相比,它们的天然劣势十分明显。
-
国内部分大模型的领先,并不是 OpenAI 那种划时代意义的领先,而是在小地方当老大而已。与 GPT-4 相比,国产大模型作为一个整体的落后幅度很大。既然如此,豆包与它们的短期技术差距也不是什么大不了的事情。
字节跳动的 AI 野心能否成功,取决于国内生成式 AI 应用的发展大势:它最早取得突破、实现良性循环的领域,如果是B端,那么阿里无疑将取得较大优势,百度也有机会;如果是C端,那么字节跳动的优势将相当明显。在前一种场景下,国内大模型创业公司或许还能通过对垂直应用的理解和定制开发能力,占据一席之地;在后一种场景下,成熟的互联网大厂将会一手遮天,AI 将不会促进行业“再平衡”,而只会加固极少数巨头的地位。
还有一个问题,不仅对字节跳动很重要,对整个行业都很重要,那就是算力问题。我在上文刻意忽略了这个问题,因为我不知道怎么解答。所有国内互联网大厂都储备了一定量级的 AI 训练及推理算力;具体到字节跳动,不仅自身有较大的算力储备,还从阿里云租用了大量算力。可是如果 AI 应用真能取得上亿级别的 MAU,乃至像抖音那样成为头部C端应用,目前全国的算力储备都是远远不够的。许多用户已经注意到了,一些国内 AI 聊天应用经常出现提问需要排队的现象,这就是算力不足的一个体现。这种算力瓶颈是不能依靠砸钱去解决的,因为供应商已经不再收钱了。
在可见的未来,如果我们还是无法以合理的成本解决算力问题,那么生成式 AI 在国内的C端应用的道路将会很窄,因为推理算力可能只够满足少数专业化的B端客户的需求(价格也会被推得很高)。这样的问题显然不是字节跳动或任何一家互联网大厂所能解决、所应该考虑的。我希望它能得到妥善解决,尽管我完全不知道怎么解决。