Why always百度?OpenAI有的他有,OpenAI没有的他还有

  鱼羊一言发自凹非寺

  量子位公众号 QbitAI

  此时此刻,枕戈待旦,全力冲刺。

  这是最新一季财报披露后,李彦宏在全员信中表达的百度状态。

  也是大语言模型技术火爆中,寻找中国版、抓住人工智能新范式机遇的呼声中,百度获得的期待——关于谁能给出最好回应?

  在中国,最先被想到、最后被确定、最被多数人看好的,唯有百度。

  看好百度,确实有最直接的原因:OpenAI 有的他有,OpenAI 没有的他还有。百度早就完成了大模型技术研发,文心大模型技术力突出,产业落地还领先;百度还有天然的场景和资源,先进的计算资源,无人能比的中文搜索优势。

  但让李彦宏壮怀激烈的,不止于此。

  他看到的是人人都开始谈论人工智能的颠覆性影响;他激动的是生成式 AI 和大模型的智能涌现给计算范式带来的全新机遇,他认为 AI 技术已经发展到一个临界点,各行各业都不可避免地被改变。

  百度创始人还强调,曾经的提前出发和布局,只为现在机会来临时能够率先抓住机遇,勇敢创新,用创新驱动新的增长。

中国 AI 市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。而百度作为中国人工智能市场长期增长的最佳代表,正站在浪潮之巅。

  而这种前所未有的变革,将从文心一言带来的重塑开始。

  最受关注的还是大语言模型“文心一言”

  此前,百度已经释出 3 月份上线新一代大语言模型产品“文心一言”的消息。

  而李彦宏内部信也用一半篇幅,进一步显现了百度对这一生成式 AI 产品的重视。

  根据内部信,百度计划将多项主流业务与文心一言整合:

  · 文心一言与搜索整合,将引领搜索体验的代际变革;

  · 文心一言将通过百度智能云对外界提供服务,根本性地改变云计算市场的游戏规则;

  · 文心一言将进入 Apollo 智舱系列产品,并与小度进行集成。

  就是说,文心一言这一对话类生成式 AI,不仅会出现在百度自家的搜索、语音助手产品中,还将对外输出。

  目前,已经有不少媒体、机构,宣布将接入文心一言。

  在财报电话会上,针对外界普遍关心的文心一言的表现,李彦宏信心十足:百度的文心大模型是中国市场非常本土化的大语言模型,这意味着百度现在正在研发的文心一言,将比国外开发的模型更适合中文和中国市场。

  财报发布后,百度美股盘前涨超6%。

  种种现象表明,在生成式 AI 这件事上,国内最受关注、最受期待、最被看好的,还是百度。

  其中原因,既与公司属性有关,又是百度占据“地利”的体现。

  自大语言模型引发热议以来,不少业内人士都指出,此类产品需要耗费巨量云计算资源。OpenAI 本身的成功,离不开微软这棵大树:

  早在 2019 年,微软就给 OpenAI 砸了 10 亿美元,成为其独家云计算供应商。截至今年,微软已累计向 OpenAI 投了 130 亿美元。

  因此仅从成本的角度考虑,国内 BAT 等本身拥有云计算业务的大厂,天然具有算力资源优势。

  在其中,百度在算法和数据方面的储备优势最为明显。

  最直接的技术储备方面,百度在大模型上的技术积累可以说是国内独一档的存在。

  2019 年,百度就提出了 ERNIE。ERNIE 是一种知识增强的预训练模型,即在深度学习的基础上融入了知识图谱。

  中文语言环境中,ERNIE 在完形填空、命名实体识别、情感分类等任务场景中,都有优于 BERT 的表现,曾一度登顶 NLP 权威数据集 GLUE 榜单,并创纪录地首次突破了 90 分大关。

  百度的大语言模型文心一言正是在 ERNIE 的技术树上发展而来。

  其大模型体系,已经横跨 NLP、CV、多模态、生物计算四大基础领域,还在电力、燃气、金融、航天、传媒等 11 个行业中以行业大模型的形态,积累了落地实践经验。

  从 ERNIE 1.0 算起,文心大模型在公开权威语义评测中已斩获十余项世界冠军。

  值得一提的是,在 Chatbot 初露头角之时,百度就发布过开放域对话大模型 PLATO-XL。这是全球首个百亿参数的中英文对话预训练生成模型。

  算法之外,以搜索为核心业务的百度,还拥有 20 年产品业务沉淀下来的海量数据和用户。

  数据对于大模型的意义无需多言。而英伟达 AI 科学家 Jim Fan 还做过这样一个对比,阐述谷歌作为后发者,在面对 OpenAI 挑战时仍然具备的优势:

  即在用户量远超对手的情况下,一旦开放用户体验与用户持续反馈的飞轮建立起来,对话 AI 产品的反馈迭代速度将直接起飞。

  对于百度而言,这一点同样适用。2022 年 12 月数据显示,百度 App 月活跃用户达到了 6.48 亿,同比增长4%。

  更重要的是,在开发大模型这件事上,李彦宏内部信中也强调了百度已经具备的完整技术栈:从底层芯片,到训练框架,再到模型、应用,百度均有自研技术。

  这也就意味着,百度有能力把算力、算法、数据三大要素集结到同一个体系结构当中。这种综合优势在中国乃至全球范围内,都只有少数几家人工智能公司具备。

  自身实力过硬之外,百度还占据“地利”。

  首先,相比于谷歌的措手不及,中文搜索领域事实上存在缓冲区,并且目前,国内并没有能立刻补上对话 AI+ 搜索应用这一空白的公司。

  而且百度不仅占据中文搜索无可动摇的地位,还握有更懂中文的文心大模型,更有完整技术堆栈——近期市场上的稳定表现和反馈,也就都在情理之中了。

  其次,在 AI 产业化落地进程中,百度一直扮演着排头兵的角色。在年初的百度 AI 开发者大会上,李彦宏还曾表示,真正的创新要靠产业实际应用中的“反馈”才能实现。

  在国内,百度是第一批把大模型真正落地应用到产业当中的公司。比如国家电网,就和百度合作打造了电力大模型,以解决复杂自然环境中设备巡检等业务问题。在应对产业需求上,百度有着长期实践和第一手应用经验。这对于百度而言,其实也蕴藏着一个新的机会:文心一言不仅能够和百度搜索强强结合,在对外合作中,也更有可能直接给合作方带来应用价值。

  所以从另一种维度看来,大语言模型创新、文心一言对于百度,与其说是市场竞争带来的压力,更像是一个 AI 时代的新机会,一个 AI 市场迎来爆发性增长和商业机遇中,给一个长期守望者和准备者,激励式的机遇。

  更关键的是,在这轮机遇面前,百度可谓潮平岸阔风正帆悬。

  在过往三年严峻大环境考验中,百度一手提升了健康经营度,展现了稳健态势;另一手通过组织调整和管理重组,建立了一个更高效的组织;而财报业绩,最能反映变革效果和当前状态。

  财报业绩如何反馈?

  百度交出了一份亮眼的财报,连续四季度业绩超市场预期。

  2022 年全年,百度实现营收 1236.75 亿元,归属百度的净利润(非美国通用会计准则)206.8 亿元,同比增 10%。

  第四季度,百度实现营收 330.77 亿元,归属百度的净利润(非美国通用会计准则)53.71 亿元,同比增长 32%。

  核心收入方面,2022 年,百度核心收入为 954 亿元,与去年基本持平。但值得关注的是,其中非广告收入 259 亿元,同比增长了 22%,占到核心收入的 27%。

  其中,AI 驱动下的云计算和创新业务,正在展现出新增长引擎价值。

  财报披露在 2020 年和 2021 年,非广告收入在百度核心收入中的占比分别为 16% 和 22%——智能云带来的贡献相当突出,AI 加持下的百度智能云,为行业提供标准化的解决方案,提高了利润率。

  根据 IDC 报告,2022 年,凭借云智一体的优势,百度智能云连续四年稳居 AI 云服务市场第一。另外,百度的智能交通解决方案,以累计合同金额超过千万元人民币订单计算,已经被 69 个城市采用,而且落地城市的缓堵保畅中发挥关键作用。2023 年春节期间,保定、株洲、阳泉、重庆等多个城市,市内出行强度创 5 年来新高,而通行效率提升均达到 15% 以上。

  除了将自动驾驶技术与大交通、云计算融合,在终端落地中,百度也巩固了全球最大的自动驾驶出行服务商地位。截至 2023 年 1 月底,萝卜快跑累计订单量超过 200 万。并且在全球“无人化”落地的关键分水岭中,百度完全无人驾驶运营取得了突破,开始在武汉和重庆提供全无人出行服务,并获准在北京开展全无人驾驶测试。

  这种行业第一,百度财报还披露了两个:一是智能终端,小度在 2022 年前九个月,位居中国智能屏和智能音箱出货量第一。另一个是 AI 开发者平台,截至 2022 年底,百度飞桨平台开发者已经发展到 535 万,服务了 20 万家企业,同样位居中国深度学习市场应用第一。

  所以确实如李彦宏所言,人类进入人工智能时代,IT 技术的技术栈发生了根本性的变化。百度是全球为数不多、进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术,可以实现端到端优化,大幅提升效率。

  这种全栈布局,正是百度各项 AI 新业务业绩突出的核心原因,但知易行难,背后其实离不开马拉松式的坚定研发投入。

  财报显示,2022 年,百度核心研发费用达到 214.16 亿元,占百度核心收入的 22. 4%——这基本也是常态,百度的研发投入节奏,基本稳定在营收的 20% 左右。

  实际上,百度还已经把这种对于技术投入和研发投入的坚定,写进 DNA 中。不管疫情前后,还是 AI 市场热情冷热不同的时期,李彦宏和百度上下对技术研发的信念没有发生过改变,在回港二次上市的演讲中,他就留下过金句:

有 1 块钱的时候,我们会投进技术里;有 1 个亿,我们会投进技术里;有 100 个亿,我们还是会投进技术里。

  所以在这种始终热爱技术、愿意为长期投资、为未来投资的信念面前,“为什么总是百度”的问题,答案不言自明。

  为什么又是百度?

  生成式 AI、大语言模型技术火了,当外界众里寻他千百度时,有人这样问。

  为什么总是百度?

  当自动驾驶展现创新变革,当 AI 基础框架面临断供担忧,当 AI 芯片被破圈热议,当人类全新技术创新周期里中国能否留有姓名……每一次关于技术和创新的讨论和提问中,又总有人从百度那里给出回答。

  发生在技术领域的现象往往是这样的,每当新技术爆发、新风口出现,百度都会出现在种子选手名单中,且不是蹭热点、因为看见才相信,而是已经独自上路,孤勇探索已久了。

  2012 年开启的深度学习是这样,2013 年上路的自动驾驶是这样,以及 2010 年就已经出发的自然语言理解研发也是这样——没有这种“江湖夜雨十年灯”式的提前出发,哪有生成式 AI 和大语言模型技术展现颠覆式影响时的枕戈待旦、最后一击。

  如今,关于文心一言将带来的影响,正在被所有人看到和谈论。

  比如搜索将被重新定义,除了提供更好的搜索和答案,还会带来全新的交互和聊天体验,以及独特的生成内容——一个新的流量入口正在被开启。

  又比如与智能云协同,会改变传统云计算服务看算力、存储的旧习惯,会进入看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同的新游戏规则。

  以及人人受益的智能终端变革中,智能助手会更聪明、更善解人意,智能座舱会带来更加先进的人车交互体验。

  所以此时此地,AI 技术确实到了发展的临界点,商业价值的释放确实将前所未有、指数级增长。

  百度确实也将毫无疑问获得时代红利中的最大回报,作为中国人工智能市场长期增长的最佳代表,站上浪潮之巅。

  这令人嫉妒,也令人心悦诚服。

  没有什么能保证我们所有人持续享受技术创新的红利,除了让敢于提前赌上一切开始技术创新的人,获得应得的奖励。