让AI“上天”“入地” 百度打开未来世界

  撰文  懂懂  

  编辑秦言

  来源:懂懂笔记

  从 ChatGPT 问世至今,已经过去 2 年。大模型和生成式 AI 带给人们的,除了无限畅想,还有理想与现实的差距。

  即便 AI 手机、AI PC、AI 汽车相继问世;即便随便打开一个大模型,让 AI 搜集一些资料、扩展一篇文章,已经“So Easy”,但大多数人仍觉得“不解渴”。用一句话总结,人民群众日益增长的 AI 理想与 AI 现实之间存在巨大矛盾。

  那么,如果从专业角度,该如何评价过去两年大模型和生成式 AI 的发展?

  “AI 先生”李彦宏 11 月 12 日做了总结:“大模型最大的变化是基本消除了幻觉,回答问题的准确性大大地提升,变得可用、可被信赖。”同时,他认为智能体是 AI 应用的最主流形态,即将迎来爆发点。

  消除幻觉的一个标志性产品是百度自研的 iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,没有了幻觉,少了 AI 味儿。比如车企可以用 iRAG 生成宣传海报,还原真实的车型,再也不用画几十万去拍摄了。再比如马斯克在故宫旅游,不仅马斯克和故宫都能精准呈现,还能将人与场景非常自然地融合在一起。

  作为国内大模型和生成式 AI 参与国际竞争的种子选手,百度在 AI 领域的进展值得关注。11 月 12 日的百度世界大会上,李彦宏就重点介绍了百度大模型和生成式 AI 的当下进展以及未来空间。

  陡峭增长,日调用量超 15 亿

  北京上班的小徐,最近尝到了 AI 的甜头。因公司设计人员不多,且集中精力备战双十一,给领导做 PPT 的任务就落在他头上。可他只擅长文字工作,制作 PPT 是短板,心里犯怵。

  经同事点拨,他知道了百度文库可以一键生成 PPT,将发言稿全文上传后,就能生成个七七八八,再更换下配图、调整下文字图片大小即可。这可帮了他大忙,接到领导这样的任务,他再也不担心了。 

  百度文库的一键生成 PPT 功能背后正是百度文心大模型在发挥作用,小徐的每次使用,都需要调用一次大模型。除了制作 PPT,用户每一次在百度 App 搜索智能体,每一次在文心一言问答,每一次用文心一言生成图文都会调用文心大模型。

  除了C端用户,B端企业用户的数字人、智能客服等每一次服务用户,也都会调用一次文心大模型。这个调用量规模有多大呢?

  李彦宏透露,截至 11 月初,百度文心大模型的日均调用量超 15 亿。这足以表明大模型已经深入用户日常生活。

  更值得关注的是,日调用量增长的速度。李彦宏表示,百度内部曾讨论大模型的未来,“怎么才叫成了”。他当时说,如果文心一言大模型日均 API 调用量,一年之内涨 10 倍,从今年 5 月初的 2 亿到明年 5 月涨到 20 亿,就认为成了。因为这说明,大家是真的需要。

  而目前,仅半年过去,就超过 15 亿,逼近 20 亿,这条超出百度预期的陡峭增长曲线,正是中国大模型应用大爆发的缩影。此外,文心一言用户规模达到 4.3 亿。

  AI 从量变迎来了质量时刻。

  AI 需求侧的爆发式增长,离不开供给侧的持续迭代。比如,百度研发了“理解—检索—生成”协同优化的检索增强技术。检索增强是大模型去幻觉,增强答案可靠性的主要路径,即用海量搜索信息指导内容生产,提高准确度。

  再比如,服务程序员的智能代码助手文心快码升级至 3.0 版本,不仅功能开发、代码测试、问题修复等能力有所提升,还能实现多个智能体流水线协同,进一步提升程序员工作成效。

  面向产业端,百度构建了文心大模型矩阵,包括 ERNIE 4.0 Turbo 等旗舰大模型、ERNIE Speed 等轻量模型,以及基于基础模型生产的系列思考模型和场景模型,满足不同应用的需要。

  当然,这更离不开百度 AI 先人一步出发。ALL in AI 到李彦宏获评 AI 先生,百度几乎是国内唯一持续多年在 AI 领域做投入、开源、人才培养、生态共建的企业。10 多年来,百度为人工智能和自动驾驶研发投入超过 1700 亿,聘请 2024 物理诺奖得主辛顿、吴恩达、Dario Amodei 等全球科技领军人物,使得百度在大模型领域成为真正的扛旗者。

  打开多个增长通道

  AI 正在重塑百度。除了大众知道的百度将旗下产品全部 AI 化以外,文心大模型还在至少三个维度为百度提供新的增长动力,由内到外改变这家公司。

  • 一是智能体。这被李彦宏看作是 AI 原生时代,融合内容、信息、服务的新载体,类似 PC 时代的官网,移动时代的自媒体账号。与智能体紧密相关的是百度的搜索业务,以前用户百度搜索之后的结果页是官网或者其他 SEO 之后的内容,如今得到的更大概率会是智能体。

  有何区别呢?以往,用户在百度 App 搜索比亚迪,通过首个结果进入比亚迪官网,自主浏览、查看。现在,搜索结果第一条是比亚迪智能体,变成了一个类似生成式 AI 的互动界面。用户可以问某款车型信息,多款车型对比,或者线下门店信息等,智能体可第一时间生成答案,告知用户。这种模式下,品牌与用户的链接更精准、高效。

  在百度看来,搜索是智能体最大分发入口,智能体的爆发会使搜索成为 AI 时代的第一入口。数据显示,截至 2024 年 11 月,百度文心智能体平台已经吸引了 15 万家企业、80 万名开发者入驻。

  越来越多的智能体出现,将彻底改变原有的搜索体验,为百度赖以起家的搜索业务带来新的合作模式、盈利模式,打开新的增长通道。

  • 二是百度智能云。近几个季度,百度智能云营收增长强劲、持续盈利,正是与大模型绑定的结果。因为大模型,解决了企业客户在 AI 时代的需求,带动了模型构建、算力消耗、接口调用等需求,并帮助企业客户催生了 AI 原生应用。

  最初,云服务是解决企业客户信息化、数字化的成本问题、效率问题,更多属于 CTO 决策的范畴。后来,各个云服务厂商增加了行业解决方案,将云服务深入到企业经营管理各方面,涵盖了生产、销售、服务、管理等多个环节,帮助 CEO 解决问题。

  在 AI 原生时代,企业客户迫切需要借助大模型工具,实现自身业务的重构。文心大模型与百度智能云结合,让企业客户应用 AI、大模型的门槛降低,不仅仅是成本,还包括人员组织等多维度。

  为实现这一步,百度在文心大模型旗舰版的 3.5 和 4.0 版本基础上,推出了 5 款轻量级/特定模型、AI 原生应用开发工具 AppBuilder 等,帮助企业更低门槛、更高性价比的进入 AI 原生时代。

  目前。百度智能云千帆大模型平台已帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。百度智能云也成为中国最大的大模型产业落地云,60% 以上的央企,以及大量的民营企业,都在联合百度智能云进行 AI 创新。

  • 三是自动驾驶。自动驾驶是百度面向未来,需要长期培养的增长点。在大模型的加持下,百度自动驾驶技术迭代更快,商业空间更大。今年,百度 Apollo 发布了支持 L4 级自动驾驶的大模型 Apollo ADFM(Autonomous Driving Foundation Model),可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员 10 倍以上,实现城市级全域复杂场景落地。

  门槛越低,商业版图越大

  纵观百度大模型近两年发展,明显朝着“上天”“入地”两个方向发展。

  “上天”是不断优化大模型技术,持续迭代,提高竞争壁垒。不论从专利数量还是应用规模,百度在大模型领域都走在全球第一梯队。前不久,沙利文发布的《2024 年全球 AI 生态全景概览》中,百度与谷歌、OpenAI 等位于 AI-Native Giant(AI 巨头)同一序列。

  “入地”是百度在不断降低大模型应用成本和门槛,让更多人触手可及。除了各种开放平台、开发工具,百度还亲自下场,为高校、企业培养了数百万的 AI 人才,让 AI 普及的速度越来越快。

  本次百度世界大会再次体现了这两点。李彦宏在会上发布了两项新技术。

  一是 iRAG 技术。回顾过去两年,李彦宏认为,文字层面的 RAG(检索增强生产)已经做得很好基本让大模型消除了幻觉,即用户跟大模型一问一答,大概率能得到用户想要的答案。

  但在图像等多模态方面,还存在较大幻觉,比如让大模型生成一张某历史人物在某景点的照片,还是存在“一眼假”的情况。要么是事实性错误,如人物张冠李戴,要么是画质“机器味儿”太重,缺乏真实感。

  针对于此,百度开发了检索增强的文生图技术 iRAG(image based RAG),将百度搜索的亿级图片资源跟基础模型能力相结合,可生成超真实的图片。这项技术拥有广泛应用场景,比如过往汽车品牌要拍一组海报大片,动辄要大几十万,应用百度 iRAG,可立刻生成,且成本几乎等于零。

  这是百度不断“上天”,向技术高峰攀爬的行动。当天,李彦宏还重点介绍了计划明年一季度上线的无代码工具“秒哒”,是百度不断降低大模型门槛,“入地”的体现。

  “秒哒”可以说,满足了大多数人对于大模型和生成式 AI 应用的想象,即不需要懂编程,只需要说出想法,AI 就能实现和生产所需要的应用。

  具体如何实现?用户只需对准秒哒用中文描述需求,如需要搭建一场活动的在线报名系统,并上传活动时间、地点等信息。之后,秒哒会自动调取多个智能体、多个工具,实现程序的开发、BUG 检查、视觉设计等工作,完成报名系统的开发。也就是说,只要有想法,你就可以心想事成,这也将迎来一个前所未有的只靠想法就能赚钱的时代——点子时代。

  当一个复杂的事务变得简单化,将是其走向千家万户,占领大众市场的开始。比如微软的可视化桌面系统取代 Dos 系统,让普通人可以使用原本复杂的计算机。而“秒哒”的落地,意味着将开启一个全新的点子时代,这才是 AI 真正的价值所在。

  “秒哒”正是这样一个工具,让每个人都变成程序员,将极大提高 AI 原生应用的生成效率,带来更多智能体,进一步繁荣 AI 生态。而百度作为这一生态的主要创建者,未来的获益无需多言。

  【结束语】

  作为全世界最成功的快消品之一,可口可乐的成功有其独特配方、成功的营销,还有重要的一条,即建立了全球最大的饮料分销系统。2019 年其已在 200 多个国家建立超 30000 万个销售网点,覆盖了全球约 60% 的零售店。这样的结局是,世界各地的人们触手可得可口可乐。

  当前的百度正在做类似的事情,将大模型和生成式 AI 送到普通人手里,让大模型触手可得。AI 的普及和商业化自此打开,百度更广阔的未来世界也被打开。