微软的AI赌局,谷歌为何没敢接

  出品虎嗅科技组

  作者齐健

  编辑陈伊凡

  头图视觉中国

  ChatGPT 加入搜索后,会颠覆 Google 吗?

  这是过去几周里,在科技产业圈里热议的话题。

  1 月 3 日,科技媒体 The Information 爆料了人工智能研究实验室 OpenAI 与微软 Bing 最新的合作计划。两位直接参与该计划的人士称,微软正与 OpenAI 一起研究一款具备 AI 对话能力的新版 Bing 搜索引擎,预计将于 3 月底前公布。该版本将融合了 OpenAI 最新推出的对话大模型 ChatGPT,与以往单纯罗列网页链接的搜索模式不同,ChatGPT 可以直接回答搜索查询。

  DA Davidson 分析师甚至因此给予了微软“买入”评级,并称,短期内 OpenAI 的 ChatGPT,将会转化为 Azure 的增量。从长远来看,将 ChatGPT 功能整合到必应(Bing)可能会为微软提供十年一次的推翻谷歌搜索主导地位的机会。

  在此合作之前,微软一直出钱出力,支持 OpenAI 业务。2020 年,微软以 10 亿美元投资 OpenAI。同年,微软 Azuer 云也成为了 OpenAI 的独家算力伙伴。在此之前 OpenAI 曾一度成为 Google 云的五大企业客户之一,年单 1.2 亿美元。不过,微软收购 OpenAI 之后,似乎从微软拿到了极低的云计算折扣。有数据显示,在 2021 财年中,OpenAI 在微软产品上的开支仅为 92000 美元,而以 OpenAI 运维、研发 GPT-3 和 GPT-3.5 等大模型的进度来看,云计算用量并未有明显下降。

  与 Bing 的合作被曝出之后,OpenAI 在 1 月 6 日早些时候又传出出售股票的消息。据《华尔街日报》报道,OpenAI 正在与 Thrive Capital、Founders Fund 两家基金谈判,以 290 亿美元的估值出售至少价值 3 亿美元的股票。2021 年,OpenAI 员工向红杉资本、老虎环球出售股票时的估值约为 200 亿美元。

  AI 对于搜索行业太超前?

  既然通用大模型如此厉害,为何在搜索上积累最深的 Google 不做,毕竟要论搜索,Google 在业内有绝对优势。

  据《纽约时报》报道,ChatGPT 发布之后不久,Google 首席执行官 Sundar Pichai 就在内部动员研究人员团队想办法应对 ChatGPT,并宣布这种情况是“红色代码”的威胁。

  其实 Google 也并非没有尝试,在 2021 年 5 月的I/O大会上 Google 就展示了语言类通用大模型 LaMDA,并持续对其进行迭代研发。然而直至目前,Google 都没有向公众发布 LaMDA,Google 方面称,部分原因在于 LaMDA 目前尚不完美,其中存在较多错误。

  事实上,在大模型尚未成熟的时代,搜索引擎就已开始尝试 AI 技术了。在查询过程中,搜索引擎利用自然语言处理(Natural Language Processing,NLP)分析和理解用户输入的查询词语。在搜索过程中,利用深度神经网络(Deep Neural Networks,DNN),解决“隐式搜索”问题。

  “隐式搜索是百度内部的说法,也可以叫做‘真正的语义搜索’。”一位百度搜索技术专家告诉虎嗅,隐式搜索不再是单纯的字面搜索,而是利用 AI 分析用户关键词语的深层意思。例如,搜索“现实版钢铁侠”,得到的搜索结果就都是马斯克相关的内容。

  此外,Google、百度、Bing 等还利用 AI 实验了类似 ChatGPT 的 AI 功能,使搜索呈现出的结果不只是罗列网页,更能从搜索结果中筛选内容,直接回答用户的问题。

  例如搜索“ChatGPT 是什么”。

  Google 会在侧边栏直接引用维基百科:“ChatGPT 是由 OpenAl 开发的一个人工智能聊天机器人程序,于 2022 年 11 月推出……”

  百度则会筛选搜索内容,并摘取答案直接回答在第一条的显著位置:“聊天机器人,chatgpt 是 OpenAl 开发的一个大型预训练语言模型……”

  不过这种技术在搜索行业并没有得到广泛认可,甚至没有统一的名字。“你可以管这种技术叫精准搜索,也可以叫唯一答案或阿拉丁。”

  即便是 ChatGPT 搜索,也仍存在一些问题。

  首先,AI 挑选出的内容很难确保准确性,连 OpenAI 的 CEO Sam Altman 都认为,“现在依赖它(ChatGPT)来做任何重要的事情都是错误的。”如果把 ChatGPT 提供的搜索结果作为“唯一答案”呈现给用户,却无法保证其准确性的话,那么在错误的答案面前,再好的交互体验,都会成为笑话。

  此外,有的时候用户使用搜索引擎的目的是直接得到答案,比如你搜“ChatGPT 是什么”时,你想看到的就是一个定义。但当你搜“关于 AI 通用大模型的技术文章”时,你可能需要的是搜集广泛、全面的资料,如果 AI 筛选了部分内容,则可能影响你在搜索结果中博采众长。

  更重要的是经济账

  不过,虽然搜索引擎很早就融入了 AI 技术,但却很难有更深入的应用,其中的原因就是算不好经济账。

  通用 AI 大模型的研发、运维投入都不是小数目,更别说加入了搜索。

  “搜索”是一项开销巨大的业务,要利用爬虫从互联网海量数据中抓取搜索结果,背后需要大量的算力支持。据业内人士透露,百度搜索处理的网页数量在七八年前就已达到千亿级别。服务器用量超过一万台,每年纯设备成本超 50 亿。如果算上研发、运营和维护的人工成本,总开销可能会接近 100 亿。虽然近两年服务器成本或有下滑,但人力成本会一直随着通胀逐年上升。

  而这只是不包含 ChatGPT 情况下的纯搜索成本。

  数据显示,GPT-3 的训练成本约 1200 万美元,而 ChatGPT 的运行成本大概是单轮回答(Single Turn)几美分,听起来不多,但叠加到搜索引擎每天处理的数亿、数十亿次搜索中,产生的开销就高得过分了。如果按照每天 10 亿次搜索量来计算,把 ChatGPT 的回答成本压到最低的 1 美分,那么按照现在的汇率看,这样一个搜索引擎 2 天的“答题成本”就要一个半“小目标”。

  由于 ChatGPT 的训练并不是基于非实时更新的数据库(数据皆采集于 2021 年以前),它的搜索功能无法解答 2021 年以后的新问题。目前要对 ChatGPT 进行实时训练,就要面临新的技术挑战和成本问题。

  不过也有 AI 行业专家认为,实时更新的 AI 搜索引擎实用价值并没有想象中那么大。虽然互联网中每天新增的数据量很大,但真正有价值,值得沉淀下来的知识非常有限。用户对于这些知识的需求,也是随时间推移阶段性增长的。这样就可以把重新训练大模型或更新数据库的时间拉长,从而摊薄成本。

  那么花大价钱融入搜索引擎的 ChatGPT 能带来多少回报呢?

  与上边提到过的“精准搜索、唯一答案、阿拉丁”技术相似,ChatGPT 也无法直接提供经济效益。曾经的谷歌广告团队负责人 Sridhar Ramaswamy 就表示,ChatGPT 的使用,从一定程度上阻止了用户点击带有广告的谷歌链接。Google 在 2021 年的广告业务收入为 2080 亿美元,占 Alphabet 总收入的 81%。

  为何 Bing 可以去做与 ChatGPT 结合的尝试?

  “单看搜索业务,国内头部搜索引擎的利润率大概在 65% 左右。”一位搜索行业专家向虎嗅透露,虽然成本会随着服务器和人员的多少增减,但要保证搜索引擎可用,单个服务器的成本差距不大,广告规模却会差很多。因此营收规模越大,利润率也越高。放在任何一个成熟的海外市场,头部搜索引擎的利润率也都差不多是这个数。

  据微软财报显示,在截至 2022 年 6 月的财年数据中,搜索、MSN.com 和其他新闻产品的广告收入共 116 亿美元,其中搜索业务占比较大。相比之下,Google 搜索业务的同期收入至少是 Bing 的 10 倍。

  据海外多家调研机构的统计显示,Bing 在美国本土的市场占有率远低于 Google,目前全球搜索市场中 Bing 的市占率不超过 10%,而 Google 的市占率保守估计也不低于 80%。从市占率看来,Bing 和 Goggle 二者的竞争关系似乎并不明显。

  因为市场占比小,搜索利润率相对较低,Bing 很自然地不承担过多的营收压力,也就可以放心大胆地尝试 ChatGPT 这种未来的颠覆式创新,而不需要考虑太多成本。

  技术创新的故事就是如此充满戏剧性和残酷性。有时候赌对了一个技术路线,就能赢下未来十年甚至几十年的商业战争。而原有技术路线的优势者,往往由于自身的路径依赖,反过来被自己的优势地位掣肘,难以在新技术上勇往直前。正如曾经的光刻机霸主尼康赌错了技术路线,在浸润式光刻机上被荷兰 ASML 公司捷足先登,丧失了此后几十年的市场领先地位;诺基亚在智能手机时代被后继者超越,跌下神坛。ChatGPT 大规模商用后会怎么样,谁也不知道,而一旦爆发,将是颠覆式创新,谁赢下了这场赌注,谁就能赢下下一个人工智能时代。