与kimi热度比肩的通用AI搜索产品秘塔,想成为“中国版Perplexity”

  蓝鲸新闻 6 月 11 日讯 (记者朱俊熹)最近的 AI 圈绕不开一个关键词:搜索。

  谷歌、腾讯、百度等科技巨头都加快了在 AI 搜索领域的布局,期望着能诞生出 AI 时代的下一个杀手级应用。但这些体量庞大的选手会发现,这条赛道上早已盘踞着几家活跃的初创企业。

  在国外,AI 搜索引擎初创企业 Perplexity 4 月被传正在进行新一轮至少 2.5 亿美元的融资,推高公司估值达到 25 亿至 30 亿美元。而国内,被称作“中国版 Perplexity”的秘塔 AI 搜索也是一款不可忽视的黑马产品。

  今年年初,AI 公司秘塔科技推出了新的搜索引擎“秘塔 AI 搜索”,一经发布便获得了极高的热度,访问量增速甚至一度超过 AI 公司月之暗面旗下的明星产品 Kimi。据 AI 产品评测平台 AIwatch.ai,4 月国内 AI 搜索应用的访问量激增,其中秘塔 AI 搜索以 1009 万排在总榜第四位,次于 Kimi、文心一言及 360 AI 搜索。

  一款高热度的 AI 搜索产品让更多人注意到秘塔科技,但这家公司实际上在人工智能领域布局已久。从早期专注于法律垂直领域的 AI 产品,秘塔正在转向更通用的应用场景。

  不靠广告的 AI 搜索能盈利吗?

  传统搜索引擎的诞生最早可追溯到近三十年前,如果说用户早已习惯在浩如烟海的信息和广告中自行寻找到解答,那么 AI 搜索提供的则是全然不同的体验——对网页内容进行总结,直接提供答案,还没有广告的干扰。

  秘塔 AI 搜索也喊出了“没有广告,直达结果”的口号。传统搜索引擎的主要商业模式是通过广告向企业收费,而对用户免费。但 AI 搜索却允许用户跳过网页链接直接获取答案,这也让人们开始好奇这类搜索的商业化路径,毕竟背后的企业需要找到盈利方式,而如果引进了广告,对搜索体验又势必会造成影响。

  走在 AI 搜索领域前列的 Perplexity 在商业化上的尝试或许能为国内外的同类选手们提供些参照。Perplexity 由前 OpenAI 研究科学家 Aravind Srinivas 等人于 2022 年 8 月创办,到今年 4 月的月活跃用户已增长至 1500 万,就连英伟达 CEO 黄仁勋也表示“几乎每天都在用”。

  作为挑战谷歌的新兴力量,Perplexity 早期主打“不受广告驱动模式的影响”。其官网介绍称,这个平台希望能在时间宝贵的时代、信息过载的噪音中,提供精准且以用户为中心的答案。但现实显然改变了这一说法,要与广告保持距离的口号此前已在官方介绍中删除。创始人 Aravind Srinivas 在一个采访中表示,他并不反对在 Perplexity 上添加广告,希望能帮助广告商了解是谁在搜索,从而对高价值的流量竞价投放。

  因此,Perplexity 正走在融入广告的路上。其首席商务官 Dmitry Shevelenko 在 4 月透露称,公司计划首先在搜索结果中的“相关问题”部分引入原生广告,并在接下来的几个季度内推出这项广告业务。现阶段 Perplexity 的主要盈利方式是对高级功能收费,其基础版支持免费使用,如果用户想要享受更多功能,如选择不同的 AI 模型、无限制上传文件等,则需要支付每月 20 美元的费用。

  而秘塔科技股东、猎豹移动的董事长兼 CEO 傅盛在科技媒体极客公园的访谈中提到,秘塔 AI 搜索未来有可能会采取复合的商业模式,向付费会员开放深度分析的功能。傅盛还指出,秘塔去年实现了盈利,在推出 AI 搜索产品时明确了要控制搜索成本不能过高的思路,采用的是大概百亿参数规模的自训大模型。

  相较而言,Perplexity 调用的 GPT-4 模型参数量达万亿级别,参数量越大也会带来更高的计算成本。据中金公司测算,Perplexity 调用 Bing 搜索引擎及 GPT-4 的单个问题成本约为 0.03 美元,年成本约为 6000 万美元。

  秘塔 AI 搜索利用的是秘塔科技自主研发的大模型 MetaLLM。据秘塔科技介绍,该模型基于 Transformer 底层架构投入中文语料训练,因此产品更符合中文文本习惯。秘塔 AI 搜索还使用了混合专家模型(MoEs),使其预训练速度、推理速度能更快。

  让 AI 搜索不同于 ChatGPT 的在于其所使用的检索增强生成(RAG)技术,这项核心技术支持大模型与外部数据库相连,基于检索到的内容生成答案,能够减少幻觉的产生。如果把用 RAG 的 AI 模型比作是在开卷考试,那么 ChatGPT 则是闭卷考试,不断地将更多数据喂给大模型训练,完全依靠内部数据生成回答。

  当科技巨头们花费重金来卷大模型的性能时,Perplexity 却没有挤进这场竞争里。业界将其视作“套壳产品”,因为它接入的是 GPT、Claude 等其他公司的模型,在 Meta 和 Mistral AI 发布开源模型后才开始训练自有模型。而管理层们显然有自己的逻辑,Aravind Srinivas 直言,“如果你的目标是打造以产品为核心的公司,就不要在训练自有模型上浪费时间。成为一个拥有十万用户的套壳产品显然比拥有自有模型却没有用户更有意义。”

  在是否要追赶更大参数的 AI 模型上,秘塔科技持有相似的谨慎态度。其创始人兼 CEO 闵可锐曾对媒体表示,底层技术是秘塔一定会去不断投入的方向,但是否需要千亿模型却不一定。在效果接近的前提下,“我们会希望它(模型)越小越好,而不是越大越好,因为后者会带来更大的成本。”他解释道。

  比起全力投入到大模型的研发中,秘塔科技更注重在用户增长层面发力。在去年一档综艺节目中,秘塔科技的首席运营官王益为透露,公司每个月的支出里,一半是固定成本,另一半都由运营团队花费,每个月的运营预算达百万。该团队负责的是用户的增长,包括自制内容和外部投放,在抖音、B站、小红书等平台与一些博主达人进行合作。

  这一策略是有效的。2022 年秘塔科技产品的用户规模约在 100 万,到 2023 年就到了千万级别。秘塔会从C端注册用户中找到B端的销售线索,通过员工影响他们的领导层,自下而上地触达企业客户。

  从法律垂直领域起家

  事实上,在发布 AI 搜索产品之前,秘塔科技就已经推出了一款逻辑相似的产品——MetaLaw 类案检索。用户在对话框中用自然语言提出法律问题,MetaLaw 直接返回结论,并列出引用的案例和法律资料。

  江苏剑桥颐华律师事务所律师、专利代理师杨卫薪告诉蓝鲸新闻,通用类的 AI 搜索对法律词汇的语义理解可能会存在问题,导致生成的答案也出现错误,而 MetaLaw 针对的就是专业的法律场景,在体验上效果更优。

  “MetaLaw 给我们减轻了不少的负担。一个简单的法律问题抛进去,就能得到不错的结论,后面还附有案例库,能够作为精确的支撑,让我们拿去回答客户。”杨卫薪表示。他补充道,虽然中国大陆地区采用的是以成文法典为中心的大陆法系,但类案在司法中也具有效力,能够为法官提供裁判参考,所以类案检索是有可用价值的。

  杨卫薪回想起接触秘塔产品的契机,是在B站上看到了博主“@王一快”的推荐视频。而这位有着近 60 万粉丝、超 4700 万播放量的博主,正是秘塔科技的首席运营官王益为。他拥有法律行业从业经验,具备中国和美国律师执业资格,曾担任 10 年红圈所律师。秘塔创始团队的背景还覆盖了计算机工程、人工智能等行业,CEO 闵可锐曾在微软和谷歌进行研究工作。

  秘塔科技最早主攻的就是法律这条细分赛道。2019 年,成立一年的秘塔科技推出了首款产品“秘塔翻译”,主打法律、公文类文书的中英文 AI 翻译。客户囊括了国内顶尖律师事务所、仲裁中心等法律相关机构。

  闵可锐在接受媒体采访时解释称,之所以选择从法律切入,是因为这个领域具备付费的意愿与能力。负责跨国交易的律师可能需要耗费大量时间在翻译和校对的工作上,这是能被人工智能替代的点。律所愿意付费,专职的翻译团队开价又较高,于是促成了秘塔将第一个产品的落地定位确定为法律翻译。

  “越来越多的法律实务都已经开始采用 AI 加持。我们看到的领域至少包括:法律检索、合同自动审阅、机器翻译、文书自动生成、案件辅助分析审判等。”闵可锐在 2019 年曾表示。

  这是在新一轮人工智能浪潮来临前。

  2022 年 OpenAI 的 ChatGPT 横空出世后,AI+ 法律领域的初创企业们更是活跃了起来,包括幂律智能、华宇元典、得理科技等。其中,幂律智能在去年年底完成了近 8000 万元 Pre-B 轮融资,由蓝驰创投领投,投资者包括红杉中国、智谱 AI 等。该公司还联合智谱 AI 推出了法律垂直大模型。

  秘塔科技也开始将目光从法律赛道投向更为广泛的通用领域。以秘塔旗下的另一款产品秘塔写作猫为例,2020 年时它的定位还是“法律文本智能校对工具”,现在已更新为“文书写作助手”,提供智能写作、文本校对、改写润色等功能,用户群体也扩大至学生、新媒体等重度文字工作者。

  法律垂类的场景和市场规模毕竟有限,当秘塔拥有了跳出来的技术基础,拓展原有业务就变得水到渠成,于是面向更多受众的秘塔 AI 搜索便应运而生。

  但是想真正成为“中国版 Perplexity”,既要面对来自搜索大厂、明星 AI 初创公司们的高压竞争,又要摸索出属于 AI 搜索产品的商业模式,秘塔科技要做的事还有很多。