开局打爆谷歌,微软ChatGPT版必应亲测:强到发指!

  新智元报道

  编辑:Aeneas 好困

  硅谷两大巨头神仙打架,战况空前激烈。目前肉眼可见,微软开局已经把谷歌按在地上摩擦。但 AI 军备竞赛的大结局,还要再等几周。

  微软笑拉了!这场互联网巨头神仙打架的大戏才拉开序幕,微软就已经领先谷歌几个身位。

  微软:嗯,是让人十分放心的对手了。

  这场搜索引擎大战,目前微软以绝对优势领先。

  目前,已经有记者亲测了一波微软的「ChatGPT 搜索」,体验就是:棒呆了!

  ChatGPT 搜索上线:真·有问「必应」!

  2 月 8 日,微软在自家 Edge 浏览器中正式发布新必应(new Bing),结合了 ChatGPT 和微软自己的普罗米修斯(Prometheus)模型,将搜索体验带上了一个新台阶。

  微软首席执行官 Satya Nadella 甚至在发布会上激动地表示「这是搜索的新时代」(This is a new day for search)。

  不过呢,虽然新必应已经公开测试,但要是想正式使用,还要先加入 waiting list 等待一段时间。

  如果用户在个人电脑上设置微软的默认搜索,并且在手机上安装必应 app,他们可以更快地获得访问新必应的机会,还带动了一波 app 下载热潮。(有点「不下载 app 不让用」那味了...)

  至于等待多久,微软表示,将在「未来几周内」向「数百万用户」开放体验,甚至后续还会考虑把新必应带到其他浏览器中,不过还没有具体的时间表。(Chrome:虾仁还要猪心!)

  有网友吐槽,从来没想过 2023 年的 to-do-list 上竟然还会有「加入新必应的等候列表」。

  不过新必应在发布会上也开放给了一些外媒进行抢先体验,TechCrunch 的记者最近就他的体验发表了一篇报道。

  全新的搜索体验

  新版必应变化最明显的就是前端搜索框更大,并且下面还会展示一些 ChatGPT 的样例以帮助新用户熟悉聊天功能。

  另一个变化是,搜索引擎的提示文字变成了「请向我提问...」,引导新用户区分常见的「关键词」搜索模式,不过新必应也支持普通的搜索模式。

  我认为微软在传统的、以链接为中心的搜索结果和 ChatGPT 之间找到了一个合适的平衡点,除了在开放问题中聊天以外,当你问它一些需要真实信息的内容时,Edge 浏览器就会在侧边栏显示出一些搜索结果。

  不过目前还很难预测什么样的问题可以触发侧边栏。

  能联网的 ChatGPT

  新版 ChatGPT 可以进行网上冲浪了,能提升其准确性吗?

  以前有研究人员在测试过 ChatGPT 关于「COVID-19 新冠疫苗」的问题,ChatGPT 给出了一个错误答案,研究人员便把结果发布到了网上。

  当这次再问新必应相同的问题时,它的回答和 ChatGPT 之前的答案相同,并且还把那份错误答案的链接当作了参考。(离谱,我参考我自己的错误答案)

  还有之前在 ChatGPT 的研究中发现的问题,例如让 ChatGPT 以希特勒的口吻为大屠杀行为进行辩护等非常邪恶的事,新必应也都会照做。

  不过在向微软提交上述故障不久后,这些 query 及其各种变体都无法再无复现了,必应随后也开始拒绝其他历史人物的类似 query,作者猜测是微软在后端添加了一些过滤规则,以此加强必应的安全算法。

  道德问题还没解决

  从上面的例子可以看出,尽管微软谈论了很多关于人工智能的道德问题,以及还为新必应设置了诸多保护措施,但显然还有一些场景没有覆盖到。

  微软的一位发言人表示,在某些情况下,团队可能在生成输出的过程中发现问题,程序将会中途停止。开发团队已经料到系统可能会在预览期间出错,反馈对于系统的后续改进是至关重要的。

  还有点 bug,会给你推荐自家股票

  在大多数情况下,你可以简单地把新必应看作是 ChatGPT,但是新必应拥有实时更新的数据。

  比如新必应甚至可以浏览到今天早上才发生的事,不过在一些时间类的 query 中,新必应的表现并不好,似乎它并不理解「recently」的概念;但是如果你想问它这周有哪些电影上映,它会给你一个相当不错的返回列表。

  另一个很棒的特性是,它会在聊天中提供一些意想不到的 web 体验。

  比如当问它关于购买微软股票的问题时,它会回答说不会给我财务建议(因为可能会对你的财务状况有害产生负面影响),但它也提到了 MSN Money 上微软的股票代码。

  和 ChatGPT 一样,新必应的聊天功能并不总是完全准确,比如问他一些不存在的实体时,也能得到一本正经的回答。

  当被问及更专业的话题,比如夜间作为私人飞行员的目视飞行(visual flight)规则时,返回的内容并不清晰,部分原因是模型的调教倾向就是健谈,它的回答和普通问答一样,但包含了大量无关的信息。

  虽然新必应在回答问题时会加上引用源,但其中一些链接十分可疑,比如包括一些内容剽窃网站,而且有时也会引用自己并链接到必应网站上的搜索结果。

  但新必应能够引用信息来源已经是朝着正确的方向迈出了一步,虽然许多在线出版商担心这样一个工具会降低搜索引擎的点击率,虽然这个流量对于必应来说无关紧要,但新必应仍然提供大量的链接。

  例如,每个带有来源的句子都有链接(有时,必应也会在这些链接下面显示广告),对于许多与新闻相关的查询,它会展示来自 Bing News 的相关故事。

  除了必应之外,微软还将新开发的 AI copilot 引入了 Edge 浏览器,作者认为这项功能的体验也不错,在浏览器中,必应可以使用当前浏览的网站的上下文来执行操作,比如对比价格,告诉你你想买的东西是否有好的评论,甚至是写一封关于该网站的电子邮件等。

  不过这里有一个奇怪的地方,因为目前还是预览版,可能会有一些 bug:一开始,必应并不知道我在看什么网站,在三四次查询失败后,必应才能访问到浏览器中的网页内容。

  Edge 团队还把这个新侧边栏拆分为 Chat、Compose 和 Insights,其中 compose 功能可以辅助写电子邮件、博客文章和一些简短的文本片段。

  两种模式的底层模型似乎有些不同,或者说是添加了一些规则,对相同的输入有不同的返回内容。

  但是,在大多数情况下,侧边栏只是复制了 chat 的体验,下一步微软可能会设计成用户的入口点,特别是针对那些已经在使用 Edge 的老用户。

  前工程师:发布会就是做做样子,谷歌根本不 care

  微软的新搜索引擎这么拉风,衬得谷歌的 Bard 更加拉跨了。

  前天谷歌的发布会结束后,一度沦为业内的笑柄。

  一些评论家这样评论谷歌的演示——「坦率地说,非常糟糕」,在人工智能军备竞赛日益激烈的情况下是一场「灾难」。

  谷歌前员工 Maarten Bosma 也忍不住发推吐槽前东家。

  Maarten Bosma 是谷歌大脑的前工程师,在一条推文的回复中,他这样评价前雇主:「我认为谷歌的演示(正确或错误地)表明他们并没有真正认真对待它」。

  他指出了发布会的众多「华点」——

  1. Bard 的演示「不到 5 分钟」,还是跟谷歌地图、谷歌镜头这些新工具一起展示的。

  2. 发布会地点「在巴黎而不是总部」,而且「首席执行官不在场」。

  发布会上出席的是谷歌副总裁 Prabhakar Raghavan

  回想这几个月,微软凭 ChatGPT 把谷歌打得节节败退,终于逼得谷歌不得不发布「红色代码」,使用 AI 聊天机器人来增强谷歌搜索引擎。

  而就在谷歌宣布开发自家 AI 聊天机器人 Bard 的消息后,微软第二天在发布会上亮相的「ChatGPT 新必应」的光芒让人闪瞎了眼。

  而谷歌后一天的发布会,也就更显得滑稽了。

  显然,Bosma 并不是唯一公开批评谷歌这次做法的人。

  「坦率地说,这次活动很糟糕,」分析师 Ben Thompson 在一篇博客文章中这样评价谷歌的演示。他表示,发布会上绝大多数内容,是以往已经展示内容的翻版。

  而谷歌 Bard 广告中关于韦伯望远镜的错误,也让大家笑掉了大牙,更是瞬间拉低了股价。

  不过,也有人对谷歌在舆论上遭受的嘲笑感到困惑。

  纽约大学前神经科学教授、自称是人工智能怀疑论者的 Gary Marcus 在博客中表示,自己感到十分疑惑——明明微软和谷歌的 AI 工具都处于相似的部署阶段,并且都存在缺陷,为什么受到的舆论评价却如此不同?

  微软的演示「被描述为一场革命」,而谷歌的演示被描述为「一场灾难」,马库斯指出。(莫非,是微软的一盘大棋?)

  然而,这些还都只是前序。等再过几周,完成更多测试之后,谷歌的 Bard 会正式向公众发布。而微软的「ChatGPT 必应」,也在排等候名单了。

  到那时,真正的大战才会开始。

  参考资料:

  https://techcrunch.com/2023/02/08/hands-on-with-the-new-bing/