新智元报道
编辑:英智
苹果在 2024 年全球开发者大会上为 Siri 描绘了诱人的蓝图,承诺将成为 iPhone 的「超级大脑」。然而,仅仅九个月后,内部技术方向的反复摇摆和高管间的矛盾让这一愿景化为泡影。
去年 6 月,苹果展示了 AI 版 Siri。
随后的几个月,Siri 团队对实现这些功能的基础技术方案摇摆不定。
据一位知情的前苹果员工透露,团队曾计划打造一小一大两种模型,分别命名为「迷你鼠」(Mini Mouse)和「大力鼠」(Mighty Mouse)。
小模型在 iPhone 上运行,处理像设闹钟这类简单任务。大模型则在云端运行,负责更复杂的任务,比如帮用户叫车,赶赴下一场会议。
但后来,Siri 负责人改变主意,决定构建一个全能大模型。
这意味着 Siri 软件得在云端运行,与先前为保护用户隐私,将大部分软件部署在设备端的做法相悖。
技术方向大幅调整,让 Siri 团队成员疲惫不堪,备受挫折,甚至有人因此离开。
这让公司今年发布 Siri 新功能的目标,变得岌岌可危。
这种犹豫不决,导致苹果上个月做出惊人决定:将 Siri 新功能发布时间推迟到 2026 年。
据知情人透露,苹果将解除其 AI 主管 John Giannandrea 及负责日常运营的副手 Robby Walker 对 Siri 的管理职权。
苹果的软件工程主管 Craig Federighi 将主管 Siri,此前领导 Vision Pro 开发的 Mike Rockwell 将接手 Walker 的工作。
演示,几乎全是假的?
去年 6 月,苹果发布一系列名为 Apple Intelligence 的 AI 功能,涵盖写作、图像生成、全新的照片编辑、邮件功能,以及 Siri 升级。
一反此前的立场,苹果宣布与 OpenAI 合作,引入 ChatGPT 作为补充,用于其模型无法解决的问题或任务。
发布会的现场演示中,一位苹果高管问 Siri 母亲航班的降落时间。Siri 通过访问其电子邮件和实时航班数据,给出了到达时间。
接着,她又让 Siri 提醒午餐计划,Siri 从短信中提取细节,并规划了从机场到餐厅的路线。
然而,Siri 团队成员对此演示却颇感意外。一位前苹果员工称,他们从未见过这些功能可以实际运行的版本。
该员工还表示,当时演示中唯一在测试设备上激活的新功能,是用户唤醒 Siri 时,iPhone 屏幕边缘出现的闪烁彩色光带。
以往,苹果在大会上仅展示已在测试设备上运行、且经营销团队审核确保能按时发布的功能和产品。
苹果 2024 年开发者大会上对 Siri 新功能的演示
即便如此,仍给外界留下深刻印象。
宣布这些功能后的两天内,苹果股价上涨超 10%,华尔街对苹果推出 AI 计划表示认可。
一些前苹果员工表示,他们对 Federighi 和 Rockwell 扭转 Siri 局面充满信心。
与更依赖下属管理具体事务的 Giannandera 和 Walker 相比,他俩更倾向于亲力亲为。
Federighi 对软件项目技术细节的了解,有时甚至超过负责这些项目的初级工程师。
Rockwell 被视为富有远见的领导者,既能为项目注入新思维,又能巧妙适应公司文化。
Federighi 已着手做出改变。
他指示 Siri 的机器学习工程师,要不惜一切打造最顶尖的 AI 功能,即使需要在软件产品中使用其他公司的开源模型,而非苹果自研模型。
AI 热潮兴起
2022 年 11 月,OpenAI 发布 ChatGPT,在科技界和公众中引发轰动。
然而,Giannandrea 团队的前工程师称,团队高层领导并未表现出紧迫感。
相比之下,Federighi 的软件工程团队则反应迅速。
多名前苹果员工表示,Intelligent Systems 团队领导者迅速分享 LLM 的论文,并公开探讨如何用这些技术改进 iPhone。
Intelligent Systems 团队向 Federighi 演示了 AI 在 iPhone 上的功能后,软件工程团队内部热情高涨。
这些 demo 借助 OpenAI 模型,展示了 AI 如何理解用户手机屏幕内容,并能通过更自然的对话,操作应用程序、执行其他任务。
AI 团队和软件工程团队的高管们随即开始争夺 LLM 驱动的新功能主导权。
凭借交付方面一贯的好声誉,软件工程团队占据上风。
尽管苹果内部试用了 OpenAI 模型,但在 2023 年,管理层告知工程师,最终产品不得使用外部公司模型,只能用于与自研模型对比测试。
打造旨在与 OpenAI 抗衡的苹果大模型,是 Giannandrea 团队的职责。
然而,据多位在 2023-2024 年使用过这些模型的前苹果员工称,其性能表现远不及 OpenAI。
AIMLess(漫无目的)
对全球市值最高的苹果来说,如何有效利用 AI,是当下最为关键的挑战之一。
这关乎 iPhone 和其他产品能否继续保持技术领先地位。
Siri 因创新迟缓饱受诟病,随着 OpenAI ChatGPT 等 AI 产品爆火,外界的不满愈发强烈。
仅仅九个月前,在开发者大会上,苹果还向投资者保证,将通过 Siri 升级和其他功能,在 AI 领域迎头赶上。
对苹果而言,此次延迟发布极为尴尬。
这种困境部分源于其根深蒂固的企业价值观。
苹果对用户隐私的高度重视,使其难以获取大量数据用于模型训练,也难以验证 AI 功能在设备端的实际效果。
然而,多位曾在 AI 和软件部门工作的人士透露,苹果内部高层的个性冲突,也是重要原因。
超过六位曾在 Giannandrea 领导的 AI/ML 团队工作的前苹果员工表示,领导不力是问题的根源。
他们指出,Walker 不仅缺乏雄心,还缺乏承担风险的魄力。
在苹果内部,AI/ML 团队松散的氛围和较差的执行力,为其赢得了一个有讽刺意味的外号「AIMLess」(漫无目的,由 AI/ML 首字母组合变化而来)。
苹果内部对 AI/ML 团队的负面评价,与 Federighi 领导的软件工程团队形成了鲜明对比。
软件工程团队凭借在操作系统、信息、照片、邮件和其他应用上的出色工作,声名远扬。
耗时两年,只为去掉「嘿,Siri」的「嘿」
实际上,Siri 的问题已存在多年。
2018 年,Giannandrea 从谷歌跳槽至苹果,负责新成立的 AI 团队,科技界普遍认为苹果挖到了一位关键人才。
知情人士称,尽管当时一些高管认为 Giannandrea 可能对负责自动驾驶更感兴趣,但他却对 Siri 格外关注。
彼时,苹果在 2011 年推出的 Siri,发展已陷入停滞。它对常识性问题表现不佳,对第三方应用的支持也极为有限。
在 Giannandrea 接手之前,Siri 团队的成员在苹果内部就感觉不受重视。
Siri 工程师对软件工程团队主导 iOS 更新不满,认为他们未优先考虑修复 Siri 的问题。软件工程团队则认为,Siri 团队跟不上节奏,无法为 Federighi 团队推出的新功能提供支持。
Giannandrea 曾表示,他有信心借鉴谷歌打造 AI 语音助手的方法,来改进 Siri。
他认为苹果只需获取合适的训练数据,并提升从网络抓取信息,以回答常识性问题的能力。
与 Giannandrea 共事过的人形容他随和、安静,不爱与人起冲突,这与苹果高管团队中要求严苛、性格强势(A型人格)者形成鲜明对比。
从左至右:Tim Cook、John Giannandrea 和 Craig Federighi
Giannandrea 常向员工阐述他的理念,他坚信机器学习能让产品逐步改进,最终实现重大突破,他称为「爬山」。
他也表达过不看好聊天机器人的观点,在 ChatGPT 发布后,还曾表示,他认为聊天机器人对用户价值不大。
Walker 是一位经常受到同事批评的 Siri 领导者。他于 2013 年加入苹果,2022 年底开始负责 Siri 日常运营。
在批评者眼中,Walker 不愿进行大刀阔斧的冒险,只关注性能提升有限的指标,缺乏革新 Siri 的长远规划。
他常为一些微小进展沾沾自喜,比如将用户向 Siri 提问的响应时间缩短几个百分点。
Walker 的一个得意之作,是去掉唤醒 Siri 的语音指令「嘿 Siri」中的「嘿」字,这项任务耗时两年多才完成。
Walker 还否决了一个提案。团队计划用 LLM 赋予 Siri 更强的情感感知能力,使其识别出处于困境中的用户,并作出恰当的回应。
然而,该项目的工程师绕过他,继续与软件工程团队的安全和定位小组合作开发这些功能。
更高的薪酬,更快的晋升?
Federighi 领导的软件工程团队和 Giannandrea 的 AI/ML 团队,关系愈发紧张,时常陷入僵局。
从管理风格来看,两人截然不同。
Federighi 管理严格、要求颇高,Giannandrea 则更随和。
开会时,Federighi 常常连珠炮似地向同事发问,Giannandrea 更倾向于倾听。
John Giannandrea
其他方面的不满情绪也在悄然积累。
软件工程团队部分成员对 AI 团队同事薪资高、晋升快感到恼火。
他们还愤懑于,一些 AI 团队工程师能享受更长假期,周五还能提前下班,自己却要面对繁重的工作安排。
两个团队之间的不信任感日益加深。
今年早些时候,Giannandrea 的副手要求详细记录一个联合项目的开发过程,以防项目失败后,Federighi 团队将责任归咎于 AI 团队。
Federighi 还组建了自己的机器学习团队,这进一步加剧了紧张关系。
Intelligent Systems 团队成员达数百人,由其高级副手 Sebastien Marineau-Mes 负责运营。
他们训练了自己的模型,并构建了多个 demo,让用户通过语音指令控制应用程序,且通常无需 Siri 团队协助。
在一次内部演示中,一名团队成员展示了一张幻灯片,两座山碰撞后夷为平地,一些人认为这是对 Giannandrea「爬山」理念的隐晦嘲讽。
2022 年,Intelligent Systems 团队开始与 Walker 以及负责 Vision Pro 的高管 Rockwell 合作,启动了一个代号为 Link 的项目,但该项目很快陷入困境。
项目旨在为混合现实头显及 AR 眼镜开发语音指令,以控制应用程序、完成任务。
Mike Rockwell
参与三方会议的工程师对 Rockwell 和 Marineau-Mes 对 Walker 公开表露的敌意深感震惊。
两人常因 Siri 在支持 Vision Pro 方面进展缓慢,对 Walker 表达不满。
例如,Rockwell 期望佩戴头显的用户能用语音通过 Siri 浏览网页、调整窗口大小。他还设想,在虚拟空间交流的两人能共同与 Siri 互动,比如一起规划度假。
但 Siri 团队的部分成员对此表示怀疑。最终,因 Siri 团队能力所限,Rockwell 为 Vision Pro 设想的许多功能被削减。
参考资料:
https://www.theinformation.com/articles/apple-fumbled-siris-ai-makeover?rc=epv9gi