微软最新揭秘:「话痨实习生」AI助手,到底能帮人类做什么?

  新智元报道

  编辑:peter 东英智

  究竟哪些职业,更容易受到 AI 影响?基于 20 万微软 Copilot 使用数据,近日的一项研究指出,AI 能够支持许多涉及研究、写作和沟通的任务,但这并不表明 AI 能够完全胜任任何单一职业的所有任务。

  Copilot 作为微软主推的 AI 对话工具,其积累了海量的用户数据。

  而近日的一项研究,用到的数据来自 24 年微软 Copilot 对话,以及用户对 AI 回复是否点赞。

  研究者将这些对话分类,发现用户使用 AI 助手频率最高的任务是获取信息,占比近 40%。

  其次从事与公众直接沟通的工作,例如撰写宣传稿,占比接近 10%。

  除此之外,使用更多的是与企业外的人员沟通,向他人解释信息,整理文档等(见图 1 的红色柱子)。

  图 1 Copilot 使用情况和对应任务在工作中的占比

  与之相对的,是各项任务在O*NET 职业信息数据集中记录的,在各项工作中的任务占比。

  两者之间存在显著的差异,这是从宏观角度,说明早期使用生成式 AI 的用户集中在知识工作者中。

  Copolit 执行的任务多是解释型的

  使用过类似 AI 助手的工具,多半会抱怨这些工具时不时会无法按自己的要求去工作。

  例如你本来想让 AI 来给你写个广告词,结果 AI 给你写出的更像一份调研报告。

  在这份报告中,你会发现这样的现象普遍出现。下图左边是用户使用 Copilot 的目的频率,而右图是 Copilot 实际执行任务的频率.

  结果显示:AI 更侧重于「建议和教学」:AI 执行的动作中「解释」类的任务尤为突出,这与用户更侧重于「获取」信息的目标形成对比。

  图 2 Copilot 用户目标和 AI 实际执行动作的频率分布

  当前的 AI 助手,如同一个读了百科全书,工作积极性超高的实习生,会习惯于解释而非按照用户真正的需求去给出解决方案。

  那在哪些任务上,用户对 Copilot 的表现满意度最高?

  图 4 给出的答案是在写作类任务,例如撰写书面材料,商业或艺术类写作,以及收集信息,例如调研医疗健康相关问题上,用户对生成式 AI 的表现满意率较高。

  而在视觉设计,例如给出插图和可视化,以及处理数据类任务中,用户的满意度较低。

  图 3 中级工作中,用户对 Copilot 执行各项任务的满意比例

  哪些职位和 AI 的适配性更高

  根据当前生成式 AI 在那些任务上表现的不错,结合各项岗位中所需执行的任务,就可以去考察那个职业最容易被 AI 取代了。

  该研究利用上述数据提出了一个「AI 适用性评分」,试图量化每个特定职业的受 AI 的影响程度。

  AI 适用性评分考虑了 AI 在该领域当前的普及频率以及相关应用的成功程度。

  图 4 右侧展示了 AI 适用性评分最高的 25 个职业。这些职业按照其 AI 适用性评分从高到低排序。

  每个职业的条形高度代表其在美国的就业人数。

  左侧列出了对上述高适用性职业贡献最大的 20 个「工作活动」,中间的彩色线将工作和任务相连。

  图 4 受 AI 影响最深的工作与对应的任务

  结果显示:高度依赖语言、内容创作和重复性沟通任务的职业显示出最高的 AI 适用性。

  记者、翻译、历史学家、客户支持等岗位受到的影响最大。

  不过,人工智能也根本没有能够执行任何一种职业的所有工作活动。

  例如下表中,销售相关的工作任务中,AI 能完成的只占 56%,这意味着对于许多工作,AI 无法接管 100% 的任务,还需要人的参与。

  这无疑让很多担心自己工作被取代的职场人放心了,如今的 AI 可能会如同历史中的 ATM 取款机,自动取款机让存款取款这一银行柜员的任务自动化了,但却不是让银行柜员这个职位消失,而是导致银行柜员数量增加。

  因为银行以更低的成本开设了更多分支机构,柜员更专注于更有价值的任务,即维护并建立与客户的联系,而不是处理存款和取款。

  该研究还对比了人类专家认为会受到 AI 影响的工作,以及基于实际使用数据根据 AI 适配度得出的受影响工作。

  图 5 中左上角蓝色的是人类高估 AI 取代风险的岗位,例如翻译。

  作家被 AI 取代的比例被显著高估了,而另一些岗位,如历史学家、作家和政治学家,尽管高度依赖人类直觉和专业知识,并且必须处理不完整或相互矛盾的文件,最终却得到了一些相当高的 AI 适用性评分。

  图 5 AI 适应性评分与人类预估的 AI 影响程度对比

  人们会很自然的认为:与 AI 执行的活动高度重叠的职业将被自动化,从而经历岗位消失或工资降低,而人工智能辅助活动的职业将被增强并提高工资。

  这是一个错误,当前的数据不包括 AI 对下游技术的影响,因此其商业影响很难预测。

  此外,出人意料的是,和 AI 适配度最高的工作,是聚集在本科学历中的,这也反映了当前 AI 的智能水平。

  与 AI 提供的劣质服务共存

  看完这篇论文,笔者需指出这项研究只是基于 Bing Copilot 的使用数据得出的,其用户会天生偏向文字相关的任务,而对于诸如卡车驾驶之类和物理实体打交道的工作任务,则基本不会出现在使用数据中。

  然而据此得出洗碗工是最难被 AI 取代的岗位,这就是过度引申了。

  毕竟具身智能相关的技术进展,不会体现在 Copliot 的使用情况中。

  而更让笔者忧心的是,AI 将会用劣质的知识服务将我们的接收信道淹没。

  如今我们见到越来越多疑似是 AI 生成的文章时,内心如同一潭死水,不再有一丝一毫的波澜。

  这反映了 AI 取代人类工作所带来的更深远的影响,即 AI 通过提供一种劣质服务来取代人类的工作,而我们不得不与之共存。

  最简单的就是客服,当我们一次次的要求转人工时,我们多么希望与我们对话的能时一个活生生的人。

  更复杂一些的任务是写公文,例如给客户的道歉信,如果被发现是由 AI 撰写,这反而会导致舆情扩大。

  这些案例都说明了 AI 不是要替代某项工作,而是会改变工作所需的技能和素质。

  例如之前文员需要的是耐心,能稳定地完成重复性的文书撰写,而如今则是共情能力和洞察力,能够写出走心的,让人能感同身受的文字。

  参考资料:

  https://arxiv.org/pdf/2507.07935