Anthropic报告,揭示了300个独角兽的创业机会!YC CEO力挺

  新智元报道

  编辑:艾伦

  Anthropic 最新报告揭示,AI 智能体近半数使用量集中在软件工程,其余 16 个垂直行业各占不到9%。AI 已具备连续工作 5 小时的能力,但用户目前最多只让它跑 42 分钟,信任远未跟上技术。Y Combinator CEO 陈嘉兴断言:这片几乎空白的行业版图里,藏着下一代 300 个独角兽。

  你所在的行业,可能还没见过哪怕一分钟的 AI 智能体。

  这个事实本身蕴含着巨大的机会。

  2026 年 2 月 18 日,Anthropic 发布了一份关于 AI 智能体实际使用情况的大规模研究报告(报告:https://anthropic.com/research/measuring-agent-autonomy),分析对象是其公共 API 上数百万次真实的人机交互。

  报告的核心发现可以浓缩成一张柱状图。

  软件工程独占了 49.7% 的智能体工具调用量,像一根拔地而起的烟囱。

  剩下的 16 个垂直行业——医疗、法律、金融、教育、客服、物流,每一个的份额都是个位数:医疗1%。法律 0.9%。教育 1.8%,没有任何一个超过9%。

  Y Combinator 的 CEO 陈嘉兴(Garry Tan)盯着这张图,得出了一个让很多创业者坐不住的结论:那片几乎空白的区域,藏着下一代 300 个独角兽。

  他的原话更直白:「如果我今天创业,我会盯着那张柱状图上那一大片红色区域,直到从中看到自己的未来。」

  你的 AI 比你以为的能干得多

  这份报告里有一组数据,适合贴在每个产品经理的工位上。

  独立评估机构 METR 的测试结果显示,Claude 已经能够独立完成需要人类近 5 小时才能搞定的工作。然而在实际使用中,即便是全球最激进的那批用户(统计意义上的第 99.9 百分位),单次让 AI 连续工作的时长也不过 42 分钟左右。

  5 小时的能力,42 分钟的授权。

  这中间巨大的落差,陈嘉兴给它起了个名字叫「部署积压」(deployment overhang)。

  翻译成大白话就是:AI 已经准备好了,人还没准备好。

  好消息是,人正在追赶。

  从 2025 年 10 月到 2026 年 1 月,这个第 99.9 百分位的会话时长几乎翻了一倍,从不到 25 分钟涨到 42 分钟。

  值得留意的是,这条增长曲线非常平滑,并没有因为新模型的发布出现突然跳升。

  换句话说,驱动变化的主力不是模型变聪明了,而是人类在一次又一次的协作中,学会了慢慢松手。

  Anthropic 内部的使用数据印证了同样的趋势。

  2025 年 8 月到 12 月,Claude Code 在最困难任务上的成功率翻倍,每次会话中人工介入的次数从 5.4 次降到了 3.3 次。

  对于正在考虑创业方向的人来说,这意味着一件很具体的事:窗口期还在。

  绝大多数行业甚至还没开始认真尝试让 AI 智能体介入自己的核心工作流。

  不是技术不行,是信任还没到。

  老手更敢放手,也更敢叫停

  关于人和 AI 如何磨合出默契,这份报告讲了一个很有意思的故事。

  刚开始用 Claude Code 的人,只有大约 20% 的会话选择了「全自动批准」模式——也就是让 AI 自己跑,不用每一步都等人点头。

  累计使用超过 750 次之后,这个比例上升到 40% 以上。

  信任在日复一日的使用中缓慢生长,可以被精确测量。

  反直觉的地方在于:那些更愿意放手让 AI 跑的老用户,同时也更频繁地打断它。

  新手的打断率大约是5%,老手反而到了9%。

  这看起来矛盾,其实是两种截然不同的工作方式。

  新手像是在考场上监考,AI 每写一道题都要看一眼。

  老手更像是委托了一个信得过的下属,平时不盯着,一旦感觉方向不对立刻喊停。

  从「逐项审批」到「委托+监控」,这种转变对理解人机协作的未来至关重要。

  另一个容易被忽视的细节:在复杂任务中,Claude 主动暂停来向用户确认的次数,是用户主动打断它的两倍还多。

  AI 在拿不准的时候会停下来问一声,而非闷头往前冲。

  Anthropic 的研究团队提炼出一个核心概念来描述这种动态——「共建」。

  AI 智能体的自主程度,不是模型单方面决定的。

  它由三方力量塑造:模型在不确定时选择暂停,用户随经验调整监管尺度,产品设计在中间架设桥梁。

  这个发现直指当下最热的 AI 监管争论。

  如果政策要求人类必须「逐项审批 AI 的每一个动作」,结果大概率是生产力被扼杀,安全性却没有实质提升。

  报告中的数据也支持了这种判断:73% 的工具调用有人在回路中监管,仅 0.8% 的操作属于不可逆类型。

  而那些看起来高风险的极端案例(API 密钥操作、自主加密货币交易),经核实大多是安全团队做的红队演练,不是真实生产场景。

  护城河在行业里,不在模型里

  看到这里,可能有人要问:既然垂直行业机会这么大,为什么大家都挤在软件工程里?

  答案并不复杂。

  代码是可测试、可回滚、出错成本低的——写坏了一段代码,最多回退一个版本。

  但你让 AI 帮一个病人处理医保报销,或者替律师做证据开示,出了错可能是一场诉讼。

  软件工程的智能体渗透率高,本质上是因为这个领域的「容错空间」最宽裕。

  Box 的 CEO Aaron Levie 点出了垂直 AI 创业的真正壁垒所在:能把遗留工作流吃透,能在监管的夹缝中找到产品路径,能帮客户推动组织内部的变革。

  谁都可以在大模型外面包一层界面做个「AI 壳」。

  但要让智能体在医疗账单审核、法律合同检索或建筑许可审批这些场景里真正跑起来,创业者必须比客户自己还懂那个行业的痛点和雷区。

  这也是为什么陈嘉兴认为垂直 AI 公司天然具备防御性。

  他提了一笔大账:过去二十年,SaaS 行业每十年规模增长十倍,超过 40% 的风险投资流入了 SaaS 公司,催生了 300 多个独角兽。

  他的核心推演是——这 300 多个独角兽,每一个都对应着一个垂直 AI 版本等待被创造;而 AI 版本的天花板可能是 SaaS 版本的十倍,因为它替代的不只是软件本身,还有操作软件的那些人。

  Bessemer Venture Partners 在 2025 年的一份研究中给出了类似的判断:美国劳工统计局的数据显示,软件支出仅占美国 GDP 的1%,而由重复性语言任务主导的商业与专业服务行业占到 13%。

  垂直 AI 的潜在市场不在于抢占现有软件的份额,而在于切入那些软件从未触及的服务经济腹地。

  放到中国语境下,这个逻辑同样成立,甚至空间更大。

  中国企业级市场的一个显著特征是供给端偏爱通用化、标准化的产品,而需求端渴望的是能够深入特定行业流程的定制方案。

  叠加数据孤岛和组织协同壁垒,这种供需错配反而为垂直 AI 创业者提供了结构性的保护。

  Gartner 预测,到 2026 年底约 40% 的企业应用将集成任务型 AI Agent——2025 年这个数字还不到5%。

  我们正站在从实验到规模化的临界点上。

  图已经画好了

  软件工程这块地盘基本已经有主了。

  但医疗、法律、金融、教育、客服、物流——16 个垂直行业各自只占个位数的份额,几乎是一片未经开垦的土地。

  如果你是一个正在选方向的创业者,或者是一个在传统行业里每天处理大量重复性工作的从业者,这份报告指向的信号很明确:你日常工作中那些让你疲惫又无聊的环节,很可能就是下一个独角兽公司的起点。

  那些你每天重复填写的表格、反复核对的数据、来回扯皮的审批流程,在 AI 智能体的视角里都是尚未被开发的矿脉。

  模型已经具备连续工作五小时的能力,用户目前只让它跑 42 分钟。

  TechCrunch 在 2025 年底调研了 24 位专注企业市场的风险投资人,压倒性的共识是 2026 年将成为企业真正从 AI 中看到回报的一年。

  与此同时,麦肯锡的数据显示 92% 的企业计划在未来三年增加 AI 投资,但只有1% 认为自己已经进入成熟部署阶段。

  也就是说,几乎所有人都知道要往这个方向走,几乎所有人都还站在起跑线上。

  陈嘉兴的总结很简练:300 个 SaaS 独角兽已经来过了,300 个垂直 AI 独角兽即将到来。

  赢家属于那些选准一个行业扎进去、把领域知识编织进智能体、同时能帮客户完成变革管理的创始人。

  每一轮技术革命最丰厚的回报,往往不属于铸造锤子的人,而属于那些清楚该往哪面墙上敲的人。

  参考资料:

  https://anthropic.com/research/measuring-agent-autonomy

  https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open