国思软件 - Anthropic报告，揭示了300个独角兽的创业机会！YC CEO力挺

　　新智元报道

　　编辑：艾伦

　　Anthropic 最新报告揭示，AI 智能体近半数使用量集中在软件工程，其余 16 个垂直行业各占不到9%。AI 已具备连续工作 5 小时的能力，但用户目前最多只让它跑 42 分钟，信任远未跟上技术。Y Combinator CEO 陈嘉兴断言：这片几乎空白的行业版图里，藏着下一代 300 个独角兽。

　　你所在的行业，可能还没见过哪怕一分钟的 AI 智能体。

　　这个事实本身蕴含着巨大的机会。

　　2026 年 2 月 18 日，Anthropic 发布了一份关于 AI 智能体实际使用情况的大规模研究报告（报告：https://anthropic.com/research/measuring-agent-autonomy），分析对象是其公共 API 上数百万次真实的人机交互。

　　报告的核心发现可以浓缩成一张柱状图。

　　软件工程独占了 49.7% 的智能体工具调用量，像一根拔地而起的烟囱。

　　剩下的 16 个垂直行业——医疗、法律、金融、教育、客服、物流，每一个的份额都是个位数：医疗1%。法律 0.9%。教育 1.8%，没有任何一个超过9%。

　　Y Combinator 的 CEO 陈嘉兴（Garry Tan）盯着这张图，得出了一个让很多创业者坐不住的结论：那片几乎空白的区域，藏着下一代 300 个独角兽。

　　他的原话更直白：「如果我今天创业，我会盯着那张柱状图上那一大片红色区域，直到从中看到自己的未来。」

　　你的 AI 比你以为的能干得多

　　这份报告里有一组数据，适合贴在每个产品经理的工位上。

　　独立评估机构 METR 的测试结果显示，Claude 已经能够独立完成需要人类近 5 小时才能搞定的工作。然而在实际使用中，即便是全球最激进的那批用户（统计意义上的第 99.9 百分位），单次让 AI 连续工作的时长也不过 42 分钟左右。

　　5 小时的能力，42 分钟的授权。

　　这中间巨大的落差，陈嘉兴给它起了个名字叫「部署积压」（deployment overhang）。

　　翻译成大白话就是：AI 已经准备好了，人还没准备好。

　　好消息是，人正在追赶。

　　从 2025 年 10 月到 2026 年 1 月，这个第 99.9 百分位的会话时长几乎翻了一倍，从不到 25 分钟涨到 42 分钟。

　　值得留意的是，这条增长曲线非常平滑，并没有因为新模型的发布出现突然跳升。

　　换句话说，驱动变化的主力不是模型变聪明了，而是人类在一次又一次的协作中，学会了慢慢松手。

　　Anthropic 内部的使用数据印证了同样的趋势。

　　2025 年 8 月到 12 月，Claude Code 在最困难任务上的成功率翻倍，每次会话中人工介入的次数从 5.4 次降到了 3.3 次。

　　对于正在考虑创业方向的人来说，这意味着一件很具体的事：窗口期还在。

　　绝大多数行业甚至还没开始认真尝试让 AI 智能体介入自己的核心工作流。

　　不是技术不行，是信任还没到。

　　老手更敢放手，也更敢叫停

　　关于人和 AI 如何磨合出默契，这份报告讲了一个很有意思的故事。

　　刚开始用 Claude Code 的人，只有大约 20% 的会话选择了「全自动批准」模式——也就是让 AI 自己跑，不用每一步都等人点头。

　　累计使用超过 750 次之后，这个比例上升到 40% 以上。

　　信任在日复一日的使用中缓慢生长，可以被精确测量。

　　反直觉的地方在于：那些更愿意放手让 AI 跑的老用户，同时也更频繁地打断它。

　　新手的打断率大约是5%，老手反而到了9%。

　　这看起来矛盾，其实是两种截然不同的工作方式。

　　新手像是在考场上监考，AI 每写一道题都要看一眼。

　　老手更像是委托了一个信得过的下属，平时不盯着，一旦感觉方向不对立刻喊停。

　　从「逐项审批」到「委托+监控」，这种转变对理解人机协作的未来至关重要。

　　另一个容易被忽视的细节：在复杂任务中，Claude 主动暂停来向用户确认的次数，是用户主动打断它的两倍还多。

　　AI 在拿不准的时候会停下来问一声，而非闷头往前冲。

　　Anthropic 的研究团队提炼出一个核心概念来描述这种动态——「共建」。

　　AI 智能体的自主程度，不是模型单方面决定的。

　　它由三方力量塑造：模型在不确定时选择暂停，用户随经验调整监管尺度，产品设计在中间架设桥梁。

　　这个发现直指当下最热的 AI 监管争论。

　　如果政策要求人类必须「逐项审批 AI 的每一个动作」，结果大概率是生产力被扼杀，安全性却没有实质提升。

　　报告中的数据也支持了这种判断：73% 的工具调用有人在回路中监管，仅 0.8% 的操作属于不可逆类型。

　　而那些看起来高风险的极端案例（API 密钥操作、自主加密货币交易），经核实大多是安全团队做的红队演练，不是真实生产场景。

　　护城河在行业里，不在模型里

　　看到这里，可能有人要问：既然垂直行业机会这么大，为什么大家都挤在软件工程里？

　　答案并不复杂。

　　代码是可测试、可回滚、出错成本低的——写坏了一段代码，最多回退一个版本。

　　但你让 AI 帮一个病人处理医保报销，或者替律师做证据开示，出了错可能是一场诉讼。

　　软件工程的智能体渗透率高，本质上是因为这个领域的「容错空间」最宽裕。

　　Box 的 CEO Aaron Levie 点出了垂直 AI 创业的真正壁垒所在：能把遗留工作流吃透，能在监管的夹缝中找到产品路径，能帮客户推动组织内部的变革。

　　谁都可以在大模型外面包一层界面做个「AI 壳」。

　　但要让智能体在医疗账单审核、法律合同检索或建筑许可审批这些场景里真正跑起来，创业者必须比客户自己还懂那个行业的痛点和雷区。

　　这也是为什么陈嘉兴认为垂直 AI 公司天然具备防御性。

　　他提了一笔大账：过去二十年，SaaS 行业每十年规模增长十倍，超过 40% 的风险投资流入了 SaaS 公司，催生了 300 多个独角兽。

　　他的核心推演是——这 300 多个独角兽，每一个都对应着一个垂直 AI 版本等待被创造；而 AI 版本的天花板可能是 SaaS 版本的十倍，因为它替代的不只是软件本身，还有操作软件的那些人。

　　Bessemer Venture Partners 在 2025 年的一份研究中给出了类似的判断：美国劳工统计局的数据显示，软件支出仅占美国 GDP 的1%，而由重复性语言任务主导的商业与专业服务行业占到 13%。

　　垂直 AI 的潜在市场不在于抢占现有软件的份额，而在于切入那些软件从未触及的服务经济腹地。

　　放到中国语境下，这个逻辑同样成立，甚至空间更大。

　　中国企业级市场的一个显著特征是供给端偏爱通用化、标准化的产品，而需求端渴望的是能够深入特定行业流程的定制方案。

　　叠加数据孤岛和组织协同壁垒，这种供需错配反而为垂直 AI 创业者提供了结构性的保护。

　　Gartner 预测，到 2026 年底约 40% 的企业应用将集成任务型 AI Agent——2025 年这个数字还不到5%。

　　我们正站在从实验到规模化的临界点上。

　　图已经画好了

　　软件工程这块地盘基本已经有主了。

　　但医疗、法律、金融、教育、客服、物流——16 个垂直行业各自只占个位数的份额，几乎是一片未经开垦的土地。

　　如果你是一个正在选方向的创业者，或者是一个在传统行业里每天处理大量重复性工作的从业者，这份报告指向的信号很明确：你日常工作中那些让你疲惫又无聊的环节，很可能就是下一个独角兽公司的起点。

　　那些你每天重复填写的表格、反复核对的数据、来回扯皮的审批流程，在 AI 智能体的视角里都是尚未被开发的矿脉。

　　模型已经具备连续工作五小时的能力，用户目前只让它跑 42 分钟。

　　TechCrunch 在 2025 年底调研了 24 位专注企业市场的风险投资人，压倒性的共识是 2026 年将成为企业真正从 AI 中看到回报的一年。

　　与此同时，麦肯锡的数据显示 92% 的企业计划在未来三年增加 AI 投资，但只有1% 认为自己已经进入成熟部署阶段。

　　也就是说，几乎所有人都知道要往这个方向走，几乎所有人都还站在起跑线上。

　　陈嘉兴的总结很简练：300 个 SaaS 独角兽已经来过了，300 个垂直 AI 独角兽即将到来。

　　赢家属于那些选准一个行业扎进去、把领域知识编织进智能体、同时能帮客户完成变革管理的创始人。

　　每一轮技术革命最丰厚的回报，往往不属于铸造锤子的人，而属于那些清楚该往哪面墙上敲的人。

　　参考资料：

　　https://anthropic.com/research/measuring-agent-autonomy

　　https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open

Anthropic报告，揭示了300个独角兽的创业机会！YC CEO力挺

我们的产品

相关链接

关于我们

联系我们