美团发布LongCat-2.0大模型,总参数规模1.6万亿

  新京报贝壳财经讯(记者陈维城)6 月 30 日,美团正式发布新一代基础大模型 LongCat-2.0。依靠国产算力完成训练、推理全流程的万亿参数大模型。

  据悉,LongCat-2.0 采用 MoE 架构,总参数规模 1.6 万亿,每个 Token 激活参数约 480 亿,原生支持 1M 超长上下文,可一次处理百万字级输入。模型深度适配 Claude Code、OpenClaw、Hermes 等主流 Harness。

  今年 4 月底,美团曾发布 LongCat-2.0-Preview 版本,并以匿名的方式,接入全球最大的大模型 API 路由平台 OpenRouter。OpenRouter 数据显示,截至 6 月底,LongCat-2.0-Preview 的总调用量已跻身全球前三。

  2023 年起,美团就与国产算力厂商共同推进“模芯协同”研发,从早期的小规模验证到超大规模稳定训练,逐步攻克了万卡级容错恢复、NPU 确定性计算、算力利用率提升等核心难题,验证了大规模国产训练的可行性。

  LongCat-2.0 的训练、推理成本消耗,低于全球其他万亿参数级别的大模型。LongCat 官方宣布,将于近期在多平台同步开源 Infra 框架、推理引擎、模型参数等核心技术。

  编辑杨娟娟

  校对王心