Kimi 推出新一代思考模型,性能翻倍,全面提升搜索与编程能力

  Kimi 昨天正式发布并开源其迄今最强的思考模型「Kimi K2 Thinking」。

  据介绍,该模型基于「模型即 Agent」理念,具备原生的「边思考,边使用工具」能力,在多项国际基准测试中取得 SOTA(最先进)成绩,全面提升了推理、搜索、编程和写作等能力。

  Kimi 表示,K2 Thinking 模型可在无需人工干预的情况下完成高达 300 轮的工具调用与多轮推理,显著增强复杂问题的解决能力。

  在「人类最后的考试」这一涵盖 100 多个专业领域的测试中,K2 Thinking 取得了 44.9% 的成绩,刷新了同类模型纪录。

  在 OpenAI 发布的 BrowseComp 浏览基准中,该模型以 60.2% 的成绩超越人类平均水平(29.2%),展现出更强的自主搜索与信息整合能力。

  值得注意的是,K2 Thinking 采用原生 INT4 量化技术,在保持推理性能的同时,将生成速度提升约 2 倍,并优化了对国产加速芯片的兼容性。

  该模型已上线 kimi 官网及最新版 Kimi App,API 也已开放,支持 256K 上下文输入。