
Kimi 昨天正式发布并开源其迄今最强的思考模型「Kimi K2 Thinking」。
据介绍,该模型基于「模型即 Agent」理念,具备原生的「边思考,边使用工具」能力,在多项国际基准测试中取得 SOTA(最先进)成绩,全面提升了推理、搜索、编程和写作等能力。
Kimi 表示,K2 Thinking 模型可在无需人工干预的情况下完成高达 300 轮的工具调用与多轮推理,显著增强复杂问题的解决能力。
在「人类最后的考试」这一涵盖 100 多个专业领域的测试中,K2 Thinking 取得了 44.9% 的成绩,刷新了同类模型纪录。
在 OpenAI 发布的 BrowseComp 浏览基准中,该模型以 60.2% 的成绩超越人类平均水平(29.2%),展现出更强的自主搜索与信息整合能力。
值得注意的是,K2 Thinking 采用原生 INT4 量化技术,在保持推理性能的同时,将生成速度提升约 2 倍,并优化了对国产加速芯片的兼容性。
该模型已上线 kimi 官网及最新版 Kimi App,API 也已开放,支持 256K 上下文输入。
