DeepSeek Coder 成为第一个打败 GPT-4 Turbo 的开源代码模型

  中国 AI 创业公司 DeepSeek 的 DeepSeek Coder 成为第一个打败 GPT-4 Turbo 的开源代码模型。DeepSeek 上个月发布了混合专家模型 DeepSeek-V2,它的代码模型 DeepSeek Coder V2 就是基于该模型,它支持逾 300 种编程语言,在编程任务中超过了最先进的闭源模型如 GPT-4 Turbo、Claude 3 Opus 和 Gemini 1.5 Pro。

  在 MBPP+、HumanEval 和 Aider 编程测试中,DeepSeek Coder V2 获得了 76.2、90.2 和 73.7 分;在 MATH 和 GSM8K 等数学测试中,DeepSeek Coder V2 表现也类似。DeepSeek Coder V2 采用了 MIT 许可证,对商业使用不设限制,它有 160 亿和 2360 亿参数两个版本。

  1. https://news.slashdot.org/story/24/06/18/226232/chinas-deepseek-coder-becomes-first-open-source-coding-model-to-beat-gpt-4-turbo
  2. https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/LICENSE-CODE
  3. https://coder.deepseek.com/sign_in