DeepSeek 新模型上线

  昨晚,DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、APP、小程序测试,API 接口调用方式保持不变。

  简单来讲,新版 DeepSeek 能一次性「记住」和处理的文本长度更长,上下文容量大提升,对长文档分析、代码库理解、长对话保持一致性都更有帮助。

  不过,这只是常规更新,和大家期待已久的 R2 没关联。按照过去的经验,R2 发布前应该会先更新 V4 模型。

  上周市场曾传出下一代大模型 DeepSeek-R2 将在 8 月下旬发布的消息,但消息来源并不可靠。据接近 DeepSeek 人士透露, DeepSeek-R2 在 8 月内并无发布计划。

  今天凌晨,DeepSeek 开源了 V3.1-Base 版本。该模型拥有 6850 亿参数,支持 BF16、F8_E4M3、F32 三种张量类型,以 Safetensors 格式发布,便于高效推理,还具备扩展的上下文窗口。

  HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base