国思软件 - DeepSeek 新模型上线

　　昨晚，DeepSeek 线上模型版本已升级至 V3.1，上下文长度拓展至 128k，可通过官方网页、APP、小程序测试，API 接口调用方式保持不变。

　　简单来讲，新版 DeepSeek 能一次性「记住」和处理的文本长度更长，上下文容量大提升，对长文档分析、代码库理解、长对话保持一致性都更有帮助。

　　不过，这只是常规更新，和大家期待已久的 R2 没关联。按照过去的经验，R2 发布前应该会先更新 V4 模型。

　　上周市场曾传出下一代大模型 DeepSeek-R2 将在 8 月下旬发布的消息，但消息来源并不可靠。据接近 DeepSeek 人士透露， DeepSeek-R2 在 8 月内并无发布计划。

　　今天凌晨，DeepSeek 开源了 V3.1-Base 版本。该模型拥有 6850 亿参数，支持 BF16、F8_E4M3、F32 三种张量类型，以 Safetensors 格式发布，便于高效推理，还具备扩展的上下文窗口。

DeepSeek 新模型上线