1 月 27 日消息,临近春节,DeepSeek 团队今日在 HuggingFace 和 GitHub 平台正式开源其新一代视觉语言模型——DeepSeek-OCR 2,并同步发布论文《DeepSeek-OCR 2: Visual Causal Flow》,揭示其在视觉编码逻辑上的重大突破。

与初代模型主打“视觉压缩”不同,OCR 2 的核心在于通过引入 DeepEncoder V2,赋予 AI 处理二维图像时的“因果推理”能力,使其能够像人类一样,根据图像内容动态重排信息,解决了传统模型在处理复杂文档布局时的局限性。(袁宁)
