智谱开源GLM-OCR模型:多个领域性能接近Gemini-3-Pro,主打“小尺寸、高精度”

  2 月 3 日,智谱(02513.HK)官微宣布正式发布并开源 GLM-OCR。

  据介绍,作为一款轻量的专业级 OCR 模型,该模型仅 0.9B 参数规模,支持 vLLM、SGLang 和 Ollama 部署。

  公司表示,尽管 GLM-OCR 参数量仅 0.9B,但在权威文档解析榜单 OmniDocBench V1.5 中以 94.6 分取得 SOTA 性能。在文本、公式、表格识别及信息抽取四大细分领域的表现优于多款 OCR 专项模型,性能接近 Gemini-3-Pro。