2 月 3 日,智谱(02513.HK)官微宣布正式发布并开源 GLM-OCR。
据介绍,作为一款轻量的专业级 OCR 模型,该模型仅 0.9B 参数规模,支持 vLLM、SGLang 和 Ollama 部署。
公司表示,尽管 GLM-OCR 参数量仅 0.9B,但在权威文档解析榜单 OmniDocBench V1.5 中以 94.6 分取得 SOTA 性能。在文本、公式、表格识别及信息抽取四大细分领域的表现优于多款 OCR 专项模型,性能接近 Gemini-3-Pro。