
复旦大学和阶跃星辰将要出一款端到端多模态 SVG 生成模型:OmniSVG,核心是支持从简单图标到复杂动漫角色的生成。
- OmniSVG 主页:https://omnisvg.github.io/
- 论文地址:https://arxiv.org/abs/2504.06263v1
OmniSVG 支持三种生成模式:
- 文字生成 SVG
- 图片转 SVG
- 角色参考 SVG 生成
OmniSVG 基于 Qwen2.5-VL,并集成了 SVG 标记化器。该模型将文本和图像输入都标记为前缀标记,同时 SVG 标记化器将矢量图形命令编码到一个统一的空间表示,从而将结构逻辑与底层几何图形解耦,实现高效训练和生成,带来了超级震撼的 SVG 生成效果。