克雷西发自凹非寺
量子位公众号 QbitAI
欧洲的 OpenAI,把 ChatGPT 功能都复制了。
Mistral AI 大模型平台 Le Chat 新增 Canvas、联网搜索、上传 PDF 等 ChatGPT 同款功能,而且全都免!费!
三大主流大模型产品的功能,现在可以一站式访问。
而且还官宣和知名绘图模型Flux达成合作,在 Le Chat 平台提供在线生图功能,同样是不收一分钱。
经量子位简单实测发现,搜索、文档总结和绘图这些新功能都支持中文。
Mistral 的 CEOArthur Mensch表示,这次的新版 Le Chat 是一个里程碑,标志着该平台已经成为“更成熟的动物”。
ChatGPT 同款功能免费用
在 Mistral 的官方平台 Le Chat(看上去是 chat,但实际上是法语的“猫”)上,免费上新了一系列 ChatGPT 同款功能。
从 Mistral 官方发布的表格来看,除了 o1 和语音对话,其他功能基本都安排了。
其中也包括 OpenAI 最新上线的高级界面 Canvas,在 ChatGPT 中该功能目前还是会员专属。
在 Le Chat 的 Canvas 当中,可以单独展示生成的文稿,而不必再从对话中手动提取。
代码也可以如法炮制,并支持实时预览,还能选中局部代码要求做出修改。
再来是联网搜索,和 ChatGPT 一样,Le Chat 可以根据问题进行在线搜索总结,并附上来源信息,而且速度非常快。
另外,现在的 Le Chat 已经能够处理复杂的 PDF 文档和图像,并进行分析和总结,包括其中的表格、图表、文本、公式、方程等内容。
在下面的示例中,Le Chat 对爱因斯坦等人 1935 年撰写的著名量子纠缠论文进行了信息提取、概括和语义理解。
除了分析图片,最新的 Le Chat 也支持了文生图,不过 Mistral 暂未自研此类模型,而是选择了与 Flux 合作,接入其模型。
还可以创建并在对话中@智能体,智能执行一些任务,但是目前创建页面只有法语……
不过,目前 Mistral 已经发布的模型尚未拓展至语音模态,因此 ChatGPT 中的高级语音对话功能,Le Chat 是没有的,另外也没有桌面客户端。
所以,虽然 Mistral 此举被视为在功能上对 ChatGPT 的追赶,但离真正追上还存在一定的距离,不过倒是胜在免费(手动狗头)。
多模态模型大号版上线
在 Le Chat 中提供图像分析功能的,正是今天同时发布的大号版多模态大模型Pixtral Large。
它拥有124B 参数量,包括一个 123B 参数的解码器和一个 1B 参数的视觉编码器,此前 Mistral 曾经发布了小号的 12B 版本。
上下文窗口为 128k,相当于可以一次性处理至少 30 张高分辨率图像。
功能上 Pixtral Large 支持多语言 OCR 识别,并在此基础上进行推理。
也能看懂图表并分析其中的趋势。
同时,Pixtral Large在训练的过程当中还考虑到了前端应用,对此 Mistral 的 CEO Arthur Mensch 解释道:
从 Mistral 的成长经历中我们意识到,要想创造好的 AI 体验,需要模型和产品界面的协同设计。
Pixtral 就是一个很好的例子,它在训练过程中充分考虑了前端应用。
而至于模型本身的性能,按照 Mistral 的说法,Pixtral Large 是目前的 SOTA 视觉模型。
在 MMMU、MathVista、ChartQA 等六个不同任务类型的数据集中,Pixtral Large 取得了超过或接近与 Gemini-1.5 Pro 和 GPT-4o 的成绩,相对 Claude-3.5 Sonnet 优势更为明显,在开源模型中更是远远超过 Llama-3.2 90B。
此外 Mistral 团队还以 GPT-4o 作为评价者,使用其自己开源的MM-MT-Bench基准进行了测试,结果 Pixtral Large 领先于其他模型,包括既当裁判员又当运动员的 GPT-4o。
有网友看了 Pixtral 的成绩后表示,Benchmark 很快又需要更新了。
不过在 Reddit 上,有人提出质疑,表示 Pixtral 可能并没有达到 SOTA 水准——
Mistral 官方只将 Pixtral 和少数模型做了比较,其中开源模型只比较了 Llama-3.2 90B。
但实际在多个数据集上,Qwen2-VL(最大版参数量 72B)的表现比 Pixtral 更强。
同时在部分数据集中,Pixtral 的测试成绩也不如 Molmo(由西雅图一家名为 Ai2 的非营利研究机构开发)。
而且有人实测之后说,在他测试的含有日文的图片中,Pixtral Large 的识别能力还不如 Qwen 的 7B 版本。
那么,你觉得 Mistral 的新产品到底好不好用呢?
参考链接: