Meta 开源多模态大模型 Llama 4

　　昨日，Meta 突然公布并开源了最新多模态大模型 Llama 4。据官方介绍，Llama 4 全系采用混合专家（MoE）架构，目前最强的开源多模态大模型，其重点为「文本、图像与视频的全能选手」。下面是几款模型的具体特点：

　　Llama 4 Scout：

面向文档摘要与大型代码库推理任务，专为高效信息提取与复杂逻辑推理打造；
共有 1090 亿参数，170 亿激活参数量；
上下文长度 1000 万 tokens（目前行业最长）。

　　Llama 4 Maverick：

以通用助手与聊天应用为核心，具备顶级的多语言支持与编程能力；
共有 4000 亿参数，170 亿激活参数量，分布于 128 个专家模块；
在大模型竞技场（Arena）中突破 1400 分，总排名第二；其中开放模型超越 DeepSeek V3 排名第一。
下载链接：https://www.llama.com/llama-downloads/

　　Llama 4 Behemoth（预览）：

未来最强大的 AI 模型之一，具备令人瞩目的超大规模参数架构；
2880 亿激活参数量，总参数 2 万亿（消费级根本跑不动）；
目标：在多模态处理与推理能力上实现突破；
这么庞大的模型训练需要巨量计算资源和时间，据悉在推理和数学任务等技术基准上仍未达预期。

　　值得一提的是，Llama 4 Scout 使用 Int4 量化就可以在单个 H100 GPU 上运行，Llama 4 Maverick 则可以直接在 H100 主机上运行。

　　值得一提的是，此前曾有消息称 DeepSeek 让 Meta AI 团队陷入恐慌：当生成式 AI 组织中的每个高管薪资都比训练整个 DeepSeek-V3 的成本还要高，而我们有好几十个这样的高管，他们要如何面对高层？

作者：itwriter
来源：互联网
日期：2025-04-07
浏览 (3546)