Grok-3四档定价揭秘:低至0.3美元/百万token,硬刚谷歌Meta

  新智元报道

  编辑:KingHZ

  刚刚,xAI 正式上线 Grok 3 API,一次性推出 4 种模型,以适配不同应用场景,定价策略灵活,用户可按需选择。同日,谷歌、Anthropic 等也推出新的定价策略。

  GenAI 竞争,越来越激烈了。

  据 Similar Web 统计,在日活跃用户方面,Grok 与 Gemini 展开了激烈竞争。两者都已经超过 50 万日活跃用户,差距不足 5 万。

  就在昨天,谷歌面向开发者推出全新套餐体系,其中标准套餐对个人开发者免费开放,可免费使用 Gemini 代码助手。

  谈及 API 价格策略,AI 巨头各出奇招:

  1. Grok-3 推出 2 款模型,支持 2 种调用模式,衍生出 4 种定价套餐;

  2. Anthropic 推出 100 美元的 Max 套餐,主打高端服务;

  3. 谷歌 Gemini 2.5 需付费解锁使用限制,以高性价比吸引用户;

  4. Meta 开源 Llama 3,成本优势显著,平均每百万 token 仅需 0.36 美元 。

  Grok-3:4 种模型,各取所需

  xAI,正式向公众开放了 Grok 3 系列 API!

  目前,Grok 3 和 Grok 3 Mini 均处于 Beta 测试阶段,支持常规模式与快速模式。

  • Grok 3 适用于企业应用场景,如数据抽取、编程、文本处理等。其价格为:每输入 100 万 token 收费 3 美元,每输出 100 万 token 收费 15 美元。

  • Grok 3 MINI 属于轻量级模型,适用于对深度领域知识无需求的简单任务。价格为:每输入 100 万 token 收费 0.3 美元,每输出 100 万 token 收费 0.5 美元。

  Grok-3Grok-3-fast使用的是相同的基座模型,提供相同的响应质量。

  它们的区别在于服务方式:Grok-3-fast 运行在更快的基础设施上,响应速度显著高于标准版grok-3,但其输出 token 的成本也更高

  Grok-3grok-3-fast指向的是相同的模型。

  • 如果需要低延迟的应用,选择grok-3-fast

  • 如果想降低成本,可以选择grok-3

  对于grok-3-minigrok-3-mini-fast也是如此。

  它们本质上是相同的模型,唯一的区别是响应延迟。

  可用模型列表

  • grok-3-beta(标准版):输入 3 美元/百万 token,输出 15 美元/百万 token

  • grok-3-fast-beta(标准版,快速响应):输入 5 美元/百万 token,输出 25 美元/百万 token

  • grok-3-mini-beta(轻量版):输入 0.3 美元/百万 token,输出 0.5 美元/百万 token

  • grok-3-mini-fast-beta(轻量版,快速响应):输入 0.6 美元/百万 token,输出 4 美元/百万 token

  在文档中,xAI 展示了几个示例。

  比如对话补全,可以流式传输响应,用户向 xAI API 端点发送请求。

  API 处理该请求后返回完整的响应。

import os
from openai import OpenAI
client = OpenAI (
    api_key=" " ,
    base_url="https://api.x.ai/v1",
)
completion = client.chat.completions.create (
    model="grok-3-latest",
    messages=[
        {"role": "system", "content": "You are a PhD-level mathematician."},
        {"role": "user", "content": "What is 2 + 2?"},
    ],
)
print (completion.choices[0].message)

  响应:

ChatCompletionMessage (
    content='2 + 2 equals 4.',
    refusal=None,
    role='assistant',
    audio=None,
    function_call=None,
    tool_calls=None
)

  AI 巨头,各显神通

  Gemini 系列模型推出了免费的 Gemini 2.5 Pro、 2.0 Flash 等最新模型。

  而且除了使用的模型不同,以及部分功能每日请求次数的限制,免费版几乎和付费版没有什么不同

  今天,Anthropic 推出了Max 套餐:最低 100 美元专为那些重度使用 Claude 并且需要更多使用次数,完成重要工作的用户设计。

  Llama 4 Maverick 相较于平均水平更为便宜,定价为每百万 token 为 0.36 美元。

  • Llama 4 Maverick 输入令牌价格:每百万个令牌 0.20 美元

  • Llama 4 Maverick 输出令牌价格:每百万个令牌 0.82 美元

  在 ARC-AGI 的半私有评估中,Llama 4 Maverick 非常具有性价比:

  - ARC-AGI-1:每个任务只要 0.0078 美元

  - ARC-AGI-2:每个任务只要 0.0121 美元

  参考资料: