阿里云百炼宣布部分模型上下文缓存降价

  阿里云大模型服务平台百炼 8 月 26 日发布部分模型上下文缓存降价通知。

  本次调价后,当请求部分模型命中缓存时,命中的输入 Token 将按 cached_token 计费,单价从调价前 input_token 单价的 40% 调整到 input_token 单价的 20%;未被命中的输入 Token 按标准 input_token 计费。