计费说明

UloveGPT 采用按量付费的计费模式,根据实际使用的 Token 数量计费。不同模型和不同操作类型(输入/输出/缓存)有不同定价。

计费模型

费用 = Input Token 费用 + Output Token 费用 + 缓存写入费用 + 缓存读取费用

操作类型说明
Input Token发送给模型的 prompt token 数量
Output Token模型返回的 completion token 数量
Cache Write首次写入缓存的 token 数量
Cache Read从缓存读取的 token 数量(价格大幅降低)

模型定价示例

以下是部分常用模型的定价参考(完整定价请在控制台查看):

模型Input ($/1M)Output ($/1M)Cache Read ($/1M)
gpt-5.4-mini$1.00$3.00$0.10
gpt-5.4$2.50$10.00$0.25
claude-sonnet-4.6$3.00$15.00$0.30
claude-opus-4.6$15.00$75.00$1.50
gemini-3.1-flash$0.15$0.60$0.04

费用计算示例

费用计算Text
# 费用计算示例
# 假设使用 openai/gpt-5.4-mini:
# Input Token:  $1.00 / 1M tokens
# Output Token: $3.00 / 1M tokens
# Cache Read:   $0.10 / 1M tokens
# Cache Write:  $1.25 / 1M tokens

# 一次请求:
# - Input:  2,000 tokens  → $0.002
# - Output: 500 tokens    → $0.0015
# - Cache Read: 1,800 tokens → $0.00018
# - 总费用: $0.00368

# 如果 10,000 次相同请求:
# - 首次 Cache Write:  2,000 × $0.00000125 = $0.0025
# - 后续 Cache Read:   9,999 × 1,800 × $0.0000001 = $0.0017998
# - Input (未缓存):    9,999 × 200 × $0.000001 = $0.0019998
# - Output:            9,999 × 500 × $0.000003 = $0.0149985
# - 总费用: ≈ $0.0213 (vs 无缓存 $0.035)

账单管理

  • 预付费模式:先充值后使用,余额不足时服务暂停
  • 实时扣费:每次请求完成后立即从余额中扣除对应费用
  • 详细账单:可在控制台查看每笔消费的明细
  • 用量告警:设置余额阈值,低于阈值时通知

降低成本的技巧

  • 使用提示缓存:缓存命中率越高,成本越低
  • 选择合适模型:简单任务用 mini/flash 级别模型
  • 优化 Prompt:减少不必要的 system prompt 和上下文
  • 设置 max_tokens:限制输出长度,避免过度生成
  • 关注用量:定期检查用量报告,发现异常消费