计费说明
UloveGPT 采用按量付费的计费模式,根据实际使用的 Token 数量计费。不同模型和不同操作类型(输入/输出/缓存)有不同定价。
计费模型
费用 = Input Token 费用 + Output Token 费用 + 缓存写入费用 + 缓存读取费用
| 操作类型 | 说明 |
|---|---|
| Input Token | 发送给模型的 prompt token 数量 |
| Output Token | 模型返回的 completion token 数量 |
| Cache Write | 首次写入缓存的 token 数量 |
| Cache Read | 从缓存读取的 token 数量(价格大幅降低) |
模型定价示例
以下是部分常用模型的定价参考(完整定价请在控制台查看):
| 模型 | Input ($/1M) | Output ($/1M) | Cache Read ($/1M) |
|---|---|---|---|
gpt-5.4-mini | $1.00 | $3.00 | $0.10 |
gpt-5.4 | $2.50 | $10.00 | $0.25 |
claude-sonnet-4.6 | $3.00 | $15.00 | $0.30 |
claude-opus-4.6 | $15.00 | $75.00 | $1.50 |
gemini-3.1-flash | $0.15 | $0.60 | $0.04 |
费用计算示例
费用计算Text
# 费用计算示例
# 假设使用 openai/gpt-5.4-mini:
# Input Token: $1.00 / 1M tokens
# Output Token: $3.00 / 1M tokens
# Cache Read: $0.10 / 1M tokens
# Cache Write: $1.25 / 1M tokens
# 一次请求:
# - Input: 2,000 tokens → $0.002
# - Output: 500 tokens → $0.0015
# - Cache Read: 1,800 tokens → $0.00018
# - 总费用: $0.00368
# 如果 10,000 次相同请求:
# - 首次 Cache Write: 2,000 × $0.00000125 = $0.0025
# - 后续 Cache Read: 9,999 × 1,800 × $0.0000001 = $0.0017998
# - Input (未缓存): 9,999 × 200 × $0.000001 = $0.0019998
# - Output: 9,999 × 500 × $0.000003 = $0.0149985
# - 总费用: ≈ $0.0213 (vs 无缓存 $0.035)账单管理
- 预付费模式:先充值后使用,余额不足时服务暂停
- 实时扣费:每次请求完成后立即从余额中扣除对应费用
- 详细账单:可在控制台查看每笔消费的明细
- 用量告警:设置余额阈值,低于阈值时通知
降低成本的技巧
- 使用提示缓存:缓存命中率越高,成本越低
- 选择合适模型:简单任务用 mini/flash 级别模型
- 优化 Prompt:减少不必要的 system prompt 和上下文
- 设置 max_tokens:限制输出长度,避免过度生成
- 关注用量:定期检查用量报告,发现异常消费