计费说明

UloveGPT 采用按量付费的计费模式，根据实际使用的 Token 数量计费。不同模型和不同操作类型（输入/输出/缓存）有不同定价。

计费模型

费用 = Input Token 费用 + Output Token 费用 + 缓存写入费用 + 缓存读取费用

操作类型	说明
Input Token	发送给模型的 prompt token 数量
Output Token	模型返回的 completion token 数量
Cache Write	首次写入缓存的 token 数量
Cache Read	从缓存读取的 token 数量（价格大幅降低）

模型定价示例

以下是部分常用模型的定价参考（完整定价请在控制台查看）：

模型	Input ($/1M)	Output ($/1M)	Cache Read ($/1M)
`gpt-5.4-mini`	$1.00	$3.00	$0.10
`gpt-5.4`	$2.50	$10.00	$0.25
`claude-sonnet-4.6`	$3.00	$15.00	$0.30
`claude-opus-4.6`	$15.00	$75.00	$1.50
`gemini-3.1-flash`	$0.15	$0.60	$0.04

费用计算示例

费用计算Text

# 费用计算示例
# 假设使用 openai/gpt-5.4-mini：
# Input Token:  $1.00 / 1M tokens
# Output Token: $3.00 / 1M tokens
# Cache Read:   $0.10 / 1M tokens
# Cache Write:  $1.25 / 1M tokens

# 一次请求：
# - Input:  2,000 tokens  → $0.002
# - Output: 500 tokens    → $0.0015
# - Cache Read: 1,800 tokens → $0.00018
# - 总费用: $0.00368

# 如果 10,000 次相同请求：
# - 首次 Cache Write:  2,000 × $0.00000125 = $0.0025
# - 后续 Cache Read:   9,999 × 1,800 × $0.0000001 = $0.0017998
# - Input (未缓存):    9,999 × 200 × $0.000001 = $0.0019998
# - Output:            9,999 × 500 × $0.000003 = $0.0149985
# - 总费用: ≈ $0.0213 (vs 无缓存 $0.035)

账单管理

预付费模式：先充值后使用，余额不足时服务暂停
实时扣费：每次请求完成后立即从余额中扣除对应费用
详细账单：可在控制台查看每笔消费的明细
用量告警：设置余额阈值，低于阈值时通知

降低成本的技巧

使用提示缓存：缓存命中率越高，成本越低
选择合适模型：简单任务用 mini/flash 级别模型
优化 Prompt：减少不必要的 system prompt 和上下文
设置 max_tokens：限制输出长度，避免过度生成
关注用量：定期检查用量报告，发现异常消费

← 用量追踪

API 参考 →

查看三大协议的完整 API 文档