价格战

2026年的LLM API市场正在经历一场真正的价格战。过去一年,推理成本根据供应商不同下降了2-5倍。让我们看看当前主要模型的价格,以及如何选择最优方案。

价格表(2026年3月)

旗舰模型

模型 输入 ($/1M) 输出 ($/1M) 缓存输入 上下文
GPT-5.3 $8.00 $24.00 $2.00 128K
Claude Opus 4.6 $15.00 $75.00 $3.75 200K
Claude Sonnet 4.6 $3.00 $15.00 $0.75 256K
Gemini 3.1 Pro $3.50 $10.50 $0.88 1M
DeepSeek V3 $0.27 $1.10 $0.07 128K
Qwen 3 72B $0.40 $1.20 128K

轻量模型

模型 输入 ($/1M) 输出 ($/1M) 上下文
GPT-5.3 Mini $0.40 $1.60 128K
Claude Haiku 3.5 $0.80 $4.00 200K
Gemini 3.1 Flash $0.15 $0.60 1M
DeepSeek V3 Lite $0.07 $0.28 64K
Qwen 3 7B $0.05 $0.15 32K

推理模型

模型 输入 ($/1M) 输出 ($/1M)
o3 $10.00 $40.00
o4-mini $1.10 $4.40
DeepSeek R1 $0.55 $2.19
Claude Sonnet 4.6 (extended) $3.00 $15.00

实际应用成本

场景1:分析一份财务报告

  • 文档大小:约30,000个token(输入)
  • 模型回复:约2,000个token(输出)
模型 单次请求成本
GPT-5.3 $0.29
Claude Sonnet 4.6 $0.12
Gemini 3.1 Pro $0.13
DeepSeek V3 $0.01

场景2:每日新闻分析(100篇文章)

  • 输入:约500,000个token/天
  • 输出:约50,000个token/天
模型 日成本 月成本
GPT-5.3 $5.20 $156
Claude Sonnet 4.6 $2.25 $67.50
Gemini 3.1 Pro $2.28 $68.25
DeepSeek V3 $0.19 $5.64

场景3:智能体交易系统(24/7)

  • 每日请求数:约1,000次
  • 平均输入:10,000个token
  • 平均输出:1,000个token
  • 月度合计:3亿输入 + 3000万输出
模型 月成本
GPT-5.3 $3,120
Claude Opus 4.6 $6,750
Claude Sonnet 4.6 $1,350
Gemini 3.1 Pro $1,365
DeepSeek V3 $114

隐性成本

每token价格不是唯一的考量因素:

速率限制

  • OpenAI:500-10,000 RPM(取决于套餐)
  • Anthropic:1,000-4,000 RPM
  • Google:最高60,000 RPM
  • DeepSeek:高负载时存在限流

延迟

  • GPT-5.3:约800ms TTFT
  • Claude Sonnet 4.6:约600ms TTFT
  • Gemini 3.1 Pro:约500ms TTFT
  • DeepSeek V3:约1200ms TTFT(受服务器地理位置影响)

可靠性(正常运行时间)

  • OpenAI:99.8%(偶有事故)
  • Anthropic:99.9%
  • Google:99.95%
  • DeepSeek:99.5%(基础设施较新)

建议

使用场景 最佳选择 原因
批量数据分析 DeepSeek V3 价格
关键决策 Claude Opus 4.6 质量
编程 Claude Sonnet 4.6 SWE-Bench
长上下文 Gemini 3.1 Pro 100万token
预算方案 Qwen 3 7B(自托管) 免费

价格持续下降。今天花100美元/月的服务,一年后可能只需20美元。在规划基础设施时请考虑这一趋势。