价格战
2026年的LLM API市场正在经历一场真正的价格战。过去一年,推理成本根据供应商不同下降了2-5倍。让我们看看当前主要模型的价格,以及如何选择最优方案。
价格表(2026年3月)
旗舰模型
| 模型 |
输入 ($/1M) |
输出 ($/1M) |
缓存输入 |
上下文 |
| GPT-5.3 |
$8.00 |
$24.00 |
$2.00 |
128K |
| Claude Opus 4.6 |
$15.00 |
$75.00 |
$3.75 |
200K |
| Claude Sonnet 4.6 |
$3.00 |
$15.00 |
$0.75 |
256K |
| Gemini 3.1 Pro |
$3.50 |
$10.50 |
$0.88 |
1M |
| DeepSeek V3 |
$0.27 |
$1.10 |
$0.07 |
128K |
| Qwen 3 72B |
$0.40 |
$1.20 |
– |
128K |
轻量模型
| 模型 |
输入 ($/1M) |
输出 ($/1M) |
上下文 |
| GPT-5.3 Mini |
$0.40 |
$1.60 |
128K |
| Claude Haiku 3.5 |
$0.80 |
$4.00 |
200K |
| Gemini 3.1 Flash |
$0.15 |
$0.60 |
1M |
| DeepSeek V3 Lite |
$0.07 |
$0.28 |
64K |
| Qwen 3 7B |
$0.05 |
$0.15 |
32K |
推理模型
| 模型 |
输入 ($/1M) |
输出 ($/1M) |
| o3 |
$10.00 |
$40.00 |
| o4-mini |
$1.10 |
$4.40 |
| DeepSeek R1 |
$0.55 |
$2.19 |
| Claude Sonnet 4.6 (extended) |
$3.00 |
$15.00 |
实际应用成本
场景1:分析一份财务报告
- 文档大小:约30,000个token(输入)
- 模型回复:约2,000个token(输出)
| 模型 |
单次请求成本 |
| GPT-5.3 |
$0.29 |
| Claude Sonnet 4.6 |
$0.12 |
| Gemini 3.1 Pro |
$0.13 |
| DeepSeek V3 |
$0.01 |
场景2:每日新闻分析(100篇文章)
- 输入:约500,000个token/天
- 输出:约50,000个token/天
| 模型 |
日成本 |
月成本 |
| GPT-5.3 |
$5.20 |
$156 |
| Claude Sonnet 4.6 |
$2.25 |
$67.50 |
| Gemini 3.1 Pro |
$2.28 |
$68.25 |
| DeepSeek V3 |
$0.19 |
$5.64 |
场景3:智能体交易系统(24/7)
- 每日请求数:约1,000次
- 平均输入:10,000个token
- 平均输出:1,000个token
- 月度合计:3亿输入 + 3000万输出
| 模型 |
月成本 |
| GPT-5.3 |
$3,120 |
| Claude Opus 4.6 |
$6,750 |
| Claude Sonnet 4.6 |
$1,350 |
| Gemini 3.1 Pro |
$1,365 |
| DeepSeek V3 |
$114 |
隐性成本
每token价格不是唯一的考量因素:
速率限制
- OpenAI:500-10,000 RPM(取决于套餐)
- Anthropic:1,000-4,000 RPM
- Google:最高60,000 RPM
- DeepSeek:高负载时存在限流
延迟
- GPT-5.3:约800ms TTFT
- Claude Sonnet 4.6:约600ms TTFT
- Gemini 3.1 Pro:约500ms TTFT
- DeepSeek V3:约1200ms TTFT(受服务器地理位置影响)
可靠性(正常运行时间)
- OpenAI:99.8%(偶有事故)
- Anthropic:99.9%
- Google:99.95%
- DeepSeek:99.5%(基础设施较新)
建议
| 使用场景 |
最佳选择 |
原因 |
| 批量数据分析 |
DeepSeek V3 |
价格 |
| 关键决策 |
Claude Opus 4.6 |
质量 |
| 编程 |
Claude Sonnet 4.6 |
SWE-Bench |
| 长上下文 |
Gemini 3.1 Pro |
100万token |
| 预算方案 |
Qwen 3 7B(自托管) |
免费 |
价格持续下降。今天花100美元/月的服务,一年后可能只需20美元。在规划基础设施时请考虑这一趋势。
讨论
加入我们的讨论 Telegram 群组!