DeepSeek在5月22日宣布了一个重大利好:V4 Pro模型的API价格将永久调整为原价的25%。这意味着此前的75%折扣促销将变成正式定价,不再是临时活动。
具体价格变化
调整后的V4 Pro定价:
输入token(缓存命中):$0.0145/百万token
输入token(缓存未命中):$1.74/百万token
输出token:$3.48/百万token
作为对比,V4 Flash的价格依然保持在极低水平:
输入token(缓存命中):$0.0028/百万token
输入token(缓存未命中):$0.14/百万token
输出token:$0.28/百万token
V4 Pro还支持高达100万token的上下文长度,最大输出384K token,支持JSON输出、工具调用和Chat前缀补全。
为什么这对站长很重要
DeepSeek一直是性价比最高的AI API选择之一。V4 Pro永久降价75%后,价格优势更加明显:
1. 和Claude Sonnet对比:Claude Sonnet的输入价格约$3/百万token,输出约$15/百万token。V4 Pro降价后的价格大约是Claude Sonnet的1/5到1/4。
2. 和GPT-4o对比:GPT-4o的输入约$2.5/百万token,输出约$10/百万token。V4 Pro的价格大约是GPT-4o的1/3。
3. 对于中文场景:DeepSeek在中文理解和生成方面的表现一直很强,结合这个价格,对中文站长来说几乎是最佳选择。
实际使用建议
什么场景用V4 Flash:简单的对话、内容生成、分类、摘要等不需要深度推理的任务。价格极低,适合高并发场景。
什么场景用V4 Pro:复杂推理、代码生成、长文档分析、需要高质量输出的任务。降价后的价格已经非常亲民。
缓存命中优化:V4 Pro的缓存命中价格只有$0.0145/百万token,是缓存未命中价格的1/120。如果你的应用有重复的system prompt或常见查询,善用缓存可以大幅降低成本。
并发限制
需要注意的是,V4 Pro的并发限制是500,V4 Flash是2500。如果你的应用需要高并发,可能需要做请求队列或分流处理。
模型名称迁移提醒
DeepSeek提醒,旧的模型名称deepseek-chat和deepseek-reasoner将在未来被弃用。deepseek-chat对应V4 Flash的非思考模式,deepseek-reasoner对应V4 Flash的思考模式。建议尽早迁移到新模型名称。
这次永久降价让DeepSeek在AI API市场的价格竞争力进一步提升。对于成本敏感的站长和开发者来说,这是一个值得认真考虑切换的时机。














Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro


暂无评论内容