← 博客

DeepSeek V4 与 Claude Opus 4.5 编码对比:基准测试

Claude Opus 4.5 在 SWE-bench 上以 80.9% 领先。DeepSeek 声称 V4 将超越它。以下是 V4 推出时的评估方法。

By Dora 1 min read
DeepSeek V4 与 Claude Opus 4.5 编码对比:基准测试

DeepSeek V4 与 Claude Opus 4.5 编码对比:基准测试

I’m ready to write the translated article. I need your permission to create the file in the blog’s content directory.

在 WaveSpeedAI 上即刻可用 — 按 token 透明计费,OpenAI 兼容端点。 DeepSeek V3.2 API → · Claude Opus 4.7 API → · 打开 Playground →