WaveSpeed API定价:积分工作原理 + 简单成本计算器

WaveSpeed API定价:积分工作原理 + 简单成本计算器

你好,还记得我吗?我是Dora。

我本来没打算思考定价的问题。我只是想要一个安静的下午来测试。但在半途中接线一个小原型时(2026年1月),我的笔记开始从”这能工作吗?“漂移到”如果这真的发货,会花多少钱?“这通常是我暂停的时刻。WaveSpeed API定价不是花哨的。这是隐藏在边缘的那种,上下文大小、重试、数据大小。没有一个是戏剧性的,但它加起来。这是我一直在如何测算它的,用真实数字在我能的地方和普通估计在我不能的地方。如果你像我一样工作,发货小的实验可能会增长,这可能会帮助你计划而不是猜测。

定价如何计量

我找不到一个能够清晰地捕捉WaveSpeed API定价的单一数字。所以我把它视为三个桶:

  • 基础通话:命中一次端点的费用。把它看作”门票费”。
  • 可变工作负载:与你发送和要求的内容一起增长的部分,令牌、文件大小、模型层级、使用的工具、上下文长度。
  • 额外费用:存储、数据传出和任何持久或移动数据的东西。

为了规划,我使用一个简单的公式:

估计成本 = (runs × base_per_call) + (input_volume × rate_in) + (output_volume × rate_out) + (data_stored × storage_rate × months) + (egress_GB × egress_rate)

这很无聊,这就是为什么它有效。我在一个小表单中保留费率,并在文档更改时进行调整。如果你也在做这个,请收藏官方定价和限制页面:它们经常变化,那里的小变化会涟漪传播到其他所有地方。

乘以成本的因素

有几件事悄悄推高了总数。它们中任何一个都不是”陷阱”。总的来说,它们是预算漂移的原因。

  • 长提示和宽松的输出:每额外1k令牌都会显示在账单上。我只在有充分理由时才上限最大输出令牌。
  • 重试和回退:对于可靠性来说是坚实的,如果放任不管则对成本来说是粗糙的。我使用指数级回退并有严格的上限。
  • 大文件:转录、视觉或PDF解析在你向其投入大资产时会很昂贵。我对其进行下采样或分块。
  • 工具链:一个用户操作可以扇出到多个API调用。很容易忘记每个工具步骤都是另一个可计费的运行。
  • 并发:并行性对于延迟来说很好,但在负载测试中会乘以成本。我后期启用它,而不是早期。
  • 日志和捕获:有助于调试。如果你永远存储所有东西则很昂贵。我保持结构化日志很薄并积极轮换。

如果你只测量其他的,请测量令牌、文件大小和重试计数。这三个为我解释了大多数意外。

3个真实场景(10 / 50 / 100次运行)

这些不是官方数字。它们是我从2026年1月原型的规划估计。代入你自己的费率:形状应该保持。

假设的占位符费率(仅供数学使用):

  • 每次通话基础:$0.002
  • 输入令牌:每1M令牌$0.50(每1k $0.0005)
  • 输出令牌:每1M令牌$1.00(每1k $0.001)
  • 存储:每GB-月$0.02
  • 传出:每GB $0.09

场景A:短提示→短答案

  • 平均输入:600令牌:输出:200令牌:无文件。
  • 每次运行:基础$0.002 + 输入(0.6k × $0.0005 = $0.0003)+ 输出(0.2k × $0.001 = $0.0002)= $0.0025
  • 10次运行≈ $0.025:50次运行≈ $0.125:100次运行≈ $0.25

感觉如何:基本免费,直到重试启动。当我允许3次重试时,在不稳定的一小时内成本几乎翻倍。我上限为1次重试并排队其余的。

场景B:中等PDF的摘要

  • 平均输入:来自分块文本的6,000令牌:输出:1,000令牌。
  • 每次运行:基础$0.002 + 输入(6k × $0.0005 = $0.003)+ 输出(1k × $0.001 = $0.001)= $0.006
  • 10次运行≈ $0.06:50次运行≈ $0.30:100次运行≈ $0.60

注意:这里隐藏的成本是提取。当我发送完整PDF而不是干净的文本块时,准备步骤增加了时间,有时需要第二次通话。文本优先更便宜且更可预测。

场景C:轻视觉+摘要+导出

  • 图像:平均1.5 MB:输入2,000令牌:输出500令牌:存储结果1个月:导出在运行中总共0.5 GB。
  • 每次运行(API):基础$0.002 + 输入(2k × $0.0005 = $0.001)+ 输出(0.5k × $0.001 = $0.0005)= $0.0035
  • 存储:如果每个结果增加~200 KB的工件,100次运行≈ 20 MB = 0.02 GB × $0.02 ≈ $0.0004/月(可忽略)
  • 传出:0.5 GB × $0.09 = 总批次中$0.045
  • 10次运行≈ $0.035 + 微小存储:50次运行≈ $0.175 + 如果你导出则传出:100次运行≈ $0.35 + ~$0.045传出

让我惊讶的是:传出是我感到的唯一账目项目。不巨大,但在我为客户导出媒体时很引人注目。

在某个时刻,我停止想要估计,只是想让事情保持可预测。
这就是为什么我们构建了WaveSpeed — 来运行像这样的实验而不断地观看令牌计数、重试或意外的传出行。

如果你对可能扩展的想法进行压力测试,请尝试一下。

成本计算器表

我保持一个微小的工作表。这不花哨,只是诚实的数学。如果你想要快速草图,将你的数字放入这个模式。

运行次数每次通话基础 ($)每次运行输入令牌每次运行输出令牌费率输入 ($/1k)费率输出 ($/1k)传出 (GB)传出 $/GB估计总计 ($)
100.0026002000.00050.00100.09(10×0.002) + (10×0.6×0.0005) + (10×0.2×0.001) + (0×0.09)
500.002600010000.00050.00100.09(50×0.002) + (50×6×0.0005) + (50×1×0.001)
1000.00220005000.00050.0010.50.09(100×0.002) + (100×2×0.0005) + (100×0.5×0.001) + (0.5×0.09)

注意: 用WaveSpeed 定价页面的当前数字替换占位符费率。我在表单中保留版本,只需一个日期列,这样我就记得什么改变了以及何时改变。

如何减少浪费

对我帮助最大的不是魔法,只是坚持下来的护栏:

  • 设置最大输出令牌。长答案很不错:可预测的账单更不错。
  • 修剪提示。重用系统提示和参考ID而不是粘贴文本墙。
  • 缓存中间结果。不要重新嵌入或重新总结未更改的内容。
  • 在安全的地方进行批处理。十个小通话可能比一个巨大的便宜,或相反。测试两者。
  • 正确调整文件大小。下采样图像,在发送前从PDF提取文本。
  • 上限重试和超时。可靠性很好:无限循环则不是。
  • 稀疏记录。保留哈希和ID:除非你真正需要,否则删除原始有效载荷。

团队计费提示

我在团队成本上绊过不止一次。一些习惯为我节省了:

  • 每个环境和项目分离密钥。使属性明显。
  • 用用户或功能ID标记请求。事后每个功能的成本在规划中是金子。
  • 带有每周快照的共享仪表板。没有人读取每日噪音。
  • 项目级软预算。当达到80%时,功能减速或切换到更便宜的路径。
  • 一个人拥有定价更新。不是为了把持,只是为了减少漂移。
  • 保持一个运行手册:当成本飙升时首先节流什么(输出令牌、并发或可选工具)。

预算护栏

这是我在任何东西面向真实用户之前放在原位的:

  • 飞行前估计器:一个计算每个操作估计成本并将其添加到日志的小函数。
  • 每个操作上限:如果单个运行投影超过$X,它礼貌地拒绝。
  • 每日和每月上限,包括警报。警报进入某人实际观看的安静频道。
  • 慢速模式:在预算压力下将并发减半的标志。
  • 重路径的功能标志:在不重新部署的情况下关闭视觉或长上下文功能。
  • 审查节奏:每隔一个星期五15分钟从官方定价页面更新费率。

老实说,这都不是光彩的。但WaveSpeed API定价在你这样做时会表现。有趣的是,一旦护栏就位,工具就会再次褪色到背景中,正好是我喜欢它的地方。

我仍然抓住自己出于习惯检查令牌计数的习惯,然后在数字看起来合理时关闭标签。旧习惯。小小的安慰。我会接受这个。