WaveSpeed API料金: クレジットの仕組み + シンプルなコスト計算機

WaveSpeed API料金: クレジットの仕組み + シンプルなコスト計算機

こんにちは、覚えていますか? 私はドーラです。

価格設定について考えようと思ったわけではありませんでした。ただ静かな午後のテストがしたかっただけです。でも小さなプロトタイプの配線の途中(2026年1月)で、メモが「これは機能するのか?」から「実際に出荷されたら何にコストがかかるのか?」へとシフトし始めました。それが通常、私が立ち止まる瞬間です。WaveSpeed API の価格設定は派手ではありません。コンテキストサイズ、再試行、データサイズなど、端々に隠れているようなものです。どれも劇的ではありませんが、積み重なります。ここでは実際の数字を使ってどのようにサイズを決めてきたか、そして推測できない部分では単なる見積もりを提供します。もし私のように小さな実験を出荷し、それが成長するかもしれないというやり方をしているなら、これは推測なしでプランを立てるのに役立つかもしれません。

価格設定がどのように測定されるか

WaveSpeed API の価格設定をきれいに説明する1つの数字を見つけることができませんでした。そこで、3つのバケットとして扱っています:

  • 基本通話: エンドポイントに1回当たるための手数料。「入場料」と考えてください。
  • 変動ワークロード: 送信して要求するものとともに成長する部分、トークン、ファイルサイズ、モデルティア、使用されるツール、コンテキスト長。
  • 追加機能: ストレージ、データエグレス、およびデータを永続化または移動するその他すべてのもの。

計画のために、シンプルな公式を使用します:

推定コスト = (実行数 × 通話あたりのベース) + (入力量 × 入力レート) + (出力量 × 出力レート) + (保存データ × ストレージレート × 月数) + (エグレスGB × エグレスレート)

退屈ですが、だからこそ機能します。レートを小さなシートに保持し、ドキュメントが変更されるときに調整します。あなたもこれを実行している場合は、公式の価格設定とリミットページをブックマークしてください:これらは頻繁に変更され、そこでの小さな変更は他のすべてに波及します。

コストを乗じる要因

いくつかのことが静かに合計を高くします。それらのどれもが「ひっかけ」ではありません。一緒に、それらは予算がドリフトする理由です。

  • 長いプロンプトと寛大な出力: 1k トークンごとの追加はすべて請求に表示されます。理由がない限り、最大出力トークンを上限にしています。
  • 再試行とフォールバック: 信頼性の向上に最適で、無制限に放置された場合はコストが粗くなります。指数バックオフと堅い上限を使用します。
  • 大きなファイル: トランスクリプション、ビジョン、またはPDF 解析は、大きなアセットを投げるときに高くなります。ダウンサンプルまたはチャンク化します。
  • ツーリングチェーン: 1つのユーザーアクションが複数のAPI呼び出しに拡大することがあります。各ツールステップが別の課金実行であることを忘れるのは簡単です。
  • 同時実行性: 並列処理はレイテンシーには最適ですが、負荷テスト中はコストが乗じられます。早期ではなく、後で有効にします。
  • ロギングとキャプチャ: デバッグに役立ちます。すべてを永遠に保存している場合は高価です。構造化ログを薄く保ち、積極的にローテーションします。

何も測定しない場合は、トークン、ファイルサイズ、および再試行カウントを測定してください。これら3つは私にとってほとんどの驚きを説明しています。

3つの実際のシナリオ(10 / 50 / 100実行)

これらは公式の数字ではありません。2026年1月のプロトタイプからの計画の見積もりです。独自のレートをスワップしてください:形状は保持する必要があります。

想定されるプレースホルダーレート(数学のみ用):

  • 通話あたりのベース: $0.002
  • 入力トークン: 100万トークンあたり $0.50 ($0.0005千あたり)
  • 出力トークン: 100万トークンあたり $1.00 ($0.001千あたり)
  • ストレージ: GB-月あたり $0.02
  • エグレス: GB あたり $0.09

シナリオA:短いプロンプト→短い回答

  • 平均入力: 600トークン出力: 200トークンファイルなし。
  • 実行ごと: 基本 $0.002 + 入力 (0.6k × $0.0005 = $0.0003) + 出力 (0.2k × $0.001 = $0.0002) = $0.0025
  • 10実行 ≈ $0.025 50実行 ≈ $0.125 100実行 ≈ $0.25

どのように感じたか: 再試行が開始されるまで基本的に無料でした。3回の再試行を許可すると、不安定な時間帯にコストはほぼ倍になりました。1回の再試行に上限を設定して、残りをキューに入れました。

シナリオB:中規模PDFの概要

  • 平均入力: チャンク化されたテキストから6,000トークン出力: 1,000トークン。
  • 実行ごと: 基本 $0.002 + 入力 (6k × $0.0005 = $0.003) + 出力 (1k × $0.001 = $0.001) = $0.006
  • 10実行 ≈ $0.06 50実行 ≈ $0.30 100実行 ≈ $0.60

注: ここでの隠れたコストは抽出でした。きれいなテキストチャンクの代わりに完全なPDFを送信すると、準備ステップが時間を追加し、時には2番目の呼び出しをしました。テキスト最初はより安く、より予測可能でした。

シナリオC:ライトビジョン+概要+エクスポート

  • 画像: 平均1.5 MB 入力2,000トークン出力500トークン結果を1ヶ月保存エグレス0.5 GB実行全体。
  • 実行ごと(API): 基本 $0.002 + 入力 (2k × $0.0005 = $0.001) + 出力 (0.5k × $0.001 = $0.0005) = $0.0035
  • ストレージ: 各結果が約200 KBのアーティファクトを追加する場合、100実行 ≈ 20 MB = 0.02 GB × $0.02 ≈ $0.0004/月 (無視できる)
  • エグレス: 0.5 GB × $0.09 = $0.045 バッチ全体
  • 10実行 ≈ $0.035 + 小さなストレージ 50実行 ≈ $0.175 + エグレス(エクスポートする場合) 100実行 ≈ $0.35 + 約 $0.045 エグレス

何が驚いたか: エグレスは私が感じた唯一の項目でした。巨大ではありませんが、クライアント向けのメディアをエクスポートするときは目立ちました。

ある時点で、私は推定をやめて、物事が予測可能なままであることを望みました。
それが私たちがWaveSpeedを構築した理由です — トークンカウント、再試行、またはサプライズエグレス行を常に監視することなく、これのような実験を実行するために。

スケールするかもしれないアイデアをストレステストしている場合は、試してみてください。

コスト計算機テーブル

私は小さなワークシートを保持しています。それは派手ではなく、正直な数学です。簡単なスケッチがしたい場合は、このパターンに数字をドロップしてください。

実行ベース/通話 ($)実行ごとの入力トークン実行ごとの出力トークン入力レート ($/1k)出力レート ($/1k)エグレス (GB)エグレス $/GB推定合計 ($)
100.0026002000.00050.00100.09(10×0.002) + (10×0.6×0.0005) + (10×0.2×0.001) + (0×0.09)
500.002600010000.00050.00100.09(50×0.002) + (50×6×0.0005) + (50×1×0.001)
1000.00220005000.00050.0010.50.09(100×0.002) + (100×2×0.0005) + (100×0.5×0.001) + (0.5×0.09)

: プレースホルダーレートを WaveSpeed の価格設定ページの現在の数字に置き換えてください。バージョンをシートに保持し、日付列があるだけなので、何が変更されたかと時期を覚えています。

無駄を削減する方法

私にとって最も役立ったことは魔法ではなく、固執した安全柵でした:

  • 最大出力トークンを設定してください。長い回答は素晴らしいです:予測可能な請求はより良いです。
  • プロンプトをトリミングします。システムプロンプトを再利用し、テキストの壁を貼り付ける代わりに参照IDを使用します。
  • キャッシュ中間結果。変更されていないコンテンツを再埋め込みまたは再要約しないでください。
  • 安全な場所で一括処理します。10の小さな呼び出しは1つの巨大な呼び出しより安い場合も、反対の場合もあります。両方をテストしてください。
  • ファイルサイズを適切にします。送信する前に画像をダウンサンプルし、PDFからテキストを抽出します。
  • 再試行とタイムアウトを上限にします。信頼性は良いです:無限ループはそうではありません。
  • 疎にログを記録します。ハッシュとID を保持する:本当に必要でない限り、未処理ペイロードを削除します。

チーム請求のヒント

私はチームコストで1回以上つまずきました。いくつかの習慣が私を救いました:

  • 環境とプロジェクトごとに個別のキー。属性を明らかにします。
  • ユーザーまたは機能IDでリクエストにタグを付けます。事後コスト単位は計画中に金です。
  • 毎週のスナップショットを含む共有ダッシュボード。誰も毎日のノイズを読みません。
  • プロジェクトレベルでの柔らかい予算。80%に達すると、機能は遅くなるか、より安い経路に切り替わります。
  • 1人が価格更新を所有しています。ゲートキープするのではなく、ドリフトを減らすためだけです。
  • ランブックを保持しています: コストが急増したときに最初に調整するもの(出力トークン、同時実行性、またはオプションツール)。

予算ガードレール

ここでは、実際のユーザーに面する前に実装したものです:

  • 飛行前見積もり: 実行ごとの推定コストを計算してログに追加する小さな関数。
  • アクション当たりの上限: 単一の実行が$Xを超える投影をしている場合、それは丁寧に拒否します。
  • 日次および月次の上限とアラート。アラートは誰かが実際に見守っている静かなチャネルに送信します。
  • スローモード: 予算圧力下で同時実行性を半減させるフラグ。
  • ヘビーパスのフィーチャーフラグ: 再デプロイせずにビジョンまたは長コンテキスト機能をオフにします。
  • レビュー周期: 15分ごと2番目の金曜日に公式価格設定ページからレートを更新します。 正直なところ、これの何もが魅力的ではありません。しかしWaveSpeed API の価格設定はあなたがしているときに動作します。面白いのは、ガードレール一度に入ると、ツールは背景に消えて、正確には私がそれを好む場所です。

習慣の外にトークンカウントをチェックしていることに気付きますが、数字が妥当に見えるときはタブを閉じています。古い習慣。小さな救済。それを取ります。