Seedance 2.0 | Special Offer ✦ 10% OFF NOW
openai
openai/gpt-5.4-mini

openai/gpt-5.4-mini

400,000 context · $0.75/M input tokens · $4.50/M output tokens

GPT-5.4 mini brings the core capabilities of GPT-5.4 to a faster, more efficient model optimized for high-throughput workloads. It supports text and image inputs with strong performance across reasoning, coding, and tool use, while reducing latency and cost for large-scale deployments. The model is designed for production environments that require a balance of capability and efficiency, making it well suited for chat applications, coding assistants, and agent workflows that operate at scale. GPT-5.4 mini delivers reliable instruction following, solid multi-step reasoning, and consistent performance across diverse tasks with improved cost efficiency.

Preise

Pay-per-Use

Keine Vorabkosten, zahlen Sie nur, was Sie nutzen

Eingabe$0.75 / M Tokens
Ausgabe$4.50 / M Tokens

API-Nutzung

Verwenden Sie die folgenden Codebeispiele zur Integration mit unserer API:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="openai/gpt-5.4-mini",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

Info

Anbieteropenai
Typllm

Unterstützte Funktionen

Eingabe
TextBild
Ausgabe
Text
Kontext400,000
Max. Ausgabe128,000
Vision✓ Unterstützt
Function Calling✓ Unterstützt

API-Zugriffsanleitung

Base URLhttps://llm.wavespeed.ai/v1
API-Endpunktchat/completions
Modell-IDopenai/gpt-5.4-mini

GPT 5.4 Mini API

openai/gpt-5.4-mini

GPT-5.4 mini brings the core capabilities of GPT-5.4 to a faster, more efficient model optimized for high-throughput workloads. It supports text and image inputs with strong performance across reasoning, coding, and tool use, while reducing latency and cost for large-scale deployments. The model is designed for production environments that require a balance of capability and efficiency, making it well suited for chat applications, coding assistants, and agent workflows that operate at scale. GPT-5.4 mini delivers reliable instruction following, solid multi-step reasoning, and consistent performance across diverse tasks with improved cost efficiency.

Eingabe

$0.75 /M

Ausgabe

$4.5 /M

Kontext

400K

Max. Ausgabe

128K

Vision

Unterstützt

Tool-Nutzung

Unterstützt

GPT 5.4 Mini auf WaveSpeedAI testen

Zugriff auf GPT 5.4 Mini über unsere einheitliche API — OpenAI-kompatibel, keine Kaltstarts, transparente Preise.

Playground öffnen

Häufige Fragen zu GPT 5.4 Mini

Wie viel kostet die GPT 5.4 Mini-API?+

Preise auf WaveSpeedAI: $0.75 pro Million Input-Tokens und $4.50 pro Million Output-Tokens. Prompt-Caching und Batch-Verarbeitung werden separat berechnet und reduzieren die effektiven Kosten bei langen, sich wiederholenden Workloads.

Wie groß ist das Kontextfenster von GPT 5.4 Mini?+

GPT 5.4 Mini unterstützt bis zu 400K Kontext-Tokens und bis zu 128K Output-Tokens pro Anfrage.

Ist GPT 5.4 Mini OpenAI-kompatibel?+

Ja. WaveSpeedAI stellt GPT 5.4 Mini über einen OpenAI-kompatiblen Endpunkt unter https://llm.wavespeed.ai/v1 bereit. Richten Sie das offizielle OpenAI SDK mit Ihrem WaveSpeedAI-API-Schlüssel auf diese Base-URL — keine weiteren Codeänderungen erforderlich.

Wie starte ich mit GPT 5.4 Mini?+

Bei WaveSpeedAI anmelden, in Access Keys einen API-Schlüssel erstellen und eine Anfrage an https://llm.wavespeed.ai/v1/chat/completions mit der oben angezeigten Model-ID senden. Neue Konten erhalten kostenlose Credits, um GPT 5.4 Mini zu testen.

Verwandte LLM-APIs