Seedance 2.0 | Special Offer ✦ 10% OFF NOW | Ends May 13 (UTC+0)
openai
openai/gpt-4o-audio-preview

openai/gpt-4o-audio-preview

128,000 context · $2.50/M input tokens · $10.00/M output tokens

The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs are currently not supported. Audio tokens are priced at $40 per million input and $80 per million output audio tokens.

Fiyatlandırma

Kullandıkça öde

Ön ödeme yok, yalnızca kullandığınız kadar ödeyin

Giriş$2.50 / M Tokens
Çıkış$10.00 / M Tokens

API Kullanımı

API'mizle entegre etmek için aşağıdaki kod örneklerini kullanın:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="openai/gpt-4o-audio-preview",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

Model Tanıtımı

Openai gpt-4o-audio-preview

The gpt-4o-audio-preview model adds support for audio inputs as prompts

The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs are currently not supported. Audio tokens are priced at $40 per million input and $80 per million output audio tokens.


Why It Looks Great

  • Large Language Model architecture for efficient processing
  • 128000 context window for long document handling
  • Competitive pricing at $2.5/$10.0 per million tokens

Key Features

  • Context Window: 128000 tokens
  • Max Output: 16384 tokens
  • Vision: Supported
  • Function Calling: Supported

Specifications

SpecificationValue
ProviderOpenai
Model TypeLarge Language Model (LLM)
ArchitectureN/A
Context Window128000 tokens
Max Output16384 tokens
InputText
OutputText
VisionSupported
Function CallingSupported

Pricing

Token TypeCost per Million Tokens
Input$2.5
Output$10.0

How to Use

  1. Write your prompt — describe the task, provide context, and specify desired output format.
  2. Submit — the model processes your request and returns the response.

API Integration

Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: openai/gpt-4o-audio-preview


API Usage

Python SDK

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="openai/gpt-4o-audio-preview",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

cURL

curl https://llm.wavespeed.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "openai/gpt-4o-audio-preview",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Notes

  • Model: openai/gpt-4o-audio-preview
  • Provider: Openai

Bilgi

Sağlayıcıopenai
Türllm

Desteklenen İşlevsellik

Giriş
MetinSes
Çıkış
Metin
Bağlam128,000
Maks. Çıkış16,384
Vision-
Function Calling✓ Destekleniyor

API Erişim Kılavuzu

Base URLhttps://llm.wavespeed.ai/v1
API Endpointchat/completions
Model IDopenai/gpt-4o-audio-preview

GPT 4o Audio Preview API

openai/gpt-4o-audio-preview

The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs are currently not supported. Audio tokens are priced at $40 per million input and $80 per million output audio tokens.

Giriş

$2.5 /M

Çıkış

$10 /M

Bağlam

128K

Maks. Çıkış

16K

Araç Kullanımı

Destekleniyor

GPT 4o Audio Preview'i WaveSpeedAI'da deneyin

Birleşik API'miz aracılığıyla GPT 4o Audio Preview'e erişin — OpenAI uyumlu, soğuk başlatma yok, şeffaf fiyatlandırma.

GPT 4o Audio Preview hakkında sık sorulan sorular

GPT 4o Audio Preview API ücreti ne kadar?+

WaveSpeedAI fiyatlandırması: milyon giriş tokenı başına $2.50 ve milyon çıkış tokenı başına $10.00. Prompt caching ve toplu işleme ayrı faturalanır ve uzun, tekrar eden yüklerde etkin maliyeti düşürür.

GPT 4o Audio Preview'in bağlam penceresi nedir?+

GPT 4o Audio Preview istek başına 128K bağlam tokenını ve 16K çıkış tokenını destekler.

GPT 4o Audio Preview OpenAI uyumlu mu?+

Evet. WaveSpeedAI, GPT 4o Audio Preview modelini https://llm.wavespeed.ai/v1 adresindeki OpenAI uyumlu endpoint üzerinden sunar. Resmi OpenAI SDK'sını WaveSpeedAI API anahtarınızla bu base URL'ye yöneltin — başka kod değişikliği gerekmez.

GPT 4o Audio Preview'e nasıl başlarım?+

WaveSpeedAI'a giriş yapın, Access Keys'te bir API anahtarı oluşturun, ardından yukarıda gösterilen model id ile https://llm.wavespeed.ai/v1/chat/completions adresine bir istek gönderin. Yeni hesaplar GPT 4o Audio Preview'i değerlendirmek için ücretsiz krediler alır.

İlgili LLM API'leri