Seedance 2.0 | Special Offer ✦ 10% OFF NOW | Ends May 13 (UTC+0)
openai
openai/gpt-4o-audio-preview

openai/gpt-4o-audio-preview

128,000 context · $2.50/M input tokens · $10.00/M output tokens

The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs are currently not supported. Audio tokens are priced at $40 per million input and $80 per million output audio tokens.

Цены

Оплата по факту использования

Никаких авансовых платежей — платите только за то, чем пользуетесь

Ввод$2.50 / M Tokens
Вывод$10.00 / M Tokens

Использование API

Используйте следующие примеры кода для интеграции с нашим API:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="openai/gpt-4o-audio-preview",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

Описание модели

Openai gpt-4o-audio-preview

The gpt-4o-audio-preview model adds support for audio inputs as prompts

The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs are currently not supported. Audio tokens are priced at $40 per million input and $80 per million output audio tokens.


Why It Looks Great

  • Large Language Model architecture for efficient processing
  • 128000 context window for long document handling
  • Competitive pricing at $2.5/$10.0 per million tokens

Key Features

  • Context Window: 128000 tokens
  • Max Output: 16384 tokens
  • Vision: Supported
  • Function Calling: Supported

Specifications

SpecificationValue
ProviderOpenai
Model TypeLarge Language Model (LLM)
ArchitectureN/A
Context Window128000 tokens
Max Output16384 tokens
InputText
OutputText
VisionSupported
Function CallingSupported

Pricing

Token TypeCost per Million Tokens
Input$2.5
Output$10.0

How to Use

  1. Write your prompt — describe the task, provide context, and specify desired output format.
  2. Submit — the model processes your request and returns the response.

API Integration

Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: openai/gpt-4o-audio-preview


API Usage

Python SDK

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://llm.wavespeed.ai/v1"
)

response = client.chat.completions.create(
    model="openai/gpt-4o-audio-preview",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

cURL

curl https://llm.wavespeed.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "openai/gpt-4o-audio-preview",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Notes

  • Model: openai/gpt-4o-audio-preview
  • Provider: Openai

Информация

Провайдерopenai
Типllm

Поддерживаемые возможности

Ввод
ТекстАудио
Вывод
Текст
Контекст128,000
Макс. вывод16,384
Vision-
Function Calling✓ Поддерживается

Руководство по доступу к API

Base URLhttps://llm.wavespeed.ai/v1
API Endpointchat/completions
ID моделиopenai/gpt-4o-audio-preview

GPT 4o Audio Preview API

openai/gpt-4o-audio-preview

The gpt-4o-audio-preview model adds support for audio inputs as prompts. This enhancement allows the model to detect nuances within audio recordings and add depth to generated user experiences. Audio outputs are currently not supported. Audio tokens are priced at $40 per million input and $80 per million output audio tokens.

Ввод

$2.5 /M

Вывод

$10 /M

Контекст

128K

Макс. вывод

16K

Использование инструментов

Поддерживается

Попробуйте GPT 4o Audio Preview на WaveSpeedAI

Доступ к GPT 4o Audio Preview через наш единый API — совместимость с OpenAI, без холодных стартов, прозрачные цены.

Часто задаваемые вопросы о GPT 4o Audio Preview

Сколько стоит GPT 4o Audio Preview через API?+

Цены на WaveSpeedAI: $2.50 за миллион входных токенов и $10.00 за миллион выходных токенов. Prompt caching и batch processing тарифицируются отдельно и снижают эффективную стоимость длинных повторяющихся нагрузок.

Каково контекстное окно GPT 4o Audio Preview?+

GPT 4o Audio Preview поддерживает до 128K токенов контекста и до 16K токенов вывода на запрос.

Совместим ли GPT 4o Audio Preview с OpenAI?+

Да. WaveSpeedAI предоставляет GPT 4o Audio Preview через OpenAI-совместимый endpoint по адресу https://llm.wavespeed.ai/v1. Направьте официальный OpenAI SDK на этот base URL с ключом API WaveSpeedAI — других изменений в коде не требуется.

Как начать работу с GPT 4o Audio Preview?+

Войдите в WaveSpeedAI, создайте API-ключ в Access Keys и отправьте запрос на https://llm.wavespeed.ai/v1/chat/completions с указанным выше model id. Новые аккаунты получают бесплатные кредиты для оценки GPT 4o Audio Preview.

Связанные LLM API