nvidia/llama-3.3-nemotron-super-49b-v1.5
Yayın tarihi: 2025-10-10
131,072 context · $0.10/M input tokens · $0.40/M output tokens
Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
Kullandıkça öde
Ön ödeme yok, yalnızca kullandığınız kadar ödeyin
API'mizle entegre etmek için aşağıdaki kod örneklerini kullanın:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="nvidia/llama-3.3-nemotron-super-49b-v1.5",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)nvidia llama-3.3-nemotron-super-49b-v1.5
| Specification | Value |
|---|---|
| Provider | Nvidia |
| Model Type | Large Language Model (LLM) |
| Architecture | N/A |
| Context Window | 131072 tokens |
| Max Output | 4096 tokens |
| Input | Text |
| Output | Text |
| Vision | Supported |
| Function Calling | Supported |
| Token Type | Cost per Million Tokens |
|---|---|
| Input | $0.1 |
| Output | $0.4 |
Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: nvidia/llama-3.3-nemotron-super-49b-v1.5
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="nvidia/llama-3.3-nemotron-super-49b-v1.5",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "nvidia/llama-3.3-nemotron-super-49b-v1.5",
"messages": [{"role": "user", "content": "Hello!"}]
}'
nvidia/llama-3.3-nemotron-super-49b-v1.5
Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
Giriş
$0.1 /M
Çıkış
$0.4 /M
Bağlam
131K
Maks. Çıkış
4K
Araç Kullanımı
Destekleniyor
Birleşik API'miz aracılığıyla Llama 3.3 Nemotron Super 49b V1.5'e erişin — OpenAI uyumlu, soğuk başlatma yok, şeffaf fiyatlandırma.
WaveSpeedAI fiyatlandırması: milyon giriş tokenı başına $0.10 ve milyon çıkış tokenı başına $0.40. Prompt caching ve toplu işleme ayrı faturalanır ve uzun, tekrar eden yüklerde etkin maliyeti düşürür.
Llama 3.3 Nemotron Super 49b V1.5 istek başına 131K bağlam tokenını ve 4K çıkış tokenını destekler.
Evet. WaveSpeedAI, Llama 3.3 Nemotron Super 49b V1.5 modelini https://llm.wavespeed.ai/v1 adresindeki OpenAI uyumlu endpoint üzerinden sunar. Resmi OpenAI SDK'sını WaveSpeedAI API anahtarınızla bu base URL'ye yöneltin — başka kod değişikliği gerekmez.
WaveSpeedAI'a giriş yapın, Access Keys'te bir API anahtarı oluşturun, ardından yukarıda gösterilen model id ile https://llm.wavespeed.ai/v1/chat/completions adresine bir istek gönderin. Yeni hesaplar Llama 3.3 Nemotron Super 49b V1.5'i değerlendirmek için ücretsiz krediler alır.