inflection/inflection-3-productivity
8,000 context · $2.50/M input tokens · $10.00/M output tokens
Inflection 3 Productivity is optimized for following instructions. It is better for tasks requiring JSON output or precise adherence to provided guidelines. It has access to recent news. For emotional...
จ่ายตามการใช้งาน
ไม่มีค่าใช้จ่ายล่วงหน้า จ่ายเฉพาะสิ่งที่คุณใช้
ใช้ตัวอย่างโค้ดต่อไปนี้เพื่อผสานรวมกับ API ของเรา:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="inflection/inflection-3-productivity",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)inflection inflection-3-productivity
| Specification | Value |
|---|---|
| Provider | Inflection |
| Model Type | Large Language Model (LLM) |
| Architecture | N/A |
| Context Window | 8000 tokens |
| Max Output | 1024 tokens |
| Input | Text |
| Output | Text |
| Vision | Supported |
| Function Calling | Supported |
| Token Type | Cost per Million Tokens |
|---|---|
| Input | $2.7 |
| Output | $11.0 |
Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: inflection/inflection-3-productivity
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="inflection/inflection-3-productivity",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "inflection/inflection-3-productivity",
"messages": [{"role": "user", "content": "Hello!"}]
}'
inflection/inflection-3-productivity
Inflection 3 Productivity is optimized for following instructions. It is better for tasks requiring JSON output or precise adherence to provided guidelines. It has access to recent news. For emotional...
อินพุต
$2.5 /M
เอาต์พุต
$10 /M
คอนเท็กซ์
8K
เอาต์พุตสูงสุด
1K
เข้าถึง Inflection 3 Productivity ผ่าน API แบบรวมของเรา — เข้ากันได้กับ OpenAI ไม่มี cold start ราคาโปร่งใส
ราคาบน WaveSpeedAI: $2.50 ต่อล้านโทเคนอินพุต และ $10.00 ต่อล้านโทเคนเอาต์พุต Prompt caching และ batch processing คิดค่าบริการแยกและช่วยลดต้นทุนที่แท้จริงสำหรับภาระงานที่ยาวและทำซ้ำ
Inflection 3 Productivity รองรับสูงสุด 8K โทเคนคอนเท็กซ์ และสูงสุด 1K โทเคนเอาต์พุตต่อคำขอ
ใช่ WaveSpeedAI ให้บริการ Inflection 3 Productivity ผ่าน endpoint ที่เข้ากันได้กับ OpenAI ที่ https://llm.wavespeed.ai/v1 ชี้ OpenAI SDK ทางการมาที่ base URL นี้ด้วย API key ของ WaveSpeedAI — ไม่ต้องแก้ไขโค้ดอื่น
ลงชื่อเข้าใช้ WaveSpeedAI สร้าง API key ใน Access Keys จากนั้นส่งคำขอไปยัง https://llm.wavespeed.ai/v1/chat/completions พร้อม model id ที่แสดงด้านบน บัญชีใหม่จะได้รับเครดิตฟรีสำหรับทดลองใช้ Inflection 3 Productivity