liquid/lfm-2-24b-a2b
32,768 context · $0.03/M input tokens · $0.12/M output tokens
LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment. Built as a 24B parameter Mixture-of-Experts model with only 2B active parameters per token, it delivers high-quality generation while maintaining low inference costs. The model fits within 32 GB of RAM, making it practical to run on consumer laptops and desktops without sacrificing capability.
従量課金
初期費用なし、使った分だけお支払い
以下のコード例を使用して API と連携してください:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="liquid/lfm-2-24b-a2b",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment
LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment. Built as a 24B parameter Mixture-of-Experts model with only 2B active parameters per token, it delivers high-quality generation while maintaining low inference costs. The model fits within 32 GB of RAM, making it practical to run on consumer laptops and desktops without sacrificing capability.
| Specification | Value |
|---|---|
| Provider | Liquid |
| Model Type | Large Language Model (LLM) |
| Architecture | N/A |
| Context Window | 32768 tokens |
| Max Output | tokens |
| Input | Text |
| Output | Text |
| Vision | Supported |
| Function Calling | Supported |
| Token Type | Cost per Million Tokens |
|---|---|
| Input | $0.0 |
| Output | $0.1 |
Base URL: https://llm.wavespeed.ai/v1 API Endpoint: chat/completions Model ID: liquid/lfm-2-24b-a2b
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://llm.wavespeed.ai/v1"
)
response = client.chat.completions.create(
model="liquid/lfm-2-24b-a2b",
messages=[
{"role": "user", "content": "Hello!"}
]
)
print(response.choices[0].message.content)
curl https://llm.wavespeed.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "liquid/lfm-2-24b-a2b",
"messages": [{"role": "user", "content": "Hello!"}]
}'
liquid/lfm-2-24b-a2b
LFM2-24B-A2B is the largest model in the LFM2 family of hybrid architectures designed for efficient on-device deployment. Built as a 24B parameter Mixture-of-Experts model with only 2B active parameters per token, it delivers high-quality generation while maintaining low inference costs. The model fits within 32 GB of RAM, making it practical to run on consumer laptops and desktops without sacrificing capability.
入力
$0.03 /M
出力
$0.12 /M
コンテキスト
33K
統合APIを通じてLfm 2 24b A2bにアクセス — OpenAI互換、コールドスタートなし、透明な料金。
WaveSpeedAI の料金: 入力 100 万トークンあたり $0.03、出力 100 万トークンあたり $0.12。プロンプトキャッシュとバッチ処理は別途料金で、長く反復的なワークロードでは実効コストを下げられます。
Lfm 2 24b A2b はリクエストあたり最大 33K のコンテキストトークンと最大 — の出力トークンをサポートします。
はい。WaveSpeedAI は OpenAI 互換エンドポイント https://llm.wavespeed.ai/v1 で Lfm 2 24b A2b を提供します。公式 OpenAI SDK のベース URL をこちらに変更し WaveSpeedAI の API キーを設定するだけで利用可能です。
WaveSpeedAI にサインインし、Access Keys で API キーを作成して、上に表示されているモデル ID を指定して https://llm.wavespeed.ai/v1/chat/completions にリクエストを送信してください。新規アカウントには Lfm 2 24b A2b を試用できる無料クレジットが付与されます。