LTX 2 19b ControlがWaveSpeedAIに登場
LTX-2 19B ControlNetは、ビデオ入力からポーズ、深度、またはCannyエッジガイダンスを使用して、同期されたオーディオ-ビデオ(最大20秒)を生成します。オーディオ保存とジーンをサポートしています
WaveSpeedAI LTX 2 19b Ic LoRA Trainer、WaveSpeedAIに登場
LTX-2 IC-LoRA Trainerを使用すると、ビデオ・ツー・ビデオ変換用のカスタムIn-Context LoRAモデルを訓練できます。深度/ポーズアダプター、ビデオ復元、スタイル変更などに対応しています
LTX 2 19b Video LoRA Trainer、WaveSpeedAIに登場
LTX-2 Audio-Video LoRA Trainerは、同期したオーディオ-ビデオ生成機能をサポートするカスタムLoRAモデルのトレーニングが可能です。アクション、モーション、ビデオエフェクトモデルをトレーニングできます
LTX 2 19b Video UpscalerがWaveSpeedAIに登場
LTX-2 19B Video Upscalerは低解像度のビデオをシームレスなモーションダイナミクスとフレーム一貫性を備えた鮮明な4K映像に変換します。すぐに使用できるREST推論
Molmo2 Image CaptionerがWaveSpeedAIに登場
Molmo2-4B Image Captioner: 画像に対して詳細で正確なキャプションを生成します。カスタマイズ可能な詳細レベル(低、中、高)に対応。オープンソースのビジョン言語モデル
Molmo2 Image Content Moderatorが WaveSpeedAIに登場
Molmo2-4B Image Content Moderator: 画像コンテンツの安全性、適切性、ポリシー準拠性を分析します。暴力、ヌード、グロテスク、その他の有害な内容を検出します
Molmo2 Image QAがWaveSpeedAIに登場
Molmo2-4B Image QA: 複数画像比較に対応した画像に関する質問への回答(1~2画像)。オープンソースのビジョン言語モデル。すぐに使えるREST API
WaveSpeedAI Molmo2 Prompt OptimizerがWaveSpeedAIに登場
Molmo2-4B Prompt Optimizer:画像・動画生成用のプロンプトを、インテリジェントな再構成、スタイルガイダンス、コンテキスト対応の改善で強化します。オープン
WaveSpeedAI Molmo2 Text Content ModeratorがWaveSpeedAIに登場
Molmo2-4B Text Content Moderator: テキストコンテンツの安全性、適切性、ポリシー準拠を分析します。ヘイトスピーチ、暴力、性的コンテンツなどを検出
WaveSpeedAI Molmo2 Video Captionerが WaveSpeedAIに登場
Molmo2-4B Video Captioner: ビデオの詳細で正確なキャプションを生成でき、カスタマイズ可能な詳細レベル(低、中、高)に対応しています。オープンソースのビジョン言語モデル
Molmo2 Video Content ModeratorがWaveSpeedAIに登場
Molmo2-4B Video Content Moderatorは、ビデオコンテンツの安全性、適切性、ポリシー準拠性を分析します。暴力、ヌード、グロ、その他の有害なコンテンツを検出します
Molmo2 Video QAがWaveSpeedAIに登場
Molmo2-4B Video QA:ビデオコンテンツに関する質問に時間的理解を持って答えます。オープンソースのビジョンランゲージモデル。すぐに使えるREST API、コールドスタートなし