Phota Text-to-ImageがWaveSpeedAIに登場
photatext-to-image

Phota Text-to-ImageがWaveSpeedAIに登場

Phota Text-to-Imageは、テキストプロンプトから高品質なパーソナライズ写真を生成します。4K解像度、複数のアスペクト比、バッチ生成、組み込みプロンプトエンハンサーを搭載。REST API対応、1枚あたり$0.09、コールドスタートなし。

1 min read
LTX-2.3の料金:APIコスト、ローカル推論、クラウドのトレードオフ(2026年)

LTX-2.3の料金:APIコスト、ローカル推論、クラウドのトレードオフ(2026年)

LTX-2.3 APIの料金を解説:fastとproのバリアント、720pと1080pのティア、1秒あたりのコスト内訳、そしてローカル推論が実際にコスト削減になる場合について。

2 min read
PixVerse V6登場:カメラコントロール、ネイティブオーディオ、マルチショット動画生成
pixversepixverse-v6

PixVerse V6登場:カメラコントロール、ネイティブオーディオ、マルチショット動画生成

PixVerse V6が20以上のシネマティックレンズコントロール、ネイティブオーディオ対応マルチショット動画、15秒1080p安定出力、開発者向けCLIワークフローを引っ提げてリリース。V6の新機能と、今すぐ使えるおすすめAI動画モデルをご紹介します。

1 min read
Claude Mythos(Opus 5)がリーク:現時点で判明していること
ai-modelsclaude

Claude Mythos(Opus 5)がリーク:現時点で判明していること

AnthropicのClaude Mythosモデルがデータ漏洩によって明らかになりました。リークされたドキュメントには、コーディング、推論、サイバーセキュリティにおける性能についての情報が含まれています。AIの未来にとって何を意味するのかをまとめます。

1 min read
Suno vs MiniMax Music vs Google Lyria 3:AI音楽生成ツール徹底比較
ai-musicsuno

Suno vs MiniMax Music vs Google Lyria 3:AI音楽生成ツール徹底比較

Suno v5.5、MiniMax Music 2.5、Google Lyria 3 Proを音質、ボーカル、クリエイティブコントロール、価格、APIアクセスの観点から詳しく比較します。

4 min read
daVinci-MagiHuman:あらゆるデジタルヒューマン生成モデルを圧倒したオープンソースモデル
magihumandavinci

daVinci-MagiHuman:あらゆるデジタルヒューマン生成モデルを圧倒したオープンソースモデル

daVinci-MagiHumanは150億パラメータのオープンソースモデルで、単一のH100で2秒以内にリップシンク付きトーキングヘッド動画を生成します。Ovi 1.1(勝率80%)およびLTX 2.3(勝率60.9%)を凌駕。Apache 2.0ライセンス、多言語対応、超高速処理を実現。

2 min read
daVinci MagiHuman Image-to-VideoがWaveSpeedAIに登場
davinci-magihumansand-ai

daVinci MagiHuman Image-to-VideoがWaveSpeedAIに登場

daVinci MagiHuman Image-to-Videoは150億パラメータのオープンソースモデルで、参照画像を映画品質の動画にアニメーション化し、オプションで音声同期にも対応しています。WAN 2.5と同等の性能を発揮。最大1080p、5〜10秒の動画を生成可能。REST API対応、$0.04/秒、コールドスタートなし。

1 min read
daVinci MagiHuman Text-to-VideoがWaveSpeedAIに登場
davinci-magihumansand-ai

daVinci MagiHuman Text-to-VideoがWaveSpeedAIに登場

daVinci MagiHuman Text-to-Videoは、テキストプロンプトからシネマティックな人物中心の動画を生成し、オプションの音声同期にも対応。150億パラメータのオープンソースモデルで、最大1080p・5〜10秒の動画を出力。REST API対応、$0.04/秒、コールドスタートなし。

1 min read
LTX-2.3 ComfyUI セットアップ:2ステージパイプライン、VRAM修正&Gemmaエンコーダー

LTX-2.3 ComfyUI セットアップ:2ステージパイプライン、VRAM修正&Gemmaエンコーダー

ComfyUIでLTX-2.3をセットアップする方法:チェックポイントの配置、Gemma 3 12Bエンコーダーの設定、2ステージ生成パイプライン、コンシューマーGPU向けの低VRAMストラテジー。

1 min read
LTX-2.3 LoRAトレーニングガイド:スタイル、モーション、IC-LoRAコントロール(2026年)

LTX-2.3 LoRAトレーニングガイド:スタイル、モーション、IC-LoRAコントロール(2026年)

公式ltx-trainerを使用してLTX-2.3でカスタムLoRAをトレーニングする方法を解説。スタイルLoRA、IC-LoRA構造制御、ランク設定、データセット準備、よくあるトレーニングエラーを網羅。

1 min read
Google Lyria 3 ClipがWaveSpeedAIに登場
lyriagoogle

Google Lyria 3 ClipがWaveSpeedAIに登場

Google Lyria 3 Clipは、テキストプロンプトから歌詞・説明・音声を含む完全な楽曲を生成します。画像ガイド生成、ネガティブプロンプト、再現性のある結果に対応。REST API、1クリップあたり$0.04、コールドスタートなし。

1 min read
Google Lyria 3 ProがWaveSpeedAIに登場
lyriagoogle

Google Lyria 3 ProがWaveSpeedAIに登場

Google Lyria 3 Proは、Clipティアよりも豊かな楽器表現、繊細なニュアンス、高い音質を実現するプレミアム品質のAI音楽を生成します。テキストおよび画像ガイドによる音楽制作に対応。REST API、1クリップあたり$0.08、コールドスタートなし。

1 min read