#alibaba
215 articles - Page 17
Kling O1 視頻模型即將到來——視覺創作的全面飛躍
專為創作者、電影製作人和設計師打造,Kling O1 在智能、一致性和可編輯性方面實現了重大飛躍,覆蓋整個視頻工作流程。這款下一代多模態視頻引擎為所有視頻工作者帶來更流暢、更直觀、高度可控的工作體驗。
Kling Omni Video O1 Video Edit——自然語言視頻編輯登陸WaveSpeedAI
WaveSpeedAI 很榮幸宣佈推出 Kling Video Edit,由快手突破性的多模態視頻模型 Kling Omni Video O1 提供支持。使用 Video Edit,您可以通過簡單的自然語言指令修改視頻。
Nano Banana Pro 與 Wan 2.5 Image Edit:編輯精度遇上完整生成能力
探索 Google 的 Nano Banana Pro(Gemini 3.0 Pro Image)和 Wan 2.5 Image Edit 如何結合生成和精確編輯,以簡化創意工作流程。
Seedream V4 快速入門
Seedream 4.0 支援三種輸入類型:文字、單一影像和多重影像。
WaveSpeedAI 上的 Qwen-Image-Edit:在幾秒內清理照片和完善視覺效果
您是否厭倦了與複雜的圖像編輯軟件搏鬥,只為進行簡單修改就花費數小時和精力?您是否希望有一個能夠解決圖像編輯挑戰的圖像編輯工具?我們很高興地宣布,Qwen-Image-Edit 現已在 WaveSpeed AI 上推出。基於旗艦級 20B 參數 Qwen-Image 模型,此工具將尖端的語義理解與像素完美的外觀控制相結合,使用戶能夠以前所未有的精度創建、修改和細化圖像。
WaveSpeedAI 上的 Qwen-Image:銳利文字渲染與精確編輯
WaveSpeedAI 上的 Qwen-Image:銳利文字渲染與精確編輯
速度還是規模?Nano Banana Pro vs Qwen Image for 創意專業人士
Google Nano Banana Pro (Gemini 3.0 Pro Image) 和 Seedream 4 的簡明比較,重點強調創意專業人士的速度、逼真度和工作流程優勢。
停止手動遮罩圖像:使用 Qwen-Image Layered 建立乾淨的 RGBA 圖層
Qwen-Image Layered 是一個提示引導的圖像分解模型,能將單一圖像分割成多個乾淨的 RGBA 圖層,每個圖層都具有適當的透明度、柔和邊緣和正確的遮擋順序——可立即用於實際生產工作流程。
停止訓練,開始創作:在 WaveSpeedAI 上使用 LoRA
什麼是 LoRA?可以將其視為一種輕量級微調方法:與其重新訓練整個模型,不如簡單地向現有模型添加一個小型「快速適應」層來鎖定您自己的風格 — 更快更便宜。
AI 影片的下一步:認識 Wan 2.5
在過去幾年,AI 影片生成經歷了幾波創新浪潮——首先是更流暢的動作,然後是更高的視覺清晰度。
利用阿里巴巴 WAN 2.6 解鎖下一代影片創作 - 现已登陆WaveSpeedAI
阿里巴巴的 WAN 2.6 模型現已在 WaveSpeedAI 上線,為創作者提供更強大的故事講述能力、更智能的參考驅動生成和更長、更富表現力的輸出。我們強調了定義 WAN 2.6 的三個核心功能。
WAN 2.2 Spicy:AI 變得大膽的地方
最近,由埃隆·馬斯克開發的新模型 Grok 在 X 上引起了熱烈討論。但還有另一個同樣強大的競爭者——WAN 2.2 Spicy。由阿里巴巴團隊開發,它提供相同的創意靈活性、支持多種用途,甚至提供 API 調用。受益於其寬泛的邊界,你可以在這裡釋放你的想像力——現在已在 WaveSpeedAI 上推出!