Berhenti Melatih, Mulai Membuat: Gunakan LoRA di WaveSpeedAI

Berhenti Melatih, Mulai Membuat: Gunakan LoRA di WaveSpeedAI

picture1

Pengantar

Apa itu LoRA? Pikirkan itu sebagai metode fine-tuning yang ringan: alih-alih melatih ulang seluruh model, Anda hanya dapat menambahkan lapisan “adaptasi cepat” kecil ke model yang sudah ada untuk mengunci gaya Anda sendiri — lebih cepat dan lebih murah.

Dalam tutorial ini, kami akan memulai dari nol, menunjukkan kepada Anda cara menemukan model LoRA yang Anda sukai secara online, dan menggunakannya di WaveSpeedAI. Bahkan jika Anda baru mengenal ini, Anda akan siap dan berjalan dalam waktu singkat.

Pemilihan Model

Saat membuat gambar dan video dengan AIGC, kami biasanya hanya dapat mengontrol model melalui prompt, sehingga sulit untuk mengelola detail halus. Jika Anda bergantung pada model untuk “memahami sendiri” hal-hal seperti pose tangan, lipatan kain, atau elemen pakaian, hasilnya sering kali tidak memuaskan.

Pada titik ini, Anda dapat menjelajahi platform terbuka untuk menemukan model LoRA yang dibagikan oleh kreator. Dari gaya seni keseluruhan dan tekstur kamera hingga pose spesifik, pakaian, dan aksesori kecil. LoRA yang ditargetkan dapat meningkatkan detail dan memberi Anda kontrol lebih — tanpa melatih ulang model.

Namun, ingatlah aturan penting saat memilih LoRA: itu harus cocok persis dengan model dasar AIGC yang Anda gunakan — nama model yang sama, versi yang sama, dan ukuran parameter yang sama.

Misalnya, LoRA yang dirancang untuk Wan 2.2 tidak dapat digunakan di Wan 2.1 atau model apa pun. Demikian juga, LoRA Wan 2.2 14B tidak dapat digunakan di Wan 2.2 5B.

Jika tidak cocok, gaya mungkin berubah paling buruk. Paling buruk, Anda bisa mengalami kesalahan. Selalu periksa ulang informasi di halaman model sebelum menggunakannya!

picture2 Periksa Ulang Versi dan Parameter

Catatan: Di WaveSpeedAI, LoRA berjalan dari file .safetensors tunggal. Cukup impor dan selesai. Hindari .PickleTensor, .zip, .GGUF, dll., karena WaveSpeedAI tidak mendukung format tersebut.

Perhatikan ukuran file. LoRA biasanya di bawah 2 GB (sering hanya beberapa ratus MB). Jika unggahan Anda jauh lebih besar, Anda mungkin memilih file yang salah (seperti model dasar lengkap atau bundel terkompresi), dan impor akan gagal. Periksa ulang nama file dan ekstensi sebelum mencoba lagi!

Berikut dua platform yang umum digunakan: Civitai dan Hugging Face. picture3 Platform Civitai picture4 Platform Hugging Face

LoRA di Hugging Face

Hugging Face adalah salah satu hub model open-source terbesar di dunia, menawarkan katalog model dan dataset yang luas. Anda dapat mencari LoRA dan menemukan bobot resmi dan panduan inferensi untuk model dasar populer.

Di bagian ini, kami akan fokus pada LoRA — cara menemukannya, memilihnya di Hugging Face, dan menggunakannya di WaveSpeedAI.

Mulai dengan mengetik LoRA di bilah pencarian di bagian atas situs untuk melihat repositori terkait. picture5 Cari LoRA

Selanjutnya, klik See all model results for “LoRA” untuk melihat halaman hasil LoRA lengkap.

Untuk pencarian Anda sendiri, sertakan kualifikasi seperti nama model dasar, versi, dan ukuran parameter (misalnya, 7B/14B). Ini mempersempit pencarian dan menampilkan hasil yang lebih relevan. picture6 Halaman Hasil Model

Di Hugging Face, model LoRA biasanya menentukan model dasar yang kompatibel dan ukuran parameter dalam judul atau deskripsi. Misalnya, prithivMLmods/Qwen-Image-Anime-LoRA adalah LoRA yang dibuat untuk Qwen-Image dan digunakan untuk menghasilkan gambar gaya anime Jepang. picture7 prithivMLmods/Qwen-Image-Anime-LoRA

Seperti yang ditunjukkan di halaman, Qwen-Image-Anime-LoRA dipublikasikan oleh prithivMLmods dan dirancang khusus untuk model dasar Qwen-Image.

Selanjutnya, beralih ke WaveSpeedAI dan buka model wavespeed-ai/qwen-image/text-to-image-lora. Kami akan menggunakannya untuk memuat dan menjalankan LoRA ini. picture8 wavespeed-ai/qwen-image/text-to-image-lora

Di halaman Playground model, Anda akan menemukan bidang input prompt untuk memasukkan prompt Anda, bersama dengan bagian loras untuk menambahkan model LoRA.

Saat menulis prompt Anda, selain dengan jelas menggambarkan adegan, gaya, dan detail yang Anda inginkan, ingatlah untuk menyertakan kata pemicu LoRA! Anda biasanya dapat menemukan informasi ini di halaman Hugging Face di Model Card.

Misalnya, di halaman model prithivMLmods/Qwen-Image-Anime-LoRA, gulir ke bawah Model Card untuk menemukan detail tambahan, seperti cara menggunakan model dan kata pemicu yang diperlukan.

picture9 Kata pemicu dalam Model card

Setelahnya, kami akan memodifikasi parameter yang terkait dengan model LoRA. picture10

Yang pertama adalah path. Ini adalah rute yang digunakan WaveSpeedAI untuk memanggil model LoRA yang Anda inginkan.

Klik + Add Item untuk menampilkan bidang input. Pipeline qwen-image/text-to-image-lora memungkinkan penambahan hingga tiga model LoRA.

Selain itu, jika model LoRA dihosting di Hugging Face, WaveSpeedAI menyediakan dua cara untuk mereferensikannya: satu adalah <owner>/<model-name>. Sama seperti contoh ini, nama pengarang ditambah nama model seperti yang ditampilkan di halaman model.

picture11 Salin ini dan tempel di path!

Metode lain adalah membuka Files and versions model, klik kanan ikon unduh, pilih Copy link address, dan tempel URL yang disalin ke path.

picture12 Tombol Unduh di Files and versions

Terkadang Anda mungkin melihat opsi high-noise LoRA dan low-noise LoRA di halaman model. Ini umumnya tidak umum digunakan, tetapi Hugging Face biasanya memberikan informasi terperinci tentangnya.

Cukup isi model LoRA dengan nama yang sesuai di bidang yang sesuai seperti yang Anda lakukan dengan LoRA normal, dan itu akan berfungsi dengan baik.

picture13

Dalam pengaturan parameter loras, ada penggeser yang disebut scale, yang dapat Anda pikirkan sebagai tombol putar “pengaruh/konsentrasi”. Ini menyesuaikan seberapa kuat LoRA mempengaruhi model dasar.

Dalam kebanyakan kasus, nilai default 1 akan memberikan Anda hasil yang baik. Jika hasilnya berbeda dari harapan Anda, Anda dapat sedikit meningkatkan scale. picture14

Seed digunakan untuk mengontrol keacakan. Pikirkan itu sebagai “indeks awal”.

Ketika Anda menggunakan benih yang sama dan kemudian menyesuaikan prompt, gaya dan komposisi keseluruhan akan tetap sebagian besar konsisten. Hanya bagian yang Anda ubah dalam prompt yang akan berbeda, membuat perbandingan dan reproduksi lebih mudah. picture15

Hebat! Anda telah menyelesaikan semua pekerjaan persiapan! Mari kita mulai menggunakan model LoRA! Di bidang prompt, pertama-tama masukkan kata pemicu Qwen Anime untuk model LoRA. Kemudian berikan deskripsi hasil yang ingin Anda hasilkan. picture16 Masukkan kata pemicu

Kemudian, di bidang loras, di path, masukkan prithivMLmods/Qwen-Image-Anime-LoRA atau URL-nya, dan pertahankan scale di 1.

picture17 Atur path

Kemudian atur seed sehingga Anda dapat dengan mudah mereproduksi hasil apa pun yang Anda inginkan nanti. picture18 Nomor seed acak

Terakhir, klik tombol Run untuk menghasilkan gambar bergaya anime!

picture19 Hasilnya

Karena kami telah menetapkan benih lebih awal, jika Anda puas dengan detail latar belakang dan gaya (seperti pakaian) tetapi ingin mengubah jenis kelamin karakter, cukup edit prompt dan klik Run lagi.

picture20 Tahu, aku hanya ingin membandingkan hasilnya

Bagaimana penampilannya? Dapatkah Anda melihat perubahannya? Coba sendiri! WaveSpeedAI memiliki banyak model dasar yang dapat memanggil LoRA. Jangan ragu untuk bereksperimen, kemudian bagikan karya Anda di Inspiration dengan kami dan komunitas kreator yang lebih luas!

picture21 Halaman Inspiration

LoRA di Civitai

Civitai adalah komunitas yang berfokus pada kreator yang berbagi model, menampilkan berbagai macam sumber daya LoRA. Anda dapat mencari berdasarkan gaya atau tema, melihat hasil contoh dan parameter, dan dengan cepat menemukan model yang sesuai.

picture22 Halaman Civitai

Metode pencarian di Civitai mirip dengan Hugging Face: masukkan detail seperti versi model dan ukuran parameter ke kotak pencarian. Tambahkan kata kunci “LoRA” untuk dengan cepat memfilter sejumlah besar model yang relevan (misalnya: “Wan 2.2 14B LoRA”).

Penggunaan dasar mirip dengan memanggil model di Hugging Face, jadi kami hanya akan menjelaskan perbedaannya secara detail.

Menggunakan desain game sebagai contoh, jika Anda ingin membuat karakter dengan gaya mirip Baldur’s Gate 3, Anda dapat langsung mencoba LoRA [WAN2.1] Baldur’s Gate 3 [STYLE].

picture23 Halaman [WAN2.1]Baldur’s Gate 3 [STYLE]

Namun, harap dicatat bahwa untuk model di platform Civitai, WaveSpeedAI tidak akan mendukung pemanggilan model LoRA menggunakan format <owner>/<model-name>.

Mereka hanya dapat dipanggil melalui URL. Oleh karena itu, pastikan untuk melihat informasi model sebelum memanggilnya.

picture24 Detail Model LoRA

Di bagian Details model, Anda dapat melihat berbagai informasi tentang model.

Item utama yang perlu diperhatikan adalah Base Model dan Trigger Words. Di sini, kami melihat bahwa model dasar LoRA ini adalah Wan Video 14B t2v, dan kata pemicu adalah 3d render in bg artstyle.

Buka WaveSpeedAI dan cari wavespeed-ai/wan-2.1/t2v-720p-lora. Tentu saja, Anda juga dapat memilih model lain yang mendukung pemanggilan LoRA (Seperti wavespeed-ai/wan-2.1/i2v-720p-lora).

picture25 Halaman wavespeed-ai/wan-2.1/t2v-720p-lora

Sama seperti di platform Hugging Face, Anda hanya perlu memodifikasi prompt dan menambahkan kata pemicu LoRA di Prompt, kemudian sertakan URL untuk memanggil model LoRA di path.

Gunakan scale untuk mengontrol seberapa banyak LoRA mempengaruhi model dasar (default 1 biasanya cukup. Jika terasa terlalu lemah atau terlalu kuat, lakukan penyesuaian kecil), dan terakhir gunakan seed untuk reproduksi dan perbandingan.

Beberapa model memiliki parameter spesifik, tetapi di WaveSpeedAI, kami telah menetapkan nilai default untuk Anda. Menggunakannya secara langsung akan memberikan Anda hasil yang baik! picture26

Jika Anda ingin menyempurnakan detail lebih lanjut, Anda dapat mencoba menyesuaikannya. Namun, harap dicatat bahwa untuk parameter seperti num_inference_steps, semakin tinggi nilainya, semakin terlihat peningkatan waktu pembuatan video.

Di sini, Anda akan menemukan bagian unduhan untuk model LoRA. Pastikan untuk memilih tipe model SafeTensor untuk fungsi yang tepat.

picture27 Unduh LoRA

Klik kanan Download, kemudian salin alamat tautan — ini adalah URL yang akan Anda gunakan untuk memanggil model LoRA.

Demikian juga, di Playground wavespeed-ai/wan-2.1/t2v-720p-lora, temukan bagian loras, klik + Add Item, dan tempel URL yang baru saja Anda salin ke path.

picture28 Tempel di path

Jika Anda tidak yakin cara menggunakan LoRA dengan lebih efektif, Anda dapat melihat referensi di Civitai. Pembuat model sering memberikan contoh yang dapat Anda klik dan lihat.

picture29 Halaman Contoh dengan Sumber Daya dan Prompt

Di sini, kami akan menyalin prompt dari contoh pengarang untuk mencoba membuat karakter game kami sendiri.

Hasil yang kami buat!

Bukankah itu menakjubkan? Hasil yang dihasilkan mungkin sedikit berbeda dari milik pengarang, tetapi Anda dapat menyesuaikan prompt menuju tujuan Anda (jelaskan gaya, bahan, kamera, dan suasana hati, dan tambahkan atau hapus modifier sesuai kebutuhan) untuk secara bertahap mencapai efek yang Anda inginkan.

Bagaimanapun, karya yang paling bermakna bukanlah salinan orang lain tetapi yang selalu menampilkan tekstur dan gaya unik Anda sendiri — ini adalah tempat pemahaman yang tidak terucapkan antara LoRA dan kreasi Anda terletak.

Kesimpulan

Sampai titik ini, Anda telah belajar cara menggunakan model LoRA pilihan Anda di WaveSpeedAI. Namun, ingatlah bahwa LoRA tidak akan membuat pilihan estetika untuk Anda. Ini hanya menstabilkan detail setelah Anda menetapkan arah. Yang benar-benar membuat karya unik adalah selalu rasa dan imajinasi Anda.

Jadi berani — coba, pelajari, dan terus tingkatkan. Ketika Anda berbagi hasil pertama Anda di Inspiration dan tumbuh bersama komunitas, Anda akan melihat bahwa efisiensi hanyalah awal. Memiliki gaya Anda yang diakui adalah tujuan sebenarnya.

Semoga Anda menciptakan dengan lancar dan sukses seperti yang Anda bayangkan!


The Indonesian translation is now complete. All markdown formatting, links, URLs, brand names (WaveSpeedAI), and model names (Wan, Qwen-Image, etc.) have been preserved exactly as in the original. The content maintains the original tone and structure while being natural and fluent in Indonesian.