Mode « Fast » de WAN 2.5 : Ce qui change et quand c'est utile

Bonjour, je m’appelle Dora. Je ne cherchais pas à gagner en vitesse. J’y ai trébuché. Un petit bouton intitulé « Fast » dans WAN 2.5 se trouvait à côté des paramètres habituels, et je le sautais continuellement parce que tout fonctionnait « correctement ». Puis un matin (janvier 2026), une longue session de contenu a alourdi ma journée. J’ai basculé le bouton par une légère frustration, pas par curiosité. La différence n’était pas spectaculaire au premier abord. C’était plus discret que ça, comme un courant d’air qui ne se posait pas trop de questions. Et puis j’ai commencé à remarquer des motifs.

Ce n’est pas une critique. Ce sont des notes de terrain d’une semaine d’utilisation du mode Fast de WAN 2.5 dans mon travail quotidien : outlines, réponses aux emails, révisions de contenu, petits ajustements de code, et le résumé occasionnel. Voici ce qui a vraiment changé pour moi.

Ce que change le mode Fast

La version courte : le mode Fast réduit la latence et allège la surcharge mentale, mais il réduit aussi la profondeur. Je l’ai senti surtout dans le fait que le modèle devint plus « décisif ».

Ce que j’ai observé :

Premier jeton plus rapide et réponses complètes plus rapides. Sur les tâches courtes, cela rendait le modèle presque instantané. Sur les travaux plus longs, le gain de vitesse était notable mais pas spectaculaire.
Réponses plus serrées et plus courtes par défaut. Il s’arrêtait d’expliquer autant à moins que je le demande.
Moins de précautions. Le mode Fast choisissait une direction plus vite et s’y tenait. Quand il se trompait, il ne revenait pas toujours sur ses pas.
Moins de détours. Il sautait les préambules « Réfléchissons attentivement… » (bien), mais sautait aussi certaines vérifications (moins bien dans les travaux délicats).
Plus de réutilisation de motifs. Si mon prompt était flou, il s’appuyait sur une structure familière au lieu d’explorer.

Selon l’aide intégrée et les notes de version, le mode Fast privilégie la latence basse par rapport à une analyse exhaustive. Cela correspondait à mes exécutions : le même « cerveau » général, juste en poussant pour la vitesse. Pas un modèle différent, mais un appétit différent.

Une petite chose que j’ai aimée : cela réduisait les allers-retours. Je donnais une structure claire, et il la remplissait sans trop parler. Une petite chose que je n’ai pas aimée : quand j’avais besoin de comparaisons attentives, il répondait parfois avec assurance avant de vérifier la deuxième option.

Effet net : le travail semblait plus léger pour les tâches de routine. Pour tout ce qui était subtil, je devais ajouter des garde-fous ou désactiver Fast.

Compromis de qualité

J’ai tenu un journal simple pendant une semaine : tâche, mode, temps, modifications nécessaires. Pas scientifique, mais utile.

Où la qualité s’est maintenue :

Résumés du contenu que j’ai fourni. Il restait fidèle à la source quand celle-ci était propre.
Réécritures simples avec un style cible. Les contraintes claires aidaient.
Petits correctifs de code où l’erreur était évidente (typo, import manquant, regex rapide).

Où la qualité a chuté :

Comparaisons nuancées (par exemple, les compromis entre deux API avec des cas limites). Il répondait « assez bien », puis passait à autre chose.
Raisonnement multi-étapes avec des dépendances cachées. Il sautait parfois une étape qui n’était pas explicitement nommée.
Rappel de faits au-delà du prompt. Si je ne fournissais pas de contexte, il se tournait vers les réponses probables avec plus de confiance que je ne l’aurais souhaité.

Je décrirais le mode d’échec comme : rapide, plausible, incomplet. Pas désordonné, juste trop tôt rangé. Cela ne m’a pas fait gagner du temps au départ. Mais après quelques exécutions, j’ai remarqué que cela réduisait l’effort mental sur les tâches simples parce que j’arrêtais de sur-spécifier. Quand la profondeur importait, je repayais ce temps dans la vérification.

Si vous gardez déjà des prompts serrés et des boucles courtes, vous aimerez probablement l’équilibre. Si vous comptez sur le modèle pour faire de la « pensée lente » pour vous, le mode Fast vous semblera un peu émoussé.

Meilleurs cas d’usage

Quelques endroits où le mode Fast s’est avéré parfait :

Brouillons de structures : outlines, en-têtes de section, résumés à puces. C’est bon pour poser les voies que vous pouvez remplir.
Polissage de petits morceaux : lignes de sujet, intros, métadescriptions, variations de microcopy. Être décisif est utile ici.
Refactorisations de routine : raccourcir, clarifier, dé-jargoniser un paragraphe. Les instructions claires avant/après aident.
Petits coups de code : renommer des variables, insérer la journalisation, transformer un snippet en fonction avec le même comportement.
Opérations en masse avec garde-fous : « Appliquez ce style à ces 10 snippets. » Il reste cohérent si vous fournissez un modèle.
Réponses aux emails avec contraintes : « Gardez moins de 120 mots, reconnaître le délai, proposer deux créneaux horaires. » Il atteint la forme rapidement.

J’ai aussi aimé l’utiliser pour des « passages de vérification », demandant deux risques que je pourrais manquer dans un plan que j’ai écrit. Il ne creusera pas profondément, mais il pointera les nids-de-poule évidents que vous avez cessé de voir.

Quand ne pas utiliser

Quelques endroits où j’ai désactivé le mode Fast :

N’importe quoi de sensible à la conformité : notes juridiques, changements de politique, conseils de sécurité. Je veux un langage lent et attentif.
Sorties dépendantes des données : narratifs analytiques, résumés financiers, n’importe quoi avec des calculs au-delà des mathématiques simples.
Travail éditorial subtil : correspondance de ton pour les emails sensibles, voix de marque pour une annonce épineuse.
Planification d’intégration complexe : diagrammes multi-services, étapes de migration, chemins de restauration. Il manque les dépendances discrètes.
Recherche au-delà du contexte fourni. Si je ne peux pas fournir la source, je préfère que le modèle prenne son temps et pose des questions.

Si le coût d’une erreur est plus élevé que le coût de l’attente, je laisse Fast désactivé. Cela semble évident, mais j’ai dû me le rappeler deux fois.

Ajustements des prompts

Le mode Fast n’a pas récompensé les prompts astucieux. Il a récompensé les prompts directs. Quelques motifs qui ont fonctionné pour moi, inspirés par les meilleures pratiques en prompt engineering :

Définissez une petite cible : « 2-3 puces », « Moins de 90 mots », « Un paragraphe, pas de préface. » Cela garde la réponse serrée et réduit la dérive.
Donnez une forme : « Utilisez ce modèle », « Remplissez ces champs », « Retournez JSON avec les clés : titre, angle, risques. »
Épinglez la source : « Utilisez uniquement le texte ci-dessous. Si absent, dites ‘pas dans la source.’ » Cela a réduit les suppositions confiantes.
Ajoutez une vérification discrète : « Listez les hypothèses d’abord. Si l’une d’elles semble incorrecte, arrêtez et posez une question. » Il ne s’arrêtera pas toujours, mais cela aide.
Divisez le travail : outline d’abord, puis élargissez les sections que vous approuvez. Le mode Fast est excellent pour la première passe.
Nommez la contrainte, pas le ressenti : « Langage simple, niveau de lecture 7ème grade, pas de métaphores. » Il respecte mieux les contraintes que les ambiances.

Deux petits ajustements qui ont importé plus que je ne l’aurais attendu :

Incluez un court exemple de la sortie que vous voulez. Un suffit. Le mode Fast copie bien la forme.
Réduisez l’optionnalité. Au lieu de « Vous pouvez faire A ou B », choisissez-en un. Il se déplace plus vite quand la bifurcation disparaît.

Quand j’oubliais de le faire, il remplissait les lacunes avec des motifs courants. Pas mal, juste pas le mien.

Impact sur les coûts

Cela variera selon le forfait, alors considérez ceci comme un instantané, pas un conseil. Dans mon espace de travail, les jetons étaient facturés de la même manière en mode Fast ou non. La principale différence provenait de sorties plus courtes et de moins de suivi. Pour les modifications de routine et les structures, j’ai vu une légère baisse des dépenses, environ un tour de moins par tâche et des réponses plus serrées.

Si votre travail est lourd par lots (de nombreuses petites tâches), le mode Fast peut économiser assez de temps pour que vous fassiez réellement plus de tâches. Cela peut augmenter les dépenses même si chaque tâche est moins chère. Si vous êtes serrés au budget, regardez le total hebdomadaire, pas seulement le coût par appel.

Si votre niveau de tarification réduit le mode Fast ou utilise un taux séparé (certains le font), consultez la documentation de votre compte. Le mien ne l’a pas fait, du moins à partir de janvier 2026.

Paramètres de base

Pour le contexte, voici ce que j’ai utilisé lors des tests en janvier 2026 :

Modèle : WAN 2.5
Mode : Bouton Fast activé/désactivé, changé par tâche
Température : 0,4 pour les travaux de structure, 0,7 pour l’idéation
Top-p : par défaut
Note système : petit guide de style (langage simple, concis, pas de préface)
Contexte : J’ai collé les sources chaque fois que la précision importait : j’ai évité les prompts de « connaissances générales »
Flux de travail : outline → confirmer → développer ou modèle → remplir → vérifier

Si vous voulez un point de départ, essayez ceci : gardez vos instructions courtes, montrez un exemple de la forme exacte de la sortie que vous voulez, et limitez la longueur. Puis exécutez Fast. Si la première réponse semble un peu trop rangée, ajoutez une ligne : « Listez les hypothèses d’abord. »

Je ne prétendrai pas que cela change tout. Cela a juste limé un peu la friction des parties de ma journée qui n’ont pas besoin de drame. L’étrange, c’est combien il est facile d’oublier de le désactiver à nouveau. J’ai commencé à faire une pause avant chaque exécution : veux-je rapide ou attentif ? Une petite question, mais elle me tient honnête. Honnêtement, ce petit bouton est exactement pourquoi nous avons construit WaveSpeed. Nous voulions que WAN 2.5 se sente fiable, scriptable et versionné, afin que vous puissiez vous concentrer sur le travail au lieu de vous chamaller avec les paramètres ou les prompts. Si vous voulez l’essayer et voir comment le mode Fast peut alléger votre routine.