Apresentando Vidu Q3 Start End To Video no WaveSpeedAI

Apresentando Vidu Q3 Start-End to Video no WaveSpeedAI

O modelo de vídeo com frames inicial e final mais avançado da Shengshu Technology chegou. Temos o prazer de anunciar a disponibilidade do Vidu Q3 Start-End to Video no WaveSpeedAI—trazendo o poder da geração Vidu Q3, classificada entre as melhores do mundo, para a criação precisa de vídeos com dois keyframes.

O Vidu Q3 causou grande impacto quando foi lançado em 30 de janeiro de 2026, ficando em 1º lugar na China e em 2º lugar globalmente nos benchmarks da Artificial Analysis. Agora, com a variante Start-End to Video, os criadores podem aproveitar essa mesma qualidade líder do setor enquanto mantêm controle total sobre os frames de abertura e fechamento de seus vídeos gerados. Forneça uma imagem inicial, uma imagem final e um prompt de texto—e observe o modelo produzir transições suaves e cinematográficas entre os dois estados em resolução de até 1080p.

O que é o Vidu Q3 Start-End to Video?

O Vidu Q3 Start-End to Video é um modelo de interpolação com dois keyframes que gera vídeos de alta qualidade conectando inteligentemente dois frames de referência. Ao contrário dos modelos padrão de imagem para vídeo, que extrapolam de forma imprevisível a partir de uma única imagem, este modelo ancora tanto o início quanto o fim do seu vídeo e, em seguida, sintetiza o caminho de movimento natural entre eles.

A arquitetura subjacente do Vidu Q3 representa um salto geracional em relação ao Q2. Construído sobre a avançada base de vision transformer da Shengshu Technology, o Q3 oferece fidelidade visual aprimorada, maior coerência de movimento e lógica física superior—testes independentes atribuem a ele uma pontuação de física de 7,5/10, com objetos interagindo de forma realista e movimentos de personagens parecendo naturais e com peso. As distorções em nível de frame são significativamente reduzidas em comparação com gerações anteriores, e a continuidade de movimento é visivelmente mais suave.

O que torna a variante Start-End especialmente poderosa é a previsibilidade. A geração de vídeo por IA tradicional produz resultados bonitos, mas incontroláveis. Ao restringir ambos os pontos finais, os criadores podem direcionar o arco narrativo de seu vídeo com precisão, enquanto ainda se beneficiam do motor de movimento cinematográfico do Q3 e da interpolação natural.

Principais Recursos

Qualidade Visual da Geração Q3 O Vidu Q3 produz imagens mais nítidas com menos artefatos do que qualquer modelo Vidu anterior. As melhorias na arquitetura e no aumento de dados reduzem o flicker e melhoram a continuidade do movimento, entregando resultados que parecem intencionais em vez de gerados algoritmicamente.

Controle de Precisão com Dois Frames Defina tanto os visuais iniciais quanto os finais. O modelo preserva identidade, iluminação, composição e relações espaciais em todo o clipe, garantindo que seu sujeito permaneça consistente do primeiro ao último frame.

Interpolação Suave com Consciência Física O motor de movimento com IA gera movimento natural e fluido entre seus dois frames de referência. Os objetos obedecem à física realista, os personagens se movem com peso e intenção, e as transições de câmera parecem cinematograficamente elaboradas.

Múltiplas Opções de Resolução Escolha entre saída em 540p, 720p ou 1080p para equilibrar qualidade e custo. Seja para prototipar ideias em resolução menor ou produzir entregas finais em Full HD, o modelo se adapta ao seu fluxo de trabalho.

Controle de Amplitude de Movimento Ajuste a intensidade do movimento em suas transições. Use movimento sutil para transformações suaves ou aumente para morphs dramáticos e sequências de ação.

Geração de Áudio Nativa Uma capacidade diferenciada herdada da arquitetura Q3: geração opcional de áudio sincronizado e música de fundo sem custo adicional. Seus vídeos podem ser entregues completos com design de som, eliminando a necessidade de produção de áudio separada.

Aprimorador de Prompt Integrado A ferramenta integrada de aprimoramento de prompt melhora automaticamente suas descrições de cena, ajudando você a obter melhores resultados sem precisar dominar técnicas complexas de prompting.

Casos de Uso no Mundo Real

Transições Cinematográficas de Cenas

Crie transições suaves entre dois estados visuais para filmes, comerciais e videoclipes. Forneça seu plano de abertura e plano de fechamento, descreva o movimento da câmera e a ação, e gere footage de ligação profissional que de outra forma exigiria trabalho caro de VFX.

Morphing e Demonstrações de Produtos

Mostre transformações de produtos, variações de cores ou alterações de recursos com transições de vídeo polidas. Uma marca de cosméticos pode fazer morphing entre opções de tonalidades; um fabricante de automóveis pode transitar entre níveis de acabamento—tudo com movimento suave e controlado.

Conteúdo de Antes e Depois

Transformações físicas, reformas residenciais, mudanças sazonais de paisagem—qualquer cenário que conte uma história por meio de contraste se beneficia de transições de vídeo suaves e profissionais entre dois estados. O controle de dois frames garante que tanto o seu momento “antes” quanto o “depois” aconteçam exatamente como planejado.

Animação de Personagens e Transições de Pose

Anime personagens se movendo de uma pose ou expressão para outra. Desenvolvedores de jogos, animadores e criadores de conteúdo podem rapidamente prototipar movimentos de personagens sem keyframing manual, usando o prompt de texto para guiar o estilo e o ritmo da transição.

Time-Lapse e Efeitos Temporais

Crie vídeos de time-lapse artificiais com pontos de início e fim controlados. Simule do nascer ao pôr do sol, mudanças de estação ou progresso de construção arquitetônica com interpolação temporal de aparência natural.

Previsualization de Storyboard

Transforme frames estáticos de storyboard em sequências animadas. Forneça seus beats principais como imagens inicial e final, e o modelo gera o movimento entre eles—perfeito para apresentar conceitos, testar fluxo editorial ou visualizar movimentos de câmera antes de comprometer-se com a produção.

Primeiros Passos no WaveSpeedAI

Usar o Vidu Q3 Start-End to Video no WaveSpeedAI requer apenas alguns passos:

Faça upload da sua imagem inicial — o primeiro frame do seu vídeo
Faça upload da sua imagem final — o último frame do seu vídeo
Escreva seu prompt — descreva o movimento, a ação e a transição entre os frames
Defina a duração — escolha o comprimento do seu vídeo (padrão: 5 segundos)
Escolha a resolução — 540p para velocidade, 720p para equilíbrio, ou 1080p para qualidade máxima
Ajuste o movimento (opcional) — controle a intensidade do movimento com a configuração de amplitude
Ative o áudio (opcional) — ative o áudio sincronizado e a música de fundo
Gere — envie e faça download do seu vídeo completo

A infraestrutura do WaveSpeedAI oferece inferência rápida sem cold starts, então seus vídeos são gerados rapidamente independentemente da demanda. A API REST integra-se diretamente em pipelines de produção e fluxos de trabalho criativos existentes.

Preços Transparentes

Os custos escalam de forma previsível por resolução e duração:

Resolução	Custo por Segundo	Vídeo de 5s	Vídeo de 10s
540p	$0,07	$0,35	$0,70
720p	$0,15	$0,75	$1,50
1080p	$0,16	$0,80	$1,60

A geração de áudio está incluída sem custo adicional. Sem assinaturas, sem taxas ocultas—pague apenas pelo que você gerar.

Integração via API

import json
import os
import time
from urllib.request import Request, urlopen

api_key = os.environ["WAVESPEED_API_KEY"]
headers = {"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"}
payload = {
    "prompt": "A cinematic ocean wave at sunrise, highly detailed",
    "image": "https://interactive-examples.mdn.mozilla.net/media/cc0-images/painted-hand-298-332.jpg",
    "last_image": "https://interactive-examples.mdn.mozilla.net/media/cc0-images/painted-hand-298-332.jpg",
    "duration": 5,
    "resolution": "720p",
    "bgm": True,
    "generate_audio": True,
    "movement_amplitude": "auto",
    "seed": -1
}

def request_json(url, data=None):
    request = Request(url, data=data, headers=headers, method="POST" if data else "GET")
    with urlopen(request) as response:
        return json.load(response)

# 1. Submit the prediction.
submit_body = request_json("https://api.wavespeed.ai/api/v3/vidu/q3/start-end-to-video", json.dumps(payload).encode())
task = submit_body.get("data", submit_body)
prediction_id = task.get("id")
if not prediction_id:
    raise RuntimeError("Submission response did not contain a prediction id")
result_url = task.get("urls", {}).get("get") or f"https://api.wavespeed.ai/api/v3/predictions/{prediction_id}/result"

# 2. Poll until the prediction finishes.
while True:
    body = request_json(result_url)
    result = body.get("data", body)
    status = result.get("status")
    if status == "completed":
        print(result.get("outputs", []))
        break
    if status in {"failed", "cancelled", "timeout"}:
        raise RuntimeError(result)
    if status not in {"created", "processing"}:
        raise RuntimeError(f"Unexpected status: {status}")
    time.sleep(2)

Por que WaveSpeedAI?

Sem Cold Starts — a infraestrutura permanece aquecida, oferecendo velocidades de geração consistentes desde sua primeira solicitação até a milésima
API REST Pronta para Uso — pule a configuração de infraestrutura e comece a gerar imediatamente
Preços Acessíveis com Pagamento por Uso — sem assinaturas ou compromissos, escale conforme seu uso
Confiabilidade Empresarial — infraestrutura construída para cargas de trabalho de produção com uptime consistente

Conclusão

O Vidu Q3 Start-End to Video traz o poder do modelo de vídeo por IA classificado em 2º lugar no mundo para a criação de vídeos guiada com precisão. Ao combinar a qualidade visual superior do Q3, o movimento com consciência física e a geração de áudio nativa com controle de dois keyframes, ele oferece um nível de precisão criativa que antes era impossível na geração de vídeo por IA.

Seja criando transições cinematográficas, produzindo demonstrações de produtos, animando personagens ou prototipando storyboards, este modelo dá a você o controle para definir os pontos finais da sua narrativa enquanto a IA cuida de tudo no meio—lindamente.

Experimente o Vidu Q3 Start-End to Video no WaveSpeedAI →