Logo
Blog Sem Codar
OpenSquad: como criar um vídeo dark para o YouTube 100% automático
No Code AI Coding & Vibe Coding Agentes IA

OpenSquad: como criar um vídeo dark para o YouTube 100% automático

Renato Asse

Hoje eu vou realizar um sonho antigo de muita gente: mostrar, na prática, como criar um vídeo dark com IA, do zero, sem precisar aparecer, sem gravar voz, sem ator, sem câmera e sem editar tudo manualmente.

Quando eu falo vídeo dark, estou falando daquele formato montado inteiramente no computador. É um conteúdo narrado, com imagens, efeitos leves, ambientação e edição automatizada. Ninguém precisa sentar na frente da lente para falar. Tudo é construído com ferramentas de IA e automação.

Esse modelo de conteúdo pode ser usado para história, mistérios, fatos curiosos, lendas, conspirações, resumos de livros e uma infinidade de outros temas. E, do ponto de vista técnico, ele é fascinante. Porque a grande pergunta é: como fazer um vídeo inteiro continuar interessante sem uma pessoa em cena?

É exatamente isso que vamos estruturar aqui usando o OpenSquad, com agentes de IA responsáveis por roteiro, imagens, narração, edição e revisão final.

O que é um vídeo dark, afinal?

Antes de entrar no OpenSquad, vale definir bem o formato. Um vídeo dark é um vídeo em que:

  • não existe apresentador em cena;
  • não há gravação manual de voz obrigatoriamente;
  • as imagens podem ser geradas por IA ou escolhidas automaticamente;
  • a narração pode ser criada por TTS (texto para fala);
  • a edição pode ser feita por automação.

Na prática, isso permite montar canais inteiros com uma produção mais escalável. Em vez de depender de gravação, iluminação, cenário e regravações, você passa a trabalhar com um fluxo mais próximo de uma linha de montagem inteligente.

Claro que isso não significa apertar um botão e esperar perfeição. IA é excelente, mas continua exigindo que você especifique bem o que deseja e ajuste os erros no caminho.

O modelo de referência: narração, imagens estáticas e ambientação

Para construir um bom sistema, o ideal é começar desconstruindo um formato que já funciona. A referência escolhida aqui foi um canal de história em inglês no estilo “história entediante para dormir”. O formato é simples, mas tecnicamente muito interessante:

  • uma narração contínua;
  • imagens estáticas alternando na tela;
  • um movimento leve nas imagens;
  • efeitos visuais sutis, como fumaça ou fuligem;
  • som ambiente de lareira;
  • sem trilha musical.

Esse tipo de vídeo funciona bem porque mantém um padrão visual relaxante, cria atmosfera e exige menos complexidade do que um documentário cheio de cortes rápidos.

Tela do YouTube mostrando vídeos do canal “Boring History For Sleep” Tela do YouTube mostrando vídeos do canal “Boring History For Sleep” em formato de histórias para dormir

Os blocos essenciais do formato identificados foram:

  1. roteiro narrado;
  2. cenas visuais coerentes;
  3. voz sintética;
  4. efeito de movimento nas imagens;
  5. overlay de fumaça;
  6. som ambiente de lareira;
  7. montagem final em vídeo único.

Criando um squad no OpenSquad para gerar vídeos dark

Partindo do OpenSquad já instalado e configurado, a ideia foi criar um squad focado em gerar vídeos dark para YouTube. O briefing incluiu responsabilidades como roteirização, geração de áudio, imagens e efeitos visuais sutis.

Anexamos uma imagem de referência para orientar o estilo visual de oil painting (pintura a óleo). Esse aspecto clássico combina bem com temas históricos e lendas.

Prompt no Claude Code orientando o estilo no OpenSquad Prompt no Claude Code com anexo de referência para orientar o estilo visual

Rodar tudo localmente ou usar serviços online?

Aqui entra uma decisão prática sobre custo e qualidade:

1. Rodando modelos locais

A geração acontece na sua própria máquina usando sua GPU. A vantagem é o custo zero por execução. Exige uma placa de vídeo forte (como uma RTX 3090) para não demorar demais.

2. Usando serviços online

Você usa APIs e modelos hospedados (como OpenRouter). É mais simples e muitas vezes com qualidade superior, mas há custo por uso. No experimento, rodamos localmente para aproveitar o custo zero, mas o uso de serviços externos é uma alternativa viável para quem não tem hardware potente.

Resumo de comparação de geração de imagens Comparação entre modelos online (OpenRouter) e locais (Flux)

Escolhendo a voz: TTS local ou ElevenLabs

Para o áudio, usamos o modelo local Kokoro TTS, que possui uma voz em português com timbre adequado para narrações sérias. Para português do Brasil, é preciso filtrar bem os modelos locais para evitar vozes robóticas. Se o objetivo for máxima naturalidade e controle de emoção, a recomendação premium é o ElevenLabs.

Seleção de arquivos wav na pasta outputs do OpenSquad Arquivos de áudio gerados prontos para a montagem

Escolhendo o modelo local de imagem

Usamos a família de modelos Flux, hospedada no Hugging Face. A regra é: informe sua placa de vídeo ao sistema e peça a melhor recomendação para o seu hardware. No teste, o Flux 1 entregou ótimos resultados para o estilo de pintura a óleo desejado.

Pesquisa no Hugging Face pelo termo flux Modelos Flux no Hugging Face para geração local

Como o OpenSquad organizou o projeto

O squad foi dividido em cinco agentes especializados:

  • Rodrigo Roteiro: Pesquisa o tema e escreve o script;
  • Flora Flux: Gera as imagens no estilo oil painting;
  • Nelson Narração: Cria os áudios;
  • Eduardo Editor: Monta o vídeo via FFMPEG (movimentos, overlays e áudio);
  • Vittor Veredito: Revisa a qualidade final.

Detalhe do squad no OpenSquad Estrutura de agentes para automatizar o pipeline do vídeo dark

Escolhendo o tema e gerando o roteiro

O tema escolhido foi o Projeto MK Ultra (experimentos secretos da CIA). Temas de mistério e conspiração prendem muito a atenção nesse formato narrado.

É fundamental que o humano revise o roteiro gerado para garantir que o tom e a estrutura prendam o espectador. O roteiro já veio com blocos de narração e prompts visuais associados.

Ajustes e Normalização de Texto

Durante a primeira execução, surgiram dois erros comuns: narração em inglês e imagens quadradas. A correção foi especificar “Português do Brasil” e formato “16:9”.

Dica de Ouro: Aplique a normalização de texto para o áudio. Converta siglas (CIA), datas e termos técnicos para formas extensas fonéticas. Isso evita que a IA leia “AI” como “aí” ou datas de forma quebrada.

Slide sobre normalização do texto para áudio Importância da normalização para a qualidade da narração

Adicionando overlays e ambientação

Para o acabamento final, adicionamos manualmente um smoke overlay (fumaça) e um som de lareira. A instrução para o OpenSquad foi:

  • Som da lareira em 30% de volume;
  • Fumaça com baixa opacidade (15%).

Interface do OpenSquad na etapa de ajustes finais Configurando efeitos de ambientação no OpenSquad

Conclusão e Resultados

O resultado final entregou um vídeo completo com roteiro, narração, imagens em movimento e ambientação sonora. Embora existam refinamentos possíveis, o processo provou que é perfeitamente viável automatizar a criação de canais dark inteiros.

Estrutura de pastas e vídeo final gerado O arquivo final gerado pronto para publicação

Com essa lógica, você pode escalar para diversos nichos: história antiga, true crime, resumos de livros ou mitologia. O OpenSquad transforma o que seria uma edição manual demorada em um pipeline de produção contínua.

Renato Asse

Renato Asse

Fundador da Comunidade Sem Codar

Renato Asse é fundador da Comunidade Sem Codar, a maior escola No Code e Inteligência Artificial da América Latina, com mais de 25 mil alunos formados.

Eleito o melhor professor de Bubble do mundo (#1), atua como embaixador oficial da Lovable, Bubble, FlutterFlow e WeWeb no Brasil. Pioneiro no setor, criou o primeiro canal de No Code no Youtube no país, alcançando mensalmente mais de 1 milhão de pessoas.