OpenSquad: como criar um vídeo dark para o YouTube 100% automático
Hoje eu vou realizar um sonho antigo de muita gente: mostrar, na prática, como criar um vídeo dark com IA, do zero, sem precisar aparecer, sem gravar voz, sem ator, sem câmera e sem editar tudo manualmente.
Quando eu falo vídeo dark, estou falando daquele formato montado inteiramente no computador. É um conteúdo narrado, com imagens, efeitos leves, ambientação e edição automatizada. Ninguém precisa sentar na frente da lente para falar. Tudo é construído com ferramentas de IA e automação.
Esse modelo de conteúdo pode ser usado para história, mistérios, fatos curiosos, lendas, conspirações, resumos de livros e uma infinidade de outros temas. E, do ponto de vista técnico, ele é fascinante. Porque a grande pergunta é: como fazer um vídeo inteiro continuar interessante sem uma pessoa em cena?
É exatamente isso que vamos estruturar aqui usando o OpenSquad, com agentes de IA responsáveis por roteiro, imagens, narração, edição e revisão final.
O que é um vídeo dark, afinal?
Antes de entrar no OpenSquad, vale definir bem o formato. Um vídeo dark é um vídeo em que:
- não existe apresentador em cena;
- não há gravação manual de voz obrigatoriamente;
- as imagens podem ser geradas por IA ou escolhidas automaticamente;
- a narração pode ser criada por TTS (texto para fala);
- a edição pode ser feita por automação.
Na prática, isso permite montar canais inteiros com uma produção mais escalável. Em vez de depender de gravação, iluminação, cenário e regravações, você passa a trabalhar com um fluxo mais próximo de uma linha de montagem inteligente.
Claro que isso não significa apertar um botão e esperar perfeição. IA é excelente, mas continua exigindo que você especifique bem o que deseja e ajuste os erros no caminho.
O modelo de referência: narração, imagens estáticas e ambientação
Para construir um bom sistema, o ideal é começar desconstruindo um formato que já funciona. A referência escolhida aqui foi um canal de história em inglês no estilo “história entediante para dormir”. O formato é simples, mas tecnicamente muito interessante:
- uma narração contínua;
- imagens estáticas alternando na tela;
- um movimento leve nas imagens;
- efeitos visuais sutis, como fumaça ou fuligem;
- som ambiente de lareira;
- sem trilha musical.
Esse tipo de vídeo funciona bem porque mantém um padrão visual relaxante, cria atmosfera e exige menos complexidade do que um documentário cheio de cortes rápidos.
Tela do YouTube mostrando vídeos do canal “Boring History For Sleep” em formato de histórias para dormir
Os blocos essenciais do formato identificados foram:
- roteiro narrado;
- cenas visuais coerentes;
- voz sintética;
- efeito de movimento nas imagens;
- overlay de fumaça;
- som ambiente de lareira;
- montagem final em vídeo único.
Criando um squad no OpenSquad para gerar vídeos dark
Partindo do OpenSquad já instalado e configurado, a ideia foi criar um squad focado em gerar vídeos dark para YouTube. O briefing incluiu responsabilidades como roteirização, geração de áudio, imagens e efeitos visuais sutis.
Anexamos uma imagem de referência para orientar o estilo visual de oil painting (pintura a óleo). Esse aspecto clássico combina bem com temas históricos e lendas.
Prompt no Claude Code com anexo de referência para orientar o estilo visual
Rodar tudo localmente ou usar serviços online?
Aqui entra uma decisão prática sobre custo e qualidade:
1. Rodando modelos locais
A geração acontece na sua própria máquina usando sua GPU. A vantagem é o custo zero por execução. Exige uma placa de vídeo forte (como uma RTX 3090) para não demorar demais.
2. Usando serviços online
Você usa APIs e modelos hospedados (como OpenRouter). É mais simples e muitas vezes com qualidade superior, mas há custo por uso. No experimento, rodamos localmente para aproveitar o custo zero, mas o uso de serviços externos é uma alternativa viável para quem não tem hardware potente.
Comparação entre modelos online (OpenRouter) e locais (Flux)
Escolhendo a voz: TTS local ou ElevenLabs
Para o áudio, usamos o modelo local Kokoro TTS, que possui uma voz em português com timbre adequado para narrações sérias. Para português do Brasil, é preciso filtrar bem os modelos locais para evitar vozes robóticas. Se o objetivo for máxima naturalidade e controle de emoção, a recomendação premium é o ElevenLabs.
Arquivos de áudio gerados prontos para a montagem
Escolhendo o modelo local de imagem
Usamos a família de modelos Flux, hospedada no Hugging Face. A regra é: informe sua placa de vídeo ao sistema e peça a melhor recomendação para o seu hardware. No teste, o Flux 1 entregou ótimos resultados para o estilo de pintura a óleo desejado.
Modelos Flux no Hugging Face para geração local
Como o OpenSquad organizou o projeto
O squad foi dividido em cinco agentes especializados:
- Rodrigo Roteiro: Pesquisa o tema e escreve o script;
- Flora Flux: Gera as imagens no estilo oil painting;
- Nelson Narração: Cria os áudios;
- Eduardo Editor: Monta o vídeo via FFMPEG (movimentos, overlays e áudio);
- Vittor Veredito: Revisa a qualidade final.
Estrutura de agentes para automatizar o pipeline do vídeo dark
Escolhendo o tema e gerando o roteiro
O tema escolhido foi o Projeto MK Ultra (experimentos secretos da CIA). Temas de mistério e conspiração prendem muito a atenção nesse formato narrado.
É fundamental que o humano revise o roteiro gerado para garantir que o tom e a estrutura prendam o espectador. O roteiro já veio com blocos de narração e prompts visuais associados.
Ajustes e Normalização de Texto
Durante a primeira execução, surgiram dois erros comuns: narração em inglês e imagens quadradas. A correção foi especificar “Português do Brasil” e formato “16:9”.
Dica de Ouro: Aplique a normalização de texto para o áudio. Converta siglas (CIA), datas e termos técnicos para formas extensas fonéticas. Isso evita que a IA leia “AI” como “aí” ou datas de forma quebrada.
Importância da normalização para a qualidade da narração
Adicionando overlays e ambientação
Para o acabamento final, adicionamos manualmente um smoke overlay (fumaça) e um som de lareira. A instrução para o OpenSquad foi:
- Som da lareira em 30% de volume;
- Fumaça com baixa opacidade (15%).
Configurando efeitos de ambientação no OpenSquad
Conclusão e Resultados
O resultado final entregou um vídeo completo com roteiro, narração, imagens em movimento e ambientação sonora. Embora existam refinamentos possíveis, o processo provou que é perfeitamente viável automatizar a criação de canais dark inteiros.
O arquivo final gerado pronto para publicação
Com essa lógica, você pode escalar para diversos nichos: história antiga, true crime, resumos de livros ou mitologia. O OpenSquad transforma o que seria uma edição manual demorada em um pipeline de produção contínua.
Renato Asse
Fundador da Comunidade Sem Codar
Renato Asse é fundador da Comunidade Sem Codar, a maior escola No Code e Inteligência Artificial da América Latina, com mais de 25 mil alunos formados.
Eleito o melhor professor de Bubble do mundo (#1), atua como embaixador oficial da Lovable, Bubble, FlutterFlow e WeWeb no Brasil. Pioneiro no setor, criou o primeiro canal de No Code no Youtube no país, alcançando mensalmente mais de 1 milhão de pessoas.
Materiais Gratuitos
Gestor de IA (R$12k/mês)
Descubra como faturar R$12 mil/mês criando Agentes IA sem programar. O mercado está desesperado por este profissional.
IA para Empresas
Dobre o faturamento da sua empresa com 6 Agentes de IA. Implemente hoje mesmo e saia na frente da concorrência.
Curso Gratuito de n8n
Automatize tarefas chatas e ganhe liberdade. Curso prático de n8n para iniciantes: do zero à sua primeira automação.
Acelere sua Carreira
Comunidade Sem Codar
A maior escola de No-Code e IA da América Latina. Crie aplicativos e agentes de IA profissionais e transforme ideias em negócios digitais lucrativos.
TECH 12K
Sua carreira à prova de futuro. Transforme seu conhecimento técnico em uma profissão de alta demanda e fature até R$12k/mês como Gestor de IA.
SAAS 7D
O mapa para o milhão. Domine o marketing para SaaS e MicroSaaS e escale seu negócio para 7 dígitos de faturamento com estratégias validadas.