La generación de vídeo mediante IA generativa consiste en transformar descripciones de texto (text-to-video), imágenes, guiones o archivos de audio en secuencias de movimiento realistas. La IA se encarga de generar los elementos visuales, las animaciones, las transiciones, las voces en off e incluso la música de fondo.
Algunas fuentes indican que la IAG permite generar vídeo de alta calidad sin conocimientos avanzados de producción de audiovisual, aunque esta afirmación no es del todo precisa. La justificación es que si se desea generar un material de calidad es necesario elaborar un buen guion y describir con precisión tanto las escenas como los movimientos de cámara, y esto implica disponer de conocimientos de lenguaje audiovisual y de edición de vídeo.
En todo caso, la IAG facilita la producción de vídeo de forma más rápida y accesible que los métodos tradicionales, ya que automatiza gran parte del proceso técnico y facilita la experimentación.
Algunos asistentes de IA no incluyen la función de generar vídeo, mientras que otros la ofrecen únicamente en las versiones de pago. Los que la permite de forma gratuita suelen proporcionar pocos créditos, lo que limita la capacidad para realizar pruebas. Esto se debe a que generar vídeo con IAG consume muchos recursos en los servidores de las empresas y obtener un resultado aceptable requiere múltiples iteraciones. Los vídeos de calidad profesional se logran, generalmente, mediante versiones de pago o a través del procedimiento tradicional, que consiste en elaborar un guion, grabar las imágenes con una cámara y editarlas con aplicaciones como Premiere.
Texto a vídeo (text to video) con Kling AI
Crear un vídeo a partir de un texto (prompt) es el procedimiento más habitual. Para iniciar el proceso, se describe el vídeo mediante un prompt y el sistema lo interpreta para generar las imágenes, personajes, movimientos de cámara y, en algunos casos, los sonidos y locuciones.
En este ejemplo se utiliza la versión gratuita de Kling IA, disponible en https://app.klingai.com/. Para crear un vídeo hay que acceder a la opción generar vídeo y redactar el prompt. Es posible indicar el frame inicial (pantalla inicial) y final del vídeo.
Prompt: Crea un vídeo con un plano medio (medium shot) estable de un joven de aproximadamente 20 años, vestido con una chaqueta moderna con capucha, caminando lentamente por el centro de Times Square, Nueva York. Está amaneciendo con el cielo nublado y una lluvia fina que moja el pavimento. Las icónicas pantallas LED están encendidas, reflejándose en el suelo mojado. El ambiente es melancólico y cinematográfico.
El vídeo comienza con un plano general del personaje que pasa a ser un plano medio. Aunque no se solicitó expresamente, incluye audio, en concreto, se escuchan los pasos del joven al caminar.
Imagen a vídeo (image to video) con Runway
En el procedimiento de imagen a vídeo, se proporciona una ilustración de partida a la IA y, mediante un prompt, se anima la escena.
En este ejemplo, se usa la versión gratuita de la aplicación Runway, disponible en https://app.runwayml.com/. Una vez en la aplicación, hay que seleccionar la opción de generar vídeo, subir una imagen e indicar el prompt. En este caso:
Prompt: Crea un vídeo de un militar del Ejército Español con uniforme de campaña árido que pasea por un bosque. Está cansado tras una larga jornada de trabajo. Atardece y se visualizan los últimos rayos de sol entre los árboles.
Parámetros: Seleccionar la imagen inicial; relación de aspecto: 4:3; duración: 5 segundos; vídeo model: Gen-4 Turbo.
Imagen inicial:
Imagen inicial generada con ChatGPT (SUBDEVA, 2026)
Vídeo generado (Runway):
Vídeo generado con Runway (SUBDEVA, 2026)
El vídeo no es de calidad, ya que el personaje abandona demasiado rápido la escena. Debería acompañarse con un movimiento de cámara para mantener la continuidad visual y reforzar la sensación de naturalidad en la acción.
En la generación de vídeo con IAG, son habituales las alucinaciones. En este ejemplo, diseñado también con Runway, de un soldado caminando por el desierto, se observa cómo camina hacia atrás:
Vídeo generado con Runway (alucinación) (SUBDEVA, 2026)
Guion a vídeo (script to video) con Google AI Studio
El procedimiento de guion a vídeo es laborioso, pero permite resultados más profesionales. A partir de un guion la IA se encarga de crear las escenas, elegir el metraje adecuado, añadir la voz en off, los subtítulos y la música.
Si es preciso, un asistente de IA puede ser útil para elaborar el guion. En este ejemplo, se parte de un prompt en el que se describe el vídeo (idea) y el asistente de IA Qwen confecciona el guion del vídeo:
Prompt (idea): Crea un vídeo de un soldado del Ejército Español con uniforme de campaña boscoso pixelado llegando a la cumbre de una montaña espectacular. La cámara captura el momento en que alcanza la cima, se detiene y mira el horizonte con expresión de cansancio pero profunda satisfacción, esbozando una sonrisa de alegría y logro. Viste uniforme de camuflaje militar español moderno con parches visibles. Vistas panorámicas impresionantes de cordilleras dramáticas extendiéndose hasta el horizonte. Día soleado con cielo azul despejado, nubes flotando por debajo del pico. El viento sopla constantemente moviendo su uniforme, pelo y el paisaje alrededor. Luz dorada del sol iluminando la escena. El soldado respira profundamente, se quita la mochila y levanta los brazos en señal de triunfo. Movimiento de cámara suave, cinematográfico, comenzando en plano medio y abriendo a plano general para mostrar la magnificencia del paisaje. Estilo documental épico, atmósfera inspiradora y motivacional, calidad cinematográfica profesional. Duración 10 segundos. Movimiento de cámara drone shot y steadicam. Audio: viento y respiración del soldado.
Respuesta abreviada (guion elaborado por Qwen): ¡Claro! A continuación, te presento una descripción detallada del guion visual (shot list) para ese video de 10 segundos, listo para ser utilizado por un director, operador de cámara o equipo de producción cinematográfica. Esta descripción puede servir también como brief para un artista de VFX, un editor o un generador de video por IA.
Título del Clip: Cumbre del honor
Duración: 10 segundos.
Estilo visual: Documental épico, cinematográfico, calidad 4K HDR
Movimiento de cámara: Combinación de drone shot (aéreo suave) + steadicam (terrestre estable)
0:00-0:02: Plano medio (steadicam). El soldado del Ejército Español sube los últimos metros de la cumbre. Se ve uniforme del Ejército de Tierra de España, casco táctico, mochila de asalto, botas de montaña. El viento agita su uniforme. Expresión de fatiga en los ojos.
0:02- 0:04: Transición suave a drone shot. Plano ligeramente bajo (low angle) para enfatizar su figura contra el cielo. Respiración profunda y audible. Se quita la mochila con un movimiento cansado pero firme.
0:04-0:06: Plano medio frontal: El soldado mira al horizonte. Sus ojos se relajan. Una sonrisa sutil se forma en su rostro. Luz dorada del sol baña su cara.
0:06-0:08: Dron se aleja en ascenso suave: La cámara comienza a abrir el encuadre, revelando el entorno. El soldado levanta los brazos como un gesto de triunfo. Detrás de él: cordilleras infinitas, picos nevados, nubes algodonosas flotando.
0:08-0:10: Plano general épico (wide drone shot): Vista aérea completa de la montaña y el paisaje circundante. El soldado es ahora una pequeña figura. El viento sigue moviendo la vegetación. Corte final con el sol brillando en el horizonte.
Notas técnicas:
- Color grading: Tonos cálidos, contraste alto, realzando los verdes del camuflaje y los dorados del sol.
- Sonido: Solo ambiente natural. Viento constante (con variación de intensidad), respiración pesada que se calma, crujido de tela al moverse.
- Uniforme: Asegurar autenticidad: camuflaje boscoso español actual, parche del Ejército de Tierra, en manga izquierda bandera de España y equipo táctico reglamentario.
Este clip está diseñado para transmitir resiliencia, logro personal y conexión con la tierra, ideal para campañas institucionales del Ejército, documentales de montaña o piezas motivacionales con enfoque patriótico y humano.
Google permite generar vídeos de forma gratuita con su aplicación Google IA Studio disponible en https://aistudio.google.com/ Para ello, hay que acceder a la opción de generar vídeo —text to vídeo— y copiar el guion elaborado por Qwen.
El resultado es el siguiente:
Vídeo generado por Google AI Studio (SUBDEVA, 2026)
Los problemas de este vídeo son varios: No responde fielmente a lo indicado en el guion, el uniforme no pertenece al ET y se observa que el soldado habla pero el vídeo no tiene sonido. El resultado es de mala calidad.