Tecnología

    Grok Imagine Video 1.5: el nuevo modelo de video #1 de xAI

    Grok Imagine Video 1.5 es el nuevo modelo image-to-video #1 de xAI, con audio sincronizado nativo. Ejecútalo en Kubeez a 480p o 720p ahora mismo.

    3 de junio de 20266 min de lecturaPor Kubeez
    Grok Imagine Video 1.5: el nuevo modelo de video #1 de xAI

    Grok Imagine Video 1.5: el nuevo modelo de video #1 de xAI

    El 31 de mayo de 2026, xAI lanzó Grok Imagine Video 1.5, y no llegó en silencio. El modelo saltó +52 Elo frente a la versión 1.0 y se quedó con el puesto #1 en la tabla Image-to-Video Arena (Elo ~1473), superando a Seedance 2.0 de ByteDance, HappyHorse de Alibaba y Google Veo. Si conviertes imágenes fijas en clips cortos con sonido, este es el modelo que debes conocer ahora mismo.

    Kubeez ya lo ofrece como grok-imagine-video-1-5-preview con variantes 480p y 720p, así que puedes ponerlo a trabajar hoy sin esperar en ninguna lista.

    Creador animando una sola foto de producto en un clip con sonido usando Grok Imagine Video 1.5 en Kubeez

    #Qué hace destacar a Grok Imagine Video 1.5

    Image-to-video que respeta tu fotograma de origen. Le das una sola imagen fija (una foto de producto, un retrato, un fotograma conceptual) y la anima manteniendo intactas la composición, la iluminación y la identidad del sujeto del original. Esa fidelidad al fotograma inicial es justo lo que lo coloca en la cima de las tablas de image-to-video.

    Audio sincronizado nativo en una sola pasada. Esta es la función estrella. Grok Imagine Video 1.5 genera diálogo, sonido ambiente, efectos de sonido y música junto con la imagen, en el mismo render. Sin una segunda herramienta de audio, sin paso manual de alineación. La versión 1.5 ofrece un diálogo más natural, con pausas creíbles e entonación a nivel de frase, además de capas ambientales que coinciden con la escena en lugar de una textura genérica.

    Sincronización labial y fotorrealismo mucho mejores. xAI reconstruyó el modelo de sincronización, de modo que las líneas habladas se alinean de forma convincente con el movimiento de los labios, y el realismo fotograma a fotograma dio un salto claro frente a 1.0. Esa combinación es la que logró la ganancia de +52 Elo.

    720p a 24fps, clips de hasta 15 segundos. El modelo renderiza movimiento fluido a 24fps, hasta 720p. En Kubeez puedes fijar cualquier duración entre 2 y 15 segundos, para ajustar el clip a la plataforma (un gancho ajustado de 6 segundos para Reels, una escena más completa de 12-15 segundos para YouTube).

    #"Extend from Frame": encadenar secuencias más largas

    El modelo de xAI incluye una capacidad Extend from Frame: continúas el movimiento desde el último fotograma de un clip para construir secuencias más largas sin regenerar desde cero.

    En Kubeez, el modelo acepta exactamente una imagen de entrada, así que la forma práctica de encadenar es sencilla y fiable: genera un clip, toma su último fotograma y vuelve a introducirlo como imagen de origen para el siguiente clip. Une las piezas y obtienes una secuencia continua que mantiene la consistencia del personaje y de la escena de un corte a otro. Es un traspaso manual, no un botón de un solo clic, pero te da control total sobre cada momento.

    Storyboard de clips de Grok Imagine encadenados, el último fotograma de uno convirtiéndose en el de inicio del siguiente

    #Cómo se compara ahora mismo

    La tabla Image-to-Video Arena cuenta la historia con claridad:

    • Grok Imagine Video 1.5 está en el #1, Elo ~1473.
    • Seedance 2.0 le sigue de cerca, en ~1467.
    • HappyHorse y Google Veo quedan por detrás de los dos primeros.

    La carrera está reñida, lo cual es una buena noticia para ti: la franja alta de los modelos de video es ahora realmente excelente, y cada uno tiene su punto fuerte. Grok 1.5 es la opción cuando quieres image-to-video con sonido nativo y buena sincronización labial a partir de una sola imagen. Para text-to-video y movimiento fluido en varias tomas, Seedance 2 en Kubeez sigue siendo una opción fantástica. No tienes que elegir un solo modelo para siempre: eliges según el brief, en una misma plataforma.

    #Prueba Grok Imagine Video 1.5 en Kubeez

    1. Abre Generación de video (inicia sesión si se te pide).
    2. Elige la tarjeta de modelo Grok Imagine Video 1.5.
    3. Selecciona la variante 480p para borradores rápidos y pruebas de alto volumen, o 720p cuando el clip deba ser de calidad final.
    4. Sube una imagen de inicio (este modelo es image-to-video, así que un fotograma de origen es obligatorio).
    5. Fija tu duración (de 2 a 15 segundos) y la relación de aspecto. Un prompt breve que describa la acción, el movimiento de cámara y cualquier diálogo es opcional, pero ayuda.
    6. Genera, revisa e itera. Como el audio viene integrado, tu clip llega con el sonido ya sincronizado.

    Consejo: Parte de una imagen nítida y bien iluminada. El modelo arrastra la calidad de tu imagen de origen, así que un retrato limpio o una foto de producto nítida producen una animación notablemente mejor que un fotograma blando o recargado. ¿Necesitas ese fotograma inicial? Genéralo primero con uno de los modelos de imagen de la gama completa de Kubeez y luego anímalo con Grok.

    Espacio de trabajo de video de Kubeez mostrando la tarjeta de modelo Grok Imagine Video 1.5 con las variantes 480p y 720p

    #Dónde encaja en tu flujo de trabajo

    • Movimiento de producto: Convierte una sola foto de e-commerce en un clip principal con sonido para la tienda o un anuncio de pago.
    • Retratos que hablan: Anima una foto de cara en una breve introducción hablada, con la sincronización labial resuelta en la misma pasada.
    • Del concepto al clip: Toma un fotograma clave generado y dale vida para un pitch, un teaser o un gancho social.
    • Construcción de secuencias: Encadena clips mediante el traspaso del último fotograma para contar una historia algo más larga.

    Cuando publiques en redes, pasa el resultado por Auto Captions para que el diálogo sea legible sin sonido. Y si quieres video centrado en el sonido, nuestra guía sobre video con IA con sonido cubre el panorama completo en los modelos de Kubeez.

    #En resumen

    • Grok Imagine Video 1.5 es el nuevo modelo image-to-video #1 de xAI (Elo ~1473, +52 frente a 1.0), lanzado el 31 de mayo de 2026.
    • Genera audio sincronizado nativo (diálogo, ambiente, efectos, música) en una sola pasada, con sincronización labial y fotorrealismo mucho mejores a 720p / 24fps.
    • En Kubeez funciona como image-to-video con variantes 480p y 720p y clips de 2 a 15 segundos, disponible ahora en /video-generation.
    • Encadena secuencias más largas reintroduciendo el último fotograma de cada clip como la siguiente imagen de inicio.

    Abre la generación de video en Kubeez y anima tu primera imagen con Grok Imagine Video 1.5.

    Ver también