SORA ha llegado pisando fuerte. Desde que OpenAl lanzó al mercado su nuevo modelo de inteligencia artificial generativa de videos, Sora, internet se ha llenado de videos de entretenimiento: imágenes de gatos haciendo malabares o de Abraham Lincoln bebiendo chupitos en una discoteca. Sora es una auténtica revolución, y proviene de los mismos creadores de ChatGPT y DALL-E. En esta ocasión, la IA puede generar videos a partir de un texto. Te lo contamos todo sobre SORA de OpenAI.
Sora es similar a los modelos que crean imágenes fijas desde un texto y se basa en tecnología de modelos de lenguaje como GPT. El sistema es capaz de entender lo que una persona pide en un lenguaje natural, pues ha sido entrenada para entender la manera en la que los humanos solemos hablar y cómo nos expresamos para preguntar las cosas.
Cómo funciona SORA de OpenAI
Después de entender el prompt, Sora crea videos en los que vemos en movimiento aquello que se pidió, lo cual supone un enorme paso hacia delante en comparación a generar, simplemente, imágenes estáticas. Esto se puede conseguir porque Sora tiene un modelo que ha sido entrenado con una enorme biblioteca de videos, de manera que Sora sabe reconocer toda clase de movimientos y descripciones para recrearlos más tarde en videos. Como es habitual, las capacidades de Sora dependen de la habilidad de cada persona para crear prompts complejos, con descripciones detalladas, que le permitan obtener resultados a la medida.
Por el momento, este modelo de IA se encuentra en una fase temprana de desarrollo y solo genera videos de hasta 60 segundos. Está disponible en España y en el resto de Europa aunque no es gratis, por lo que para usar Sora hace falta una suscripción de pago a ChatGPT Plus, con sus 20 dólares al mes, o a ChatGPT Pro que cuesta 200 dólares al mes.
La calidad y la cantidad de videos que se pueden producir con Sora
La calidad y la cantidad de los videos dependen de la cuota que se pague. Si uno está suscrito a ChatGPT Plus, puede crear hasta 50 videos al mes, con una duración máxima de 10 segundos y una resolución de 720p. Pero si se está suscrito a ChatGPT Pro, entonces puede crear hasta 500 videos, con una resolución FullHD de 1080p y una duración máxima de 5 segundos.
A modo de ejemplo, podemos ver este video, que ha utilizado un prompt en el que se le pidió a Sora que creara a una mujer elegante, caminando por una calle de Tokyo llena de neones y señalizaciones urbanas. También se describió en detalle su vestimenta, las gafas de sol y hasta su pintalabios.
Los animales de compañía son una de las cosas que mejor crea Sora, según alguna de las encuestas realizadas. Lo mismo sucede con los primeros planos, pues esta herramienta es toda una experta simulando la fisionomía humana cuando se le piden planos detallados, como de los ojos.
La interfaz es intuitiva, principalmente porque todavía no dispone de demasiadas funciones. Pero alguna de ellas es verdaderamente interesante, como por ejemplo, permitir cargar tus propios videos para trabajar sobre ellos o combinarlos con creaciones propias. También hay un botón de estilo que incluye opciones como “Stop Motion” o “Cine negro”, a las que, poco a poco, se irán uniendo otras estéticas. Por último, cuenta con funciones básicas de edición de video para cortar los clips o mezclarlos, y tiene un modo “Storyboard” para añadirle al video diferentes ritmos o instrucciones como si un guion de cine se tratase.
Usos y utilidades de Sora de OpenAI
Sora puede utilizarse para crear videos desde cero o ampliar videos existentes, haciéndolos más largos. También puede rellenar los fotogramas que faltan en los videos. En definitiva, la promesa de Sora es facilitar la creación de videos sin necesidad de tener experiencia en la edición de imágenes. He aquí algunos casos de uso clave:
1. Redes Sociales
Sora se puede utilizar para crear videos cortos para plataformas de redes sociales como TikTok, Instagram Reels y YouTube Shorts. Para contenidos difíciles o imposibles de filmar, los videos de Sora son especialmente adecuados.
2. Publicidad y marketing
Crear anuncios, videos promocionales y demostraciones de productos ha sido tradicionalmente caro. Las herramientas de IA de conversión texto a video, prometen abaratar mucho este proceso.
3. Creación de prototipos y visualización de conceptos
Aunque el video de IA no se utilice en un producto final, puede ser útil para demostrar ideas rápidamente. Los cineastas pueden utilizar la IA para maquetas de escenas antes de rodarlas, y los diseñadores pueden crear videos de productos antes de construirlos.
4. Generación de datos sintéticos
Los datos sintéticos se utilizan a menudo en los casos en los que la privacidad o la viabilidad impiden utilizar datos reales. Para los datos numéricos, por ejemplo, los usos más comunes son los datos financieros y la información personal identificable. El acceso a estos conjuntos de datos debe estar estrictamente controlado, pero se pueden crear datos sintéticos con propiedades similares para ponerlos a disposición del público.
Uno de los usos de los datos de video sintético es el entrenamiento de sistemas de visión por ordenador. Las fuerzas armadas de EE. UU. por ejemplo, utilizan datos sintéticos para mejorar el rendimiento de sus sistemas de visión por ordenador de vehículos aéreos no tripulados, para detectar edificios y vehículos de noche y con mal tiempo. Herramientas como Sora, hacen que este proceso sea mucho más barato y accesible.
9 alternativas a SORA de OpenAI en el mercado
Existen actualmente en el mercado varias alternativas de alto perfil a SORA, que permiten crear contenido de video a partir de un texto. Entre ellas están:
1. Runway-Gen-3
La alternativa de perfil más alto es Runway Gen-3. Al igual que Sora, es una IA generativa de texto a video y actualmente, está disponible tanto para web como para móvil.
2. Lumière
Google dio a conocer recientemente a Lumière, que hoy en día está disponible como una extensión del marco Python de aprendizaje profundo PyTorch.
3. Make-a-Video
Meta anunció Make-a-Video en 2022. Ahora, también está disponible a través de una extensión de PyTorch.
4. Victoria
Simplifica la conversión de texto en contenido de video. Se dirige a vendedores de contenidos y educadores.
5. Kapwing
Ofrece una plataforma en línea para crear videos a partir de un texto, haciendo hincapié en la facilidad de uso para profesionales del marketing en redes sociales y creadores ocasionales.
6. Synthesia
Se centra en la creación de presentaciones de video basadas en IA a partir de un texto. Ofrece videos personalizables dirigidos por avatares para fines empresariales y educativos.
7. HeyGen
Tiene como objetivo simplificar la producción de video para el marketing de productos y contenidos, la divulgación de ventas y la educación.
8. Steve AI
Proporciona una plataforma de AI que permite generar videos y animaciones desde un Prompt a un video, de guion a video y de audio a video.
9. Elai
Se centra en el e-learning y la formación corporativa, ofreciendo una solución para convertir, sin esfuerzo, el contenido instructivo en videos informativos.
Para finalizar, si quieres conocer, en detalle, cuáles son todos los pasos para entrar y crear un video en Sora, te dejamos, a continuación, una guía completa en formato de video, extraída de la plataforma YouTube: