En abril pasado, una startup de Nueva York llamada Runway AI presentó una tecnología que permite a las personas crear videos, como una vaca en una fiesta de cumpleaños o un perro hablando por un teléfono inteligente, simplemente escribiendo una oración en un cuadro en la pantalla de una computadora.
Los videos de cuatro segundos estaban borrosos, entrecortados, distorsionados y molestos. Pero fue una señal clara de que las tecnologías de inteligencia artificial generarán videos cada vez más atractivos en los próximos meses y años.
Apenas diez meses después, OpenAI, una startup de San Francisco, presentó un sistema similar que crea videos que parecen sacados de una película de Hollywood. La manifestación incluyó videos cortos, capturados en minutos, de mamuts lanudos trotando por un prado nevado, un monstruo mirando una vela derritiéndose y una escena en una calle de Tokio aparentemente capturada por una cámara que recorría la ciudad.
OpenAI, la compañía detrás del chatbot ChatGPT y el generador de imágenes fijas DALL-E, se encuentra entre muchas empresas que compiten para mejorar este tipo de generador de video instantáneo, incluidas nuevas empresas como Runway y gigantes tecnológicos como Google y Meta, propietario de Facebook e Instagram. Esta tecnología puede acelerar el trabajo de cineastas experimentados y, al mismo tiempo, reemplazar por completo a los artistas digitales menos experimentados.
También puede convertirse en una forma rápida y económica de crear información errónea en línea, haciendo más difícil saber qué es real en línea.
«Estoy absolutamente aterrorizado de que este tipo de cosas afecten una elección reñida», dijo Oren Etzioni, profesor de la Universidad de Washington que se especializa en inteligencia artificial. También es el fundador de True Media, una organización sin fines de lucro que trabaja para identificar información errónea en línea en campañas políticas.
OpenAI llama a su nuevo sistema Sora, en honor a la palabra japonesa que significa cielo. El equipo detrás de la tecnología, incluidos los investigadores Tim Brooks y Bill Peebles, eligió el nombre porque «evoca la idea de un potencial creativo ilimitado».
En una entrevista, también dijeron que la compañía aún no ha hecho público a Sora porque todavía está trabajando para comprender los riesgos del sistema. En cambio, OpenAI está compartiendo la tecnología con un pequeño grupo de académicos y otros investigadores externos que formarán un “equipo rojo”, término que se refiere a buscar formas de abusar de ella.
«La intención aquí es dar una idea de lo que hay en el horizonte, para que la gente pueda ver las capacidades de esta tecnología y podamos obtener comentarios», dijo el Dr. Brooks.
OpenAI ya coloca marcas de agua en videos producidos por el sistema que los identifican como generados por IA, pero la compañía admite que se pueden eliminar. También puede resultar difícil de detectar. (El New York Times agregó marcas de agua «Generadas por IA» a los videos que contienen esta historia).
El sistema es un ejemplo de IA generativa, que puede generar texto, imágenes y sonidos en el acto. Al igual que otras tecnologías de inteligencia artificial generativa, el sistema OpenAI aprende analizando datos digitales; en este caso, videos y subtítulos que describen lo que contienen esos videos.
OpenAI se negó a decir cuántos videos aprendió el sistema o de dónde vino, excepto para decir que la capacitación incluyó videos disponibles públicamente y videos con licencia de los titulares de derechos de autor. La empresa dice poco sobre los datos utilizados para entrenar su tecnología, probablemente porque quiere mantener una ventaja sobre sus competidores, y ha sido demandada varias veces por utilizar material protegido por derechos de autor.
(El New York Times demandó a OpenAI y su socio Microsoft en diciembre, alegando infracción de derechos de autor sobre contenido de noticias relacionado con sistemas de inteligencia artificial).
Sora crea vídeos en respuesta a descripciones breves, como «un magnífico mundo de arrecifes de coral hecho de papel, lleno de peces de colores y criaturas marinas». Aunque los vídeos pueden ser impresionantes, no siempre son perfectos y pueden incluir imágenes extrañas e ilógicas. Por ejemplo, el sistema generó recientemente un vídeo de alguien comiendo una galleta, pero la galleta nunca se hizo más pequeña.
DALL-E, Midjourney y otros generadores de imágenes fijas han mejorado tan rápidamente en los últimos años que ahora producen imágenes que son casi indistinguibles de las fotografías. Esto ha hecho que sea más difícil identificar información errónea en línea, y muchos artistas digitales se quejan de que les ha dificultado encontrar trabajo.
«Todos nos reímos en 2022 cuando Midjourney salió por primera vez y dijo: ‘Oh, eso es lindo'», dijo Reid Southin, el artista conceptual de la película con sede en Michigan. «Ahora la gente está perdiendo sus trabajos debido a Midjourney».
«Introvertido. Pensador. Solucionador de problemas. Especialista malvado en cerveza. Propenso a ataques de apatía. Experto en redes sociales. Fanático de la comida galardonado».
More Stories
El ex director de «Marathon» ha sido despedido de Bungie por mala conducta
Lanzamiento físico de Castlevania Dominus Collection confirmado, los pedidos anticipados se abrirán el próximo mes
Bethesda tiene el mejor juego independiente por 100 dólares