Skip to content
Ahora cualquiera puede usar poderosas herramientas de inteligencia artificial para crear imágenes.  ¿Qué podría salir mal?



CNN Negocios

Si alguna vez ha querido utilizar la inteligencia artificial para diseñar rápidamente un híbrido entre un pato y un corgi, ahora es el momento de brillar.

El miércoles, OpenAI anunció que ahora cualquiera puede usar la versión más reciente de su herramienta DALL-E impulsada por IA para generar una gama aparentemente ilimitada de imágenes con solo escribir unas pocas palabras, meses después de que la puesta en marcha comenzara a implementarla gradualmente para los usuarios. .

Es probable que la medida amplíe el alcance de una nueva cosecha de herramientas impulsadas por IA que ya han atraído a una amplia audiencia y desafiado nuestras ideas fundamentales de arte y creatividad. Pero también podría aumentar las preocupaciones sobre cómo dichos sistemas podrían ser mal utilizados cuando están ampliamente disponibles.

“Aprender del uso en el mundo real nos ha permitido mejorar nuestros sistemas de seguridad, haciendo posible una mayor disponibilidad hoy”, dijo OpenAI en una publicación de blog. La compañía dijo que también ha fortalecido las formas en que rechaza los intentos de los usuarios de hacer que su IA cree «contenido sexual, violento y de otro tipo».

Ahora hay tres sistemas de IA conocidos e inmensamente poderosos abiertos al público que pueden tomar unas pocas palabras y escupir una imagen. Además de DALL-E 2, está Midjourney, que estuvo disponible públicamente en julio, y Stable Diffusion, que Stability AI lanzó al público en agosto. Los tres ofrecen algunos créditos gratuitos a los usuarios que quieran familiarizarse con la creación de imágenes con IA en línea; generalmente, después de eso, tienes que pagar.

Estos llamados sistemas de IA generativa ya se están utilizando para películas experimentales, portadas de revistas y anuncios de bienes raíces. Una imagen generada con Midjourney ganó recientemente un concurso de arte en la Feria Estatal de Colorado y causó revuelo entre los artistas.

En solo unos meses, millones de personas han acudido en masa a estos sistemas de IA. Más de 2,7 millones de personas pertenecen al servidor Discord de Midjourney, donde los usuarios pueden enviar avisos. OpenAI dijo en su publicación de blog del miércoles que tiene más de 1,5 millones de usuarios activos, que colectivamente han estado creando más de 2 millones de imágenes con su sistema cada día. (Cabe señalar que puede tomar muchos intentos para obtener una imagen con la que esté satisfecho cuando usa estas herramientas).

Muchas de las imágenes creadas por los usuarios en las últimas semanas se han compartido en línea y los resultados pueden ser impresionantes. Van desde paisajes de otro mundo y una pintura de aristócratas franceses como pingüinos a un fotografía vintage falsa de un hombre caminando un tardígrado.

El ascenso de dicha tecnología, y las indicaciones cada vez más complicadas y las imágenes resultantes, han impresionado incluso a los expertos de la industria desde hace mucho tiempo. Andrej Karpathy, quien renunció a su cargo como director de IA de Tesla en julio, dijo en un tweet reciente que después de que lo invitaran a probar DALL-E 2 se sintió «congelado» cuando trató de decidir qué escribir y finalmente escribió «gato».

Ahora cualquiera puede usar poderosas herramientas de inteligencia artificial para crear imágenes.  ¿Qué podría salir mal?

“El arte de las indicaciones que la comunidad ha descubierto y perfeccionado cada vez más en los últimos meses para los modelos de texto -> imagen es asombroso”, dijo.

Pero la popularidad de esta tecnología tiene posibles desventajas. Los expertos en IA han expresado su preocupación de que la naturaleza abierta de estos sistemas, que los hace expertos en generar todo tipo de imágenes a partir de palabras, y su capacidad para automatizar la creación de imágenes significa que podrían automatizar el sesgo a gran escala. Un ejemplo simple de esto: cuando pasé el mensaje «un banquero vestido para un gran día en la oficina» a DALL-E 2 esta semana, los resultados fueron imágenes de hombres blancos de mediana edad con traje y corbata.

“Básicamente, permiten que los usuarios encuentren las lagunas en el sistema usándolo”, dijo Julie Carptener, científica investigadora y miembro del Grupo de Ética y Ciencias Emergentes de la Universidad Politécnica Estatal de California, San Luis Obispo.

Ahora cualquiera puede usar poderosas herramientas de inteligencia artificial para crear imágenes.  ¿Qué podría salir mal?

Estos sistemas también tienen el potencial de usarse con fines nefastos, como avivar el miedo o difundir desinformación a través de imágenes que se alteran con IA o se fabrican por completo.

Hay algunos límites para las imágenes que los usuarios pueden generar. Por ejemplo, OpenAI hace que los usuarios de DALL-E 2 acepten una política de contenido que les dice que no intenten hacer, cargar o compartir imágenes «que no tengan clasificación G o que puedan causar daño». DALL-E 2 tampoco ejecutará avisos que incluyan ciertas palabras prohibidas. Pero manipular la verborrea puede sortear los límites: DALL-E 2 no procesará el mensaje «una foto de un pato cubierto de sangre», pero devolverá imágenes para el mensaje «una foto de un pato cubierto de un líquido rojo viscoso». ” OpenAI mismo mencionó este tipo de «sinónimo visual» en su documentación para DALL-E 2.

Chris Gilliard, miembro de Just Tech en el Consejo de Investigación de Ciencias Sociales, cree que las empresas detrás de estos generadores de imágenes están «subestimando gravemente» la «creatividad infinita» de las personas que buscan hacer algo malo con estas herramientas.

“Siento que este es otro ejemplo más de personas que lanzan tecnología que está medio cocida en términos de averiguar cómo se usará para causar caos y crear daño”, dijo. “Y luego con la esperanza de que más adelante tal vez haya alguna forma de abordar esos daños”.

Para eludir posibles problemas, algunos servicios de imágenes de archivo están prohibiendo las imágenes de IA por completo. Getty Images confirmó a CNN Business el miércoles que no aceptará envíos de imágenes que se crearon con modelos generativos de IA y eliminará cualquier envío que use esos modelos. Esta decisión se aplica a sus servicios de imágenes Getty Images, iStock y Unsplash.

“Hay preguntas abiertas con respecto a los derechos de autor de los resultados de estos modelos y hay problemas de derechos no abordados con respecto a las imágenes subyacentes y los metadatos utilizados para entrenar estos modelos”, dijo la compañía en un comunicado.

Pero en realidad capturar y restringir estas imágenes podría resultar un desafío.