Mié. Nov 20th, 2024

La actriz estadounidense rechazó una oferta de OpenAI para prestar su voz para ChatGPT, pero poco después descubrió que sonaba muy parecida a la suya

Scarlett Johansson

OpenAI dijo eque planea detener el uso de una de sus voces ChatGPT que, según la actriz de “Her”, Scarlett Johansson, suena “inquietantemente similar” a la suya.

En una publicación en la plataforma de redes sociales X, OpenAI dijo que está “trabajando para pausar” Sky, el nombre de una de las cinco voces con las que los usuarios de ChatGPT pueden elegir hablar. La compañía dijo que había “escuchado preguntas” sobre cómo selecciona las opciones de audio realistas disponibles para su chatbot insignia de inteligencia artificial, particularmente Sky, y quería abordarlas.

Entre los que plantearon preguntas se encontraba Johansson, quien dio voz a una asistente de inteligencia artificial ficticia y en ese momento futurista en la película de 2013 “Her”.

Johansson emitió un comunicado diciendo que el director ejecutivo de OpenAI, Sam Altman, se había acercado a ella en septiembre para preguntarle si prestaría su voz al sistema, diciendo que sentía que sería “reconfortante para las personas” que no se sentían cómodas con la tecnología. Ella dijo que rechazó la oferta.

Cuando escuché la demostración publicada, me sorprendió, me enojó y me sentí incrédula de que el señor Altman persiguiera una voz que sonaba tan inquietantemente similar a la mía que mis amigos más cercanos y los medios de comunicación no podían notar la diferencia“, dijo Johansson.

Dijo que OpenAI aceptó “a regañadientes” eliminar la voz de Sky después de que contrató a abogados que escribieron cartas a Altman preguntando sobre el proceso mediante el cual la compañía creó la voz.

OpenAI había tomado medidas para desacreditar las teorías de Internet sobre Johansson en una publicación de blog que acompañaba a su anuncio anterior destinada a detallar cómo se eligieron las voces de ChatGPT. La compañía escribió que creía que las voces de IA “no deberían imitar deliberadamente la voz distintiva de una celebridad” y que la voz de Sky pertenece a una “actriz profesional diferente”. Pero añadió que no podía compartir el nombre de ese profesional por motivos de privacidad.

En un comunicado enviado a The Associated Press luego de la respuesta de Johansson el lunes por la noche, Altman dijo que OpenAI eligió al actor de doblaje detrás de Sky “antes de cualquier contacto” con Johansson.

“La voz de Sky no es la de Scarlett Johansson y nunca tuvo la intención de parecerse a la de ella”, dijo Altman. “Por respeto a la señora Johansson, hemos dejado de utilizar la voz de Sky en nuestros productos. Lamentamos mucho, señora Johansson, que no nos hayamos comunicado mejor”.

OpenAI, con sede en San Francisco, lanzó por primera vez capacidades de voz para ChatGPT, que incluían cinco voces diferentes, en septiembre, lo que permitió a los usuarios entablar conversaciones con el asistente de IA. El “Modo de voz” originalmente solo estaba disponible para suscriptores pagos, pero en noviembre, OpenAI anunció que la función sería gratuita para todos los usuarios de la aplicación móvil.

Y las interacciones de ChatGPT son cada vez más sofisticadas. La semana pasada, OpenAI dijo que la última actualización de su modelo de IA generativa puede imitar las cadencias humanas en sus respuestas verbales e incluso puede intentar detectar el estado de ánimo de las personas.

OpenAI dice que el modelo más nuevo, denominado GPT-4o, funciona más rápido que las versiones anteriores y puede razonar a través de texto, audio y video en tiempo real. En una demostración durante el anuncio de OpenAI el 13 de mayo, el robot de IA conversó en tiempo real, agregando emoción (específicamente “más dramatismo”) a su voz según lo solicitado. También intentó extrapolar el estado emocional de una persona al mirar un video de selfie de su rostro, con la ayuda de traducciones de idiomas, problemas matemáticos paso a paso y más.

GPT-4o, abreviatura de “omni”, aún no está ampliamente disponible. Llegará progresivamente a usuarios seleccionados en las próximas semanas y meses. Las capacidades de texto e imagen del modelo ya han comenzado a implementarse y están listas para llegar incluso a algunos de aquellos que usan el nivel gratuito de ChatGPT, pero el nuevo modo de voz solo estará disponible para suscriptores pagos de ChatGPT Plus.

Si bien la mayoría aún no tiene en sus manos estas características recientemente anunciadas, las capacidades han evocado aún más comparaciones con el romance distópico de Spike Jonze, “Her”, que sigue a un hombre introvertido (Joaquin Phoenix) que se enamora de una IA que opera sistema (Johansson), lo que lleva a muchas complicaciones.

Altman también pareció aprovechar esto: simplemente publicó la palabra “ella” en la plataforma de redes sociales X el día de la presentación de GPT-4o.

Muchos de los que reaccionaron a las demostraciones de la modelo la semana pasada también encontraron que algunas de las interacciones tenían un tono extrañamente coqueto. En un vídeo publicado por OpenAI, un ChatGPT con voz femenina felicita a un empleado de la empresa por “llevar una sudadera con capucha OpenAI”, por ejemplo, y en otro, el chatbot dice “oh, basta, me estás haciendo sonrojar” después de que le dijeran que es asombroso.

Esto ha provocado cierta conversación sobre las formas de género que los críticos dicen que las empresas de tecnología han utilizado durante mucho tiempo para desarrollar e involucrar a los asistentes de voz, que se remontan a mucho antes de que la última ola de IA generativa avanzara las capacidades de los chatbots de IA. En 2019, la organización cultural y científica de las Naciones Unidas señaló la “subordinación programada” incorporada en los asistentes predeterminados con voz femenina (como Siri de Apple o Alexa de Amazon), incluso cuando se enfrentan a insultos y acoso sexistas.

“Esto está claramente programado para alimentar el ego de los tipos”, dijo el corresponsal principal de The Daily Show, Desi Lydic, sobre GPT-4o en un segmento la semana pasada. “Realmente se nota que un hombre construyó esta tecnología”.