Tendencias:
Voice Enginer

Voice Engine: lo nuevo de OpenAI que puede clonar voces humanas 

03/04/2024
Número de visualizaciones

OpenAI continua su carrera por dominar el panorama de la inteligencia artificial. Después de crear ChatGPT, una IA que funciona con texto; DALL-E, con imágenes; y Sora, con vídeo; llega, Voice Engine, la nueva herramienta para clonar voces humanas en cuestión de segundos. Sí, como lees, solo necesita una muestra de 15 segundos y un poco de texto para hacer magia.

La empresa tecnológica todavía no ha querido lanzar este producto al público. Y es que conlleva una serie de beneficios, pero también de peligros. En manos de las personas equivocadas, Voice Engine puede ser usado para completar estafas. Así, OpenAI tiene grandes desafíos por delante.

¿Qué sabemos de esta inteligencia artificial? ¡Vamos a verlo en INESEM!

¿En qué consiste la nueva IA de OpenAI?

Como hemos mencionado en la anterior introducción, Voice Engine, creada por OpenAI, será capaz de generar voces humanas totalmente idénticas a las reales. La compañía liderada por Sam Altman señaló que podrá hacerlo a partir de una muestra de 15 segundos. Después, tendremos el texto que le hemos proporcionado con la voz que queremos.

Es verdad que no es la primera vez que esta empresa tecnológica realiza pruebas con la voz. Y es que lo han usado para generar la voz de su API de texto a voz, por ejemplo. Por otro lado, también lo han usado para crear la voz de ChatGPT en las aplicaciones móviles. Por ello, no se trata de algo nuevo, sino de algo a lo que han puesto nombre.

Por el momento, a Voice Engine únicamente han podido acceder unas pocas empresas. El listado se puede enumerar, ya que realmente son pocas: la empresa de tecnología educativa Age of Learning, la plataforma de narración visual HeyGen, el fabricante de software de salud Dimagi, el creador de aplicaciones de comunicación de inteligencia artificial Livox y el sistema de salud Lifespan.

Usos positivos de la nueva IA de OpenAI

OpenAI está haciendo un gran esfuerzo por hacer ver todas las ventajas que tiene esta nueva inteligencia artificial. Que una aplicación pueda clonar nuestra voz en segundos nos aterra. ¿Cómo le vamos a encontrar el lado positivo? Esta será una tarea difícil para la tecnológica, que ya publicó ejemplos en sus canales.

Por ejemplo, uno de los principales usos es servir como asistente de lectura para los más pequeños o para las personas que no saben leer. En este caso, puede servir para completar la lectura con la ayuda de una voz más natural y simpática que un simple bot. Sin duda alguna, se trata de un uso beneficioso.

El principal uso contiene una gran ventaja: rompe cualquier barrera idiomática. Voice Engine será capaz de traducir y doblar a cualquier idioma un texto con tu voz, es decir, que conservará su acento. Por ejemplo, si decides traducir un texto en inglés al español con una voz anglosajona, el audio en español tendrá ese acento.

Un uso ligado al ámbito sanitario es que puede usar en personas con problemas de habla. Imagina una persona que ha perdido la fluidez en el habla debido a un tumor cerebral. Pues bien, a partir de un vídeo anterior en el que hable durante 15 segundos, puede comenzar a comunicarse con su misma voz de por vida. Sin duda alguna, muy beneficioso para miles de personas.

Los peligros de Voice Engine, la IA que puede clonar voces humanas

OpenAI es consciente que, como con el resto de las herramientas de inteligencia artificial, Voice Engine puede ser usado para hacer mucho daño. Y es que con esta app tan solo se necesita una historia de Instagram para clonar la voz de una persona. Con la voz, ya pueden suplantar tu identidad o fabricar una deepfake.

Es por ello por lo que OpenAI ha decidido no difundir la herramienta en este momento. Debemos saber que se trata de un año electoral en Estados Unidos y, con esta inteligencia artificial, muchos llamarían a otras personas con la voz de los candidatos. Las campañas serían bastante peligrosas.

Entre las principales medidas que van a incorporar, podemos encontrar la inclusión de marcas de agua para saber el origen de un audio generado por Voice Engine. Así, si nos pasan un supuesto audio de un famoso, podremos saber si es real o se trata de una creación de la inteligencia artificial.

Los creadores de contenido, los más beneficiados por Voice Engine

Los creadores de contenido pueden convertirse en los principales beneficiados de esta inteligencia artificial. Y es que, por ejemplo, un influencer puede arrancar un pódcast en su idioma, pero va a ser incapaz de replicarlo en todos los idiomas. Ahora, con esta tecnología, podrá traducirlo con su voz y acento a cualquier idioma.

Las barreras idiomáticas se eliminan con la llegada de Voice Engine. De igual manera, para los consumidores se abre una ola de contenido totalmente nuevo que poder disfrutar. Los mejores pódcast anglosajones ya no serán ningún obstáculo. Podrás aprender de los mejores del mundo sin la barrera del idioma.

La inteligencia artificial está aterrizando en nuestras vidas para quedarse. Por ello, debes tener los conocimientos necesarios para sacarle el mayor partido posible. ¿Y qué mejor manera que formándote de la mano de los mejores? En INESEM contamos con distintas formaciones que te colocarán en el escenario laboral de la inteligencia artificial.

¿A qué estás esperando? Aprovecha nuestras becas y facilidades de pago. Ródeate de un claustro académico potente e impulsa tu carrera profesional.

Categorizado en: Gestión Empresarial

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Descubre nuestro contenido más actualizado en TERRITORIO INESEM

PRÓXIMOS EVENTOS

Blockchain y el Futuro de las Monedas Digitales

Blockchain y el Futuro de las Monedas Digitales

Fernando Molina
45 minutos
29/04/2024 17:00
Universidades colaboradoras
La universidad Antonio de Nebrija es Universidad colaboradora con INESEM Business School La universidad a Distancia de Madrid es Universidad colaboradora con INESEM Business School