Inicio Empresas COMUNICADO: Un estudio de UIC Barcelona evidencia los límites actuales de la...

COMUNICADO: Un estudio de UIC Barcelona evidencia los límites actuales de la IA generativa de voz

0

(Información remitida por la empresa firmante)

La profesora de UIC Barcelona Maria Fitó-Carreras ha liderado el artículo científico “Análisis de softwares de inteligencia artificial generativa de voz aplicados al podcasting”.

El estudio demuestra las carencias que aún tienen los softwares de inteligencia artificial generativa de voz para imitar los patrones vocales de los humanos.

Barcelona, 13 de febrero de 2025.- La investigadora Maria Fitó-Carreras ha publicado el estudio en la revista Comunicación y Hombre, después del análisis de los principales softwares que utilizan los creadores de pódcast para la clonación de voz. A pesar de la rapidez con la que está avanzando la industria de la Inteligencia Artificial Generativa (IAG), no se interpreta como una amenaza inmediata debido a la reproducción de una prosodia inexacta.

El estudio ha analizado 11 softwares de IAG, divididos en tres categorías: aquellos que generan voz clonada a partir de una muestra del usuario, los que funcionan a modo de bancos de voces almacenadas y los que ofrecen una combinación de ambas funcionalidades. Paralelamente, el estudio ha recogido la percepción de 10 títulos de podcasts que utilizan habitualmente esta tecnología.

La primera conclusión es el sesgo entre los resultados proclamados por las empresas tecnológicas, que prometen una generación de voces hiperrealistas, y la percepción de los creadores, quienes opinan que la IAG de voz no produce aún productos suficientemente realistas. De hecho, destacan que la escucha de los títulos es “monótona y aburrida”, debido a la falta de “matices emocionales inherentes a la voz humana”.

Leer más:  La SETT invierte 9 millones de euros en Sensia, una empresa de tecnología infrarroja

Es el caso del boletín informativo WP a day (2032) sobre el universo de WordPress, creado por Antonio Cambronerot. Su pódcast es creado enteramente por IA, desde el guión hasta la generación de voz, gracias al software Amazon Polly. Reconoce que la voz “carece de naturalidad”, y que para lograr un proceso automático, es preciso realizar un trabajo de codificación “laborioso”. A pesar de todo, evalúa positivamente el ahorro de tiempo y la reducción de costos.

Cabe destacar que la mayoría de los podcasters amateurs o profesionales analizados en la muestra, utilizan la IAG de voz como un experimento para demostrar su potencial en el ámbito del podcasting. “La tecnología no está suficientemente desarrollada, pero en un par de años, el escenario será otro”, explica Maria Fitó, docente en UIC Barcelona y locutora de radio y doblaje.

“Entre los profesionales del sector, ya no nos sorprende cuando una empresa nos contacta para rehacer un trabajo que la IAG no ha hecho correctamente”, añade Fitó. “Una de las opiniones compartidas entre los creadores de los títulos que figuran en el estudio, es el tiempo que pierden clonando y editando las voces”, apunta. Es el caso del podcast Joe Rogan AI Experience (2023), que usa voces clonadas para el presentador y los invitados. El creador admite que las voces “presentan problemas de cadencia, lo que obliga a añadir muletillas como “ah” o “um” para transmitir un proceso de pensamiento genuino y escalonado, es decir, para que suene como una conversación humana normal”.

Leer más:  OpenAI cancela o3 e integrará su tecnología en GPT-5 como parte de la unificación de sus familias de modelos de IA

Mientras la IA avanza de la mano de las grandes tecnológicas, la Unión Europea aprobó en junio de 2024 la primera Ley sobre IA en todo el mundo, que busca un marco jurídico para “fomentar una IA fiable en toda Europa y garantizar los derechos fundamentales de los ciudadanos”. “¿Qué pasa con el resto de las IA del mundo? Pocos productos indican hoy en día que están creados con Inteligencia Artificial”, recuerda Maria Fitó. “Son muchos los compañeros que ya han podido escuchar sus voces clonadas sin su consentimiento y se comercializan en softwares en la India, por ejemplo”, añade.

La autora del artículo avisa del peligro que la IAG supone para las nuevas generaciones. “Los más jóvenes llegarán a normalizar las voces de la IA, los estándares irán bajando”, advierte. A pesar de todo, Maria Fitó trata de ver el lado positivo a la irrupción de la IA: “Espero que valoremos mucho más las relaciones humanas; poder hablar con personas de verdad y escucharlas”, concluye.

Esta información se extrae del artículo académico “Análisis de softwares de inteligencia artificial generativa de voz aplicados al podcasting”, elaborado por la investigadora Maria Fitó-Carreras de UIC Barcelona, con la colaboración de la investigadora Montserrat Vidal Mestre de la Universitat Autònoma de Barcelona y el investigador Alfonso Freire Sánchez de la Universidad Abat Oliba CEU, publicado en la edición Número 21 de la revista científica Comunicación y Hombre.

Leer más:  Solaria consigue la aprobación para la viabilidad del acceso y conexión de 213 MW para 'data centers' en Madrid

Para profundizar en la temática y poder hablar con la experta, diríjanse a:.

Àlex Sánchez Aragón.

Responsable de Comunicación UIC Barcelona.

93 254 18 00 | 638 59 95 64 | asanchezara@uic.es.

Immaculada, 22, 08017 Barcelona | www.uic.es.

Sobre UIC Barcelona.

La Universitat Internacional de Catalunya (UIC Barcelona) es una universidad privada sin ánimo de lucro, fundada en 1997 con el compromiso de impactar en la sociedad.

Nuestra misión es formar a personas que contribuyan a humanizar la transformación de la sociedad a través de la excelencia profesional, la búsqueda de impacto, la integridad y el compromiso social.

Impartimos dieciséis grados, más de cuarenta dobles titulaciones internacionales y un amplio programa de másteres y posgrados a una comunidad de unos 9.000 alumnos.

Disponemos de ocho facultades ubicadas en dos campus, situados en Barcelona y Sant Cugat del Vallès. Creemos en la formación a lo largo de toda la vida y contamos con un campus para mayores: el Campus de la Experiencia.

Ofrecemos atención personalizada, enfoque integral centrado en cada alumno, conexión profesional constante e innovación en los métodos de docencia e investigación. Tenemos un marcado carácter internacional y en nuestros campus conviven personas de más de un centenar de nacionalidades. Estamos conectados con la sociedad y las empresas a través de quince cátedras y cinco aulas de empresa, cinco institutos de investigación y tres clínicas universitarias.

Somos una universidad humanista, sostenible, innovadora y global, y estamos posicionados en los principales rankings nacionales e internacionales.


- Te recomendamos -