MADRID, 27 (EUROPA PRESS)
Los investigadores de la Escuela Técnica Superior de Ingenieros de Telecomunicación de la Universidad Politécnica de Madrid, en colaboración con la empresa Sigma AI, han desarrollado un sistema que utiliza los últimos avances en inteligencia artificial para eliminar la información personal de la señal de voz.
Concretamente, el sistema propuesto utiliza técnicas de aprendizaje automático mediante redes neuronales profundas (Deep Learning) para obtener una representación del habla que permita separar el contenido lingüístico de las características particulares de cada hablante, ha indicado la Universidad en un comunicado.
Además, aplican diferentes transformaciones para suprimir aquellos rasgos del hablante que se quieran proteger y, por último, se genera una voz que mantiene el contenido lingüístico original, pero excluyendo las características sensibles de la voz del hablante.
“Si la voz está debidamente anonimizada, no podría considerarse un dato personal y no habría que preocuparse por tener que conservar de forma segura un dato biométrico”, ha asegurado Luis A. Hernández, uno de los creadores del novedoso sistema.
Además, “hay que tener en cuenta que los asistentes virtuales se entrenan con un gran número de audios con locuciones de muchas personas y aquí surge el problema del almacenamiento de grabaciones de voz sin que estén debidamente anonimizadas”.
Otro ámbito importante de aplicación es la investigación, desarrollo e innovación en las diferentes tecnologías del habla, ya que estos campos necesitan disponer de grandes bases de datos con grabaciones de voz que también podrán ser protegidas y de este modo adecuarse a las exigencias del Reglamento General de Protección de Datos.
El sistema podría instalarse tanto en el dispositivo o en el propio sistema de centralita. En el escenario de los asistentes virtuales “al ser sistemas más cerrados”, ha aclarado, “lo tendría que integrar el fabricante en el software del asistente, para de esta forma eliminar el problema de conservar y tratar datos biométricos”.
Este sistema ha sido presentado en la iniciativa internacional VoicePrivacy, que reúne a los principales grupos de investigación en este campo y cuyo objetivo es impulsar el desarrollo de nuevas tecnologías que permitan suprimir información sensible del hablante, preservando el contenido lingüístico del mensaje hablado.
La solución desarrollada por la UPM y Sigma AI ha sido una de las soluciones que demostró mayor capacidad de anonimización de voz manteniendo un alto nivel en la calidad lingüística del mensaje.
- Te recomendamos -