Ir directamente a la navegación principal Ir directamente a la búsqueda Ir directamente al contenido principal

Análisis de softwares de inteligencia artificial generativa de voz aplicados al podcasting

Maria Fitó-Carreras, Montserrat Vidal-Mestre*, Alfonso Freire-Sánchez

*Autor correspondiente de este trabajo

Producción científica: Contribución a una revistaArtículoInvestigaciónrevisión exhaustiva

4 Descargas (Pure)

Resumen

La inteligencia artificial generativa (IAG) de voz es capaz de generar mensajes en lenguaje humano mediante algoritmos de aprendizaje profundo, como las redes neuronales convolucionales (CNN), que aprenden a imitar los patrones vocales a partir de datos de habla. Ante este contexto, el principal objetivo es ofrecer una radiografía de la IAG de voz aplicada al podcasting para responder si la actual oferta tecno-lógica representa una amenaza para los empleos de los profesionales del audio, en particular para los/as locutores/as. Con este fin, se analizan los principales softwares que emplean los creadores de pódcast para la clonación de voz y se establece un marco comparativo. En segundo lugar, se recopilan las percepciones de los creadores acerca de los resultados obtenidos mediante el análisis de 10 títulos. Los principales softwares ofrecen herramientas específicas, que pueden mejorar el flujo de trabajo y optimizar los costes de producción. Gracias a los resultados sobre el estado actual de la IAG de voz aplicada al podcasting, hemos identificado tanto las oportunidades como las limitaciones que esta tecnología ofrece a los creadores. Se observa que la industria de la IAG de voz está adaptándose a las necesidades del sector, ofreciendo múltiples herramientas a través de plataformas especializadas que permiten clonar la voz, editar grabaciones, publicar pódcast y distribuirlos en varios idiomas. Sin embargo, no se interpreta como una amenaza inmediata debido a la reproducción de una prosodia inexacta y la ausencia de elementos paralingüísticos.
Título traducido de la contribuciónAnalysis of voice-generative artificial intelligence software applied to podcasting
Idioma originalMúltiples idiomas
Páginas (desde-hasta)179 - 196
Número de páginas18
PublicaciónComunicación y Hombre
N.º21
DOI
EstadoPublicada - 24 ene 2025

Palabras clave

  • inteligencia artificial generativa
  • voz sintética
  • podcasting
  • automatización
  • prosodia
  • generative artificial intelligence
  • synthetic voice
  • automation
  • prosody

Huella

Profundice en los temas de investigación de 'Análisis de softwares de inteligencia artificial generativa de voz aplicados al podcasting'. En conjunto forman una huella única.

Citar esto