Modelo de síntese de fala para línguas com recursos limitados : uma investigação da quantidade de dados para garantir inteligibilidade

Thumbnail Image
item.page.type
Dissertação
Date
2025-02-24
item.page.ispartof
item.page.citationsscopus
Authors
Silva, Larissa Santoni
publication.page.advisor
Silva, Leandro Augusto da
Journal Title
Journal ISSN
Volume Title
publication.page.board
Martins, Valéria Farinazzo
Candido Junior, Arnaldo
publication.page.program
Computação Aplicada
Abstract
Nesta dissertação de mestrado foi conduzida uma investigação com o objetivo de desenvolver um modelo de síntese de fala para línguas com recursos limitados, com o intuito de abordar a exclusão tecnológica e a falta de documentação enfrentadas por essas comunidades linguísticas. Foi proposto um modelo acessível e escalável, projetado para operar em ambientes de baixa infraestrutura e adaptável por comunida des indígenas, com vistas à preservação e revitalização de suas línguas. A pesquisa fundamentou-se na utilização de ferramentas de código aberto, como a plataforma Coqui TTS, e no ambiente computacional Google Colab Pro, que possibilitaram a execu ção dos experimentos mesmo em condições restritas. Os dados de treinamento foram escalonados em diferentes volumes, variando de 30 minutos a 6 horas de gravações, com o objetivo de avaliar a influência da quantidade de dados sobre a inteligibilidade do modelo. A metodologia foi aprimorada pela conversão de texto em fonemas, realizada com a utilização da biblioteca espeak, o que permitiu superar limitações observadas na abordagem inicial baseada no uso de caracteres. Foi validado que o uso de fone mas proporcionou uma representação mais eficaz das características fonéticas das línguas-alvo, resultando em melhorias significativas na qualidade da síntese de fala. Adicionalmente, foram realizadas validações do modelo em contextos computacionais limitados, confirmando sua viabilidade prática e sua escalabilidade para outras línguas de poucos recursos. Os resultados obtidos evidenciaram que a abordagem proposta é eficaz na democratização da tecnologia de síntese de fala, ao oferecer uma solução replicável e acessível para comunidades linguísticas marginalizadas. Foi destacada a relevância social e tecnológica que o projeto busca, ao integrar inovação, simplicidade e eficácia no enfrentamento da exclusão linguística, estabelecendo um marco para futuras pesquisas e aplicações no campo da preservação cultural. Assim, o projeto fornece uma base metodológica, por meio de um notebook para expandir iniciativas similares para outras línguas ameaçadas de extinção, reforçando seu impacto na diversidade linguística e cultural.
Description
Keywords
síntese de fala , línguas de poucos recursos , preservação linguística , inclusão tecnológica , diversidade cultural
item.page.scopussubject
Citation