Modelo de síntese de fala para línguas com recursos limitados : uma investigação da quantidade de dados para garantir inteligibilidade

Carregando...
Imagem de Miniatura
Tipo
Dissertação
Data de publicação
2025-02-24
Periódico
Citações (Scopus)
Autores
Silva, Larissa Santoni
Orientador
Silva, Leandro Augusto da
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Martins, Valéria Farinazzo
Candido Junior, Arnaldo
Programa
Computação Aplicada
Resumo
Nesta dissertação de mestrado foi conduzida uma investigação com o objetivo de desenvolver um modelo de síntese de fala para línguas com recursos limitados, com o intuito de abordar a exclusão tecnológica e a falta de documentação enfrentadas por essas comunidades linguísticas. Foi proposto um modelo acessível e escalável, projetado para operar em ambientes de baixa infraestrutura e adaptável por comunida des indígenas, com vistas à preservação e revitalização de suas línguas. A pesquisa fundamentou-se na utilização de ferramentas de código aberto, como a plataforma Coqui TTS, e no ambiente computacional Google Colab Pro, que possibilitaram a execu ção dos experimentos mesmo em condições restritas. Os dados de treinamento foram escalonados em diferentes volumes, variando de 30 minutos a 6 horas de gravações, com o objetivo de avaliar a influência da quantidade de dados sobre a inteligibilidade do modelo. A metodologia foi aprimorada pela conversão de texto em fonemas, realizada com a utilização da biblioteca espeak, o que permitiu superar limitações observadas na abordagem inicial baseada no uso de caracteres. Foi validado que o uso de fone mas proporcionou uma representação mais eficaz das características fonéticas das línguas-alvo, resultando em melhorias significativas na qualidade da síntese de fala. Adicionalmente, foram realizadas validações do modelo em contextos computacionais limitados, confirmando sua viabilidade prática e sua escalabilidade para outras línguas de poucos recursos. Os resultados obtidos evidenciaram que a abordagem proposta é eficaz na democratização da tecnologia de síntese de fala, ao oferecer uma solução replicável e acessível para comunidades linguísticas marginalizadas. Foi destacada a relevância social e tecnológica que o projeto busca, ao integrar inovação, simplicidade e eficácia no enfrentamento da exclusão linguística, estabelecendo um marco para futuras pesquisas e aplicações no campo da preservação cultural. Assim, o projeto fornece uma base metodológica, por meio de um notebook para expandir iniciativas similares para outras línguas ameaçadas de extinção, reforçando seu impacto na diversidade linguística e cultural.
Descrição
Palavras-chave
síntese de fala , línguas de poucos recursos , preservação linguística , inclusão tecnológica , diversidade cultural
Assuntos Scopus
Citação