Um protótipo de software para mineração de dados de contas de prestadoras de serviços de telefonia

Carregando...
Imagem de Miniatura
Tipo
TCC
Data de publicação
2023-12-08
Periódico
Citações (Scopus)
Autores
Gonçalves, Ana Julia P.
Fontes, Filipe Franchini F.
Diniz, Gabriel Soares
Oliveira, Johnathan V. S. de
Orientador
Oliveira, Ivan Carlos A. de
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Programa
Resumo
No atual contexto, em que a gestão de uma vasta gama de documentos, tanto físicos quanto digitais, demanda eficiência, a automação da extração de dados e sua análise torna-se relevante. Nesta linha, este trabalho propõe um protótipo de software para automatizar a extração de dados de faturas em PDF de serviços de telecomunicações, usando Reconhecimento Óptico de Caracteres (OCR) com Pytesseract e Expressões Regulares. Com a finalidade de alcançar esse objetivo, foi realizada uma revisão da literatura, seleção de tecnologias, implementação e testes. No final, foi obtido um protótipo que extrai informações de contas das operadoras Vivo, Tim e Claro, consolidando os dados em uma planilha.
In the current context, where the management of a vast array of documents, both physical and digital, demands efficiency, the automation of data extraction and analysis becomes relevant. In this line of reasoning, This paper proposes a prototype to automate the extraction of data from telecommunications service invoices, using Optical Character Recognition (OCR) with Pytesseract and Regular Expressions. To achieve this goal, we conducted a literatury reviewn, technology selection, implementation, and testing.In the end,a prototype was designed that extracts information from Vivo, Tim and Claro operator consolidating the data into a spreadsheet.
Descrição
Indicado para publicação.
Palavras-chave
automatização , extração de dados , reconhecimento Óptico de caracteres (OCR) , pytesserac , expressões regulares , faturas , operadoras , automation , data extraction , optical character recognition (OCR) , pytesseract , regular expressions , invoices , operators
Assuntos Scopus
Citação