Um protótipo de software para mineração de dados de contas de prestadoras de serviços de telefonia
dc.contributor.advisor | Oliveira, Ivan Carlos A. de | |
dc.contributor.author | Gonçalves, Ana Julia P. | |
dc.contributor.author | Fontes, Filipe Franchini F. | |
dc.contributor.author | Diniz, Gabriel Soares | |
dc.contributor.author | Oliveira, Johnathan V. S. de | |
dc.contributor.referees | Oliveira | |
dc.date.accessioned | 2024-01-29T15:12:53Z | |
dc.date.available | 2024-01-29T15:12:53Z | |
dc.date.issued | 2023-12-08 | |
dc.description | Indicado para publicação. | |
dc.description.abstract | No atual contexto, em que a gestão de uma vasta gama de documentos, tanto físicos quanto digitais, demanda eficiência, a automação da extração de dados e sua análise torna-se relevante. Nesta linha, este trabalho propõe um protótipo de software para automatizar a extração de dados de faturas em PDF de serviços de telecomunicações, usando Reconhecimento Óptico de Caracteres (OCR) com Pytesseract e Expressões Regulares. Com a finalidade de alcançar esse objetivo, foi realizada uma revisão da literatura, seleção de tecnologias, implementação e testes. No final, foi obtido um protótipo que extrai informações de contas das operadoras Vivo, Tim e Claro, consolidando os dados em uma planilha. | |
dc.description.abstract | In the current context, where the management of a vast array of documents, both physical and digital, demands efficiency, the automation of data extraction and analysis becomes relevant. In this line of reasoning, This paper proposes a prototype to automate the extraction of data from telecommunications service invoices, using Optical Character Recognition (OCR) with Pytesseract and Regular Expressions. To achieve this goal, we conducted a literatury reviewn, technology selection, implementation, and testing.In the end,a prototype was designed that extracts information from Vivo, Tim and Claro operator consolidating the data into a spreadsheet. | |
dc.identifier.uri | https://dspace.mackenzie.br/handle/10899/33763 | |
dc.language | pt_BR | |
dc.publisher | Universidade Presbiteriana Mackenzie | |
dc.subject | automatização | |
dc.subject | extração de dados | |
dc.subject | reconhecimento Óptico de caracteres (OCR) | |
dc.subject | pytesserac | |
dc.subject | expressões regulares | |
dc.subject | faturas | |
dc.subject | operadoras | |
dc.subject | automation | |
dc.subject | data extraction | |
dc.subject | optical character recognition (OCR) | |
dc.subject | pytesseract | |
dc.subject | regular expressions | |
dc.subject | invoices | |
dc.subject | operators | |
dc.title | Um protótipo de software para mineração de dados de contas de prestadoras de serviços de telefonia | |
dc.type | TCC | |
local.publisher.department | Faculdade de Computação e Informática (FCI) |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- ANA JULIA PIMENTEL GONCALVES ._5059186_assignsubmission_file_TCCII_jonathanFelipeAnaJuliaEGabriel_vFinal.pdf
- Tamanho:
- 764.95 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 2.22 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: