Um protótipo de software para mineração de dados de contas de prestadoras de serviços de telefonia

dc.contributor.advisorOliveira, Ivan Carlos A. de
dc.contributor.authorGonçalves, Ana Julia P.
dc.contributor.authorFontes, Filipe Franchini F.
dc.contributor.authorDiniz, Gabriel Soares
dc.contributor.authorOliveira, Johnathan V. S. de
dc.contributor.refereesOliveira
dc.date.accessioned2024-01-29T15:12:53Z
dc.date.available2024-01-29T15:12:53Z
dc.date.issued2023-12-08
dc.descriptionIndicado para publicação.
dc.description.abstractNo atual contexto, em que a gestão de uma vasta gama de documentos, tanto físicos quanto digitais, demanda eficiência, a automação da extração de dados e sua análise torna-se relevante. Nesta linha, este trabalho propõe um protótipo de software para automatizar a extração de dados de faturas em PDF de serviços de telecomunicações, usando Reconhecimento Óptico de Caracteres (OCR) com Pytesseract e Expressões Regulares. Com a finalidade de alcançar esse objetivo, foi realizada uma revisão da literatura, seleção de tecnologias, implementação e testes. No final, foi obtido um protótipo que extrai informações de contas das operadoras Vivo, Tim e Claro, consolidando os dados em uma planilha.
dc.description.abstractIn the current context, where the management of a vast array of documents, both physical and digital, demands efficiency, the automation of data extraction and analysis becomes relevant. In this line of reasoning, This paper proposes a prototype to automate the extraction of data from telecommunications service invoices, using Optical Character Recognition (OCR) with Pytesseract and Regular Expressions. To achieve this goal, we conducted a literatury reviewn, technology selection, implementation, and testing.In the end,a prototype was designed that extracts information from Vivo, Tim and Claro operator consolidating the data into a spreadsheet.
dc.identifier.urihttps://dspace.mackenzie.br/handle/10899/33763
dc.languagept_BR
dc.publisherUniversidade Presbiteriana Mackenzie
dc.subjectautomatização
dc.subjectextração de dados
dc.subjectreconhecimento Óptico de caracteres (OCR)
dc.subjectpytesserac
dc.subjectexpressões regulares
dc.subjectfaturas
dc.subjectoperadoras
dc.subjectautomation
dc.subjectdata extraction
dc.subjectoptical character recognition (OCR)
dc.subjectpytesseract
dc.subjectregular expressions
dc.subjectinvoices
dc.subjectoperators
dc.titleUm protótipo de software para mineração de dados de contas de prestadoras de serviços de telefonia
dc.typeTCC
local.publisher.departmentFaculdade de Computação e Informática (FCI)
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
ANA JULIA PIMENTEL GONCALVES ._5059186_assignsubmission_file_TCCII_jonathanFelipeAnaJuliaEGabriel_vFinal.pdf
Tamanho:
764.95 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.22 KB
Formato:
Item-specific license agreed upon to submission
Descrição: