Um estudo sobre tecnologia orientada a dados nas empresas: uma aplicação em um caso real sobre segmentação de análise de preços de venda de gás liquefeito de petróleo baseada em modelos de machine learning suportados por um data lakehouse
dc.contributor.advisor | Vallim Filho, Arnaldo de Aguiar R. | |
dc.contributor.author | Gamba, Walter Pelissari | |
dc.date.accessioned | 2024-10-23T21:13:06Z | |
dc.date.available | 2024-10-23T21:13:06Z | |
dc.date.issued | 2024-08-28 | |
dc.description.abstract | Objetivo: O presente trabalho teve como objetivo evidenciar um processo técnico decisório que pode ser usado para gestão e decisão de preços, usando tecnologia para análise e testes com ferramentas de Machine Learning em bases de dados de preços praticados por Revendedores de botijões de 13kg de GLP (Gás Liquefeito de Petróleo) ao consumidor final, oriundos de uma pesquisa gerada pela ANP (Agência Nacional de Petróleo), mesclando os dados com informações disponíveis no IBGE dos municípios citados na pesquisa. Metodologia/Abordagem: O trabalho tem natureza aplicada e intervencionista, com uma abordagem quantitativa, baseado no conceito do CAR (Canonical Action Research). Resultados: Foram realizados testes com os dados usando técnicas de Machine Learning, sendo 5 testes com algoritmos de clusterização e 1 teste com decision tree. Os resultados mostraram que, dadas diversas dimensões do banco de dados coletado, algumas dessas dimensões se mostraram relevantes para o resultado dos testes, sendo (i) volume de botijões consumidos, (ii) PIB per capita por Município e a (III) classe de revenda (capacidade de armazenagem de botijões dos revendedores). No teste de decision tree, principalmente a dimensão preço do produtor (preço que o produtor pratica na média em determinada UF) se mostrou relevante. Implicações práticas: O processo técnico decisório descrito nesse trabalho pode ser aplicado em decisões de segmentação de preços, mesmo em produtos diferentes, desde que o passo a passo seja seguido e sejam replicados os testes com os parâmetros utilizados. Originalidade: A base de dados de preços ao consumidor final utilizada foi mesclada com de volumes consumidos, de capacidade de armazenagem das revendas e de dados socioeconômicos dos Municípios publicados pelo IBGE. Não há registros em trabalhos acadêmicos de testes feitos com essas dimensões de dados. Contribuições: Foram encontrados nos testes de clusterização e arvore de decisão dimensões relevantes na base de dados, além disso o trabalho fez uma revisão de literatura da evolução dos processos de dados, passando desde os bancos relacionais até chegar em modernas técnicas de Machine Learning usando Big Data, já que a tecnologia de dados foi utilizada nos testes. Limitações da pesquisa: Os testes realizados foram feitos com dados de preços de um produto, o que limita uma generalização, apesar das especificidades desse produto: ser um energético usado majoritariamente para cocção de alimentos e que chega em praticamente todos os municípios do pais; a pesquisa da ANP apesar de muito abrangente não capta todos os Municípios brasileiros. | |
dc.identifier.uri | https://dspace.mackenzie.br/handle/10899/39643 | |
dc.language.iso | pt_BR | |
dc.publisher | Universidade Presbiteriana Mackenzie | |
dc.publisher.country | Brasil | |
dc.publisher.initials | UPM | |
dc.subject | strategic management accounting | |
dc.subject | armazenagem de dados | |
dc.title | Um estudo sobre tecnologia orientada a dados nas empresas: uma aplicação em um caso real sobre segmentação de análise de preços de venda de gás liquefeito de petróleo baseada em modelos de machine learning suportados por um data lakehouse | |
dc.type | Dissertação | |
local.contributor.authorLattes | http://lattes.cnpq.br/0395393814490859 | |
local.contributor.board1 | Saramelli, Alexandre | |
local.contributor.board1Lattes | http://lattes.cnpq.br/3785750027455127 | |
local.contributor.board2 | Yoshikuni, Adilson Carlos | |
local.contributor.board2Lattes | http://lattes.cnpq.br/6436446845747176 | |
local.contributor.coadvisor | Yoshikuni, Adilson Carlos | |
local.contributor.coadvisorLattes | http://lattes.cnpq.br/6436446845747176 | |
local.description.abstracten | Objective: The present work aimed to highlight a technical decision-making process that can be used for price management and decisions, using technology for analysis and testing with Machine Learning tools in databases of prices practiced by 13kg LPG cylinder resellers (Liquefied Petroleum Gas) to the final consumer, coming from a survey generated by the ANP (National Petroleum Agency), merging the data with information available at the IBGE of the municipalities mentioned in the survey. Methodology/Approach: The work is applied and interventionist in nature, with a quantitative approach, based on the concept of CAR (Canonical Action Research). Results: Tests were carried out with the data using Machine Learning techniques, 5 tests with clustering algorithms and 1 test with a decision tree. The results showed that, given several dimensions of the collected database, some of these dimensions were relevant to the results of the tests, being (i) volume of cylinders consumed, (ii) GDP per capita by Municipality and (III) class of resale (sellers’ cylinder storage capacity). In the decision tree test, mainly the producer price dimension (price that the producer charges on average in a given UF) proved to be relevant. Practical implications: The technical decision-making process described in this work can be applied to price segmentation decisions, even across different products, as long as the step-by-step process is followed and tests are replicated with the parts used. Originality: A database of final consumer prices used was merged with the volumes consumed, the storage capacity of resellers and the socioeconomic data of the Municipalities published by IBGE. There are no records in academic works of tests carried out with these data dimensions. Contributions: Clustering tests and decision trees relevant dimensions were found in the database, in addition the work reviewed the literature on the evolution of data processes, going from relational banks to modern Machine Learning techniques using Big Data , as data technology was used in the tests. Research limitations: The tests carried out were carried out using price data for a product, which limits generalization, despite the specificities of this product: being an energy used mainly for cooking food and reaching practically all municipalities in the country; An ANP survey, despite being very comprehensive, did not capture all Brazilian municipalities. | |
local.keywords | LPG prices | |
local.keywords | strategic management accounting | |
local.keywords | data lake | |
local.keywords | data lakehouse | |
local.keywords | machine learning | |
local.keywords | pricing | |
local.keywords | self service analytics | |
local.publisher.department | Centro de Ciências Sociais e Aplicadas (CCSA) | |
local.publisher.program | Controladoria e Finanças Empresariais | |
local.subject.cnpq | CNPQ::CIENCIAS SOCIAIS APLICADAS::ECONOMIA |