Geração aumentada por recuperação aplicada à análise de vendas: comparação de categorias de produtos e períodos

dc.contributor.advisorSilva, Leandro Augusto da
dc.contributor.authorMicale, Davi Bernardes da Silva
dc.date.accessioned2025-06-30T20:19:35Z
dc.date.available2025-06-30T20:19:35Z
dc.date.issued2025-06-18
dc.descriptionIndicado para publicação.
dc.description.abstractCom o crescimento do comércio eletrônico e a necessidade de tomadas de decisão baseadas em dados, torna-se essencial o desenvolvimento de ferramentas inteligentes para análise de vendas. Neste trabalho, propõe-se uma proposta que combina técnicas de Processamento de Linguagem Natural (PLN), busca vetorial e geração automática de textos para interpretar e comparar o desempenho das vendas de produtos em diferentes períodos ou categorias. A proposta utiliza um conjunto de dados da Amazon, enriquecido manualmente com colunas de data e quantidade de vendas, permitindo o cálculo de métricas comerciais relevantes como receita estimada, ticket médio, avaliação média e percentual de desconto. Para encontrar produtos semelhantes, são gerados embeddings com o modelo all-MiniLM-L6-v2 e indexados com o banco vetorial FAISS. A partir disso, é aplicado o paradigma RAG (Retrieval-Augmented Generation), onde um modelo FLAN-T5 gera respostas textuais interpretativas com base em dados recuperados. Complementarmente, gráficos do tipo barras e pizza são utilizados para visualizar os resultados. Os testes realizados demonstram que a proposta é capaz de lidar com diferentes tipos de consultas, gerando respostas informativas e acessíveis. Como contribuição, a proposta se destaca por integrar componentes avançados de inteligêncial artificial em um fluxo coeso, demonstrando o potencial de modelos grandes de linguagem aplicados a contextos de vendas.
dc.description.abstractWith the growth of e-commerce and the need for data-driven decision-making, the development of intelligent tools for sales analysis becomes essential. This work proposes an approach that combines Natural Language Processing (NLP) techniques, vector search, and automatic text generation to interpret and compare product sales performance across different periods or categories. The proposal uses an Amazon dataset, manually enriched with date and sales quantity columns, enabling the calculation of relevant business metrics such as estimated revenue, average ticket size, average rating, and discount percentage. To find similar products, embeddings are generated using the all-MiniLM-L6-v2 model and indexed with the FAISS vector database. Based on this, the RAG (Retrieval-Augmented Generation) paradigm is applied, where a FLAN-T5 model generates interpretative textual responses based on retrieved data. Additionally, bar and pie charts are used to visualize the results. The tests conducted show that the approach is capable of handling different types of queries, generating informative and accessible responses. As a contribution, the proposal stands out for integrating advanced artificial intelligence components into a cohesive workflow, demonstrating the potential of large language models applied to sales contexts.
dc.identifier.urihttps://dspace.mackenzie.br/handle/10899/40937
dc.languagept_BR
dc.publisherUniversidade Presbiteriana Mackenzie
dc.subjectRAG
dc.subjectFAISS
dc.subjectvendas
dc.subjectlinguagem natural
dc.subjectanálise automatizada
dc.subjectembeddings
dc.subjectFLAN-T5
dc.subjectsistemas inteligentes
dc.subjectRAG
dc.subjectFAISS
dc.subjectsales
dc.subjectnatural language
dc.subjectautomated analysis
dc.subjectembeddings
dc.subjectFLAN-T5
dc.subjectintelligent systems
dc.titleGeração aumentada por recuperação aplicada à análise de vendas: comparação de categorias de produtos e períodos
dc.typeTCC
local.publisher.departmentFaculdade de Computação e Informática (FCI)
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Davi Bernardes da Silva Micale1.pdf
Tamanho:
532.25 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.22 KB
Formato:
Item-specific license agreed upon to submission
Descrição: