Geração aumentada por recuperação aplicada à análise de vendas: comparação de categorias de produtos e períodos

Carregando...
Imagem de Miniatura
Tipo
TCC
Data de publicação
2025-06-18
Periódico
Citações (Scopus)
Autores
Micale, Davi Bernardes da Silva
Orientador
Silva, Leandro Augusto da
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Programa
Resumo
Com o crescimento do comércio eletrônico e a necessidade de tomadas de decisão baseadas em dados, torna-se essencial o desenvolvimento de ferramentas inteligentes para análise de vendas. Neste trabalho, propõe-se uma proposta que combina técnicas de Processamento de Linguagem Natural (PLN), busca vetorial e geração automática de textos para interpretar e comparar o desempenho das vendas de produtos em diferentes períodos ou categorias. A proposta utiliza um conjunto de dados da Amazon, enriquecido manualmente com colunas de data e quantidade de vendas, permitindo o cálculo de métricas comerciais relevantes como receita estimada, ticket médio, avaliação média e percentual de desconto. Para encontrar produtos semelhantes, são gerados embeddings com o modelo all-MiniLM-L6-v2 e indexados com o banco vetorial FAISS. A partir disso, é aplicado o paradigma RAG (Retrieval-Augmented Generation), onde um modelo FLAN-T5 gera respostas textuais interpretativas com base em dados recuperados. Complementarmente, gráficos do tipo barras e pizza são utilizados para visualizar os resultados. Os testes realizados demonstram que a proposta é capaz de lidar com diferentes tipos de consultas, gerando respostas informativas e acessíveis. Como contribuição, a proposta se destaca por integrar componentes avançados de inteligêncial artificial em um fluxo coeso, demonstrando o potencial de modelos grandes de linguagem aplicados a contextos de vendas.
With the growth of e-commerce and the need for data-driven decision-making, the development of intelligent tools for sales analysis becomes essential. This work proposes an approach that combines Natural Language Processing (NLP) techniques, vector search, and automatic text generation to interpret and compare product sales performance across different periods or categories. The proposal uses an Amazon dataset, manually enriched with date and sales quantity columns, enabling the calculation of relevant business metrics such as estimated revenue, average ticket size, average rating, and discount percentage. To find similar products, embeddings are generated using the all-MiniLM-L6-v2 model and indexed with the FAISS vector database. Based on this, the RAG (Retrieval-Augmented Generation) paradigm is applied, where a FLAN-T5 model generates interpretative textual responses based on retrieved data. Additionally, bar and pie charts are used to visualize the results. The tests conducted show that the approach is capable of handling different types of queries, generating informative and accessible responses. As a contribution, the proposal stands out for integrating advanced artificial intelligence components into a cohesive workflow, demonstrating the potential of large language models applied to sales contexts.
Descrição
Indicado para publicação.
Palavras-chave
RAG , FAISS , vendas , linguagem natural , análise automatizada , embeddings , FLAN-T5 , sistemas inteligentes , RAG , FAISS , sales , natural language , automated analysis , embeddings , FLAN-T5 , intelligent systems
Assuntos Scopus
Citação