Geração aumentada por recuperação aplicada à análise de vendas: comparação de categorias de produtos e períodos
Carregando...
Tipo
TCC
Data de publicação
2025-06-18
Periódico
Citações (Scopus)
Autores
Micale, Davi Bernardes da Silva
Orientador
Silva, Leandro Augusto da
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Programa
Resumo
Com o crescimento do comércio eletrônico e a necessidade de tomadas de decisão
baseadas em dados, torna-se essencial o desenvolvimento de ferramentas inteligentes
para análise de vendas. Neste trabalho, propõe-se uma proposta que combina técnicas
de Processamento de Linguagem Natural (PLN), busca vetorial e geração automática
de textos para interpretar e comparar o desempenho das vendas de produtos em diferentes
períodos ou categorias. A proposta utiliza um conjunto de dados da Amazon,
enriquecido manualmente com colunas de data e quantidade de vendas, permitindo o
cálculo de métricas comerciais relevantes como receita estimada, ticket médio, avaliação
média e percentual de desconto. Para encontrar produtos semelhantes, são gerados
embeddings com o modelo all-MiniLM-L6-v2 e indexados com o banco vetorial FAISS.
A partir disso, é aplicado o paradigma RAG (Retrieval-Augmented Generation), onde
um modelo FLAN-T5 gera respostas textuais interpretativas com base em dados recuperados.
Complementarmente, gráficos do tipo barras e pizza são utilizados para
visualizar os resultados. Os testes realizados demonstram que a proposta é capaz de
lidar com diferentes tipos de consultas, gerando respostas informativas e acessíveis.
Como contribuição, a proposta se destaca por integrar componentes avançados de
inteligêncial artificial em um fluxo coeso, demonstrando o potencial de modelos grandes
de linguagem aplicados a contextos de vendas.
With the growth of e-commerce and the need for data-driven decision-making, the development of intelligent tools for sales analysis becomes essential. This work proposes an approach that combines Natural Language Processing (NLP) techniques, vector search, and automatic text generation to interpret and compare product sales performance across different periods or categories. The proposal uses an Amazon dataset, manually enriched with date and sales quantity columns, enabling the calculation of relevant business metrics such as estimated revenue, average ticket size, average rating, and discount percentage. To find similar products, embeddings are generated using the all-MiniLM-L6-v2 model and indexed with the FAISS vector database. Based on this, the RAG (Retrieval-Augmented Generation) paradigm is applied, where a FLAN-T5 model generates interpretative textual responses based on retrieved data. Additionally, bar and pie charts are used to visualize the results. The tests conducted show that the approach is capable of handling different types of queries, generating informative and accessible responses. As a contribution, the proposal stands out for integrating advanced artificial intelligence components into a cohesive workflow, demonstrating the potential of large language models applied to sales contexts.
With the growth of e-commerce and the need for data-driven decision-making, the development of intelligent tools for sales analysis becomes essential. This work proposes an approach that combines Natural Language Processing (NLP) techniques, vector search, and automatic text generation to interpret and compare product sales performance across different periods or categories. The proposal uses an Amazon dataset, manually enriched with date and sales quantity columns, enabling the calculation of relevant business metrics such as estimated revenue, average ticket size, average rating, and discount percentage. To find similar products, embeddings are generated using the all-MiniLM-L6-v2 model and indexed with the FAISS vector database. Based on this, the RAG (Retrieval-Augmented Generation) paradigm is applied, where a FLAN-T5 model generates interpretative textual responses based on retrieved data. Additionally, bar and pie charts are used to visualize the results. The tests conducted show that the approach is capable of handling different types of queries, generating informative and accessible responses. As a contribution, the proposal stands out for integrating advanced artificial intelligence components into a cohesive workflow, demonstrating the potential of large language models applied to sales contexts.
Descrição
Indicado para publicação.
Palavras-chave
RAG , FAISS , vendas , linguagem natural , análise automatizada , embeddings , FLAN-T5 , sistemas inteligentes , RAG , FAISS , sales , natural language , automated analysis , embeddings , FLAN-T5 , intelligent systems