Análise de cesta: cross-selling para varejo — Estat Júnior

Quando o assunto é cross-selling para o varejo, é comum trazer à memória o caso do supermercado americano que, ao verificar a saída conjunta de fraldas e cervejas, aproximou os dois itens para impulsionar suas vendas ainda mais.

Por mais clássico que este exemplo seja, ele não está fora da realidade de super e hipermercados brasileiros. É sim possível conduzir uma análise desta a fim de otimizar as vendas de produtos em conjunto e potencializar promoções.

Neste texto vamos explicar como funciona esse procedimento, aplicando-o a um banco de dados real disponível no kaggle com cerca de 130 mil observações.

De maneira geral, essa análise é dividida em em três partes:

1. Seleção e tratamento dos dados;

Nesta etapa temos que escolher qual é o período que queremos estudar, já que o perfil de compra muda de acordo com os dias da semana e com o período do mês, mas isso não significa que analisar períodos longos seja uma má ideia. Tudo depende do que precisa ser estudado.

Feita a escolha, uma etapa computacional requer que os dados sejam transformados de forma que possibilite a aplicação correta do algoritmo.

No nosso exemplo os dados estão em duas tabelas: a primeira contém as vendas de acordo com o código dos produtos vendidos, já a segunda identifica os produtos de acordo com os códigos:

2. Aplicação do algoritmo apriori;

Com os dados selecionados e tratados, aplicamos o algoritmo apriori. Ele consiste em identificar quais são os conjuntos de produtos que mais são vendidos juntos e, ao analisar o quanto a venda de um deles está associada à venda do outro, o algoritmo identifica padrões de consumo.

Para chegar no resultado final, são analisados 3 componentes nos dados:

  • Suporte: É a proporção das vendas em que um determinado grupo de produtos aparece junto.

Ex: Proporção das vendas de um Arroz X.

  • Confiança: Entre todas as vendas de um determinado produto, a proporção das quais ele é vendido em conjunto com um determinado outro.

Ex: Proporção das vendas do Arroz X em que eu também vendi o Feijão Y.

  • Lift: Mostra o quão mais frequente é a venda de um produto quando este é vendido em conjunto com um determinado outro.

Ex: Quantas vezes mais eu vendo o Feijão Y por já estar vendendo o Arroz X, em relação a quando o Feijão Y não é vendido em conjunto com o Arroz X.

Podemos então usar estes componentes para filtrar as relações que vamos analisar. Ter um suporte muito alto nos leva a analisar somente produtos com muitas vendas, sendo provavelmente os mais essenciais; uma confiança baixa nos leva a muitas relações que podem ser muito pontuais e um lift menor que 2 não mostra uma relação tão forte entre as vendas dos produtos.

No nosso exemplo usamos um suporte mínimo de 1%, ou seja, produtos que apareçam em pelo menos em uma a cada 100 compras; confiança mínima de 30% e lift de pelo menos 2, o que significa que as relações são de produtos que são vendidos duas vezes mais quando em conjunto com algum outro.

3. Análise dos resultados

Nesta última etapa são identificadas as relações e elas são validadas junto a alguém que conheça o negócio, a fim de notar se alguma alteração no espaço deve ser feita ou alguma estratégia de vendas deve ser adotada.

Após realizar o estudo no banco de dados de exemplo, encontramos relações entre produtos orgânicos, principalmente frutas.

Visto que a nossa base de dados é muito grande e representa um padrão de consumo geral, não se pode dizer se esse caso é mais frequente em algum período do mês, da semana ou do dia, mas que os consumidores daquele estabelecimento, em geral, estão frequentemente comprando várias frutas orgânicas em conjunto e não cada uma separada.

Gostou da análise? Conheça a Estat Júnior: a empresa júnior de estatística da Unicamp. Temos diversos tipos de serviço, para empresas, pesquisadores, empreendedores e muito mais. Marque uma reunião conosco!

Texto por: Wesley Cabral

Deixe um comentário

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

WhatsApp