Pandas - Curso de Python

Visualização no pandas

Documentação do Pandas

Análise das vendas

Métodos para analisar nossas tabelas (dataframes), usando plot de gráfico padrões do pandas.

O pandas usa o matplotlib para plotar gráficos.
Se quiser personalizar mais do que o padrão do pandas, importe o matplotlib e use os métodos do matplotlib.

import pandas as pd

#importando os arquivos

vendas_df = pd.read_csv(r'Contoso - Vendas - 2017.csv', sep=';')

produtos_df = pd.read_csv(r'Contoso - Cadastro Produtos.csv', sep=';')

lojas_df = pd.read_csv(r'Contoso - Lojas.csv', sep=';')

clientes_df = pd.read_csv(r'Contoso - Clientes.csv', sep=';')

  

#limpando apenas as colunas que queremos

clientes_df = clientes_df[['ID Cliente', 'E-mail']]

produtos_df = produtos_df[['ID Produto', 'Nome do Produto']]

lojas_df = lojas_df[['ID Loja', 'Nome da Loja']]

  

#mesclando e renomeando os dataframes

vendas_df = vendas_df.merge(produtos_df, on='ID Produto')

vendas_df = vendas_df.merge(lojas_df, on='ID Loja')

vendas_df = vendas_df.merge(clientes_df, on='ID Cliente').rename(columns={'E-mail': 'E-mail do Cliente'})

display(vendas_df)

O Comando diplay é usado para mostrar os dados em formato de tabela, para faciliar a vizualização.

Qual cliente que comprou mais vezes?

frequencia_clientes = vendas_df['E-mail do Cliente'].value_counts()

display(frequencia_clientes)

frequencia_clientes[:5].plot(figsize=(15,5))

Qual a Loja que mais vendeu?

vendas_lojas = vendas_df.groupby('Nome da Loja').sum()

vendas_lojas = vendas_lojas[['Quantidade Vendida']]

display(vendas_lojas)

 #pegando o maior valor e se índice

maior_valor = vendas_lojas['Quantidade Vendida'].max()

melhor_valor = vendas_lojas['Quantidade Vendida'].idxmax()

print(melhor_valor, maior_valor)

Loja: Contoso Catalog Valor de vendas R$ 1029117