Pandas - Curso de Python
Visualização no pandas
Análise das vendas
Métodos para analisar nossas tabelas (dataframes), usando plot de gráfico padrões do pandas.
O pandas usa o matplotlib para plotar gráficos.
Se quiser personalizar mais do que o padrão do pandas, importe o matplotlib e use os métodos do matplotlib.
- Preparando as bases de dados.
- Lembrando que a base de dados usadas estava na mesma pasta do arquivo pandas.
import pandas as pd
#importando os arquivos
vendas_df = pd.read_csv(r'Contoso - Vendas - 2017.csv', sep=';')
produtos_df = pd.read_csv(r'Contoso - Cadastro Produtos.csv', sep=';')
lojas_df = pd.read_csv(r'Contoso - Lojas.csv', sep=';')
clientes_df = pd.read_csv(r'Contoso - Clientes.csv', sep=';')
#limpando apenas as colunas que queremos
clientes_df = clientes_df[['ID Cliente', 'E-mail']]
produtos_df = produtos_df[['ID Produto', 'Nome do Produto']]
lojas_df = lojas_df[['ID Loja', 'Nome da Loja']]
#mesclando e renomeando os dataframes
vendas_df = vendas_df.merge(produtos_df, on='ID Produto')
vendas_df = vendas_df.merge(lojas_df, on='ID Loja')
vendas_df = vendas_df.merge(clientes_df, on='ID Cliente').rename(columns={'E-mail': 'E-mail do Cliente'})
display(vendas_df)
O Comando diplay é usado para mostrar os dados em formato de tabela, para faciliar a vizualização.
Qual cliente que comprou mais vezes?
- Usamos o método .value_counts() para contar quantas vezes cada valor do Dataframe aparece
- Usamos o método .plot() para exibir um gráfico
frequencia_clientes = vendas_df['E-mail do Cliente'].value_counts()
display(frequencia_clientes)
frequencia_clientes[:5].plot(figsize=(15,5))
Qual a Loja que mais vendeu?
- Usamos o .groupby para agrupar o nosso dataframe, de acordo com o que queremos (somando as quantidades de vendas, por exemplo)
vendas_lojas = vendas_df.groupby('Nome da Loja').sum()
vendas_lojas = vendas_lojas[['Quantidade Vendida']]
display(vendas_lojas)
#pegando o maior valor e se índice
maior_valor = vendas_lojas['Quantidade Vendida'].max()
melhor_valor = vendas_lojas['Quantidade Vendida'].idxmax()
print(melhor_valor, maior_valor)
Loja: Contoso Catalog Valor de vendas R$ 1029117