1. Estruturando dados para relatórios
Quando você cria um relatório, é importante não apenas apresentar um monte de dados com visual bonito, mas fazer a informação ser clara e acessível. A preparação dos dados impacta diretamente o quão rapidamente e facilmente o seu relatório será compreendido.
Tabelas dinâmicas: nossa faca suíça dos relatórios
Tabelas dinâmicas são uma maneira poderosa de resumir, agregar e apresentar dados, frequentemente usadas
para análises no Excel. No pandas, podemos criar tabelas dinâmicas facilmente usando o método
pivot_table
.
Vamos dar uma olhada em um exemplo simples.
Imagine que você tem dados sobre vendas em uma loja:
import pandas as pd
data = {
'Produto': ['Laranja', 'Maçã', 'Banana', 'Laranja', 'Banana', 'Maçã'],
'Mês': ['Janeiro', 'Janeiro', 'Janeiro', 'Fevereiro', 'Fevereiro', 'Fevereiro'],
'Vendas': [150, 200, 250, 130, 180, 210]
}
df = pd.DataFrame(data)
Para criar uma tabela dinâmica que mostre o total de vendas de cada produto por cada mês, usamos
pivot_table
.
pivot_df = df.pivot_table(values='Vendas', index='Produto', columns='Mês', aggfunc='sum')
print(pivot_df)
Esse exemplo simples demonstra como podemos agregar dados rapidamente por categorias e datas — uma base ideal para relatórios.
2. Usando métodos do pandas para preparar dados
Método pivot_table
O método pivot_table
é extremamente flexível e permite não apenas somar dados, mas também aplicar outras funções de agregação, como mean
, count
, etc.
Vamos ver como reorganizar os dados para mostrar a média de vendas:
pivot_mean_df = df.pivot_table(values='Vendas', index='Produto', columns='Mês', aggfunc='mean')
print(pivot_mean_df)
Método crosstab
O método crosstab
no pandas é semelhante às tabelas dinâmicas, mas é usado para cálculos de frequência.
Imagine que queremos contar quantas vezes cada produto foi vendido em diferentes meses:
cross_df = pd.crosstab(df['Produto'], df['Mês'])
print(cross_df)
Esse método é útil quando você precisa estudar a distribuição de dados entre categorias ou analisar a frequência de eventos.
3. Configurando a exibição de dados com índices multidimensionais
Índices multidimensionais
Sim, o pandas permite que você vá além de dados bidimensionais e use índices multidimensionais. Isso é útil para representar dados com múltiplos níveis de agregação. Por exemplo, vamos adicionar "Ano" ao nosso conjunto de dados e criar um índice multidimensional.
data['Ano'] = [2023, 2023, 2023, 2024, 2024, 2024]
df = pd.DataFrame(data)
multi_pivot_df = df.pivot_table(values='Vendas', index=['Ano', 'Produto'], columns='Mês', aggfunc='sum')
print(multi_pivot_df)
Agora nossos dados são agregados por ano e produto, tornando-os mais informativos.
4. Prática e análise
Vamos colocar em prática o que aprendemos. Exercício: preparar dados para um relatório de vendas.
Imagine que você tem os seguintes dados de vendas:
data = {
'Produto': ['Laranja', 'Laranja', 'Maçã', 'Maçã', 'Banana', 'Banana'],
'Mês': ['Janeiro', 'Fevereiro', 'Janeiro', 'Fevereiro', 'Janeiro', 'Fevereiro'],
'Ano': [2023, 2023, 2024, 2024, 2023, 2024],
'Vendas': [150, 200, 180, 220, 120, 130]
}
df = pd.DataFrame(data)
Sua tarefa é criar uma tabela dinâmica que mostre o total de vendas para cada produto por cada mês, incluindo dados totais por anos.
pivot_total_df = df.pivot_table(values='Vendas', index=['Ano', 'Produto'], columns='Mês', aggfunc='sum', margins=True, margins_name='Total')
print(pivot_total_df)
Essa linha "Total" mostrará a soma de todas as categorias, o que muitas vezes é necessário para uma visão geral completa.
5. Discussão sobre estratégias de apresentação de dados e análise
Preparar dados para relatórios usando pandas não é só matemática, mas também uma arte. Uma parte importante desse processo é escolher a maneira mais informativa de apresentar os dados, seja com tabelas simples ou gráficos complexos. Na vida real, esse tipo de estruturação ajuda não só a entender métricas atuais, mas também a tomar decisões informadas. Você provavelmente se verá no papel de um mago, transformando fileiras entediantes de números em uma imagem clara.
Se você quer se tornar mestre na preparação automatizada de relatórios, não se esqueça das possibilidades do pandas e não tenha preguiça de experimentar diferentes métodos e técnicas. Essa habilidade será útil não apenas na criação de resumos analíticos, mas também em entrevistas de emprego e na sua futura carreira. Mergulhe sem medo no mundo dos dados e torne seus relatórios coloridos, informativos e fáceis de entender!
GO TO FULL VERSION