CodeGym /Curso Java /Python SELF PT /Exportar dados filtrados e processados para o Excel

Exportar dados filtrados e processados para o Excel

Python SELF PT
Nível 28 , Lição 4
Disponível

Imagina que você é um pesquisador espacial e os dados são o seu mapa do céu estrelado. Ele é volumoso, confuso e absolutamente necessário. Depois de uma filtragem e análise cuidadosas, esses dados precisam ser organizados e salvos em um formato fácil de ler. E é aí que entra nosso herói — a exportação de dados para o Excel. Ele permite que você compartilhe suas descobertas com colegas ou prepare relatórios para uma reunião importante. No mundo onde dados são o novo petróleo, a habilidade de criar relatórios com apenas poucas linhas de código pode valer uma fortuna.

1. Aspectos principais da exportação de dados

Exportar dados para o Excel não é apenas uma questão de converter um formato em outro. É uma oportunidade de configurar os relatórios de maneira que sejam claros e confortáveis de entender. Como um amigo programador meu costumava dizer: "Python é capaz de magia, mas até o Harry Potter precisa de uma varinha." No nosso caso, a varinha é o método to_excel da biblioteca pandas.

Bases do to_excel

Vamos começar com um exemplo simples de exportar dados de um DataFrame para um arquivo Excel. Suponha que temos um DataFrame com dados sobre os participantes de uma maratona:

Python

import pandas as pd

# Criando o DataFrame
data = {
    'Nome': ['Anna', 'Boris', 'Victor', 'Galina'],
    'Idade': [29, 34, 22, 28],
    'Cidade': ['Moscou', 'São Petersburgo', 'Kazan', 'Novosibirsk'],
    'Tempo de Chegada': ['03:15:30', '03:45:10', '03:25:45', '03:50:05']
}

df = pd.DataFrame(data)

# Exportando o DataFrame para o Excel
df.to_excel('marathon_participants.xlsx', index=False)

Neste exemplo, criamos um DataFrame simples e o exportamos para o arquivo marathon_participants.xlsx. Note que configuramos o parâmetro index=False, para não exportar os índices do DataFrame para o Excel, caso eles não sejam necessários.

Adicionando Formato e Estilos

Vamos para o próximo nível — adicionar estilo. Porque quem disse que os dados não podem ser estilosos? Com a biblioteca pandas e openpyxl, é fácil formatar tabelas e adicionar estilos.

Python

import pandas as pd
from openpyxl import Workbook

# Criando o DataFrame
data = {
    'Nome': ['Anna', 'Boris', 'Victor', 'Galina'],
    'Idade': [29, 34, 22, 28],
    'Cidade': ['Moscou', 'São Petersburgo', 'Kazan', 'Novosibirsk'],
    'Tempo de Chegada': ['03:15:30', '03:45:10', '03:25:45', '03:50:05']
}

df = pd.DataFrame(data)

# Escrevendo no Excel com formatação
with pd.ExcelWriter('styled_marathon.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, index=False, sheet_name='Participantes')
    worksheet = writer.sheets['Participantes']
    for col in worksheet.columns:
        max_length = 0
        column = col[0].column_letter # obtendo a letra da coluna
        for cell in col:
            try:
                if len(str(cell.value)) > max_length:
                    max_length = len(cell.value)
            except:
                pass
        adjusted_width = (max_length + 2) * 1.2
        worksheet.column_dimensions[column].width = adjusted_width

Neste exemplo, não apenas exportamos os dados, mas ajustamos a largura das colunas de acordo com o conteúdo, para que fiquem mais organizadas no Excel. Usamos openpyxl para acessar a folha e aplicar formatação.

Trabalhando com várias folhas

Criar relatórios com várias folhas pode parecer uma missão para o Super-Homem, mas, na real, é bem tranquilo. Imagine que você deseja armazenar dados de competições anuais em folhas separadas.

Python

import pandas as pd

# Dados de diferentes anos
data_2022 = {
    'Nome': ['Dmitry', 'Elena'],
    'Idade': [30, 29],
    'Cidade': ['Omsk', 'Vladivostok'],
    'Tempo de Chegada': ['03:20:05', '03:35:40']
}

data_2023 = {
    'Nome': ['Igor', 'Katerina'],
    'Idade': [31, 27],
    'Cidade': ['Chelyabinsk', 'Yekaterinburg'],
    'Tempo de Chegada': ['03:29:10', '03:40:20']
}

df_2022 = pd.DataFrame(data_2022)
df_2023 = pd.DataFrame(data_2023)

# Escrevendo dados em diferentes folhas
with pd.ExcelWriter('marathon_data.xlsx') as writer:
    df_2022.to_excel(writer, sheet_name='2022', index=False)
    df_2023.to_excel(writer, sheet_name='2023', index=False)

Este código cria o arquivo marathon_data.xlsx com duas folhas, contendo os dados de anos diferentes. Isso é super útil para organizar dados por ano, projeto ou qualquer outra categoria.

2. Sempre há algo para melhorar

Tente pensar em como a automação da exportação pode ser integrada a processos mais complexos do seu projeto. Talvez você queira adicionar a criação automática de gráficos após a exportação? Ou integrar os relatórios ao front-end para um acesso mais fácil?

De qualquer forma, a exportação de dados para o Excel é só o começo do caminho para criar relatórios bonitos e informativos que farão de você uma estrela da análise de dados no seu trabalho ou na faculdade!

Agora você tem as ferramentas para automatizar a exportação de dados e sabe como tornar seus relatórios no Excel mais legíveis e apresentáveis. Então vá em frente, e que seus dados sempre trabalhem a seu favor!

1
Опрос
Escrita de consultas,  28 уровень,  4 лекция
недоступен
Escrita de consultas
Escrita de consultas
Comentários
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION