CodeGym /Cours /Python SELF FR /Exporter des données filtrées et traitées vers Excel

Exporter des données filtrées et traitées vers Excel

Python SELF FR
Niveau 28 , Leçon 4
Disponible

Imagine que tu es un explorateur spatial et que les données sont ta carte du ciel étoilé. Elle est encombrante, déroutante et absolument essentielle. Après une analyse et un filtrage minutieux, ces données doivent être organisées et conservées dans un format facile à lire. C'est là que notre héros entre en jeu : l'exportation des données vers Excel. Elle te permet de partager tes découvertes avec tes collègues ou de préparer des rapports pour une réunion importante. Dans un monde où les données sont le nouveau pétrole, la capacité de créer des rapports en quelques lignes de code peut valoir une fortune.

1. Points clés de l'exportation des données

Exporter des données vers Excel, ce n'est pas juste convertir d'un format à un autre. C'est l'opportunité de configurer des rapports pour qu'ils soient pratiques et compréhensibles. Comme un programmeur que je connais disait : "Python est capable de magie, mais même Harry Potter a besoin d'une baguette." Dans ce cas, notre baguette est la méthode to_excel de la librairie pandas.

Les bases de to_excel

Commençons par un exemple simple d'exportation de données depuis un DataFrame vers un fichier Excel. Supposons que nous ayons un DataFrame contenant des données sur les participants à un marathon :

Python

import pandas as pd

# Création du DataFrame
data = {
    'Nom': ['Anna', 'Boris', 'Viktor', 'Galina'],
    'Âge': [29, 34, 22, 28],
    'Ville': ['Moscou', 'Saint-Pétersbourg', 'Kazan', 'Novossibirsk'],
    'Temps d\'arrivée': ['03:15:30', '03:45:10', '03:25:45', '03:50:05']
}

df = pd.DataFrame(data)

# Exportation du DataFrame vers Excel
df.to_excel('marathon_participants.xlsx', index=False)

Dans cet exemple, nous avons créé un DataFrame simple et l'avons exporté vers le fichier marathon_participants.xlsx. Note que nous avons défini le paramètre index=False afin de ne pas exporter les index du DataFrame si ce n'est pas nécessaire.

Ajouter du format et des styles

Passons au niveau supérieur : ajouter du style. Qui a dit que les données ne peuvent pas être élégantes ? Avec les bibliothèques pandas et openpyxl, il est facile de formater des tableaux et d'ajouter des styles.

Python

import pandas as pd
from openpyxl import Workbook

# Création du DataFrame
data = {
    'Nom': ['Anna', 'Boris', 'Viktor', 'Galina'],
    'Âge': [29, 34, 22, 28],
    'Ville': ['Moscou', 'Saint-Pétersbourg', 'Kazan', 'Novossibirsk'],
    'Temps d\'arrivée': ['03:15:30', '03:45:10', '03:25:45', '03:50:05']
}

df = pd.DataFrame(data)

# Écriture avec formatage dans Excel
with pd.ExcelWriter('styled_marathon.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, index=False, sheet_name='Participants')
    worksheet = writer.sheets['Participants']
    for col in worksheet.columns:
        max_length = 0
        column = col[0].column_letter # obtenir la lettre de la colonne
        for cell in col:
            try:
                if len(str(cell.value)) > max_length:
                    max_length = len(cell.value)
            except:
                pass
        adjusted_width = (max_length + 2) * 1.2
        worksheet.column_dimensions[column].width = adjusted_width

Dans cet exemple, nous n'exportons pas seulement des données, mais nous ajustons également la largeur des colonnes en fonction de leur contenu pour un affichage plus propre dans Excel. Nous utilisons openpyxl pour accéder à la feuille et appliquer le style.

Travailler avec plusieurs feuilles

Créer des rapports avec plusieurs feuilles peut sembler une tâche difficile, mais c'est en réalité assez simple. Imagine que tu veux stocker des données de différentes compétitions annuelles sur des feuilles séparées.

Python

import pandas as pd

# Données pour différentes années
data_2022 = {
    'Nom': ['Dmitry', 'Elena'],
    'Âge': [30, 29],
    'Ville': ['Omsk', 'Vladivostok'],
    'Temps d\'arrivée': ['03:20:05', '03:35:40']
}

data_2023 = {
    'Nom': ['Igor', 'Katerina'],
    'Âge': [31, 27],
    'Ville': ['Tcheliabinsk', 'Ekaterinbourg'],
    'Temps d\'arrivée': ['03:29:10', '03:40:20']
}

df_2022 = pd.DataFrame(data_2022)
df_2023 = pd.DataFrame(data_2023)

# Écriture des données sur plusieurs feuilles
with pd.ExcelWriter('marathon_data.xlsx') as writer:
    df_2022.to_excel(writer, sheet_name='2022', index=False)
    df_2023.to_excel(writer, sheet_name='2023', index=False)

Ce code crée un fichier marathon_data.xlsx avec deux feuilles contenant les données pour différentes années. C'est très pratique pour organiser des données par années, projets ou toute autre catégorie.

2. Il y a toujours des choses à améliorer

Réfléchis à comment l'automatisation de l'exportation peut être intégrée dans des processus plus complexes de ton projet. Peut-être souhaites-tu ajouter une création automatique de graphiques après l'exportation ? Ou intégrer des rapports dans une interface web pour un accès plus pratique ?

Quoi qu'il en soit, exporter des données vers Excel n'est que le début du chemin pour créer des rapports jolis et informatifs qui feront de toi une star de l'analyse dans ton équipe ou à l'université !

Maintenant, tu as les outils pour automatiser l'exportation de données, et tu sais comment rendre tes rapports Excel plus lisibles et présentables. Alors fonce, et que tes données travaillent pour toi !

1
Опрос
Écriture des requêtes,  28 уровень,  4 лекция
недоступен
Écriture des requêtes
Écriture des requêtes
Commentaires
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION