CodeGym /Java Kurs /Python SELF DE /Export von gefilterten und verarbeiteten Daten nach Excel...

Export von gefilterten und verarbeiteten Daten nach Excel

Python SELF DE
Level 28 , Lektion 4
Verfügbar

Stell dir vor, du bist ein Weltraumforscher, und Daten sind deine Sternkarten. Sie sind riesig, verwirrend und absolut notwendig. Nach sorgfältigem Filtern und Analysieren müssen diese Daten in einem leicht lesbaren Format geordnet und gespeichert werden. Und hier kommt unser Held ins Spiel: der Export von Daten nach Excel. Damit kannst du deine Erkenntnisse mit Kolleg:innen teilen oder Berichte für wichtige Meetings erstellen. In einer Welt, in der Daten das neue Öl sind, kann die Fähigkeit, Berichte mit nur ein paar Zeilen Code zu erstellen, Gold wert sein.

1. Grundlagen des Datenexports

Der Export von Daten nach Excel ist nicht nur ein simpler Formatwechsel. Es ist die Möglichkeit, Berichte so anzupassen, dass sie praktisch und verständlich sind. Wie ein befreundeter Programmierer mal sagte: "Python kann Magie, aber selbst Harry Potter braucht einen Zauberstab." Unser Zauberstab ist in diesem Fall die Methode to_excel aus der pandas-Bibliothek.

Grundlagen von to_excel

Fangen wir mit einem einfachen Beispiel an, wie man Daten aus einem DataFrame in eine Excel-Datei exportiert. Angenommen, wir haben ein DataFrame mit Daten über Marathon-Teilnehmende:

Python

import pandas as pd

# Erstelle DataFrame
data = {
    'Name': ['Anna', 'Boris', 'Viktor', 'Galina'],
    'Alter': [29, 34, 22, 28],
    'Stadt': ['Moskau', 'Sankt Petersburg', 'Kazan', 'Nowosibirsk'],
    'Zielzeit': ['03:15:30', '03:45:10', '03:25:45', '03:50:05']
}

df = pd.DataFrame(data)

# Exportiere DataFrame nach Excel
df.to_excel('marathon_participants.xlsx', index=False)

In diesem Beispiel haben wir ein einfaches DataFrame erstellt und es in die Datei marathon_participants.xlsx exportiert. Beachte, dass wir den Parameter index=False gesetzt haben, um die Indizes des DataFrame nicht nach Excel zu exportieren, falls sie nicht benötigt werden.

Hinzufügen von Format und Stil

Als nächstes kommt der nächste Skill-Level: ein bisschen Style hinzufügen. Denn wer sagt, dass Daten nicht schick sein können? Mit der Bibliothek pandas und openpyxl kannst du Tabellen einfach formatieren und Stile hinzufügen.

Python

import pandas as pd
from openpyxl import Workbook

# Erstelle DataFrame
data = {
    'Name': ['Anna', 'Boris', 'Viktor', 'Galina'],
    'Alter': [29, 34, 22, 28],
    'Stadt': ['Moskau', 'Sankt Petersburg', 'Kazan', 'Nowosibirsk'],
    'Zielzeit': ['03:15:30', '03:45:10', '03:25:45', '03:50:05']
}

df = pd.DataFrame(data)

# Schreibe nach Excel mit Formatierung
with pd.ExcelWriter('styled_marathon.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, index=False, sheet_name='Teilnehmende')
    worksheet = writer.sheets['Teilnehmende']
    for col in worksheet.columns:
        max_length = 0
        column = col[0].column_letter # Spaltenbuchstaben bekommen
        for cell in col:
            try:
                if len(str(cell.value)) > max_length:
                    max_length = len(cell.value)
            except:
                pass
        adjusted_width = (max_length + 2) * 1.2
        worksheet.column_dimensions[column].width = adjusted_width

In diesem Beispiel exportieren wir nicht nur die Daten, sondern passen auch die Spaltenbreiten an den Inhalt an, damit sie in Excel ordentlicher aussehen. Wir nutzen openpyxl, um auf das Arbeitsblatt zuzugreifen und Styling anzuwenden.

Arbeiten mit mehreren Arbeitsblättern

Berichte mit mehreren Arbeitsblättern zu erstellen, klingt vielleicht nach einer Mammutaufgabe, ist aber eigentlich ganz einfach. Stell dir vor, du möchtest die Daten aus verschiedenen Jahreswettkämpfen auf separaten Blättern speichern.

Python

import pandas as pd

# Daten aus verschiedenen Jahren
data_2022 = {
    'Name': ['Dmitrij', 'Elena'],
    'Alter': [30, 29],
    'Stadt': ['Omsk', 'Wladiwostok'],
    'Zielzeit': ['03:20:05', '03:35:40']
}

data_2023 = {
    'Name': ['Igor', 'Katerina'],
    'Alter': [31, 27],
    'Stadt': ['Tscheljabinsk', 'Jekaterinburg'],
    'Zielzeit': ['03:29:10', '03:40:20']
}

df_2022 = pd.DataFrame(data_2022)
df_2023 = pd.DataFrame(data_2023)

# Schreibe Daten in verschiedene Arbeitsblätter
with pd.ExcelWriter('marathon_data.xlsx') as writer:
    df_2022.to_excel(writer, sheet_name='2022', index=False)
    df_2023.to_excel(writer, sheet_name='2023', index=False)

Dieser Code erstellt die Datei marathon_data.xlsx mit zwei Arbeitsblättern, auf denen die Daten der verschiedenen Jahre gespeichert sind. Das ist super hilfreich, um Daten nach Jahren, Projekten oder anderen Kategorien zu trennen.

2. Es gibt immer Raum für Verbesserung

Überlege, wie die Automatisierung des Exports in komplexere Prozesse deines Projekts integriert werden kann. Vielleicht möchtest du nach dem Export automatisch Diagramme erstellen lassen? Oder Berichte mit einer Webschnittstelle integrieren, um bequemeren Zugriff zu ermöglichen?

So oder so, der Export von Daten nach Excel ist nur der Anfang deines Weges zur Erstellung von schönen und informativen Berichten. Damit wirst du sowohl in deinem Job als auch im Studium zur Datenanalyse-Rakete!

Jetzt hast du die Tools, um den Datenexport zu automatisieren. Du weißt, wie man Berichte in Excel leserlicher und ansprechender macht. Also los, mach mehr aus deinen Daten!

1
Опрос
Anfragen schreiben,  28 уровень,  4 лекция
недоступен
Anfragen schreiben
Anfragen schreiben
Kommentare
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION