CodeGym /Java Adesua /Python SELF TW /篩選和處理後的數據導出到 Excel

篩選和處理後的數據導出到 Excel

Python SELF TW
等級 28 , 課堂 4
開放

想像一下你是一名宇宙研究員,數據就是你的星空地圖。它龐大、複雜但絕對必要。經過仔細的篩選和分析後,這些數據需要以易於閱讀的格式來組織和保存。這時,我們的英雄——數據導出到 Excel 就登場了。它可以讓你與同事分享發現,或者準備重要會議的報告。在這個數據被比喻為新石油的時代,僅需幾行代碼就能生成報告的技能,價值無可限量。

1. 數據導出基本要點

將數據導出到 Excel 不僅僅是從一種格式轉換到另一種格式。這是一種定制報告的能力,使其更便利和易懂。正如我認識的一位程序員所說:“Python 是可以施展魔法的,但就連哈利波特也需要魔杖。”在我們的情況下,這根魔杖就是 pandas 庫中的 to_excel 方法。

to_excel 的基礎

讓我們從一個將數據從 DataFrame 導出到 Excel 文件的簡單例子開始。假設我們有一個包含馬拉松參賽者記錄的 DataFrame

Python

import pandas as pd

# 創建 DataFrame
data = {
    '名字': ['安娜', '鮑里斯', '維克托', '加利娜'],
    '年齡': [29, 34, 22, 28],
    '城市': ['莫斯科', '聖彼得堡', '喀山', '新西伯利亞'],
    '完成時間': ['03:15:30', '03:45:10', '03:25:45', '03:50:05']
}

df = pd.DataFrame(data)

# 將 DataFrame 導出到 Excel
df.to_excel('marathon_participants.xlsx', index=False)

在這個例子中,我們創建了一個簡單的 DataFrame,並將其導出到文件 marathon_participants.xlsx。請注意,我們設置了參數 index=False,以防止將 DataFrame 的索引導出到 Excel,除非確實需要。

添加格式和樣式

進階到下一個級別——添加樣式。誰說數據就不能時髦點?使用 pandasopenpyxl 庫,可以輕鬆地為表格格式化並添加樣式。

Python

import pandas as pd
from openpyxl import Workbook

# 創建 DataFrame
data = {
    '名字': ['安娜', '鮑里斯', '維克托', '加利娜'],
    '年齡': [29, 34, 22, 28],
    '城市': ['莫斯科', '聖彼得堡', '喀山', '新西伯利亞'],
    '完成時間': ['03:15:30', '03:45:10', '03:25:45', '03:50:05']
}

df = pd.DataFrame(data)

# 使用格式化將數據寫入 Excel
with pd.ExcelWriter('styled_marathon.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, index=False, sheet_name='參賽者')
    worksheet = writer.sheets['參賽者']
    for col in worksheet.columns:
        max_length = 0
        column = col[0].column_letter # 獲取列的字母表示
        for cell in col:
            try:
                if len(str(cell.value)) > max_length:
                    max_length = len(cell.value)
            except:
                pass
        adjusted_width = (max_length + 2) * 1.2
        worksheet.column_dimensions[column].width = adjusted_width

在這個例子中,我們不僅導出數據,還根據內容調整了列的寬度,讓其在 Excel 中看起來更整潔。我們使用 openpyxl 來訪問工作表並應用樣式。

處理多個工作表

創建包含多個工作表的報告或許聽起來是超人才能完成的任務,但實際上非常簡單。想像一下你要將來自不同年度比賽的數據存儲在不同的工作表中。

Python

import pandas as pd

# 不同年份的數據
data_2022 = {
    '名字': ['德米特里', '埃琳娜'],
    '年齡': [30, 29],
    '城市': ['鄂木斯克', '符拉迪沃斯托克'],
    '完成時間': ['03:20:05', '03:35:40']
}

data_2023 = {
    '名字': ['伊戈爾', '卡特琳娜'],
    '年齡': [31, 27],
    '城市': ['車里雅賓斯克', '葉卡捷琳堡'],
    '完成時間': ['03:29:10', '03:40:20']
}

df_2022 = pd.DataFrame(data_2022)
df_2023 = pd.DataFrame(data_2023)

# 將數據寫入不同工作表
with pd.ExcelWriter('marathon_data.xlsx') as writer:
    df_2022.to_excel(writer, sheet_name='2022', index=False)
    df_2023.to_excel(writer, sheet_name='2023', index=False)

此代碼生成了一個名為 marathon_data.xlsx 的文件,包含兩個工作表,分別存儲不同年份的數據。這對於按年度、項目或其他分類來分割數據非常有用。

2. 總有改進的空間

嘗試思考一下如何將數據導出自動化融入到你的項目中的更複雜流程中。或許你想在導出後自動生成圖表?或者將報告與網頁界面集成以獲得更方便的訪問?

無論如何,將數據導出到 Excel 僅僅是創建美觀且信息豐富的報告的起點,這將使你成為工作場所或學校中數據分析的明星!

現在你已經擁有了自動化數據導出工具,也知道如何讓你的 Excel 報告更具可讀性和展示效果。所以,行動起來吧,讓你的數據為你服務!

1
Опрос
查詢寫法,  28 уровень,  4 лекция
недоступен
查詢寫法
查詢寫法
留言
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION