CodeGym /Java Adesua /Python SELF TW /數據過濾與排序分析與報表

數據過濾與排序分析與報表

Python SELF TW
等級 27 , 課堂 4
開放

1. 在DataFrame中進行數據過濾的基礎

為什麼需要過濾?

就像你最愛的自拍應用程式中的濾鏡一樣, pandas 的過濾功能幫助我們專注於最重要的事情。 我們可以排除不必要的數據,只保留真正有用的部分。 對於數據分析來說,這是一個基本的工具,特別是當我們需要 為報表做準備或處理大量數據時。

我們的第一次過濾

讓我們從一個簡單的例子開始。我們有一個DataFrame, 包含商品銷售資訊:

Python

import pandas as pd

data = {
    "商品": ["橘子", "香蕉", "蘋果", "橘子", "蘋果"],
    "數量": [10, 5, 8, 7, 6],
    "價格": [3.5, 2.0, 4.0, 3.0, 4.5]
}

df = pd.DataFrame(data)

# 按商品名稱過濾數據
filtered_df = df[df["商品"] == "橘子"]
print(filtered_df)

使用條件

我們可以像多重濾鏡一樣結合條件! 例如,找到數量大於 6 並且價格不超過 3.5 的所有商品:

Python

# 使用 & (邏輯「和」) 結合條件
filtered_df = df[(df["數量"] > 6) & (df["價格"] <= 3.5)]
print(filtered_df)

記住要點

別忘了,在 pandas 中,我們用方括號來創建過濾器, 用小括號來撰寫條件。你可不想成為「那個人」, 忘記括號然後出錯了吧?

2. 數據排序

為什麼排序這麼重要?

數據排序讓我們在混亂中看清結構與順序(如果數據集中真有混亂的話)。 比方說,想像一下你身處圖書館,而書籍被隨意堆放——簡直噩夢!排序則能把信息 組織起來,不論是為了分析、報表或僅僅是找到需要的值。

按單一欄位排序

讓我們將DataFrame按商品價格升序排列:

Python

# 按價格升序排序
sorted_df = df.sort_values(by="價格")
print(sorted_df)

按多個欄位排序

想像一下你需要先按數量排序,若數量相同則按價格排序, 而且要降序排列。以下是完成此操作的方法:

Python

# 按數量與價格排序
sorted_df = df.sort_values(by=["數量", "價格"], ascending=[True, False])
print(sorted_df)

排序的注意事項

注意ascending參數。它讓你指定以升序或降序進行排序。 如果你想「邪惡地」掌控數據,這是個非常方便的功能。

3. 實際應用

實踐任務

是時候將我們的知識應用於實際情境了!假設你是 一家銷售小工具公司的分析師。你的任務是找到 銷量超過 100 件的所有手機型號, 並按利潤降序排列。

Python

# 手機銷售數據
data = {
    "型號": ["Phone X", "Phone Y", "Phone Z", "Phone X", "Phone Y"],
    "銷量": [120, 150, 90, 130, 80],
    "利潤": [200, 180, 220, 210, 190]
}

df = pd.DataFrame(data)

# 過濾銷量超過 100 的型號
filtered_df = df[df["銷量"] > 100]

# 按利潤降序排序
sorted_df = filtered_df.sort_values(by="利潤", ascending=False)
print(sorted_df)

分析與討論

使用過濾與排序的組合來提取 對你或你的報告真正重要且有趣的數據。 就像任何其他工具一樣,過濾與排序隨著練習越來越強大。 別忘記,格式良好的數據不僅是分析師的福音, 也是他最大的驕傲。

常見錯誤

一些新手有時會忘記在過濾條件中使用小括號, 這會導致錯誤。就像忘了在鍋子上蓋蓋子—— 一切都可能失控。另一個常見錯誤是 在多個字段排序時未正確指定順序。 確保你正確使用ascending, 才不會把一切弄得亂七八糟。

實際應用

在實際操作中,過濾與排序是每個數據分析師不可或缺的工具。 它們幫助迅速從複雜數據集中獲取所需數據, 並為報表準備數據。在現實中,它們無處不在: 從金融科技到醫學研究。例如, 銀行過濾交易以識別可疑活動, 而研究人員排序藥物試驗數據以發現隱藏的關聯。 不用說,熟悉這些工具在面試時也能成為利器。

4. 進一步學習的資源

對於那些想要更深入學習此主題的人,我建議 查看 pandas 官方文檔, 這是了解該庫所有功能的絕佳資源。在那裡,你可以找到 許多範例與解釋,幫助你以專業水平掌握此工具。

1
Опрос
Excel操作,  27 уровень,  4 лекция
недоступен
Excel操作
Excel操作
留言
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION