1. DataFrame
-də Məlumatların Filtrasiyası Üzrə Əsaslar
Filtrasiya nə üçün lazımdır?
Sevimli selfie tətbiqinizdəki filtrlər kimi, pandas-dakı filtrasiya da əsas məsələlərə fokuslanmağa kömək edir. Lazımsız məlumatları çıxarıb, həqiqətən vacib olanı saxlaya bilərik. Bu, xüsusilə məlumatların təhlili, hesabatların hazırlanması və böyük verilənlər dəstini anlamaq üçün vacib bir vasitədir.
İlk filtrasiyamız
Gəlin sadə bir nümunədən başlayaq. Bizim mal satışı haqqında məlumatlar olan bir DataFrame
-imiz var:
import pandas as pd
data = {
"Məhsul": ["Apelsinlər", "Bananlar", "Almalar", "Apelsinlər", "Almalar"],
"Miqdar": [10, 5, 8, 7, 6],
"Qiymət": [3.5, 2.0, 4.0, 3.0, 4.5]
}
df = pd.DataFrame(data)
# Məhsul adlarına görə filtrasiya
filtered_df = df[df["Məhsul"] == "Apelsinlər"]
print(filtered_df)
Şərtlərdən istifadə
Şərtləri multifiz filtr kimi birləşdirə bilərik! Məsələn, miqdarı 6-dan çox və qiyməti 3.5-dən artıq olmayan bütün malları tapaq:
# Şərtləri & (məntiqi "və") vasitəsilə birləşdiririk
filtered_df = df[(df["Miqdar"] > 6) & (df["Qiymət"] <= 3.5)]
print(filtered_df)
Vacib məqamları yadda saxlayırıq
Unutmayın ki, pandas-da filtrlər yaratmaq üçün kvadrat mötərizələrdən və şərtlər üçün dairəvi mötərizələrdən istifadə edirik. Bu mötərizələri unutmaq istəməzsiniz, elə deyilmi?
2. Məlumatların sıralanması
Niyə sıralama vacibdir?
Məlumatların sıralanması bizə struktur və qayda yaratmağa imkan verir xaosdan çıxmaq üçün (düzdür, dataset-lərdə xaos olurmu, bilmirəm). Məsələn, təsəvvür edin ki, siz kitabxanadasınız və kitablar hər yerdə qarışıqdır — dəhşət! Sıralama məlumatları nizamlı etməkdə kömək edir, istər analiz üçün, istər hesabatlar üçün ya sadəcə lazım olanı tapmaq üçün.
Bir sütuna görə sıralama
Gəlin bizim DataFrame
-i məhsulların qiymətinə görə artan sıraya yerləşdirək:
# Qiymətə görə artan sırada sıralama
sorted_df = df.sort_values(by="Qiymət")
print(sorted_df)
Bir neçə sütuna görə sıralama
Təsəvvür edin ki, siz məlumatları əvvəlcə miqdara görə, sonra isə eyni miqdar olduqda qiymətə görə və azalan sırada sıralamaq istəyirsiniz. Bunu belə edə bilərsiniz:
# Miqdara və qiymətə görə sıralama
sorted_df = df.sort_values(by=["Miqdar", "Qiymət"], ascending=[True, False])
print(sorted_df)
Sıralamanın xüsusiyyətləri
ascending
parametrinə diqqət edin. Bu parametr artan ya azalan qaydada məlumatları sıralamaq üçün istifadə olunur. Bu çox rahatdır, əgər siz məlumatlarınızı "şəfqət göstərmədən" idarə etmək istəyirsinizsə.
3. Praktikada tətbiq
Praktik tapşırıq
İndi biliklərimizi praktikada tətbiq etməyin vaxtıdır! Təsəvvür edin, siz gadget-lər satan bir şirkətdə analitiksiniz. Sizin tapşırığınız — 100-dən çox satılmış bütün telefon modellərini tapmaq və onları azalan mənfəət ardıcıllığı ilə çeşidləməkdir.
# Telefon satışı ilə bağlı məlumatlar
data = {
"Model": ["Phone X", "Phone Y", "Phone Z", "Phone X", "Phone Y"],
"Satış": [120, 150, 90, 130, 80],
"Mənfəət": [200, 180, 220, 210, 190]
}
df = pd.DataFrame(data)
# 100-dən çox satılan modellərin filtrasiya edilməsi
filtered_df = df[df["Satış"] > 100]
# Mənfəətə görə azalan ardıcıllıqla çeşidlənmə
sorted_df = filtered_df.sort_values(by="Mənfəət", ascending=False)
print(sorted_df)
Analiz və müzakirə
Maraqlı və vacib olan məlumatları əldə etmək üçün filtrasiya və çeşidlənməni birləşdirin. Digər alətlər kimi, filtrasiya və çeşidlənmə də təcrübə ilə daha güclü olur. Və unutmayın, mükəmməl formatlaşdırılmış məlumat təkcə analitikin xeyir-duası deyil, həm də onun ən böyük qürurudur.
Tipik səhvlər
Bəzi yeni başlayanlar bəzən filtrasiya şərtlərində dairəvi mötərizələrdən istifadə etməyi unudur ki, bu da səhvlərə səbəb olur. Bu, qazan üzərinə qapaq qoymağı unutmağa bənzəyir — hər şey nəzarətdən çıxa bilər. Digər tez-tez baş verən səhv — bir neçə sahəyə görə düzgün çeşidləmə ardıcıllığını göstərməməkdir. ascending
düz istifadə etdiyinizə əmin olun ki, hər şeyin yuxarı-aşağı çevrilməsin.
Praktiki tətbiqi
Praktikada filtrasiyası və sıralanması hər hansı bir data analitiki üçün əvəzolunmaz alətlərdir. Onlar mürəkkəb datasetlərdən lazım olan məlumatları tez əldə etməyə və onları hesabatlar üçün hazırlamağa kömək edir. Real həyatda bunlar hər yerdə istifadə olunur: fintech-dən tutmuş tibbi araşdırmalara qədər. Məsələn, banklar şübhəli fəaliyyətləri aşkar etmək üçün tranzaksiyaları filtrasiyadan keçirə bilər, tədqiqatçılar isə dərmanların sınaqları ilə bağlı məlumatları sıralayaraq gizli asılılıqları aşkar edirlər. Bu alətlərin bilməyin iş müsahibələrində də faydalı bir müttəfiq ola biləcəyini deməyə ehtiyac yoxdur.
4. Öyrənmək üçün əlavə resurslar
Mövzunu dərindən öyrənmək istəyənlər üçün tövsiyə edirəm ki, pandas rəsmi sənədlərinə baxsınlar, çünki bu kitabxananın bütün imkanlarını anlamaq üçün əla mənbədir. Orada siz bu aləti peşəkar səviyyədə mənimsəməyə kömək edəcək bir çox nümunə və izahlar tapacaqsınız.
GO TO FULL VERSION