CodeGym /Kurslar /Python SELF AZ /Hesabatlar üçün məlumatların hazırlanması pandas metodlar...

Hesabatlar üçün məlumatların hazırlanması pandas metodlarından istifadə edərək

Python SELF AZ
Səviyyə , Dərs
Mövcuddur

1. Hesabatlar üçün məlumatların strukturlaşdırılması

Hesabat hazırlayanda, sadəcə gözəl qablaşdırılmış bir yığın məlumat təqdim etmək deyil, məlumatı başa düşülən və əlçatan etmək vacibdir. Məlumatların hazırlanması birbaşa hesabatınızın nə qədər asan və tez qavranılmasına təsir edir.

Sxematik cədvəllər: hesabat üçün İsveçrə bıçağımız

Sxematik cədvəllər — Excel-də analitika üçün tez-tez istifadə olunan, məlumatları xülasə etmək, aqreqasiya etmək və təqdim etmək üçün güclü bir yoldur. pandas-da sxematik cədvəlləri asanlıqla pivot_table metodu ilə yarada bilərik. Gəlin sadə bir nümunəyə baxaq.

Təsəvvür edin ki, mağazada satışlar haqqında məlumatlarınız var:

Python

import pandas as pd

data = {
    'Məhsul': ['Apelsin', 'Alma', 'Banan', 'Apelsin', 'Banan', 'Alma'],
    'Ay': ['Yanvar', 'Yanvar', 'Yanvar', 'Fevral', 'Fevral', 'Fevral'],
    'Satışlar': [150, 200, 250, 130, 180, 210]
}

df = pd.DataFrame(data)

Hər bir məhsulun hər ay üzrə ümumi satış məbləğini göstərən bir sxematik cədvəl yaratmaq üçün pivot_table istifadə edirik.

Python

pivot_df = df.pivot_table(values='Satışlar', index='Məhsul', columns='Ay', aggfunc='sum')
print(pivot_df)

Bu sadə nümunə, məlumatları kateqoriyalar və tarixlər üzrə tez bir şəkildə aqreqasiya etməyin necə asan olduğunu göstərir — hesabatlar üçün ideal bir baza.

2. Məlumatların hazırlanması üçün pandas metodlarından istifadə

pivot_table metodu

pivot_table metodu çox fleksibldir və məlumatların summalanışı ilə yanaşı, mean, count və s. kimi digər aqreqasiya funksiyalarını tətbiq etməyə imkan verir. Gəlin, satışların orta qiymətini göstərmək üçün məlumatları necə çevirmək lazım olduğunu nəzərdən keçirək:

Python

pivot_mean_df = df.pivot_table(values='Satışlar', index='Məhsul', columns='Ay', aggfunc='mean')
print(pivot_mean_df)

crosstab metodu

pandas-dakı crosstab metodu kontingensiya cədvəllərini xatırladır, lakin tezliklərin hesablanması üçün istifadə olunur. Təsəvvür edin ki, hər bir məhsulun müxtəlif aylarda neçə dəfə satıldığını hesablamaq istəyirik:

Python

cross_df = pd.crosstab(df['Məhsul'], df['Ay'])
print(cross_df)

Bu metod, kateqoriyalar arasındakı məlumatların yayılmasını öyrənmək və ya hadisələrin tezliyini təhlil etmək lazım olanda faydalıdır.

3. Çoxölçülü indekslərlə məlumatların göstərilməsinin tənzimlənməsi

Çoxölçülü indekslər

Bəli, pandas sizə iki ölçülü məlumatlardan kənara çıxmağa və çoxölçülü indekslərdən istifadə etməyə imkan verir. Bu, bir neçə səviyyəli aqreqasiya olan məlumatların təmsil edilməsi üçün faydalıdır. Məsələn, məlumat toplusuna "İl" əlavə edək və çoxölçülü bir indeks yaradaq.

Python

data['İl'] = [2023, 2023, 2023, 2024, 2024, 2024]
df = pd.DataFrame(data)

multi_pivot_df = df.pivot_table(values='Satışlar', index=['İl', 'Məhsul'], columns='Ay', aggfunc='sum')
print(multi_pivot_df)

İndi məlumatlarımız illər və məhsullar üzrə aqreqasiya olunub, bu da onları daha informativ edir.

4. Təcrübə və analiz

Gəlin öyrəndiklərimizi praktikada tətbiq edək. Tapşırıq: satışlar barədə hesabat üçün məlumatları hazırlayın.

Təsəvvür edin ki, sizdə aşağıdakı satış məlumatları var:

Python

data = {
    'Məhsul': ['Portağal', 'Portağal', 'Alma', 'Alma', 'Banan', 'Banan'],
    'Ay': ['Yanvar', 'Fevral', 'Yanvar', 'Fevral', 'Yanvar', 'Fevral'],
    'İl': [2023, 2023, 2024, 2024, 2023, 2024],
    'Satışlar': [150, 200, 180, 220, 120, 130]
}

df = pd.DataFrame(data)

Sizin tapşırığınız – hər bir məhsul üçün hər bir ay üzrə ümumi satış cəmini göstərən cədvəl yaratmaqdır, illər üzrə ümumi məlumatları da daxil etməklə.

Python

pivot_total_df = df.pivot_table(values='Satışlar', index=['İl', 'Məhsul'], columns='Ay', aggfunc='sum', margins=True, margins_name='Cəmi')
print(pivot_total_df)

Bu "Cəmi" sətri bütün kateqoriyalar üzrə cəmi göstərəcək, bu isə tam mənzərə üçün tez-tez lazım olur.

5. Məlumatların təqdim edilməsi və təhlil strategiyalarının müzakirəsi

Hesabatlar üçün məlumatların pandas vasitəsilə hazırlanması təkcə riyaziyyat deyil, həm də sənətkarlıqdır. Bu prosesin vacib hissəsi məlumatların ən informativ təqdimat formasını seçməkdir, istər sadə cəmləri olan cədvəllər, istərsə də mürəkkəb qrafiklər olsun. Həyatda belə bir strukturlaşdırma təkcə cari göstəriciləri anlamağa kömək etmir, həm də əsaslandırılmış qərarlar qəbul etməyə dəstək olur. Çox güman ki, özünüzü cansıxıcı rəqəm sıralarını aydın mənzərəyə çevirən sehrbaz rolunda tapacaqsınız.

Hesabatların avtomatlaşdırılmış hazırlanmasının ustası olmaq istəyirsinizsə, pandas imkanlarını unutmayın və müxtəlif metodlar və texnikalarla eksperiment aparmaqdan çəkinməyin. Bu bacarıq təkcə analitik xülasələr qurmaqda deyil, həm də müsahibələrdə və gələcək karyeranızda işinizə yarayacaq. Məlumatlar dünyasına cəsarətlə dalın və hesabatlarınızı rəngarəng, informativ və asan qəbul edilən hala gətirin!

Şərhlər
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION