1. Hesabatlar üçün məlumatların strukturlaşdırılması
Hesabat hazırlayanda, sadəcə gözəl qablaşdırılmış bir yığın məlumat təqdim etmək deyil, məlumatı başa düşülən və əlçatan etmək vacibdir. Məlumatların hazırlanması birbaşa hesabatınızın nə qədər asan və tez qavranılmasına təsir edir.
Sxematik cədvəllər: hesabat üçün İsveçrə bıçağımız
Sxematik cədvəllər — Excel-də analitika üçün tez-tez istifadə olunan, məlumatları xülasə etmək, aqreqasiya etmək və təqdim etmək üçün güclü bir yoldur. pandas-da sxematik cədvəlləri asanlıqla pivot_table
metodu ilə yarada bilərik. Gəlin sadə bir nümunəyə baxaq.
Təsəvvür edin ki, mağazada satışlar haqqında məlumatlarınız var:
import pandas as pd
data = {
'Məhsul': ['Apelsin', 'Alma', 'Banan', 'Apelsin', 'Banan', 'Alma'],
'Ay': ['Yanvar', 'Yanvar', 'Yanvar', 'Fevral', 'Fevral', 'Fevral'],
'Satışlar': [150, 200, 250, 130, 180, 210]
}
df = pd.DataFrame(data)
Hər bir məhsulun hər ay üzrə ümumi satış məbləğini göstərən bir sxematik cədvəl yaratmaq üçün pivot_table
istifadə edirik.
pivot_df = df.pivot_table(values='Satışlar', index='Məhsul', columns='Ay', aggfunc='sum')
print(pivot_df)
Bu sadə nümunə, məlumatları kateqoriyalar və tarixlər üzrə tez bir şəkildə aqreqasiya etməyin necə asan olduğunu göstərir — hesabatlar üçün ideal bir baza.
2. Məlumatların hazırlanması üçün pandas metodlarından istifadə
pivot_table
metodu
pivot_table
metodu çox fleksibldir və məlumatların summalanışı ilə yanaşı, mean
, count
və s. kimi digər aqreqasiya funksiyalarını tətbiq etməyə imkan verir. Gəlin, satışların orta qiymətini göstərmək üçün məlumatları necə çevirmək lazım olduğunu nəzərdən keçirək:
pivot_mean_df = df.pivot_table(values='Satışlar', index='Məhsul', columns='Ay', aggfunc='mean')
print(pivot_mean_df)
crosstab
metodu
pandas-dakı crosstab
metodu kontingensiya cədvəllərini xatırladır, lakin tezliklərin hesablanması üçün istifadə olunur. Təsəvvür edin ki, hər bir məhsulun müxtəlif aylarda neçə dəfə satıldığını hesablamaq istəyirik:
cross_df = pd.crosstab(df['Məhsul'], df['Ay'])
print(cross_df)
Bu metod, kateqoriyalar arasındakı məlumatların yayılmasını öyrənmək və ya hadisələrin tezliyini təhlil etmək lazım olanda faydalıdır.
3. Çoxölçülü indekslərlə məlumatların göstərilməsinin tənzimlənməsi
Çoxölçülü indekslər
Bəli, pandas sizə iki ölçülü məlumatlardan kənara çıxmağa və çoxölçülü indekslərdən istifadə etməyə imkan verir. Bu, bir neçə səviyyəli aqreqasiya olan məlumatların təmsil edilməsi üçün faydalıdır. Məsələn, məlumat toplusuna "İl" əlavə edək və çoxölçülü bir indeks yaradaq.
data['İl'] = [2023, 2023, 2023, 2024, 2024, 2024]
df = pd.DataFrame(data)
multi_pivot_df = df.pivot_table(values='Satışlar', index=['İl', 'Məhsul'], columns='Ay', aggfunc='sum')
print(multi_pivot_df)
İndi məlumatlarımız illər və məhsullar üzrə aqreqasiya olunub, bu da onları daha informativ edir.
4. Təcrübə və analiz
Gəlin öyrəndiklərimizi praktikada tətbiq edək. Tapşırıq: satışlar barədə hesabat üçün məlumatları hazırlayın.
Təsəvvür edin ki, sizdə aşağıdakı satış məlumatları var:
data = {
'Məhsul': ['Portağal', 'Portağal', 'Alma', 'Alma', 'Banan', 'Banan'],
'Ay': ['Yanvar', 'Fevral', 'Yanvar', 'Fevral', 'Yanvar', 'Fevral'],
'İl': [2023, 2023, 2024, 2024, 2023, 2024],
'Satışlar': [150, 200, 180, 220, 120, 130]
}
df = pd.DataFrame(data)
Sizin tapşırığınız – hər bir məhsul üçün hər bir ay üzrə ümumi satış cəmini göstərən cədvəl yaratmaqdır, illər üzrə ümumi məlumatları da daxil etməklə.
pivot_total_df = df.pivot_table(values='Satışlar', index=['İl', 'Məhsul'], columns='Ay', aggfunc='sum', margins=True, margins_name='Cəmi')
print(pivot_total_df)
Bu "Cəmi" sətri bütün kateqoriyalar üzrə cəmi göstərəcək, bu isə tam mənzərə üçün tez-tez lazım olur.
5. Məlumatların təqdim edilməsi və təhlil strategiyalarının müzakirəsi
Hesabatlar üçün məlumatların pandas vasitəsilə hazırlanması təkcə riyaziyyat deyil, həm də sənətkarlıqdır. Bu prosesin vacib hissəsi məlumatların ən informativ təqdimat formasını seçməkdir, istər sadə cəmləri olan cədvəllər, istərsə də mürəkkəb qrafiklər olsun. Həyatda belə bir strukturlaşdırma təkcə cari göstəriciləri anlamağa kömək etmir, həm də əsaslandırılmış qərarlar qəbul etməyə dəstək olur. Çox güman ki, özünüzü cansıxıcı rəqəm sıralarını aydın mənzərəyə çevirən sehrbaz rolunda tapacaqsınız.
Hesabatların avtomatlaşdırılmış hazırlanmasının ustası olmaq istəyirsinizsə, pandas imkanlarını unutmayın və müxtəlif metodlar və texnikalarla eksperiment aparmaqdan çəkinməyin. Bu bacarıq təkcə analitik xülasələr qurmaqda deyil, həm də müsahibələrdə və gələcək karyeranızda işinizə yarayacaq. Məlumatlar dünyasına cəsarətlə dalın və hesabatlarınızı rəngarəng, informativ və asan qəbul edilən hala gətirin!
GO TO FULL VERSION