1. Cơ bản về Pyplot
Tạo biểu đồ đơn giản
Giờ đây, khi có Matplotlib trong tay, hãy cùng tìm hiểu các phần cơ bản của nó. Pyplot — là một module nhỏ nhưng cực kỳ hữu ích trong Matplotlib. Nó cho phép bạn nhanh chóng và dễ dàng tạo biểu đồ, giống như bạn đang vẽ trên canvas vậy.
import matplotlib.pyplot as plt
# Tạo biểu đồ đơn giản nhất
plt.plot([0, 1, 2, 3], [0, 1, 4, 9])
plt.show()
Vậy là bạn đã tạo biểu đồ đầu tiên rồi! Nó có thể không thắng được bất kỳ giải thưởng thẩm mỹ nào, nhưng hãy tin rằng đây chỉ là khởi đầu thôi.
Cải thiện biểu đồ
Tạo biểu đồ trong pyplot
bao gồm một số bước cơ bản:
- Chuẩn bị dữ liệu cho biểu đồ.
-
Lựa chọn loại biểu đồ (ví dụ,
plot()
cho biểu đồ đường). - Tùy chỉnh biểu đồ (nhãn, tiêu đề và chú giải).
-
Hiển thị biểu đồ bằng hàm
show()
.
Hãy thử cải thiện biểu đồ đầu tiên của chúng ta...
Biểu đồ đường thẳng
import matplotlib.pyplot as plt
# Dữ liệu cho biểu đồ
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# Vẽ biểu đồ đường thẳng
plt.plot(x, y)
# Tùy chỉnh nhãn của trục và tiêu đề
plt.xlabel("X")
plt.ylabel("Y")
plt.title("Ví dụ về biểu đồ đường thẳng")
# Hiển thị biểu đồ
plt.show()
Code trên tạo biểu đồ đường thẳng hiển thị các giá trị
y
theo trục Y
dựa trên
các giá trị x
theo trục X
. Hàm
xlabel()
, ylabel()
và
title()
thêm nhãn và tiêu đề vào biểu đồ.
2. Các loại biểu đồ chính trong Pyplot
1. Biểu đồ đường thẳng plot()
Biểu đồ đường thẳng thường dùng để hiển thị dữ liệu theo thời gian hoặc để phân tích xu hướng.
x = [1, 2, 3, 4, 5]
y = [1, 4, 9, 16, 25]
plt.plot(x, y, marker="o", color="b", linestyle="--")
plt.xlabel("Thời gian")
plt.ylabel("Giá trị")
plt.title("Biểu đồ đường thẳng")
plt.show()
Ở đây chúng ta sử dụng tham số marker
,
color
và linestyle
để tùy chỉnh
giao diện của biểu đồ.
2. Biểu đồ histogram hist()
Biểu đồ histogram hữu ích trong việc hiển thị phân bố dữ liệu và phân tích tần suất xuất hiện của các giá trị.
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5]
plt.hist(data, bins=5, color="skyblue", edgecolor="black")
plt.xlabel("Giá trị")
plt.ylabel("Tần suất")
plt.title("Biểu đồ histogram")
plt.show()
Ở đây tham số bins
xác định số lượng
cột trong biểu đồ histogram, còn edgecolor
thêm
viền cho từng cột.
3. Biểu đồ tròn pie()
Biểu đồ tròn hiển thị tỉ lệ các danh mục trong tổng số dữ liệu.
labels = ["Mèo", "Chó", "Chim"]
sizes = [40, 35, 25]
plt.pie(sizes, labels=labels, autopct="%1.1f%%", startangle=90)
plt.title("Biểu đồ tròn")
plt.show()
Ở đây autopct
hiển thị giá trị phần trăm
cho từng danh mục, còn startangle
xoay biểu đồ.
4. Biểu đồ scatter scatter()
Biểu đồ scatter hữu ích để phân tích mối quan hệ giữa hai biến số.
x = [1, 2, 3, 4, 5]
y = [5, 7, 8, 5, 6]
plt.scatter(x, y, color="red")
plt.xlabel("X")
plt.ylabel("Y")
plt.title("Biểu đồ scatter")
plt.show()
Biểu đồ scatter phù hợp để tìm kiếm sự tương quan giữa
các giá trị trên trục X
và Y
.
5. Biểu đồ cột bar()
Biểu đồ cột hữu ích trong việc so sánh giá trị giữa các danh mục.
categories = ["A", "B", "C", "D"]
values = [10, 15, 7, 20]
plt.bar(categories, values, color="lightblue")
plt.xlabel("Danh mục")
plt.ylabel("Giá trị")
plt.title("Biểu đồ cột")
plt.show()
Ở đây categories
và
values
đại diện cho nhãn các danh mục và
giá trị tương ứng để tạo cột.
Bây giờ bạn đã làm quen với các thao tác cơ bản của Matplotlib, và đã sẵn sàng để tạo biểu đồ đầu tiên. Nhưng đây chỉ là khởi đầu cho hành trình của chúng ta. Trong các bài giảng tiếp theo, chúng ta sẽ đi sâu hơn vào việc tạo các loại biểu đồ khác nhau và tùy chỉnh chúng. Cuối cùng, bạn sẽ có thể tạo ra những tác phẩm nghệ thuật không chỉ đẹp mắt mà còn rất hữu ích.
Đừng quên rằng việc trực quan hóa dữ liệu không chỉ về biểu đồ, mà còn về việc kể câu chuyện, và Matplotlib sẽ trở thành người kể chuyện của bạn. Hẹn gặp lại trong bài giảng tiếp theo, nơi chúng ta sẽ nâng cao kỹ năng và mở ra những chân trời mới trong thế giới biểu đồ!
GO TO FULL VERSION