Hiển thị dữ liệu là một kỹ năng quan trọng đối với kỹ sư hệ thống và nhà khoa học dữ liệu. Thư viện Matplotlib của Python cung cấp một loạt các tính năng hiển thị giúp hiểu dữ liệu một cách tự nhiên. Trong bài viết này, chúng ta sẽ khám phá cơ bản của Matplotlib, kỹ thuật tiên tiến, tất cả đi kèm với mã nguồn cụ thể.
Cơ Bản của Matplotlib
Matplotlib là một thư viện phổ biến để vẽ đồ thị và biểu đồ. Hãy bắt đầu với những điều cơ bản.
import matplotlib.pyplot as plt
Vẽ Đồ Thị Đường
# Chuẩn bị dữ liệu x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] # Vẽ đồ thị đường plt.plot(x, y) # Thêm tiêu đề và nhãn cho các trục plt.title('Ví dụ về Đồ Thị Đường') plt.xlabel('Trục X') plt.ylabel('Trục Y') # Hiển thị đồ thị plt.show()
Trong đoạn mã này, chúng ta sử dụng hàm plot
để vẽ đồ thị đường, sau đó sử dụng title
, xlabel
, và ylabel
để thêm tiêu đề và nhãn cho các trục. Cuối cùng, show
được sử dụng để hiển thị đồ thị.
Vẽ Đồ Thị Phân Tán
# Chuẩn bị dữ liệu x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] # Vẽ đồ thị phân tán plt.scatter(x, y, color='red', marker='o') # Thêm tiêu đề và nhãn cho các trục plt.title('Ví dụ về Đồ Thị Phân Tán') plt.xlabel('Trục X') plt.ylabel('Trục Y') # Hiển thị đồ thị plt.show()
Chúng ta sử dụng hàm scatter
để vẽ đồ thị phân tán, và có thể tùy chỉnh màu sắc và kiểu đánh dấu bằng các tham số như color
và marker
.
Vẽ Biểu Đồ Tần Số
# Chuẩn bị dữ liệu data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5] # Vẽ biểu đồ tần số plt.hist(data, bins=5, color='skyblue', edgecolor='black') # Thêm tiêu đề và nhãn cho các trục plt.title('Ví dụ về Biểu Đồ Tần Số') plt.xlabel('Giá Trị') plt.ylabel('Tần Số') # Hiển thị đồ thị plt.show()
Hàm hist
được sử dụng để vẽ biểu đồ tần số, và các tham số như bins
, color
, và edgecolor
cho phép tùy chỉnh hình dạng của biểu đồ tần số.
Kết Hợp Các Loại Biểu Đồ Khác Nhau
Matplotlib cho phép kết hợp các loại biểu đồ khác nhau vào một hình vẽ.
# Chuẩn bị dữ liệu x = [1, 2, 3, 4, 5] y1 = [2, 4, 6, 8, 10] y2 = [1, 2, 1, 2, 1] # Vẽ đồ thị đường và biểu đồ cột cùng một lúc plt.plot(x, y1, label='Đồ Thị Đường', marker='o') plt.bar(x, y2, label='Biểu Đồ Cột', color='orange', alpha=0.7) # Thêm tiêu đề và nhãn cho các trục plt.title('Ví dụ về Kết Hợp Các Loại Biểu Đồ') plt.xlabel('Trục X') plt.ylabel('Trục Y') # Hiển thị chú thích plt.legend() # Hiển thị đồ thị plt.show()
Trong đoạn mã này, chúng ta sử dụng plot
và bar
để vẽ đồ thị đường và biểu đồ cột cùng một lúc, và legend
được sử dụng để hiển thị chú thích.
Tùy Chỉnh Biểu Đồ
Matplotlib cung cấp nhiều tùy chọn tùy chỉnh, chẳng hạn như phạm vi của trục, đánh dấu, và hiển thị lưới.
# Chuẩn bị dữ liệu x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] # Vẽ đồ thị đường plt.plot(x, y, marker='o') # Thêm tiêu đề và nhãn cho các trục plt.title('Ví dụ về Tùy Chỉnh Biểu Đồ') plt.xlabel('Trục X') plt.ylabel('Trục Y') # Đặt phạm vi của trục X từ 0 đến 6 plt.xlim(0, 6) # Đặt đánh dấu của trục Y mỗi 2 đơn vị plt.yticks([0, 2, 4 , 6, 8, 10]) # Hiển thị lưới plt.grid(True) # Hiển thị đồ thị plt.show()
Các hàm như xlim
, yticks
, và grid
được sử dụng để điều chỉnh phạm vi của trục, đánh dấu và hiển thị lưới.
Lưu Biểu Đồ
Các biểu đồ được tạo ra có thể được lưu dưới dạng tệp hình ảnh.
# Chuẩn bị dữ liệu x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] # Vẽ đồ thị đường plt.plot(x, y, marker='o') # Thêm tiêu đề và nhãn cho các trục plt.title('Ví dụ về Lưu Biểu Đồ') plt.xlabel('Trục X') plt.ylabel('Trục Y') # Lưu biểu đồ dưới dạng tệp hình ảnh plt.savefig('plot.png')
Hàm savefig
được sử dụng để lưu biểu đồ đã vẽ với tên tệp được chỉ định.
Kết Luận
Trong bài viết này, chúng ta đã khám phá các cơ bản của Matplotlib, các kỹ thuật tiên tiến để hiển thị dữ liệu trong Python. Khả năng hiển thị dữ liệu một cách hiệu quả là quan trọng trong nhiều lĩnh vực, và Matplotlib là một công cụ mạnh mẽ cho việc đó. Tôi khuyến khích bạn thực nghiệm với các bộ dữ liệu và cài đặt biểu đồ khác nhau để hiểu rõ hơn về dữ liệu của mình. Ngoài ra, tài liệu chính thức và bộ sưu tập hình ảnh của Matplotlib là những nguồn tài nguyên hữu ích để học thêm. Hãy tận hưởng hành trình hiển thị dữ liệu!