Understanding Data Visualization
chapter2 (1)_dv.pdf
chapter1 (1)_vz .pdf
Understanding Data Visualization.docx
Tóm tắt: Khám phá dữ liệu bằng Biểu đồ (Plots)
1. Lợi ích của biểu đồ
- Biểu đồ giúp hiểu dữ liệu dễ dàng hơn so với chỉ tính toán các thống kê tóm tắt.
- Biểu đồ có thể hiển thị các mẫu và mối quan hệ ẩn trong dữ liệu.
2. Ba cách phân tích dữ liệu
- Tính toán các thống kê tóm tắt (mean, median, standard deviation)
- Sử dụng các mô hình thống kê (linear regression, logistic regression)
- Trực quan hóa dữ liệu bằng biểu đồ (scatter plot, histogram)
3. Datasaurus Dozen
- Datasaurus Dozen là một tập hợp 13 bộ dữ liệu bao gồm hai biến: x và y.
- Mặc dù các thống kê tóm tắt (mean, standard deviation) của các biến x và y giống nhau, nhưng biểu đồ cho thấy sự khác biệt giữa các bộ dữ liệu.
4. Biến liên tục và biến rời rạc
- Biến liên tục: Biến có thể biểu diễn bằng số thực (ví dụ: chiều cao, nhiệt độ, doanh thu).
- Biến rời rạc: Biến được phân loại thành các nhóm riêng biệt (ví dụ: màu mắt, quốc gia, ngành nghề).
5. Ví dụ về biến có thể là liên tục hoặc rời rạc
- Tuổi: Có thể là biến liên tục (độ tuổi thực) hoặc biến rời rạc (nhóm tuổi trong khảo sát).