Phân tán trong thống kê là gì?
Sự phân tán là trạng thái bị phân tán hoặc lan rộng. Phân tán thống kê có nghĩa là mức độ mà dữ liệu số có thể thay đổi về giá trị trung bình. Nói cách khác, sự phân tán giúp hiểu được sự phân bố của dữ liệu.
Các biện pháp phân tán
Trong thống kê, các thước đo độ phân tán giúp giải thích sự biến thiên của dữ liệu, tức là để biết mức độ đồng nhất hay không đồng nhất của dữ liệu. Nói một cách dễ hiểu, nó cho thấy mức độ bị siết chặt hoặc phân tán của biến.
Các loại biện pháp phân tán
Có hai loại phương pháp phân tán chính trong thống kê là:
- Đo độ phân tán tuyệt đối
- Đo lường độ phân tán tương đối
Đo độ phân tán tuyệt đối
Một thước đo độ phân tán tuyệt đối chứa cùng một đơn vị với tập dữ liệu ban đầu. Phương pháp phân tán tuyệt đối thể hiện các biến thể về giá trị trung bình của các độ lệch của các quan sát như độ lệch chuẩn hoặc độ lệch phương tiện. Nó bao gồm phạm vi, độ lệch chuẩn , độ lệch phần tư, v.v.
Các loại thước đo tuyệt đối của độ phân tán là:
- Phạm vi: Nó chỉ đơn giản là sự khác biệt giữa giá trị lớn nhất và giá trị nhỏ nhất được cho trong một tập dữ liệu. Ví dụ: 1, 3,5, 6, 7 => Phạm vi = 7 -1 = 6
- Phương sai: Trừ giá trị trung bình từ mỗi dữ liệu trong tập hợp, sau đó bình phương từng dữ liệu và cộng từng bình phương và cuối cùng chia chúng cho tổng không có giá trị nào trong tập dữ liệu là phương sai. Phương sai (σ 2 ) = ∑ (X − μ) 2 / N
- Độ lệch chuẩn: Căn bậc hai của phương sai được gọi là độ lệch chuẩn tức là SD = √σ.
- Phần tư và độ lệch phần tư : Phần tư là các giá trị chia danh sách số thành các phần tư. Độ lệch phần tư là một nửa khoảng cách giữa phần tư thứ ba và phần tư thứ nhất.
- Trung bình và Độ lệch trung bình: Giá trị trung bình của các con số được gọi là giá trị trung bình và trung bình cộng của độ lệch tuyệt đối của các quan sát từ một thước đo có xu hướng trung tâm được gọi là độ lệch trung bình (còn gọi là độ lệch tuyệt đối trung bình).
Ngoài ra, hãy đọc:
Đo lường độ phân tán tương đối
Các thước đo tương đối của độ phân tán được sử dụng để so sánh sự phân bố của hai hoặc nhiều tập dữ liệu. Phép đo này so sánh các giá trị không có đơn vị. Các phương pháp phân tán tương đối phổ biến bao gồm:
- Đồng hiệu quả của Phạm vi
- Hệ số biến thiên
- Đồng hiệu quả của Độ lệch chuẩn
- Đồng hiệu quả của Độ lệch tứ phân vị
- Đồng hiệu quả của Độ lệch trung bình
Đồng hiệu quả của sự phân tán
Hệ số phân tán được tính toán (cùng với thước đo độ phân tán) khi hai chuỗi được so sánh, có sự khác biệt lớn về giá trị trung bình của chúng. Hệ số phân tán cũng được sử dụng khi so sánh hai loạt với các đơn vị đo lường khác nhau. Nó được ký hiệu là CD
Các hệ số phân tán phổ biến là:
CD Trong điều khoản của | Hệ số phân tán |
---|---|
Phạm vi | CD = (X tối đa – X tối thiểu ) ⁄ (X tối đa + X tối thiểu ) |
Độ lệch tứ phân vị | CD = (Q3 – Q1) ⁄ (Q3 + Q1) |
Độ lệch chuẩn (SD) | CD = SD ⁄ Mean |
Độ lệch trung bình | CD = Độ lệch trung bình / Trung bình |
Các phép đo của công thức phân tán
Các công thức quan trọng nhất cho các phương pháp phân tán khác nhau là:
Công thức trung bình số học | Công thức phần tư |
Công thức độ lệch chuẩn | Công thức phương sai |
Công thức phạm vi liên phân vị | Tất cả các công thức thống kê |
Câu hỏi ví dụ
Câu hỏi: Tìm phương sai và độ lệch chuẩn của các số sau: 1, 3, 5, 5, 6, 7, 9, 10. Lời
giải: Trung bình = (1+ 3+ 5+ 5+ 6+ 7+ 9+ 10 ) / 8 = 46/8 = 5,75
Bước 1: Trừ giá trị trung bình khỏi giá trị riêng lẻ
(1 – 5,75), (3 – 5,75), (5 – 5,75), (5 – 5,75), (6 – 5,75), (7 – 5,75), (9 – 5,75), (10 – 5,75)
= -4,75, -2,75, -0,75, -0,75, 0,25, 1,25, 3,25, 4,25
Bước 2: Bình phương các giá trị trên chúng ta nhận được, 22,563, 7,563, 0,563, 0,563, 0,063, 1,563, 10,563, 18,063
Bước 3: 22.563 + 7.563 + 0.563 + 0.563 + 0.063 + 1.563 + 10.563 + 18.063
= 61.504
Bước 4: n = 8, do đó phương sai (σ 2 ) = 61,504 / 8 = 7,69
Bây giờ, độ lệch chuẩn (σ) = 2,77
Câu hỏi thường gặp – Câu hỏi thường gặp
Tại sao sự phân tán lại quan trọng trong thống kê?
Các thước đo về độ phân tán rất quan trọng vì nó giúp hiểu được mức độ lan truyền của dữ liệu (tức là sự biến đổi của nó) xung quanh một giá trị trung tâm.
Làm thế nào để tính toán độ phân tán?
Độ phân tán có thể được tính toán bằng nhiều phép đo khác nhau như giá trị trung bình, độ lệch chuẩn, phương sai, v.v.
Phương sai của các giá trị 3, 8, 6, 10, 12, 9, 11, 10, 12, 7 là gì?
Phương sai của các số sau sẽ là 7,36.