Biểu diễn dữ liệu dưới dạng bảng hoặc đồ thị cho biết tần suất (số lần một quan sát xảy ra trong một khoảng thời gian cụ thể) được gọi là phân bố tần số.
Nếu dữ liệu rất lớn, chẳng hạn, nếu chúng ta cần phân tích điểm của 200 học sinh, thì việc biểu diễn dữ liệu đó theo kiểu ngẫu nhiên là không thực tế lắm. Vì vậy, chúng tôi sử dụng khái niệm ‘Nhóm dữ liệu’ dựa trên các khoảng thời gian của lớp. Trong cuộc thảo luận sắp tới, chúng ta sẽ thảo luận về cách tính độ lệch trung bình cho phân phối tần số liên tục của dữ liệu.
Độ lệch trung bình của dữ liệu được nhóm
Trong phân phối tần số của kiểu liên tục, các khoảng hoặc nhóm lớp được sắp xếp sao cho không có khoảng cách giữa các lớp và mỗi lớp trong bảng có tần suất tương ứng của nó. Các khoảng thời gian trong lớp được chọn sao cho chúng phải loại trừ lẫn nhau và toàn diện.
Để hiểu khái niệm về phân bố tần số liên tục, chúng ta hãy lấy ví dụ sau:
Bảng sau đại diện cho nhóm tuổi của nhân viên làm việc trong một công ty nhất định.
Nhóm tuổi | Số người |
15-25 | 25 |
25-35 | 54 |
35-45 | 34 |
45-55 | 20 |
Sự biểu diễn này có tính chất liên tục và tần suất được đề cập theo khoảng lớp.
Các bước để tính toán độ lệch trung bình của phân bổ tần số liên tục
Để tính toán độ lệch trung bình cho phân phối tần số liên tục, hãy làm theo các bước sau:
Bước i) Giả sử rằng tần số trong mỗi lớp được tập trung tại điểm giữa. Giá trị trung bình được tính cho các điểm giữa này.
Xét ví dụ trên, các điểm giữa được cho là:
Nhóm tuổi | xTôi | Số người(fTôi) |
15-25 | 20 | 25 |
25-35 | 30 | 54 |
35-45 | 40 | 34 |
45-55 | 50 | 20 |
Giá trị trung bình được tính bằng công thức
x¯¯¯ = 1N∑i = 1nxTôifTôi
Bước ii) Độ lệch tuyệt đối trung bình về giá trị trung bình được đưa ra bởi:
M. Một . D . (x¯¯¯) = 1N∑i = 1nfTôi|xTôi–x¯¯¯|
Ví dụ trên có thể được lập thành bảng như sau:
Nhóm tuổi | xTôi | Số người fTôi | fTôixTôi | |xTôi – x¯¯¯| | fTôi|xTôi – x¯¯¯| |
15-25 | 20 | 25 | 500 | 13,684 | 324,1 |
25-35 | 30 | 54 | 1620 | 3.684 | 198,936 |
35-45 | 40 | 34 | 1360 | 6.316 | 214.744 |
45-55 | 50 | 20 | 1000 | 16.316 | 352,32 |
∑ fTôi = 133 | x¯¯¯=1N∑i = 1n xTôifTôi=33,684 | ∑i = 1nfTôi|xTôi – x¯¯¯| = 1090,1 |
Hiện nay M. Một . D . (x¯¯¯) = 1N∑i = 1nfTôi|xTôi – x¯¯¯| = 1090,1133 = 8.196
Lưu ý: Đôi khi để giảm độ phức tạp, giá trị trung bình được tính bằng phương pháp độ lệch bước. Quan sát nằm ở giữa hoặc gần với giá trị giữa được coi là giá trị trung bình giả định. Kết quả thu được ít nhiều giống nhau. Phương pháp này làm giảm kích thước của các quan sát và do đó, độ phức tạp tính toán giảm.
Công thức được sử dụng là:
M. Một . D . (x¯¯¯) = a +hN∑i = 1n fTôidTôi
Ở đâu a là giá trị trung bình giả định, h là yếu tố chung và d = xTôi – một h
Tương tự, để tính toán độ lệch trung bình về giá trị trung vị, chúng ta cần tìm ra giá trị trung bình của tập dữ liệu đã cho với sự trợ giúp của tần số tích lũy, được cho là-
M = l + N2– Cf × h
Ở đâu, l là giới hạn dưới của lớp trung vị.
f là tần số của lớp trung bình,
h là chiều rộng của lớp và,
C là tần số tích lũy của lớp trước đó.
Lớp trung bình là lớp có tần suất tích lũy chỉ lớn hơn N2
Chúng tôi tìm thấy độ lệch trung bình về giá trị trung vị bằng cách sử dụng công thức:
M. Một . D ( M) = 1N∑(i = 1)n fTôi |xTôi – M |
Trong ví dụ đưa ra, độ lệch trung bình về giá trị trung vị được đưa ra như sau:
Lớp học | Tần số | Tần suất tích lũy | Điểm giữa | |xTôi – M | | fTôi|xTôi – M | |
5-15 | 5 | 5 | 10 | 17.42 | 87.1 |
15-25 | 9 | 14 | 20 | 7.42 | 66,78 |
25-35 | 7 | 21 | 30 | 2,58 | 18.06 |
35-45 | 3 | 24 | 40 | 12,58 | 37,74 |
45-55 | số 8 | 32 | 50 | 22,58 | 180,64 |
32 | 390.32 |
Từ N2 = 16. Do đó lớp25 – 35 là lớp trung bình.
M = l + N2– Cf × h
⇒ 25 + 16 – 14 7 × 10 = 27.42
Độ lệch trung bình về giá trị trung bình là M. Một . D ( M) = 1N∑(i = 1)n fTôi |xTôi– M| = 390.3232 = 12,19
Xem thêm: