Bảng phân phối tần suất cho dữ liệu được nhóm
Khi dữ liệu thu thập được lớn, chúng ta có thể làm theo cách tiếp cận dưới đây để phân tích nó một cách dễ dàng bằng cách sử dụng các dấu kiểm đếm .
Thí dụ:
Xét điểm của 50 sinh viên khóa VII đạt được trong một kỳ kiểm tra. Điểm tối đa của kỳ thi là 50.
23, 8, 13, 18, 32, 44, 19, 8, 25, 27, 10, 30, 22, 40, 39, 17, 25, 9, 15, 20, 30, 24, 29, 19, 16, 33, 38, 46, 43, 22, 37, 27, 17, 11, 34, 41, 35, 45, 31, 26, 42, 18, 28, 30, 22, 20, 33, 39, 40, 32
Nếu chúng ta tạo một bảng phân phối tần số cho mỗi và mọi quan sát, thì nó sẽ tạo thành một bảng lớn. Vì vậy, để dễ hiểu, chúng ta có thể lập một bảng với một nhóm các quan sát từ 0 đến 10, 10 đến 20, v.v.
Phân bố thu được trong bảng trên được gọi là phân bố tần số được nhóm lại. Điều này giúp chúng tôi đưa ra nhiều suy luận quan trọng như:
(i) Nhiều học sinh đạt từ 20-40, tức là 20-30 và 30-40.
(ii) 8 học sinh đạt trên 40 điểm, tức là các em đạt trên 80% trong bài thi.
Trong bảng thu được ở trên, các nhóm 0-10, 10-20, 20-30,… được gọi là các khoảng lớp (hoặc các lớp). Người ta quan sát thấy rằng 10 xuất hiện trong cả hai khoảng thời gian, chẳng hạn như 0-10 và 10-20. Tương tự, 20 xuất hiện trong cả hai khoảng thời gian, chẳng hạn như 10-20 và 20-30. Nhưng việc quan sát 10 hoặc 20 có thể thuộc hai lớp đồng thời là không khả thi. Để tránh sự mâu thuẫn này, chúng tôi chọn quy tắc rằng kết luận chung sẽ thuộc về lớp cao hơn. Có nghĩa là 10 thuộc khoảng lớp 10-20 nhưng không thuộc 0-10. Tương tự, 20 thuộc về 20-30 nhưng không thuộc 10-20, v.v.
Hãy xem xét một lớp giả sử là 10-20, trong đó 10 là khoảng của lớp dưới và 20 là khoảng của lớp trên. Sự khác biệt giữa giới hạn lớp trên và lớp dưới được gọi là chiều cao lớp hoặc kích thước lớp hoặc chiều rộng lớp của khoảng cách lớp.
Làm thế nào để xác định quy mô lớp học?
Để tránh nhầm lẫn về kích thước của các khoảng lớp mà chúng ta cần thực hiện trong khi nhóm dữ liệu, người ta phải làm theo các bước dưới đây.
Bước 1: Xác định các giá trị dữ liệu cao nhất và thấp nhất (nhỏ nhất) trong các quan sát đã cho.
Bước 2: Tìm sự khác biệt giữa giá trị cao nhất và giá trị nhỏ nhất.
Bước 3: Bây giờ, giả sử số lượng khoảng thời gian của lớp học mà chúng ta cần (thường từ 5 đến 20 lớp được đề xuất để thực hiện dựa trên số lượng quan sát).
Bước 4: Chia sự khác biệt của giá trị cao nhất và nhỏ nhất cho số lớp, điều này dẫn đến kích thước của khoảng lớp.
Bước 5: Trong trường hợp có bất kỳ số thập phân nào thu được dưới dạng sĩ số lớp thì lấy số nguyên gần nhất lớn hơn số thập phân thu được làm kích thước lớp học.
Biểu đồ
Chúng ta có thể hiển thị bảng phân phối tần suất ở trên bằng đồ thị bằng biểu đồ. Xem xét các khoảng lớp trên trục hoành và tần số trên trục tung.
Chiều cao của các thanh thể hiện tần số của khoảng lớp. Không có khoảng cách giữa các thanh vì không có khoảng cách giữa các lớp.
Câu hỏi thường gặp – Câu hỏi thường gặp
Dữ liệu được nhóm và dữ liệu không được nhóm là gì?
Ví dụ về dữ liệu được nhóm là gì?
Ưu điểm của việc phân nhóm dữ liệu là gì?
Hỗ trợ chúng tôi tập trung chủ yếu vào các nhóm con thiết yếu và bỏ qua những nhóm nhỏ
Giúp tăng hiệu quả và tính đúng đắn của ước tính cần thiết