Video: Tìm dữ liệu trùng lặp trong bảng Excel và tô màu 2025
Khi phân tích dữ liệu cho bảng thống kê của bạn, bạn nên lưu ý rằng một số điểm dữ liệu - được gọi là ngoại lệ - nằm ngoài chuẩn gọi sự chú ý đến bản thân họ. Trong các trường hợp nghiêm trọng nhất, họ thậm chí có thể nghiêng dữ liệu và tạo ra một hình ảnh gây hiểu lầm về chủ đề. Bạn cần phải nhận ra khi bạn có một outlier và sau đó quyết định những gì để làm về nó.
Bảng này chứa một ví dụ đơn giản để chứng minh ý tưởng này. Hai bộ dữ liệu đại diện cho điểm của học sinh, trong tám tuần, trên hai kỳ thi hàng tuần; các con số là phần trăm chính xác trong kỳ thi. Bộ dữ liệu ở bên trái (bài kiểm tra đầu tiên) không chứa phần ngoài, nhưng tập dữ liệu ở bên phải (bài kiểm tra thứ hai). Người ngoài cuộc được thể hiện bằng chữ đậm.
90%Nếu bạn sử dụng tùy chọn này, hãy chắc chắn thêm một chú thích chú giải mọi thứ: trong trường hợp này, việc xóa một điểm dữ liệu. Luôn luôn minh bạch nhất có thể.
Hiển thị dữ liệu dạng.
-
Cho dù bạn đang sử dụng chỉ mức trung bình trong đồ hoạ hoặc vẽ ra tất cả các dữ liệu trong một biểu đồ, bạn luôn có thể hiển thị dữ liệu chính xác như đã cho bạn, như thể hiện trong hình dưới đây. Trong trường hợp này, bạn nên bổ sung một chú thích gắn vào đầu ra để người đọc của bạn nhận thức đầy đủ về nó.
Xây dựng một "dòng phù hợp nhất. "Tùy chọn này chỉ áp dụng nếu bạn đang tạo một biểu đồ hiển thị tất cả dữ liệu. Một dòng phù hợp nhất - còn được gọi là hồi quy tuyến tính
là mức trung bình trực quan của dữ liệu của bạn: nghĩa là đường biểu diễn dữ liệu rải rác của bạn tốt nhất.
-