Trang Chủ Tài chính Cá nhân Tìm ra những Outliers trong Dữ liệu Infographics của bạn - núm vú

Tìm ra những Outliers trong Dữ liệu Infographics của bạn - núm vú

Video: Tìm dữ liệu trùng lặp trong bảng Excel và tô màu 2025

Video: Tìm dữ liệu trùng lặp trong bảng Excel và tô màu 2025
Anonim

Khi phân tích dữ liệu cho bảng thống kê của bạn, bạn nên lưu ý rằng một số điểm dữ liệu - được gọi là ngoại lệ - nằm ngoài chuẩn gọi sự chú ý đến bản thân họ. Trong các trường hợp nghiêm trọng nhất, họ thậm chí có thể nghiêng dữ liệu và tạo ra một hình ảnh gây hiểu lầm về chủ đề. Bạn cần phải nhận ra khi bạn có một outlier và sau đó quyết định những gì để làm về nó.

Bảng này chứa một ví dụ đơn giản để chứng minh ý tưởng này. Hai bộ dữ liệu đại diện cho điểm của học sinh, trong tám tuần, trên hai kỳ thi hàng tuần; các con số là phần trăm chính xác trong kỳ thi. Bộ dữ liệu ở bên trái (bài kiểm tra đầu tiên) không chứa phần ngoài, nhưng tập dữ liệu ở bên phải (bài kiểm tra thứ hai). Người ngoài cuộc được thể hiện bằng chữ đậm.

90%

90% 2 88% 88% 3 90% 90% 4 85% 50% 5 86% 86% 6 87% 87% 7 85% 85% 8 84% 84% Trung bình > 87% 83%

Trung bình trong cột giữa vẽ một bức tranh chính xác về thành tích của học sinh đó trong các cuộc kiểm tra định kỳ. Mặc dù chỉ số đơn vị (đậm) ngoài (50%) trong tập dữ liệu ở bên phải ném cờ lê vào các công trình, mặc dù giảm trung bình của học sinh xuống 4 điểm phần trăm và nghiêng dữ liệu. Nhà báo dữ liệu làm gì trong trường hợp như vậy? Dưới đây là một vài lựa chọn: Vứt bỏ các outlier. Nếu bạn chỉ sử dụng mức trung bình trong đồ họa của bạn và lo ngại rằng nó gây hiểu nhầm, hãy loại bỏ phần ngoại tệ như là sự sai lệch và sau đó tính trung bình mà không có tuần đó, như thể hiện trong hình.
Trong ví dụ này, việc ném ra bên ngoài sẽ có nghĩa là điểm kiểm tra trung bình của học sinh này nhảy lên đến 87%, mà (như cột đầu tiên thể hiện) là một sự thể hiện tốt hơn về thành tích trong suốt học kỳ.

Nếu bạn sử dụng tùy chọn này, hãy chắc chắn thêm một chú thích chú giải mọi thứ: trong trường hợp này, việc xóa một điểm dữ liệu. Luôn luôn minh bạch nhất có thể.

Hiển thị dữ liệu dạng.

  • Cho dù bạn đang sử dụng chỉ mức trung bình trong đồ hoạ hoặc vẽ ra tất cả các dữ liệu trong một biểu đồ, bạn luôn có thể hiển thị dữ liệu chính xác như đã cho bạn, như thể hiện trong hình dưới đây. Trong trường hợp này, bạn nên bổ sung một chú thích gắn vào đầu ra để người đọc của bạn nhận thức đầy đủ về nó.

    Xây dựng một "dòng phù hợp nhất. "

    Tùy chọn này chỉ áp dụng nếu bạn đang tạo một biểu đồ hiển thị tất cả dữ liệu. Một dòng phù hợp nhất - còn được gọi là hồi quy tuyến tính

    là mức trung bình trực quan của dữ liệu của bạn: nghĩa là đường biểu diễn dữ liệu rải rác của bạn tốt nhất.

Tìm ra những Outliers trong Dữ liệu Infographics của bạn - núm vú

Lựa chọn của người biên tập

Thiết bị lỗi liên quan Bạn cần biết - núm vú

Thiết bị lỗi liên quan Bạn cần biết - núm vú

Khi theo đuổi chứng chỉ CompTIA A + của bạn, bạn cần biết về các lỗi liên quan đến thiết bị và phải làm gì khi bạn gặp chúng. Thật không may là các thiết bị và trình điều khiển của họ cho phép mọi người thực hiện được rất nhiều công việc hàng ngày của họ với máy tính cũng là một trong những yếu tố lớn nhất không thể ...

Kiểm soát an ninh dữ liệu - xác người

Kiểm soát an ninh dữ liệu - xác người

Tài sản nhạy cảm, kể cả dữ liệu, phải được bảo vệ thích hợp trong suốt vòng đời của chúng. Là một chuyên gia bảo mật, đó là công việc của bạn. Quản lý vòng đời thông tin (ILM) bao gồm dữ liệu thông qua 5 giai đoạn sau: Sáng tạo. Dữ liệu được tạo bởi người dùng cuối hoặc ứng dụng. Dữ liệu cần được phân loại vào thời điểm này, dựa trên mức độ nghiêm trọng và độ nhạy cảm của

Kiểm tra Thẩm định CISSP - nồng độ

Kiểm tra Thẩm định CISSP - nồng độ

Kỳ kiểm tra chứng nhận của Hệ thống Thông tin Chứng chỉ (CISSP) là một 6 giờ, 250-câu hỏi marathon. Để đưa vào quan điểm, trong 6 giờ bạn có thể đi bộ khoảng 25 dặm, xem một bộ phim Kevin Costner 1-1 / 2 lần, hoặc hát “My Way” 540 lần trên một máy karaoke. Mỗi kỳ thi tương ứng gần giống nhau về thể chất, ...

Lựa chọn của người biên tập

Biên soạn danh sách thư điện tử thương mại - núm vú

Biên soạn danh sách thư điện tử thương mại - núm vú

Xây dựng một danh sách e-mail thương mại rắn thời gian, nhưng nỗ lực của bạn trong các phương tiện truyền thông xã hội trả hết. Danh sách email được mua hoặc thuê từ môi giới có thể không đáng tin cậy, ngay cả khi họ xác nhận rằng danh sách được nhắm mục tiêu và rằng tất cả các địa chỉ được chọn tham gia. Bạn có thực sự nghĩ rằng nếu ai đó có một danh sách email hiệu quả cao?

Kiểm tra Doanh nghiệp của Bạn về Công cụ Tìm kiếm - những người có đầu

Kiểm tra Doanh nghiệp của Bạn về Công cụ Tìm kiếm - những người có đầu

Mọi người vào Internet để khám phá hầu hết mọi loại hình kinh doanh. Sử dụng phương tiện truyền thông xã hội cho thương mại bắt đầu bằng việc nghiên cứu những gì trên web liên quan đến doanh nghiệp của bạn. Cho dù họ đang tìm kiếm cupcakes hoặc nha sĩ, điểm dừng đầu tiên của họ là một công cụ tìm kiếm. Có bao nhiêu người vào các trang web này? Những con số này đáng kinh ngạc. Ba người

Doanh nghiệp của bạn cần tiếp thị e-mail? - núm vú

Doanh nghiệp của bạn cần tiếp thị e-mail? - núm vú

Các kênh giao tiếp mới hiệu quả hơn rất nhiều so với e-mail. Một bài đăng trên Facebook hoặc Twitter có thể cung cấp một thông điệp mạnh mẽ cho khán giả mà bạn đã làm việc chăm chỉ để tu luyện. Tuy nhiên, những người ủng hộ phương tiện truyền thông xã hội muốn bạn tin rằng, e-mail không chết - có nhiều cách để kết nối ...

Lựa chọn của người biên tập

Làm thế nào để Viết một tuyên bố Class - núm vú

Làm thế nào để Viết một tuyên bố Class - núm vú

Bạn viết lệnh lớp PHP để xác định các thuộc tính và phương pháp cho lớp học. Lớp là mẫu (mẫu) cho đối tượng. Câu lệnh class có định dạng chung như sau: class className {Thêm các câu lệnh xác định thuộc tính Thêm tất cả các method} Bạn có thể sử dụng bất kỳ ký hiệu xác nhận PHP hợp lệ nào cho <...

Theo kịp với sự thay đổi của PHP và MySQL - các núm vú giả

Theo kịp với sự thay đổi của PHP và MySQL - các núm vú giả

PHP và MySQL là phần mềm mã nguồn mở. Nếu bạn chỉ sử dụng phần mềm từ các nhà xuất bản phần mềm lớn như Microsoft, Corel hay Adobe - bạn sẽ thấy rằng phần mềm nguồn mở là một loài hoàn toàn khác. Nó được phát triển bởi một nhóm các lập trình viên viết mã vào thời gian rảnh rỗi của họ, cho vui và miễn phí. ...

Cách sử dụng các biến PHP cho việc lập trình HTML5 và CSS3

Cách sử dụng các biến PHP cho việc lập trình HTML5 và CSS3

Một biến PHP có thể được đặt tên gần như bất cứ điều gì trong lập trình HTML5 và CSS3. Có một số từ dành riêng mà bạn không thể đặt tên cho một biến (như in, đã có ý nghĩa trong PHP), vậy nếu chương trình của bạn không hoạt động và bạn không thể hiểu tại sao, hãy thử thay đổi một số tên biến hoặc tìm kiếm tại chỗ ...