Video: Những Giọt Nước Mắt Oan Ức Của Giảng Viên Nguyễn Hồng Nhung 2025
Khi bạn dựa vào công nghệ hoặc thiết bị để tiến hành công việc phân tích tiên đoán, sự cố ở đây hoặc ở đó có thể khiến các thiết bị này đăng ký các giá trị cực đoan hoặc bất thường. Nếu cảm biến đăng ký các giá trị quan sát không đáp ứng các tiêu chuẩn kiểm soát chất lượng cơ bản, chúng có thể gây ra sự gián đoạn thực sự được phản ánh trong dữ liệu.
Một người nào đó thực hiện nhập dữ liệu, ví dụ, có thể dễ dàng thêm một số 0 vào cuối một giá trị do nhầm lẫn, đưa ra khỏi phạm vi và tạo ra một ngoại lệ.
Nếu bạn đang quan sát dữ liệu quan sát được bởi bộ cảm biến nước được lắp đặt ở Cảng Baltimore - và nó báo cáo mực nước sâu 20 feet trên mực nước biển có nghĩa là bạn đã có một ngoại lệ. Cảm biến này rõ ràng là sai trừ khi Baltimore được phủ kín hoàn toàn bằng nước.
Dữ liệu có thể kết thúc có ngoại tuyến bởi vì các sự kiện bên ngoài hoặc lỗi do người hoặc dụng cụ gây ra.
Nếu một sự cố thực sự như sự sụp đổ của đèn flash được bắt nguồn từ một lỗi trong hệ thống, hậu quả của nó vẫn còn thực - nhưng nếu bạn biết nguồn gốc của vấn đề, bạn có thể kết luận rằng một lỗ hổng trong dữ liệu chứ không phải mô hình của bạn, là để đổ lỗi cho nếu mô hình của bạn đã không dự đoán sự kiện.
Biết nguồn gốc của bên ngoài sẽ hướng dẫn bạn quyết định làm thế nào để đối phó với nó. Các lỗi ngoại vi là kết quả của lỗi nhập dữ liệu có thể dễ dàng sửa chữa sau khi tham khảo nguồn dữ liệu. Bên ngoài phản ánh thực tế thay đổi có thể khiến bạn thay đổi mô hình của mình.
Không có một kích cỡ phù hợp với tất cả câu trả lời khi bạn quyết định đưa hoặc bỏ qua dữ liệu cực đoan không phải là lỗi hoặc trục trặc. Phản hồi của bạn phụ thuộc vào bản chất của phân tích bạn đang thực hiện - và về loại mô hình mà bạn đang xây dựng. Trong một vài trường hợp, cách để đối phó với các điểm ngoài cùng này là đơn giản:
-
Nếu bạn theo dõi lỗi ngoại vi của mình với lỗi nhập dữ liệu khi bạn tham khảo nguồn dữ liệu, bạn có thể dễ dàng sửa dữ liệu và (có thể) giữ nguyên mô hình.
-
Nếu cảm biến nước ở Baltimore Harbor báo cáo nước ở độ sâu 20 feet trên mực nước biển có nghĩa là bạn đang ở Baltimore, hãy nhìn ra cửa sổ của bạn:
-
Nếu Baltimore không bị nước che phủ, bộ cảm biến rõ ràng là sai.
-
Nếu bạn nhìn thấy một con cá đang nhìn vào bạn, thực tế đã thay đổi; bạn có thể phải sửa đổi mô hình của bạn.
-
-
Sự sụp đổ của đèn flash có thể đã là sự kiện một lần (dù là ngắn hạn), nhưng hiệu quả của nó là thực - và nếu bạn đã nghiên cứu về thị trường trong thời gian dài, bạn sẽ biết rằng một điều tương tự có thể xảy ra.Nếu kinh doanh của bạn là tài chính và bạn đối phó với thị trường chứng khoán tất cả các thời gian, bạn muốn mô hình của bạn để tài khoản cho sự sai lạc như vậy.
Nhìn chung, nếu kết quả của một sự kiện thường được coi là ngoại tệ có thể có tác động đáng kể đến doanh nghiệp của bạn, hãy xem xét làm thế nào để đối phó với những sự kiện đó trong phân tích của bạn. Giữ những điểm chung này trong tâm trí về các giá trị ngoại vi:
-
Số liệu nhỏ hơn, càng có ý nghĩa càng có ý nghĩa đối với những tác động có thể có trong phân tích.
-
Khi bạn phát triển mô hình của mình, hãy chắc chắn bạn cũng phát triển các kỹ thuật để tìm ra những điều ngoài tầm mắt và để hiểu một cách có hệ thống tác động của chúng đến công việc kinh doanh của bạn.
-
Việc phát hiện các giá trị bên ngoài có thể là một quá trình phức tạp; không có cách đơn giản để xác định chúng.
-
Chuyên gia tên miền (người biết lĩnh vực bạn đang làm người mẫu) là người tiếp cận tốt nhất của bạn để xác minh liệu điểm dữ liệu có hợp lệ hay không, bạn có thể bỏ qua hoặc là một bên ngoài bạn có để đưa vào tài khoản. Chuyên gia về miền cần có khả năng giải thích yếu tố tạo ra ngoại tệ, phạm vi biến đổi của nó là gì, và tác động của nó đối với hoạt động kinh doanh. Công cụ hiển thị có thể giúp bạn phát hiện ra những điểm sai lệch trong dữ liệu. Ngoài ra, nếu bạn biết phạm vi mong đợi của các giá trị, bạn có thể dễ dàng truy vấn dữ liệu nằm ngoài phạm vi đó.