Video: JFK Assassination Conspiracy Theories: John F. Kennedy Facts, Photos, Timeline, Books, Articles 2025
Trong phân tích có giám sát, và đầu ra ưa thích là một phần của dữ liệu huấn luyện. Mô hình phân tích tiên đoán được trình bày với kết quả chính xác như là một phần của quá trình học tập của nó. Việc học có giám sát giả định các ví dụ được phân loại trước: Mục đích là để mô hình học hỏi từ phân loại đã biết trước đó để nó có thể ghi nhãn điểm dữ liệu không rõ tiếp theo dựa trên những gì nó đã học.
Khi quá trình đào tạo của mô hình hoàn thành, một chức năng toán học được suy ra bằng cách kiểm tra dữ liệu huấn luyện. Chức năng đó sẽ được sử dụng để ghi nhãn các điểm dữ liệu mới.
Để cách tiếp cận này hoạt động chính xác, dữ liệu huấn luyện - cùng với dữ liệu kiểm tra - phải được lựa chọn cẩn thận. Mô hình được đào tạo có thể dự đoán chính xác nhãn cho điểm dữ liệu một cách nhanh chóng và chính xác, dựa trên (các) kiểu dữ liệu mà mô hình đã thấy trong dữ liệu huấn luyện.
Phân tích giám sát mang lại một số ưu điểm khác nhau:
-
Nhà phân tích chịu trách nhiệm về quy trình.
-
Ghi nhãn dựa trên các phân loại đã biết.
-
Các lỗi ghi nhãn có thể dễ dàng giải quyết.
Mặt trái của những ưu điểm này là một điểm bất lợi khác biệt:
-
Bất kỳ sai lầm nào trong giai đoạn đào tạo sẽ được củng cố thêm sau đó.
-
Phân loại do nhà phân tích cung cấp có thể không mô tả toàn bộ dân số một cách đầy đủ.
-
Mô hình có thể không thể phát hiện ra các lớp học đi chệch khỏi bộ tập huấn ban đầu.
-
Giả định rằng các cụm trong dữ liệu không chồng lấn - và chúng có thể dễ dàng tách ra - có thể không có giá trị.