Video: Kỷ lục gia trí nhớ Dương Anh Vũ hướng dẫn cách khai phá tiềm năng bộ não con người? 2025
Một phần của việc khai thác dữ liệu cho những người mới bắt đầu Cheat Sheet
Quá trình Tiêu chuẩn Đa ngành cho Khai phá dữ liệu ( CRISP-DM ) là khuôn khổ quy trình khai thác dữ liệu thống trị. Đó là một tiêu chuẩn mở; bất cứ ai có thể sử dụng nó. Danh sách sau đây mô tả các giai đoạn khác nhau của quy trình.
-
Hiểu biết về doanh nghiệp: Hiểu rõ vấn đề bạn giải quyết, tác động của nó tới tổ chức của bạn và mục đích của bạn để giải quyết vấn đề đó. Nhiệm vụ trong giai đoạn này bao gồm:
-
Đánh giá hoàn cảnh của bạn
-
Xác định các mục tiêu khai thác dữ liệu của bạn
-
Tạo kế hoạch dự án của bạn
-
Sự hiểu biết về dữ liệu:
Xem lại dữ liệu bạn có, tài liệu, xác định các vấn đề về quản lý dữ liệu và chất lượng dữ liệu. Các nhiệm vụ cho giai đoạn này bao gồm: Thu thập dữ liệu
-
Mô tả
-
-
Xác minh chất lượng
-
Chuẩn bị dữ liệu:
Chuẩn bị dữ liệu của bạn sẵn sàng để sử dụng cho mô hình hóa. Các công việc cho giai đoạn này bao gồm: Chọn dữ liệu
-
Dữ liệu làm sạch
-
Xây dựng
-
Tích hợp
-
Định dạng
-
Mô hình:
Sử dụng các kỹ thuật toán học để xác định các mẫu trong dữ liệu của bạn. Các nhiệm vụ cho giai đoạn này bao gồm: Thiết kế thử nghiệm
-
Các mô hình xây dựng
-
Đánh giá các mô hình
-
Đánh giá:
-
Xem lại các mô hình bạn đã phát hiện và đánh giá tiềm năng sử dụng trong kinh doanh. Các nhiệm vụ cho giai đoạn này bao gồm:
Đánh giá kết quả Rà soát quy trình
-
Xác định các bước tiếp theo
-
Triển khai:
-
Đưa khám phá của bạn vào làm việc hàng ngày. Các nhiệm vụ cho giai đoạn này bao gồm:
Lập kế hoạch triển khai (các phương pháp của bạn cho việc tích hợp các khám phá khai thác dữ liệu vào sử dụng) Báo cáo kết quả cuối cùng
-
Xem lại kết quả cuối cùng