Trang Chủ Tài chính Cá nhân Giai đoạn 2 của Mô hình Quy trình CRISP-DM: Hiểu đoạn văn bản

Giai đoạn 2 của Mô hình Quy trình CRISP-DM: Hiểu đoạn văn bản

Mục lục:

Video: Quy trình nuôi tôm thẻ chân trắng siêu thâm canh 2 giai đoạn 2025

Video: Quy trình nuôi tôm thẻ chân trắng siêu thâm canh 2 giai đoạn 2025
Anonim

Trong giai đoạn thứ hai của Mô hình quá trình Tiêu chuẩn hoá Công nghiệp Đa thập phân (CRISP-DM), bạn lấy dữ liệu và xác minh rằng nó là thích hợp cho nhu cầu của bạn. Bạn có thể xác định các vấn đề khiến bạn trở lại với sự hiểu biết về kinh doanh và sửa đổi kế hoạch của mình. Bạn thậm chí có thể khám phá những sai sót trong sự hiểu biết về kinh doanh của bạn, một lý do khác để xem xét lại các mục tiêu và kế hoạch.

Giai đoạn hiểu biết về dữ liệu bao gồm bốn nhiệm vụ . Đây là

  • Thu thập dữ liệu

  • Mô tả dữ liệu

  • Khám phá dữ liệu

  • Xác minh chất lượng dữ liệu

Nhiệm vụ: thu thập dữ liệu

Bạn vừa đặt mục tiêu và định nghĩa một kế hoạch khai thác dữ liệu. Mỗi bước của kế hoạch phụ thuộc vào việc có đúng dữ liệu. Tốt hơn hãy chắc chắn rằng bạn thực sự có dữ liệu đó!

Chỉ cần một bản phân phối cho nhiệm vụ này: báo cáo thu thập dữ liệu ban đầu. Trong báo cáo của bạn, bạn cần xác minh rằng bạn đã có được dữ liệu hoặc ít nhất đã có quyền truy cập vào dữ liệu, kiểm tra quá trình truy cập dữ liệu và xác minh rằng dữ liệu tồn tại. Bạn cũng cần tải dữ liệu vào bất kỳ công cụ nào bạn sẽ sử dụng để khai thác dữ liệu để xác minh rằng các công cụ tương thích với dữ liệu.

Bạn có thể làm rất nhiều công việc để tập hợp các dữ liệu bạn cần trước khi bạn có thể viết báo cáo này. Trước tiên, bạn sẽ lập kế hoạch của mình như sau:

  • Các yêu cầu về dữ liệu phác thảo: Tạo một danh sách các loại dữ liệu cần thiết để giải quyết các mục tiêu khai thác dữ liệu. Mở rộng danh sách với các chi tiết như khoảng thời gian bắt buộc và định dạng dữ liệu.

  • Xác minh tính khả dụng của dữ liệu: Xác nhận rằng dữ liệu cần có tồn tại, và bạn có thể sử dụng nó. Nếu một số dữ liệu bạn muốn không có sẵn, hãy quyết định cách bạn sẽ giải quyết vấn đề đó. Xem xét các lựa chọn thay thế như

  • Xác định các tiêu chí lựa chọn:

  • Xác định các nguồn dữ liệu cụ thể (cơ sở dữ liệu, các tệp tin, tài liệu, v.v …) bạn sẽ sử dụng. Trong những nguồn này, hãy xác định các bảng, trường và các dãy trường hợp có liên quan đến dự án này.

  • Khi bạn đã trải qua các bước này, bạn phải thực sự có được dữ liệu. Ở giai đoạn này, nhập dữ liệu vào nền tảng khai thác dữ liệu bạn sẽ sử dụng cho dự án để xác nhận rằng có thể làm được điều đó và bạn hiểu quy trình. Trong quá trình thử nghiệm này, bạn có thể phát hiện các hạn chế về phần mềm (hoặc phần cứng) mà bạn đã không lường trước, chẳng hạn như

  • Giới hạn về số trường hợp hoặc trường, hoặc số lượng bộ nhớ bạn có thể sử dụng Không có khả năng đọc các định dạng dữ liệu của các nguồn của bạn

  • Khó khăn trong việc xử lý các sự không chính xác của dữ liệu (ví dụ, bạn có thể gặp phải các sản phẩm sẽ không nhập hoặc phân tích các tập dữ liệu không đầy đủ)

    • Cuối cùng, tóm tắt quá trình thu thập trong một báo cáo.Báo cáo nên mô tả các yêu cầu của bạn, và giải thích một cách chi tiết chính xác những dữ liệu bạn đã thu thập và từ những nguồn nào. Tại đây bạn xác nhận rằng bạn đã thực sự có được dữ liệu và nó tương thích với nền tảng khai thác dữ liệu của bạn. Nếu bạn gặp khó khăn, bạn sẽ giải thích họ là gì và làm thế nào bạn đã giải quyết chúng (sử dụng các nguồn thay thế, sửa đổi kế hoạch, thay đổi định dạng).

    • Việc phân phát cho nhiệm vụ này chỉ là một báo cáo đơn giản, nhưng công việc bạn cần làm trước khi bạn có thể viết báo cáo đó sẽ không đơn giản! Truy cập dữ liệu có thể là một trong những phần khó nhất và gây bực bội nhất của quá trình khai thác dữ liệu, với cả thách thức về kỹ thuật và kinh doanh.

    • Nhiệm vụ: Mô tả dữ liệu

    Bây giờ bạn đã có dữ liệu, hãy chuẩn bị một mô tả chung về những gì bạn có.

    Sự phân phối cho nhiệm vụ này là báo cáo mô tả dữ liệu. Trong đó, bạn mô tả nguồn và định dạng của dữ liệu, số lượng trường hợp, số lượng và mô tả của các trường và bất kỳ thông tin chung nào khác có thể quan trọng. Bạn cũng thực hiện một đánh giá ngắn gọn về sự phù hợp của dữ liệu cho mục đích khai thác dữ liệu của bạn. Ví dụ: xác minh rằng dữ liệu bao gồm các trường mà bạn mong đợi và cần phải ở đó và có đủ các trường hợp để phân tích.

    Nhiệm vụ: Khám phá dữ liệu

    Trong nhiệm vụ này, bạn kiểm tra dữ liệu chặt chẽ hơn. Đối với mỗi biến, bạn nhìn vào phạm vi của các giá trị và sự phân bố của chúng. Bạn sẽ sử dụng thao tác dữ liệu đơn giản và kỹ thuật thống kê cơ bản để kiểm tra thêm vào dữ liệu. Thăm dò dữ liệu hỗ trợ nhiều mục đích:

    Làm quen với dữ liệu.

    Dấu hiệu điểm các vấn đề về chất lượng dữ liệu.

    Thiết lập giai đoạn chuẩn bị dữ liệu.

    • Kết quả của nhiệm vụ này là báo cáo thăm dò dữ liệu. Đây là nơi để ghi lại các giả thuyết hoặc phát hiện ban đầu mà bạn đã phát triển trong quá trình khảo sát dữ liệu. Báo cáo này nên bao gồm mô tả chi tiết hơn dữ liệu so với báo cáo mô tả dữ liệu, bao gồm bản phân phối, tóm tắt và bất kỳ dấu hiệu nào của sự cố về chất lượng dữ liệu.

    • Nhiệm vụ: Xác minh chất lượng dữ liệu

    • Bạn có dữ liệu và bạn đã kiểm tra nó, và bây giờ bạn phải xác định liệu nó có đủ tốt để hỗ trợ mục tiêu của bạn. Bạn thường sẽ có một số vấn đề về chất lượng để giải quyết nhưng vẫn có thể tiến lên phía trước, nhưng đôi khi chất lượng dữ liệu quá kém đến nỗi nó không thể hỗ trợ kế hoạch của bạn và bạn sẽ phải tìm kiếm các phương án khác. Một số vấn đề dữ liệu tồi tệ nhất sẽ bao gồm

    Dữ liệu bạn cần không tồn tại. Có phải dữ liệu này được thu thập và lưu trữ để sử dụng trong tương lai không?)

    Nó tồn tại, nhưng bạn không thể có nó. (Có thể vượt qua được giới hạn này không?)

    Bạn thấy các vấn đề về chất lượng dữ liệu nghiêm trọng (rất nhiều thiếu sót hoặc các giá trị không chính xác mà không thể sửa chữa được).

    • Sự phân phối cho nhiệm vụ này là báo cáo chất lượng dữ liệu. Điều này tóm tắt dữ liệu bạn có, các vấn đề chất lượng nhỏ và quan trọng mà bạn đã tìm thấy và các biện pháp khắc phục có thể cho các vấn đề về chất lượng hoặc các phương án thay thế (chẳng hạn như sử dụng tài nguyên dữ liệu thay thế).Nếu bạn đang gặp phải bất kỳ vấn đề nghiêm trọng về chất lượng dữ liệu và không thể xác định được giải pháp đầy đủ, bạn có thể phải đề nghị xem xét lại mục tiêu hoặc kế hoạch.

    Giai đoạn 2 của Mô hình Quy trình CRISP-DM: Hiểu đoạn văn bản

    Lựa chọn của người biên tập

    Cách chuyển đổi điện áp Hiện tại Bật và Tắt - núm vú

    Cách chuyển đổi điện áp Hiện tại Bật và Tắt - núm vú

    Chuyển mạch là chức năng quan trọng nhất trong thiết bị điện tử. Hãy nghĩ đến bộ TV của bạn: Bạn bật và tắt nguồn, chọn nguồn tín hiệu từ các lựa chọn đầu vào khác nhau (như đầu DVD, hộp cáp hoặc hệ thống chơi game) và thay đổi kênh truyền hình. Màn hình TV của bạn bao gồm hàng triệu điểm ảnh nhỏ (hình ảnh ...

    Làm thế nào để Solder một Solid Joint trong Dự án Điện tử của bạn - núm vú

    Làm thế nào để Solder một Solid Joint trong Dự án Điện tử của bạn - núm vú

    Làm thế nào để Solder một Solid Joint trong dự án Điện tử của bạn < hình thức hàn phổ biến nhất khi tạo ra các dự án điện tử là thành phần hàn dẫn đến miếng đồng ở mặt sau của một bảng mạch in. Nếu bạn có thể làm điều đó, bạn sẽ không có vấn đề với các loại hàn khác, chẳng hạn như hàn hai dây với nhau hoặc hàn một dây vào một thiết bị đầu cuối chuyển đổi. Sau đây ...

    ÁNh sáng-O-Rama Sequences được sử dụng trong chiếu sáng - đầu

    ÁNh sáng-O-Rama Sequences được sử dụng trong chiếu sáng - đầu

    Ở Light-O-Rama , một dãy được biểu diễn dưới dạng một lưới tương tự như lưới trong một chương trình bảng tính. Ví dụ, hình ảnh cho thấy một phần của một chuỗi rất đơn giản, trong đó đèn trên các kênh 1, 3 và 5 luân phiên bật và tắt mỗi nửa giây. Mỗi hàng trong lưới đại diện cho một ...

    Lựa chọn của người biên tập

    Làm thế nào để Tạo một trang Blog trong SharePoint - núm vú

    Làm thế nào để Tạo một trang Blog trong SharePoint - núm vú

    Để Tạo một blog trong SharePoint, bạn tạo ra một trang web mới hoặc địa điểm phụ. Dành thời gian để xem xét nơi blog này sẽ nằm trong thứ bậc trang web của bạn. Mặc dù bạn có thể thay đổi quyền ở bất kỳ mức nào, bạn vẫn có thể có blog tổng thống của bạn trên trang chính của SharePoint Intranet của bạn (và ...

    Làm thế nào để tạo một ứng dụng tùy chỉnh trong SharePoint 2013 - núm vú

    Làm thế nào để tạo một ứng dụng tùy chỉnh trong SharePoint 2013 - núm vú

    Bạn tạo một ứng dụng tùy chỉnh sử dụng Custom Liệt kê ứng dụng. Ứng dụng Danh sách tùy chỉnh tạo ra một ứng dụng danh sách rất cơ bản mà sau đó bạn có thể tuỳ chỉnh cho kịch bản cụ thể của mình. Thực hiện theo các bước sau để tạo một ứng dụng tùy chỉnh: Nhấp vào biểu tượng bánh răng Cài đặt và chọn Thêm một ứng dụng. Trang Ứng dụng của bạn được hiển thị. Nhấp vào ...

    Làm thế nào để Tạo một Thảo luận Ban App trong SharePoint - núm vú

    Làm thế nào để Tạo một Thảo luận Ban App trong SharePoint - núm vú

    Thêm một ứng dụng thảo luận trên SharePoint một quá trình rất đơn giản. Bạn chỉ cần chọn ứng dụng Thảo luận từ trang Apps You Can Add. Bạn có thể thêm nhiều bảng thảo luận vào trang web của mình như bạn muốn. Bạn có thể thấy nó mang lại lợi ích cho việc tạo ra một bảng thảo luận cho mỗi khu chức năng để giữ ...

    Lựa chọn của người biên tập

    Máy tính giả mạo dành cho Android hoặc Điều gì đặc biệt về Số 5554? - núm vú

    Máy tính giả mạo dành cho Android hoặc Điều gì đặc biệt về Số 5554? - núm vú

    Khi bạn khởi động trình mô phỏng thiết bị Android, tên của trình mô phỏng mới là cái gì đó giống như trình mô phỏng-5554 hoặc trình mô phỏng-5556. Tên bắt nguồn từ thực tế là mỗi lần chạy của trình mô phỏng Android sử dụng hai số cổng (hai kênh để giao tiếp với máy tính phát triển). Như bạn đã biết, trình duyệt web của bạn thường sử dụng số cổng 80 ...

    Kích hoạt Chế độ xem trên Ứng dụng iOS của bạn - núm vú

    Kích hoạt Chế độ xem trên Ứng dụng iOS của bạn - núm vú

    Bất cứ khi nào bạn chỉ định một giá trị mới cho chế độ xem nhất định tài sản (như khung và thuộc tính của trung tâm), chế độ xem sẽ được vẽ lại ngay lập tức và thay đổi hiển thị ngay lập tức trên màn hình. Ngoài ra, thay đổi đối với một số thuộc tính xem (chẳng hạn như các thuộc tính được đề cập) có thể được hoạt hình. Điều này có nghĩa là việc thay đổi thuộc tính sẽ tạo ra hình ảnh động ...

    Android: Sử dụng IDE Eclipse cho Phát triển Java - núm vú

    Android: Sử dụng IDE Eclipse cho Phát triển Java - núm vú

    Ngày nay, sử dụng một môi trường phát triển tích hợp (IDE) để phát triển Java dễ dàng hơn. IDE được chấp nhận rộng rãi nhất trong số các nhà phát triển Java là Eclipse. Bảng này cung cấp cho bạn các mẹo nhanh để sử dụng IDE Eclipse để phát triển các ứng dụng Android. Nhiệm vụ Làm thế nào để hoàn thành Bắt đầu một dự án mới của Android Từ màn hình Dự án mới, dưới Android ...