Trang Chủ Tài chính Cá nhân Giai đoạn 4 của Mô hình Quy trình CRISP-DM: Lập mô hình

Giai đoạn 4 của Mô hình Quy trình CRISP-DM: Lập mô hình

Mục lục:

Video: 4 Giai Đoạn Của Doanh Nghiệp | Làm Doanh Nghiệp Nhất Định Phải Biết - Học viện CEO Việt Nam 2024

Video: 4 Giai Đoạn Của Doanh Nghiệp | Làm Doanh Nghiệp Nhất Định Phải Biết - Học viện CEO Việt Nam 2024
Anonim

Mô hình là một phần của mô hình quá trình Cross-Industry cho quá trình khai thác dữ liệu (CRISP-DM) mà hầu hết dữ liệu thợ mỏ như giỏi nhất. Dữ liệu của bạn đã có hình dạng tốt và bây giờ bạn có thể tìm kiếm các mẫu hữu ích trong dữ liệu của bạn.

Giai đoạn lập mô hình bao gồm bốn nhiệm vụ. Đây là

  • Chọn kỹ thuật lập mô hình

  • Thiết kế thử nghiệm

  • Mô hình xây dựng

  • Đánh giá mô hình

Nhiệm vụ: Lựa chọn kỹ thuật mô hình hóa

Thế giới tuyệt vời của khai thác dữ liệu cung cấp rất nhiều kỹ thuật mô hình, nhưng không phải tất cả chúng đều phù hợp với nhu cầu của bạn. Thu hẹp danh sách dựa trên các loại biến số có liên quan, lựa chọn các kỹ thuật có sẵn trong công cụ của bạn và bất kỳ cân nhắc kinh doanh nào quan trọng đối với bạn.

Ví dụ, nhiều tổ chức ưa thích các phương pháp với đầu ra dễ hiểu, vì vậy các cây quyết định hoặc hồi qui hậu cần có thể chấp nhận được, nhưng mạng nơ-ron sẽ không được chấp nhận.

Các tài liệu gửi cho nhiệm vụ này bao gồm hai báo cáo:

  • Kỹ thuật lập mô hình: Chỉ định (các) kỹ thuật mà bạn sẽ sử dụng.

  • Các giả định về mô hình hóa: Nhiều kỹ thuật lập mô hình dựa trên các giả định nhất định. Ví dụ: kiểu mô hình có thể được dùng cho dữ liệu có loại phân phối cụ thể. Ghi lại các giả định này trong báo cáo này.

Các nhà thống kê được thông tin đầy đủ, nghiêm khắc và kín đáo về những giả định. Điều đó không nhất thiết phải đúng với những người khai thác dữ liệu, và nó không phải là một yêu cầu để trở thành một thợ mỏ dữ liệu. Nếu bạn có kiến ​​thức thống kê sâu và hiểu các giả định đằng sau các mô hình bạn chọn, bạn có thể nghiêm ngặt và kín đáo về các giả định.

Nhưng nhiều thợ khai thác dữ liệu, đặc biệt là các thợ mỏ khai thác mới làm quen, không phiền phức nhiều về các giả định. Cách khác là thử nghiệm - rất nhiều và rất nhiều thử nghiệm - của các mô hình của bạn.

Nhiệm vụ: Thiết kế thử nghiệm

Thử nghiệm trong nhiệm vụ này là bài kiểm tra mà bạn sẽ sử dụng để xác định mô hình hoạt động tốt như thế nào. Nó có thể đơn giản như chia tách dữ liệu của bạn thành một nhóm các trường hợp để huấn luyện mô hình và một nhóm khác để thử nghiệm mô hình.

Dữ liệu huấn luyện được sử dụng để phù hợp với các hình thức toán học với mô hình dữ liệu, và dữ liệu thử nghiệm được sử dụng trong quá trình huấn luyện mô hình để tránh overfitting: tạo ra mô hình hoàn hảo cho một tập dữ liệu, nhưng không khác. Bạn cũng có thể sử dụng dữ liệu tạm giữ, dữ liệu không được sử dụng trong quá trình huấn luyện mô hình để kiểm tra bổ sung.

Sự phân phối cho nhiệm vụ này là thiết kế thử nghiệm của bạn. Nó không cần phải phức tạp, nhưng bạn nên ít nhất là chăm sóc mà dữ liệu đào tạo và thử nghiệm của bạn là tương tự và bạn tránh việc giới thiệu bất kỳ sự thiên vị vào dữ liệu.

Nhiệm vụ: Xây dựng mô hình (s)

Mô hình hóa là điều mà nhiều người tưởng tượng là toàn bộ công việc của người khai thác dữ liệu, nhưng đó chỉ là một nhiệm vụ của hàng chục! Tuy nhiên, mô hình để giải quyết các mục tiêu kinh doanh cụ thể là trung tâm của nghề khai thác dữ liệu.

Các thiết bị phân phối cho nhiệm vụ này bao gồm ba mục:

  • Cài đặt thông số: Khi xây dựng mô hình, hầu hết các công cụ cung cấp cho bạn tùy chọn điều chỉnh nhiều cài đặt và các cài đặt này có ảnh hưởng đến cấu trúc của mô hình cuối cùng. Tài liệu các thiết lập này trong một báo cáo.

  • Mô tả mô hình: Mô tả mô hình của bạn. Xác định loại mô hình (như hồi quy tuyến tính hoặc mạng thần kinh) và các biến được sử dụng. Giải thích mô hình được diễn giải như thế nào. Ghi lại những khó khăn gặp phải trong quá trình lập mô hình.

  • Các mô hình: Sự phân phối này là các mô hình. Một số loại mô hình có thể dễ dàng xác định bằng một phương trình đơn giản; những thứ khác quá phức tạp và phải được truyền đi dưới một định dạng phức tạp hơn.

Nhiệm vụ: Đánh giá mô hình

Bây giờ bạn sẽ xem xét các mô hình mà bạn đã tạo ra, từ quan điểm kỹ thuật và từ quan điểm kinh doanh (thường là thông tin đầu vào từ các chuyên gia kinh doanh trong nhóm dự án của bạn).

Các tài liệu phân phối cho nhiệm vụ này bao gồm hai báo cáo:

  • Đánh giá mô hình: Tóm tắt thông tin được phát triển trong việc xem xét mô hình của bạn. Nếu bạn đã tạo ra một số mô hình, bạn có thể xếp hạng chúng dựa trên đánh giá của bạn về giá trị của chúng cho một ứng dụng cụ thể.

  • Cài đặt thông số đã được sửa đổi: Bạn có thể chọn tinh chỉnh các cài đặt đã được sử dụng để xây dựng mô hình và tiến hành một vòng mô hình khác và cố gắng cải thiện kết quả của bạn.

Khai thác dữ liệu, như hành, một con Dobos torte, hay một tảng đá trầm tích, có nhiều lớp. Khi bạn mới bắt đầu khai thác dữ liệu, bạn có thể bắt đầu bằng cách đặt các cài đặt thông số theo giá trị mặc định (thực tế, bạn thậm chí không nhận thấy các tùy chọn trừ khi bạn cố gắng tìm kiếm chúng).

Khi bạn cảm thấy thoải mái trong sự nghiệp khai thác dữ liệu mới của mình, bạn sẽ tìm hiểu về các thông số mô hình và biết cách bạn có thể sử dụng chúng. Tùy chọn của bạn sẽ khác nhau tùy theo loại mô hình và công cụ cụ thể mà bạn đang sử dụng.

Giai đoạn 4 của Mô hình Quy trình CRISP-DM: Lập mô hình

Lựa chọn của người biên tập

Chuyện gì sẽ xảy ra khi bạn xuất bản một blog? - núm vú

Chuyện gì sẽ xảy ra khi bạn xuất bản một blog? - núm vú

Viết blog là một phương tiện rất trực tiếp: Khi bạn xuất bản một bài đăng, nó thường xuất hiện trực tiếp trên blog của bạn. Thực tế, một vài điều xảy ra khi bạn nhấp vào nút Xuất bản: Bài đăng xuất hiện ở đầu trang chủ blog của bạn. Phần mềm viết blog cho biết thêm bài viết vào kho lưu trữ blog của bạn, thường là ...

Micro Blog là gì? - núm vú

Micro Blog là gì? - núm vú

Viết blog nhỏ được mô tả bởi các bài viết trên blog rất ngắn, nhanh và thường xuyên, thường được tạo ra từ một số công cụ xuất bản không phổ biến như điện thoại di động, email, tin nhắn tức thì và tin nhắn văn bản. Tuy nhiên, bạn vẫn có thể sử dụng một giao diện web để tạo ra một blog nhỏ! Một số blogger nhỏ sử dụng blog của mình như là các cơ chế để thu thập và lưu trữ các bài báo thú vị ...

Eventbrite là gì? - núm vú

Eventbrite là gì? - núm vú

Eventbrite là một trang web lập kế hoạch sự kiện trực tuyến, từ đó bạn có thể tạo trang sự kiện, đăng ký người tham dự, theo dõi tham dự, thậm chí bán vé trực tuyến hoặc tại cửa. Đăng một sự kiện trực tuyến. Với Eventbrite, bạn có thể đăng bất kỳ sự kiện nào, từ một cuộc hội ngộ gia đình lâu dài, cuộc tĩnh tâm tâm linh, lễ hội nghệ thuật cộng đồng, hoặc thực sự về bất cứ điều gì ...

Lựa chọn của người biên tập

Cách sử dụng Từ điển Thesaurus trong Word 2007 - núm vú

Cách sử dụng Từ điển Thesaurus trong Word 2007 - núm vú

Word Thesaurus được xây dựng trong Word 2007 cho phép tìm kiếm từ đồng nghĩa, từ trái nghĩa, từ thay thế, và cách viết khác. Word có thể giúp bạn tăng khả năng viết và từ vựng của bạn khi bạn sử dụng tính năng này của Microsoft như một tham khảo hữu ích. Thay đổi từ vựng của bạn để gia tăng văn bản của bạn. Sử dụng từ điển Thesaurus Word để tránh sử dụng các từ tương tự trên ...

Cách sử dụng lệnh Hoàn tác trong Word 2016 - núm vú

Cách sử dụng lệnh Hoàn tác trong Word 2016 - núm vú

Lệnh Hoàn tác trong Word 2016 hủy hoàn toàn bất cứ điều gì bạn làm trong Word, bao gồm định dạng văn bản, di chuyển khối, nhập và xóa văn bản - toàn bộ enchilada. Bạn có hai cách tiện dụng để giải phóng lệnh Undo: Nhấn Ctrl + Z. Nhấn vào nút Undo trên thanh công cụ Quick Access. Bạn cũng có thể sử dụng phím Ctrl + Z ...

Làm thế nào để sử dụng Word 2007 Bảng Tools Thiết kế Tab - núm vú

Làm thế nào để sử dụng Word 2007 Bảng Tools Thiết kế Tab - núm vú

Bạn có thể sử dụng các Công cụ Bảng Thiết kế tab để nhanh chóng định dạng bảng trong Word 2007. Để hiển thị tab Thiết kế Công cụ Bảng, bạn chỉ cần chọn bảng bạn muốn chỉnh sửa. Nhóm Bảng Styles trong tab Thiết kế có thể nhanh chóng áp dụng định dạng cho bất kỳ bảng nào. Chọn một phong cách hoặc nhấp vào nút trình đơn ...

Lựa chọn của người biên tập

Làm thế nào để tối ưu hóa trang web của bạn để tạo lưu lượng truy cập từ Pinterest - núm vú cao

Làm thế nào để tối ưu hóa trang web của bạn để tạo lưu lượng truy cập từ Pinterest - núm vú cao

Pinterest có marketing truyền thông xã hội trực quan. Tại Pinterest, người dùng có thể tạo ra các bảng điện tử bao gồm các chân hình ảnh mà họ chia sẻ hoặc từ các trang web. Pinterest gửi một lượng lớn lưu lượng truy cập giới thiệu đến các trang web, chủ yếu dựa vào các hình ảnh trên trang web. Pinterest đã được báo cáo là nguồn số một cho lưu lượng truy cập giới thiệu ...

Làm thế nào để Đặt Thông báo Thông báo Email của bạn trên Pinterest - núm vú

Làm thế nào để Đặt Thông báo Thông báo Email của bạn trên Pinterest - núm vú

Bạn sẽ nhận được thông báo cho mọi pin, repin, nhận xét và theo dõi và nếu tài khoản công ty của bạn hoạt động rất tích cực, có thể thêm nhiều thông báo. Bạn có thể chỉnh sửa chúng theo sở thích của bạn, do đó ít có thể lướt qua khi công ty của bạn đòi hỏi sự chú ý của bạn ở nơi khác. Để đặt thông báo qua email, làm ...

Làm thế nào để gắn thẻ thành viên Pinterest - núm vú

Làm thế nào để gắn thẻ thành viên Pinterest - núm vú

Trong một mô tả về pin, bạn có thể gắn thẻ thành viên Pinterest khác để thu hút sự chú ý của họ để pin. Gắn thẻ họ cũng làm cho tên tiểu sử của họ trong liên kết mô tả chốt với tiểu sử Pinterest của người đó. Để gắn thẻ một thành viên trong khi ghim, repinning, hoặc bình luận, hãy làm theo các bước sau: Trong mô tả pin hoặc nhận xét, nhập <...