Trang Chủ Tài chính Cá nhân Giai đoạn 4 của Mô hình Quy trình CRISP-DM: Lập mô hình

Giai đoạn 4 của Mô hình Quy trình CRISP-DM: Lập mô hình

Mục lục:

Video: 4 Giai Đoạn Của Doanh Nghiệp | Làm Doanh Nghiệp Nhất Định Phải Biết - Học viện CEO Việt Nam 2025

Video: 4 Giai Đoạn Của Doanh Nghiệp | Làm Doanh Nghiệp Nhất Định Phải Biết - Học viện CEO Việt Nam 2025
Anonim

Mô hình là một phần của mô hình quá trình Cross-Industry cho quá trình khai thác dữ liệu (CRISP-DM) mà hầu hết dữ liệu thợ mỏ như giỏi nhất. Dữ liệu của bạn đã có hình dạng tốt và bây giờ bạn có thể tìm kiếm các mẫu hữu ích trong dữ liệu của bạn.

Giai đoạn lập mô hình bao gồm bốn nhiệm vụ. Đây là

  • Chọn kỹ thuật lập mô hình

  • Thiết kế thử nghiệm

  • Mô hình xây dựng

  • Đánh giá mô hình

Nhiệm vụ: Lựa chọn kỹ thuật mô hình hóa

Thế giới tuyệt vời của khai thác dữ liệu cung cấp rất nhiều kỹ thuật mô hình, nhưng không phải tất cả chúng đều phù hợp với nhu cầu của bạn. Thu hẹp danh sách dựa trên các loại biến số có liên quan, lựa chọn các kỹ thuật có sẵn trong công cụ của bạn và bất kỳ cân nhắc kinh doanh nào quan trọng đối với bạn.

Ví dụ, nhiều tổ chức ưa thích các phương pháp với đầu ra dễ hiểu, vì vậy các cây quyết định hoặc hồi qui hậu cần có thể chấp nhận được, nhưng mạng nơ-ron sẽ không được chấp nhận.

Các tài liệu gửi cho nhiệm vụ này bao gồm hai báo cáo:

  • Kỹ thuật lập mô hình: Chỉ định (các) kỹ thuật mà bạn sẽ sử dụng.

  • Các giả định về mô hình hóa: Nhiều kỹ thuật lập mô hình dựa trên các giả định nhất định. Ví dụ: kiểu mô hình có thể được dùng cho dữ liệu có loại phân phối cụ thể. Ghi lại các giả định này trong báo cáo này.

Các nhà thống kê được thông tin đầy đủ, nghiêm khắc và kín đáo về những giả định. Điều đó không nhất thiết phải đúng với những người khai thác dữ liệu, và nó không phải là một yêu cầu để trở thành một thợ mỏ dữ liệu. Nếu bạn có kiến ​​thức thống kê sâu và hiểu các giả định đằng sau các mô hình bạn chọn, bạn có thể nghiêm ngặt và kín đáo về các giả định.

Nhưng nhiều thợ khai thác dữ liệu, đặc biệt là các thợ mỏ khai thác mới làm quen, không phiền phức nhiều về các giả định. Cách khác là thử nghiệm - rất nhiều và rất nhiều thử nghiệm - của các mô hình của bạn.

Nhiệm vụ: Thiết kế thử nghiệm

Thử nghiệm trong nhiệm vụ này là bài kiểm tra mà bạn sẽ sử dụng để xác định mô hình hoạt động tốt như thế nào. Nó có thể đơn giản như chia tách dữ liệu của bạn thành một nhóm các trường hợp để huấn luyện mô hình và một nhóm khác để thử nghiệm mô hình.

Dữ liệu huấn luyện được sử dụng để phù hợp với các hình thức toán học với mô hình dữ liệu, và dữ liệu thử nghiệm được sử dụng trong quá trình huấn luyện mô hình để tránh overfitting: tạo ra mô hình hoàn hảo cho một tập dữ liệu, nhưng không khác. Bạn cũng có thể sử dụng dữ liệu tạm giữ, dữ liệu không được sử dụng trong quá trình huấn luyện mô hình để kiểm tra bổ sung.

Sự phân phối cho nhiệm vụ này là thiết kế thử nghiệm của bạn. Nó không cần phải phức tạp, nhưng bạn nên ít nhất là chăm sóc mà dữ liệu đào tạo và thử nghiệm của bạn là tương tự và bạn tránh việc giới thiệu bất kỳ sự thiên vị vào dữ liệu.

Nhiệm vụ: Xây dựng mô hình (s)

Mô hình hóa là điều mà nhiều người tưởng tượng là toàn bộ công việc của người khai thác dữ liệu, nhưng đó chỉ là một nhiệm vụ của hàng chục! Tuy nhiên, mô hình để giải quyết các mục tiêu kinh doanh cụ thể là trung tâm của nghề khai thác dữ liệu.

Các thiết bị phân phối cho nhiệm vụ này bao gồm ba mục:

  • Cài đặt thông số: Khi xây dựng mô hình, hầu hết các công cụ cung cấp cho bạn tùy chọn điều chỉnh nhiều cài đặt và các cài đặt này có ảnh hưởng đến cấu trúc của mô hình cuối cùng. Tài liệu các thiết lập này trong một báo cáo.

  • Mô tả mô hình: Mô tả mô hình của bạn. Xác định loại mô hình (như hồi quy tuyến tính hoặc mạng thần kinh) và các biến được sử dụng. Giải thích mô hình được diễn giải như thế nào. Ghi lại những khó khăn gặp phải trong quá trình lập mô hình.

  • Các mô hình: Sự phân phối này là các mô hình. Một số loại mô hình có thể dễ dàng xác định bằng một phương trình đơn giản; những thứ khác quá phức tạp và phải được truyền đi dưới một định dạng phức tạp hơn.

Nhiệm vụ: Đánh giá mô hình

Bây giờ bạn sẽ xem xét các mô hình mà bạn đã tạo ra, từ quan điểm kỹ thuật và từ quan điểm kinh doanh (thường là thông tin đầu vào từ các chuyên gia kinh doanh trong nhóm dự án của bạn).

Các tài liệu phân phối cho nhiệm vụ này bao gồm hai báo cáo:

  • Đánh giá mô hình: Tóm tắt thông tin được phát triển trong việc xem xét mô hình của bạn. Nếu bạn đã tạo ra một số mô hình, bạn có thể xếp hạng chúng dựa trên đánh giá của bạn về giá trị của chúng cho một ứng dụng cụ thể.

  • Cài đặt thông số đã được sửa đổi: Bạn có thể chọn tinh chỉnh các cài đặt đã được sử dụng để xây dựng mô hình và tiến hành một vòng mô hình khác và cố gắng cải thiện kết quả của bạn.

Khai thác dữ liệu, như hành, một con Dobos torte, hay một tảng đá trầm tích, có nhiều lớp. Khi bạn mới bắt đầu khai thác dữ liệu, bạn có thể bắt đầu bằng cách đặt các cài đặt thông số theo giá trị mặc định (thực tế, bạn thậm chí không nhận thấy các tùy chọn trừ khi bạn cố gắng tìm kiếm chúng).

Khi bạn cảm thấy thoải mái trong sự nghiệp khai thác dữ liệu mới của mình, bạn sẽ tìm hiểu về các thông số mô hình và biết cách bạn có thể sử dụng chúng. Tùy chọn của bạn sẽ khác nhau tùy theo loại mô hình và công cụ cụ thể mà bạn đang sử dụng.

Giai đoạn 4 của Mô hình Quy trình CRISP-DM: Lập mô hình

Lựa chọn của người biên tập

Làm thế nào để tạo danh sách thả xuống Các trường trong HTML5 - núm vú

Làm thế nào để tạo danh sách thả xuống Các trường trong HTML5 - núm vú

Thả xuống các danh sách trong các biểu mẫu trên trang web của bạn là một cách tuyệt vời để cung cấp cho người dùng nhiều lựa chọn trong một khoảng không gian màn hình nhỏ. Bạn sử dụng hai thẻ HTML để tạo danh sách thả xuống: tạo danh sách. Sử dụng thuộc tính name với phần tử để đặt tên cho danh sách của bạn. Một bộ sưu tập của các phần tử ...

Cách tạo trường tải tệp lên trong HTML5 - núm vú

Cách tạo trường tải tệp lên trong HTML5 - núm vú

Biểu mẫu web HTML có thể nhận được tài liệu và các tệp khác, chẳng hạn như hình ảnh, từ người dùng. Khi người dùng gửi biểu mẫu, trình duyệt sẽ lấy một bản sao của tệp và gửi nó bằng dữ liệu biểu mẫu khác. Để tạo một trường tải lên tệp, bạn hãy làm như sau: Sử dụng phần tử với loại

Làm thế nào để Tạo siêu liên kết với HTML5 - núm vú

Làm thế nào để Tạo siêu liên kết với HTML5 - núm vú

Siêu liên kết, hoặc đơn giản liên kết, kết nối các trang HTML tài nguyên trên web. Khi bạn đưa một liên kết lên trang của mình, bạn cho phép khách truy cập di chuyển từ trang của bạn đến một trang web khác, một trang khác trên trang web của bạn, hoặc thậm chí là một vị trí khác trên cùng một trang. Không có liên kết, một trang đứng một mình, bị ngắt kết nối khỏi phần còn lại ...

Lựa chọn của người biên tập

Làm thế nào để bắt đầu hoặc Làm theo một cuộc thảo luận với Jive - núm vú

Làm thế nào để bắt đầu hoặc Làm theo một cuộc thảo luận với Jive - núm vú

Tạo, sau và các chủ đề thảo luận là một trong những tính năng được sử dụng nhiều nhất của Jive. Bởi vì Jive được thiết kế với sự cộng tác trong tâm trí, khả năng đưa ra một cuộc thảo luận mới hoặc theo một cuộc thảo luận hiện tại là dễ dàng hơn bao giờ hết. Nguồn: Jive. com Với các phiên bản trước của phần mềm, quản trị viên tài khoản Jive là người duy nhất ...

Làm thế nào để Thiết lập một tài khoản Jive mới và hồ sơ - núm vú

Làm thế nào để Thiết lập một tài khoản Jive mới và hồ sơ - núm vú

Jive là một doanh nghiệp mới xã hội-phần mềm mà nhiều công ty lớn đã bắt đầu đưa vào cuộc sống hàng ngày. Jive cũng có sẵn cho các doanh nghiệp nhỏ. Nhiều người trong số bạn có thể tự hỏi làm thế nào để có được Jive trên máy tính, máy tính bảng và / hoặc điện thoại thông minh để có thể thiết lập một tài khoản mới cho doanh nghiệp của bạn và bắt đầu Jive-ing. ...

Làm thế nào để thiết lập cộng đồng Socialcast mới - núm vú

Làm thế nào để thiết lập cộng đồng Socialcast mới - núm vú

Bắt đầu trong Socialcast là nhanh chóng và đơn giản. Mặc dù Socialcast không nổi tiếng như một số ứng dụng mạng xã hội doanh nghiệp khác nhưng những người sử dụng nó thích nó và các công ty trên toàn thế giới đã chấp nhận cả giao diện đơn giản và các tính năng quản trị toàn diện. Chỉ cần thực hiện theo các bước đơn giản sau.

Lựa chọn của người biên tập

Làm thế nào để Thiết lập các lớp học trong QuickBooks 2014

Làm thế nào để Thiết lập các lớp học trong QuickBooks 2014

QuickBooks cho phép bạn sử dụng các lớp để tách biệt hoặc theo dõi tài chính dữ liệu bằng những cách không thể thực hiện được khi bạn sử dụng các thông tin kế toán khác, chẳng hạn như số tài khoản, khách hàng, đại diện bán hàng, mục này, v.v. Ví dụ, một công ty có thể sử dụng các lớp học để phân chia thông tin tài chính theo các cửa hàng, các đơn vị kinh doanh, hoặc ...

Làm thế nào để Thiết lập Thuế Bán hàng trong QuickBooks 2016 - những con báo

Làm thế nào để Thiết lập Thuế Bán hàng trong QuickBooks 2016 - những con báo

QuickBooks 2016 giúp dễ thu thập và ghi thuế bán hàng khi cần thiết. Có thể bạn muốn kiểm tra với cơ quan thuế doanh thu địa phương để xác định liệu thuế doanh thu phải được tính trước hay sau khi giảm giá. Nếu bạn cần phải thu thuế doanh thu, và bạn không thiết lập chức năng này trong QuickBooks ...

Làm thế nào để Thiết lập một lựa chọn dịch vụ trả lương trong QuickBooks 2016 - núm vú

Làm thế nào để Thiết lập một lựa chọn dịch vụ trả lương trong QuickBooks 2016 - núm vú

Muốn sử dụng một trong những lựa chọn dịch vụ trả lương QuickBooks vì bạn muốn tiết kiệm tiền, bạn không sợ giấy tờ nhỏ, hoặc có thể bạn muốn có thêm sự linh hoạt đi kèm với việc tự làm, bạn cần phải đăng ký cho hương vị thích hợp của dịch vụ. Chi phí của các dịch vụ tính lương QuickBooks ...