Trang Chủ Tài chính Cá nhân Làm thế nào để tạo ra một mô hình học được giám sát với hồi quy logistic - núm vú

Làm thế nào để tạo ra một mô hình học được giám sát với hồi quy logistic - núm vú

Mục lục:

Video: The CIA's Covert Operations: Afghanistan, Cambodia, Nicaragua, El Salvador 2025

Video: The CIA's Covert Operations: Afghanistan, Cambodia, Nicaragua, El Salvador 2025
Anonim

Sau khi bạn xây dựng mô hình dự đoán phân loại đầu tiên để phân tích dữ liệu, tạo ra nhiều mô hình hơn như nó là một nhiệm vụ thực sự đơn giản trong scikit. Sự khác biệt thực sự duy nhất từ ​​mô hình này sang mô hình tiếp theo là bạn có thể phải điều chỉnh các tham số từ thuật toán sang thuật toán.

Cách tải dữ liệu của bạn

Danh sách mã này sẽ nạp bộ dữ liệu iris vào phiên làm việc của bạn: >>>> từ sklearn. datasets import load_iris >>> iris = load_iris ()

Cách tạo một thể hiện của trình phân loại

Hai dòng mã sau tạo ra một thể hiện của trình phân loại. Dòng đầu tiên nhập thư viện hồi quy logistic. Dòng thứ hai tạo ra một ví dụ của thuật toán hồi quy hậu cần. >>>> từ sklearn import linear_model >>> logClassifier = linear_model. LogisticRegression (C = 1, random_state = 111)

Chú ý tham số (thông số định chuẩn) trong hàm tạo. Thông số định chuẩn


được sử dụng để ngăn ngừa việc overfitting. Các tham số là không cần thiết thật (nhà xây dựng sẽ làm việc tốt mà không có nó bởi vì nó sẽ mặc định để C = 1). Tạo một phân loại hồi quy hậu cần sử dụng C = 150 tạo ra một cốt truyện tốt hơn của bề mặt quyết định. Bạn có thể thấy cả hai lô dưới đây.

Cách chạy dữ liệu huấn luyện

Bạn sẽ cần chia bộ dữ liệu vào tập huấn và tập kiểm tra trước khi bạn có thể tạo ra một thể hiện của trình phân loại hồi quy logistic. Đoạn mã sau sẽ hoàn thành nhiệm vụ đó: >>>> từ nhập khẩu qua lại chéo {X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris dữ liệu, iris target, test_size = 0, random_state = 111) >>> logClassifier. fit (X_train, y_train)

Dòng 1 nhập thư viện cho phép bạn tách bộ dữ liệu thành hai phần.

Dòng 2 gọi hàm từ thư viện chia tách bộ dữ liệu thành hai phần và gán các bộ dữ liệu đã chia cho hai cặp các biến.

Dòng 3 lấy ví dụ của phân loại hồi quy hậu cần mà bạn vừa tạo và gọi phương thức phù hợp để đào tạo mô hình với tập dữ liệu huấn luyện.

Làm thế nào để hình dung phân loại

Nhìn vào bề mặt quyết định bề mặt trên cốt truyện, có vẻ như một số điều chỉnh đã được thực hiện. Nếu bạn nhìn vào giữa ô, bạn có thể thấy rằng nhiều điểm dữ liệu thuộc khu vực giữa (Versicolor) nằm trong khu vực ở phía bên phải (Virginica).

Hình ảnh này cho thấy bề mặt quyết định với một giá trị C là 150. Nó có vẻ tốt hơn, do đó lựa chọn sử dụng thiết đặt này cho mô hình hồi quy hậu cần của bạn có vẻ thích hợp.

Cách chạy dữ liệu thử nghiệm

Trong đoạn mã sau, dòng đầu tiên cung cấp dữ liệu thử nghiệm cho mô hình và dòng thứ ba hiển thị đầu ra: >>>> predicted = logClassifier. dự đoán (X_test) >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2])

Làm thế nào để đánh giá mô hình < Bạn có thể tham khảo chéo sản lượng từ dự đoán đối với mảng y_test. Kết quả là, bạn có thể thấy rằng nó dự đoán tất cả các dữ liệu thử nghiệm điểm chính xác. Dưới đây là mã: >>>> từ chỉ số nhập sklearn >>> predictedarray ([0, 0, 2, 1, 2, 0, 2, 2, 2]) >>> y_testarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> số liệu. accuracy_score (y_test, dự đoán) 1. 0 # 1. 0 chính xác 100% >>> dự đoán == y_testarray ([True, True, True, True, True, True, True, True, True, True, True, True, True, True], dtype = bool)

Vậy mô hình hồi quy hậu cần như thế nào với tham số C = 150 so sánh? Vâng, bạn không thể đánh bại 100 phần trăm. Đây là mã để tạo và đánh giá trình phân loại hậu cần với C = 150: >>>> logClassifier_2 = linear_model. LogisticRegression (C = 150, random_state = 111) >>> logClassifier_2. phù hợp (X_train, y_train) >>> dự đoán = logClassifier_2. dự đoán (X_test) >>> số liệu. accuracy_score (y_test, dự đoán) 0. 93333333333333335 >>> chỉ số. confusion_matrix (y_test, predicted) array ([[5, 0, 0], [0, 2, 0], [0, 1, 7]]

Chúng tôi mong đợi tốt hơn, nhưng nó thực sự tồi tệ hơn. Có một lỗi trong dự đoán. Kết quả cũng giống như mô hình mô hình Máy hỗ trợ (SVM).

Đây là danh sách đầy đủ của mã để tạo và đánh giá một mô hình phân loại hồi quy hậu cần với các thông số mặc định: >>>> từ sklearn. datasets import load_iris >>> từ sklearn import linear_model >>> từ sklearn import cross_validation >>> từ các chỉ số nhập skleish >>> iris = load_iris () >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (dữ liệu iris, mục tiêu iris, test_size = 0.10, random_state = 111) >>> logClassifier = linear_model. LogisticRegression (, random_state = 111) >>> logClassifier. fit (X_train, y_train) >>> dự đoán = logClassifier. dự đoán (X_test) >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> y_testarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> chỉ số. accuracy_score (y_test, dự đoán) 1. 0 # 1. 0 chính xác 100% >>> dự đoán == y_testarray ([True, True, True, True, True, True, True, True, True, True, True, True, True, True], dtype = bool)
Làm thế nào để tạo ra một mô hình học được giám sát với hồi quy logistic - núm vú

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...