Video: Regression Intro - Practical Machine Learning Tutorial with Python p.2 2025
Đối với các phân tích tiên đoán, bạn cần tải dữ liệu cho các thuật toán của mình để sử dụng. Việc tải bộ dữ liệu Iris trong scikit cũng đơn giản như phát hành một vài dòng mã bởi vì scikit đã tạo một chức năng để tải tập dữ liệu.
Chiều dài khoảng | Chiều rộng cánh cửa | Chiều dài hoa | Độ rộng cánh hoa | Loại / Nhãn mục tiêu |
---|---|---|---|---|
5. 1 | 3. 5 1. 4 | 0. 2 | Setosa (0) | 7. 0 |
3. 2 | 4. 7 1. 4 | Màu xám (1) | 6. 3 | 3. 3 |
6. 0 | 2. 5 | Virginica (2) |
|
Mở một phiên làm việc tương tác Python mới. |
-
Nhập mã sau đây vào dấu nhắc và quan sát kết quả đầu ra: >>>> từ sklearn. datasets import load_iris >>> iris = load_iris ()
Sau khi chạy hai câu lệnh này, bạn sẽ không thấy bất kỳ thông báo nào từ trình thông dịch. Các iris biến nên chứa tất cả các dữ liệu từ iris. tệp csv.
-
Trước khi bạn tạo một mô hình tiên đoán, điều quan trọng là phải hiểu một chút về iris biến mới và những gì bạn có thể làm với nó. Nó làm cho mã dễ dàng hơn để làm theo và quá trình đơn giản hơn nhiều để nắm bắt. Bạn có thể kiểm tra giá trị của iris bằng cách gõ nó vào trình thông dịch. >>>> iris
Đầu ra sẽ là tất cả các nội dung từ iris. tệp csv, cùng với một số thông tin khác về tập dữ liệu mà hàm load_iris nạp vào biến. Biến là một cấu trúc dữ liệu từ điển với bốn thuộc tính chính. Các tính chất quan trọng của iris được liệt kê dưới đây.
Mô tả
dữ liệu
Có tất cả các phép đo của các quan sát.
feature_nameChứa tên của đối tượng địa lý (tên thuộc tính). | mục tiêu |
---|---|
Có tất cả các mục tiêu (nhãn) của các quan sát. | target_names |
Chứa tên của các lớp. | Bạn có thể in ra các giá trị trong trình thông dịch bằng cách nhập tên biến và sau đó là dấu chấm theo sau tên thuộc tính. Một ví dụ là sử dụng iris. dữ liệu để truy cập tài sản của iris, như sau: >>>> iris. data |
Đây là một cách chuẩn để truy cập các thuộc tính của một đối tượng trong nhiều ngôn ngữ lập trình. | Để tạo một thể hiện của trình phân loại SVM, nhập mã sau trong trình thông dịch: >>>> từ sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111) |
Dòng đầu tiên của mã nhập khẩu thư viện Linear SVC vào phiên. Hỗ trợ phân loại tuyến tính tuyến tính (SVC) là sự thực hiện của SVM để phân loại tuyến tính và có hỗ trợ nhiều lớp.Tập dữ liệu có thể được phân tách theo tuyến tính và có ba lớp, vì vậy nó sẽ là một ý tưởng hay để thử nghiệm với Linear SVC để xem nó hoạt động như thế nào. | Dòng thứ hai tạo ra cá thể sử dụng biến svmClassifier. Đây là một biến quan trọng để nhớ. Tham số random_state cho phép bạn tạo lại các ví dụ này và nhận được kết quả tương tự. Nếu bạn không đưa vào tham số random_state, kết quả của bạn có thể khác với những kết quả được hiển thị ở đây. |