Video: Cách viết cấu hình electron nguyên tử - Hóa Lớp 10 – Thầy Phạm Thanh Tùng 2025
Một nhiệm vụ khác trong phân tích tiên đoán (predictive analytics) là phân loại khách hàng theo loại - nói, là khách hàng có giá trị cao, khách hàng thường xuyên hoặc khách hàng đã sẵn sàng để chuyển sang một … là phân loại dữ liệu mới bằng cách dự đoán những gì lớp một mục tiêu của dữ liệu thuộc về, đưa ra một tập hợp các biến độc lập. Bạn có thể, ví dụ, phân loại khách hàng theo loại - nói như khách hàng có giá trị cao, khách hàng thường xuyên hoặc khách hàng đã sẵn sàng chuyển sang đối thủ cạnh tranh bằng cách sử dụng cây quyết định.
Để xem một số thông tin hữu ích về mô hình Phân loại R, nhập mã sau:
>> summary (model) Length Class Mode 1 BinaryTree S4Cột Class nói với bạn rằng bạn đã tạo một cây quyết định. Để xem các phân chia được xác định như thế nào, bạn chỉ cần gõ tên biến mà bạn đã gán cho mô hình, trong trường hợp này là: >> model Cây suy luận có điều kiện với 6 nút đầu cuối Đáp ứng: seedType Đầu vào: diện tích, chu vi, compactness, chiều dài, chiều rộng, không đối xứng, chiều dài2 Số quan sát: 147 1) diện tích <= 16. 2; tiêu chí = 1, thống kê = 123. 423 2) diện tích <= 13. 37; = trọng số = 1, thống kê = 63. 549 3) chiều dài2 4. 914 5) * trọng lượng = 45 2) diện tích> 13 37 6) chiều dài2 5. 396 8) * trọng lượng = 8 1) diện tích> 16 2 9) chiều dài2 5. 877 11) * weight = 40
Thậm chí tốt hơn, bạn có thể hình dung mô hình bằng cách tạo ra một cốt truyện của cây quyết định với mã này:> plot (model)
Đây là biểu đồ đồ họa của một cây quyết định. Bạn có thể thấy rằng hình dạng tổng thể bắt chước rằng của một cây thực sự. Nó được tạo thành từ
nút(hình tròn và hình chữ nhật) và liên kết hoặc cạnh (đường kết nối). Nút đầu tiên (bắt đầu ở đầu) được gọi là nút gốc
và các nút ở dưới cùng của cây (hình chữ nhật) được gọi là các nút đầu cuối . Có năm nút quyết định và sáu nút đầu cuối. Bắt đầu tại nút gốc, đó là nút 1 (số được hiển thị trong hình vuông nhỏ ở đầu vòng tròn). Quyết định dựa trên thuộc tính: Là quan sát # 2 ít hơn hoặc bằng (ký hiệu bởi <=) 16.2? Câu trả lời là có, do đó, di chuyển dọc theo con đường đến nút 2.
Tại nút 2, mô hình hỏi: Là khu vực 13. 37? Câu trả lời là có, do đó di chuyển dọc theo con đường đến nút 6. Tại nút này mô hình hỏi: Là chiều dài 2 <= 5. 396? nó là, và bạn di chuyển đến nút đầu cuối 7 và phán quyết là quan sát # 2 là loại hạt 1. Và thực ra, hạt giống loại 1.
Mô hình này xử lý tất cả các quan sát khác để dự đoán các lớp học.
-
Để tìm hiểu liệu bạn đã được đào tạo một mô hình tốt, hãy kiểm tra nó dựa vào dữ liệu huấn luyện. Bạn có thể xem các kết quả trong một bảng với mã sau: >> table (predict (model), trainSet $ seedType) 1 2 3 1 45 4 3 2 3 47 0 3 1 0 44
-
Kết quả cho thấy sai số (hoặc tỷ lệ phân lớp sai) là 11 trong số 147, hoặc 7. 48 phần trăm.
Với kết quả tính, bước tiếp theo là đọc bảng.
-
Các dự đoán chính xác là những dự đoán số cột và số hàng giống nhau. Những kết quả hiển thị dưới dạng đường chéo từ trên trái sang dưới cùng bên phải; ví dụ, [1, 1], [2, 2], [3, 3] là số dự đoán chính xác cho lớp đó.
Vì vậy, đối với hạt giống loại 1, mô hình đã dự đoán đúng 45 lần, trong khi phân loại sai hạt giống 7 lần (4 lần giống hạt giống loại 2 và 3 lần loại 3). Đối với hạt giống loại 2, mô hình dự đoán đúng 47 lần, trong khi phân loại sai 3 lần. Đối với hạt giống loại 3, mô hình đã tiên đoán đúng 44 lần, trong khi phân loại sai chỉ một lần.
Điều này cho thấy rằng đây là một mô hình tốt. Vì vậy, bây giờ bạn đánh giá nó với các dữ liệu thử nghiệm. Đây là mã sử dụng dữ liệu kiểm tra để dự đoán và lưu trữ nó trong một biến (testPrediction) để sử dụng sau này: >> testPrediction <- predict (model, newdata = testSet)
-
Để đánh giá mô hình thực hiện như thế nào với kiểm tra dữ liệu, xem nó trong một bảng và tính toán lỗi, trong đó mã trông như sau: >> table (testPrediction, testSet $ seedType) testPrediction 1 2 3 1 23 2 1 2 1 19 0 3 1 0 17